新規記事の投稿を行うことで、非表示にすることが可能です。
タグ / Python
記事
【5日目成果】 英語版Udemy講座で学ぶ!SparkとpythonでBig Data解析 [2019/09/17 23:59]
進捗58%(+3%)
Logistic Regressionの学習を進めている。
疲れ気味のため、進捗が少ない。
模擬プロジェクト練習問題に入る前の知識の確認中。
Logistic Regressionの学習中に気が付いた点を2点メモしておく。
1、DataFram.head()と head(1)を実行した結果が微妙に違うのに気が付いた。
・df.head() →Rowオブジェクト
・df.head(1) →Rowオブジェクト1個の配列
..
【3日目成果】 英語版Udemy講座で学ぶ!SparkとpythonでBig Data解析 [2019/09/15 23:37]
進捗47%(+13%)
順調ではあるが苦労した。
知識の定着が十分でなかったため、DataFrameの章の最後の練習問題に非常に時間がかかった。
原因を考えるといろいろ思い当たることがある。
・進捗を優先したために理解が不十分
・英語講義を理解せずに聞き流していた
・コマンド自体は簡単なので使うときに調ればいいや、と思い覚えなかった
・多数のコマンドを短時間にあてもなく説明されるのでストーリー立てて思い出すのが難しい
・勉強するにあたり..
【2日目成果] 英語版Udemy講座で学ぶ!SparkとpythonでBig Data解析 [2019/09/14 22:14]
進捗34%(+7%)
思った通りに進められてない。+10%くらいは進みたいのだが...
講座自体は難しくないのだが、いくつか問題?課題?に遭遇し、解決をしながら進めている。
まず、VirtualBoxをインストールした際に画面の解像度が低いままでスタートしていた。いい加減、受講しにくいため、調査、設定を行い、Guest Additions CDのインストールを行い、解像度を上げることができ、事なきを得た。
次に、sparkが思うように動作し..
【1日目成果] 英語版Udemy講座で学ぶ!SparkとpythonでBig Data解析 [2019/09/13 18:54]
進捗27%
順調に進んでいる。
といっても、ほとんどは環境のセットアップとPythonの基礎の復習だ。
演習環境解いてVirtualbox、AWS EC2、DataBricksの3つを用意している。
今回は、最も簡単なVirtualboxで環境を構築して、いったん講座を完了しようと思っている。
Pythonはデータ操作の復習でPandasやNumpyをやるわけではない。本当の巨大なビックデータではこれらのライブラリは使えないのだそうだ。だからPy..
英語版Udemy講座で学ぶ!SparkとpythonでBig Data解析 [2019/09/12 21:26]
はじめに
ビックデータの解析や活用が盛んな昨今、データ処理のスピードも求められるようになってきている。
そんな時に有望なのが今回勉強するApache Sparkである。Apache Sparkは Google, Facebook, Netflix, Airbnb, Amazon, NASAでビックデータの課題を解決に使用されており、 Hadoop MapReduceの約100倍で処理を行うことができる。
解析対象のデータが爆発的に増大していく中、最も注目..
≪前へ 次へ≫
Auto Scaling C# DataFrame deep learning EBS EC2 ELB EXPRESS Git heatmap JavaScript jest keras LinQ Node.js numpy opencv pandas Python React.JS Redis S3 seaborn Series sklearn SPARK SQL SQL SERVER TDD tensorflow Thread Unity VirtualBox VPC WPF YOLO ビックデータ解析 ブロックチェーン 仮想通貨 機械学習 画像処理