アフィリエイト広告を利用しています

広告

posted by fanblog

2019年11月04日

【11日目】Udemy講座で学ぶ!実践 Python データサイエンス





進捗 90%
楽しく進めることができた。
実際に手を動かしながら、データの解析を行っていくのが楽しい!
前半で習ったことが実際の解析でどう活用するかがわかり、ためになる。
また、データ解析の過程の中で新たに見えてくる発見や、レクチャー以外の疑問が出てきて、習ったことを活用しながら、寄り道的にいろいろ試すのも楽しい。

■セクション9:実践データ解析


・タイタニック
  データ解析では有名なデータ。タイタニック号の沈没の際の乗客のデータで生き残った人の推定を機械学習で行ったりするのによく使われるデータである。
 始めに問いを立ててそれにこたえる形で講義が進むのがわかりやすく、終わった後に達成感がある。まず、decribeやinfoを使って、データの概要をつかみつつ、層別(hue)を多用しながら、解析を進める。性別、客室グレードなど複数のデータを比較しながら調べたいものに有効だ。
 seabornで様々な視覚化を行いながら、詳細を明らかにしていく。countplot, FacetGridなど各図の実際のデータでの使用場面が学べてためになる。

・株式市場
 普段から株式の取引をしているわけでないのであまりなじみがなかったが特に問題なし。
最新の株価データを取得して比較やリスク予測などの計算を行う。10日、20日、50日の移動平均線が簡単に描けるのが便利。pairplotで総当たりで相関を見れるのが使えそう。
DataReaderやrolling_meanなど、モジュールのインストール方法やメソッドの場所が最新版と異なるが、すぐにQAを見て簡単に解消が可能。

・選挙とデータ解析
 選挙の支持率の推移と寄付金の額の推移を調べる。これまた、ほとんど興味はないが特に問題なし。やれば楽しく進めれる。
 解析を進める上で、関係ない情報を排除しながら、注目すべきデータの視覚化を行っていくところが参考になる。

 これにて、セクション9完了。

■セクション10:機械学習


・線形回帰
 もっとも簡単な機械学習、Bostonの住宅価格のデータを使って学習を行う。sklearnはopencvや、pysparkでも使用したのでスムーズに進めれている。

■次は

 セクション10:機械学習を完了させ、受講を完了する。


このコースへのリンク
【世界で5万人が受講】実践 Python データサイエンス







全般ランキング
タグ:seaborn
この記事へのコメント
コメントを書く

お名前: 必須項目

メールアドレス:


ホームページアドレス:

コメント: 必須項目

※ブログオーナーが承認したコメントのみ表示されます。

この記事へのトラックバックURL
https://fanblogs.jp/tb/9378042
※ブログオーナーが承認したトラックバックのみ表示されます。

この記事へのトラックバック
検索
<< 2021年12月 >>
      1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31  
最新記事
タグクラウド
カテゴリーアーカイブ
プロフィール
peter3qさんの画像
peter3q
エンジニアとして働いている40代の会社員です。 仕事でメインに使用している言語はC/C++です。 プライベートでは、大学生の息子と中学生の娘がいて、 週末、料理をし、毎年、梅シロップを付けています。
プロフィール
×

この広告は30日以上新しい記事の更新がないブログに表示されております。