2019年10月28日
【4日目】Udemy講座で学ぶ!実践 Python データサイエンス
進捗 30%
失速。疲れか、やたらと週末寝てしまった。
■セクション4:Pandas入門
統計量の一括計算、describe。
ん、これはやった気がする。pysparkのところで多用した気がする。
Pandas, pyspark共にDataFrameがある。位置づけ的には同じ感じだ。
微妙にmethodやできることは違うようだ。
今度調べてみたい。
欠損値の取り扱いに関して。削除したり、指定した値で埋めたりすることができる。この辺りは、実際のデータ解析でもプレ処理のデータクレンジングの際に使いそうだ。地味に面白い。
■次は
セクション4:Pandas入門のつづきを学ぶ。
このコースへのリンク
【世界で5万人が受講】実践 Python データサイエンス
全般ランキング
【このカテゴリーの最新記事】
-
no image
-
no image
-
no image
-
no image
-
no image
この記事へのコメント
コメントを書く
この記事へのトラックバックURL
https://fanblogs.jp/tb/9354206
※ブログオーナーが承認したトラックバックのみ表示されます。
この記事へのトラックバック