新規記事の投稿を行うことで、非表示にすることが可能です。
2019年09月12日
英語版Udemy講座で学ぶ!SparkとpythonでBig Data解析
はじめに
ビックデータの解析や活用が盛んな昨今、データ処理のスピードも求められるようになってきている。
そんな時に有望なのが今回勉強するApache Sparkである。Apache Sparkは Google, Facebook, Netflix, Airbnb, Amazon, NASAでビックデータの課題を解決に使用されており、 Hadoop MapReduceの約100倍で処理を行うことができる。
解析対象のデータが爆発的に増大していく中、最も注目される技術の1つである。
この講座ではクラウドプラットフォームであるAWSやDataBricks上でプログラミング言語としてpythonを用いて学習を進めることができる最先端の講座である。
講座名:
・Spark and Python for Big Data with PySpark
このコースの受講動機:
・最新のビックデータ解析ライブラリの知識習得
・スケーラブルなクラウド解析環境の構築の機械学習
・実践的なビックデータ解析演習による経験値積み上げ
このコース完了の際のゴールイメージ
・環境設定が一通り操作ができる
・Spark, PySparkを用いた解析ロジックを説明できる
・Spark, PySparkを用いて解析を行える
・Spark, PySpark, MLibを用いて機械学習のプログラムを作成できる
・Sparkでの自然言語処理を説明できる
コース詳細の紹介
・レクチャー数と時間
・66レクチャー、10.5時間のビデオ
・言語
・英語(英語字幕あり)
・内容要約
・最新のSpark2.0とpythonを使ったBigData解析
・AWSサービス(EC2,Elastic Map Reduce)、DataBrickを用いた環境構築
・模擬プロジェクトを使った演習
・MLibを用いた機械学習
・Sparkと自然言語処理を用いたスパムフィルタの作成
・Spark Streamを用いたツィートのリアルタイム解析
・受講に際しての前提条件
・プログラミング言語の知識、好ましくはpythonの知識
受講計画:
・10日程度で完了するつもりで受講をする。
このコースへのリンク
Spark and Python for Big Data with PySpark
全般ランキング