アフィリエイト広告を利用しています
プロフィール
たっさんさんの画像
たっさん
中年男。20代半ばから勉強開始。30代を前にして脱サラするも、成果を出せずに資金切れ。再就職するも「二足のわらじを履けぬ」性格を認識した。再起を図りつつ、知識足らずを痛感した。復活と将来への希望に燃える!
ブログ
プロフィール


ファン
人気ブログランキングへ
カテゴリーアーカイブ
タグクラウド
検索

広告

この広告は30日以上更新がないブログに表示されております。
新規記事の投稿を行うことで、非表示にすることが可能です。
posted by fanblog

勉強、勉強・・楽しい!統計学

2015年12月09日

昨日も統計学の(初心者)勉強に熱中した。

「帰無仮説」や「標準偏差」などの考え方が面白い。
数値からターゲットの動向を見るのだが、「なるほど」と感じる事が多い。「帰無仮説」は『ある事』を証明するために『ある事』の逆説を掲示し、この逆説を否定する事で証明する方法だ。

例えば・・「学校で一番人気がある生徒はA君である」という事を証明するために、『A君の人気が一番では無い』という仮説を否定する。

「A君以外の生徒」が一番人気と考える人の確率が【ある水準】以下であれば、『A君の人気が一番では無い』という仮説を否定できるので、「A君が一番人気」という事が証明されるわけだ。

この【ある水準】というのは、自由に設定できる。
60%なのか、95%、99%・・この確立を設定した上での証明というわけである。

人気投票数であれば、過半数や2/3という水準でも良さそうだな・・面白い。

ついでに「標準偏差」も勉強になる。
これは「偏差値」の計算で使用する値でもある。算出方法は面倒だが、意味が深い。


 まず各データ毎に、平均値からの差を算出し、絶対値で表す。

 上記の値を【二乗】する。

 各データ毎の数値を全て足す。

 合計の値を、データ数で割る。・・ここで算出された値を「分散」という。

 割った数字(分散)の平方根を求める。・・これが「標準偏差」。


何だか理解し難いのだが、「平均からの差」を面積(平方)に表し、面積の平均(分散)を算出するところが要点だと考える。

なぜ、この数値を算出するかというと、全体の「ばらつき」を見るためであるとの事。
つまり、平均値だけではデータの分布が分からないので、この分布も考慮した評価を表したいという訳である。

例えば・・「テストの成績」を評価する時。
私的であるが、点数が悪かった時などは「全体の分布図」を考慮した上での、評価点が欲しい。そこで標準偏差を利用した「偏差値」が嬉しいというわけである。


[Dell]数量限定在庫一掃モデルがお得!



これを競輪のデータ分析に反映させたら面白そうだ。
まずはデータ分析に必要な知識を取得することに集中しよう。

ちなみに、昨日も競輪の予想を2レース分(GVグレートレース)やってみた。
結果は一勝一敗。3位入着する内の二車を予想してみたのだが、予想材料としてライン構成が重要だと再認識した。

まずは勉強、勉強だね。

空き時間に読書するのだが、先日読み始めた「ラクをしないと成果は出ない」(著:日垣隆氏)は読み終わってしまった。

100項目を挙げて、それぞれに意見が記載されている。
幾つか勉強になったが、内容が単発である項目を100項目も記述するのは大変だ。題名と反して内容は効率化を求める考え方が記述されている。

過去の本を掘り出して、次は何を読もうかな・・(おつかれさま)。

posted by たっさん at 03:47 | Comment(0) | TrackBack(0) | 日記
My Blog 一覧
【ベストブック】
心に響く本
【おもちゃ屋さん】
自宅で遊べる「おもちゃ」       大人も汗かこう!!
月別アーカイブ
記事一覧
NTTグループ運営(NTTコム オンライン)の小遣いサイト。 ゲーム、クリック、ランキング投票でポイントを貯めて換金できる。
最新コメント
×

この広告は30日以上新しい記事の更新がないブログに表示されております。