勉強、勉強・・楽しい!統計学
2015年12月09日
昨日も統計学の(初心者)勉強に熱中した。
「帰無仮説」や「標準偏差」などの考え方が面白い。
数値からターゲットの動向を見るのだが、「なるほど」と感じる事が多い。「帰無仮説」は『ある事』を証明するために『ある事』の逆説を掲示し、この逆説を否定する事で証明する方法だ。
例えば・・「学校で一番人気がある生徒はA君である」という事を証明するために、『A君の人気が一番では無い』という仮説を否定する。
「A君以外の生徒」が一番人気と考える人の確率が【ある水準】以下であれば、『A君の人気が一番では無い』という仮説を否定できるので、「A君が一番人気」という事が証明されるわけだ。
この【ある水準】というのは、自由に設定できる。
60%なのか、95%、99%・・この確立を設定した上での証明というわけである。
人気投票数であれば、過半数や2/3という水準でも良さそうだな・・面白い。
ついでに「標準偏差」も勉強になる。
これは「偏差値」の計算で使用する値でもある。算出方法は面倒だが、意味が深い。
まず各データ毎に、平均値からの差を算出し、絶対値で表す。
上記の値を【二乗】する。
各データ毎の数値を全て足す。
合計の値を、データ数で割る。・・ここで算出された値を「分散」という。
割った数字(分散)の平方根を求める。・・これが「標準偏差」。
何だか理解し難いのだが、「平均からの差」を面積(平方)に表し、面積の平均(分散)を算出するところが要点だと考える。
なぜ、この数値を算出するかというと、全体の「ばらつき」を見るためであるとの事。
つまり、平均値だけではデータの分布が分からないので、この分布も考慮した評価を表したいという訳である。
例えば・・「テストの成績」を評価する時。
私的であるが、点数が悪かった時などは「全体の分布図」を考慮した上での、評価点が欲しい。そこで標準偏差を利用した「偏差値」が嬉しいというわけである。
[Dell]数量限定在庫一掃モデルがお得!
これを競輪のデータ分析に反映させたら面白そうだ。
まずはデータ分析に必要な知識を取得することに集中しよう。
ちなみに、昨日も競輪の予想を2レース分(GVグレートレース)やってみた。
結果は一勝一敗。3位入着する内の二車を予想してみたのだが、予想材料としてライン構成が重要だと再認識した。
まずは勉強、勉強だね。
空き時間に読書するのだが、先日読み始めた「ラクをしないと成果は出ない」(著:日垣隆氏)は読み終わってしまった。
100項目を挙げて、それぞれに意見が記載されている。
幾つか勉強になったが、内容が単発である項目を100項目も記述するのは大変だ。題名と反して内容は効率化を求める考え方が記述されている。
過去の本を掘り出して、次は何を読もうかな・・(おつかれさま)。
「帰無仮説」や「標準偏差」などの考え方が面白い。
数値からターゲットの動向を見るのだが、「なるほど」と感じる事が多い。「帰無仮説」は『ある事』を証明するために『ある事』の逆説を掲示し、この逆説を否定する事で証明する方法だ。
例えば・・「学校で一番人気がある生徒はA君である」という事を証明するために、『A君の人気が一番では無い』という仮説を否定する。
「A君以外の生徒」が一番人気と考える人の確率が【ある水準】以下であれば、『A君の人気が一番では無い』という仮説を否定できるので、「A君が一番人気」という事が証明されるわけだ。
この【ある水準】というのは、自由に設定できる。
60%なのか、95%、99%・・この確立を設定した上での証明というわけである。
人気投票数であれば、過半数や2/3という水準でも良さそうだな・・面白い。
ついでに「標準偏差」も勉強になる。
これは「偏差値」の計算で使用する値でもある。算出方法は面倒だが、意味が深い。
まず各データ毎に、平均値からの差を算出し、絶対値で表す。
上記の値を【二乗】する。
各データ毎の数値を全て足す。
合計の値を、データ数で割る。・・ここで算出された値を「分散」という。
割った数字(分散)の平方根を求める。・・これが「標準偏差」。
何だか理解し難いのだが、「平均からの差」を面積(平方)に表し、面積の平均(分散)を算出するところが要点だと考える。
なぜ、この数値を算出するかというと、全体の「ばらつき」を見るためであるとの事。
つまり、平均値だけではデータの分布が分からないので、この分布も考慮した評価を表したいという訳である。
例えば・・「テストの成績」を評価する時。
私的であるが、点数が悪かった時などは「全体の分布図」を考慮した上での、評価点が欲しい。そこで標準偏差を利用した「偏差値」が嬉しいというわけである。
[Dell]数量限定在庫一掃モデルがお得!
これを競輪のデータ分析に反映させたら面白そうだ。
まずはデータ分析に必要な知識を取得することに集中しよう。
ちなみに、昨日も競輪の予想を2レース分(GVグレートレース)やってみた。
結果は一勝一敗。3位入着する内の二車を予想してみたのだが、予想材料としてライン構成が重要だと再認識した。
まずは勉強、勉強だね。
空き時間に読書するのだが、先日読み始めた「ラクをしないと成果は出ない」(著:日垣隆氏)は読み終わってしまった。
100項目を挙げて、それぞれに意見が記載されている。
幾つか勉強になったが、内容が単発である項目を100項目も記述するのは大変だ。題名と反して内容は効率化を求める考え方が記述されている。
過去の本を掘り出して、次は何を読もうかな・・(おつかれさま)。
【このカテゴリーの最新記事】
-
no image
-
no image
-
no image
-
no image
-
no image
この記事へのコメント
コメントを書く
この記事へのトラックバックURL
https://fanblogs.jp/tb/4500088
※ブログオーナーが承認したトラックバックのみ表示されます。
この記事へのトラックバック