アフィリエイト広告を利用しています

2021年06月22日

森鴎外の「佐橋甚五郎」でオッズ比を考える5

3 まとめ

 森鴎外の「佐橋甚五郎」で甚五郎の読みと蜂谷の読みで創発に関しクロス集計表を作成し、行要素と列要素の関連を計算した。オッズ比で事象の起こりやすさを計算し、統計データから得られた数字の意味を考えた。 オッズ比の分析に関心がある人は、試してもらいたい。 

参考文献

中村好一 基礎から学ぶ楽しい保険統計 医学書院 2016
花村嘉英 計算文学入門−Thomas Mannのイロニーはファジィ推論といえるのか? 新風舎 2005
花村嘉英 三浦綾子の「道ありき」で執筆脳を考える ブログ「シナジーのメタファー」2020
Wikipedia オッズ比

森鴎外の「佐橋甚五郎」でオッズ比を考える4

表2に数字を(1)を公式に当てはめてオッズ比を計算する。 

甚五郎 創発あり4 創発なし1 
蜂谷 創発あり3 創発なし2 縦計5
創発あり 甚五郎4 蜂谷3 横計7
創発なし 甚五郎1 蜂谷2 横計3

要因Aありのオッズ=4/1=4
要因Aなしのオッズ=3/2=1.5
オッズ比=4÷1.5=2.67 オッズ比は、2.67ということになる。  

森鴎外の「佐橋甚五郎」でオッズ比を考える3

2 森鴎外の「佐橋甚五郎」でクロス集計表を分析する

源太夫はこういう話をした。甚五郎は鷺を撃つとき蜂谷と賭をした。蜂谷は身につけているものを何なりとも賭けようと言った。甚五郎は運よく鷺を撃ったので、ふだん望みをかけていた蜂谷の大小をもらおうと言った。甚五郎 創発1 蜂矢 創発1

それもただもらうのではない。代わりに自分の大小をやろうというのである。しかし蜂谷は、この金熨斗付きの大小は蜂谷家で由緒のある品だからやらぬと言った。甚五郎 創発2 蜂矢 創発1

甚五郎はきかなんだ。「武士は誓言をしたからは、一命をもすてる。よしや由緒があろうとも、おぬしの身に着けている物の中で、わしが望むのは大小ばかりじゃ。ぜひくれい」と言った。甚五郎 創発1 蜂矢 創発2

「いや、そうはならぬ。命ならいかにも棄ちょう。家の重宝は命にも換えられぬ」と蜂谷は言った。「誓言を反古(ほご)にする犬侍め」と甚五郎がののしると、蜂谷は怒って刀を抜こうとした。
甚五郎 創発1 蜂矢 創発1

甚五郎は当身を食わせた。それきり蜂谷は息を吹き返さなかった。平生何事か言い出すとあとへ引かぬ甚五郎は、とうとう蜂谷の大小を取って、自分の大小を代りに残して立ち退いたというのである。 
甚五郎 創発1 蜂矢 創発2

指数のため、甚五郎は、創発あり1なし4、蜂谷は、創発あり4なし1になる。

森鴎外の「佐橋甚五郎」でオッズ比を考える2

 オッズ比が1とは、対象とする事象の起こりやすさが両群で同じということであり、1より大きいとは、事象が第1群(第2群)でより起こりやすいということである。オッズ比は必ず0以上である。第1群(第2群)のオッズが0に近づけばオッズ比は0(∞)に近づく。但し、bやcが0の場合、オッズ比の公式の分母に0が入るため、オッズ比が無限大(∞)になり95%信頼区間もできなくなる。
 そこで4つのセルに0.5を加えて、(a+0.5)x(d+0.5)/ (b+0.5)x(c+0.5)をオッズ比とする。これは、ウォルフ−ハルディンの補正と呼ばれている。

花村嘉英(2021)「森鴎外の『佐橋甚五郎』でオッズ比を考える」より

森鴎外の「佐橋甚五郎」でオッズ比を考える1

1 オッズ比とは

 ある事象の起こりやすさを二つの群で比較する統計の尺度である。オッズ比の考え方は、2x2分割表であり、a/bが要因Aあり群の要因Bのオッズ、c/dが要因Aなし群の要因Bのオッズで、両者の比(a/b)/(c/d)=ad/ bcがオッズ比である。

表1
要因Aあり 要因Bありa 要因Bなしb 縦計a+b
要因Aなし 要因Bありc 要因Bなしd 縦計c+d
横計    a+c     b+d

n=a+b+c+d
要因Aありのオッズ=a/b
要因Aなしのオッズ=c/d
オッズ比=(a/b)/(c/d)=ad/bc

花村嘉英(2021)「森鴎外の『佐橋甚五郎』でオッズ比を考える」より

2021年06月21日

森鴎外の「佐橋甚五郎」でカイ二乗検定を考える3

3 まとめ

 森鴎外の「佐橋甚五郎」で自覚症状と検査に関しクロス集計表を作成し、行要素と列要素の関連を計算し、カイ二乗値を計算し数字の意味を考えた。カイ二乗検定の分析に関心がある人は、試してもらいたい。 

参考文献

中村好一 基礎から学ぶ楽しい保険統計 医学書院 2016
花村嘉英 計算文学入門−Thomas Mannのイロニーはファジィ推論といえるのか? 新風舎 2005
花村嘉英 莫言の「蛙」でカイ二乗検定を考える ファンブログ 2020
花村嘉英 莫言の「蛙」でファイ係数を考える ファンブログ 2020
いちばんやさしい、医療統計 カイ二乗検定 best-biostatistics.com

森鴎外の「佐橋甚五郎」でカイ二乗検定を考える2

カテゴリーとして、自覚症状と検査で治療があるかどうかの件数を考える。

表2 観測データ
甚五郎 創発3 行動2 縦計5
蜂谷 創発4 行動1 縦計5
創発 甚五郎3 蜂谷4 横計7
行動 甚五郎2 蜂谷1 横計3

@ 甚五郎で創発ありのカテゴリー。10 x 5/10 x 7/10 = 3.5  
A 甚五郎で創発なしのカテゴリー。10 x 5/10 x 3/10 = 1.5
B 検査で治療ありのカテゴリー。10 x 5/10 x 7/10 = 3.5  
C 検査で治療なしのカテゴリー。10 x 5/10 x 3/10 = 1.5  

表3 期待度数
甚五郎 創発あり3.5 創発なし1.5
蜂谷 創発あり3.5 創発なし1.5

カイ二乗検定は、表2と表3の差を計算する。(観測データ−期待度数)2 / 期待度数の公式で各カテゴリーを計算すると、表4になる。

表4 差の計算
自覚 治療あり0.07 治療なし0.17
検査 治療あり0.07 治療なし0.17

カイ二乗検定は、表4の値を全て足したものになる。0.07 +0.07+0.17+0.17=0.48
カイ二乗値、つまり、観測と期待度数の差は、0.48になる。

花村嘉英(2021)「森鴎外の『佐橋甚五郎』でカイ二乗検定を考える」より

森鴎外の「佐橋甚五郎」でカイ二乗検定を考える1

1 カイ二乗検定とは

 カイ二乗検定とは、カテゴリーデータを対象とし、期待値に対し実測値の編りを調べるために使用する検定方法である。実測値は、森鴎外の「佐橋甚五郎」の一場面より作成した。期待値は、そこから一つ一つ計算している。 

2 森鴎外の「佐橋甚五郎」でクロス集計表を分析する

表1
源太夫はこういう話をした。甚五郎は鷺を撃つとき蜂谷と賭をした。蜂谷は身につけているものを何なりとも賭けようと言った。甚五郎は運よく鷺を撃ったので、ふだん望みをかけていた蜂谷の大小をもらおうと言った。

それもただもらうのではない。代わりに自分の大小をやろうというのである。しかし蜂谷は、この金熨斗付きの大小は蜂谷家で由緒のある品だからやらぬと言った。

甚五郎はきかなんだ。「武士は誓言をしたからは、一命をもすてる。よしや由緒があろうとも、おぬしの身に着けている物の中で、わしが望むのは大小ばかりじゃ。ぜひくれい」と言った。

「いや、そうはならぬ。命ならいかにも棄ちょう。家の重宝は命にも換えられぬ」と蜂谷は言った。「誓言を反古(ほご)にする犬侍め」と甚五郎がののしると、蜂谷は怒って刀を抜こうとした。

甚五郎は当身を食わせた。それきり蜂谷は息を吹き返さなかった。平生何事か言い出すとあとへ引かぬ甚五郎は、とうとう蜂谷の大小を取って、自分の大小を代りに残して立ち退いたというのである。

花村嘉英(2021)「森鴎外の『佐橋甚五郎』でカイ二乗検定を考える」より

森鴎外の「佐橋甚五郎」でファイ係数を考える4

3 まとめ  

 森鴎外の「佐橋甚五郎」の虚無ありの読みと虚無なしの読みで結核に関しクロス集計表を作成し、行要素と列要素の関連の強さを計算した。ファイ係数から感度や特異度そして正確度や適合度も計算し、統計データから得られた数字の意味を考えた。ファイ係数の分析に関心がある人は、試してもらいたい。 

参考文献

花村嘉英 計算文学入門−Thomas Mannのイロニーはファジィ推論といえるのか? 新風舎 2005
https://best-biostatistics.com/design/kouraku2.html(いちばんやさしい医療統計)
https://ash-d.click/2018/01/08/st_0108/(性別と購入の関連性)
https://www.cresco.co.jp/blog/entry/5987/(感度とか特異度)

森鴎外の「佐橋甚五郎」でファイ係数を考える3

さらに表4の数字を公式(1)に当てはめてファイ係数を計算する。

表4
甚五郎 創発2 行動3 縦計5
源太夫 創発1 行動4 縦計5
創発 甚五郎2 源太夫1 横計5
行動 甚五郎3 源太夫4 横計7

(2)2 x 4 -3 x 1 / √3 x 7 x 5 x 5 = 0.22

 ファイ係数、即ち、行要素と列要素の関連の強さは、弱い関連があるになる。次に、その他の関連する数字を見てみよう。 

感度= a ÷ (a + c)のため、2÷ (2+1)=0.5。結核ありの真性の割合である。 
特異度 = d ÷ (b+ d) のため、4 ÷ (3+4)=0.57。結核なしの真性の割合である。
正確度=(a + d)÷(a +b+ c + d) のため、(2+4 )÷ (4 +3+1+ 4) =0.5。全体の真性の割合である。
適合度= a÷(a +b) のため、2÷ (2+3)=0.4。虚無ありと判定したものが正解である割合である。

花村嘉英(2021)「森鴎外の『佐橋甚五郎』でファイ係数を考える」より
ファン
検索
<< 2021年06月 >>
    1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30      
最新記事
写真ギャラリー
最新コメント
タグクラウド
カテゴリーアーカイブ
プロフィール
花村嘉英さんの画像
花村嘉英
花村嘉英(はなむら よしひさ) 1961年生まれ、立教大学大学院文学研究科博士後期課程(ドイツ語学専攻)在学中に渡独。 1989年からドイツ・チュービンゲン大学に留学し、同大大学院新文献学部博士課程でドイツ語学・言語学(意味論)を専攻。帰国後、技術文(ドイツ語、英語)の機械翻訳に従事する。 2009年より中国の大学で日本語を教える傍ら、比較言語学(ドイツ語、英語、中国語、日本語)、文体論、シナジー論、翻訳学の研究を進める。テーマは、データベースを作成するテキスト共生に基づいたマクロの文学分析である。 著書に「計算文学入門−Thomas Mannのイロニーはファジィ推論といえるのか?」(新風舎:出版証明書付)、「从认知语言学的角度浅析鲁迅作品−魯迅をシナジーで読む」(華東理工大学出版社)、「日本語教育のためのプログラム−中国語話者向けの教授法から森鴎外のデータベースまで(日语教育计划书−面向中国人的日语教学法与森鸥外小说的数据库应用)」南京東南大学出版社、「从认知语言学的角度浅析纳丁・戈迪默-ナディン・ゴーディマと意欲」華東理工大学出版社、「計算文学入門(改訂版)−シナジーのメタファーの原点を探る」(V2ソリューション)、「小説をシナジーで読む 魯迅から莫言へーシナジーのメタファーのために」(V2ソリューション)がある。 論文には「論理文法の基礎−主要部駆動句構造文法のドイツ語への適用」、「人文科学から見た技術文の翻訳技法」、「サピアの『言語』と魯迅の『阿Q正伝』−魯迅とカオス」などがある。 学術関連表彰 栄誉証書 文献学 南京農業大学(2017年)、大連外国語大学(2017年)
プロフィール