前回の記事で紹介したカイ二乗分布を理解できれば、母分散を推定することができる。
カイ二乗分布についてまだ知らない方は、以下の記事をチェックしてくれ。
さて、分布を知ることができれば「95パーセント予言的中区間」を導き出すことができる。
カイ二乗分布の相対度数
以下の表は、自由度毎の95パーセント信頼区間を表したものだ。
自由度 | 相対度数:0.975 | 相対度数:0.025 |
1 | 0.001 | 5.023 |
2 | 0.0506 | 7.377 |
3 | 0.2157 | 9.3484 |
4 | 0.4844 | 11.1433 |
5 | 0.8312 | 12.8325 |
6 | 1.2373 | 14.4494 |
7 | 1.6898 | 16.0128 |
例えば以下の式で統計量Vを算出した場合を考える。
$$V = x1^2 + x2^2 + x3^2 + x4^2 + x5^2$$
表を見ると自由度5のとき、Vが0.8312以上となる確率は97.5%で、12.8325以上となる確率が2.5%ということが分かる。
つまり、Vの95パーセント信頼区間は次のとおりだ。
$$0.8312 \leqq V \leqq 12.8325$$
正規母集団の母分散を推定
今回は母平均μが分かっているという前提で例題を解いていく。
また身長データを例にしよう。
ある正規母集団の母平均が170cmだとする。
この母集団から3個の標本を観測し、それぞれ168cm、178cm、175cmだった場合、母分散の95パーセント信頼区間は何になるか?を考える。
まずは統計量Vを算出しよう。
$$V = (\frac{x1 – μ}{σ})^2 + (\frac{x2 – μ}{σ})^2 + (\frac{x3 – μ}{σ})^2$$
$$V = (\frac{168 – 170}{σ})^2 + (\frac{178 – 170}{σ})^2 + (\frac{175 – 170}{σ})^2$$
$$V = \frac{(-2)^2}{σ^2} + \frac{8^2}{σ^2} + \frac{5^2}{σ^2}$$
$$V = \frac{4}{σ^2} + \frac{64}{σ^2} + \frac{25}{σ^2}$$
$$V = \frac{93}{σ^2}$$
先に挙げた自由度nの95パーセント信頼区間の表から、自由度3の部分を抜粋したものが以下の表だ。
自由度 | 相対度数:0.975 | 相対度数:0.025 |
3 | 0.2157 | 9.3484 |
表の値から以下の不等式が出来上がる。
$$0.2157 \leqq \frac{93}{σ^2} \leqq 9.3484$$
次にこの式を解いていく。
$$0.2157σ^2 \leqq 93 \leqq 9.3484σ^2$$
左の不等式と、右の不等式をそれぞれ割り算して解く。
$$σ^2 \leqq \frac{93}{0.2157} = σ^2 \leqq 431.15..$$
$$\frac{93}{9.3484} \leqq σ^2 = 9.948.. \leqq σ^2$$
以上の結果から、母分散の95パーセント信頼区間は以下の不等式が成り立つことが分かる。
$$9.948.. \leqq σ^2 \leqq 431.15..$$
また、最後に3辺のルートをとれば、母標準偏差の区間推定をおこなうこともできる。
$$3.154.. \leqq σ \leqq 20.764..$$
これが母平均が分かっている状態での母分散の区間推定のやり方だ。
【中卒でも分かる統計学入門】連載記事一覧
- 度数分布表とヒストグラム
- 度数分布表から平均値を求める
- 色々な平均値の求め方
- データの散らばり具合をみる分散と標準偏差
- 度数分布表から標準偏差を求める
- 標準偏差を理解して偏差値の求め方と意味を知る
- Pythonで偏差値を求める
- 仮説検定で一つのデータから母集団を推定する
- Pythonで95パーセント信頼区間を求める
- 平均に対する区間推定
- 母集団からとった標本平均の95パーセント予言的中区間
- 標本平均から母平均を区間推定する
- 標本分散とカイ二乗分布
- カイ二乗分布から母分散を推定する ←←現在見ている記事
- 標本分散に比例する統計量Wの求め方
- 母平均が分からなくても母標準偏差を推定する方法
- 統計量Tを求めてt分布を理解する
- t分布を使った区間推定