前回の記事を読んだ読者はt分布を既に理解しているはずだ。
t分布を知ることで、正規母集団の母分散が分からない状況でも少ない標本データから母平均を推定することができるのだ。
早速、区間推定の具体的な手法を紹介していこう。
コンテンツ
t分布の95パーセント予言的中区間
自由度 | 限界値 |
1 | 12.706 |
2 | 4.303 |
3 | 3.182 |
4 | 2.776 |
5 | 2.571 |
6 | 2.447 |
7 | 2.365 |
8 | 2.306 |
9 | 2.262 |
10 | 2.228 |
30 | 2.042 |
60 | 2.000 |
120 | 1.980 |
この表の見方を簡単に解説しておこう。
まず自由度を見る。
例えば自由度が5の場合、限界値は2.571となる。
この時、Tの95パーセント予言的中区間は次のとおりとなる。
$$-2.571 \leqq T \leqq +2.571$$
t分布のヒストグラムは以下のとおり、正規分布に似た形をしている。
t分布の性質として、自由度が高くなればなるほど限界値は、正規分布の限界値1.96に近づいていくという特徴を持っている。
例題を解いて母平均を区間推定する
では例題を解きながら、t分布を使った母平均の区間推定方法を学んでいこう。
ある都市の20代男性の身長について、母平均を推定する。
標本データとして5人の身長を測った。
それぞれ158cm、172cm、169cm、161cm、170cmだった場合の母平均は何cmになるかを考える。
まずは標本平均xバーと標本標準偏差Sを計算する。
$$\bar{x} = \frac{158 + 172 + 169 + 161 + 170}{5} = 166$$
$$S^2 = \frac{(158 – 166)^2 + (172 – 166)^2 + (169 – 166)^2 + (161 – 166)^2 + (170 – 166)^2}{5}$$
$$S^2 = \frac{(-8)^2 + (6)^2 + (3)^2 + (-5)^2 + (4)^2}{5}$$
$$S^2 = \frac{64 + 36 + 9 + 25 + 16}{5} = 30$$
$$S = \sqrt{30} = 5.477…$$
自由度n – 1(つまり今回の場合は自由度4)の95パーセント予言的中区間は、先に示した表のとおり2.776となるので、以下の不等式が成り立つ。
$$-2.776 \leqq T \leqq +2.776$$
上記の式のTに式を代入すると次のとおり。
$$-2.776 \leqq \frac{(\bar{x} – μ)\sqrt{n – 1}}{S} \leqq +2.776$$
$$-2.776 \leqq \frac{(166 – μ)\sqrt{5 – 1}}{5.477} \leqq +2.776$$
まずルート(5 – 1)÷5.477を解く。
$$-2.776 \leqq (166 – μ) \times 0.365… \leqq +2.776$$
次に3辺で0.365を割り算する。
$$-7.605 \leqq (166 – μ) \leqq +7.605$$
3辺から166を引く。
$$-173.605 \leqq -μ \leqq -158.395$$
3辺に-1を掛ける。
負の数を掛けると不等号が逆転するので、整理すると次のとおりとなる。
$$158.395 \leqq μ \leqq 173.605$$
結果、5個の標本データからt分布を使った区間推定を行うことで、母平均μは95パーセントの確率で158.395cm以上、173.605cm以下であるということが分かった。
まとめ
ここまで【中卒でも分かる統計学入門】というシリーズで記事を書いてきたが、この内容は完全独習 統計学入門という書籍から中卒の俺が実際に学んだ内容をまとめたものだ。
中学レベルの数学力でも十分に統計学の基礎を学ぶことができた。
これから機械学習を深く学んでいくにあたり、数学・統計学の知識は必須となるようなので、AIなどの分野へ興味のある方は是非ここまでまとめてきたシリーズ記事を読んで、統計の概念を学んでもらえれば、より今後の学習も捗ることになると思う。
【中卒でも分かる統計学入門】連載記事一覧
- 度数分布表とヒストグラム
- 度数分布表から平均値を求める
- 色々な平均値の求め方
- データの散らばり具合をみる分散と標準偏差
- 度数分布表から標準偏差を求める
- 標準偏差を理解して偏差値の求め方と意味を知る
- Pythonで偏差値を求める
- 仮説検定で一つのデータから母集団を推定する
- Pythonで95パーセント信頼区間を求める
- 平均に対する区間推定
- 母集団からとった標本平均の95パーセント予言的中区間
- 標本平均から母平均を区間推定する
- 標本分散とカイ二乗分布
- カイ二乗分布から母分散を推定する
- 標本分散に比例する統計量Wの求め方
- 母平均が分からなくても母標準偏差を推定する方法
- 統計量Tを求めてt分布を理解する
- t分布を使った区間推定 ←←現在見ている記事