これまでの記事で様々な推定をおこなってきたが、その全てにおいて母平均μが分かっているという、現実ではあり得ない状況を前提に話を進めてきた。
このままでは、これまでおこなってきた推定の手法を実際の現場で活用することができないので、今回は標本データをもとに統計量Tを導き出し、Tの分布(t分布)を求める手法を紹介しよう。
このt分布が分かれば、母平均μを推定することもできるのだ。
コンテンツ
統計量Tの求め方
正規母集団からn個のデータを観測し、まず標本平均を計算する。
$$\bar{x} = \frac{x1 + x2 + … xn}{n}$$
次に標本標準偏差を計算する。
$$S = \sqrt{\frac{(x1 – \bar{x})^2 + (x2 – \bar{x})^2 + … (xn – \bar{x})^2}{n}}$$
これらの値を元に、最後に統計量Tを計算する。
$$T = \frac{(\bar{x} – μ)\sqrt{n – 1}}{S}$$
見てのとおり、統計量Tを求めるにあたって現れる変数のうち、μ以外は全て観測した標本データから計算することができることが分かる。
ということは、統計量Tの分布さえ分かれば95パーセント予言的中区間を作り、母平均μを区間推定できるということだ。
この分布をt分布という。
t分布のヒストグラム
統計量Tの分布は、自由度n – 1のt分布と呼ばれる。
ヒストグラムで表すと次のとおりとなり、正規分布に似た曲線を描く。
正規分布と比べると、ややグラフの頂点の位置が低く、両端はやや高い山型のグラフになるということが分かるだろう。
また、t分布の相対度数は数学者により正確に計算されているので、これによりカイ二乗分布と同じように95パーセント予言的中区間を言い当てることができるということだ。
この区間の推定については次回以降に触れるとして、今回は例題を解きながら統計量Tの計算をおこなうところまで話を進めよう。
例題を解いて統計量Tを計算する
この例題では母平均が分かっているものとする。
母平均μが165cmという正規母集団から、5つの標本を観測した。
それぞれのデータが158cm、172cm、169cm、161cm、170cmだった場合の統計量Tを計算する。
まずは標本平均から計算する。
$$\bar{x} = \frac{158 + 172 + 169 + 161 + 170}{5} = 166$$
次に標本標準偏差を計算する。
$$S^2 = \frac{(158 – 166)^2 + (172 – 166)^2 + (169 – 166)^2 + (161 – 166)^2 + (170 – 166)^2}{5}$$
$$S^2 = \frac{(-8)^2 + (6)^2 + (3)^2 + (-5)^2 + (4)^2}{5}$$
$$S^2 = \frac{64 + 36 + 9 + 25 + 16}{5} = 30$$
$$S = \sqrt{30} = 5.477…$$
最後に統計量Tを計算する。
$$T = \frac{(\bar{x} – μ)\sqrt{n – 1}}{S}$$
$$T = \frac{(166 – 165)\sqrt{5 – 1}}{5.477}$$
この式を解くと以下の結果が算出される。
$$T = \frac{2}{5.477} = 0.365…$$
まとめ
今回の例題では、分かりやすく母平均μを定義して計算をおこなったが、次回はt分布の本題である、母平均μの区間推定をおこなう。
楽しみにしておいてくれ。
【中卒でも分かる統計学入門】連載記事一覧
- 度数分布表とヒストグラム
- 度数分布表から平均値を求める
- 色々な平均値の求め方
- データの散らばり具合をみる分散と標準偏差
- 度数分布表から標準偏差を求める
- 標準偏差を理解して偏差値の求め方と意味を知る
- Pythonで偏差値を求める
- 仮説検定で一つのデータから母集団を推定する
- Pythonで95パーセント信頼区間を求める
- 平均に対する区間推定
- 母集団からとった標本平均の95パーセント予言的中区間
- 標本平均から母平均を区間推定する
- 標本分散とカイ二乗分布
- カイ二乗分布から母分散を推定する
- 標本分散に比例する統計量Wの求め方
- 母平均が分からなくても母標準偏差を推定する方法
- 統計量Tを求めてt分布を理解する ←←現在見ている記事
- t分布を使った区間推定