これまでの記事で紹介してきた仮説検定では、母集団が正規分布と分かっていて、かつ平均値と標準偏差も分かっているという状況で行ってきた。
本来、ビジネスの現場などの実践的なケースでは、正規分布であることも、標準偏差も分からないような環境の中、統計学をフル動員して推定していく。
ここまで学習してきた統計学の内容では、そこまで難しい推定をおこなうことはできないので、今回は少し特殊な状況だが、正規分布していることと標準偏差が分かっているが、平均値が分かっていないという状況の中で、観測されたデータをもとに平均値を区間推定していく。
区間推定の例題を解く
では早速例題を解いていこう。
中学生n人の身長データがあるとする。
この母集団は正規分布しており、標準偏差は12cmということが分かっている。
この中でAさんの身長が168cmということが分かった時、この母集団の平均身長を95パーセント信頼区間で区間推定した場合、何cmになるか?
まず求めるべき平均値をμとする。
標準偏差σは12ということが分かっている。
区間推定の式は以下のとおりだった。
$$z = \frac{x – μ}{σ}$$
この式に観測値168とσ=12を当てはめる。
$$z = \frac{168 – μ}{12}$$
さらに以下の式を解いていこう。
$$-1.96 \geqq \frac{168 – μ}{12} \leqq +1.96$$
三辺に12を乗じて分母を払う。
$$-23.52 \geqq 168 – μ \leqq +23.52$$
三辺から168を減じる。
$$-191.52 \geqq -μ \leqq -144.48$$
μからマイナスを外すため、三辺に-1を乗じる。
$$191.52 \geqq μ \leqq 144.48$$
上記の手順で式を解くと、母集団の平均値μの95パーセント信頼区間は「144.48cm以上、191.52cm以下」ということが分かる。
まとめ
基礎の公式さえ分かれば、様々な場面で統計的な信頼区間を算出することができる。
今回は身長を例に出したが、ビジネスの現場で応用できる事例はいくつもあるはずなので、今後実践で応用していきたい。
【中卒でも分かる統計学入門】連載記事一覧
- 度数分布表とヒストグラム
- 度数分布表から平均値を求める
- 色々な平均値の求め方
- データの散らばり具合をみる分散と標準偏差
- 度数分布表から標準偏差を求める
- 標準偏差を理解して偏差値の求め方と意味を知る
- Pythonで偏差値を求める
- 仮説検定で一つのデータから母集団を推定する
- Pythonで95パーセント信頼区間を求める
- 平均に対する区間推定 ←←現在見ている記事
- 母集団からとった標本平均の95パーセント予言的中区間
- 標本平均から母平均を区間推定する
- 標本分散とカイ二乗分布
- カイ二乗分布から母分散を推定する
- 標本分散に比例する統計量Wの求め方
- 母平均が分からなくても母標準偏差を推定する方法
- 統計量Tを求めてt分布を理解する
- t分布を使った区間推定