これまでの記事で紹介してきた仮説検定では、母集団が正規分布と分かっていて、かつ平均値と標準偏差も分かっているという状況で行ってきた。

本来、ビジネスの現場などの実践的なケースでは、正規分布であることも、標準偏差も分からないような環境の中、統計学をフル動員して推定していく。

ここまで学習してきた統計学の内容では、そこまで難しい推定をおこなうことはできないので、今回は少し特殊な状況だが、正規分布していることと標準偏差が分かっているが、平均値が分かっていないという状況の中で、観測されたデータをもとに平均値を区間推定していく。

区間推定の例題を解く

では早速例題を解いていこう。

中学生n人の身長データがあるとする。
この母集団は正規分布しており、標準偏差は12cmということが分かっている。
この中でAさんの身長が168cmということが分かった時、この母集団の平均身長を95パーセント信頼区間で区間推定した場合、何cmになるか?

まず求めるべき平均値をμとする。
標準偏差σは12ということが分かっている。

区間推定の式は以下のとおりだった。

$$z = \frac{x – μ}{σ}$$

この式に観測値168とσ=12を当てはめる。

$$z = \frac{168 – μ}{12}$$

さらに以下の式を解いていこう。

$$-1.96 \geqq \frac{168 – μ}{12} \leqq +1.96$$

三辺に12を乗じて分母を払う。

$$-23.52 \geqq 168 – μ \leqq +23.52$$

三辺から168を減じる。

$$-191.52 \geqq -μ \leqq -144.48$$

μからマイナスを外すため、三辺に-1を乗じる。

$$191.52 \geqq μ \leqq 144.48$$

上記の手順で式を解くと、母集団の平均値μの95パーセント信頼区間は「144.48cm以上、191.52cm以下」ということが分かる。

まとめ

基礎の公式さえ分かれば、様々な場面で統計的な信頼区間を算出することができる。

今回は身長を例に出したが、ビジネスの現場で応用できる事例はいくつもあるはずなので、今後実践で応用していきたい。

【中卒でも分かる統計学入門】連載記事一覧

  1. 度数分布表とヒストグラム
  2. 度数分布表から平均値を求める
  3. 色々な平均値の求め方
  4. データの散らばり具合をみる分散と標準偏差
  5. 度数分布表から標準偏差を求める
  6. 標準偏差を理解して偏差値の求め方と意味を知る
  7. Pythonで偏差値を求める
  8. 仮説検定で一つのデータから母集団を推定する
  9. Pythonで95パーセント信頼区間を求める
  10. 平均に対する区間推定 ←←現在見ている記事
  11. 母集団からとった標本平均の95パーセント予言的中区間
  12. 標本平均から母平均を区間推定する
  13. 標本分散とカイ二乗分布
  14. カイ二乗分布から母分散を推定する
  15. 標本分散に比例する統計量Wの求め方
  16. 母平均が分からなくても母標準偏差を推定する方法
  17. 統計量Tを求めてt分布を理解する
  18. t分布を使った区間推定