今回は、ある正規母集団(正規分布した母集団)の中からとったn個の標本データから、標本平均を推定する方法を紹介する。

95パーセント予言的中区間の復習

詳しくは以前の記事で説明したが、軽く復習をしておく。

平均値μ、標準偏差σの正規分布の95パーセント予言的中区間は、下記の不等式が成り立つ。

$$-1.96σ \leqq μ \leqq +1.96σ$$

つまり、ある母集団からとった一つのデータの値を95パーセントの確率で的中させようと思ったら「平均値μから標準偏差σの1.96倍の範囲内」の値を言っておけば大丈夫ということだ。

n個の標本から平均値を推定する

早速本題に入ろう。
今回は2個以上の標本をとった場合の標本平均を推定していく。

計算の仕方が分かれば簡単な話で、以下の不等式が成り立つ。

$$-1.96 \leqq \frac{\bar{x} – μ}{\frac{σ}{\sqrt{n}}} \leqq +1.96$$

$$\bar{x} = 標本平均$$
$$μ = 母平均$$
$$σ = 母標準偏差$$
$$n = 標本データ数$$

では、上記の式に例題を当てはめて、標本平均(xバー)を解いていく。

例題1. 4個のデータを観測する場合の標本平均

ある国の20代男性の身長を例にする。

母集団は正規分布しているとして(正規母集団)、その母平均が172cmだとする。
さらに母標準偏差は10ということまで分かっていたとしよう。

この母集団の中から、まず4個のデータをピックアップした場合に考えられる標本平均を推定する。

$$-1.96 \leqq \frac{\bar{x} – 172}{\frac{10}{\sqrt{4}}} \leqq +1.96$$

分母の「ルート4分の10」を解く。

$$-1.96 \leqq \frac{\bar{x} – 172}{5} \leqq +1.96$$

3辺に5を掛けて分母を払う。

$$-9.8 \leqq \bar{x} – 172 \leqq +9.8$$

3辺に172を足して(-172)を消す。

$$162.2 \leqq \bar{x} \leqq +181.8$$

上記の結果、この正規母集団から観測した4個のデータの標本平均は「162.2cm以上、181.8cm以下」と予言すれば95パーセント当たる、ということが分かる。

例題2. 16個のデータを観測する場合の標本平均

今度は、同じ正規母集団から16個の標本を観測した場合の標本平均を推定してみる。

解き方は同じだ。

$$-1.96 \leqq \frac{\bar{x} – 172}{\frac{10}{\sqrt{16}}} \leqq +1.96$$

$$-1.96 \leqq \frac{\bar{x} – 172}{2.5} \leqq +1.96$$

$$-4.9 \leqq \bar{x} – 172 \leqq +4.9$$

$$167.1 \leqq \bar{x} \leqq +176.9$$

観測するデータを16個に増やした場合の標本平均は「167.1cm以上、176.9cm以下」と、先ほどの例よりも狭い区間で推定をすることができた。

まとめ

例題を解いてみて分かるとおり、観測するデータが多ければ多いほど予言する区間は狭くなる。
つまり、95パーセントの的中率はそのままで、よりピンポイントで当てることができるということになる。

【中卒でも分かる統計学入門】連載記事一覧

  1. 度数分布表とヒストグラム
  2. 度数分布表から平均値を求める
  3. 色々な平均値の求め方
  4. データの散らばり具合をみる分散と標準偏差
  5. 度数分布表から標準偏差を求める
  6. 標準偏差を理解して偏差値の求め方と意味を知る
  7. Pythonで偏差値を求める
  8. 仮説検定で一つのデータから母集団を推定する
  9. Pythonで95パーセント信頼区間を求める
  10. 平均に対する区間推定
  11. 母集団からとった標本平均の95パーセント予言的中区間 ←←現在見ている記事
  12. 標本平均から母平均を区間推定する
  13. 標本分散とカイ二乗分布
  14. カイ二乗分布から母分散を推定する
  15. 標本分散に比例する統計量Wの求め方
  16. 母平均が分からなくても母標準偏差を推定する方法
  17. 統計量Tを求めてt分布を理解する
  18. t分布を使った区間推定