今回は、ある正規母集団(正規分布した母集団)の中からとったn個の標本データから、標本平均を推定する方法を紹介する。
コンテンツ
95パーセント予言的中区間の復習
詳しくは以前の記事で説明したが、軽く復習をしておく。
平均値μ、標準偏差σの正規分布の95パーセント予言的中区間は、下記の不等式が成り立つ。
$$-1.96σ \leqq μ \leqq +1.96σ$$
つまり、ある母集団からとった一つのデータの値を95パーセントの確率で的中させようと思ったら「平均値μから標準偏差σの1.96倍の範囲内」の値を言っておけば大丈夫ということだ。
n個の標本から平均値を推定する
早速本題に入ろう。
今回は2個以上の標本をとった場合の標本平均を推定していく。
計算の仕方が分かれば簡単な話で、以下の不等式が成り立つ。
$$-1.96 \leqq \frac{\bar{x} – μ}{\frac{σ}{\sqrt{n}}} \leqq +1.96$$
$$\bar{x} = 標本平均$$
$$μ = 母平均$$
$$σ = 母標準偏差$$
$$n = 標本データ数$$
では、上記の式に例題を当てはめて、標本平均(xバー)を解いていく。
例題1. 4個のデータを観測する場合の標本平均
ある国の20代男性の身長を例にする。
母集団は正規分布しているとして(正規母集団)、その母平均が172cmだとする。
さらに母標準偏差は10ということまで分かっていたとしよう。
この母集団の中から、まず4個のデータをピックアップした場合に考えられる標本平均を推定する。
$$-1.96 \leqq \frac{\bar{x} – 172}{\frac{10}{\sqrt{4}}} \leqq +1.96$$
分母の「ルート4分の10」を解く。
$$-1.96 \leqq \frac{\bar{x} – 172}{5} \leqq +1.96$$
3辺に5を掛けて分母を払う。
$$-9.8 \leqq \bar{x} – 172 \leqq +9.8$$
3辺に172を足して(-172)を消す。
$$162.2 \leqq \bar{x} \leqq +181.8$$
上記の結果、この正規母集団から観測した4個のデータの標本平均は「162.2cm以上、181.8cm以下」と予言すれば95パーセント当たる、ということが分かる。
例題2. 16個のデータを観測する場合の標本平均
今度は、同じ正規母集団から16個の標本を観測した場合の標本平均を推定してみる。
解き方は同じだ。
$$-1.96 \leqq \frac{\bar{x} – 172}{\frac{10}{\sqrt{16}}} \leqq +1.96$$
$$-1.96 \leqq \frac{\bar{x} – 172}{2.5} \leqq +1.96$$
$$-4.9 \leqq \bar{x} – 172 \leqq +4.9$$
$$167.1 \leqq \bar{x} \leqq +176.9$$
観測するデータを16個に増やした場合の標本平均は「167.1cm以上、176.9cm以下」と、先ほどの例よりも狭い区間で推定をすることができた。
まとめ
例題を解いてみて分かるとおり、観測するデータが多ければ多いほど予言する区間は狭くなる。
つまり、95パーセントの的中率はそのままで、よりピンポイントで当てることができるということになる。
【中卒でも分かる統計学入門】連載記事一覧
- 度数分布表とヒストグラム
- 度数分布表から平均値を求める
- 色々な平均値の求め方
- データの散らばり具合をみる分散と標準偏差
- 度数分布表から標準偏差を求める
- 標準偏差を理解して偏差値の求め方と意味を知る
- Pythonで偏差値を求める
- 仮説検定で一つのデータから母集団を推定する
- Pythonで95パーセント信頼区間を求める
- 平均に対する区間推定
- 母集団からとった標本平均の95パーセント予言的中区間 ←←現在見ている記事
- 標本平均から母平均を区間推定する
- 標本分散とカイ二乗分布
- カイ二乗分布から母分散を推定する
- 標本分散に比例する統計量Wの求め方
- 母平均が分からなくても母標準偏差を推定する方法
- 統計量Tを求めてt分布を理解する
- t分布を使った区間推定