前回の記事では、正規母集団から観測された標本から母平均μを引き、母標準偏差σで割った値の2乗の和(統計量V)を作り、カイ二乗分布するVの区間推定をおこなう例を見てきた。

ただし「母平均μが分かっている」ということは現実世界ではなかなかあり得ないことである。

最終的には母平均μが分からないという状況下で推定をおこなうことを考えていくが、その前に今回は標本平均(xバー)を使って、新たな統計量Wを作っていくことを考える。

Wは標本分散に比例する統計量

前回解説した統計量Vの求め方(自由度3の場合)は以下のとおりだった。

$$V = (\frac{x1 – μ}{σ})^2 + (\frac{x2 – μ}{σ})^2 + (\frac{x3 – μ}{σ})^2$$

分子で標本データxから母平均μを引いているが、標本平均xバーを引くとどうなるか。

$$W = (\frac{x1 – \bar{x}}{σ})^2 + (\frac{x2 – \bar{x}}{σ})^2 + (\frac{x3 – \bar{x}}{σ})^2$$

$$W = \frac{(x1 – \bar{x})^2}{σ^2} + \frac{(x2 – \bar{x})^2}{σ^2} + \frac{(x3 – \bar{x})^2}{σ^2}$$

実はこのWは標本分散に比例することが分かる。

まず標本分散を求める式を見てみよう。

$$S^2 = \frac{(x1 – \bar{x})^2 + (x2 – \bar{x})^2 + (x3 – \bar{x})^2}{n}$$

Wを求める式と標本分散を求める式の分子が同じだ。

このことから、標本分散にデータ数nを掛けて分母を払った式と、Wに母分散σ2乗を掛けて分母を払った式が同じになることが分かる。

$$S^2 \times n = W \times σ^2$$

つまり、Wと標本分散は比例する関係になっており、次の式も成り立つということだ。

$$S^2 = \frac{W \times σ^2}{n}$$

$$W = \frac{S^2 \times n}{σ^2}$$

標本分散のカイ二乗分布は自由度が1つ下がる

実は統計量Wは自由度(n – 1)のカイ二乗分布になる。

これを「なぜそうなるのか」と理解しようとするとかなり難解になるなので、数学者がそう言っているのだからそういうものなのか、と理解しておくことにする。

例題:5人の身長から統計量Wとその分布を求める

では早速例題を解いて理解を深めていくことにしよう。

正規母集団から5人の身長データ(標本)を観測する。
それぞれ170cm、180cm、158cm、169cm、176cmだった場合の統計量Wを算出し、どのような分布になるのかを考える。

まずは標本平均(xバー)から求めていこう。

$$\bar{x} = \frac{170 + 180 + 158 + 169 + 176}{5} = 170.6$$

次に標本分散を求める。

$$S^2 = \frac{(170 – 170.6)^2 + (180 – 170.6)^2 + (158 – 170.6)^2 + (169 – 170.6)^2 + (176 – 170.6)^2}{5}$$

$$S^2 = \frac{(-0.6)^2 + (9.4)^2 + (-12.6)^2 + (-1.6)^2 + (5.4)^2}{5}$$

$$S^2 = \frac{0.36 + 88.36 + 158.76 + 2.56 + 29.16}{5}$$

$$S^2 = \frac{279.2}{5} = 55.84$$

Wと標本分散の関係式に値を当てはめると次のとおり。

$$W = \frac{55.84 \times 5}{σ^2} = \frac{279.2}{σ^2}$$

そしてこの統計量Wは自由度4(5 – 1)の分布をする、ということになる。

【中卒でも分かる統計学入門】連載記事一覧

  1. 度数分布表とヒストグラム
  2. 度数分布表から平均値を求める
  3. 色々な平均値の求め方
  4. データの散らばり具合をみる分散と標準偏差
  5. 度数分布表から標準偏差を求める
  6. 標準偏差を理解して偏差値の求め方と意味を知る
  7. Pythonで偏差値を求める
  8. 仮説検定で一つのデータから母集団を推定する
  9. Pythonで95パーセント信頼区間を求める
  10. 平均に対する区間推定
  11. 母集団からとった標本平均の95パーセント予言的中区間
  12. 標本平均から母平均を区間推定する
  13. 標本分散とカイ二乗分布
  14. カイ二乗分布から母分散を推定する
  15. 標本分散に比例する統計量Wの求め方 ←←現在見ている記事
  16. 母平均が分からなくても母標準偏差を推定する方法
  17. 統計量Tを求めてt分布を理解する
  18. t分布を使った区間推定