平均値の求め方というと「足して個数で割る」という方法が真っ先に挙げられるが、これは他に色々ある求め方のうちの一つにすぎない。
今回は色々な平均値の求め方と、実際にどのような場面で使われるのかについて説明していこう。
コンテンツ
小学生も知っている算術平均
いわゆる「足して個数で割る」求め方を統計学では算術平均という。
例えばx, y, zの平均を求める場合の式は以下のとおりだ。
$$\frac{x + y + z}{3}$$
一般社会では最も有名な計算方法だろう。
成長率の平均をとる相乗平均
企業の成長率などを平均する際に使われるものを相乗平均という。
求め方は単純で「掛けてルートにする」というものだ。
式は次のとおり。
$$\sqrt{xy}$$
例として、ある企業の売上高、成長率が下記表のとおりとする。
売上 | 成長率 | |
1年目 | 5,000万円 | – |
2年目 | 1億2,000万円 | 2.4(240%) |
3年目 | 1億5,000万円 | 1.25(125%) |
この場合、成長率を平均化してならすと以下のようになる。
$$\sqrt{2.4*1.25} = \sqrt{3} = 1.732…$$
つまり1年につき約173.2%ずつ成長していることになる。
標準偏差で使われる二乗平均
今後の記事で紹介していく標準偏差のときに使われるのが二乗平均という方法で、データを2乗したものを足して個数で割るというものだ。
式は次のとおり。
$$\frac{\sqrt{x^2 + y^2}}{2}$$
速度を扱う際の調和平均
速度を扱う際の平均値を求める場合によく使われるのが調和平均だ。
式は次のとおり。※移動距離をaとする。
$$\frac{2a}{\frac{a}{x}+\frac{a}{y}}$$
例として、片道2kmの距離を往復したとする。
行きは平均時速50km、帰りは平均時速30kmだった場合、以下の式が成り立つ。
$$\frac{2*2}{\frac{2}{50}+\frac{2}{30}}$$
この式を解くと調和平均は約37.52となる。
算術平均で平均を求めようとすると、単純に(50 + 30) / 2 = 40となるはずだが、調和平均と値が違うのはなぜか。解説しよう。
これは速度と距離、走行時間の関係で、行きも帰りも2kmと同じ距離を走ったのに、時速が50km、30kmとそれぞれ違うので、実際の走行時間は異なるはずだ。
時速の遅い帰りの方が、走行時間に与える影響は大きいので、算術平均40よりも実際の平均時速は遅くなるということだ。
まとめ
以上、今回は4つの平均値の求め方を紹介した。
正しいデータ分析をおこなう上で、それぞれ適した求め方を使用する必要があるので、今回紹介した4つの公式は覚えておく必要がありそうだ。
【中卒でも分かる統計学入門】連載記事一覧
- 度数分布表とヒストグラム
- 度数分布表から平均値を求める
- 色々な平均値の求め方 ←←現在見ている記事
- データの散らばり具合をみる分散と標準偏差
- 度数分布表から標準偏差を求める
- 標準偏差を理解して偏差値の求め方と意味を知る
- Pythonで偏差値を求める
- 仮説検定で一つのデータから母集団を推定する
- Pythonで95パーセント信頼区間を求める
- 平均に対する区間推定
- 母集団からとった標本平均の95パーセント予言的中区間
- 標本平均から母平均を区間推定する
- 標本分散とカイ二乗分布
- カイ二乗分布から母分散を推定する
- 標本分散に比例する統計量Wの求め方
- 母平均が分からなくても母標準偏差を推定する方法
- 統計量Tを求めてt分布を理解する
- t分布を使った区間推定