サンプルをもとに、2つの母集団の平均値に差があるかを調べる場合、統計学ではt検定と呼ばれる手法を使う。

Excel(Googleスプレッドシート)では、このt検定を簡単におこなうことができる便利な関数が用意されているので、今回はExcelを使ってt検定をおこなう手順を紹介する。

T.TEST関数を使ってみる

データが多いので一部非表示にしているが、以下のような二つの製品のレビュー点数(評価値)をまとめた表を例にとる。

まず、t検定をおこなうにあたって帰無仮説と対立仮説を立てておく。
※帰無仮説と対立仮説についての詳細は以下の記事を参照してほしい

今回の場合、帰無仮説は「二つの平均値の差は誤差である」で、対立仮説は「製品Aが評価は高い」となる。

それではExcelのT.TEST関数を使ってt検定をおこなっていく。

まず、T.TEST関数の第一引数に製品Aの評価値が入力された範囲を、第二引数に製品Bの範囲を指定。

片側検定の場合(今回は製品Aの片側検定をおこなう)、第三引数には1を指定し、「対応のあるデータ」の場合は第四引数に1を指定する。

「対応のあるデータ」とは一人のサンプルが両方の評価をしているケースのことを言い、例えば上記2行目のデータを見ると、サンプル1が製品A、製品B両方の評価をおこなっているので「対応のあるデータ」と言える。

さて、片側検定をおこなった結果を見ると次のとおりとなった。

この結果をどう見るかを解説していく。

P値を使った優位差判定

先ほどT.TEST関数で得られた値(0.3367…)を統計用語でP値と言う。

P値は、帰無仮説(平均値の差は誤差である)を棄却した時にそれが間違いである確率で、P値が1に近づけば近づくほど帰無仮説が正しい(棄却できない)ということになる。

一般的にP値が0.05(5%)または0.01(1%)より小さい場合に、帰無仮説を棄却し対立仮説を採用しても良いとされている。
このことを統計学では「5%(1%)優位で帰無仮説を棄却する」と言う。

今回のケースで言うと、P値は0.05よりも大きいので、製品Aの評価が高いというわけではなく、評価の平均値は誤差レベルであると言える。

まとめ

最後にt検定をおこなう手順を以下にまとめておく。

  1. 帰無仮説を立て、対立仮説を決める
  2. T.TEST関数を用いてP値を求める
  3. p < 0.05またはp < 0.01であれば帰無仮説を棄却し、対立仮説を採用する