このページの最終更新日 2020/10/25

t検定(本当にそれって有意な差があるの?)

1、導入編 ~魚の大きさの平均値を例に~

 とある休日、Aさんは海に釣りに行くことにしました。Aさんはそこで10匹の魚を釣り上げました。10匹のうち、3匹は青色、3匹は赤色、4匹は緑色で、それぞれの魚の大きさ(cm)と各色での平均値は pic.1のようになっていました。

- pic.1 -

 それぞれの色の魚の平均値から、Aさんは次のように結論付けました。

「この海の赤色の魚は青色の魚よりも大きく、緑色の魚は赤色の魚よりも大きい。」

 確かに、Aさんが釣ってきた魚だけに着目すればAさんの言い分は問題ないかもしれません。しかし、Aさんが釣ってきた10匹の魚をもとに「海全体の」魚の大きさを推定しようとした場合に、果たしてAさんの主張は正しいのでしょうか。
 「赤色の魚は青色の魚よりも大きい」なんてことを言っていますが、3匹の青色の魚のうち1匹は90cmもあり赤色の魚の平均値を軽く超えてしまっています。一方「緑色の魚は赤色の魚よりも大きい。」という主張は、確かにどの赤色の魚とどの緑色の魚を比べても緑色の魚の方が大きく妥当かもしれません。しかし、赤色の魚はたったの3匹ですし、緑色の魚はたったの4匹です。
 この数はこの海全体の魚の大きさを推量するためには十分な数と言えるのでしょうか。これが赤も緑の魚も10匹ずつあって、pic.1と同じような大きさであれば妥当性は増すかもしれません。しかしでは本当に10匹だったら十分な数と言えるのでしょうか。10匹が不十分なのだとしたら100匹だったら十分なのでしょうか。

 もちろん感覚的にある程度の妥当性は推し量れるものです。しかしこれを客観的に把握出来るような数値として提示しろと言われればどのようにすれば良いのでしょうか。このような「平均値に差があったからと言って、それは本当に有意な差があると言っていいのか」という疑問にきちんと数値を示してくれるのがt検定なのです。


2、真の平均値をどうやって推定するのか

 いきなりAさんの「〇色の魚より〇色の魚の方が大きい」という主張の正しさを評価することは難しいので、まずはこの海に住んでいる、青色、赤色、緑色のそれぞれの魚の真の平均の大きさはどれぐらいなのか、ということを考えてみることにします。
 もちろん釣った魚の平均値と、海全体の魚の平均値と同じぐらいであろうと推論していくことは出来ます。例えば赤色の魚は3匹とも80cmぐらいでしたから、海全体の赤色の魚の大きさの平均値が10メートルぐらいのクジラサイズであるとか、10-20cmぐらいの出目金サイズであることはないように思えます。しかし通常は100cmぐらいのサイズであるにも関わらず、今回釣れた魚はたまたま小さめだったとか、逆に通常は60cmだけれども大き目のが釣れたとか、そういうことは考えられるはずです。
 これをもっと定量的に、海全体の赤色の魚の大きさの平均がどの程度の範囲であるかを推定していくことにします。数理統計の考えでは、定量的に評価するために次のように仮定を敷きます。

  • 1、この海に存在する魚の数は無限数である。
  • 2、各色の魚の大きさの分布は、pic.2のような平均値μ、分散$σ^2$の正規分布従う。
  • 3、釣った魚はこの正規分布から無作為抽出したものとする。

- pic.2 -

 しかし「でも正規分布になってるかなんて解らないじゃないか」という疑問も出てきます。

 それはその通りで、正規分布に従っているかどうかなんて確証が必ずしもある訳ではありません。ですから、これはとても大きな仮定です。例えば数学の学力テストの点数分布なんぞは二極化して山が2つ出来るような分布になっているものも見かけます。そういう正規分布の形から大きく異なるような分布になっている場合はこの推定は少し怪しくなってきます。
「正規分布からの無作為抽出である」というのもとても重要です。例えば赤色の魚の分布が80cm~200cmぐらいに散らばっているにも関わらず、釣糸の強度的に90cm以上の魚は釣り上げることが出来ないため結果的に80cm程度の赤い魚が吊れているような状況で、t検定を持ち出すのはバツです。80cmであろうが200cmであろうが同じ確率で釣れるという状況を"仮定しても問題ないだろう"という前提が存在しているのです。

 ここでは、数理統計的に平均値μの「信頼区間」を求めることにします。正規分布であることは仮定してしまい、正規分布は平均値μと分散$σ^2$の2つが分かれば確定しますから、後は平均値μと分散$σ^2$について考えるだけです。「信頼区間」を求めると言っている場合は平均値μを推定する訳ですが、このとき分散については(1)式の不偏推定量を用いて決め打ちしてしまいます。

$\displaystyle \hat{\sigma}^2 = \frac{1}{n-1}\sum_{i=1}^{n}(X_i - \overline{X})^2\qquad(1)$