統計学 – t検定を学習しよう

WRITER: m-mukaida
2022/04/04

はじめに

前回のブログでは、カイ2乗検定を学習しました。
今回は、t検定を学習したいと思います。

 

t検定の種類

t検定とは、t分布を利用する検定法の総称ですが、下記の種類に分けることができます。

母平均の検定(1つの母集団の母平均が特定の値と等しいか)

平均値の差の検定(2つの母集団の母平均の差について有意差が認められるかどうか)

・回帰直線の回帰係数の有意性の検定

 

さらに「平均値の差の検定」は、下記の種類に分けることができます。

◯ 独立な2群
・2つの母集団が独立しており、母分散が等しいと仮定した場合の検定(スチューデントのt検定)
・2つの母集団が独立しており、母分散が等しいと仮定できない場合の検定(ウェルチのt検定)

◯ 対応のある2群
・2つの標本において関係があると認められた場合の検定(調査の対象者が同じで複数の調査を行う場合)

今回は、「平均値の差の検定」の中で、母分散が等しいと仮定できない場合の検定(ウェルチのt検定)について、
統計解析ソフトRを使って、t検定を実施してみます。

 

t検定の手順

① 仮説を設定します

仮説を立てます。仮説は、導きたい結論とは反対の仮説を設定します。

帰無仮説 :設定する仮説(棄却されることを期待して立てられる仮説)
対立仮説 :導き出したい結論(帰無仮説が棄却されたときに採用される仮説)

ここで、両側検定を行うのか片側検定を行うのか決定します。
・群1の母平均は群2の母平均より大きいとする場合、片側検定(右側検定)を行います。
・群1の母平均は群2の母平均より小さいとする場合、片側検定(左側検定)を行います。
・群1の母平均と群2の母平均は異なるとする場合、両側検定を行います。

② 有意水準を決定します

「5%(0.05)」に設定します。
有意水準とは、設定した仮説が間違っていると判断する(仮説を棄却する)確率のことで、5%や1%が多く使われます。有意水準を5%に設定した場合、5%以下の確率で生じる現象は、非常にまれなことであるとします。

③ t値を算出します

検定統計量tを算出します。
比較する平均値に意味のある差があるかどうかを示す数値。

④ p値を算出します

t値をもとにp値を算出します。

⑤ 検証します

p値と有意水準を比較して検証します。

⑥ 結論を導きます

検証した結果、設定した仮説が有意水準で指定した棄却域に入らない場合は、帰無仮説が正しいとします。
逆に有意水準で指定した棄却域に入る場合は、対立仮説が正しいとします。

 

Rを使ってt検定を実施

統計解析ソフトRを使って、t検定を実施してみます。
Rのインストール方法については、ここでは省略させていただきます。

検定内容

2つのスマホゲームについて、ユーザ満足度調査のアンケートをとった結果、下記のような回答結果になった場合、2つのスマホゲームの満足度について、平均値に差があり、満足度は異なるのか同じくらいの満足度なのかを有意水準5%で検定します。
回答は、実際のデータではありません。学習用に作成したデータです。

スマホゲームのユーザ満足度調査(100点満点)

スマホゲームA スマホゲームB
80 50
100 80
100 60
70 80
70 70
50 90
40 90
100 50
90 60
70 70

 

帰無仮説と対立仮説

帰無仮説:満足度の平均値に差はない(満足度は同じ)
対立仮説:満足度の平均値に差がある(満足度は異なる)

 

ソースコード

(補足)
8行目:t.test関数で独立な2群のt検定を行います。
t値をもとにp値が算出されます。
オプションに「var.equal=T」を指定することでスチューデントのt検定を行うことができます。(デフォルト:ウェルチのt検定)
→  t.test(ga, gb, var.equal=T)

 

実行結果

※実行結果の説明
・t = 0.85661 ・・・ 統計検定量の実現値
・df = 16.189 ・・・ t分布の自由度
・p-value = 0.4042 ・・・ p値(両側検定)
・95 percent confidence interval
-10.30693 24.30693 ・・・ 95%信頼区間の値
・sample estimates:
mean of x mean of y
77 70 ・・・ 標本平均

 

結果

p値が「0.4042」で有意水準「0.05」より大きいので、帰無仮説は棄却されず平均に差があるとはいえない。
したがって、「スマホゲームAとスマホゲームBの満足度の平均値には差がない」という結論になります。

 

まとめ

今回は統計的仮説検定で用いる検定法の1つである「t検定」について統計解析ソフトRを使用して学習しました。
スマホゲームでは、ユーザアンケートが実施されることがあります。
それらのデータを分析する際にt検定が活用できるのではないでしょうか。

 

参考文献

金城 俊哉 著「R統計解析パーフェクトマスター」, 秀和システム

m-mukaida

m-mukaida

開発部
分析基盤グループ