目次
はじめに
前回のブログでは、カイ2乗検定を学習しました。
今回は、t検定を学習したいと思います。
t検定の種類
t検定とは、t分布を利用する検定法の総称ですが、下記の種類に分けることができます。
・母平均の検定(1つの母集団の母平均が特定の値と等しいか)
・平均値の差の検定(2つの母集団の母平均の差について有意差が認められるかどうか)
・回帰直線の回帰係数の有意性の検定
さらに「平均値の差の検定」は、下記の種類に分けることができます。
◯ 独立な2群
・2つの母集団が独立しており、母分散が等しいと仮定した場合の検定(スチューデントのt検定)
・2つの母集団が独立しており、母分散が等しいと仮定できない場合の検定(ウェルチのt検定)
◯ 対応のある2群
・2つの標本において関係があると認められた場合の検定(調査の対象者が同じで複数の調査を行う場合)
今回は、「平均値の差の検定」の中で、母分散が等しいと仮定できない場合の検定(ウェルチのt検定)について、
統計解析ソフトRを使って、t検定を実施してみます。
t検定の手順
① 仮説を設定します
仮説を立てます。仮説は、導きたい結論とは反対の仮説を設定します。
帰無仮説 :設定する仮説(棄却されることを期待して立てられる仮説)
対立仮説 :導き出したい結論(帰無仮説が棄却されたときに採用される仮説)
ここで、両側検定を行うのか片側検定を行うのか決定します。
・群1の母平均は群2の母平均より大きいとする場合、片側検定(右側検定)を行います。
・群1の母平均は群2の母平均より小さいとする場合、片側検定(左側検定)を行います。
・群1の母平均と群2の母平均は異なるとする場合、両側検定を行います。
② 有意水準を決定します
「5%(0.05)」に設定します。
有意水準とは、設定した仮説が間違っていると判断する(仮説を棄却する)確率のことで、5%や1%が多く使われます。有意水準を5%に設定した場合、5%以下の確率で生じる現象は、非常にまれなことであるとします。
③ t値を算出します
検定統計量tを算出します。
比較する平均値に意味のある差があるかどうかを示す数値。
④ p値を算出します
t値をもとにp値を算出します。
⑤ 検証します
p値と有意水準を比較して検証します。
⑥ 結論を導きます
検証した結果、設定した仮説が有意水準で指定した棄却域に入らない場合は、帰無仮説が正しいとします。
逆に有意水準で指定した棄却域に入る場合は、対立仮説が正しいとします。
Rを使ってt検定を実施
統計解析ソフトRを使って、t検定を実施してみます。
※Rのインストール方法については、ここでは省略させていただきます。
検定内容
2つのスマホゲームについて、ユーザ満足度調査のアンケートをとった結果、下記のような回答結果になった場合、2つのスマホゲームの満足度について、平均値に差があり、満足度は異なるのか同じくらいの満足度なのかを有意水準5%で検定します。
※回答は、実際のデータではありません。学習用に作成したデータです。
<スマホゲームのユーザ満足度調査(100点満点)>
スマホゲームA | スマホゲームB |
80 | 50 |
100 | 80 |
100 | 60 |
70 | 80 |
70 | 70 |
50 | 90 |
40 | 90 |
100 | 50 |
90 | 60 |
70 | 70 |
帰無仮説と対立仮説
帰無仮説:満足度の平均値に差はない(満足度は同じ)
対立仮説:満足度の平均値に差がある(満足度は異なる)
ソースコード
(補足)
8行目:t.test関数で独立な2群のt検定を行います。t値をもとにp値が算出されます。
オプションに「var.equal=T」を指定することでスチューデントのt検定を行うことができます。(デフォルト:ウェルチのt検定)
→ t.test(ga, gb, var.equal=T)
実行結果
※実行結果の説明
・t = 0.85661 ・・・ 統計検定量の実現値
・df = 16.189 ・・・ t分布の自由度
・p-value = 0.4042 ・・・ p値(両側検定)
・95 percent confidence interval
-10.30693 24.30693 ・・・ 95%信頼区間の値
・sample estimates:
mean of x mean of y
77 70 ・・・ 標本平均
結果
p値が「0.4042」で有意水準「0.05」より大きいので、帰無仮説は棄却されず平均に差があるとはいえない。
したがって、「スマホゲームAとスマホゲームBの満足度の平均値には差がない」という結論になります。
まとめ
今回は統計的仮説検定で用いる検定法の1つである「t検定」について統計解析ソフトRを使用して学習しました。
スマホゲームでは、ユーザアンケートが実施されることがあります。
それらのデータを分析する際にt検定が活用できるのではないでしょうか。
参考文献
金城 俊哉 著「R統計解析パーフェクトマスター」, 秀和システム