シュハートのノーマルチップの実験から、正規確率分布する母集団からn個のサンプルを取り出した場合、そのサンプル平均の分布は平均が母平均と一致し、標準偏差は母標準偏差σの√n分の1になるという法則性があることが分かります(下図)。
Figure2-2-1.シュハートのノーマルチップの分布(平均30、標準偏差10)
Figure2-2-2.5個のサンプル平均の分布(平均30、標準偏差10/√5)
今回のシミュレートでは、予め母平均とその標準偏差が分かっていましたが、普通は分かりません、そこでサンプル平均から母平均や標準偏差を推定せざるを得ません。また、平均値や標準偏差は測定対象によってまちまちな値を取ってしまうので、z変換と同じように、平均0、標準偏差1になるように標準化し、その値をtとします。標準化すればいろんな値を取るデータでも、サンプル数(自由度)が同じであれば一つの確率分布表で確率を読みとることが出来ます。
![]() |
ここで はサンプル平均、mは母平均の推定値、sは標本標準偏差を指す。
このtの確率分布は、左右対称で正規確率分布に近いのですが中央部が高くとがった分布をし、その尖り方(分布の仕方)はnの数(自由度n-1)によって異なります。何故n-1が自由度として使われるのかと不思議に思うかもしれませんが、「母平均の推定に情報が1つ使われたしまったから」というのが一番簡単な説明です。
統計の本にあるt確率分布表には、この両端が5%になるt値、1%になるt値が載っています。この両側の確率が平均値の差の検定に使われます。同じ母平均から取り出されたサンプルであれば、その平均値はこのt確率分布という規則性に従うはずです。
t確率分布を使った2つの平均値の差の検定
新しい教授法を開発し、これまでの教授法より優れていることを確認するため、ほぼ等しい力を持つ2つのクラスを対象に、一方に新しい教授法をふまえた授業を、もう一方に従来の教授法による授業を実施し、その効果を見るテストをおこない、以下のような結果が得られた。
表1.教授効果確認テストの結果
従来の教授法群 |
新しい教授法群 | ||
生徒番号 |
成績 |
生徒番号 |
成績 |
1 |
72 |
1 |
76 |
2 |
84 |
2 |
88 |
3 |
72 |
3 |
84 |
4 |
76 |
4 |
76 |
5 |
80 |
5 |
80 |
6 |
92 |
6 |
92 |
7 |
64 |
7 |
72 |
8 |
72 |
8 |
76 |
9 |
76 |
9 |
84 |
10 |
64 |
10 |
72 |
11 |
72 |
11 |
84 |
12 |
84 |
12 |
92 |
13 |
68 |
13 |
76 |
14 |
52 |
14 |
60 |
15 |
76 |
15 |
84 |
16 |
80 |
16 |
82 |
17 |
68 |
17 |
76 |
18 |
76 |
18 |
80 |
19 |
80 |
19 |
88 |
20 |
72 |
20 |
84 |
21 |
64 |
21 |
76 |
22 |
76 |
22 |
80 |
23 |
72 |
23 |
72 |
24 |
80 |
24 |
76 |
25 |
72 |
25 |
80 |
26 |
72 |
26 |
72 |
27 |
88 |
27 |
92 |
28 |
72 |
28 |
80 |
29 |
56 |
29 |
68 |
30 |
84 |
30 |
84 |
31 |
72 |
31 |
76 |
32 |
64 |
32 |
84 |
33 |
54 |
33 |
64 |
34 |
72 |
34 |
80 |
35 |
76 |
35 |
78 |
36 |
76 | ||
37 |
72 | ||
38 |
84 |
得られた結果からすると、従来の教授法のクラスの成績は73.0、新しい教授法の方は78.7と新しい教授法が有効であるように見えます。しかし、これは単に偶然の差に過ぎないかもしれません。偶然の結果ではなく、新しい教授法が効果があると言ってよいかを確認するために統計的「検定」(ここではt検定)を使います。
(2つの平均値の差の検定の手順)
1.まず、2つの平均は差がない、つまり同じ平均をもつ母集団から取り出された2つのサンプル平均に過ぎないという前提(「帰無仮説」)から出発します。
2.もし、2つの平均値が同じ母集団から取り出されたサンプル平均にすぎないのであるならば、母平均m(標準化すれば0)、標準偏差σ/√nの分布規則に当てはまることになります。
3.そこで、2つのサンプル平均のズレを示すt値を、下の公式を使って計算します。
4.上の計算で得られたt値が自由度n1+n2−2のときに起きうる確率(図3-11.の両端の確率)を求めます。(自由度が2引かれるのは母分散の推定に二つのサンブル平均が使われていることが上の公式から読みとれると思います)。
5.もし、t値の確率が5%以下である場合、同じ母平均だとしたら100回のうち5回しか起こらないズレが起きている。ということは、この2つは同じ母平均から取り出されたサンプルとは言えないのでは、ということで「帰無仮説」を棄却します。
6.「同じ」という「帰無仮説」を捨て去るのですから、2つの平均に統計的に差があると言える。という結論が導かれます。
注)100回のうち5回起こると言うことは、本当に滅多に起きないことと言っていいのでしょうか?考え方によっては100回のうち5回も起きるのです。薬の効果の検証や乗り物の安全性を問題にする場合はこのような基準は甘すぎるでしょう。しかし、心理学研究や社会学研究では5%水準がぎりぎりの基準として採用されています。
また、滅多に起こらないからと帰無仮説を棄却しても5%水準の場合、100の内5回は起きうるので、実際は差がなかったのにあるといってしまう危険性があります。これを「第一種の過誤」といい、逆に、差があるのに差がないという結論を出してしまう過ちを「第二種の過誤」と呼びます。そこで、帰無仮説を棄却する水準を「危険率」とも言います。
課題8.「分析ツール」を使って平均値の差の検定をしてみましょう。
・「分析ツール」では「t検定:等分散を仮定した2標本による検定」を使いましょう。
・結果には「両側確率」「片側確率」という2つの確率が出力されています。この確率が5%以下なら帰無仮説を棄却できます。
ズレる方向が1方向だけ問題にするときは片側、どちらにズレるか分からないときは両側を使って検定します。
今回は、新しい教授法が優れているという方向を問題にしますので、「片側検定」で良いでしょう。