2-sample T-test 는 두 그룹간의 평균을 기준으로 차이에 의미를 부여 하는 방법이다.
단지 평균만 가지고 차이를 비교한다고 하면 아래와 같은 경우, 의미있는 비교가 되지 않을 수 있다.
1)
2)
먼저 1)번 그림은 평균은 각각 16, 24이고 variance 는 두 분포 모두, 2이다.
2)번 그림은 평균은 1번과 같이 16, 24이고, variance 는 두 분포 모두, 4 이다.
1번 그룹에서의 두 분포의 평균차와 2번 그룹에서 두 분포의 평균차는 같지만 둘은 상당히 다른 의미를 가진다.
게다가 분산이 점점 더 커질수록 평균 차이의 의미를 점점 적어진다 .
분산을 고려하여 두 집단의 평균을 비교하는 방법이 T-test이다.
T-test 의 공식을 보면 분자/ 분모의 비로서 정의 되어 있다 .
보면,
T -value = (Difference between group menas) / (variability of groups)
- Formula for the standard error of the difference between the means.
단지 평균만 가지고 차이를 비교한다고 하면 아래와 같은 경우, 의미있는 비교가 되지 않을 수 있다.
1)
2)
먼저 1)번 그림은 평균은 각각 16, 24이고 variance 는 두 분포 모두, 2이다.
2)번 그림은 평균은 1번과 같이 16, 24이고, variance 는 두 분포 모두, 4 이다.
1번 그룹에서의 두 분포의 평균차와 2번 그룹에서 두 분포의 평균차는 같지만 둘은 상당히 다른 의미를 가진다.
게다가 분산이 점점 더 커질수록 평균 차이의 의미를 점점 적어진다 .
분산을 고려하여 두 집단의 평균을 비교하는 방법이 T-test이다.
T-test 의 공식을 보면 분자/ 분모의 비로서 정의 되어 있다 .
보면,
T -value = (Difference between group menas) / (variability of groups)
=
- Formula for the standard error of the difference between the means.
즉,
이렇게 정의 되어 진다.
T값은 두 집단의 평균의 차이를 두 그럽 평균차이의 standard error 로 나눈것이 된다.
예로,
두집단, y1, y2를 만든후에.
y1 = 16 + 2*randn(10000,1);
y2 = 24 + 2*randn(10000,1);
t-test 를 하면,
[h p ci stats] = ttest2(y1,y2)
h =
1
p =
0
ci =
-8.0571
-7.9463
stats =
tstat: -283.0185
df: 19998
sd: 1.9992
t -값은 -283.0185 가 나오고 null hypothesis 는 인정되었다.
반면,
y3 = 23.99 + 4*randn(10000,1);
y4 = 24 + 4*randn(10000,1);
이렇게 y3, y4 집단을 설정하고 t-test하면 ,
h2 =
0
p2 =
0.2829
ci2 =
-0.0500
0.1711
stats2 =
tstat: 1.0738
df: 19998
sd: 3.9889
널 가설이 기각됨을,, 확인 할 수 있다.
반응형
'기초통계' 카테고리의 다른 글
unpaired t-test (0) | 2011.01.31 |
---|---|
정상분포를 이용한 가설검증의 예 (0) | 2010.11.29 |
아주 간단한 one-sample t-test (단일표본 t검증) (2) | 2010.11.08 |
Student 의 t분포 (0) | 2010.10.25 |
가설검증 (0) | 2010.10.25 |