본문 바로가기
기초통계

T-test ( two-sample T-test)

by 단창 2010. 10. 24.
2-sample T-test 는 두 그룹간의 평균을 기준으로 차이에 의미를 부여 하는 방법이다.
단지 평균만 가지고 차이를 비교한다고 하면 아래와 같은 경우, 의미있는 비교가 되지 않을 수 있다.
1)



2)


먼저 1)번 그림은 평균은 각각 16, 24이고 variance 는 두 분포 모두, 2이다.
2)번 그림은 평균은 1번과 같이 16, 24이고, variance 는 두 분포 모두, 4 이다.

1번 그룹에서의 두 분포의 평균차와 2번 그룹에서 두 분포의 평균차는 같지만 둘은 상당히 다른 의미를 가진다.
게다가  분산이 점점 더 커질수록 평균 차이의 의미를 점점 적어진다 .

분산을 고려하여 두 집단의 평균을 비교하는 방법이 T-test이다.
T-test 의 공식을 보면 분자/ 분모의 비로서 정의 되어 있다 .
보면,
T -value = (Difference between group menas) / (variability of groups)  
   =


- Formula for the standard error of the difference between the means.



즉,

이렇게 정의 되어 진다.
T값은 두 집단의 평균의 차이를 두 그럽 평균차이의  standard error 로 나눈것이 된다.
 
예로,
두집단, y1, y2를 만든후에.

y1 = 16 + 2*randn(10000,1);

y2 = 24 + 2*randn(10000,1);


t-test 를 하면,

[h p ci stats] = ttest2(y1,y2)


h =

     1

p =

     0

ci =

   -8.0571

   -7.9463

stats =

    tstat: -283.0185

       df: 19998

       sd: 1.9992


t -값은 -283.0185 가 나오고 null hypothesis 는 인정되었다.


반면,

y3 = 23.99 + 4*randn(10000,1);

y4 = 24 + 4*randn(10000,1);


이렇게 y3, y4 집단을 설정하고 t-test하면 ,

h2 =

     0

p2 =

    0.2829

ci2 =

   -0.0500

    0.1711

stats2 =

    tstat: 1.0738

       df: 19998

       sd: 3.9889

널 가설이 기각됨을,,  확인 할 수 있다.


반응형

'기초통계' 카테고리의 다른 글

unpaired t-test  (0) 2011.01.31
정상분포를 이용한 가설검증의 예  (0) 2010.11.29
아주 간단한 one-sample t-test (단일표본 t검증)  (2) 2010.11.08
Student 의 t분포  (0) 2010.10.25
가설검증  (0) 2010.10.25