아래 포스팅에 나온 내용 그대로 적용할수 있는 예제 하나를 해보겠습니다ㅎㅎ
이것도 출처는 출처 : mlsc.lboro.ac.uk/resources/statistics/Unpairedttest.pdf
입니다
미국에는 많은 종류의 핫도그가 있다고 합니다. 미국을 안가봐서 잘은 모르지만 핫도그가 많을것 같기도 하군요..
우리나라에서는 길에서 파는 소세지에 빵옷 입혀놓고 튀긴 그것을 핫도그라고 하는데 여기서 말하는 핫도그는 왠지 그게 아닐것 같군요... 흐음.. 암튼 각설하고
beef hotdogs 와 poultry hotdogs 의 칼로리 차이를 비교해 보고 두 핫도그 종류의 칼로리는 과연 차이가 나는지! unpaired t-test 로 검증해 보겠습니다.
beef hotdog는 20개 샘플수로 칼로리 측정하였습니다.
poultry hotdog는 17개 샘플로 칼로를 측정하였군요
그래서 집단은
beef = [186, 181, 176, 149, 184, 190, 158, 139, 175, 148, 152, 111, 141, 153, 190, 157, 131, 149, 135, 132];
poultry = [129, 132, 102, 106, 94, 102, 87, 99, 170, 113, 135, 142, 86, 143, 152, 146, 144];
이렇게 칼로리 측정량이 나왔습니다.
앞서 포스팅한 순서 그대로 따라가 보지요
mbeef= mean(beef);
mpoultry = mean(poultry);
stdbeef = std(beef);
stdpoultry = std(poultry);
이렇게 계산하여서
그룹 | 샘플사이즈 | 샘플의 평균 | 샘플의 std |
beef | 20 | 156.85 | 22.64 |
poultry | 17 | 122.47 | 25.48 |
이렇게 계산되었습니다.
두 샘플 평균의 차이는
diff_2sample = mbeef - mpoultry;
34.3794 가 나는군요
pooled standard deviation 은 psd = sqrt(((20-1)*stdbeef^2 + (17-1)*stdpoultry^2)./(20+17-2));
23.9826 입니다.
두 평균차의 standard error 을 구해보면
SEdiff = psd*sqrt(1/20 + 1/17);
7.9115
입니다.
이제 T값에 대입해 보지요
T = diff_2sample/SEdiff;
T값은 4.3455 가 나왔네요
이것을 가지고 테이블에서 찾습니다.
찾을때의 자유도는 20+17-2 = 35 입니다.
P<0.001 이 나왔군요. 그렇다면 충분히 두 핫도그의 칼로리 차이는 없다 라는 영가설을 기각할수 있습니다.
그렇다면 poultry 핫도그와 beef 핫도그 간에는 명확한 칼로리 차이가 있다고 할 수 있습니다!
저는 분명히 칼로리가 높은 핫도그가 더 맛나다고 생각합니다....
암튼 다음 시간에~
반응형
'기초통계' 카테고리의 다른 글
multiple comparison(다중비교)와 false discovery rate(FDR) (0) | 2013.12.06 |
---|---|
unpaired t-test (0) | 2011.01.31 |
정상분포를 이용한 가설검증의 예 (0) | 2010.11.29 |
아주 간단한 one-sample t-test (단일표본 t검증) (2) | 2010.11.08 |
Student 의 t분포 (0) | 2010.10.25 |