4-1. 2개 집단의 평균 비교 - t-test
2019. 2. 19. 15:34
T 분포 ( Student's t - Distribution)
- 표본 평균으로 모집단의 정규분포 평균을 해석할 때 사용
- 가설검정과 회귀분석에서도 자주 사용
- 정규분포보다 꼬리가 더 두껍다. (n수가 작아도 예측범위가 더 넓다?)
- 표본의 수(자유도도 관련)가 30이상이면 정규분포를 따르는 좌우대칭형
- 만약 n수가 30이 안되면 t분포를 써서 예측해야한다.(좌우대칭형은 마찬가지)
- t값( t score )로 두 집단간의
평균차이를 분석
한다. t score
= 두 (표본)집단 평균의 차이 / 두 집단에서 계산된 표준편차(Sab)
즉,2집단의 표준편차(분산)이 고려된, 두 집단의 평균 차이
두 표본의 평균차이가 크더라도, 한쪽이 분산이 엄청커서 벌어져있다고 가정해보자. 차이가 명확하게 안들어난다. 분산(표준편차)까지 고려한 평균의 차이가 t값이다.- ex> t분포에서 검정통계량 t가 크다? -> 분산고려되어 분자(A평균-B평균) 크다 -> 평균차이 크다!
T-test의 종류 3가지
단일표본 t검정
H0
: m = 50 (한 집단의 평균이 50이랑 같다)- 한 집단의 평균이 어떤 숫자와 같은지/다른지 비교한다.
대응표본 t검정
- 1가지 가정이 만족되어야한다.
1) 실험 후- 실험전 차이의 분포가정규성
을 따른다
-만약, 정규성을 따르지 않는다면 =>Wilcoxon signed rank test
H0
: 실험 전/후 간의 평균차이가 없다(=)- 한 집단의 실험 전/후 비교, 즉,
실험후 - 실험전 차이의 평균 = 0
인지/아닌지를 test
- 1가지 가정이 만족되어야한다.
독립표본 t검정
3가지 가정이 만족되어야한다.
1) 두 집단간의독립성 검정
: 사람이 판단함.
-만약, 독립성이 없다 =>대응표본 t검정
( 한집단의 전/후 )2) 각 집단의
정규성 검정
( H0 : 정규분포를 따른다 -> p:0.05보다 커야 정규성 만족)
(1) n > 30 : 중심극한정리(Central Limit Test)에 의해서 정규성 만족
(2) 10 <= n <= 30 : Kolmogrov-Smirnov test or Shapiro-Wilk test
(3) n < 10 : 정규성x로서 비모수적 방법 사용
-만약, 정규성이 없다 => 비모수적 방법(평균비교x)인Mann-Whitney test or Wilcoxon Rank-Sum test
3) 두 집단간의
등분산성 검정
( H0 : 두 집단의 분산은 같다 -> p:0.05보다 커야 정규성 만족)
-만약, 두 집단이 분산이 다르다 => p가 0.05보다 작아서 등분산성을 만족하지 않으면 ->** 자유도를 수정하는Welch t-test
한다.
**예외적으로 p-value가 0.05보다 커야 좋은 경우 2가지 : 정규성 검정, 등분산성 검정H0
: 두 집단간에 평균차이가 없다(=)두 집단의 평균 차이를 본다.
보정된 t 검정
- 두 집단가의 평균차이가 나긴 났는데, 다른 변수까지 끼워서 보정해놓고 검정한다.
- 다른 변수를 보정시킨상태에서 해당 집단간의 차이가 유의하지 않다면, 그것은 진짜로 유의한 차이가 아닌 것이다.
'한의대 생활 > └ 통계에 대한 나의 정리' 카테고리의 다른 글
4-2. Rmarkdown T-test (0) | 2019.02.20 |
---|---|
4-2. 3집단 이상의 (숫자형)분석 ANOVA (0) | 2019.02.19 |
4. Rmarkdown - 상관계수와 산점도 matrix (0) | 2019.02.19 |
4. 상관계수 정리 (1) | 2019.02.18 |
3-6. 반복문, ifelse-binning + 빈도분석, 데이터합치기(rbind, cbind, merge) (0) | 2019.02.17 |