T 분포 ( Student's t - Distribution)

참고블로그 : https://m.blog.naver.com/PostView.nhn?blogId=mykepzzang&logNo=220853827288&proxyReferer=https%3A%2F%2Fwww.google.com%2F

  • 표본 평균으로 모집단의 정규분포 평균을 해석할 때 사용
  • 가설검정과 회귀분석에서도 자주 사용
  • 정규분포보다 꼬리가 더 두껍다. (n수가 작아도 예측범위가 더 넓다?)
  • 표본의 수(자유도도 관련)가 30이상이면 정규분포를 따르는 좌우대칭형
  • 만약 n수가 30이 안되면 t분포를 써서 예측해야한다.(좌우대칭형은 마찬가지)
  • t값( t score )로 두 집단간의 평균차이를 분석한다.
  • t score= 두 (표본)집단 평균의 차이 / 두 집단에서 계산된 표준편차(Sab)
    즉, 2집단의 표준편차(분산)이 고려된, 두 집단의 평균 차이
    두 표본의 평균차이가 크더라도, 한쪽이 분산이 엄청커서 벌어져있다고 가정해보자. 차이가 명확하게 안들어난다. 분산(표준편차)까지 고려한 평균의 차이가 t값이다.
  • ex> t분포에서 검정통계량 t가 크다? -> 분산고려되어 분자(A평균-B평균) 크다 -> 평균차이 크다!

T-test의 종류 3가지

  1. 단일표본 t검정
    • H0 : m = 50 (한 집단의 평균이 50이랑 같다)
    • 한 집단의 평균이 어떤 숫자와 같은지/다른지 비교한다.
  1. 대응표본 t검정

    • 1가지 가정이 만족되어야한다.
      1) 실험 후- 실험전 차이의 분포가 정규성을 따른다
      -만약, 정규성을 따르지 않는다면 => Wilcoxon signed rank test
    • H0 : 실험 전/후 간의 평균차이가 없다(=)
    • 한 집단의 실험 전/후 비교, 즉, 실험후 - 실험전 차이의 평균 = 0 인지/아닌지를 test
  2. 독립표본 t검정

    • 3가지 가정이 만족되어야한다.
      1) 두 집단간의 독립성 검정 : 사람이 판단함.
      -만약, 독립성이 없다 => 대응표본 t검정( 한집단의 전/후 )

      2) 각 집단의 정규성 검정( H0 : 정규분포를 따른다 -> p:0.05보다 커야 정규성 만족)
      (1) n > 30 : 중심극한정리(Central Limit Test)에 의해서 정규성 만족
      (2) 10 <= n <= 30 : Kolmogrov-Smirnov test or Shapiro-Wilk test
      (3) n < 10 : 정규성x로서 비모수적 방법 사용
      -만약, 정규성이 없다 => 비모수적 방법(평균비교x)인 Mann-Whitney test or Wilcoxon Rank-Sum test

      3) 두 집단간의 등분산성 검정( H0 : 두 집단의 분산은 같다 -> p:0.05보다 커야 정규성 만족)
      -만약, 두 집단이 분산이 다르다 => p가 0.05보다 작아서 등분산성을 만족하지 않으면 ->** 자유도를 수정하는 Welch t-test한다.
      **예외적으로 p-value가 0.05보다 커야 좋은 경우 2가지 : 정규성 검정, 등분산성 검정

    • H0 : 두 집단간에 평균차이가 없다(=)

    • 두 집단의 평균 차이를 본다.

  3. 보정된 t 검정

    • 두 집단가의 평균차이가 나긴 났는데, 다른 변수까지 끼워서 보정해놓고 검정한다.
    • 다른 변수를 보정시킨상태에서 해당 집단간의 차이가 유의하지 않다면, 그것은 진짜로 유의한 차이가 아닌 것이다.

+ Recent posts