4-7. 2집단(t-test), 3집단(ANOVA) : 범주별 숫자형의 평균차이의 비모수 통계 분석
2019. 2. 21. 22:58
비모수 통계 분석 ( Non parametic )
모집단의 분포가 정규분포가 아님
-> 표본은 도저히 정규분포를 가정 불가능- 표본의 수가
n < 10
으로 도저히 정규분포가 될 수 없는 경우 10 <= n <= 30
이나 but정규성 검정(shapiro test)
를 통과 못한 경우순서를 가진 경우
모수
: 모평균, 모표준편차, 모분산 -> 현실적으로는 추출된 표본의 평균,표준편차,분산으로 -> 모집단의 모수들을 추정
모수 검정
: 정규성=모수적 특성=정규분포를 따르니, 서로 다른집단이라도 정규성을 이용하여 평균차이로 집단의 차이
를 밝힌다. 표본이 정규성을 만족한다면, 모집단도 정규분포 -> 표본 집단들의 평균차이 = 모집단들의 평균차이 = 모집단들이 차이난다
비모수 검정
: 실제 표본들로 만들어진 평균이 아니라 표본들을 나열한 뒤, 부호,절대값(signed)이나 순위(rank)를 이용해서 검정
한다. 대신 검졍력은 모수적 방법들에 비해 떨어진다.
제시 통계량
: 모수 검정시에는 평균 +- 표준편차
을 제시, 비모수 검정시에는 중앙값 + [1QR, 3QR]
을 제시
cf)
비모수 통계 분석의 종류
1~2집단에 대한 숫자형의 평균차이
대응표본 t-test
->Wilcoxon signed rank test
독립표본 t-test
->Mann-Whitney test or Wilcoxon rank-sum test
3집단의 숫자형의 평균차이(요인1개)
one way ANOVA
->Kruskal-Wallis test
1. Wilcoxon signed rank test ( 대응표본 t-test의 비모수 검정 )
H0 : before와 after의 크기가 같다.
- 짝지어전 실험 전/후 자료를 빼서
diff
를 구한다. - diff에
절대값(signed)
를 취한 뒤,크기를 내림차순(rank)
나열한다 동률 처리
로서 절대값 diff값이 같은 애들은 순서를 더해서 평균을 준다.- 예를들어, 1 -1 -> rank 1, 2 -> rank 1.5, 1.5
- 절대값을 취하기전의 부호끼리 그 순위들을 다 더한다(
diff순위의 부호별 합
).- diff가 양이었던 애들의 순위들 합 vs 음이었던 애들의 순위들 합
- 양의 순위합과 음의 순위합을 비교하여 크기 차이가 있는지 검정(자세한 내용 확인필요)
2. Mann-Whitney test ( 독립표본 t-test의 비모수 검정 )
Wilcoxon rank-sum test라고도 하는 것 같다.
H0 : 두군의 크기가 같다
- 독립된
2집단의 자료들을 집단 관계없이 모두 섞는다
(n수 늘리는 작업) 내림차순으로 정렬하여 순위(rank)
동률 처리
섞기전의 집단별로 순위들의 합(rank-sum)
을 구한다- 집단별로 순위합을 비교하여 크기 차이가 있는지 검정
3. Kruskal-wallis test( one way ANOVA의 비모수 검정 )
H0 : 세군의 평균이 모두 같다
3집단의 자료들을 집단과 관계없이 모두 섞는다.
내림차순으로 정렬한다.
동률처리는 더해서 평균
다시 집단별 순위합의
평균
비모수라도 사후검정이 가능
하다.
'한의대 생활 > └ 통계에 대한 나의 정리' 카테고리의 다른 글
4-7. Rmarkdown 비모수검정 3가지 + mytable (0) | 2019.02.22 |
---|---|
4-6. Rmarkdown 카이제곱 test, Fisher's Exact test, trend test (0) | 2019.02.22 |
4-6. 범주형-범주형의 빈도에 대한 독립성(연관성) 검정(카이제곱, Exact, trend test) (1) | 2019.02.21 |
4-5. 상관관계(계수, 산점도), t-test, anova 간단 복습 (0) | 2019.02.21 |
4-4. Rmarkdown 칼럼명변경 +range() + 사용자정의함수로 scaling (0) | 2019.02.21 |