4-6. 범주형-범주형의 빈도에 대한 독립성(연관성) 검정(카이제곱, Exact, trend test)

2019. 2. 21. 17:44

Fisher's Exact test : (교차표상에서) 각 관측값들로 구한 기대값(Expected)가 5이하로 나타난 cell이 25%이상(1/4이상)일 때 쓰는 범주1-범주2의 독립성 test
ex> 2x2교차표에서 25%(1/4)= 1개 : cell에 대해서 expected가 5이하가 한개라도 나오면, Fisher exact test로 변환해서 수행.
- R상에서 warning message로 카이제곱 approximation은 정확하지 않을수도 있습니다.라 는 문구가 나오면, 카이제곱이 아닌 Fisher's Exact test로 연관성(독립성)검정한다.
- 과거의 많은 의료논문에서 cell 25%이상이 expected 5이하인데도 카이제곱 검정으로 연관성 테스트를 한 경우가 많다고 한다.

적합도 검정 (GOF) :범주1개에 대한 범주별 빈도(관측도수)와 그 기대값(특정된 확률)을 비교한다.
아래는 교차표는 아니지만, 범주1개(동전의 앞/뒤)에 대한 관측값과 기대관측도수를 나타내었고, 카이제곱 검정통계량을 아래와 같이 구한다. 이 검정통계량을 카이제곱 분포에 대입하여, 유의확률을 계산하여 H0(관측값과 예상값이 동일하다)를 기각하던지 기각하지 않던지 보면 된다.
독립성 검정 : 일반적으로 많이 사용하는 카이제곱 검정으로, 쉽게 말해서, 범주1별 빈도와 범주2별 빈도의 교차표(contingency table)로 카이제곱 검정통계량을 계산한다. - 범주가 2개인 교차표에서 각 관측값들에 대한 Expected(기대값)을 계산 하는 법
(1) 아래와 같이 범주1(A,B,C,D) + 범주2(white, blue, no collar) + total의 교차표가 있다고 가정

(2) 첫번째 관측값( A & white colooar)인 90에 대한 Expected를 구해보자.

4-6. Rmarkdown 카이제곱 test, Fisher's Exact test, trend test (0)	2019.02.22
4-7. 2집단(t-test), 3집단(ANOVA) : 범주별 숫자형의 평균차이의 비모수 통계 분석 (9)	2019.02.21
4-5. 상관관계(계수, 산점도), t-test, anova 간단 복습 (0)	2019.02.21
4-4. Rmarkdown 칼럼명변경 +range() + 사용자정의함수로 scaling (0)	2019.02.21
4-3. Rmarkdown ANOVA 와 interactionplot (1)	2019.02.21

우아 한의원 | 조재성 원장의 한의학, 의학통계, 프로그래밍