피셔 정확 검정(Fisher's Exact Test)은 두 분류의 변수간 유의미한 상관성이 있는지 판별하는 데 사용한다.
피셔 정확 검정(Fisher's Exact Test)은 카이제곱 독립성 검정(Chi-Square Test of Independence)의 대체 방법으로 하나 이상의 셀에 관측수가 5 이하 일 때 사용한다.
엑셀에서 피셔 정확 검정(Fisher's Exact Test)을 시행 해본다.
예시: 엑셀에서 피셔 정확 검정(Fisher's Exact Test) 하기
성별과 정치성향에 유의미한 상관성이 있는지 알아보고 싶다. 그래서 500명의 투표자를 무작위로 선별해서 정치성향에 대해 물어봤다. 그리고 결과를 아래 테이블로 정리했다.
성별과 정치성향의 두 분류가 서로 유의미한 상관성이 있는지 검정하기 위해서 피셔 정확 검정(Fisher's Exact Test) 시행한다.
=HYPGEOM.DIST(sample_s, number_sample, population_s, number_pop, cumulative)
- sample_s = 표본에서 관측수
- number_sample = 표본의 크기
- population_s = 모집단(총계)에서 관측수
- number_pop = 모집단(총계)의 크기
- cumulative = TRUE: CDF, 누적 분포 함수, FALSE: PMF, 확률 함수, 여기에서는 목적에 맞게 'TRUE'값을 사용한다.
함수에 상수를 입력하기 위해서, 4개의 셀에서 하나의 셀만 선택한다. 하지만 총계의 값들은 상응하는 동일한 값을 사용한다.
이제 엑셀에서 구해본다.=HYPGEOM.DIST(4개 중 1셀 값, 열에 총 관측수, 행에 총 관측수, 전체 크기, TRUE)
단측(one-tailed)의 p-값(p-value)은 0.0812
p-값(p-value)이 0.05보다 작지 않으므로 귀무가설(null hypothesis)을 기각할 수 없다. 그러므로 성별과 정치성향에 관계에 유의미한 상관성이 있다고 할 수 없다. 두 변수는 서로 간 독립적(independent)이다.
양측(two-taied) p-값(p-value)도 찾을 수 있다.
우선, 관심 있는 관측값을 선택하고 확률을 구한다.=HYPGEOM.DIST(4개 중 1셀 값, 열에 총 관측수, 행에 총 관측수, 전체 크기, TRUE)그리고, 1 - 관심 있는 관측값(전체 확률 - 아닐 확률)을 구하고 두 값을 합한다.=1- HYPGEOM.DIST(정해진 셀에 같은 열에셀 값 외에 값, 열에 총 관측수, 행에 총 관측수, 전체 크기, TRUE)
양측(two-tailed)의 p-값(p-value)은0.11524
p-값(p-value)이 0.05보다 작지 않으므로 귀무가설(null hypothesis)을 기각할 수 없다. 그러므로 성별과 정치성향에 관계에 유의미한 상관성이 있다고 할 수 없다. 두 변수는 서로 간 독립적(independent)이다.
※ 카이제곱 검정(Chi-Square Test) 관련 포스팅
엑셀에서 카이제곱 적합도 검정(Chi-Square Goodness-of-fit Test) 하기
'Excel_데이터 > Chi-Square Tests' 카테고리의 다른 글
엑셀에서 크래머 V 계수(Cramer's V) 구하기 (0) | 2021.04.30 |
---|---|
엑셀에서 독립성 카이제곱 검정(Chi-Square Test of Independence) 하기 (1) | 2021.04.28 |
엑셀에서 카이제곱 적합도 검정(Chi-Square Goodness-of-fit Test)하기 (1) | 2021.04.27 |