양비율 Z-검정(one proportion z-test)은 두 개의 서로 다른 모집단(population)의 비율이 차이를 검정할 때 사용한다.
모 대학 안에 카페 1호점과 2호점을 운영하는 자영업자가 있다. 그는 이번에 한 음료를 선택해서 반값 프로모션을 하려고 한다. 각 지점에서 가장 인기 있는 음료를 할인 하기로 했다. 그동안 매출로 보기에 1호점과 2호점에서 아메리카노 같은 비율로 가장 많이 팔린 것 같았다. 그래서 아메리카노로 하려고 한다.
실제 아메리카노가 1호점 2호점에서 같은 비율로 더 선호되는지 알아보기 위해, 지나가는 100명의 학생에게 무작위로 설문조사를 실시했다. 설문조사 결과 1호점을 이용하는 학생 70%가 아메키라노를 선호했고, 2호점을 이용하는 학생 68%가 아메리카노를 선호했다.
1호점 2호점에서 모두 아메리카노가 더 인기 있는 음료인지, 설문조사 결과를 양비율 Z-검정(one proportion z-test)을 통해서 판단할 수 있다.
단 표본 Z-검정(one sample z-test) 시행하기
아래 단계별로 양비율 Z-검정(one proportion z-test)을 시행한다.
1단계: 가정 수립한다.
H0 [귀무가설(null hypothesis)]: P1 = P2
Ha [대안 가설(alternative hypothesis)]: P1 ≠ P2
2단계: 통계량과 p-값(p-value)을 찾는다.
p = (p1 * n1 + p2 * n2) / (n1 + n2)
p = (0.70*100 + 0.68*100) / (100 + 100) = 0.69
- p: 합동 표본비율(pooled sample proportion)
- n1: 표본 크기 1
- n2: 표본 크기 2
z = (p1-p2) / √p * (1-p) * [ (1/n1) + (1/n2)]
z = (0.70-0.68) / √0.69 * (1-0.69) * [ (1/100) + (1/100)] = 0.02 / 0.0654 = 0.306
양측(two-tailed), z-통계량 0.306에 대한 p-값(p-value)은 0.759이다. (z-점수 분포표에서 찾을 수 있다.)
3단계: 귀무가설(null hypothesis) 기각 여부 결정
우선, 유의 수준(significance level)을 결정한다. 0.01, 0.05, 0.10 이 많이 쓰인다. 만약 0.05를 선택했으면 p-값(p-value)은 0.05보다 크기 때문에 귀무가설(null hypothesis)을 기각할 수 없다. 그러므로 1호점과 2호점에서 아메리카노가 같은 비율로 가장 인기 메뉴라는 가정에 대해 반박할 통계적 근거가 업다.
엑셀에서 양 표본 Z-검정(two sample z-test) 양측 검정(two-tailed test) 시행하기
모 대학 안에 카페 1호점과 2호점을 운영하는 자영업자가 있다. 그는 이번에 한 음료를 선택해서 반값 프로모션을 하려고 한다. 각 지점에서 가장 인기 있는 음료를 할인 하기로 했다. 그동안 매출로 보기에 1호점과 2호점에서 아메리카노 같은 비율로 가장 많이 팔린 것 같았다. 그래서 아메리카노로 하려고 한다.
실제 아메리카노가 1호점 2호점에서 같은 비율로 더 선호되는지 알아보기 위해, 지나가는 100명의 학생에게 무작위로 설문조사를 실시했다. 설문조사 결과 1호점을 이용하는 학생 70%가 아메키라노를 선호했고, 2호점을 이용하는 학생 68%가 아메리카노를 선호했다.
시트에서 위에 양비율 Z-검정(two proportion z-test)을 실행했다.
표본 1 비율 P1, 표본 1 크기 n1, 표본 2 비율 P2, 표본 2 크기 n2를 입력하면, 합동 표본비율 p, 검증 통계량(z-score), p-값이 자동적으로 구해진다.
C6: 합동 표본비율을 구한다. p = (p1 * n1 + p2 * n2) / (n1 + n2)
C7: 검증 통계량(z-score)을 구한다. z = (p1-p2) / √p * (1-p) * [ (1/n1) + (1/n2)]
C8: p-값을 구한다. NORM.S.DIST() 함수는 정규분포(normal distribution)에 누적확률을 반환한다. 양측 검정(two-tailed test)을 하므로 x2를 해준다.
p-값(p-value)은 0.759로 유의 수준(significance level) 0.05보다 크므로 가설을 기각할 수 없다. 그러므로 1호점과 2호점에서 아메리카노가 같은 비율로 인기 메뉴라는 가정에 대해 반박할 통계적 근거가 업다.
엑셀에서 양 표본 Z-검정(two sample z-test) 단측 검정(one-tailed test) 시행하기
모 대학 안에 카페 1호점과 2호점을 운영하는 자영업자가 있다. 그는 이번에 한 음료를 선택해서 반값 프로모션을 하려고 한다. 각 지점에서 가장 인기 있는 음료를 할인 하기로 했다. 그동안 매출로 보기에 1호점과 2호점에서 아메리카노 같은 비율로 가장 많이 팔린 것 같았다. 그래서 아메리카노로 하려고 한다.
실제 아메리카노가 1호점 2호점에서 같은 비율로 더 선호되는지 알아보기 위해, 지나가는 100명의 학생에게 무작위로 설문조사를 실시했다. 설문조사 결과 1호점을 이용하는 학생 70%가 아메키라노를 선호했고, 2호점을 이용하는 학생 68%가 아메리카노를 선호했다.
시트에서 위에 양비율 Z-검정(two proportion z-test)을 실행했다.
표본 1 비율 P1, 표본 1 크기 n1, 표본 2 비율 P2, 표본 2 크기 n2를 입력하면, 합동 표본비율 p, 검증 통계량(z-score), p-값이 자동적으로 구해진다.
C6: 합동 표본비율을 구한다. p = (p1 * n1 + p2 * n2) / (n1 + n2)
C7: 검증 통계량(z-score)을 구한다. z = (p1-p2) / √p * (1-p) * [ (1/n1) + (1/n2)]
C8: p-값을 구한다. NORM.S.DIST() 함수는 정규분포(normal distribution)에 누적확률을 반환한다.
p-값(p-value)은 0.379로 유의 수준(significance level) 0.05보다 크므로 가설을 기각할 수 없다. 그러므로 1호점과 2호점에서 아메리카노가 같은 비율로 인기 메뉴라는 가정에 대해 반박할 통계적 근거가 업다.
'Excel_데이터 > 가설검증' 카테고리의 다른 글
엑셀에서 이항검정(Binomial Test) 하기 (0) | 2021.04.18 |
---|---|
엑셀에서 윌콕슨 부호순위 검정(Wilcoxon Signed Rank Test) 하기 (0) | 2021.04.17 |
엑셀에서 단비율 z-검정(One Proportion Z-Test) 하기 (0) | 2021.04.16 |
엑셀에서 맥니마 검정(McNemar's Test) 하기 (0) | 2021.04.15 |
엑셀에서 그럽스 검정(Grubbs' Test) 하기 (0) | 2021.04.15 |