Excel_데이터/가설검증

엑셀에서 양비율 z-검정(Two Proportion Z-Test)하기

palefaceman 2021. 4. 16. 18:18

양비율 Z-검정(one proportion z-test)은 두 개의 서로 다른 모집단(population)의 비율이 차이를 검정할 때 사용한다.

 

모 대학 안에 카페 1호점과 2호점을 운영하는 자영업자가 있다. 그는 이번에 한 음료를 선택해서 반값 프로모션을 하려고 한다. 각 지점에서 가장 인기 있는 음료를 할인 하기로 했다. 그동안 매출로 보기에 1호점과 2호점에서 아메리카노 같은 비율로 가장 많이 팔린 것 같았다. 그래서 아메리카노로 하려고 한다.   

 

실제 아메리카노가 1호점 2호점에서 같은 비율로 더 선호되는지 알아보기 위해, 지나가는 100명의 학생에게 무작위로 설문조사를 실시했다. 설문조사 결과 1호점을 이용하는 학생 70%가 아메키라노를 선호했고, 2호점을 이용하는 학생 68%가 아메리카노를 선호했다. 

 

1호점 2호점에서 모두 아메리카노가 더 인기 있는 음료인지, 설문조사 결과를 양비율 Z-검정(one proportion z-test)을 통해서 판단할 수 있다.

단 표본 Z-검정(one sample z-test) 시행하기

아래 단계별로 양비율 Z-검정(one proportion z-test)을 시행한다.

1단계: 가정 수립한다.

H0 [귀무가설(null hypothesis)]: P1 = P2

Ha [대안 가설(alternative hypothesis)]: P1 ≠ P2

2단계: 통계량과 p-값(p-value)을 찾는다. 

p = (p1 * n1 + p2 * n2) / (n1 + n2)

 

p = (0.70*100 + 0.68*100) / (100 + 100) = 0.69

 

  • p: 합동 표본비율(pooled sample proportion)
  • n1: 표본 크기 1
  • n2: 표본 크기 2

z = (p1-p2) / √p * (1-p) * [ (1/n1) + (1/n2)]

 

z = (0.70-0.68) / √0.69 * (1-0.69) * [ (1/100) + (1/100)] = 0.02 / 0.0654 = 0.306

 

양측(two-tailed), z-통계량 0.306에 대한 p-값(p-value)은 0.759이다. (z-점수 분포표에서 찾을 수 있다.)

3단계: 귀무가설(null hypothesis) 기각 여부 결정

우선, 유의 수준(significance level)을 결정한다. 0.01, 0.05, 0.10 이 많이 쓰인다. 만약 0.05를 선택했으면 p-값(p-value)은 0.05보다 크기 때문에 귀무가설(null hypothesis)을 기각할 수 없다. 그러므로 1호점과 2호점에서 아메리카노가 같은 비율로 가장 인기 메뉴라는 가정에 대해 반박할 통계적 근거가 업다.

엑셀에서 양 표본 Z-검정(two sample z-test) 양측 검정(two-tailed test) 시행하기

모 대학 안에 카페 1호점과 2호점을 운영하는 자영업자가 있다. 그는 이번에 한 음료를 선택해서 반값 프로모션을 하려고 한다. 각 지점에서 가장 인기 있는 음료를 할인 하기로 했다. 그동안 매출로 보기에 1호점과 2호점에서 아메리카노 같은 비율로 가장 많이 팔린 것 같았다. 그래서 아메리카노로 하려고 한다. 

 

실제 아메리카노가 1호점 2호점에서 같은 비율로 더 선호되는지 알아보기 위해, 지나가는 100명의 학생에게 무작위로 설문조사를 실시했다. 설문조사 결과 1호점을 이용하는 학생 70%가 아메키라노를 선호했고, 2호점을 이용하는 학생 68%가 아메리카노를 선호했다. 

시트에서 위에 비율 Z-검정(two proportion z-test)을 실행했다.

표본 1 비율 P1, 표본 1 크기 n1, 표본 2 비율 P2, 표본 2 크기 n2를 입력하면, 합동 표본비율 p, 검증 통계량(z-score), p-값이 자동적으로 구해진다.

 

C6: 합동 표본비율을 구한다. p = (p1 * n1 + p2 * n2) / (n1 + n2)

C7: 검증 통계량(z-score)을 구한다. z = (p1-p2) / √p * (1-p) * [ (1/n1) + (1/n2)]

C8:  p-값을 구한다. NORM.S.DIST() 함수는 정규분포(normal distribution)에 누적확률을 반환한다. 양측 검정(two-tailed test)을 하므로 x2를 해준다.

 

p-값(p-value)은 0.759로 유의 수준(significance level) 0.05보다 크므로 가설을 기각할 수 없다. 그러므로 1호점과 2호점에서 아메리카노가 같은 비율로 인기 메뉴라는 가정에 대해 반박할 통계적 근거가 업다.

 

엑셀에서 z-점수(z-score) 백분위수 치환하기

엑셀에서 양 표본 Z-검정(two sample z-test) 단측 검정(one-tailed test) 시행하기

모 대학 안에 카페 1호점과 2호점을 운영하는 자영업자가 있다. 그는 이번에 한 음료를 선택해서 반값 프로모션을 하려고 한다. 각 지점에서 가장 인기 있는 음료를 할인 하기로 했다. 그동안 매출로 보기에 1호점과 2호점에서 아메리카노 같은 비율로 가장 많이 팔린 것 같았다. 그래서 아메리카노로 하려고 한다. 

 

실제 아메리카노가 1호점 2호점에서 같은 비율로 더 선호되는지 알아보기 위해, 지나가는 100명의 학생에게 무작위로 설문조사를 실시했다. 설문조사 결과 1호점을 이용하는 학생 70%가 아메키라노를 선호했고, 2호점을 이용하는 학생 68%가 아메리카노를 선호했다. 

 

시트에서 위에 비율 Z-검정(two proportion z-test)을 실행했다.

표본 1 비율 P1, 표본 1 크기 n1, 표본 2 비율 P2, 표본 2 크기 n2를 입력하면, 합동 표본비율 p, 검증 통계량(z-score), p-값이 자동적으로 구해진다.

 

C6: 합동 표본비율을 구한다. p = (p1 * n1 + p2 * n2) / (n1 + n2)

C7: 검증 통계량(z-score)을 구한다. z = (p1-p2) / √p * (1-p) * [ (1/n1) + (1/n2)]

C8:  p-값을 구한다. NORM.S.DIST() 함수는 정규분포(normal distribution)에 누적확률을 반환한다.

 

p-값(p-value)은 0.379 유의 수준(significance level) 0.05보다 크므로 가설을 기각할 수 없다. 그러므로 1호점과 2호점에서 아메리카노가 같은 비율로 인기 메뉴라는 가정에 대해 반박할 통계적 근거가 업다.