Excel_데이터/가설검증

엑셀에서 단비율 z-검정(One Proportion Z-Test) 하기

palefaceman 2021. 4. 16. 09:09

단비율 Z-검정(one proportion z-test)은 예측되는 비율을 표본 조사를 통해 나온 비율을 가지고 적합도를 비교하기 위해서 사용한다. 

 

어느 가전제품 회사의 신제품 TV에 고객 만족도가 90%로 발표했다면, 이를 비교하기 위해 200명의 임의에 고객들에게 만족도를 조사한 결과 85%였다. 

 

단비율 Z-검정(one proportion z-test)은  실제 고객 만족도가 90% 인지 아닌지에 대해 사실검증을 할 수 있다.

 

단 표본 Z-검정(one sample z-test) 시행하기

아래 단계별로 단 표본 Z-검정(one sample z-test)을 시행한다.

1단계: 가정 수립한다.

H0 [귀무가설(null hypothesis)]: P = 0.9

Ha [대안 가설(alternative hypothesis)]: P ≠ 0.9

2단계: 통계량을과 p-값(p-value)을 찾는다. 

검증 통계량 z  =  (p-P) / (√P(1-P) / n)

 

  • p: 표본 비율
  • P: 가정하는 모집단 비율
  • n: 표본 크기

z = (0.85-0.90) / (√0.90(1-0.90) / 200) = (-0.05) / (0.0212) = -2.358

 

양측(two-tailed), z-통계량 -2.358에 대한 p-값(p-value)은 0.018이다. (z-점수 분포표에서 찾을 수 있다.)

3단계: 귀무가설(null hypothesis) 기각 여부 결정

우선, 유의수준(significance level)을 결정한다. 0.01, 0.05, 0.10 이 많이 쓰인다. 만약 0.05를 선택했으면 p-값(p-value)은 0.05보다 작기 때문에 귀무가설(null hypothesis)을 기각할 수 있다. 그러므로 90%의 고객이 새로운 TV에 만족했다는 보도는 통계적으로 사실이 아니라고 판별한다.

엑셀에서 단표본 Z-검정(one sample z-test) 양측 검정(two-tailed test) 시행하기

어느 가전제품 회사의 신제품 TV에 고객 만족도가 90%로 발표했다면, 이를 비교하기 위해 200명의 임의에 고객들에게 만족도를 조사한 결과 85%였다. 

 

유의수준(significance level) 0.05에서 양측 검정(two-tailed test) 실행한다.

시트에서 위에 단비율 Z-검정(one proportion z-test)을 실행했다. 

 

가정 비율 P, 표본 크기 n, 도수를 입력 데이터로 하면 표본 비율 p, 검증 통계량(z-score), p-값이 자동적으로 구해진다.

 

  • B5: 표본 비율로 무작위 표본 설문 조사에서 나온 도수/표본크기 한다.  f/n
  • B6: 검증 통계량(z-score)을 구한다. z = (p1-p2) / √p * (1-p) * [ (1/n1) + (1/n2)]
  • B7: p-값(p-value)을 구한다. NORM.S.DIST(z, 1): 정규분포(normal distribution)에 누적확률(cumulative probability)을 반환한다. 양측 검정(two-tailed test)을 하므로 x2를 해준다.

 

p-값(p-value)은 0.018로 유의 수준(significance level) 0.05보다 작으므로 가설을 기각한다. 그러므로 90%의 고객이 새로운 TV에 만족했다는 보도는 통계적으로 사실이 아니라고 판별한다. 

 

엑셀에서 z-점수(z-score) 백분위수 치환하기

 

 

엑셀에서 단표본 Z-검정(one sample z-test) 단측 검정(one-tailed test) 시행하기

어느 가전제품 회사의 신제품 TV에 고객 만족도가 90%로 발표했다면, 이를 비교하기 위해 200명의 임의에 고객들에게 만족도를 조사한 결과 88%였다. 

 

유의 수준(significance level) 0.1에서 단측 검정(one-tailed test)을 실행한다. 

 

  • B5: 표본 비율로 무작위 표본 설문 조사에서 나온 도수/표본크기 한다.  f/n
  • B6: 검증 통계량(z-score)을 구한다. z = (p1-p2) / √p * (1-p) * [ (1/n1) + (1/n2)]
  • B7: p-값(p-value)을 구한다. NORM.S.DIST(z, 1): 정규분포(normal distribution)에 누적확률(cumulative probability)을 반환한다.

 

단측 검증이므로 유의 수준(signficance level)은 0.10, 단측 검정(one-tailed test) p-값은 0.17보다 크기 때문에 귀무가설(null hypothesis)을 기각할 수 없다. 그러므로 90%의 고객이 새로운 TV에 만족했다는 보도는 통계적으로 사실이라 판별한다.