Excel_데이터/확률분포

엑셀에서 t-점수 p-value 구하기

palefaceman 2021. 3. 28. 18:44

통계분석의 가설검정(hypothesis test)를해서 t-점수(t-socre)를 구하고 거기에 적합한 p-value를 구한다.

 

여기서 구한 p-value가 (0.10,0.05,0.01)등 특정 신뢰구간(confident interval) 보다 작으면 null 가설(null hypothesis)을 기각하고 그리고 가정(hypothesis)이 타당했다고 통계적 판단을 내릴 수 있다.

 

엑셀을 이용해서 t-점수에 p-value를 구해본다. 

T.DIST(x, deg_freedom)

  • x: 검정을 할 t-점수
  • deg_freedom: 자유도

예시1: t-점수로 p-value 구하기(two-tailed)

어느 식물학자는 자기가 연구하는 한 식물종의 평균 크기가 15 cm인지 알고 싶다. 그래서 12개의 식물 표본을 채취해 평균과 표준편차를 구해보니, 14.33cm, 1.37cm이였다.

 

여기서 신뢰구간 95%(0.05)으로 해서 평균이 15 cm 가 적합한지 알아본다

 

1단계:  가설 세우기

The null hypothesis (H0): μ = 15

The alternative hypothesis: (Ha): μ ≠ 15

2단계: t-점수 와 자유도 구하기

t-점수  =  (x-μ) / (s/√n)  = (14.33-15) / (1.37/√12)  = -1.694

자유도(degrees of freedom) = n-1 = 12-1 = 11

3단계: p-value 구하기

=T.DIST.2T(ABS(-1.694), 11)

p-value는 0.1184

4단계: 가설 검정하기

0.11840.05보다 작지 않기 때문에, null hypothesis(H0)를 기각 하지 못한다. 그러므로 처음에 세운 가설은 신뢰구간(confident interval) 95%에서 적용된다. 그렇기 때문에 식물의 평균 높이가 15cm가 아니라고 부정할 수 있는 통계적 증거가 없다.

예시 2: t-점수로 p-value 구하기(one-tailed)

베터리배터리 회사는 신제품 배터리의 수명이 기존 제품보다 더 오래가는가 확인하고 싶다. 평균 배터리 수명은 18시간, 25개의 표본을 랜덤으로 추출하여 평균과 표준편차를 구해보니, 19시간, 4시간이였다.

 

신뢰구간 95%(0.05)에서 one-tailed 가설 감정을 시행해 본다.

 

1단계: 가설 세우기

The null hypothesis (H0): μ ≤ 18

The alternative hypothesis: (Ha): μ > 18

2단계: t-점수 와 자유도 구하기

t-점수  =  (x-μ) / (s/√n)  = (19-18) / (4/√25)  = 1.25.

degrees of freedom = n-1 = 25-1 = 24.

3단계: p-value 구하기

=T.DIST.RT(1.25, 24)

t-점수는 0.1117(신뢰구간 95%)

4단계: 가설 검정하기

0.1117은 0.05로 보다 크기 때문에 신뢰구간 95%에서 null hypothesis를 기각할 수 없다. 그리하여 새로운 신제품 배터리가 기존 배터리보다 더 수명이 오래간다고 할만한 통계적 근거가 없다.