Excel_데이터/가설검증

엑셀에서 그럽스 검정(Grubbs' Test) 하기

palefaceman 2021. 4. 15. 09:53

그럽스 검정(Grubbs' test)은 데이터 세트 안에 하나에 이상치(outlier) 유무를 판별하는데 쓰인다. 

 

그럽스 검정(Grubbs' test)을 실시하기 위한 선행 조건으로 데이터 세트는 정규분포 곡선(normal distribution curve)이어야 하며 최소 7개의 데이터가 있어야 한다.

 

그럽스 검정(Grubbs' test)는 하나의 이상치를 판별한다. 하나 이상의 이상치(outlier) 유무 판별을 위해서는 ESD 검정(the generalized extreme studentized deviate test for outlier)을 한다.

 

만약에 데이터 셋트에서 최곳값(maxium)이 이상치(outlier)로 의심된다면 그럽스 검정(Grubbs' test)을 시행할 수 있다.

G = (xmax  x) / s

 

만약에 데이터 세트에서 최솟값(minimum)이 이상치(outlier)로 의심된다면 그럽스 검정(Grubbs' test)을 시행할 수 있다.

G = (x – xmin) / s

 

만약, 최고/최소 값이 모두 이상치(outlier)인지 긴가민가 하다면, 양측 검정(two-sided test)을 한다. 

G = max|xi – x| / s

 

양측검정(two-sided test)에 기각치(critical value)를 구한다.

Gcritical = (n-1)tcritical  /  √[n(n-2 + t² critical)] 

 

여기서 tcritical은 자유도 n-2, 유의 수준(significance level) 단측 검정(one-tailed test) α/n, 양측 검정(two-tailed test) 시  α/(2n)에서 t-분포에서 t 기각치(t critival value)다.

※ 변수

  • x: 표본 평균
  • s: 표본 표준편차
  • xi: 임의 이 데이터 값
  • xmax: 최곳값
  • xmin: 최솟값

예시: 그럽스 검정(Grubbs' test) 실행하기

아래 데이터 세트에서 60이 이상치(outlier)인지 아닌지 판별해보기로 한다.

1단계: 그럽스 검정(Grubbs' Test) 적합도 판정

 

그럽스 검정(Grubbs' test)을 하기 위한 선행 조건 중 한 가지 7개 이상의 데이터는 만족했다. 두 번째 선행조건인, 정규분포(normal distribution)를 하고 있는지 알아보기 위해서 히스토그램(histogram)을 그려서 확인한다. 엑셀에서 데이터 분석을 통해서 그려본다.

 

데이터 분석 툴 업로드하기

 

계급 구간을 5로 해서, 히스토그램을 생성한다.

히스토그램에서 보면 15에 최고 많이 분포하고 있으며 양옆으로 점점 분포도가 줄어든다. 거의 정규분포(normal distribution)에 종모양(bell-shape)을 취하고 있다.

2단계: 그럽스 검정(Grubbs's Test) 하기

최곳값(max) 60에 대해서 그럽스 검정(Grubbs' test)을 시행한다. 아래에 데이터와 같이 입력한다.

 

이렇게 입력하고 나면 G 검정 통계량은 D4에 3.603219

 

G 기각치는 D11에 2.556581이다. G 검정 통계량이 G 기각치 보다 크기 때문에 60은 이상치(outlier) 값으로 판정된다.

그럽스 검정 그럽스 검정(Grubbs' test)으로 판정된 이상치(outlier)는 어떻게 할까?

  • 이상치(outlier) 값이 관측값에서 타이핑 에러인지, 다시 한번 확인해본다. 가끔씩 데이터 입력 과정에서 오류가 발생한다.
  • 다른 값으로 치환한다. 데이터가 이상치(outlier)로 된다면, 그 값을 평균이나. 중앙값의 데이터 값으로 대체한다.
  • 이상치(outlier)를 아예 제거한다. 이상치(outlier)가 데이터 분석 결과에 크게 영향을 미칠 것으로 염려된다면 제거하기도 한다.

 

셋 중 어떠한 방식으로 이상치(outlier)를 처리하더라도, 데이터 분석 결과 리포트에는 이상치 제거에 대한 언급이 들어가도록 한다.