Excel_데이터/회귀분석

엑셀에서 Q-Q플롯(Q-Q Plot) 그리기

palefaceman 2021. 5. 26. 17:46

Q-Q플롯(Q-Q Plot)은 'quantile-quantile plot'을 의미한다. 

 

Q-Q플롯(Q-Q Plot)은 선택된 데이터가 이론적인 분포를 하고 있는지 파악할 때 쓰인다. 여기서 '이론적인 분포'란 정규분포(normal distribution)를 의미한다.

 

이번 포스팅에서는 Q-Q플롯(Q-Q Plot)을 만들어본다.

 

예시: 엑셀에서 Q-Q플롯(Q-Q Plot) 만들기

아래의 단계별로 Q-Q플롯(Q-Q Plot)을 그려본다.

1단계: 데이터 입력

우선 데이터를 오름차순으로 정리를 해야 한다. 위에 데이터는 오름차순으로 정리가 돼있다. 

오름차순 정리를 하기 위해서 데이터 > 필터 > 오름차순으로 정렬한다.

2단계: 각 데이터에 순위를 찾는다.

엑셀에서 랭크 함수를 사용해서 데이터별 순위를 찾아낸다.

 

=RANK(A2, $A$2:$A$11, 1)

 

3단계: 백분위(percentile)를 찾아낸다.

아래 수식을 사용해서 백분위(percentile)을 찾아낸다.

 

=(B2-0.5)/COUNT($B$2:$B$11)

4단계: z-점수(z-score)를 구한다.

아래 수식을 사용해서 z-점수(z-score)을 구한다.

 

=NORM.S.INV(C2)

5단계: Q-Q플롯(Q-Q Plot)을 그린다.

A열에 데이터를 E열에 똑같이 복사한다. 그리고 D열, E열을 선택한다.

 

삽입 > 차트 > 분산형(X, Y)또는 거품형 차트 삽입에서 분산형을 선택한다.

아래와 같은 차트가 그려진다.

우측 상단에 + 마크를 클릭하고 추세선을 추가해준다.

보기 좋게 꾸며준다.

Q-Q플롯(Q-Q Plot)에 데이터가 45도 정도로 그어진 추세선에 맞아떨어질수록 데이터는 정규 분포(normal distiribution)에 가깝게 분포해있다. 왼쪽에선 아래로, 오른쪽에선 위로 살짝 벗어나 있어서 완전 정규 분포(normal distribution)가 아니다. 

 

Q-Q플롯(Q-Q Plot)은 공식적인 통계 검정은 아니다. 하지만 정규 분포성을 검정할 수 있는 간편한 방법이다.