Q-Q플롯(Q-Q Plot)은 'quantile-quantile plot'을 의미한다.
Q-Q플롯(Q-Q Plot)은 선택된 데이터가 이론적인 분포를 하고 있는지 파악할 때 쓰인다. 여기서 '이론적인 분포'란 정규분포(normal distribution)를 의미한다.
이번 포스팅에서는 Q-Q플롯(Q-Q Plot)을 만들어본다.
예시: 엑셀에서 Q-Q플롯(Q-Q Plot) 만들기
아래의 단계별로 Q-Q플롯(Q-Q Plot)을 그려본다.
1단계: 데이터 입력
우선 데이터를 오름차순으로 정리를 해야 한다. 위에 데이터는 오름차순으로 정리가 돼있다.
오름차순 정리를 하기 위해서 데이터 > 필터 > 오름차순으로 정렬한다.
2단계: 각 데이터에 순위를 찾는다.
엑셀에서 랭크 함수를 사용해서 데이터별 순위를 찾아낸다.
=RANK(A2, $A$2:$A$11, 1)
3단계: 백분위(percentile)를 찾아낸다.
아래 수식을 사용해서 백분위(percentile)을 찾아낸다.
=(B2-0.5)/COUNT($B$2:$B$11)
4단계: z-점수(z-score)를 구한다.
아래 수식을 사용해서 z-점수(z-score)을 구한다.
=NORM.S.INV(C2)
5단계: Q-Q플롯(Q-Q Plot)을 그린다.
A열에 데이터를 E열에 똑같이 복사한다. 그리고 D열, E열을 선택한다.
삽입 > 차트 > 분산형(X, Y)또는 거품형 차트 삽입에서 분산형을 선택한다.
아래와 같은 차트가 그려진다.
우측 상단에 + 마크를 클릭하고 추세선을 추가해준다.
보기 좋게 꾸며준다.
Q-Q플롯(Q-Q Plot)에 데이터가 45도 정도로 그어진 추세선에 맞아떨어질수록 데이터는 정규 분포(normal distiribution)에 가깝게 분포해있다. 왼쪽에선 아래로, 오른쪽에선 위로 살짝 벗어나 있어서 완전 정규 분포(normal distribution)가 아니다.
Q-Q플롯(Q-Q Plot)은 공식적인 통계 검정은 아니다. 하지만 정규 분포성을 검정할 수 있는 간편한 방법이다.
'Excel_데이터 > 회귀분석' 카테고리의 다른 글
엑셀에서 결정계수(coefficient of determination) R² 구하기 (0) | 2021.07.11 |
---|---|
엑셀에서 Breusch-Pagan 검정(Breusch-Pagan Test) 하기 (0) | 2021.05.25 |
엑셀에서 회귀분석 표준오차(Standard Error of Regression) 구하기 (0) | 2021.05.18 |
엑셀에서 분산팽창계수(VIF) 구하기 (0) | 2021.05.15 |
엑셀에서 표준화 잔차(Standardized Residuals) 구하기 (0) | 2021.05.13 |