상자 그림(box plot)은 데이터를 시각적으로 표현할 수 있는 간단하면서 유용한 방법이다.
상자 그림(box plot)에는
- 최솟값
- Q1 백분위
- 중앙값
- Q3 백분위
- 최댓값
을 포함한다.
상자그림(box plot)을 그려본다.
엑셀에서 상자그림(box plot) 그리기
1단계: 데이터 입력
2단계: 상자 그림(box plot) 그리기
삽입 > 차트 > 통계 차트 삽입 > 상자 수염
상자 그림(box plot)에서 값 표시를 하기 위해서 그림을 좌 클릭하고 우측 상단 '+'에서 데이터 라벨을 표시한다.
- 최솟값: 3
- Q1 백분위: 5.25
- 중앙값: 15
- 평균값: 14.75(x로 표시된다)
- Q3 백분위: 14.75
- 최댓값: 29
이상치(Outlier) 처리하기
IQR(Interquartile Range)는 Q1과 Q3의 사이 거리이다. 엑셀에서 Q1과 Q3의 거리에서 IQR x1.5 보다 멀리 떨어져 있는 데이터 값을 이상치(Outlier)로 처리한다.
예를 들어 위의 데이터에서
- IQR: 23.75 - 5.25 = 18.5
- 5.25 - (18.5*1.5) = -22.5
- 23.75 + (18.5*1.5) = 51.5
어떤 값이든 -22.5, 51.5 이상의 값은 이 데이터 값에서 이상치로 간주한다.
위의 데이터에 임의로 54의 데이터를 추가하게 되면 상자 그림(box plot)은 이상치 값을 표시한다.
두 개 이상의 상자그림(box plot) 그리기
데이터 세트를 하나 더 만들고 두 데이터 세트를 선택 후, 삽입> 차트 > 통계 차트 삽입 > 상자 수염, 두 개의 상자 그림(box plot)을 만들 수 있다.
두 개 이상의 데이터 세트를 빠르게 시각화하여 경향성을 파악하고자 할 때 유용하다.
'Excel_데이터 > 시각화' 카테고리의 다른 글
엑셀에서 종 곡선(Bell Curve) 그리기 (2) | 2021.04.06 |
---|---|
엑셀에서 상관계수행렬(Correlation Matrix) 만들기 (0) | 2021.04.06 |
엑셀에서 누적도수분포 곡선(Ogive graph) 그리기 (0) | 2021.04.05 |
엑셀에서 도넛 차트(Doughnut Chart) 그리기 (0) | 2021.04.05 |
엑셀에서 줄기 잎 그래프(Stem-and-Leaf Plot)만들기 (0) | 2021.04.04 |