Excel_데이터/시각화

엑셀에서 상자그림(box plot)그리기

palefaceman 2021. 4. 4. 19:25

상자 그림(box plot)은 데이터를 시각적으로 표현할 수 있는 간단하면서 유용한 방법이다.

상자 그림(box plot)에는 

  • 최솟값
  • Q1 백분위
  • 중앙값
  • Q3 백분위
  • 최댓값

을 포함한다.

 

상자그림(box plot)을 그려본다.

엑셀에서 상자그림(box plot) 그리기

1단계: 데이터 입력

2단계: 상자 그림(box plot) 그리기

삽입 > 차트 > 통계 차트 삽입 > 상자 수염

상자 그림(box plot)에서 값 표시를 하기 위해서 그림을 좌 클릭하고 우측 상단 '+'에서 데이터 라벨을 표시한다.

  • 최솟값: 3
  • Q1 백분위: 5.25
  • 중앙값: 15
  • 평균값: 14.75(x로 표시된다)
  • Q3 백분위: 14.75
  • 최댓값: 29

이상치(Outlier) 처리하기

IQR(Interquartile Range)는 Q1과 Q3의 사이 거리이다. 엑셀에서 Q1과 Q3의 거리에서 IQR x1.5 보다 멀리 떨어져 있는 데이터 값을 이상치(Outlier)로 처리한다. 

 

예를 들어 위의 데이터에서

  • IQR: 23.75 - 5.25 = 18.5
  • 5.25 - (18.5*1.5) = -22.5
  • 23.75 + (18.5*1.5) = 51.5 

어떤 값이든 -22.5, 51.5 이상의 값은 이 데이터 값에서 이상치로 간주한다.

 

위의 데이터에 임의로 54의 데이터를 추가하게 되면 상자 그림(box plot)은 이상치 값을 표시한다.

두 개 이상의 상자그림(box plot) 그리기

 데이터 세트를 하나 더 만들고 두 데이터 세트를 선택 후, 삽입> 차트 > 통계 차트 삽입 > 상자 수염, 두 개의 상자 그림(box plot)을 만들 수 있다.

두 개 이상의 데이터 세트를 빠르게 시각화하여 경향성을 파악하고자 할 때 유용하다.