Excel_데이터/기술적 통계

엑셀에서 IQR(Interquartile Range)구하기 in Excel

palefaceman 2021. 3. 8. 17:37

interquartile range(IQR)을 엑셀에서 구해보자.

 

IQR(interquartile range)는 데이터에서 50% 구간에서 데이터가 '퍼져나간 정도'를 말해준다.

 

IQR(interquartile range)는 Q3-Q1로 구해진다.

 

IQR 숫자 자체로 특정한 의미를 가지지 않고, 크냐 작냐의 정도로 중앙값(median)에서 얼마나 데이터가 퍼져있는지를 알아볼 수 있는 척도(measure)이다.

*Quartile은 데이터를 4개(Quarter)로 나눈 것이다.

 

[58, 66, 71, 73, 74, 77, 78, 82, 84, 85, 88, 88, 88, 90, 90, 92, 92, 94, 96, 98]

 

위의 데이터에서 Q3는 91이고 Q1는 75.5다. 그래서 IQR는 91 - 75.5 = 15다.  

 

엑셀에서 IQR구하기

엑셀에서 IQR를 구하는 함수는 직접 제공하지 않는다. 하지만 QUARTILE() 함수로 쉽게 IQR 구할 수 있다.

 

QUARTILE(array, quart)

array: 데이터 구간 
quart: 구하고 싶은 쿼터 구간

 

예시: IQR in Excel

이렇게 하면 IQR은 Q3-Q1 = IQR이므로 39.5-23.5=16이다. 

결론

데이터의 '퍼짐(spread)'를 측정하는 통계 값은 많다. 범위(range), 표준편차(standard deviation), 분산(variance)

그들 중에서 IQR의 장점은 데이터에 outlier에 영향을 받지 않는다는 점이다. 왜냐하면 IQR은 중간값(median)에서 Q3에서 Q1로 얼마나 퍼저있나를 나타내기 때문이다. 범위(range)는 Maxium, Minimum 값을 포함하기 때문에, outlier 데이터 값에 왜곡된 값을 나타내기도 한다.