이상치(outlier)는 비정상적으로 데이터 분포에서 멀리 떨어져 있는 데이터 값이다. 이상치(outlier)는 여러 통계 수치를 계산하는데 영향을 끼쳐 값에 신뢰도를 떨어뜨리거나, 해석에 오류를 범하게 하는 문제를 일으킨다. 위의 데이터에 이상치를 알아보자 방법 1: IQR(Interquartile Range)로 구하기 IQR은 Q3-Q1으로 데이터에서 50%에 값을 지시한다. 만약 Q3에서 IQR의 1.5배 한 값보다 크거나, Q1에서 IQR에 1.5배 아래에 이상치(outlier)로 간주한다. 계산해보면 아래와 같다. 164가 이상치(outlier)로 잡혔다. 방법 2: z-스코어 사용하기 z = (X – μ) / σ X : 데이터 값 μ : 모평균 σ : 모 표준편차 만약 z 값이 -3보다 작고,..