평균 3

Numpy mean() vs average(): 차이점

파이썬에서 np.mean(), np.average()로 배열(array)에 평균을 구할 수 있다. 두 함수에서는 작은 차이가 있다. np.mean(): 산술평균을 계산한다. np.average(): 가중치가 옵션으로 추가 입력할 수 있어 가중평균을 구할 수 있다. 예시 1: np.mean(), np.average() 가중치 옵션 없이 사용하기 아래의 배열이 있다. # 배열 생성 data = [1, 4, 5, 7, 8, 8, 10] np.mean()과 np.average()를 사용하여 평균을 구해본다. import numpy as np # 평균 구하기 np.mean(data) 6.142857142857143 # 평균 구하기 2 np.average(data) 6.142857142857143 두 함수가 같은 ..

엑셀에서 변동계수(CV, coefficient of variation) 구하기

변동 계수(CV, coefficient of variation)는 데이터의 퍼짐 정도와 데이터의 평균값에 관계를 나타낸다. CV= σ/μ σ = 표준편차(standard deviation) μ = 평균(mean) 위의 식에서 보면 변동 계수(CV, coffiecient of variation)는 수학 기호로 단순히 표준편차/평균값이다. 어디에 쓰이는가? 변동 계수(CV, coefficient of variation)는 두 데이터 간에 비교하는 데 사용된다. 이를테면 두 기대수익률 데이터에서 평균과 표준편차의 관계로 두 기대수익률을 비교하여 리스크 판단과 손절각을 결정하는 도구로 사용된다. A 펀드: 평균 7%, 표준편차= 12.4% B 펀드: 평균 5%, 표준편차 = 8.2% A펀드 CV: 12.4/7 ..

엑셀에서 중간범위(midrange)구하기

중간범위는=(제일 큰 값 +제일 작은 값)/2로 구한다 데이터에서 가장 큰 값과 가장 작은 값의 평균이다. 그리고 데이터의 중심이 어디에 위치해 있는지 알려준다. 이렇게 하면 중간값(midrange)은 24.5가 나온다. 중간범위(midrange) 단점 중간범위(midrange)는 outlier 값에 취약하다. 만약 위의 데이터 120이 포함되면 중간범위(midrange)는 60으로 데이터의 중심과 크게 떨어져 있다. 중간범위(midrange) 대안 중간범위(midrange)는 데이터에 중앙(center)을 구하는데 자주 사용되지 않는다. 그 이유는 outlier에 취약하지 않은 좋은 수단들이 많기 때문이다. 대표적으로 평균값(mean), 그리고 중앙값(median)이다. 이렇게 하면 중간범위(midra..