확률통계 22

엑셀에서 유클리드 거리(Euclidean Distance)구하기

두 벡터 간 유클리디안 거리(Euclidean distane)는 다음과 같이 나타낸다. Euclidean distance = √Σ(Ai-Bi) 2 Σ: 합계 Ai: A벡터의 i번째 요소의 값 Bi: B벡터의 i번째 요소의 값 엑셀에서는 함수들을 이용해서 구할 수 있다. =SQRT(SUMXMY2(RANGE1, RANGE2)) SUMXMY2: range1과 range2의 각각의 요소들에 차에 제곱을 구해준다. SQRT: 루트(root)를 씌워준다. 유클리드 거리는 12.40967이다. 유클리드 거리는 반드시 대칭되는 두 배열(array), 범위(ragne), 벡터(vector), 크기(size)끼리만 적용된다. 예를 들어 이 두 차원이 다른 a, b 사이에 유클리드 거리는 성립되지 않는다.

엑셀에서 체비셰프 가정(Chebyshev's Theorem) 적용하기

체비셰프 가정(Chebyshev's Theorem)은 1보다 큰 어떤 수 k에서 1-1/k^2는 어떠한 분포에 데이터에서도 표준편차 k안에 들어간다고 정의한다. 예를 들어 1-1/3^2=88.89%의 값은 어떤 데이터의 분포에서도 표준편차x3에 들어간다. 예시1: 30에서 70 사이에 데이터에서 (30- mean) / stdev = (30 -50)/10 = -2 (70-mean) / stdev = (70-50)/10 = 2 여기서 30과 70은 평균이 50, 표준편차가 10인 데이터에서 k=2이다. 표준편차x2 안에 들어가는 데이터들은 75%이다. 30과 70사이에 들어가는 데이터는 75%이다. 예시 2: 20에서 50 사이에 데이터에서 (20- mean) / stdev = (20 -35)/5 = -3 ..