엑셀로통계하기 111

엑셀에서 윌콕슨 부호순위 검정(Wilcoxon Signed Rank Test) 하기

윌콕슨 부호 순위 검정(Wilcoxon Signed Rank Test)은 두 모집단 평균 간에 차이가 있는지 없는지 판별할 때 사용한다. 여기까지 보면 대응표본 t-검정(paired samples t-test)과 같아 보이지만, 대응표본 t-검정(paired samples t-test)에서는 모집단의 분포가 정규분포(normal distribution)로 가정한다. 만약 모집단이 정규분포(normal distribution)로 가정할 수 없을 경우, 윌콕슨 부호순위 검정(Wilcoxon Signed Rank Test)을 사용하게 된다. 단계별로 윌콕슨 부호순위 검정(Wilcoxon Signed Rank Test) 시행한다. 1단계: 데이터 생성 자동차 엔지니어는 기존의 연료와 개질 연료가 자동차에 평균 ..

환율 이상치(outlier)를 찾아보고, 환율 구간별 파이차트(pie chart)를 그려보기

이상치(outlier)는 데이터 세트에서 평균과 표준편차 같은 통계량(statistics)에 왜곡된 결과를 낸다. 그렇기 때문에 통계에서 IQR(Interquartile Range) 이상치 판별법 같은 이상치(outlier)를 판별하기 위한 방법들이 이용되고 있다. 환율 데이터에도 1997~2021/04 사이에 IQR(Interquartile Range) 이상치 판별법을 사용해서 이상치(outlier)를 검출해보고, 이상치(outlier)를 제외한 데이터의 평균과 표준편차를 비교해본다. 그리고 데이터를 고급 필터 기능을 이용해서 임의의 구간으로 데이터를 나누고 파이 차트(pie chart)를 그려서 정리해본다. 이상치(Outlier) 찾기 환율 데이터에 이상치(outlier)로 의심되는 값들이 1997년..

엑셀에서 양비율 z-검정(Two Proportion Z-Test)하기

양비율 Z-검정(one proportion z-test)은 두 개의 서로 다른 모집단(population)의 비율이 차이를 검정할 때 사용한다. 모 대학 안에 카페 1호점과 2호점을 운영하는 자영업자가 있다. 그는 이번에 한 음료를 선택해서 반값 프로모션을 하려고 한다. 각 지점에서 가장 인기 있는 음료를 할인 하기로 했다. 그동안 매출로 보기에 1호점과 2호점에서 아메리카노 같은 비율로 가장 많이 팔린 것 같았다. 그래서 아메리카노로 하려고 한다. 실제 아메리카노가 1호점 2호점에서 같은 비율로 더 선호되는지 알아보기 위해, 지나가는 100명의 학생에게 무작위로 설문조사를 실시했다. 설문조사 결과 1호점을 이용하는 학생 70%가 아메키라노를 선호했고, 2호점을 이용하는 학생 68%가 아메리카노를 선호했..

엑셀에서 단비율 z-검정(One Proportion Z-Test) 하기

단비율 Z-검정(one proportion z-test)은 예측되는 비율을 표본 조사를 통해 나온 비율을 가지고 적합도를 비교하기 위해서 사용한다. 어느 가전제품 회사의 신제품 TV에 고객 만족도가 90%로 발표했다면, 이를 비교하기 위해 200명의 임의에 고객들에게 만족도를 조사한 결과 85%였다. 단비율 Z-검정(one proportion z-test)은 실제 고객 만족도가 90% 인지 아닌지에 대해 사실검증을 할 수 있다. 단 표본 Z-검정(one sample z-test) 시행하기 아래 단계별로 단 표본 Z-검정(one sample z-test)을 시행한다. 1단계: 가정 수립한다. H0 [귀무가설(null hypothesis)]: P = 0.9 Ha [대안 가설(alternative hypoth..

엑셀에서 맥니마 검정(McNemar's Test) 하기

맥니마 검정(McNemar's test)은 하나의 관측대상(subject)에 대해서 서로 다른 조건에 있을 때, 그 조건이 검증에 영향을 주느냐 안느냐에 판별하는 용도로 쓰인다. 맥니마 검정(McNemar's test)은 특히 물리, 화학, 생물 실험에서 유용하게 쓰인다. 특정 요인이 실험대상에 미치는 영향을 알아보기 위한 실험 설계(experiment design)에서, 실험군(experimental group)과 대조군(control group)에 대해서 하나의 조건을 독립 변인을 두고 실험을 진행한 결과에서 독립 변인이 실험 결과에 미치는 유무를 판별하기 위한 통계 검정이다. 엑셀에서 맥니마 검정(McNemar's test) 시행해본다. 엑셀에서 맥니마 검정(McNemar's test) 하기 이번 ..

엑셀에서 그럽스 검정(Grubbs' Test) 하기

그럽스 검정(Grubbs' test)은 데이터 세트 안에 하나에 이상치(outlier) 유무를 판별하는데 쓰인다. 그럽스 검정(Grubbs' test)을 실시하기 위한 선행 조건으로 데이터 세트는 정규분포 곡선(normal distribution curve)이어야 하며 최소 7개의 데이터가 있어야 한다. 그럽스 검정(Grubbs' test)는 하나의 이상치를 판별한다. 하나 이상의 이상치(outlier) 유무 판별을 위해서는 ESD 검정(the generalized extreme studentized deviate test for outlier)을 한다. 만약에 데이터 셋트에서 최곳값(maxium)이 이상치(outlier)로 의심된다면 그럽스 검정(Grubbs' test)을 시행할 수 있다. G = (x..

엑셀에서 앤스콤 4분할 그래프(Anscombe's quartet) 그리기

앤스콤 4분할 그래프(Anscombe's quartet)는 평균(mean)과 표준편차(stanard deviation) 같은 기술적 통계량(descriptive statistics) 같은 4 개의 데이터 셋의 분포 그래프를 모아서 봄으로써, 기술적 통계(descriptive statistics)에서 보지 못한 데이터 분포의 차이를 한눈에 보여준다. 차례로 앤스콤 4분할 그래프(Anscombe's quartet)를 그려본다. 1단계: 데이터 생성하기 4개의 서로 다른 데이터 세트를 입력한다. 이들의 평균(mean)과 표준편차(standard deviation)는 같다. 2단계: 데이터를 시각화한다. 분산형 그래프를 생성한다. 분산형 그래프를 생성한 데이터 범위 A3:B13를 선택한다. 삽입> 차트 > 분산..

엑셀에서 블랜드-앨트먼 차트(Bland-Altman Plot) 그리기

블랜드-앨트먼 차트(bland-altman plot)는 두 개의 서로 다른 관측 결과에 대해서, 두 관측 결과의 차이점을 한눈에 볼 수 있게 그려놓은 차트다. 예를 들어, 하나의 실험에서 서로 다른 실험 도구를 사용했거나, 다른 실험 설계(experiment design)를 통해 결과를 얻었다면, 두 실험 도구와, 두 실험 방법 간에 차이점을 한눈에 볼 수 있다. 이 포스팅에선 단계별로 블랜드-앨트먼 차트(bland-altman plot)를 그려본다. 1단계: 데이터를 생성한다. 화학자가 서로 다른 2개의 실험 방법으로, 각 실험당 물속에 포함된 유기물(organic compound)의 질량을 측정실험을 20회씩 반복했다. 2단계: 두 실험간 평균 차를 구한다. =AVERAGE() 함수를 이용해서 매회당..

환율 최솟값, Q1, Q3, 중간값, 최댓값 구하고 상자그림(box plot) 그려보기

1988년에서 2021/04/13일 받은 환율 데이터를 가지고 Q1, Q3, 중간값, 최댓값을 구하고 상자 그림(box plot)을 그려본다. 환율 데이터는 경제통계시스템(KCOS)에서 다운 받을 수 있다. 한국은행 경제통계시스템(KCOS)에서 환율 데이터 다운 받기 5개 통계 상수 구하기 데이터를 다운로드하여 나오면 아래와 같이 나온다. ... 하면 이렇게 중간중간 환율이 기록되지 않은 주말/공휴일 날짜가 있다. 우선 환율이 기록된 날짜만 나오도록 데이터를 편집한다. 데이터> 필터 >고급필터로 들어가서 위의 조건 서식에 위의 조건을 넣는다. 하고 나면 F1 칸에서부터 아래처럼 데이터가 추출된다. 최솟값: Min(ragne) Q1: Quartile(range, 1) 중간값: Quartile(range,2..

엑셀에서 정규확률그림(Normal Probability Plot) 그리기

정규 확률 그림(normal probability plot)은 데이터 분포가 얼마 만큼 정규분포(normal distribution)로 분포되어있는지 보여준다. 정규 확률 그림(normal probability plot)을 단계별로 하나씩 그려본다. 1단계: 데이터를 입력한다. 2단계: z-값을 계산한다. 아래 함수를 가지고 데이터의 z-값(z-value)을 구한다. =NORM.S.INV((RANK(A2, $A$2:$A$16, 1)-0.5)/COUNT(A:A)) 3단계: 정규확률그림(normal probability plot) 그리기 다음으로, 정규확률그림(normal probability plot)을 그린다. A2:B16을 선택한다. 삽입 > 차트 > 분산형(x,y) 또는 거품형 차트 삽입에 들어간다...