엑셀통계 110

엑셀에서 양비율 z-검정(Two Proportion Z-Test)하기

양비율 Z-검정(one proportion z-test)은 두 개의 서로 다른 모집단(population)의 비율이 차이를 검정할 때 사용한다. 모 대학 안에 카페 1호점과 2호점을 운영하는 자영업자가 있다. 그는 이번에 한 음료를 선택해서 반값 프로모션을 하려고 한다. 각 지점에서 가장 인기 있는 음료를 할인 하기로 했다. 그동안 매출로 보기에 1호점과 2호점에서 아메리카노 같은 비율로 가장 많이 팔린 것 같았다. 그래서 아메리카노로 하려고 한다. 실제 아메리카노가 1호점 2호점에서 같은 비율로 더 선호되는지 알아보기 위해, 지나가는 100명의 학생에게 무작위로 설문조사를 실시했다. 설문조사 결과 1호점을 이용하는 학생 70%가 아메키라노를 선호했고, 2호점을 이용하는 학생 68%가 아메리카노를 선호했..

엑셀에서 단비율 z-검정(One Proportion Z-Test) 하기

단비율 Z-검정(one proportion z-test)은 예측되는 비율을 표본 조사를 통해 나온 비율을 가지고 적합도를 비교하기 위해서 사용한다. 어느 가전제품 회사의 신제품 TV에 고객 만족도가 90%로 발표했다면, 이를 비교하기 위해 200명의 임의에 고객들에게 만족도를 조사한 결과 85%였다. 단비율 Z-검정(one proportion z-test)은 실제 고객 만족도가 90% 인지 아닌지에 대해 사실검증을 할 수 있다. 단 표본 Z-검정(one sample z-test) 시행하기 아래 단계별로 단 표본 Z-검정(one sample z-test)을 시행한다. 1단계: 가정 수립한다. H0 [귀무가설(null hypothesis)]: P = 0.9 Ha [대안 가설(alternative hypoth..

엑셀에서 맥니마 검정(McNemar's Test) 하기

맥니마 검정(McNemar's test)은 하나의 관측대상(subject)에 대해서 서로 다른 조건에 있을 때, 그 조건이 검증에 영향을 주느냐 안느냐에 판별하는 용도로 쓰인다. 맥니마 검정(McNemar's test)은 특히 물리, 화학, 생물 실험에서 유용하게 쓰인다. 특정 요인이 실험대상에 미치는 영향을 알아보기 위한 실험 설계(experiment design)에서, 실험군(experimental group)과 대조군(control group)에 대해서 하나의 조건을 독립 변인을 두고 실험을 진행한 결과에서 독립 변인이 실험 결과에 미치는 유무를 판별하기 위한 통계 검정이다. 엑셀에서 맥니마 검정(McNemar's test) 시행해본다. 엑셀에서 맥니마 검정(McNemar's test) 하기 이번 ..

엑셀에서 그럽스 검정(Grubbs' Test) 하기

그럽스 검정(Grubbs' test)은 데이터 세트 안에 하나에 이상치(outlier) 유무를 판별하는데 쓰인다. 그럽스 검정(Grubbs' test)을 실시하기 위한 선행 조건으로 데이터 세트는 정규분포 곡선(normal distribution curve)이어야 하며 최소 7개의 데이터가 있어야 한다. 그럽스 검정(Grubbs' test)는 하나의 이상치를 판별한다. 하나 이상의 이상치(outlier) 유무 판별을 위해서는 ESD 검정(the generalized extreme studentized deviate test for outlier)을 한다. 만약에 데이터 셋트에서 최곳값(maxium)이 이상치(outlier)로 의심된다면 그럽스 검정(Grubbs' test)을 시행할 수 있다. G = (x..

엑셀에서 앤스콤 4분할 그래프(Anscombe's quartet) 그리기

앤스콤 4분할 그래프(Anscombe's quartet)는 평균(mean)과 표준편차(stanard deviation) 같은 기술적 통계량(descriptive statistics) 같은 4 개의 데이터 셋의 분포 그래프를 모아서 봄으로써, 기술적 통계(descriptive statistics)에서 보지 못한 데이터 분포의 차이를 한눈에 보여준다. 차례로 앤스콤 4분할 그래프(Anscombe's quartet)를 그려본다. 1단계: 데이터 생성하기 4개의 서로 다른 데이터 세트를 입력한다. 이들의 평균(mean)과 표준편차(standard deviation)는 같다. 2단계: 데이터를 시각화한다. 분산형 그래프를 생성한다. 분산형 그래프를 생성한 데이터 범위 A3:B13를 선택한다. 삽입> 차트 > 분산..

엑셀에서 블랜드-앨트먼 차트(Bland-Altman Plot) 그리기

블랜드-앨트먼 차트(bland-altman plot)는 두 개의 서로 다른 관측 결과에 대해서, 두 관측 결과의 차이점을 한눈에 볼 수 있게 그려놓은 차트다. 예를 들어, 하나의 실험에서 서로 다른 실험 도구를 사용했거나, 다른 실험 설계(experiment design)를 통해 결과를 얻었다면, 두 실험 도구와, 두 실험 방법 간에 차이점을 한눈에 볼 수 있다. 이 포스팅에선 단계별로 블랜드-앨트먼 차트(bland-altman plot)를 그려본다. 1단계: 데이터를 생성한다. 화학자가 서로 다른 2개의 실험 방법으로, 각 실험당 물속에 포함된 유기물(organic compound)의 질량을 측정실험을 20회씩 반복했다. 2단계: 두 실험간 평균 차를 구한다. =AVERAGE() 함수를 이용해서 매회당..

환율 최솟값, Q1, Q3, 중간값, 최댓값 구하고 상자그림(box plot) 그려보기

1988년에서 2021/04/13일 받은 환율 데이터를 가지고 Q1, Q3, 중간값, 최댓값을 구하고 상자 그림(box plot)을 그려본다. 환율 데이터는 경제통계시스템(KCOS)에서 다운 받을 수 있다. 한국은행 경제통계시스템(KCOS)에서 환율 데이터 다운 받기 5개 통계 상수 구하기 데이터를 다운로드하여 나오면 아래와 같이 나온다. ... 하면 이렇게 중간중간 환율이 기록되지 않은 주말/공휴일 날짜가 있다. 우선 환율이 기록된 날짜만 나오도록 데이터를 편집한다. 데이터> 필터 >고급필터로 들어가서 위의 조건 서식에 위의 조건을 넣는다. 하고 나면 F1 칸에서부터 아래처럼 데이터가 추출된다. 최솟값: Min(ragne) Q1: Quartile(range, 1) 중간값: Quartile(range,2..

엑셀에서 정규확률그림(Normal Probability Plot) 그리기

정규 확률 그림(normal probability plot)은 데이터 분포가 얼마 만큼 정규분포(normal distribution)로 분포되어있는지 보여준다. 정규 확률 그림(normal probability plot)을 단계별로 하나씩 그려본다. 1단계: 데이터를 입력한다. 2단계: z-값을 계산한다. 아래 함수를 가지고 데이터의 z-값(z-value)을 구한다. =NORM.S.INV((RANK(A2, $A$2:$A$16, 1)-0.5)/COUNT(A:A)) 3단계: 정규확률그림(normal probability plot) 그리기 다음으로, 정규확률그림(normal probability plot)을 그린다. A2:B16을 선택한다. 삽입 > 차트 > 분산형(x,y) 또는 거품형 차트 삽입에 들어간다...

엑셀에서 분산형 그래프(Scatterplot)에 구분선 추가하기

분산형 그래프에 구분선을 추가하면 관심 있는 데이터의 분포를 더 분명하게 볼 수 있다. 그래서 실험 데이터나, 경제/금융 그래프를 보면 이따금씩 분산형 그래프에 구분선이 그려져 있는 것을 볼 수 있다. 단계별로 분산형 그래프(scatterplot)을 그려보고 구분선도 추가해본다. 1단계: 데이터를 입력한다. x,y에 대해 아래와 같은 데이터가 있다. 2단계: 분산형 그래프를 생성한다. A2:B17까지 선택한다. 삽입 > 차트 > 분산형(x, y)또는 거품형 차트 > 분산형을 선택한다. 아래와 같은 분산형 그래프(scatterplot)가 생성된다. 3단계: 구분선을 추가한다. y= 20 선에 구분선을 추가하려고 한다. 우선, 구분선을 그리기 위해선 가짜 데이터를 차트에 추가해야 한다. x축 범위는 0~20..

엑셀에서 곡선 데이터 피팅(Curve Fitting)하기

점으로 분산된 데이터를 수식으로 나타내야 할 때 엑셀에서 어떻게 할 수 있는지 알아본다. 엑셀에서 추세선(trendline) 보기 기능을 사용하면 쉽게 구현할 수 있다. 단계별로 따라 진행해본다. 1단계: 데이터를 생성한다. 변수 x,y에 대한 데이터가 아래에 처럼 입력한다. 2단계: 분산그래프를 만든다. A2:B16을 선택하고 삽입 > 차트 > 분산형(x,y)또는 거품이 있는 차트 > 분산형 선택한다. 아래와 같은 분산형 차트가 나온다. 3단계: 추세선을 추가한다. 차트에 마우스 커서를 올리고 좌클릭한다. '+에서 '추세선에 기타옵션에 들어간다. 추세선 서식에서 다항식을 클릭하고, 아래에 R-제곱 값을 차트에 표시(R), 수식을 차트에 표시(E)에 체크한다. 아래와 같이 그래프에 추세선과 R² 값이 나..