엑셀통계 110

엑셀에서 신뢰구간(Confidence Interval) 구하기

신뢰구간(Confidence Interval) 안에 값은 모수(population parameter)를 포함하고 있다. 신뢰구간(confidence interval)은 아래에 공식으로 계산한다. 신뢰구간(Confidence Interval) = (point estimate) +/- (critical value)*(표준 오차) 위의 공식은 신뢰구간(confidence interval)의 상한 값(uppter bound)과 하한 값(lower bound)을 구한다. 어떻게 신뢰구간(confidence interval)을 구하는지 단계별로 알아본다. 1. 평균의 신뢰구간(confidence interval) 2. 평균차이의 신뢰구간(confidence interval) 3. 비율의 신뢰구간(confidence..

엑셀에서 상관계수 p-값(P-value for a correlation coefficient) 구하기

두 변수 간에 관계를 알고 싶을 때 쓰는 방법 중 하나로, 피어슨 상관계수(Pearson correlation coefficient)를 구하는 방법이 있다. 피어슨 상관계수(Pearson correlation coefficient)는 두 변수간 선형 관계를 측정하는 수치다. 피어슨 상관계수(Pearson correlation coefficient)는 -1에서 1사이에 값을 가진다. -1 두 변수는 완벽하게 음(-)의 선형 관계가 있다. 0 두 변수간 선형 관계가 없다 1 두 변수는 완벽하게 양(+)의 선형 관계가 있다. 피어슨 상관계수(Pearson correlation coefficient)값이 통계적으로 유의미한지 검증하기 위해서, 피어슨 상관계수(Pearson correlation coefficie..

엑셀에서 쟈크베라의 정규성 검정(Jarque-Bera Normality Test)하기

쟈크베라의 검정(Jarque-Bera Test)은 적합도(Goodness-of-ift) 검정이다. 쟈크베라의 검정(Jarque-Bera Test)은 왜도(Skewness)와 첨도(Kurtosis)가 정규분포(normal distribution)로 보기에 적합한지에 대한 적합도(Goodness-of-fit) 검정에 사용한다. 쟈크베라의 검정(Jarque-Bera Test)에 결과값은 언제나 양의 숫자다. 그리고 결괏값이 0에서 멀리 떨어진 값이 나오면, 그때는 정규분포(normal distiribuiton)에 적합하지 않다고 판정한다. 쟈크베라의 검정(Jarque-Bera Test)의 통계량은 아래 식으로 구한다. JB =(n/6) * (S² + (C²/4)) n: 관찰된 표본 수 S: 표본의 왜도(ske..

엑셀에서 등분산 검정(Levene's Test) 하기

등분산 검정(Levene's Test)은 두 그룹 또는 두 그룹 이상이 서로 같은 분산을 가지고 있느냐/없느냐를 판별할 때 사용한다. 등분산 검정(Levene's Test)는 통계 분석에서 빈번하게 사용된다. 대부분에 통계 분석은 서로 다른 그룹 간에 분산이 같다고 가정을 하고 분석을 하기 때문에 등분산 검정(Levene's Test)을 선행하여 실제 같은 분산을 가졌다고 할 수 있는지 판별한다. 아래 예시를 따라서 엑셀에서 등분산 검정(Levene's Test)을 실습해본다. 예시: 엑셀에서 등분산 검정(Levene's Test) 연구자들은 서로 다른 3개의 비료를 개발했다. 3개의 비료의 효과에 대해 알아보고 싶다. 그래서 같은 식물을 3개의 서로 다른 비료를 이용해서 키운다면 한 달 후 식물의 성장..

엑셀에서 오즈비(Odds Ratio)와 상대 위험도(Relative Risk) 구하기

아래와 같은 2:2 테이블을 분석할 때 이따금씩 오즈비(Odds Ratio)와 상대 위험도(Relative Risk)를 사용한다. 오즈비(Odds Ratio)는 실험군에서 발생한 사건과 사건 비발생에 비와 대조군에서 발생한 사건 발생과 사건 비발생의 비를 나타낸다. 오즈비(Odds Ratio) = (A/B) / (C/D) = (A*D) / (B*C) 상대 위험도(Relative Risk)는 실험군에서 사건이 발생할 확률분에 대조군에서 사건이 발생할 확률의 비를 나타낸다. 상대 위험도(Relative Risk) = [A/(A+B)] / [C/(C+D)] 아래 설명에 따라 엑셀에서 오즈비(Odds Ratio)와 상대 위험도(Relative Risk)를 구해본다. 오즈비(Odds Ratio)와 상대 위험도(R..

엑셀에서 효과크기(Cohen's D) 구하기

두 데이터 세트, 또는 두 그룹 간에 차이가 있는지 없는지 확인하고 싶을 때 가설 검증(hypothesis test)을 한다. 그 결과 값으로 p-값(p-value) 계산한다. 그리고 p-값(p-value)과 유의 수준(significance level)과 비교하여 가설의 기각 여부를 판별하여, 두 세이터 세트, 또는 두 그룹 간에 차이가 있는지 없는지 통계적을 판별할 수 있다. p-값(p-value)으로 정성적으로 두 그룹간에 차이가 있고/없고를 알 수 있다면, 효과 크기(Cohen's D)는 실제로 차이에 정량 값을 구한다. 효과 크기(effect size)를 구하는 방법은 여러 가지가 있지만, Cohen's D가 가장 많이 쓰이고 있다. Cohen’s D = (x1 – x2) / pooled SD ..

엑셀에서 상관계수 검정(Correlation Test) 하기

두 변수(two variables) 간에 관계를 파악하기 위해서 피어슨 상관계수(pearson correlation coefficient)를 이용한다. 피어슨 상관계수(pearson correlation coefficient)는 서로 다른 두 변순(two variables) 간 선형 관계를 지시하는 통계 값이다. 피어슨 상관계수(pearson correlation coefficient)는 -1에서 1의 범위를 갖는다. -1: 두 변수간 완벽한 음에 상관관계가 있다. 0 두 변순간 선형관계가 없다. 1: 두 변수간 완벽한 양에 상관관계가 있다. 피어슨 상관계수(pearson correlation coefficient)가 사용하기에 적합한지 확인하는 방법으로 상관계수 검정(Correlation Test)을 ..

엑셀에서 이항검정(Binomial Test) 하기

이상 검정(binomial test)은 관측한 확률이 예상한 확률과 같은지 안 같은지 확인하는 데 사용한다. 예를들어, 주사위를 24번 던졌다. 1/6의 확률로 3이 4번 나올 것이라 예상했다. 그런데 실제로 3이 6번 나왔다. 그렇다면 이 주사위는 3이 더 많이 나오도록 편중되어 있는 것일까?? 위 질문에 이상검정(binomial test)을 통해서 답을 할 수 있다. 엑셀에서, 이상 검정(binomial은 엑셀에 내장 함수(built-in function)를 이용해서 쉽게 구할 수 있다. BINOM.DIST(number_s, trials, probability_s, cumulative) number_s: 성공한 횟수 trials: 전체 시도한 횟수 probability_s: 각 시행마다 성공할 확률 ..

엑셀에서 윌콕슨 부호순위 검정(Wilcoxon Signed Rank Test) 하기

윌콕슨 부호 순위 검정(Wilcoxon Signed Rank Test)은 두 모집단 평균 간에 차이가 있는지 없는지 판별할 때 사용한다. 여기까지 보면 대응표본 t-검정(paired samples t-test)과 같아 보이지만, 대응표본 t-검정(paired samples t-test)에서는 모집단의 분포가 정규분포(normal distribution)로 가정한다. 만약 모집단이 정규분포(normal distribution)로 가정할 수 없을 경우, 윌콕슨 부호순위 검정(Wilcoxon Signed Rank Test)을 사용하게 된다. 단계별로 윌콕슨 부호순위 검정(Wilcoxon Signed Rank Test) 시행한다. 1단계: 데이터 생성 자동차 엔지니어는 기존의 연료와 개질 연료가 자동차에 평균 ..

환율 이상치(outlier)를 찾아보고, 환율 구간별 파이차트(pie chart)를 그려보기

이상치(outlier)는 데이터 세트에서 평균과 표준편차 같은 통계량(statistics)에 왜곡된 결과를 낸다. 그렇기 때문에 통계에서 IQR(Interquartile Range) 이상치 판별법 같은 이상치(outlier)를 판별하기 위한 방법들이 이용되고 있다. 환율 데이터에도 1997~2021/04 사이에 IQR(Interquartile Range) 이상치 판별법을 사용해서 이상치(outlier)를 검출해보고, 이상치(outlier)를 제외한 데이터의 평균과 표준편차를 비교해본다. 그리고 데이터를 고급 필터 기능을 이용해서 임의의 구간으로 데이터를 나누고 파이 차트(pie chart)를 그려서 정리해본다. 이상치(Outlier) 찾기 환율 데이터에 이상치(outlier)로 의심되는 값들이 1997년..