가설검정 16

엑셀에서 더빈-왓슨 검정(Durbin-Watson Test)하기

선형 회귀분석(linear regression)에 핵심 전제는 오차항(residuals)이 서로 독립적이어야 한다는 것이다. 오차항(residuals)이 독립인지 확인하는 방법 중, 더빈-왓슨 검정(Durbin-Watson Test)이 있다. 더빈-왓슨 검정(Durbin-Watson Test)을 통해서 자기 상관(autocorrelation)에 대해서 검정할 수 있다. 더빈-왓슨 검정(Durbin-Watson Test)은 아래의 귀무가설(null hypothesis)을 가진다. 귀무가설(null hypothesis): H0 = 오차항(residuals) 간에 관계는 없다. 대립가설(alternative hypothesis): Ha = 오차항(residuals) 간에 자기 상관(autocorrelation..

엑셀에서 신뢰구간(Confidence Interval) 구하기

신뢰구간(Confidence Interval) 안에 값은 모수(population parameter)를 포함하고 있다. 신뢰구간(confidence interval)은 아래에 공식으로 계산한다. 신뢰구간(Confidence Interval) = (point estimate) +/- (critical value)*(표준 오차) 위의 공식은 신뢰구간(confidence interval)의 상한 값(uppter bound)과 하한 값(lower bound)을 구한다. 어떻게 신뢰구간(confidence interval)을 구하는지 단계별로 알아본다. 1. 평균의 신뢰구간(confidence interval) 2. 평균차이의 신뢰구간(confidence interval) 3. 비율의 신뢰구간(confidence..

엑셀에서 상관계수 p-값(P-value for a correlation coefficient) 구하기

두 변수 간에 관계를 알고 싶을 때 쓰는 방법 중 하나로, 피어슨 상관계수(Pearson correlation coefficient)를 구하는 방법이 있다. 피어슨 상관계수(Pearson correlation coefficient)는 두 변수간 선형 관계를 측정하는 수치다. 피어슨 상관계수(Pearson correlation coefficient)는 -1에서 1사이에 값을 가진다. -1 두 변수는 완벽하게 음(-)의 선형 관계가 있다. 0 두 변수간 선형 관계가 없다 1 두 변수는 완벽하게 양(+)의 선형 관계가 있다. 피어슨 상관계수(Pearson correlation coefficient)값이 통계적으로 유의미한지 검증하기 위해서, 피어슨 상관계수(Pearson correlation coefficie..

엑셀에서 쟈크베라의 정규성 검정(Jarque-Bera Normality Test)하기

쟈크베라의 검정(Jarque-Bera Test)은 적합도(Goodness-of-ift) 검정이다. 쟈크베라의 검정(Jarque-Bera Test)은 왜도(Skewness)와 첨도(Kurtosis)가 정규분포(normal distribution)로 보기에 적합한지에 대한 적합도(Goodness-of-fit) 검정에 사용한다. 쟈크베라의 검정(Jarque-Bera Test)에 결과값은 언제나 양의 숫자다. 그리고 결괏값이 0에서 멀리 떨어진 값이 나오면, 그때는 정규분포(normal distiribuiton)에 적합하지 않다고 판정한다. 쟈크베라의 검정(Jarque-Bera Test)의 통계량은 아래 식으로 구한다. JB =(n/6) * (S² + (C²/4)) n: 관찰된 표본 수 S: 표본의 왜도(ske..

엑셀에서 등분산 검정(Levene's Test) 하기

등분산 검정(Levene's Test)은 두 그룹 또는 두 그룹 이상이 서로 같은 분산을 가지고 있느냐/없느냐를 판별할 때 사용한다. 등분산 검정(Levene's Test)는 통계 분석에서 빈번하게 사용된다. 대부분에 통계 분석은 서로 다른 그룹 간에 분산이 같다고 가정을 하고 분석을 하기 때문에 등분산 검정(Levene's Test)을 선행하여 실제 같은 분산을 가졌다고 할 수 있는지 판별한다. 아래 예시를 따라서 엑셀에서 등분산 검정(Levene's Test)을 실습해본다. 예시: 엑셀에서 등분산 검정(Levene's Test) 연구자들은 서로 다른 3개의 비료를 개발했다. 3개의 비료의 효과에 대해 알아보고 싶다. 그래서 같은 식물을 3개의 서로 다른 비료를 이용해서 키운다면 한 달 후 식물의 성장..

엑셀에서 오즈비(Odds Ratio)와 상대 위험도(Relative Risk) 구하기

아래와 같은 2:2 테이블을 분석할 때 이따금씩 오즈비(Odds Ratio)와 상대 위험도(Relative Risk)를 사용한다. 오즈비(Odds Ratio)는 실험군에서 발생한 사건과 사건 비발생에 비와 대조군에서 발생한 사건 발생과 사건 비발생의 비를 나타낸다. 오즈비(Odds Ratio) = (A/B) / (C/D) = (A*D) / (B*C) 상대 위험도(Relative Risk)는 실험군에서 사건이 발생할 확률분에 대조군에서 사건이 발생할 확률의 비를 나타낸다. 상대 위험도(Relative Risk) = [A/(A+B)] / [C/(C+D)] 아래 설명에 따라 엑셀에서 오즈비(Odds Ratio)와 상대 위험도(Relative Risk)를 구해본다. 오즈비(Odds Ratio)와 상대 위험도(R..

엑셀에서 효과크기(Cohen's D) 구하기

두 데이터 세트, 또는 두 그룹 간에 차이가 있는지 없는지 확인하고 싶을 때 가설 검증(hypothesis test)을 한다. 그 결과 값으로 p-값(p-value) 계산한다. 그리고 p-값(p-value)과 유의 수준(significance level)과 비교하여 가설의 기각 여부를 판별하여, 두 세이터 세트, 또는 두 그룹 간에 차이가 있는지 없는지 통계적을 판별할 수 있다. p-값(p-value)으로 정성적으로 두 그룹간에 차이가 있고/없고를 알 수 있다면, 효과 크기(Cohen's D)는 실제로 차이에 정량 값을 구한다. 효과 크기(effect size)를 구하는 방법은 여러 가지가 있지만, Cohen's D가 가장 많이 쓰이고 있다. Cohen’s D = (x1 – x2) / pooled SD ..

엑셀에서 상관계수 검정(Correlation Test) 하기

두 변수(two variables) 간에 관계를 파악하기 위해서 피어슨 상관계수(pearson correlation coefficient)를 이용한다. 피어슨 상관계수(pearson correlation coefficient)는 서로 다른 두 변순(two variables) 간 선형 관계를 지시하는 통계 값이다. 피어슨 상관계수(pearson correlation coefficient)는 -1에서 1의 범위를 갖는다. -1: 두 변수간 완벽한 음에 상관관계가 있다. 0 두 변순간 선형관계가 없다. 1: 두 변수간 완벽한 양에 상관관계가 있다. 피어슨 상관계수(pearson correlation coefficient)가 사용하기에 적합한지 확인하는 방법으로 상관계수 검정(Correlation Test)을 ..

엑셀에서 이항검정(Binomial Test) 하기

이상 검정(binomial test)은 관측한 확률이 예상한 확률과 같은지 안 같은지 확인하는 데 사용한다. 예를들어, 주사위를 24번 던졌다. 1/6의 확률로 3이 4번 나올 것이라 예상했다. 그런데 실제로 3이 6번 나왔다. 그렇다면 이 주사위는 3이 더 많이 나오도록 편중되어 있는 것일까?? 위 질문에 이상검정(binomial test)을 통해서 답을 할 수 있다. 엑셀에서, 이상 검정(binomial은 엑셀에 내장 함수(built-in function)를 이용해서 쉽게 구할 수 있다. BINOM.DIST(number_s, trials, probability_s, cumulative) number_s: 성공한 횟수 trials: 전체 시도한 횟수 probability_s: 각 시행마다 성공할 확률 ..

엑셀에서 윌콕슨 부호순위 검정(Wilcoxon Signed Rank Test) 하기

윌콕슨 부호 순위 검정(Wilcoxon Signed Rank Test)은 두 모집단 평균 간에 차이가 있는지 없는지 판별할 때 사용한다. 여기까지 보면 대응표본 t-검정(paired samples t-test)과 같아 보이지만, 대응표본 t-검정(paired samples t-test)에서는 모집단의 분포가 정규분포(normal distribution)로 가정한다. 만약 모집단이 정규분포(normal distribution)로 가정할 수 없을 경우, 윌콕슨 부호순위 검정(Wilcoxon Signed Rank Test)을 사용하게 된다. 단계별로 윌콕슨 부호순위 검정(Wilcoxon Signed Rank Test) 시행한다. 1단계: 데이터 생성 자동차 엔지니어는 기존의 연료와 개질 연료가 자동차에 평균 ..