엑셀통계 110

엑셀에서 T 임계값(T Critical Value) 구하기

T-검정(T-test)을 할 때 T 통계량을 구한다. 그리고 구한 T 통계량(T statistics)을 T 임계값(T Critical Value)과 비교하여 통계적 유의미성 여부를 판별한다. T 통계량의 절댓값이 T 임계값(T Critical Value)보다 크다면 그 검정 결과는 통계적으로 유의미하다고 한다. T 임계값(T Critical Value) T 분포표(T distribution table)에서 또는, 통계 프로그램들을 통해서 구할 수 있다. T 임계값(T critical value) 구하기 유의 수준(significance level) 정하기 0.01, 0.05, 0.1이 일반적이다. 자유도(degrees of freedom) 테스트 타입(one tailed or two tailed) 엑셀에..

엑셀에서 카이제곱 임계값(Chi-Square Critical Value)구하기

카이제곱 검정(Chi-Square Test)을 할 때 카이제곱 통계량을 구한다. 그리고 구한 카이제곱 통계량(Chi-Square statistics)을 카이제곱 임계값(Chi-Square Critical Value)과 비교하여 통계적 유의미성 여부를 판별한다. 카이제곱 통계량이 카이제곱 임계값(Chi-Square Critical Value)보다 크다면 그 검정 결과는 통계적으로 유의미하다고 한다. 카이제곱 임계값(Chi-Square Critical Value) 카이제곱 분포표(Chi-Square distribution table)에서 또는, 통계 프로그램들을 통해서 구할 수 있다. 카이제곱 임계값(Chi-Square critical value) 구하기 유의 수준(significance level) 정하기..

엑셀에서 F-임계값(F Critical Value)구하기

F 검정을 시행하게 되면 F 통계량을 얻기 된다. 그리고 F 검정(F-test)의 통계적 가치 검정을 위해서 F 임계값(F critical value)과 비교한다. F 통계량이 F 임계값(F critical value) 보다 크다면 통계적으로 유의미하다. F 임계값(F critical value)은 F값 분포 테이블(F distribution table)에서 찾을 수 있다. 또는 인터넷에서 F 임계값(F critical value) 프로그램을 찾아볼 수 있다. F 임계값(F critical value)구하기 유의 수준(significance level) 정하기 0.01, 0.05, 0.1이 일반적이다. 분자 자유도(numerator degrees of freedom) 분모 자유도(denominator d..

엑셀에서 균일분포(Uniform Distribution)구하기

균일 분포(Uniform Distribution)는 주어진 a와 b 사이 구간(invertal)에서 모든 값에 확률분포가 같은 분포다. 주어진 a와 b 사이 균일분포(uniform distribution)의 확률(probability)은 다음과 같이 구해진다. P(균일 확률) = (x2 – x1) / (b – a) ※ 균일분포(Uniform distribution)의 특징 평균: μ = (a + b) / 2 분산: σ^2 = (b – a)^2 / 12 표준편차: σ = √σ2 예시: 엑셀에서 균일분포(Uniform distribution) 구하기 예시 1: 버스 5050에 배차 간격은 20분이다. 지금 당신이 버스 정류장에 도착 막 도착했다. 버스가 8분 안에 올 확률을 얼마일까? 해결책: a(최소 범위..

엑셀에서 삼각분포(Triangular Distribution) 구하기

삼각 분포(triangular distribution)는 연속 확률분포(continuous probability distribution)로 확률분포가 삼각형 모양을 한다. 최솟값 a 최댓값 b 피크값 c 삼각 분포(triangular distribution)는 PDF와 CDF 형태가 있다. PDF: CDF: 예시를 본다. 예시1: 레스토랑 판매 이번 주 레스토랑 최소 판매금액이, $10,000, 최고 판매금액이 $30,000, 그리고 대부분은 $25,000이었다. 이 레스토랑에서 하루에 $20,000 이하로 벌 확률은 얼마일까? 연속 분포 함수(continuous distribution function, CDF)의 공식으로 $20,000보다 낮은 확률을 찾을 수 있다. P(X < x) = (x-a)^2/..

엑셀에서 포아송분포(Poisson Distribution) 구하기

포아송 분포(Poisson distribution)는 통계에서 많이 쓰이는 분포이다. 엑셀에서 POISSON.DIST() 함수로 주어진 시간(Time-Interval) 동안 사건(event)이 일어나는 평균 횟수를 알고 있는 사건(event)에 대해서, 주어진 시간 동안(interval) 사건(event)이 몇 번이나 일어날지에 대한 확률을 구할 수 있다. POISSON.DIST(x, mean, cumulative) x: 주어진 시간동안 사건이 일어나는 횟수 mean: 주어진 시간동안 사건이 일어나는 평균 횟수 cumulative: TRUE는 누적확률을 반환, FALSE는 일어날 확률 반환 몇 가지 예시를 본다. 예시 1 자동차 딜러 A 씨는 한 달에 평균 3대의 차를 판다. A시가 한 달에 5대를 팔 ..

엑셀에서 이항분포(binomial distribution) 구하기

이항 분포(binomial distribution)는 통계(statistics)에서 가장 많이 쓰이는 분포중 하나다. 엑셀에서 이항분포(binomial distriubtion)와 관련된 내장 함수(built-in function) 들을 어떻게 사용하는지 알아본다. BINOM.DIST BINOM.DIST.RANGE BINOM.INV BINOM.DIST BINOM.DIST는 '주사위 던지기 확률 구하기'다.이미 확률이 정해진 사건(event)을 연속 시행을 n회 반복하므로서 사건이 일어날 확률(probability)을 구한다. BINOM.DIST(number_s, trials, probability_s_cumulative) number_s: 사건(event) 발생 trials: 전체 시행 횟수 probabi..

엑셀에서 경험 법칙(Empirical Rule) 적용하기.

통계에서 경험 법칙(Empirical Rule)은 68-95-99.7 법칙으로, 정규 분포(normal distribution)에서 적용된다. 68%의 데이터 값들이 1 표준편차 안에 들어간다. 95%의 데이터 값들이 2 표준편차 안에 들어간다. 99.7%의 데이터 값들이 3 표준편차 안에 들어간다. 엑셀에서 경험 법칙(Empirical Rule)을 적용해 본다. 엑셀에서 경험 법칙(Empirical Rule) 적용하기 정규분포(normal distribution)를 가지는 평균이 7, 표준편차가 2.2인 데이터 세트가 있다. 이 데이터에서 68%, 95%, 99.7% 의 범위 값들을 알아본다. 68% 데이터는 4.8~9.2 사이에 있다 95% 데이터는 2.6~11.4 사이에 있다. 99.7% 데이터는 ..

엑셀에서 t-분포(t-distribution) 그래프 그리기

t-분포는 연속 확률분포의 한 종류다. t-분포의 성질은 아래와 같다. 연속적이다. 종모양(bell-shaped)이다. '0'에서 대칭(symmetry)이다. 자유도 하나의 파마미터로 정의된다. 자유도(degrees of freedom)가 무한대(infite)로 갈수록 t-분포는 정규분포(normal distribution)에 수렴한다. t-분포는 표본의 크기가 크지 않은(n 차트 > 분산형(곡선이 있는 분산형)을 선택한다. 5. 그래프를 예쁘게 데코 한다. 그래프에서 x축 라인 값을 더블클릭하고 세로축 교차에서 축 값을 -5로 변경 그래프를 클릭하고 우측 상단에 나오는 '+'를 선택하여 차트 제목 제거, 축 이름 x-t, y-f(t)로 하고, 표시선을 제거할 수 있다. 여러 개의 t-분포 그래프 겹쳐 ..

엑셀에서 z-점수 p-value 구하기

많은 통계 가설 검정(hypothesis tests)에서 z-테스트를 사용한다. 그리고 z-테스트에서 구해진 p-value와 선택된 신뢰구간(confidentl interval)에 따른 알파 값(0.01, 0.05, 0.10)과 비교하여 가설의 기각 여부를 알 수 있다. 엑셀에서 z-점수를 통해 신뢰구간 95%에서 p-value를 구해본다. NORM.DIST(x, mean, standard_dev, cumulative) x : 구하고자 하는 z-점수 mean: 분포 평균, 정규분포(normal distribution)로 '0'으로 표시 standard_dev: 분포 표준편차, 정규분포(normal distribution)으로 '1'로 표시 cumulative: “TRUE”는 연속분포함수 변환 or “FA..