[확률과 통계적 추론] 8-2. 평균에 대한 가설 검정
·
Statistics/Mathmetical Statistics
안녕하세요. 이번 포스팅에서는 이전 포스팅에서 정리한 가설검정에 대한 이해를 바탕으로 평균에 대한 가설 검정에 대해 알아보도록 하겠습니다. 이번 포스팅에서는 평균에 대한 구간추정(https://moogie.tistory.com/132), 두 평균의 차이에 대한 구간추정(https://moogie.tistory.com/133), 가설검정(https://moogie.tistory.com/138)의 내용을 많이 포함하고 있습니다. 1. Underlying Distribution이 정규분포이고, 분산($\sigma^2$)을 아는 경우 (귀무가설 $H_0 : u = u_0$) $H_1 : u > u_0$인 경우 기각역 : {$\overline{x}$ | $\overline{x} \geq u_0 + z_{\alph..
[확률과 통계적 추론] 8-1. 가설검정(Tests of Statistical Hypothesis )
·
Statistics/Mathmetical Statistics
안녕하세요. 이번 포스팅에서는 가설검정(Hypothesis Test)에 대해 알아보겠습니다. 가설검정은 쉽게 생각하면 가설이 참인지 거짓인지 판별하는 통계적 절차로, 일반적으로 참이거나 사실이라고 생각되는 명제를 귀무가설(Null Hypothesis)로 $H_0$라고 표기합니다. 이와 반대로 증명하고자 하는 가설을 대립가설(Alternative Hypothesis)라고 하며 $H_1$이라고 표기합니다. 공장에서 물건을 생산하는데 새로운 기술을 도입했다고 생각해봅시다. 기존 생산량이 100이였을때, 새로운 기술을 도입하고 생산량이 120이 되었다고 생각한 기술자가 통계적 가설검정을 진행한다고 했을 때, 귀무가설은 "생산량이 100이다"로 놓을 수 있으며 대립가설로는 "생산량이 120이다." 또는 "생산량이..
[확률과 통계적 추론] 7-6. 회귀분석 - 신뢰구간과 예측구간
·
Statistics/Mathmetical Statistics
안녕하세요. 이번 포스팅에서는 회귀분석에서의 신뢰구간과 예측구간에 대해 알아보도록 하겠습니다. 회귀분석을 다른 포스팅은 다수 있으나, 수리통계학에서 다룬 내용은 회귀분석 가정과 계수 추정에 관한 포스팅을 참고 해주시면 좋을 것 같습니다. (링크 : https://moogie.tistory.com/127 ) 이전 포스팅에서 구한 회귀계수의 추정치와 분포에 따라서 다음과 같이 분산에 대한 ML 추정량 $\hat{\sigma^2}$는 아래와 같은 분포를 따릅니다. $$\frac{n\hat{\sigma^2}}{\sigma^2} \sim \chi^2(n-2)$$ 위 증명에서 분산의 ML 추정량은 편향추정량(Biased Estimator)이므로 비편향추정량으로 만들기 위해서 $\sum_{i=1}^{n}\frac{(..
[확률과 통계적 추론] 7-5. Distribution-Free CI for percentile
·
Statistics/Mathmetical Statistics
안녕하세요. 이번 포스팅에서는 분위수의 신뢰구간을 구하는 방법에 대해 알아보겠습니다. 이전 포스팅에서는 모평균, 모비율에 대한 신뢰구간을 구했었는데, 이때 표본의 Underlying Distribution를 가정하였습니다. (모평균은 정규분포, 혹은 CLT를 적용할때는 심하게 쏠린 형태가 아니라고 가정, 모비율은 이항분포 및 초기하분포 가정) 분포에 대해 가정하고 신뢰구간을 구한 것과 다르게 이번에는 순서통계량을 사용하여 분위수의 신뢰구간을 구합니다. 본문에 앞서, 순서통계량에 관한 포스팅 (https://moogie.tistory.com/125)에서는 Underlying Distribution로 특정 분포를 가정하지 않고 연속형이라는 가정했을 때, 순서통계량 $Y_{(n+1)p}$을 분위수 $\pi_p..
[확률과 통계적 추론] 7-4. Sample Size
·
Statistics/Mathmetical Statistics
안녕하세요. 이번 포스팅에서는 표본의 크기를 결정하는 방법에 대해 정리하였습니다. 유의수준(Significant Level) $\alpha$, 최대 한계 오차 $\varepsilon$이 주어지면 표본의 최소 크기를 결정할 수 있습니다. 따로 공식으로 나타내지는 않았지만 유의수준, 한계 오차, 표본의 크기 중 2가지만 주어져도 나머지 하나를 결정할 수 있습니다. 1. 모평균 $\mu$가 $[\overline{X} \pm \varepsilon]$에 포함되기 위한 표본수 $n \geq \frac{z_{\alpha/2}^2\sigma^2}{\varepsilon^2}$ 천장함수(Ceiling function)을 이용해 ⌈$\frac{z_{\alpha/2}^2\sigma^2}{\varepsilon^2}$⌉와 같이 ..
[확률과 통계적 추론] 7-3. 비율에 대한 구간추정
·
Statistics/Mathmetical Statistics
안녕하세요. 이번 포스팅에서는 비율에 대한 구간 추정에 대해 알아보겠습니다. 앞선 평균에 대한 구간 추정 및 두 평균의 차이에 대한 구간 추정과 같이 비율에 대한 구간 추정은 실생활에서 많이 사용되고 있는데요. 선거를 생각해봅시다. 만약 특정 후보자의 실제 지지율이 $p$일때, 여론조사에서 $n$명의 사람을 조사한다고 한다면 투표수 $Y$는 이항분포 $B(n, p)$를 따른다는 할 수 있습니다. 이때, 후보자는 지지율이 51%일때, 지지율에 대한 신뢰 구간에 대해 알고 싶을 수 있습니다. 왜냐하면 지지율의 신뢰구간이 [30%, 72%]랑 [50.5%, 51.5%]인 경우에 전략을 다르게 해야하기 때문입니다. 참고로 아래에서 비율에 대한 추정량으로 $\frac{Y}{n}$을 사용하는데 이는 Maximum ..
[확률과 통계적 추론] 7-2. 두개의 평균 차이에 대한 구간추정
·
Statistics/Mathmetical Statistics
안녕하세요. 이번 포스팅에서는 두 개의 평균 차이에 대한 구간 추정에 대해 정리하였습니다. 1. 모분산 $\sigma^2_X$, $\sigma^2_Y$가 알려져 있을 때, 두 평균의 차이에 대한 신뢰구간 $100(1-\alpha)$% 신뢰구간 : $[\overline{X}-\overline{Y} \pm z_{\alpha/2}\sqrt{\frac{\sigma_X^2}{n}+{\frac{\sigma_Y^2}{m}}}]$ 가정 : $X \sim N(\mu_X, \sigma^2_X), Y \sim N(\mu_Y, \sigma^2_Y)$이고 서로 독립일 때 (단, 표본의 수는 각각 n, m개) 2. 모분산 $\sigma^2_X$, $\sigma^2_Y$가 알려져 있지 않을 때, 두 평균의 차이에 대한 근사 신뢰구..
[확률과 통계적 추론] 7-1. 평균에 대한 구간추정
·
Statistics/Mathmetical Statistics
안녕하세요. 이번 포스팅에서는 평균에 대한 구간 추정에 대해 알아보겠습니다. 그동안 모집단의 평균(혹은 분포)가 주어진 것과 다르게 실생활에서는 모집단의 평균이 무슨 값인지 알기 어렵습니다. 예를 들면, 후보자에 대한 지지율, 전구의 평균 수명, 공정라인의 불량률, 혹은 대학생의 평균 키와 같은 경우입니다. 앞 예시에서 실제 평균 값은 바로 구하기 어려운데요. 이는 시간에 따라서 실제 평균이 달라지기도 하지만, 전구의 평균 수명을 구하기 위해 모든 전구를 조사할 수도 없는 노릇이기 때문입니다. 따라서, 저희는 표본을 통해서 평균을 추정해야 하고 MLE(6-3, https://moogie.tistory.com/126)를 통해서 모수에 대한 좋은 추정치를 제공할 수 있음을 알고 있습니다. 다만 MLE를 통한..