안녕하세요. 이번 포스팅에서는 T 분포에 대해 알아보도록 하겠습니다.
T분포는 정규분포, 카이제곱분포, F분포 만큼이나 많이 사용되는 분포인 만큼 잘 이해하고 있으면 추후 통계적 추론에서 큰 도움이 됩니다.
T 분포(T Distribution)
- 두 독립인 확률변수가 $U \sim \chi^2(r)$, $Z \sim N(0, 1)$을 만족할 때, $T = \frac{Z}{\sqrt{U/r}}$의 분포
- $f_X(x) = \frac{\Gamma(\frac{r+1}{2})}{\sqrt{\pi r}\Gamma(\frac{r}{2})} \frac{1}{(1+\frac{x^2}{r})^{\frac{r+1}{2}}}$ (for $-\infty < x < \infty$)
- Notation : $X \sim T(r)$
- Mean : $E[X] = 0$ (단, r>1인 경우)
- Variance : $Var[X] = \frac{r}{r-2}$ (단, r>2인 경우)
우선 확률밀도함수(PDF)는 아래와 같이 유도할 수 있습니다.
확률분포함수나 아래 그래프에서 보이는 것 처럼 T분포는 좌우 대칭이라 자유도 상관없이 평균은 0이라고 생각할 수 있지만 자유도가 1인 T분포는 코시분포(Cauchy Distribution)라 평균을 정의할 수 없습니다.
(참고 https://stats.stackexchange.com/questions/36027/why-does-the-cauchy-distribution-have-no-mean)
평균과 분산보다 T분포에서 중요한 점은 아래 그래프와 같이 T분포는 정규분포와 모양이 유사하나 꼬리가 두껍다는 특징을 가지고 있다는 것입니다. 그리고 자유도가 커질수록 정규분포와 유사해진다는 점 체크하면 좋을 것 같습니다!
library(tidyverse)
tibble(x = seq(-3,3,by=0.01),
normal = dnorm(x=x),
freedom1 = dt(x=x, df=1),
freedom3 = dt(x=x, df=3),
freedom5 = dt(x=x, df=5),
freedom10 = dt(x=x, df=10)) %>%
pivot_longer(cols = c(contains("freedom"), normal), names_to = "freedom") %>%
mutate(freedom=fct_reorder(freedom, value) %>% fct_rev()) %>%
ggplot(mapping=aes(x=x, y=value)) + geom_line(aes(color = freedom))
또한, 저번 포스팅에서 $Z = \frac{\overline{X}-u}{\sigma / \sqrt{n}}$, $U = \frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)$이고 T분포의 정의에 따라 $T = \frac{Z}{\sqrt{U/(n-1)}} = \frac{\frac{\overline{X}-u}{\sigma / \sqrt{n}}}{\sqrt{\frac{(n-1)S^2}{\sigma^2}/(n-1)}} = \frac{\overline{X}-u}{S/\sqrt{n}} \sim T(n-1)$을 만족합니다.
$$\frac{\overline{X}-u}{S/\sqrt{n}} \sim T(n-1)$$
$$\frac{\overline{X}-u}{\sigma/\sqrt{n}} \sim N(0,1)$$
식을 보면 분모에 표본분산이 들어간 경우 T분포, 모분산이 들어간 경우 Z분포를 따르는 것을 확인할 수 있습니다.
참고로 확률분포함수가 심각하게 복잡해서 저도 외우고 있지는 않습니다.. 대학 다니면서 T분포의 확률분포함수 쓰라는 시험 본 적이 없는 것 같네요
'Statistics > Mathmetical Statistics' 카테고리의 다른 글
[확률과 통계적 추론] 5-6. 중심극한정리(Central Limit Theorem) (0) | 2024.01.19 |
---|---|
[확률과 통계적 추론] 10. 분포 정리 (0) | 2024.01.16 |
[확률과 통계적 추론] 5-5.2 표본평균과 표본분산 관계 with Normal distribution (1) | 2024.01.15 |
[확률과 통계적 추론] 5-5.1 정규분포와 관련한 함수 (0) | 2024.01.15 |
[확률과 통계적 추론] 5-4. 적률생성함수 기법 (2) | 2024.01.11 |