[확률과 통계적 추론] 5-5.3 T 분포 (T Distribution)

2024. 1. 15. 19:58·Statistics/Mathmetical Statistics

 

 

안녕하세요. 이번 포스팅에서는 T 분포에 대해 알아보도록 하겠습니다. 

T분포는 정규분포, 카이제곱분포, F분포 만큼이나 많이 사용되는 분포인 만큼 잘 이해하고 있으면 추후 통계적 추론에서 큰 도움이 됩니다.

 

T 분포(T Distribution)

  • 두 독립인 확률변수가 $U \sim \chi^2(r)$, $Z \sim N(0, 1)$을 만족할 때,  $T = \frac{Z}{\sqrt{U/r}}$의 분포
  • $f_X(x) = \frac{\Gamma(\frac{r+1}{2})}{\sqrt{\pi r}\Gamma(\frac{r}{2})} \frac{1}{(1+\frac{x^2}{r})^{\frac{r+1}{2}}}$   (for $-\infty < x < \infty$)
  • Notation : $X \sim T(r)$
  • Mean : $E[X] = 0$ (단, r>1인 경우)
  • Variance : $Var[X] = \frac{r}{r-2}$ (단, r>2인 경우)

 

우선 확률밀도함수(PDF)는 아래와 같이 유도할 수 있습니다.

 

 

확률분포함수나 아래 그래프에서 보이는 것 처럼 T분포는 좌우 대칭이라 자유도 상관없이 평균은 0이라고 생각할 수 있지만 자유도가 1인 T분포는 코시분포(Cauchy Distribution)라 평균을 정의할 수 없습니다.

(참고 https://stats.stackexchange.com/questions/36027/why-does-the-cauchy-distribution-have-no-mean)

 

평균과 분산보다 T분포에서 중요한 점은 아래 그래프와 같이 T분포는 정규분포와 모양이 유사하나 꼬리가 두껍다는 특징을 가지고 있다는 것입니다. 그리고 자유도가 커질수록 정규분포와 유사해진다는 점 체크하면 좋을 것 같습니다!

library(tidyverse)
tibble(x = seq(-3,3,by=0.01),
       normal = dnorm(x=x),
       freedom1 = dt(x=x, df=1),
       freedom3 = dt(x=x, df=3),
       freedom5 = dt(x=x, df=5),
       freedom10 = dt(x=x, df=10)) %>% 
  pivot_longer(cols = c(contains("freedom"), normal), names_to = "freedom") %>% 
  mutate(freedom=fct_reorder(freedom, value) %>% fct_rev()) %>%
  ggplot(mapping=aes(x=x, y=value)) + geom_line(aes(color = freedom))

 

또한, 저번 포스팅에서 $Z = \frac{\overline{X}-u}{\sigma / \sqrt{n}}$, $U = \frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)$이고 T분포의 정의에 따라 $T = \frac{Z}{\sqrt{U/(n-1)}} = \frac{\frac{\overline{X}-u}{\sigma / \sqrt{n}}}{\sqrt{\frac{(n-1)S^2}{\sigma^2}/(n-1)}} = \frac{\overline{X}-u}{S/\sqrt{n}} \sim T(n-1)$을 만족합니다. 

$$\frac{\overline{X}-u}{S/\sqrt{n}} \sim T(n-1)$$

$$\frac{\overline{X}-u}{\sigma/\sqrt{n}} \sim N(0,1)$$

식을 보면 분모에 표본분산이 들어간 경우 T분포, 모분산이 들어간 경우 Z분포를 따르는 것을 확인할 수 있습니다.

 

참고로 확률분포함수가 심각하게 복잡해서 저도 외우고 있지는 않습니다..  대학 다니면서 T분포의 확률분포함수 쓰라는 시험 본 적이 없는 것 같네요

'Statistics > Mathmetical Statistics' 카테고리의 다른 글

[확률과 통계적 추론] 5-6. 중심극한정리(Central Limit Theorem)  (0) 2024.01.19
[확률과 통계적 추론] 10. 분포 정리  (0) 2024.01.16
[확률과 통계적 추론] 5-5.2 표본평균과 표본분산 관계 with Normal distribution  (1) 2024.01.15
[확률과 통계적 추론] 5-5.1 정규분포와 관련한 함수  (0) 2024.01.15
[확률과 통계적 추론] 5-4. 적률생성함수 기법  (2) 2024.01.11
'Statistics/Mathmetical Statistics' 카테고리의 다른 글
  • [확률과 통계적 추론] 5-6. 중심극한정리(Central Limit Theorem)
  • [확률과 통계적 추론] 10. 분포 정리
  • [확률과 통계적 추론] 5-5.2 표본평균과 표본분산 관계 with Normal distribution
  • [확률과 통계적 추론] 5-5.1 정규분포와 관련한 함수
임파카
임파카
[ML & Statistics] 모바일 버전에서 수식 오류가 있어 PC 환경에서 접속하는 것을 권장합니다.
  • 임파카
    무기의 스탯(Stat)
    임파카
  • 전체
    오늘
    어제
    • Study (149)
      • Data Science (44)
        • Modeling (18)
        • Manipulation (21)
        • Visualization (4)
      • Statistics (59)
        • Mathmetical Statistics (53)
        • Categorical DA (1)
      • Web Programming (17)
      • AI (26)
        • Machine Learning (16)
        • Deep Learning (10)
      • 활동 및 프로젝트 (3)
  • 최근 글

  • hELLO· Designed By정상우.v4.10.3
임파카
[확률과 통계적 추론] 5-5.3 T 분포 (T Distribution)
상단으로

티스토리툴바