안녕하세요. 이번 포스팅에서는 5-2.1에서 배운 확장된 변수변환법을 사용하여 베타분포와 F분포의 PDF를 유도하려고 합니다.
1. 베타분포(Beta Distribution)
- 두 독립인 확률변수가 $X_1 \sim gamma(\alpha, \theta)$, $X_2 \sim gamma(\beta, \theta)$ 일때, $\frac{X_1}{X_1+X_2}$의 분포
- $f_X(x) = \frac{\Gamma(\alpha+\beta)}{\Gamma(\alpha) \Gamma(\beta)}x^{\alpha-1}(1-x)^{\beta-1}$ for $0<x<1$
- Notation : $X \sim Beta(\alpha, \beta)$
- Mean : $E[X] = \frac{\alpha}{\alpha + \beta}$
- Variance : $Var[X] = \frac{\alpha\beta}{(\alpha+\beta)^2(\alpha+\beta+1)}$
$f_X(x)$ 중에 $x^{\alpha-1}(1-x)^{\beta-1}$인 부분을 잘 살펴보면 베르누이 시행이나 이항분포의 PDF와 유사하다는 것을 알 수 있습니다.
여기서 $x$ 대신 확률을 나타내는 $p$를 대입해보면 $p^{\alpha-1}(1-p)^{\beta-1}$라는 식을 얻게되는데, 이는 $\alpha+\beta-2$번의 독립시행에서 성공이 $\alpha-1$번, 실패가 $\beta-1$번 나왔을 때, 확률 $p$에 대한 분포를 나타낸다고 볼 수 있습니다. (이항분포는 fixed $p$에 대해서 성공의 횟수를 나타내는 분포)
참고로, 확률밀도함수를 유도하는 방법은 아래와 같습니다.
2. F 분포 (F-Distribution)
- 두개의 확률변수 $U \sim \chi^2(r_1)$, $V \sim \chi^2(r_2)$가 서로 독립일 때, $F = \frac{U/r_1}{V/r_2}$의 분포
- $f_X(x) = \frac{\Gamma(\frac{r_1+r_2}{2})}{\Gamma(r_1/2) \Gamma(r_2/2)} * \frac{\frac{r_1}{r_2}^{\frac{r_1}{2}}*x^{\frac{r_1}{2}-1}}{(1+\frac{r_1}{r_2}x)^{(r_1+r_2)/2}}$
- Notation : $X \sim F(r_1, r_2)$
- Mean : $E(X) = \frac{r_2}{r_2-2}$
- Variance : $Var[X] = \frac{2r_2^2(r_1+r_2-2)}{r_1(r_2-2)^2(r_2-4)}$
또한 F분포의 특징으로는 $X \sim F(r_1, r_2)$일때, $\frac{1}{X} \sim F(r_2, r_1)$을 만족하며
아래와 같은 이유로 여러 집단의 평균을 비교하는 분산분석(Anova)또는 분산의 비교에 많이 사용되고 있습니다.
마지막으로, 확률밀도함수가 복잡하게 생기긴 했지만 생각보다 유도하는 과정 자체는 어렵지는 않습니다.
'Statistics > Mathmetical Statistics' 카테고리의 다른 글
[확률과 통계적 추론] 5-3. 확률표본(Random Sample) (1) | 2024.01.10 |
---|---|
[확률과 통계적 추론] 5-2.3 Box-Muller 변환과 시뮬레이션 (0) | 2024.01.09 |
[확률과 통계적 추론] 5-2.1 이변량 변수의 변환 (1) | 2024.01.09 |
[확률과 통계적 추론] 5-1.3 분포를 이용한 난수 생성 (0) | 2024.01.07 |
[확률과 통계적 추론] 5-1.2 Change-of-variable Technique (2) | 2024.01.07 |