안녕하세요. 이번 포스팅에서는 일변량 변수의 분포를 알고 있을 때, 변환된 변수의 분포를 구하는 방법 중 분포함수기법(Distribution Function Technique)에 대해 알아보겠습니다.
연속형 확률변수 $X$가 주어져 있으면 확률변수 $X$는 고유의 분포를 가지고 있어서 분포를 통해 평균과 분산 등 여러 통계값들을 계산할 수 있을 것 입니다. 그렇다면 $X$를 변환하여 구한 변수 $Y=u(X)$는 어떨까요? $Y$ 역시 확률변수이며 고유의 분포를 가지고 있는데요. 이때 아래와 같이 $Y$의 분포를 구하는 분포함수기법(Distribution Function Technique)에서는 $X$의 분포와, 누적함수분포(CDF)를 통해서 분포를 구할 수 있습니다.
$$F_Y(y) = Pr(Y<y) = Pr[u(X)<y] = Pr[X<u^{-1}(y)]$$
$$\therefore f_Y(y) = \frac{\mathrm{d}}{\mathrm{d} y}F_Y(y) = F_Y'(y)$$
아래 예시를 통해 어떻게 변환된 변수의 분포를 구하는지 알아봅시다.
아래와 같이 두번째 예시($\theta=0.2, \lambda=5$) 분포를 시뮬레이션을 통해서 시각화 하였습니다.
library(tidyverse)
n = 1e6
X = rexp(rate=5, n=n) # X~exp(lambda = 5)
Y = X^2
tibble(type = rep(c("Orignial", "Transform"), each=n),
value = c(X,Y)) %>%
ggplot(mapping=aes(x=value, fill = type)) + geom_density() +
facet_grid(~type) + lims(x=c(0,0.5))
'Statistics > Mathmetical Statistics' 카테고리의 다른 글
[확률과 통계적 추론] 5-1.3 분포를 이용한 난수 생성 (0) | 2024.01.07 |
---|---|
[확률과 통계적 추론] 5-1.2 Change-of-variable Technique (2) | 2024.01.07 |
[확률과 통계적 추론] 4-5. 이변량 정규분포 (0) | 2024.01.07 |
[확률과 통계적 추론] 4-4. 연속형 이변량 분포 (0) | 2024.01.04 |
[확률과 통계적 추론] 4-3.1 조건부분포와 상관계수의 관계 (2) | 2024.01.03 |