[확률 및 랜덤변수] 4. Random Vector

2020. 4. 22. 09:47

728x90

1. Random Vector

$−∞)=FX,Y(−∞,y)=FX,Y(x,−∞)=0F_{X, Y}(-\infty,\ -\infty)=F_{X,Y}(-\infty,y)=F_{X,Y}(x,-\infty)=0$
$FX,Y(∞,∞)=1F_{X,Y}(\infty,\infty)=1$
$0≤FX,Y(x,y)≤10\leq F_{X,Y}(x,y)\leq1$
$F_{X,Y}$ 는 x, y의 범위 내에서 감소하지 않음
$y1<Y≤y2)P(x_1<X\leq x_2,\ y_1<Y\leq y_2)$
$=FX,Y(x2,y2)+FX,Y(x1,y1)−FX,Y(x1,y2)−FX,Y(x2,y1)≥0=F_{X, Y}(x_2, y_2)+F_{X,Y}(x_1,y_1)-F_{X,Y}(x_1,y_2)-F_{ X,Y}(x_2,y_1)\geq0$
Marginality : $FX,Y(x,∞)=FX(x), FX,Y(∞,y)=FY(y)F_{X,Y}(x,\infty)=F_X(x),\ F_{X,Y}(\infty,y)=F_Y(y)$ $F_{X, Y} (x, \infty) = F_{X} (x), F_{X, Y} (\infty, y) = F_{Y} (y)$
- 랜덤벡터 CDF $F_{X, Y}(x,y)$ 에서 CDF $F_X(x)$ , $F_Y(y)$ 를 얻을 수 있음
- 하지만 $F_X(x)$ , $F_Y(y)$ 에서 $F_{X, Y}(x,y)$ 계산은 불가
- 예외 : X, Y가 확률적으로 독립된 상태일 때
  $P (A, B) = P (A) P (B)$ , $F_{X,Y}(x,y)=F_X(x)F_Y(y)$

결합 밀도 $fX,Y(x,y)≡∂2FX,Y(x,y)∂x∂yf_{X, Y}(x,y)\equiv\frac{\partial^2F_{X,Y}(x,y)}{\partial x\partial y}$ $f_{X, Y} (x, y) \equiv \frac{\partial ^{2} F _{X, Y} ( x , y )}{\partial x \partial y}$
- Discrete R.V.에서는 델타함수의 식으로 표현
- $fX,Y=(x,y)=∑n=1N∑m=1MP(xn,ym)δ(x−xn)δ(y−yn)f_{X,Y}=(x,y)=\sum_{n=1}^N\sum_{m=1}^MP(x_n,y_m)\delta(x-x_n)\delta(y-y_n)$
Properties
1. $∫−∞∞∫−∞∞fX,Y(x,y)dydx=1\int^\infty_{-\infty}\int^\infty_{-\infty}f_{X,Y}(x,y)dydx=1$
2. $FX,Y(x,y)=∫−∞x∫−∞yfX,Y(u,v)dvduF_{X,Y}(x,y)=\int^x_{-\infty}\int^y_{-\infty}f_{X,Y}(u,v)dvdu$
3. $FX(x)=∫−∞x∫−∞yfX,Y(u,v)dvduF_X(x)=\int^x_{-\infty}\int^y_{-\infty}f_{X,Y}(u,v)dvdu$
4. $P(x1<X≤x2,y1<Y≤y2)P(x_1<X\leq x_2,y_1<Y\leq y_2)$
  $=∫x1x2∫y1y2fX,Y(x,y)dydx=\int^{x2}_{x1}\int^{y2}_{y1}f_{X,Y}(x,y)dydx$
5. $fX(x)=∫−∞∞fX,Y(x,y)dyf_X(x)=\int^\infty_{-\infty}f_{X,Y}(x,y)dy$
- $f_{X,Y}(x,y)$ 에서 PDF $f_X(x)$ , $f_Y(y)$ 계산 가능
- 독립사건을 제외하고 $f_X(x)$ , $f_Y(y)$ 에서 $f_{X,Y}(x,y)$ 를 계산할 수는 없음

조건부 확률 $P(A∣B)≡P(A,B)P(B)P(A|B)\equiv\frac{P(A,B)}{P(B)}$
Conditional CDF $FX(x∣B)=P[(X≤x)∩B]P(B)F_X(x|B)=\frac{P[(X\leq x)\cap B]}{P(B)}$ $F_{X} (x ∣ B) = \frac{P [ ( X \leq x ) \cap B ]}{P ( B )}$
- 연속적인 랜덤변수 X, Y에 대해 $FX,Y(x∣Y=y)=P[(X≤x)∩[Y=y]]P(Y=y)F_{X,Y}(x|Y=y)=\frac{P[(X\leq x)\cap [Y=y]]}{P(Y=y)}$
- 연속적인 랜덤변수에서 $P (Y = y) = 0$ : 0/0형태로 나타나는 문제
- CDF 계산이 안될 경우 PDF식을 구한 후 적분
Conditional PDF $fX(x∣B)=dFX(x∣B)dxf_X(x|B)=\frac{dF_X(x|B)}{dx}$

$fY(y∣x)=fY(y)fX(x∣y)fX(x)f_Y(y|x)=\frac{f_Y(y)f_X(x|y)}{f_X(x)}$ $f_{Y} (y ∣ x) = \frac{f _{Y} ( y ) f _{X} ( x ∣ y )}{f _{X} ( x )}$
- $f_X(x)$ : 관찰된 것
- $f_Y(y|x)$ : 사후 확률
- $f_X(x|y)$ : likelihood - 인과관계
- $f_Y(y)$ : 사전 확률 - 실험 전 일반적인 확률
Marginalization : $fX(x)=∫−∞∞fX(x∣y)fY(y)dy=∫−∞∞fX,Y(x,y)dyf_X(x)=\int^\infty_{-\infty}f_X(x|y)f_Y(y)dy=\int^\infty_{-\infty}f_{X,Y}(x,y)dy$

독립적인 두 R.V. X,Y에 대해 W=X+Y를 정의
$FW(w)=F(W≤w)=F(X+Y≤w)F_W(w)=F(W\leq w)=F(X+Y\leq w)$
$∫−∞∞∫−∞W−YfX,Y(x,y)dxdy\int^\infty_{-\infty}\int^{W-Y}_{-\infty}f_{X,Y}(x,y)dxdy$
(X, Y가 indep.) $∫−∞∞fY(y)∫−∞W−YfX(x)dxdy\int^\infty_{-\infty}f_Y(y)\int^{W-Y}_{-\infty}f_X(x)dxdy$
$fW(w)=dFW(w)dwf_W(w)=\frac{dF_W(w)}{dw}$
$=∫−∞∞fY(y)fX(w−y)dy=∫−∞∞fX(x)fY(w−x)dx=\int^\infty_{-\infty}f_Y(y)f_X(w-y)dy=\int^\infty_{-\infty}f_X(x)f_Y(w-x)dx$
$f_X(w)*f_Y(w)$ : Convolution

충분히 많은 시행횟수에 대해 확률분포는 Gaussian 형태를 띄게 됨
- $Y_N=X_1+X_2+...+X_N$ 의 N이 무한으로 갈 때 $f_{Y_N}$ 은 gaussian 형태
평균이 $μ\mu$ $μ$ , 분산이 $σ2\sigma^2$ $σ^{2}$ 인 n개의 iid(independent, identical) R.V.의 합을 $S_{n}$ 으로 정의할 때
- 평균 0, 분산 1(unit-variance)인 랜덤변수 $ZN=Sn−nμσnZ_N=\frac{S_n-n\mu}{\sigma\sqrt{n}}$
- n이 무한으로 갈 때 $lim_{n\rarr\infty}P[Z_n\leq z]=\frac{1}{\sqrt{2\pi}}\int^z_{-\infty}exp[-\frac{x^2}{2}]dx$
- $S_n$ 의 평균 $E[S_n]=E[X_1]+E[X_2]+...+E[X_n]=n\mu$
- $S_n$ 의 분산 $E[(Z_n-n\mu)^2]=n\sigma^2$

728x90