728x90
1. Random Vector
- 랜덤벡터 = 랜덤변수의 곱집합(Cartesian Product)
- 2차원 벡터 (X, Y), 3차원 벡터 (X, Y, Z), ...
2. Joint Distribution
- 결합 분포 CDF FX,Y(x,y)≡P(X≤x, Y≤y)F_{X, Y}(x,y)\equiv P(X\leq x,\ Y\leq y)
- X, Y CDF의 교집합 : P(A∩B)P(A\cap B)
- Discrete R.V.의 경우 2개 축을 갖는 테이블로 표현
- Marginal Probability : 1개 축이 갖는 확률
- ex. P(X=x1)=∑j=13P(X=x1, Y=yj)=∑j=13p1jP(X=x_1)=\sum_{j=1}^3P(X=x_1,\ Y=y_j)=\sum_{j=1}^3p_{1j}
- (X, Y)의 확률계산은 랜덤변수 X, Y의 모든 정보(확률)을 알 때 가능
Joint CDF Property
- FX,Y(−∞, −∞)=FX,Y(−∞,y)=FX,Y(x,−∞)=0F_{X, Y}(-\infty,\ -\infty)=F_{X,Y}(-\infty,y)=F_{X,Y}(x,-\infty)=0
- FX,Y(∞,∞)=1F_{X,Y}(\infty,\infty)=1
- 0≤FX,Y(x,y)≤10\leq F_{X,Y}(x,y)\leq1
- FX,YF_{X,Y}는 x, y의 범위 내에서 감소하지 않음
- P(x1<X≤x2, y1<Y≤y2)P(x_1<X\leq x_2,\ y_1<Y\leq y_2)
=FX,Y(x2,y2)+FX,Y(x1,y1)−FX,Y(x1,y2)−FX,Y(x2,y1)≥0=F_{X, Y}(x_2, y_2)+F_{X,Y}(x_1,y_1)-F_{X,Y}(x_1,y_2)-F_{ X,Y}(x_2,y_1)\geq0
- Marginality : FX,Y(x,∞)=FX(x), FX,Y(∞,y)=FY(y)F_{X,Y}(x,\infty)=F_X(x),\ F_{X,Y}(\infty,y)=F_Y(y)
- 랜덤벡터 CDF FX,Y(x,y)F_{X, Y}(x,y)에서 CDF FX(x)F_X(x), FY(y)F_Y(y)를 얻을 수 있음
- 하지만 FX(x)F_X(x), FY(y)F_Y(y)에서 FX,Y(x,y)F_{X, Y}(x,y) 계산은 불가
- 예외 : X, Y가 확률적으로 독립된 상태일 때
P(A,B)=P(A)P(B)P(A,B)=P(A)P(B), FX,Y(x,y)=FX(x)FY(y)F_{X,Y}(x,y)=F_X(x)F_Y(y)
3. Joint Density
- 결합 밀도 fX,Y(x,y)≡∂2FX,Y(x,y)∂x∂yf_{X, Y}(x,y)\equiv\frac{\partial^2F_{X,Y}(x,y)}{\partial x\partial y}
- Discrete R.V.에서는 델타함수의 식으로 표현
- fX,Y=(x,y)=∑n=1N∑m=1MP(xn,ym)δ(x−xn)δ(y−yn)f_{X,Y}=(x,y)=\sum_{n=1}^N\sum_{m=1}^MP(x_n,y_m)\delta(x-x_n)\delta(y-y_n)
- Properties
- ∫−∞∞∫−∞∞fX,Y(x,y)dydx=1\int^\infty_{-\infty}\int^\infty_{-\infty}f_{X,Y}(x,y)dydx=1
- FX,Y(x,y)=∫−∞x∫−∞yfX,Y(u,v)dvduF_{X,Y}(x,y)=\int^x_{-\infty}\int^y_{-\infty}f_{X,Y}(u,v)dvdu
- FX(x)=∫−∞x∫−∞yfX,Y(u,v)dvduF_X(x)=\int^x_{-\infty}\int^y_{-\infty}f_{X,Y}(u,v)dvdu
- P(x1<X≤x2,y1<Y≤y2)P(x_1<X\leq x_2,y_1<Y\leq y_2)
=∫x1x2∫y1y2fX,Y(x,y)dydx=\int^{x2}_{x1}\int^{y2}_{y1}f_{X,Y}(x,y)dydx - fX(x)=∫−∞∞fX,Y(x,y)dyf_X(x)=\int^\infty_{-\infty}f_{X,Y}(x,y)dy
- fX,Y(x,y)f_{X,Y}(x,y)에서 PDF fX(x)f_X(x), fY(y)f_Y(y) 계산 가능
- 독립사건을 제외하고 fX(x)f_X(x), fY(y)f_Y(y)에서 fX,Y(x,y)f_{X,Y}(x,y)를 계산할 수는 없음
4. Conditional Distribution
- 조건부 확률 P(A∣B)≡P(A,B)P(B)P(A|B)\equiv\frac{P(A,B)}{P(B)}
- Conditional CDF FX(x∣B)=P[(X≤x)∩B]P(B)F_X(x|B)=\frac{P[(X\leq x)\cap B]}{P(B)}
- 연속적인 랜덤변수 X, Y에 대해 FX,Y(x∣Y=y)=P[(X≤x)∩[Y=y]]P(Y=y)F_{X,Y}(x|Y=y)=\frac{P[(X\leq x)\cap [Y=y]]}{P(Y=y)}
- 연속적인 랜덤변수에서 P(Y=y)=0P(Y=y)=0 : 0/0형태로 나타나는 문제
- CDF 계산이 안될 경우 PDF식을 구한 후 적분
- Conditional PDF fX(x∣B)=dFX(x∣B)dxf_X(x|B)=\frac{dF_X(x|B)}{dx}
Bayes' Theorem
- fY(y∣x)=fY(y)fX(x∣y)fX(x)f_Y(y|x)=\frac{f_Y(y)f_X(x|y)}{f_X(x)}
- fX(x)f_X(x) : 관찰된 것
- fY(y∣x)f_Y(y|x) : 사후 확률
- fX(x∣y)f_X(x|y) : likelihood - 인과관계
- fY(y)f_Y(y) : 사전 확률 - 실험 전 일반적인 확률
- Marginalization : fX(x)=∫−∞∞fX(x∣y)fY(y)dy=∫−∞∞fX,Y(x,y)dyf_X(x)=\int^\infty_{-\infty}f_X(x|y)f_Y(y)dy=\int^\infty_{-\infty}f_{X,Y}(x,y)dy
5. Sum of Independent R.V.
-
독립적인 두 R.V. X,Y에 대해 W=X+Y를 정의
-
FW(w)=F(W≤w)=F(X+Y≤w)F_W(w)=F(W\leq w)=F(X+Y\leq w)
∫−∞∞∫−∞W−YfX,Y(x,y)dxdy\int^\infty_{-\infty}\int^{W-Y}_{-\infty}f_{X,Y}(x,y)dxdy
(X, Y가 indep.) ∫−∞∞fY(y)∫−∞W−YfX(x)dxdy\int^\infty_{-\infty}f_Y(y)\int^{W-Y}_{-\infty}f_X(x)dxdy -
fW(w)=dFW(w)dwf_W(w)=\frac{dF_W(w)}{dw}
=∫−∞∞fY(y)fX(w−y)dy=∫−∞∞fX(x)fY(w−x)dx=\int^\infty_{-\infty}f_Y(y)f_X(w-y)dy=\int^\infty_{-\infty}f_X(x)f_Y(w-x)dx
=fX(w)∗fY(w)=f_X(w)*f_Y(w) : Convolution
7. Central Limit Theorem
- 충분히 많은 시행횟수에 대해 확률분포는 Gaussian 형태를 띄게 됨
- YN=X1+X2+...+XNY_N=X_1+X_2+...+X_N의 N이 무한으로 갈 때 fYNf_{Y_N}은 gaussian 형태
- 평균이 μ\mu, 분산이 σ2\sigma^2인 n개의 iid(independent, identical) R.V.의 합을 SnS_n으로 정의할 때
- 평균 0, 분산 1(unit-variance)인 랜덤변수 ZN=Sn−nμσnZ_N=\frac{S_n-n\mu}{\sigma\sqrt{n}}
- n이 무한으로 갈 때
- 의 평균
- 의 분산
728x90