728x90

 

1. Random Vector

  • 랜덤벡터 = 랜덤변수의 곱집합(Cartesian Product)
  • 2차원 벡터 (X, Y), 3차원 벡터 (X, Y, Z), ...

2. Joint Distribution

  • 결합 분포 CDF FX,Y(x,y)≡P(X≤x, Y≤y)F_{X, Y}(x,y)\equiv P(X\leq x,\ Y\leq y)
    • X, Y CDF의 교집합 : P(A∩B)P(A\cap B)
    • Discrete R.V.의 경우 2개 축을 갖는 테이블로 표현
      • Marginal Probability : 1개 축이 갖는 확률
      • ex. P(X=x1)=∑j=13P(X=x1, Y=yj)=∑j=13p1jP(X=x_1)=\sum_{j=1}^3P(X=x_1,\ Y=y_j)=\sum_{j=1}^3p_{1j}
    • (X, Y)의 확률계산은 랜덤변수 X, Y의 모든 정보(확률)을 알 때 가능

Joint CDF Property

  1. FX,Y(−∞, −∞)=FX,Y(−∞,y)=FX,Y(x,−∞)=0F_{X, Y}(-\infty,\ -\infty)=F_{X,Y}(-\infty,y)=F_{X,Y}(x,-\infty)=0
  2. FX,Y(∞,∞)=1F_{X,Y}(\infty,\infty)=1
  3. 0≤FX,Y(x,y)≤10\leq F_{X,Y}(x,y)\leq1
  4. FX,YF_{X,Y}는 x, y의 범위 내에서 감소하지 않음
  5. P(x1<X≤x2, y1<Y≤y2)P(x_1<X\leq x_2,\ y_1<Y\leq y_2)
    =FX,Y(x2,y2)+FX,Y(x1,y1)−FX,Y(x1,y2)−FX,Y(x2,y1)≥0=F_{X, Y}(x_2, y_2)+F_{X,Y}(x_1,y_1)-F_{X,Y}(x_1,y_2)-F_{ X,Y}(x_2,y_1)\geq0
  6. Marginality : FX,Y(x,∞)=FX(x), FX,Y(∞,y)=FY(y)F_{X,Y}(x,\infty)=F_X(x),\ F_{X,Y}(\infty,y)=F_Y(y)
    • 랜덤벡터 CDF FX,Y(x,y)F_{X, Y}(x,y)에서 CDF FX(x)F_X(x), FY(y)F_Y(y)를 얻을 수 있음
    • 하지만 FX(x)F_X(x), FY(y)F_Y(y)에서 FX,Y(x,y)F_{X, Y}(x,y) 계산은 불가
    • 예외 : X, Y가 확률적으로 독립된 상태일 때
      P(A,B)=P(A)P(B)P(A,B)=P(A)P(B), FX,Y(x,y)=FX(x)FY(y)F_{X,Y}(x,y)=F_X(x)F_Y(y)

3. Joint Density

  • 결합 밀도 fX,Y(x,y)≡∂2FX,Y(x,y)∂x∂yf_{X, Y}(x,y)\equiv\frac{\partial^2F_{X,Y}(x,y)}{\partial x\partial y}
    • Discrete R.V.에서는 델타함수의 식으로 표현
    • fX,Y=(x,y)=∑n=1N∑m=1MP(xn,ym)δ(x−xn)δ(y−yn)f_{X,Y}=(x,y)=\sum_{n=1}^N\sum_{m=1}^MP(x_n,y_m)\delta(x-x_n)\delta(y-y_n)
  • Properties
    1. ∫−∞∞∫−∞∞fX,Y(x,y)dydx=1\int^\infty_{-\infty}\int^\infty_{-\infty}f_{X,Y}(x,y)dydx=1
    2. FX,Y(x,y)=∫−∞x∫−∞yfX,Y(u,v)dvduF_{X,Y}(x,y)=\int^x_{-\infty}\int^y_{-\infty}f_{X,Y}(u,v)dvdu
    3. FX(x)=∫−∞x∫−∞yfX,Y(u,v)dvduF_X(x)=\int^x_{-\infty}\int^y_{-\infty}f_{X,Y}(u,v)dvdu
    4. P(x1<X≤x2,y1<Y≤y2)P(x_1<X\leq x_2,y_1<Y\leq y_2)
      =∫x1x2∫y1y2fX,Y(x,y)dydx=\int^{x2}_{x1}\int^{y2}_{y1}f_{X,Y}(x,y)dydx
    5. fX(x)=∫−∞∞fX,Y(x,y)dyf_X(x)=\int^\infty_{-\infty}f_{X,Y}(x,y)dy
    • fX,Y(x,y)f_{X,Y}(x,y)에서 PDF fX(x)f_X(x), fY(y)f_Y(y) 계산 가능
    • 독립사건을 제외하고 fX(x)f_X(x), fY(y)f_Y(y)에서 fX,Y(x,y)f_{X,Y}(x,y)를 계산할 수는 없음


4. Conditional Distribution

  • 조건부 확률 P(A∣B)≡P(A,B)P(B)P(A|B)\equiv\frac{P(A,B)}{P(B)}
  • Conditional CDF FX(x∣B)=P[(X≤x)∩B]P(B)F_X(x|B)=\frac{P[(X\leq x)\cap B]}{P(B)}
    • 연속적인 랜덤변수 X, Y에 대해 FX,Y(x∣Y=y)=P[(X≤x)∩[Y=y]]P(Y=y)F_{X,Y}(x|Y=y)=\frac{P[(X\leq x)\cap [Y=y]]}{P(Y=y)}
    • 연속적인 랜덤변수에서 P(Y=y)=0P(Y=y)=0 : 0/0형태로 나타나는 문제
    • CDF 계산이 안될 경우 PDF식을 구한 후 적분
  • Conditional PDF fX(x∣B)=dFX(x∣B)dxf_X(x|B)=\frac{dF_X(x|B)}{dx}

Bayes' Theorem

  • fY(y∣x)=fY(y)fX(x∣y)fX(x)f_Y(y|x)=\frac{f_Y(y)f_X(x|y)}{f_X(x)}
    • fX(x)f_X(x) : 관찰된 것
    • fY(y∣x)f_Y(y|x) : 사후 확률
    • fX(x∣y)f_X(x|y) : likelihood - 인과관계
    • fY(y)f_Y(y) : 사전 확률 - 실험 전 일반적인 확률
  • Marginalization : fX(x)=∫−∞∞fX(x∣y)fY(y)dy=∫−∞∞fX,Y(x,y)dyf_X(x)=\int^\infty_{-\infty}f_X(x|y)f_Y(y)dy=\int^\infty_{-\infty}f_{X,Y}(x,y)dy

5. Sum of Independent R.V.

  • 독립적인 두 R.V. X,Y에 대해 W=X+Y를 정의

  • FW(w)=F(W≤w)=F(X+Y≤w)F_W(w)=F(W\leq w)=F(X+Y\leq w)
    ∫−∞∞∫−∞W−YfX,Y(x,y)dxdy\int^\infty_{-\infty}\int^{W-Y}_{-\infty}f_{X,Y}(x,y)dxdy
    (X, Y가 indep.) ∫−∞∞fY(y)∫−∞W−YfX(x)dxdy\int^\infty_{-\infty}f_Y(y)\int^{W-Y}_{-\infty}f_X(x)dxdy

  • fW(w)=dFW(w)dwf_W(w)=\frac{dF_W(w)}{dw}
    =∫−∞∞fY(y)fX(w−y)dy=∫−∞∞fX(x)fY(w−x)dx=\int^\infty_{-\infty}f_Y(y)f_X(w-y)dy=\int^\infty_{-\infty}f_X(x)f_Y(w-x)dx
    =fX(w)∗fY(w)=f_X(w)*f_Y(w) : Convolution


7. Central Limit Theorem

  • 충분히 많은 시행횟수에 대해 확률분포는 Gaussian 형태를 띄게 됨
    • YN=X1+X2+...+XNY_N=X_1+X_2+...+X_N의 N이 무한으로 갈 때 fYNf_{Y_N}은 gaussian 형태
  • 평균이 μ\mu, 분산이 σ2\sigma^2인 n개의 iid(independent, identical) R.V.의 합을 SnS_n으로 정의할 때
    • 평균 0, 분산 1(unit-variance)인 랜덤변수 ZN=Sn−nμσnZ_N=\frac{S_n-n\mu}{\sigma\sqrt{n}}
    • n이 무한으로 갈 때 limnP[Znz]=12πzexp[x22]dxlim_{n\rarr\infty}P[Z_n\leq z]=\frac{1}{\sqrt{2\pi}}\int^z_{-\infty}exp[-\frac{x^2}{2}]dx
    • SnS_n의 평균 E[Sn]=E[X1]+E[X2]+...+E[Xn]=nμE[S_n]=E[X_1]+E[X_2]+...+E[X_n]=n\mu
    • SnS_n의 분산 E[(Znnμ)2]=nσ2E[(Z_n-n\mu)^2]=n\sigma^2
728x90

+ Recent posts