1. 적용 가능한 데이터의 형태

Untitled

확률 변수 $Y$가 모수 $n$ 과 $p$를 가지는 이항분포를 따른다면, $Y_1, \cdots ,Y_N \sim^{i.i,d}B(n,p)$ 라고 한다.

2. 확률변수의 Probability mass function

$P_Y(y)=P(Y=y_i)$이며, 확률변수 $Y$는 베르누이 시행을 $n$번 시행 했을 때, 그 중에서 $y_i$번 성공할 확률을 의미한다.

$\begin{aligned} P(Y=y_i) = f(y_i;n,p) = \begin{pmatrix} n \\ y_i \end{pmatrix}p^{y_i}(1-p)^{n-y_i}, \quad 0 \le y_i \le n \end{aligned}$

○ 확률 질량함수가 1임을 보이기 (확률의 제 1 공리 만족)

$\sum_{i=1}^N P(Y=y_i) = \sum_{i=1}^N \begin{pmatrix} n \\ y_i \end{pmatrix} p^{y_i} (1-p)^{n-y_i}=1$ (이항정리) .

누적분포함수 정의

$F(y;n,p) = P(Y \le y) = \sum_{i=1}^N \begin{pmatrix} n \\ y_i \end{pmatrix} p^{y_i} (1-p)^{n-y_i}$

적률생성함수 정의

$M_Y(t) = E(e^{tY}) = \sum_{i=1}^N \begin{pmatrix} n \\ y_i \end{pmatrix} (pe^t)^{y_i} (1-p)^{n-y_i}=(pe^t + (1-p))^n$ (이항정리)

c.g.f 정의

$\mathcal{K}_Y(t) = log M_Y(t)=n \cdot log(pe^t+(1-p))$

3. 확률 변수의 평균 ,분산

4. 추정

4.1 최대 우도 추정법