超幾何分布の期待値と分散

スポンサーリンク

はじめに

超幾何分布の期待値と分散を導出したのでまとめます。

超幾何分布とは下のような状況の時に現れる分布です。

超幾何分布

赤玉\(M\)個、白玉\((N-M)\)個から\(n\)個を取り出す時の赤玉の個数\(x\)は超幾何分布に従う

超幾何分布の確率密度関数

全事象は、\(N\)個から\(n\)個を取る確率で、\({}_NC_n\)通りです。

赤玉が\(x\)個になるのは、白玉が\((n-x)\)個になるときで、\({}_MC_x\times {}_{N-M}C_{n-x}\)通りです。

よって、確率密度関数は、

$$\displaystyle P(X=x)=\frac{{}_MC_x\times {}_{N-M}C_{n-x} }{ {}_NC_n }$$

超幾何分布の期待値

期待値の計算をしていきます。

\(E[X]\)
\(= \displaystyle \sum_{x=0}^nx \frac{{}_MC_x\times {}_{N-M}C_{n-x} }{ {}_NC_n } \)

二項分布の期待値計算と同様の変形をして、

\(= \displaystyle \sum_{x=0}^nx\frac{\frac{M!}{x!(M-x)!}\times \frac{(N-M)!}{(n-x)!(N-M-(n-x))!}}{\frac{N!}{n!(N-n)!}}\)
\(= \displaystyle \sum_{x=0}^n\frac{\frac{M!}{(x-1)!(M-x)!}\times \frac{(N-M)!}{(n-x)!(N-M-(n-x))!}}{\frac{N!}{n!(N-n)!}}\)

ここで階乗の分数を\(C\)で書き換えてすっきりさせたいですが、\(\displaystyle {}_nC_r = \frac{n!}{r!(n-r)!}\)の変形をするには、分母の足し算\(=\)分子となっていなければなりません。

さらに、\(x\)はシグマの変数になっているので、出来るだけいじらないことに注意すると、

\(\displaystyle \frac{M!}{(x-1)!(M-x)!} \)
\(= \displaystyle M \frac{(M-1)!}{(x-1)!(M-x)!} \)
\(\displaystyle = M {}_{M-1}C_{x-1}\)

よって、

\(\displaystyle \frac{\frac{M!}{(x-1)!(M-x)!}\times \frac{(N-M)!}{(n-x)!(N-M-(n-x))!}}{\frac{N!}{n!(N-n)!}} \)
\(= \displaystyle \frac{ M {}_{M-1}C_{x-1} \times {}_{N-M}C_{n-x}}{\frac{N!}{n!(N-n)!}} \)

ここで、超幾何分布の確率密度関数を見ると分かりますが、分子の\(C\)の両側の数字同士を足したものが、分母の両側の数字になると美しいです。

\( \displaystyle M {}_{M-1}C_{x-1} \times {}_{N-M}C_{n-x} \)の形から、分母が\({}_{N- 1}C_{n-1}\)になるように調整します。

\( {}_{N- 1}C_{n-1} \)
\(=\displaystyle \frac{(N-1)!}{(n-1)!(N-n)!} \)
\(=\displaystyle \frac{N!}{n!(N-n)!} \times \frac{n}{N}\)

よって、

\( \displaystyle \frac{ M {}_{M-1}C_{x-1} \times {}_{N-M}C_{n-x}}{\frac{N!}{n!(N-n)!}} \)
\(= \displaystyle \frac{ M {}_{M-1}C_{x-1} \times {}_{N-M}C_{n-x}}{ {}_{N- 1}C_{n-1} \times \frac{N}{n}} \)

以上より、

\(E[X]\)
\(= \displaystyle \sum_{x=0}^nx \frac{{}_MC_x\times {}_{N-M}C_{n-x} }{ {}_NC_n } \)
\( = \displaystyle \sum_{x=1}^n \frac{ M {}_{M-1}C_{x-1} \times {}_{N-M}C_{n-x}}{ {}_{N- 1}C_{n-1} \times \frac{N}{n}} \)\((x=0の時は0なので除いた)\)
\( = \displaystyle n\frac{M}{N}\sum_{x=0}^{n-1} \frac{ {}_{M-1}C_{x} \times {}_{N-M}C_{(n-1)-x}}{ {}_{N- 1}C_{n-1} \times \frac{N}{n}} \)

シグマ内は、「赤玉\(M\)個、白玉\((N-M)\)個から\((n-1)\)個を取り出す」確率に等しく、その和は\(1\)です。

よって、

$$E[X]=\displaystyle n\frac{M}{N}$$

超幾何分布の分散

二項分布の分散は以下で導出しましたが、二項分布の分散の導出過程で出てきたように\(E[X(X-1)]\)を求めることが肝になりそうです。

\(E[X(X-1)]\)

\(= \displaystyle \sum_{x=0}^nx(x-1) \frac{{}_MC_x\times {}_{N-M}C_{n-x} }{ {}_NC_n } \)

期待値と計算方法は似ているので飛ばしながら計算します。

\(= \displaystyle \sum_{x=2}^n \frac{ M(M-1) {}_{M-2}C_{x-2} \times {}_{N-M}C_{n-x}}{\frac{N!}{n!(N-n)!}} \)\((x=0,1の時は0なので除いた)\)

\(= \displaystyle \sum_{x=0}^{n-2} \frac{ M(M-1) {}_{M-2}C_{x} \times {}_{N-M}C_{(n-2)-x}}{{}_{N-2}C_{n-2}\times \frac{N(N-1) }{n(n-1)}} \)

\(=\displaystyle n(n-1)\frac{M(M-1)}{N(N-1)}\)

ここで、

\(V[X]=E[X^2]-E[X]^2\)

\(=E[X(X-1)]+E[X]-E[X]^2\)

\(= \displaystyle n(n-1)\frac{M(M-1)}{N(N-1)} \)\(+ \displaystyle n\frac{M}{N} \) \(- \displaystyle \left(n\frac{M}{N}\right)^2 \)

\(=\displaystyle n\frac{M}{N}\left(1-\frac{M}{N}\right)\frac{N-n}{N-1}\)

コメント

タイトルとURLをコピーしました