はじめに
超幾何分布の期待値と分散を導出したのでまとめます。
超幾何分布とは下のような状況の時に現れる分布です。
超幾何分布
赤玉\(M\)個、白玉\((N-M)\)個から\(n\)個を取り出す時の赤玉の個数\(x\)は超幾何分布に従う
超幾何分布の確率密度関数
全事象は、\(N\)個から\(n\)個を取る確率で、\({}_NC_n\)通りです。
赤玉が\(x\)個になるのは、白玉が\((n-x)\)個になるときで、\({}_MC_x\times {}_{N-M}C_{n-x}\)通りです。
よって、確率密度関数は、
$$\displaystyle P(X=x)=\frac{{}_MC_x\times {}_{N-M}C_{n-x} }{ {}_NC_n }$$
超幾何分布の期待値
期待値の計算をしていきます。
\(E[X]\)
\(= \displaystyle \sum_{x=0}^nx \frac{{}_MC_x\times {}_{N-M}C_{n-x} }{ {}_NC_n } \)
二項分布の期待値計算と同様の変形をして、
\(= \displaystyle \sum_{x=0}^nx\frac{\frac{M!}{x!(M-x)!}\times \frac{(N-M)!}{(n-x)!(N-M-(n-x))!}}{\frac{N!}{n!(N-n)!}}\)
\(= \displaystyle \sum_{x=0}^n\frac{\frac{M!}{(x-1)!(M-x)!}\times \frac{(N-M)!}{(n-x)!(N-M-(n-x))!}}{\frac{N!}{n!(N-n)!}}\)
ここで階乗の分数を\(C\)で書き換えてすっきりさせたいですが、\(\displaystyle {}_nC_r = \frac{n!}{r!(n-r)!}\)の変形をするには、分母の足し算\(=\)分子となっていなければなりません。
さらに、\(x\)はシグマの変数になっているので、出来るだけいじらないことに注意すると、
\(\displaystyle \frac{M!}{(x-1)!(M-x)!} \)
\(= \displaystyle M \frac{(M-1)!}{(x-1)!(M-x)!} \)
\(\displaystyle = M {}_{M-1}C_{x-1}\)
よって、
\(\displaystyle \frac{\frac{M!}{(x-1)!(M-x)!}\times \frac{(N-M)!}{(n-x)!(N-M-(n-x))!}}{\frac{N!}{n!(N-n)!}} \)
\(= \displaystyle \frac{ M {}_{M-1}C_{x-1} \times {}_{N-M}C_{n-x}}{\frac{N!}{n!(N-n)!}} \)
ここで、超幾何分布の確率密度関数を見ると分かりますが、分子の\(C\)の両側の数字同士を足したものが、分母の両側の数字になると美しいです。
\( \displaystyle M {}_{M-1}C_{x-1} \times {}_{N-M}C_{n-x} \)の形から、分母が\({}_{N- 1}C_{n-1}\)になるように調整します。
\( {}_{N- 1}C_{n-1} \)
\(=\displaystyle \frac{(N-1)!}{(n-1)!(N-n)!} \)
\(=\displaystyle \frac{N!}{n!(N-n)!} \times \frac{n}{N}\)
よって、
\( \displaystyle \frac{ M {}_{M-1}C_{x-1} \times {}_{N-M}C_{n-x}}{\frac{N!}{n!(N-n)!}} \)
\(= \displaystyle \frac{ M {}_{M-1}C_{x-1} \times {}_{N-M}C_{n-x}}{ {}_{N- 1}C_{n-1} \times \frac{N}{n}} \)
以上より、
\(E[X]\)
\(= \displaystyle \sum_{x=0}^nx \frac{{}_MC_x\times {}_{N-M}C_{n-x} }{ {}_NC_n } \)
\( = \displaystyle \sum_{x=1}^n \frac{ M {}_{M-1}C_{x-1} \times {}_{N-M}C_{n-x}}{ {}_{N- 1}C_{n-1} \times \frac{N}{n}} \)\((x=0の時は0なので除いた)\)
\( = \displaystyle n\frac{M}{N}\sum_{x=0}^{n-1} \frac{ {}_{M-1}C_{x} \times {}_{N-M}C_{(n-1)-x}}{ {}_{N- 1}C_{n-1} \times \frac{N}{n}} \)
シグマ内は、「赤玉\(M\)個、白玉\((N-M)\)個から\((n-1)\)個を取り出す」確率に等しく、その和は\(1\)です。
よって、
$$E[X]=\displaystyle n\frac{M}{N}$$
超幾何分布の分散
二項分布の分散は以下で導出しましたが、二項分布の分散の導出過程で出てきたように\(E[X(X-1)]\)を求めることが肝になりそうです。
\(E[X(X-1)]\)
\(= \displaystyle \sum_{x=0}^nx(x-1) \frac{{}_MC_x\times {}_{N-M}C_{n-x} }{ {}_NC_n } \)
期待値と計算方法は似ているので飛ばしながら計算します。
\(= \displaystyle \sum_{x=2}^n \frac{ M(M-1) {}_{M-2}C_{x-2} \times {}_{N-M}C_{n-x}}{\frac{N!}{n!(N-n)!}} \)\((x=0,1の時は0なので除いた)\)
\(= \displaystyle \sum_{x=0}^{n-2} \frac{ M(M-1) {}_{M-2}C_{x} \times {}_{N-M}C_{(n-2)-x}}{{}_{N-2}C_{n-2}\times \frac{N(N-1) }{n(n-1)}} \)
\(=\displaystyle n(n-1)\frac{M(M-1)}{N(N-1)}\)
ここで、
\(V[X]=E[X^2]-E[X]^2\)
\(=E[X(X-1)]+E[X]-E[X]^2\)
\(= \displaystyle n(n-1)\frac{M(M-1)}{N(N-1)} \)\(+ \displaystyle n\frac{M}{N} \) \(- \displaystyle \left(n\frac{M}{N}\right)^2 \)
\(=\displaystyle n\frac{M}{N}\left(1-\frac{M}{N}\right)\frac{N-n}{N-1}\)
コメント