はじめに
中心極限定理を使って、二項分布を正規分布に近似したのでまとめます。
中心極限定理
$$\displaystyle \lim_{n \to \infty}P\left(\frac{\bar{X}-\mu} {\sigma/\sqrt{n} }\leq x \right )$$
$$\displaystyle =\int_{-\infty}^x\frac{1}{\sqrt{2\pi}}e^{-\frac{t^2}{2}}dt$$
中心極限定理の説明は以下のサイトにあります。
二項分布の正規分布への近似
中心極限定理の\(P\)の方を見てみると、確率変数\( \bar{X}\)が含まれていますが、二項分布では標本を抽出して平均を取るみたいなことはしていないので、\(\bar{X}\)を\(X\)に書き換えていきたいと思います。
\( \displaystyle P\left(\frac{\bar{X}-\mu} {\sigma/\sqrt{n} }\leq x \right ) \)
\( =\displaystyle P\left(\frac{n\bar{X}-n\mu} {\sqrt{n}\sigma }\leq x \right ) \)
\(= \displaystyle P\left(\frac{\sum_{i=0}^nX_i-n\mu} {\sqrt{n}\sigma }\leq x \right ) \)
ここで\(X\)がベルヌーイ分布\(B(1,p)\)に従うとすれば、\(\displaystyle \sum_{i=0}^nX_i \)は二項分布に従います。
\(\mu,\sigma\)はそれぞれ\(X\)の平均、分散なので、
\(\mu=p,\sigma=\sqrt{p(1-p)}\)となります。
\(\displaystyle \sum_{i=0}^nX_i =Y\)と置き換えると、\(Y\sim B(n,p)\)で、
\( \displaystyle P\left(\frac{\sum_{i=0}^nX_i-n\mu} {\sqrt{n}\sigma }\leq x \right ) \)
\(=\displaystyle P\left(\frac{Y-np}{\sqrt{np(1-p)}}\leq x \right)\)
以上より、
\( \displaystyle \lim_{n \to \infty} P\left(\frac{Y-np}{\sqrt{np(1-p)}}\leq x \right)\) \( \displaystyle =\int_{-\infty}^x\frac{1}{\sqrt{2\pi}}e^{-\frac{t^2}{2}}dt \)
となり、二項分布を正規化したものが標準正規分布に従うことが示されました(二項分布が正規分布に近似されることも示されました)。
コメント