はじめに
ガンマ分布とポアソン分布には密接な関係性があります。
その関係性を表す式の計算をしたのでまとめます。
式の計算
確率変数\(T\)がガンマ分布に従うとき、\(T \sim Ga(k,\lambda)\)となり、確率密度関数は
\(\displaystyle f(t)=\frac{\lambda^k}{\Gamma(k)}t^{k-1}\exp(-\lambda t)\)
で表されます。
確率\(P(T>t)\)は以下の積分で計算出来ます。
\(\displaystyle \int^{\infty}_t \frac{\lambda^k}{\Gamma(k)}t^{k-1}\exp(-\lambda t) dt\)
この式を部分積分していきます。
\(\displaystyle \int^{\infty}_t \frac{\lambda^k}{\Gamma(k)}t^{k-1}\exp(-\lambda t) dt\)
\(\displaystyle =\left[ \frac{\lambda^k}{\Gamma(k)}t^{k-1}\exp(-\lambda t) \frac{1}{-\lambda} \right]^\infty_t\)\( \displaystyle +\int^\infty_t \frac{\lambda^{k-1}}{\Gamma(k-1)}t^{k-2}\exp(-\lambda t)dt\)
\(\displaystyle =\frac{\lambda^{k-1}}{\Gamma(k)}t^{k-1}\exp(-\lambda t)\)\( \displaystyle +\int^\infty_t \frac{\lambda^{k-1}}{\Gamma(k-1)}t^{k-2}\exp(-\lambda t)dt\)
\(\displaystyle =\frac{(\lambda t)^{k-1}}{(k-1)!}e^{-\lambda t}\)\( \displaystyle +\int^\infty_t \frac{\lambda^{k-1}}{\Gamma(k-1)}t^{k-2}\exp(-\lambda t)dt\)
計算の途中では
\(\Gamma(k)=(k-1)!\)
を用いました。
再度、後半部分に部分積分を行うと、直前の部分積分で\(k\)を\(k-1\)で置き換えて、
\( \displaystyle \int^{\infty}_t \frac{\lambda^{k-1}}{\Gamma(k-1)}t^{k-2}\exp(-\lambda t) dt\)
\(\displaystyle =\frac{(\lambda t)^{k-2}}{(k-2)!}e^{-\lambda t}\)\( \displaystyle +\int^\infty_t \frac{\lambda^{k-2}}{\Gamma(k-2)}t^{k-3}\exp(-\lambda t)dt\)
この部分積分を繰り返していくと最終的に
\( \displaystyle \int^{\infty}_t \frac{\lambda^{2}}{\Gamma(2)}t^{1}\exp(-\lambda t) dt\)
\(\displaystyle =\frac{(\lambda t)^{1}}{1!}e^{-\lambda t}\)\( \displaystyle +\int^\infty_t \frac{\lambda^{1}}{\Gamma(1)}t^{0}\exp(-\lambda t)dt\)
\(\displaystyle =\frac{(\lambda t)^{1}}{1!}e^{-\lambda t}\)\( \displaystyle +\frac{1}{\Gamma(1)}e^{-\lambda t}\)
\(\displaystyle =\frac{(\lambda t)^{1}}{1!}e^{-\lambda t}\)\( \displaystyle +\frac{(\lambda t)^{0}}{0!}e^{-\lambda t}\)
以上より
\(\displaystyle \int^{\infty}_t \frac{\lambda^k}{\Gamma(k)}t^{k-1}\exp(-\lambda t) dt\)\( \displaystyle = \sum^{k-1}_{x=0} \frac{(\lambda t)^x}{x!}e^{-\lambda t} \)
式の解釈
左辺の解釈
左辺の\(\displaystyle \int^{\infty}_t \frac{\lambda^k}{\Gamma(k)}t^{k-1}\exp(-\lambda t) dt\)は\(Ga(k,\lambda)\)に従う確率変数\(T\)に対して、\(T>t\)となる確率を計算したものです。
ここで、ガンマ分布のモーメント母関数の形からガンマ分布には再生性があることが分かるので、\(Ga(k,\lambda)\)を分解して、指数分布\(Ga(1,\lambda)\)を登場させることを目標にします。
\(S_i \sim Ga(1,\lambda)(i=1,2,…,k)\)とすると、\(T=S_1+S_2+\cdots + S_k\)は\(Ga(k,\lambda)\)に従います。
\(S_i \sim \rm{Exp}(\lambda)\)は、危険率が\(\lambda\)で一定の時に生き残る時間を表す確率変数です。
すると\(T=S_1+S_2+\cdots + S_k\)は、\(S_1\)が死んだら次の\(S_2\)というように取り換えていくときの\(k\)個の生存時間の和を表していることになります。
よって左辺の積分している部分\(\displaystyle \int^{\infty}_t \frac{\lambda^k}{\Gamma(k)}t^{k-1}\exp(-\lambda t) dt\)は、\(k\)個の生存時間の和が\(t\)以上になる確率を表していることが分かります。
右辺の解釈
右辺の\(\displaystyle \sum^{k-1}_{x=0} \frac{(\lambda t)^x}{x!}e^{-\lambda t} \)は、ポアソン分布の確率密度関数の和の形になっています。
確率密度関数\(\displaystyle \frac{(\lambda t)^x}{x!}e^{-\lambda t} \)が表しているポアソン分布\(Po(\lambda t)\)は二項分布\(\displaystyle B(n,\frac{\lambda t}{n})\)で\(n \to \infty\)としたものです。
先の危険率\(\lambda\)で説明をすると、\(\lambda t\)は期間\(t\)の間に危険率\(\lambda\)の稀な事象が起こる回数を表しています。
この事象は、1個体に対して1回のみ起こる事象(生死を分ける事象のため)なので、\(\lambda t\)は期間\(t\)の間に死ぬ個体の数と考えることが出来ます。
このように考えると、\( \displaystyle \frac{(\lambda t)^x}{x!}e^{-\lambda t} \)は期間\(t\)の間に死ぬ個体の数が\(x\)個になる確率を表しているとみることが出来ます。
よって左辺は期間\(t\)の間に死んだ個体が\(k-1\)個以下になる確率を表していると言えます。
式全体の解釈
両辺の解釈から、
\(\displaystyle \int^{\infty}_t \frac{\lambda^k}{\Gamma(k)}t^{k-1}\exp(-\lambda t) dt\)\( \displaystyle = \sum^{k-1}_{x=0} \frac{(\lambda t)^x}{x!}e^{-\lambda t} \)
は、「\(k\)個の生存時間の和が\(t\)以上になる確率」\(=\)「期間\(t\)の間に死んだ個体が\(k-1\)個以下になる確率」の式になっています。
「期間\(t\)の間に死んだ個体が\(k-1\)個以下になる確率」は言い換えると、「期間\(t\)が経っても\(k\)個目が死んでいない確率」で「\(k\)個の生存時間の和が\(t\)以上になる確率」と等しいと解釈出来ました。
まとめ
ガンマ分布とポアソン分布の関係性を考えることが出来ました。
ガンマ分布では1個体ずつ順番に危険に晒して生存時間を考えましたが、ポアソン分布では全個体を危険に晒して死亡した個体数を考えました。
これには詳しい説明が必要になりそうですが、またの機会にしたいと思います。
コメント