[1]
\(3:4:2:1\)の比率になる場合、100人の人数分布は\(30:40:20:10\)になる。
\(\displaystyle W= \frac{(24-30)^2}{30}\)\(\displaystyle +\frac{(48-30)^2}{40}\)\(\displaystyle +\frac{(16-20)^2}{30}\)\(\displaystyle +\frac{(12-10)^2}{10}\)
\(=4\)
は\(\chi^2(3)\)に従い、付表により帰無仮説は棄却されない。
[2]
調査人数は、合計で\(25k\)人なので、\(3:4:2:1\)の比率になる場合、\(25k\)人の人数分布は\(7.5k:10k:5k:2.5k\)になる。
\(\displaystyle W= \frac{(6k-7.5)^2}{7.5k}\)\(\displaystyle +\frac{(12k-10k)^2}{10k}\)\(\displaystyle +\frac{(4k-5k)^2}{5k}\)\(\displaystyle +\frac{(3k-2.5k)^2}{2.5k}\)
\(=k\)
\(W \sim \chi^2(3)\)なので、\(k \geq \chi_3^2(0.95)=7.81\)として、\(k=8\)。
[3]
公式の解答を参照。
[4]
(i)
問題に従い偏微分をして、
\(\displaystyle \frac{\partial Q}{\partial r}=2f_{OO}\frac{1}{r}\)\(\displaystyle +f_{AO}\frac{1}{r}\)\(\displaystyle +f_{BO}\frac{1}{r}\)\(\displaystyle -\lambda\)
\(=0\)
として、
\(\displaystyle r=\frac{2f_{OO}+f_{AO}+f_{BO}}{\lambda}\)\(\displaystyle =\frac{2n_{O}+f_{AO}+f_{BO}}{\lambda}\)
\(p,q\)に対しても同様して、
\(\displaystyle p=\frac{2f_{AA}+f_{AO}+f_{AB}}{\lambda}\)\(\displaystyle =\frac{2f_{AA}+f_{AO}+n_{AB}}{\lambda}\)
\( \displaystyle q=\frac{2f_{BB}+f_{BO}+f_{AB}}{\lambda}\)\( \displaystyle =\frac{2f_{BB}+f_{BO}+n_{AB}}{\lambda}\)
\(r+p+q=1\)なので、
\(\displaystyle \frac{2f_{OO}+f_{AO}+f_{BO}}{\lambda}\)\(\displaystyle +\frac{2f_{AA}+f_{AO}+f_{AB}}{\lambda}\)\(\displaystyle +\frac{2f_{BB}+f_{BO}+f_{AB}}{\lambda}\)\(\displaystyle =1\)
より、
\(\lambda = 2(f_{OO}\)\(+f_{AA}\)\(+f_{AO}\)\(+f_{BB}\)\(+f_{BO}\)\(+f_{AB})\)
\(=2N\)
\(\lambda\)に\(2N\)を代入して、\(r,p,q\)の推定値を得る。
(ii)
公式の解答を参照。
ただ、公式の解答の中で、\(E[f_{AO}]\)は\(2Npr\)、\(E[f_{BO}]\)は\(2Nqr\)でも良いのではないかと思いましたが、既知の値は出来るだけ使い、未知の値は出来るだけ避けて計算することを考えると、\(E[f_{AO}]\)の計算は未知の値2つ\((p,r)\)を含む\(E[f_{AO}]\)\(=2Npr\)よりも、未知の値1つ\((p)\)のみを含む\(E[f_{AO}]\)\(=n_A-Np^2\)の方が良い気がします。\(E[f_{BO}]\)に関しても同様の理由で、\(E[f_{BO}]\)\(=n_B-Nq^2\)となります。
本問のポイントは、問題文に書いてある、\(r,p,q\)及び、観測値である\(N,n_O, n_A,n_B,n_{AB}\)のみを用いて期待値を表すということです。
コメント