統計検定 1級 2015年 統計応用(理工学) 問5 解答 解説

スポンサーリンク

[1]

平方和は各要因の平方和の和が総平方和になることから分かる。

平均平方は\((平方和)/(自由度)\)から分かる。

検定統計量は\((各要因の平均平方)/(誤差の平均平方)\)で分かる。

各要因の自由度については、[3]の総平方和の分解式をもとに考えると考えやすいが、

性別の平方和は\((各性別の平均)-(全体平均)\)の2乗和になるので、自由度は\(2\)(性別)\(-1\)(全体平均)\(=1\)

作業の自由度は\(3\)(作業種類数)\(-1\)(全体平均)\(=2\)

性別\(\times\)作業の自由度は\((2(性別)-1(性別の平均))\)\(\times (3(作業種類数)-1(作業の平均))\)\(=2\)

誤差の自由度は総自由度から各要因の自由度を引いて\(54\)

以上より、分散分析表は以下のようになる。

要因平方和自由度平均平方検定統計量
性別29.40129.4011.95
作業22.30211.154.53
性別\(\times\)作業20.10210.054.09
誤差132.80542.46
204.6059

[2]

公式の解答を参照。

[3]

公式の解答を参照。

[4]

分解の式を覚えてしまってもいいと思います。以下は厳密ではないかもしれませんが、式の意味を理解するために、各項について説明を加えます。

まず、\((x_{ijk}-\bar{x}_{…})^2\)は何を表しているかというと、\(E[\bar{x}_{…}]=\mu\)なので、

\((x_{ijk}-\bar{x}_{…})^2=(x_{ijk}-\mu)^2\)\(=(\alpha_i + \beta_j + (\alpha\beta)_{ij}+\varepsilon_{ijk})^2\)

となり、各効果の和の2乗を表してると分かる。これを分解していくことになるが、前提として、

\(\displaystyle \sum_{i} x_i =0\)\(,\displaystyle \sum_{j} y_j =0\)の時、

\(\displaystyle\sum_i \sum_j (x_i \pm y_j)^2 = \sum_i \sum_j (x_i ^2 +y_j^2) \)

なので、

\((\alpha_i + \beta_j + (\alpha\beta)_{ij}+\varepsilon_{ijk})^2\)\(\to \alpha_i^2 + \beta_j^2 + (\alpha\beta)_{ij}^2+\varepsilon_{ijk}^2\)

のように分解することが目標である。

以下分解をしていく。

\(\alpha_i\)を求めるために\(i\)のデータの平均\(\bar{x}_{i..}\)を取ると、

\(E[\bar{x}_{i..}]=\mu+\alpha_i \)

\(E[\bar{x}_{…}]=\mu\)なので、\(\alpha_i=E[\bar{x}_{i..}-\bar{x}_{…}]\)となる。

\(\beta\)についても同様に、\(\beta_j\)を求めるために\(i\)のデータの平均\(\bar{x}_{.j.}\)を取ると、

\(E[\bar{x}_{.j.}]=\mu+\beta_j \)

\(E[\bar{x}_{…}]=\mu\)なので、\(\beta_j=E[\bar{x}_{.j.}-\bar{x}_{…}]\)となる。

\((\alpha\beta)\)については、\((\alpha\beta)_{ij}\)を求めるために\(ij\)のデータの平均\(\bar{x}_{ij.}\)を取ると、

\(E[\bar{x}_{ij.}]=\mu+\alpha_i+\beta_j +(\alpha\beta)_{ij}\)

\(E[\bar{x}_{…}]=\mu\)\(,\alpha_i=E[\bar{x}_{i..}-\bar{x}_{…}]\)\(,\beta_j=E[\bar{x}_{.j.}-\bar{x}_{…}]\)なので、\((\alpha\beta)_{ij}=E[\bar{x}_{ij.}-\bar{x}_{i..}-\bar{x}_{.j.}+\bar{x}_{…}]\)となる。

これらをもとに、\(x_{ijk}-\bar{x}_{…}\)を分解すると、

\(x_{ijk}-\bar{x}_{…}\)\(=(\bar{x}_{i..}-\bar{x}_{…})\)\(+(\bar{x}_{.j.}-\bar{x}_{…})\)\(+(\bar{x}_{ij.}-\bar{x}_{i..}-\bar{x}_{.j.}+\bar{x}_{…})\)\(+(x_{ijk}-\bar{x}_{ij.})\)

となる。(ただし、\((x_{ijk}-\bar{x}_{ij.})\)は残差項)

以上より、

\(\displaystyle \sum_{i,j,k} (x_{ijk}-\bar{x}_{…})^2 \)\( = \displaystyle \sum_{i,j,k} \{(\bar{x}_{i..}-\bar{x}_{…})\)\(+(\bar{x}_{.j.}-\bar{x}_{…})\)\(+(\bar{x}_{ij.}-\bar{x}_{i..}-\bar{x}_{.j.}+\bar{x}_{…})\)\(+(x_{ijk}-\bar{x}_{ij.})\}^2 \)

\( = \displaystyle \sum_{i,j,k} (\bar{x}_{i..}-\bar{x}_{…})^2\)\(+ \displaystyle \sum_{i,j,k}(\bar{x}_{.j.}-\bar{x}_{…})^2\)\(+ \displaystyle \sum_{i,j,k}(\bar{x}_{ij.}-\bar{x}_{i..}-\bar{x}_{.j.}+\bar{x}_{…})^2\)\(+ \displaystyle \sum_{i,j,k}(x_{ijk}-\bar{x}_{ij.})^2 \)

補足

ここで、右辺の各項の自由度を考えてみます。一番難しそうな第3項目の自由度のみを求めようと思います。

まず、本問の\( \displaystyle \sum_{i,j,k}(\bar{x}_{ij.}-\bar{x}_{i..}-\bar{x}_{.j.}+\bar{x}_{…})^2\)をより正確に書くと

\( \displaystyle \sum_{i=1}^{n_i}\sum_{j=1}^{n_j}\sum_{k=1}^{n_k}(\bar{x}_{ij.}-\bar{x}_{i..}-\bar{x}_{.j.}+\bar{x}_{…})^2\)

となる。

ここで、

\(\left \{
\begin{array}{}
E[\bar{x}_{ij.}]&=&\mu+\alpha_i+\beta_j + (\alpha\beta)_{ij}&=&\mu_{ij}\\
E[\bar{x}_{i..}]&=&\mu+\alpha_i&=&\mu_{i}\\
E[\bar{x}_{.j.}]&=&\mu+\beta_j &=&\mu_{j}\\
E[\bar{x}_{…}]&=&\mu
\end{array}
\right .\)

とすると、

\( \displaystyle \sum_{i=1}^{n_i}\sum_{j=1}^{n_j}\sum_{k=1}^{n_k}(\bar{x}_{ij.}-\bar{x}_{i..}-\bar{x}_{.j.}+\bar{x}_{…})^2\)

\( =\displaystyle \sum_{i=1}^{n_i}\sum_{j=1}^{n_j}\sum_{k=1}^{n_k}((\bar{x}_{ij.}-\mu_{ij})\)\(-(\bar{x}_{i..}-\mu_i)\)\(-(\bar{x}_{.j.}-\mu_j)\)\(+(\bar{x}_{…}-\mu)\)\(+(\alpha\beta)_{ij})^2\)

\((\alpha\beta)_{ij}\)は帰無仮説では\(0\)なので\(0\)として、

\( =\displaystyle \sum_{i=1}^{n_i}\sum_{j=1}^{n_j}\sum_{k=1}^{n_k}((\bar{x}_{ij.}-\mu_{ij})\)\(-(\bar{x}_{i..}-\mu_i)\)\(-(\bar{x}_{.j.}-\mu_j)\)\(+(\bar{x}_{…}-\mu))^2\)

これを全て展開し、適宜\(\displaystyle \sum_{i=1}^{n_i}\)\(,\displaystyle \sum_{j=1}^{n_j}\)で和を取る処理をすると、

\( =\displaystyle n_k \{\displaystyle \sum_{i=1}^{n_i} \sum_{j=1}^{n_j}(\bar{x}_{ij.}-\mu_{ij})^2\)\(-n_j\displaystyle \sum_{i=1}^{n_i}(\bar{x}_{i..}-\mu_i)^2\)\(-n_i\displaystyle \sum_{j=1}^{n_j}(\bar{x}_{.j.}-\mu_j)^2\)\(+n_in_j(\bar{x}_{…}-\mu)^2\}\)

これを\(S^2\)とし、\(\sigma^2\)で割ると、

\(\displaystyle\frac{S^2}{\sigma^2}\)\( =\displaystyle \sum_{i=1}^{n_i} \sum_{j=1}^{n_j}\frac{(\bar{x}_{ij.}-\mu_{ij})^2}{\sigma^2/n_k}\)\(-\displaystyle \sum_{i=1}^{n_i}\frac{(\bar{x}_{i..}-\mu_i)^2}{\sigma^2/n_jn_k}\)\(-\displaystyle \sum_{j=1}^{n_j}\frac{(\bar{x}_{.j.}-\mu_j)^2}{\sigma^2/n_in_k}\)\(+\displaystyle\frac{(\bar{x}_{…}-\mu)^2}{\sigma^2/n_in_jn_k}\)

ここで、\(\bar{x}_{ij.} \displaystyle \sim N\left(\mu_{ij},\frac{\sigma^2}{n_in_j}\right)\) (\(\bar{x}_{ij.}\)は\(n_i\times n_j\)個のデータの平均なので、分散は\(\sigma^2\)を\(n_in_j\)で割ったものになる)なので、

\(\displaystyle \sum_{i=1}^{n_i} \sum_{j=1}^{n_j}\frac{(\bar{x}_{ij.}-\mu_{ij})^2}{\sigma^2/n_k} \)\(\sim \chi^2(n_in_j)\)

同様に考えていくと1項目、2項目、3項目、4項目はそれぞれ、自由度\(n_in_j\)、自由度\(n_i\)、自由度\(n_j\)、自由度\(1\)の\(\chi^2\)分布に従うので、\(\displaystyle \frac{S^2}{\sigma^2}\)の自由度は

\(n_in_j-n_i-n_j+1\)\(=(n_i-1)(n_j-1)\)となる。

[5]

最尤推定値

\(x_{ijk}=\mu+\alpha_i + \beta_j + (\alpha\beta)_{ij}+\varepsilon_{ijk}\)なので、

\(\mu+\alpha_i + \beta_j + (\alpha\beta)_{ij}=\mu_{ij.}\)とすると、

\(x_{ijk}\sim N(\mu_{ij.},\sigma^2)\)

尤度\(L\)は

\(L=\displaystyle \prod_{i,j,k} \frac{1}{\sqrt{2\pi}\sigma} e^{-\frac{(x_{ijk}-\mu_{ij.})^2}{2\sigma^2}}\)

\(\ln L \)\(\displaystyle =-N \ln (\sqrt{2\pi}\sigma) -\sum_{i,j,k}\frac{(x_{ijk}-\mu_{ij.})^2}{2\sigma^2} \) (\(N\)は総数を表す)

細かな計算は省略するが、

\(\displaystyle \frac{\partial \ln L}{\partial \mu_{ij.}}=0\)を解くと、\(\mu_{ij.}=\bar{x}_{ij.}\)となり、

\(\displaystyle \frac{\partial \ln L}{\partial \sigma}=0\)を解くと、\(\displaystyle \sigma^2 = \frac{1}{N}\sum_{i,j,k}(x_{ijk}-\mu_{ij.})^2\)となることから、

\(\sigma^2\)の最尤推定値は解答のようになる。

不偏推定値

最尤推定値の\(\displaystyle \sum_{k=1}^{10}(x_{ijk}-\bar{x}_{ij.})^2\)に着目すると、これは\(X \sim N(\mu_{ij.},\sigma^2)\)とした時の、\(\displaystyle \sum_{k=1}^{10}(X_k-\bar{X})^2\)であるため、自由度が\(9\)である。\(i,j\)の足し合わせも考慮すると、最尤推定値の右辺の自由度は\(2\times 3\times 9=54\)となるので、不偏推定値は、

\(\displaystyle \hat{\sigma}^2 = \frac{1}{54}\sum_{i,j,k}(x_{ijk}-\mu_{ij.})^2\)


コメント

タイトルとURLをコピーしました