[1]
平方和は各要因の平方和の和が総平方和になることから分かる。
平均平方は\((平方和)/(自由度)\)から分かる。
検定統計量は\((各要因の平均平方)/(誤差の平均平方)\)で分かる。
各要因の自由度については、[3]の総平方和の分解式をもとに考えると考えやすいが、
性別の平方和は\((各性別の平均)-(全体平均)\)の2乗和になるので、自由度は\(2\)(性別)\(-1\)(全体平均)\(=1\)
作業の自由度は\(3\)(作業種類数)\(-1\)(全体平均)\(=2\)
性別\(\times\)作業の自由度は\((2(性別)-1(性別の平均))\)\(\times (3(作業種類数)-1(作業の平均))\)\(=2\)
誤差の自由度は総自由度から各要因の自由度を引いて\(54\)
以上より、分散分析表は以下のようになる。
要因 | 平方和 | 自由度 | 平均平方 | 検定統計量 |
性別 | 29.40 | 1 | 29.40 | 11.95 |
作業 | 22.30 | 2 | 11.15 | 4.53 |
性別\(\times\)作業 | 20.10 | 2 | 10.05 | 4.09 |
誤差 | 132.80 | 54 | 2.46 | – |
総 | 204.60 | 59 | – | – |
[2]
公式の解答を参照。
[3]
公式の解答を参照。
[4]
分解の式を覚えてしまってもいいと思います。以下は厳密ではないかもしれませんが、式の意味を理解するために、各項について説明を加えます。
まず、\((x_{ijk}-\bar{x}_{…})^2\)は何を表しているかというと、\(E[\bar{x}_{…}]=\mu\)なので、
\((x_{ijk}-\bar{x}_{…})^2=(x_{ijk}-\mu)^2\)\(=(\alpha_i + \beta_j + (\alpha\beta)_{ij}+\varepsilon_{ijk})^2\)
となり、各効果の和の2乗を表してると分かる。これを分解していくことになるが、前提として、
\(\displaystyle \sum_{i} x_i =0\)\(,\displaystyle \sum_{j} y_j =0\)の時、
\(\displaystyle\sum_i \sum_j (x_i \pm y_j)^2 = \sum_i \sum_j (x_i ^2 +y_j^2) \)
なので、
\((\alpha_i + \beta_j + (\alpha\beta)_{ij}+\varepsilon_{ijk})^2\)\(\to \alpha_i^2 + \beta_j^2 + (\alpha\beta)_{ij}^2+\varepsilon_{ijk}^2\)
のように分解することが目標である。
以下分解をしていく。
\(\alpha_i\)を求めるために\(i\)のデータの平均\(\bar{x}_{i..}\)を取ると、
\(E[\bar{x}_{i..}]=\mu+\alpha_i \)
\(E[\bar{x}_{…}]=\mu\)なので、\(\alpha_i=E[\bar{x}_{i..}-\bar{x}_{…}]\)となる。
\(\beta\)についても同様に、\(\beta_j\)を求めるために\(i\)のデータの平均\(\bar{x}_{.j.}\)を取ると、
\(E[\bar{x}_{.j.}]=\mu+\beta_j \)
\(E[\bar{x}_{…}]=\mu\)なので、\(\beta_j=E[\bar{x}_{.j.}-\bar{x}_{…}]\)となる。
\((\alpha\beta)\)については、\((\alpha\beta)_{ij}\)を求めるために\(ij\)のデータの平均\(\bar{x}_{ij.}\)を取ると、
\(E[\bar{x}_{ij.}]=\mu+\alpha_i+\beta_j +(\alpha\beta)_{ij}\)
\(E[\bar{x}_{…}]=\mu\)\(,\alpha_i=E[\bar{x}_{i..}-\bar{x}_{…}]\)\(,\beta_j=E[\bar{x}_{.j.}-\bar{x}_{…}]\)なので、\((\alpha\beta)_{ij}=E[\bar{x}_{ij.}-\bar{x}_{i..}-\bar{x}_{.j.}+\bar{x}_{…}]\)となる。
これらをもとに、\(x_{ijk}-\bar{x}_{…}\)を分解すると、
\(x_{ijk}-\bar{x}_{…}\)\(=(\bar{x}_{i..}-\bar{x}_{…})\)\(+(\bar{x}_{.j.}-\bar{x}_{…})\)\(+(\bar{x}_{ij.}-\bar{x}_{i..}-\bar{x}_{.j.}+\bar{x}_{…})\)\(+(x_{ijk}-\bar{x}_{ij.})\)
となる。(ただし、\((x_{ijk}-\bar{x}_{ij.})\)は残差項)
以上より、
\(\displaystyle \sum_{i,j,k} (x_{ijk}-\bar{x}_{…})^2 \)\( = \displaystyle \sum_{i,j,k} \{(\bar{x}_{i..}-\bar{x}_{…})\)\(+(\bar{x}_{.j.}-\bar{x}_{…})\)\(+(\bar{x}_{ij.}-\bar{x}_{i..}-\bar{x}_{.j.}+\bar{x}_{…})\)\(+(x_{ijk}-\bar{x}_{ij.})\}^2 \)
\( = \displaystyle \sum_{i,j,k} (\bar{x}_{i..}-\bar{x}_{…})^2\)\(+ \displaystyle \sum_{i,j,k}(\bar{x}_{.j.}-\bar{x}_{…})^2\)\(+ \displaystyle \sum_{i,j,k}(\bar{x}_{ij.}-\bar{x}_{i..}-\bar{x}_{.j.}+\bar{x}_{…})^2\)\(+ \displaystyle \sum_{i,j,k}(x_{ijk}-\bar{x}_{ij.})^2 \)
補足
ここで、右辺の各項の自由度を考えてみます。一番難しそうな第3項目の自由度のみを求めようと思います。
まず、本問の\( \displaystyle \sum_{i,j,k}(\bar{x}_{ij.}-\bar{x}_{i..}-\bar{x}_{.j.}+\bar{x}_{…})^2\)をより正確に書くと
\( \displaystyle \sum_{i=1}^{n_i}\sum_{j=1}^{n_j}\sum_{k=1}^{n_k}(\bar{x}_{ij.}-\bar{x}_{i..}-\bar{x}_{.j.}+\bar{x}_{…})^2\)
となる。
ここで、
\(\left \{
\begin{array}{}
E[\bar{x}_{ij.}]&=&\mu+\alpha_i+\beta_j + (\alpha\beta)_{ij}&=&\mu_{ij}\\
E[\bar{x}_{i..}]&=&\mu+\alpha_i&=&\mu_{i}\\
E[\bar{x}_{.j.}]&=&\mu+\beta_j &=&\mu_{j}\\
E[\bar{x}_{…}]&=&\mu
\end{array}
\right .\)
とすると、
\( \displaystyle \sum_{i=1}^{n_i}\sum_{j=1}^{n_j}\sum_{k=1}^{n_k}(\bar{x}_{ij.}-\bar{x}_{i..}-\bar{x}_{.j.}+\bar{x}_{…})^2\)
\( =\displaystyle \sum_{i=1}^{n_i}\sum_{j=1}^{n_j}\sum_{k=1}^{n_k}((\bar{x}_{ij.}-\mu_{ij})\)\(-(\bar{x}_{i..}-\mu_i)\)\(-(\bar{x}_{.j.}-\mu_j)\)\(+(\bar{x}_{…}-\mu)\)\(+(\alpha\beta)_{ij})^2\)
\((\alpha\beta)_{ij}\)は帰無仮説では\(0\)なので\(0\)として、
\( =\displaystyle \sum_{i=1}^{n_i}\sum_{j=1}^{n_j}\sum_{k=1}^{n_k}((\bar{x}_{ij.}-\mu_{ij})\)\(-(\bar{x}_{i..}-\mu_i)\)\(-(\bar{x}_{.j.}-\mu_j)\)\(+(\bar{x}_{…}-\mu))^2\)
これを全て展開し、適宜\(\displaystyle \sum_{i=1}^{n_i}\)\(,\displaystyle \sum_{j=1}^{n_j}\)で和を取る処理をすると、
\( =\displaystyle n_k \{\displaystyle \sum_{i=1}^{n_i} \sum_{j=1}^{n_j}(\bar{x}_{ij.}-\mu_{ij})^2\)\(-n_j\displaystyle \sum_{i=1}^{n_i}(\bar{x}_{i..}-\mu_i)^2\)\(-n_i\displaystyle \sum_{j=1}^{n_j}(\bar{x}_{.j.}-\mu_j)^2\)\(+n_in_j(\bar{x}_{…}-\mu)^2\}\)
これを\(S^2\)とし、\(\sigma^2\)で割ると、
\(\displaystyle\frac{S^2}{\sigma^2}\)\( =\displaystyle \sum_{i=1}^{n_i} \sum_{j=1}^{n_j}\frac{(\bar{x}_{ij.}-\mu_{ij})^2}{\sigma^2/n_k}\)\(-\displaystyle \sum_{i=1}^{n_i}\frac{(\bar{x}_{i..}-\mu_i)^2}{\sigma^2/n_jn_k}\)\(-\displaystyle \sum_{j=1}^{n_j}\frac{(\bar{x}_{.j.}-\mu_j)^2}{\sigma^2/n_in_k}\)\(+\displaystyle\frac{(\bar{x}_{…}-\mu)^2}{\sigma^2/n_in_jn_k}\)
ここで、\(\bar{x}_{ij.} \displaystyle \sim N\left(\mu_{ij},\frac{\sigma^2}{n_in_j}\right)\) (\(\bar{x}_{ij.}\)は\(n_i\times n_j\)個のデータの平均なので、分散は\(\sigma^2\)を\(n_in_j\)で割ったものになる)なので、
\(\displaystyle \sum_{i=1}^{n_i} \sum_{j=1}^{n_j}\frac{(\bar{x}_{ij.}-\mu_{ij})^2}{\sigma^2/n_k} \)\(\sim \chi^2(n_in_j)\)
同様に考えていくと1項目、2項目、3項目、4項目はそれぞれ、自由度\(n_in_j\)、自由度\(n_i\)、自由度\(n_j\)、自由度\(1\)の\(\chi^2\)分布に従うので、\(\displaystyle \frac{S^2}{\sigma^2}\)の自由度は
\(n_in_j-n_i-n_j+1\)\(=(n_i-1)(n_j-1)\)となる。
[5]
最尤推定値
\(x_{ijk}=\mu+\alpha_i + \beta_j + (\alpha\beta)_{ij}+\varepsilon_{ijk}\)なので、
\(\mu+\alpha_i + \beta_j + (\alpha\beta)_{ij}=\mu_{ij.}\)とすると、
\(x_{ijk}\sim N(\mu_{ij.},\sigma^2)\)
尤度\(L\)は
\(L=\displaystyle \prod_{i,j,k} \frac{1}{\sqrt{2\pi}\sigma} e^{-\frac{(x_{ijk}-\mu_{ij.})^2}{2\sigma^2}}\)
\(\ln L \)\(\displaystyle =-N \ln (\sqrt{2\pi}\sigma) -\sum_{i,j,k}\frac{(x_{ijk}-\mu_{ij.})^2}{2\sigma^2} \) (\(N\)は総数を表す)
細かな計算は省略するが、
\(\displaystyle \frac{\partial \ln L}{\partial \mu_{ij.}}=0\)を解くと、\(\mu_{ij.}=\bar{x}_{ij.}\)となり、
\(\displaystyle \frac{\partial \ln L}{\partial \sigma}=0\)を解くと、\(\displaystyle \sigma^2 = \frac{1}{N}\sum_{i,j,k}(x_{ijk}-\mu_{ij.})^2\)となることから、
\(\sigma^2\)の最尤推定値は解答のようになる。
不偏推定値
最尤推定値の\(\displaystyle \sum_{k=1}^{10}(x_{ijk}-\bar{x}_{ij.})^2\)に着目すると、これは\(X \sim N(\mu_{ij.},\sigma^2)\)とした時の、\(\displaystyle \sum_{k=1}^{10}(X_k-\bar{X})^2\)であるため、自由度が\(9\)である。\(i,j\)の足し合わせも考慮すると、最尤推定値の右辺の自由度は\(2\times 3\times 9=54\)となるので、不偏推定値は、
\(\displaystyle \hat{\sigma}^2 = \frac{1}{54}\sum_{i,j,k}(x_{ijk}-\mu_{ij.})^2\)
コメント