[1]
(a)
まず、各因子について1,-1の数が4回ずつで等しくなるように割り振る。
とりあえずAには1,1,1,1,-1,-1,-1,-1と割り振る。
次に\((A,B)\)の組み合わせ(1,1),(1,-1),(-1,1),(-1,-1)の個数が2個ずつになるように\(B\)には1,1,-1,-1,1,1,-1,-1と割り振る。
\(C\)については\((A,B,C)\)の組が重複しないように気を付けて、\(C\)には1,-1,1,-1,1,-1,1,-1と割り振る。
\(D\)については1,-1,-1,1,-1,1,1,-1と割り振ることで\(A\)\(,B\)\(,C\)\(,A×B\)\(,B×C\)\(,C×A\)のどれとも交絡しなくなる。
実験 | \(A\) | \(B\) | \(C\) | \(D\) |
1 | 1 | 1 | 1 | 1 |
2 | 1 | 1 | -1 | -1 |
3 | 1 | -1 | 1 | -1 |
4 | 1 | -1 | -1 | 1 |
5 | -1 | 1 | 1 | -1 |
6 | -1 | 1 | -1 | 1 |
7 | -1 | -1 | 1 | 1 |
8 | -1 | -1 | -1 | -1 |
(b)
5因子だと、いずれかの2因子交互作用がある因子と交絡してしまうことは避けられない。
そこでA,B,C,Dは(a)と同様に割り振り、EはC×Dと交絡するように割り振る。
EにはC×Dの交互作用となる1,1,-1,-1,-1,-1,1,1を割り振る。
実験 | A | B | C | D | E |
1 | 1 | 1 | 1 | 1 | 1 |
2 | 1 | 1 | -1 | -1 | 1 |
3 | 1 | -1 | 1 | -1 | -1 |
4 | 1 | -1 | -1 | 1 | -1 |
5 | -1 | 1 | 1 | -1 | -1 |
6 | -1 | 1 | -1 | 1 | -1 |
7 | -1 | -1 | 1 | 1 | 1 |
8 | -1 | -1 | -1 | -1 | 1 |
[2]
\(y_i\)は\(y_i\)\(=\mu\)\(+A_i\)\(+B_i\)\(+C_i\)\(+D_i\)\(+\varepsilon_i\)と表される。
ここで、\(\mu\)は因子に依らない切片分で\(A\)\(,B\)\(,C\)\(,D\)の各因子記号は因子の影響に依る切片からの変化分を表す。\(i\)は実験番号を表し、\(\varepsilon\)は\(\varepsilon \sim N(0,\sigma^2)\)とする。
ちなみに因子\(X\)(\(X=A,B,C,D\))の2水準の因子の値はそれぞれ、\(X_1\)\(=X\)\(,X_{-1}\)\(=-X\)とする。
2水準の因子は\(X_1 +X_{-1}=0\)(\(X=A,B,C,D\))が成り立つので、\(E[(y_1\)\(+y_2\)\(+y_3\)\(+y_4\)\(-y_5\)\(-y_6\)\(-y_7\)\(-y_8)/8]\)\(=A\)となることから、\(A\)の推定値は\((y_1\)\(+y_2\)\(+y_3\)\(+y_4\)\(-y_5\)\(-y_6\)\(-y_7\)\(-y_8)/8\)で計算出来る。
同様に\(A\times B\)の交互作用は実験計画表より1,1,-1,-1,-1,-1,1,1の割り振りに相当することから、\(A\times B\)の交互作用の推定値は\((y_1\)\(+y_2\)\(-y_3\)\(-y_4\)\(-y_5\)\(-y_6\)\(+y_7\)\(+y_8)/8\)で計算出来る。
[3]
[2]の各行を見た時に、\(B \times E\)の値が\(A\)列と一致しているので、\(A\)と\(B,E\)の交互作用は交絡している。
[4]
[2]より
\(\hat{A}\)\(=(y_1\)\(+y_2\)\(+y_3\)\(+y_4\)\(-y_5\)\(-y_6\)\(-y_7\)\(-y_8)/8\)
\(=A+(\varepsilon_1\)\(+\varepsilon_2\)\(+\varepsilon_3\)\(+\varepsilon_4\)\(-\varepsilon_5\)\(-\varepsilon_6\)\(-\varepsilon_7\)\(-\varepsilon_8)/8\)
ここで、
\(V[\hat{A}]\)\(=V[(\varepsilon_1\)\(+\varepsilon_2\)\(+\varepsilon_3\)\(+\varepsilon_4\)\(-\varepsilon_5\)\(-\varepsilon_6\)\(-\varepsilon_7\)\(-\varepsilon_8)/8]\)
\(\displaystyle =\frac{1}{8}V[\varepsilon]\)\(\displaystyle =\frac{\sigma^2}{8}\)
これと、\(E[\hat{A}]=A\)かつ\(\varepsilon_i\)が正規分布に従うことから、
\(\displaystyle \hat{A} \sim N\left(A,\frac{\sigma^2}{8}\right)\)
\(A\)の推定値は\(\hat{A}\)で良いとして、\(\sigma^2\)の推定値を作る必要がある。
\(\hat{A}\)の計算と同様に\(\hat{\mu}\)\(,\hat{B}\)\(,\hat{C}\)\(,\hat{D}\)を計算した状態で、不偏分散\(S^2\)は、
\( S^2 \)\(\displaystyle=\frac{1}{3}\sum_{i=1}^8 \{y_i-(\hat{\mu}+\hat{A}+\hat{B}+\hat{C}+\hat{D})\}^2\)
\(3\)で割るのは、自由度が\(8-5=3\)だからである。
ここで、\(\displaystyle \frac{3S^2}{\sigma^2}\sim \chi^2(3)\)に従うので、\(\displaystyle \frac{\hat{A}-A}{\sqrt{S^2/8}}\)は\(t(3)\)に従う。
標準誤差の定義は以下を参照で、
この\(\sqrt{S^2/8}=0.78\)で、各要因について帰無仮説として\(X=0\)(\(X=A,B,C,D\))として計算をすれば、\(A,B\)が5%有意だと分かる。
\(A\)については\(\displaystyle \frac{2.75}{0.78}=3.52\)が\(t(3)\)の上側5%点より大きいため有意である。
他の要因にも同様に計算する。
[5]
デザイン行列\(X\)は以下の通りである。
\(X\)\(=\left( \begin{array}{}1 &x_{1,1} & x_{1,2} & \cdots & x_{1,1}x_{1,2} \\ 1 &x_{2,1} & x_{2,2} & \cdots & x_{2,1}x_{2,2} \\ \vdots &\vdots& \vdots& \ddots & \vdots \\1 &x_{12,1} & x_{12,2} & \cdots & x_{12,1}x_{12,2}\end{array}\right)\)
これに対して\(Y=(y_1,y_2,\cdots,y_{12})’\)\(,\varepsilon=(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_{12})’\)(\(\varepsilon_i \sim N(0,\sigma^2)\))とすると、今回の当てはめは、
\(Y=X\beta+\varepsilon\)
と書ける。まず\(\beta\)は、次の2乗和を最小にする\(\beta\)である(最小二乗法)。
\(S\)\(=(Y-X\beta)'(Y-X\beta)\)
\(=(Y’-\beta’X’)(Y-X\beta)\)
\(=Y’Y -\beta’ X’Y-Y’X\beta+\beta’ X’X\beta\)
\(\displaystyle \frac{dS}{d\beta}\)\(=-X’Y-(Y’X)’+2X’X\beta\)\(=0\)として、
\(\beta=(X’X)^{-1}X’Y\)
この時、\(x\)\(=(1,x_1,x_2,x_1^2,x_2^2,x_1x_2)\)を代入した時の\(y\)の予測値\(\tilde{y}\)は、
\(\tilde{y}=x\beta\)
\(=x(X’X)^{-1}X’Y\)
\(V[\tilde{y}]\)\(=V[x(X’X)^{-1}X’Y]\)
\(=x(X’X)^{-1}X’V[Y]X(X’X)^{-1}x’\)(\(V[AX]=XV[A]X’\)の証明をすると分かる)
ここで、\(V[Y]\)\(=V[\varepsilon]\)\(=\sigma^2\)(\(X\beta\)は実験結果により定数になっている)ので、
\(=x(X’X)^{-1}X’\sigma^2X(X’X)^{-1}x’\)
\(=\sigma^2 x(X’X)^{-1}x’\)
これに\(x\)\(=(1,x_1,x_2,x_1^2,x_2^2,x_1x_2)\)および問題文で与えられた\((X’X)^{-1}\)の値を代入することで\(x_1^2+x_2^2\)の関数であることが分かる。
コメント