統計検定 1級 2018年 統計応用(理工学) 問4 解答 解説

スポンサーリンク

[1]

(a)

まず、各因子について1,-1の数が4回ずつで等しくなるように割り振る。

とりあえずAには1,1,1,1,-1,-1,-1,-1と割り振る。

次に(A,B)の組み合わせ(1,1),(1,-1),(-1,1),(-1,-1)の個数が2個ずつになるようにBには1,1,-1,-1,1,1,-1,-1と割り振る。

Cについては(A,B,C)の組が重複しないように気を付けて、Cには1,-1,1,-1,1,-1,1,-1と割り振る。

Dについては1,-1,-1,1,-1,1,1,-1と割り振ることでA,B,C,A×B,B×C,C×Aのどれとも交絡しなくなる。

実験ABCD
11111
211-1-1
31-11-1
41-1-11
5-111-1
6-11-11
7-1-111
8-1-1-1-1

(b)

5因子だと、いずれかの2因子交互作用がある因子と交絡してしまうことは避けられない。

そこでA,B,C,Dは(a)と同様に割り振り、EはC×Dと交絡するように割り振る。

EにはC×Dの交互作用となる1,1,-1,-1,-1,-1,1,1を割り振る。

実験ABCDE
111111
211-1-11
31-11-1-1
41-1-11-1
5-111-1-1
6-11-11-1
7-1-1111
8-1-1-1-11

[2]

\(y_i\)は\(y_i\)\(=\mu\)\(+A_i\)\(+B_i\)\(+C_i\)\(+D_i\)\(+\varepsilon_i\)と表される。

ここで、\(\mu\)は因子に依らない切片分で\(A\)\(,B\)\(,C\)\(,D\)の各因子記号は因子の影響に依る切片からの変化分を表す。\(i\)は実験番号を表し、\(\varepsilon\)は\(\varepsilon \sim N(0,\sigma^2)\)とする。

ちなみに因子\(X\)(\(X=A,B,C,D\))の2水準の因子の値はそれぞれ、\(X_1\)\(=X\)\(,X_{-1}\)\(=-X\)とする。

2水準の因子は\(X_1 +X_{-1}=0\)(\(X=A,B,C,D\))が成り立つので、\(E[(y_1\)\(+y_2\)\(+y_3\)\(+y_4\)\(-y_5\)\(-y_6\)\(-y_7\)\(-y_8)/8]\)\(=A\)となることから、\(A\)の推定値は\((y_1\)\(+y_2\)\(+y_3\)\(+y_4\)\(-y_5\)\(-y_6\)\(-y_7\)\(-y_8)/8\)で計算出来る。

同様に\(A\times B\)の交互作用は実験計画表より1,1,-1,-1,-1,-1,1,1の割り振りに相当することから、\(A\times B\)の交互作用の推定値は\((y_1\)\(+y_2\)\(-y_3\)\(-y_4\)\(-y_5\)\(-y_6\)\(+y_7\)\(+y_8)/8\)で計算出来る。

[3]

[2]の各行を見た時に、\(B \times E\)の値が\(A\)列と一致しているので、\(A\)と\(B,E\)の交互作用は交絡している。

[4]

[2]より

\(\hat{A}\)\(=(y_1\)\(+y_2\)\(+y_3\)\(+y_4\)\(-y_5\)\(-y_6\)\(-y_7\)\(-y_8)/8\)

\(=A+(\varepsilon_1\)\(+\varepsilon_2\)\(+\varepsilon_3\)\(+\varepsilon_4\)\(-\varepsilon_5\)\(-\varepsilon_6\)\(-\varepsilon_7\)\(-\varepsilon_8)/8\)

ここで、

\(V[\hat{A}]\)\(=V[(\varepsilon_1\)\(+\varepsilon_2\)\(+\varepsilon_3\)\(+\varepsilon_4\)\(-\varepsilon_5\)\(-\varepsilon_6\)\(-\varepsilon_7\)\(-\varepsilon_8)/8]\)

\(\displaystyle =\frac{1}{8}V[\varepsilon]\)\(\displaystyle =\frac{\sigma^2}{8}\)

これと、\(E[\hat{A}]=A\)かつ\(\varepsilon_i\)が正規分布に従うことから、

\(\displaystyle \hat{A} \sim N\left(A,\frac{\sigma^2}{8}\right)\)

\(A\)の推定値は\(\hat{A}\)で良いとして、\(\sigma^2\)の推定値を作る必要がある。

\(\hat{A}\)の計算と同様に\(\hat{\mu}\)\(,\hat{B}\)\(,\hat{C}\)\(,\hat{D}\)を計算した状態で、不偏分散\(S^2\)は、

\( S^2 \)\(\displaystyle=\frac{1}{3}\sum_{i=1}^8 \{y_i-(\hat{\mu}+\hat{A}+\hat{B}+\hat{C}+\hat{D})\}^2\)

\(3\)で割るのは、自由度が\(8-5=3\)だからである。

ここで、\(\displaystyle \frac{3S^2}{\sigma^2}\sim \chi^2(3)\)に従うので、\(\displaystyle \frac{\hat{A}-A}{\sqrt{S^2/8}}\)は\(t(3)\)に従う。

標準誤差の定義は以下を参照で、

標準誤差 - Wikipedia

この\(\sqrt{S^2/8}=0.78\)で、各要因について帰無仮説として\(X=0\)(\(X=A,B,C,D\))として計算をすれば、\(A,B\)が5%有意だと分かる。

\(A\)については\(\displaystyle \frac{2.75}{0.78}=3.52\)が\(t(3)\)の上側5%点より大きいため有意である。

他の要因にも同様に計算する。

[5]

デザイン行列\(X\)は以下の通りである。

\(X\)\(=\left( \begin{array}{}1 &x_{1,1} & x_{1,2} & \cdots & x_{1,1}x_{1,2} \\ 1 &x_{2,1} & x_{2,2} & \cdots & x_{2,1}x_{2,2} \\ \vdots &\vdots& \vdots& \ddots & \vdots \\1 &x_{12,1} & x_{12,2} & \cdots & x_{12,1}x_{12,2}\end{array}\right)\)

これに対して\(Y=(y_1,y_2,\cdots,y_{12})’\)\(,\varepsilon=(\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_{12})’\)(\(\varepsilon_i \sim N(0,\sigma^2)\))とすると、今回の当てはめは、

\(Y=X\beta+\varepsilon\)

と書ける。まず\(\beta\)は、次の2乗和を最小にする\(\beta\)である(最小二乗法)。

\(S\)\(=(Y-X\beta)'(Y-X\beta)\)

\(=(Y’-\beta’X’)(Y-X\beta)\)

\(=Y’Y -\beta’ X’Y-Y’X\beta+\beta’ X’X\beta\)

\(\displaystyle \frac{dS}{d\beta}\)\(=-X’Y-(Y’X)’+2X’X\beta\)\(=0\)として、

\(\beta=(X’X)^{-1}X’Y\)

この時、\(x\)\(=(1,x_1,x_2,x_1^2,x_2^2,x_1x_2)\)を代入した時の\(y\)の予測値\(\tilde{y}\)は、

\(\tilde{y}=x\beta\)

\(=x(X’X)^{-1}X’Y\)

\(V[\tilde{y}]\)\(=V[x(X’X)^{-1}X’Y]\)

\(=x(X’X)^{-1}X’V[Y]X(X’X)^{-1}x’\)(\(V[AX]=XV[A]X’\)の証明をすると分かる)

ここで、\(V[Y]\)\(=V[\varepsilon]\)\(=\sigma^2\)(\(X\beta\)は実験結果により定数になっている)ので、

\(=x(X’X)^{-1}X’\sigma^2X(X’X)^{-1}x’\)

\(=\sigma^2 x(X’X)^{-1}x’\)

これに\(x\)\(=(1,x_1,x_2,x_1^2,x_2^2,x_1x_2)\)および問題文で与えられた\((X’X)^{-1}\)の値を代入することで\(x_1^2+x_2^2\)の関数であることが分かる。


コメント

タイトルとURLをコピーしました