統計検定 1級 2021年 統計応用(理工学) 問1 解答 解説

スポンサーリンク

[1]

柔らかい紙くず、硬い紙くずの順番で実験を行っているため、紙くずの硬さと実験順番は従属関係にある。

また、実験結果の変化が紙くずの硬さに依るものなのか、それとも実験回数を重ねて、慣れに依るものなのか分からなくなっている。

これを一言で表すと、この実験計画の不適切な点は、紙くずの硬さと実験順序が交絡している点である。

[2]

AICはモデルの良さを表す数値で、値が小さいほど良い。

今回は変数減少法なので、変数が全て含まれているモデルM15からスタートする。

M15のAICは44.18で、変数を1つ除いてAICが最小になるのは、M11~M14のうち、M11である。

M11のAICは42.18で、変数をさらに1つ除いてAICが最小になるのは、M5~M7のうち、M5である。

M5のAICは40.74で、M1とM2を見ると分かるように、これ以上変数を除いてもAICを下げることは出来ない。

よってモデルM5が選択される。

[3]

ロジスティック回帰モデルによって計算される確率の式

\(\displaystyle p=\frac{1}{1+e^{-x}}\)

の\(x\)が問題文中の線形予測子に相当する。

(柔らかいダミー)とは、ダミー変数のことで、柔らかい時に1、硬い時に0となる変数である。

ゴミ箱に入る確率を計算すると

\( p\)\(\displaystyle =\frac{1}{1+e^{-(3.496-1.658\times 0 -2.667\times 1.5)}}\)

[4]

正規線形回帰モデルを使うということは、以下のような式を考えることになる。

\((3回投げて入った回数)=\beta_0\)\(+\beta_1\times(硬さダミー)\)\(+\beta_2\times(距離)\)\(+\epsilon\)\((\epsilon\sim N(0,\sigma^2))\)

\(\boldsymbol{\beta}\)が定まったのち、この式に実験条件の硬さ、距離を代入して得られる値は、3回投げて入る回数の予測値である。

予測値としては、-1回や4回などありえない回数も予測値として計算される可能性もあります。

3回投げて入る回数として可能性のあるものは0,1,2,3回だけなので、入る回数の予測値を得る分析モデルは適切ではないように思う。

それよりも、入る回数が0,1,2,3回になる確率を得られるモデルが適切である。


コメント

タイトルとURLをコピーしました