目次(まとめ)

◾️ 偏差平方和と偏差積和を使って、決定係数を求める

◾️ 決定係数と偏差平方和を使って、残差平方和を求める

◾️ 参考文献


こんにちは、みっちゃんです。

今回の記事では、以前の記事に引き続き、2012年に行われた統計検定1級の応用数理(現:統計応用)の共通問題(問1)を取り上げて、解答を得るための方針について解説します(問題の詳細については、参考文献などをご覧ください)。

この問題では、以下のように、説明変数 \(x\) と目的変数 \(y\) が与えられたときに、このデータセットを表現する回帰直線を求める必要があります。

\(i = 1\)\(i = 2\)\(i = 3\)\(i = 4\)\(i = 5\)
\(x\)0.01.02.03.04.0
\(y\)0.50.52.52.54.5

以前の記事の中で、平均値、偏差平方和、偏差積和が以下のように与えられることを示しました。

説明変数 \(x\) と目的変数 \(y\) の平均値:
$${\overline x} = \frac{0.0+1.0+2.0+3.0+4.0}{5} = 2.0\\{\overline y} = \frac{0.5+0.5+2.5+2.5+4.5}{5} = 2.1$$
説明変数 \(x\) と目的変数 \(y\) の偏差平方和:
$$A_x = \sum_{i = 1}^5 (x_i - {\overline x})^2 = 10.0\\A_y = \sum_{i = 1}^5 (y_i - {\overline y})^2 = 11.2$$
説明変数 \(x\) と目的変数 \(y\) の偏差積和:
$$A_{x,y} = \sum_{i = 1}^5 (x_i - {\overline x})(y_i - {\overline y}) = 10.0$$

偏差平方和と偏差積和を使って、決定係数を求める

決定係数とは、モデルに基づく予測値と観測値との相関係数の2乗値であり、偏差平方和と偏差積和を用いて、以下のように計算されます。
$$R^2 = \frac{A_{x,y}^2}{A_xA_y}$$
したがって、与えられているデータを代入して、\(R^2 = 0.893\) となります。

決定係数と偏差平方和を使って、残差平方和を求める

残差とは、モデルに基づく予測値と観測値との差であり、残差平方和はその2乗値になります。

決定係数を用いる場合、以下のように計算されます。
$$RSS = (1- R^2)A_y$$
したがって、与えられているデータを代入して、\(RSS = 1.2\) となります。

参考文献

日本統計学会「統計検定1級 公式問題集」実務教育出版