目次(まとめ)
◾️ 偏差平方和と偏差積和を使って、決定係数を求める
◾️ 決定係数と偏差平方和を使って、残差平方和を求める
◾️ 参考文献
こんにちは、みっちゃんです。
今回の記事では、以前の記事に引き続き、2012年に行われた統計検定1級の応用数理(現:統計応用)の共通問題(問1)を取り上げて、解答を得るための方針について解説します(問題の詳細については、参考文献などをご覧ください)。
この問題では、以下のように、説明変数 \(x\) と目的変数 \(y\) が与えられたときに、このデータセットを表現する回帰直線を求める必要があります。
\(i = 1\) | \(i = 2\) | \(i = 3\) | \(i = 4\) | \(i = 5\) | |
\(x\) | 0.0 | 1.0 | 2.0 | 3.0 | 4.0 |
\(y\) | 0.5 | 0.5 | 2.5 | 2.5 | 4.5 |
以前の記事の中で、平均値、偏差平方和、偏差積和が以下のように与えられることを示しました。
説明変数 \(x\) と目的変数 \(y\) の平均値:
$${\overline x} = \frac{0.0+1.0+2.0+3.0+4.0}{5} = 2.0\\{\overline y} = \frac{0.5+0.5+2.5+2.5+4.5}{5} = 2.1$$
説明変数 \(x\) と目的変数 \(y\) の偏差平方和:
$$A_x = \sum_{i = 1}^5 (x_i - {\overline x})^2 = 10.0\\A_y = \sum_{i = 1}^5 (y_i - {\overline y})^2 = 11.2$$
説明変数 \(x\) と目的変数 \(y\) の偏差積和:
$$A_{x,y} = \sum_{i = 1}^5 (x_i - {\overline x})(y_i - {\overline y}) = 10.0$$
偏差平方和と偏差積和を使って、決定係数を求める
決定係数とは、モデルに基づく予測値と観測値との相関係数の2乗値であり、偏差平方和と偏差積和を用いて、以下のように計算されます。
$$R^2 = \frac{A_{x,y}^2}{A_xA_y}$$
したがって、与えられているデータを代入して、\(R^2 = 0.893\) となります。
決定係数と偏差平方和を使って、残差平方和を求める
残差とは、モデルに基づく予測値と観測値との差であり、残差平方和はその2乗値になります。
決定係数を用いる場合、以下のように計算されます。
$$RSS = (1- R^2)A_y$$
したがって、与えられているデータを代入して、\(RSS = 1.2\) となります。