目次(まとめ)

◾️ 偏差平方和と偏差積和を使って、回帰直線の傾きを求める

◾️ 求めた傾きと平均値を使って、回帰直線の切片を求める

◾️ 参考文献


こんにちは、みっちゃんです。

今回の記事では、2012年に行われた統計検定1級の応用数理(現:統計応用)の共通問題(問1)を取り上げて、解答を得るための方針について解説します(問題の詳細については、参考文献などをご覧ください)。

この問題では、以下のように、説明変数 \(x\) と目的変数 \(y\) が与えられたときに、このデータセットを表現する回帰直線を求める必要があります。

\(i = 1\)\(i = 2\)\(i = 3\)\(i = 4\)\(i = 5\)
\(x\)0.01.02.03.04.0
\(y\)0.50.52.52.54.5

偏差平方和と偏差積和を使って、回帰直線の傾きを求める

ここでは、上の表で与えられたデータを表現する、以下のような回帰直線を求めることを考えます。
$$y = a + bx$$
まず、上の表で与えられたデータから、「偏差平方和」を求めます。

「偏差平方和」とは、"平均値と観測値の差" の平方和(2乗和)です。

説明変数 \(x\) の平均 \({\overline x}\)、目的変数 \(y\) の平均 \({\overline y}\) は、以下のように算出できます。
$${\overline x} = \frac{0.0+1.0+2.0+3.0+4.0}{5} = 2.0\\{\overline y} = \frac{0.5+0.5+2.5+2.5+4.5}{5} = 2.1$$
この情報を用いて、偏差平方和は以下のように計算されます。
$$A_x = \sum_{i = 1}^5 (x_i - {\overline x})^2 = 10.0\\A_y = \sum_{i = 1}^5 (y_i - {\overline y})^2 = 11.2$$
同じように、「偏差積和」を求めます。

「偏差積和」とは、"説明変数の平均値と観測値の差" と "目的変数の平均値と観測値の差" の積の和です。

したがって、偏差積和は以下のように計算されます。
$$A_{x,y} = \sum_{i = 1}^5 (x_i - {\overline x})(y_i - {\overline y}) = 10.0$$
回帰直線の傾き "\(b\)" は、説明変数 \(x\) の偏差平方和と、偏差積和を用いて、以下のように計算することができます。
$$b = \frac{A_{x, y}}{A_x} = \frac{10.0}{10.0} = 1$$

求めた傾きと平均値を使って、回帰直線の切片を求める

回帰直線の切片 "\(a\)" は、上で求めた傾き "\(b\)"、説明変数 \(x\) の平均値 \({\overline x}\)、目的変数 \(y\) の平均値 \({\overline y}\) を使って計算することができます。
$$a = {\overline y} - b{\overline x} = 2.1 - 1\times2.0 = 0.1$$

参考文献

日本統計学会「統計検定1級 公式問題集」実務教育出版