前回の記事で、Excelを使って重回帰分析をおこなう方法を紹介した。

https://chusotsu-program.com/excel-trend

今回は、重回帰分析で使われる回帰式の、複数の係数と定数項(切片)を求めるExcel関数を紹介する。

LINEST関数の使い方

今回も駅歩、築年数、面積から家賃を求める重回帰分析を例とする。

まず、重回帰分析の回帰式を整理しておく。

$$y = a^1x^1 + a^2x^2 + a^3x^3 + … + b$$

今回の例で言うと回帰式は以下のとおりとなる。

$$家賃= 駅歩a^1 + 築年数a^2 + 面積a^3 + b$$

今回LINEST関数を使って求めるのが、a1〜a3の係数とbの定数項(切片)だ。

先ほどのシートのセルG2に以下のように入力する。

引数の取り方は、まず第一引数に目的変数(家賃が入力されている範囲)を、第二引数に説明変数(駅歩、築年数、面積が入力されている範囲)を指定。
第三引数では定数項を計算するかどうか、第四引数では補正項を求めるかどうかを指定する。

補正項を求めると、回帰式の当てはまりの良さを調べることができるが、ここでは取り上げないのでFALSEを指定する。

LINEST関数は配列数式なので、G2セルにを入力するとG2〜J2まで一気に値が返される。

なお、LINEST関数では求められた係数が、逆順で返されることに注意が必要。

つまり、LINEST関数の第二引数で指定した説明変数の順序が「駅歩・築年数・面積」だった場合、「面積・築年数・駅歩」の順で返されるということだ。

求められた結果を見ると、面積の係数が最も大きいので、3つの説明変数の中で家賃に最も影響を与えるのが面積の広さということが分かる。

また、築年数、駅歩が負の値となっているということは、いずれの変数も値が大きくなるにつれ家賃が安くなるということも分かる。

LINEST関数を使って重回帰分析の係数を求めると、どの要素が最も影響度の高い変数かが分かり、あらゆる分析に役立てることができる。