先日の記事で、Excelでの単回帰分析により部屋面積から家賃を予測する例を取り上げた。
しかし、家賃は単に部屋面積だけでなく、駅からの距離や築年数なども相関関係にあるかもしれない。
その場合、説明変数が複数に増えるため重回帰分析をおこなう必要があるのだが、Excelでは重回帰分析を簡単におこなうことができる関数も用意されているため、今回はその使い方を学んでいく。
重回帰分析とは
単回帰分析は説明変数が一つだったのに対し、重回帰分析は説明変数が複数あるので回帰式は以下のようになる。
$$y = a^1x^1 + a^2x^2 + a^3x^3 + … + b$$
xが説明変数、yが目的変数をあらわし、aが係数(傾き)、bが定数項(切片)となる。
今回は以下のデータを学習データとし、駅歩、築年数、面積の3つの説明変数を使って重回帰分析をおこなっていく。
重回帰分析をおこなうTREND関数の使い方
Excel(Googleスプレッドシート)では、重回帰分析をおこなうためのTREND関数が用意されている。
予測をおこなうためのデータとして、以下の値をあらかじめ入力しておくことにした。
引数の取り方は、まず第一引数に目的変数の範囲を指定。
次に説明変数の範囲を第二引数に指定する。
この時、説明変数が一つであっても良いので、TREND関数は単回帰分析もおこなうことができる。
第三引数には、予測に使うデータが入力されている範囲を指定する。
最後は定数項を計算するか否かを指定する引数で、今回は定数項を計算したいのでTRUEを設定。
こうして求められた予測値がこちら。
TREND関数を使えば、たったこれだけの手順で複雑な重回帰分析による予測を簡単におこなうことができる。