[データ分析]重回帰分析による予測(線形回帰、多項式回帰) 〜 年式、走行距離、排気量から中古車の価格を予測

図4 変数同士の組み合わせ全てについて散布図を描く散布図を見ると、年式が極端に古い中古車が3つあることや、排気量が5000ccを超える特殊な車両があることも分かる。それらを除外すれば、年式と本体価格が直線的な関係になりそうである(このことについては、後のコラムで少し触れる)。走行距離については、10万kmを超えると本体価格がほとんど下限に近くなることが分かる。さらに、ヒストグラムを見れば、排気量が小さい中古車(軽自動車)が多いことも分かる。軽自動車を別扱いにすることも考えられるが、今回はこのまま進めることとする。

図4 変数同士の組み合わせ全てについて散布図を描く散布図を見ると、年式が極端に古い中古車が3つあることや、排気量が5000ccを超える特殊な車両があることも分かる。それらを除外すれば、年式と本体価格が直線的な関係になりそうである(このことについては、後のコラムで少し触れる)。走行距離については、10万kmを超えると本体価格がほとんど下限に近くなることが分かる。さらに、ヒストグラムを見れば、排気量が小さい中古車(軽自動車)が多いことも分かる。軽自動車を別扱いにすることも考えられるが、今回はこのまま進めることとする。