Pythonでグラフを描こう ― 棒グラフ/ヒストグラム/散布図/ヒートマップ 図17 英語と数学の成績を散布図にしたものデータを見る限りでは英語の成績と数学の成績には負の相関があるように思える。が、第3回で作成した相関係数を求めるプログラムで計算すると、0.453という正の相関が得られる。また、後の練習問題で取り組む回帰分析のプログラムを使って計算しても、回帰式の係数が0.404という正の値になる。これは、極端に成績の高い人と極端に成績の低い人がいて、それらの値に引きずられたため(ちなみに、それらの値を除外すると相関係数は-0.800という負の値になり、回帰式の係数も-0.596という負の値になる)。1、2件の外れ値だけでは何とも言えないが、全体を込みにして考えるのではなく、幾つかのクラスタがあるかもしれないなどと考えるヒントにもなる。 記事に戻る 羽山博,著