[データ分析]四分位範囲と平均情報量 〜 趣味や好みにはどれぐらいの幅があるのか?!

図1 四分位範囲とは(中央値を除外する方法)全体を半分に分け、中央値を求める。次に、中央値より小さな値のグループと、中央値より大きな値のグループを作る。つまり、中央値を除外してグループを分ける。データが偶数個の場合はちょうど真ん中の値がないが、その場合は中央にある2つの値を除外する。次に、小さいグループの中央値を求める。これが第1四分位数(Q1)となる。また、大きいグループの中央値が第3四分位数(Q3)となる。データが偶数個の場合は、中央にある2つの値の平均をQ1やQ3とする(全体の中央値であるQ2についても同様)。Q3-Q1が四分位範囲の値となる。