データ分析の進め方と、分析前に知っておきたいデータの種類

図3 非構造化データの例上の例は、動物(ヒョウ)を撮影し、顔の部分を縦100×横100(ピクセル=点)の画像データにしたもの。各ピクセルの色はR(赤)、G(緑)、B(青)、α(不透明度)の度合いで表されている。このデータは行×列×色の3次元の配列の形式で表される。下の例は文章の一部。そのままでは詳しい分析ができないので、形態素解析と呼ばれる方法で、品詞に分解するなどの前処理を行っている。