GitHub、機械学習を用いてソースコードから言語を検出/分類するツール「OctoLingua」を開発 ファイル拡張子がある状態(左)とない場合(中央)、ランダムな拡張子の場合(右)の性能(出典:GitHub) 記事に戻る @IT