EvernoteでOCR処理したテキストデータを抽出する

GoogleドキュメントでOCR処理して抽出したテキストデータ。原稿にもよるが、内容はかなり正確で、テキストの重複もない。ちなみに縦書きの原稿では漢字まわりの変換がかなり怪しくなる。フリーソフトのレベルでは、実用に耐えうる品質のOCRはほぼ皆無といっていい。画像右は海外製の某OCRソフトでの抽出結果。日本語読み取りも可能で、国内でこのエンジンを使用したソフトも市販しているほどだが、実際に使ってみると漢字の読み取りがおぼつかないレベル

GoogleドキュメントでOCR処理して抽出したテキストデータ。原稿にもよるが、内容はかなり正確で、テキストの重複もない。ちなみに縦書きの原稿では漢字まわりの変換がかなり怪しくなる。フリーソフトのレベルでは、実用に耐えうる品質のOCRはほぼ皆無といっていい。画像右は海外製の某OCRソフトでの抽出結果。日本語読み取りも可能で、国内でこのエンジンを使用したソフトも市販しているほどだが、実際に使ってみると漢字の読み取りがおぼつかないレベル