AI-OCRで国立国会図書館の資料をテキスト化 約1300万文字のデータセットから開発 その舞台裏に迫る

NDLOCRの開発には、旧字体の認識や複雑なレイアウトへの対応などが必要だった(出典:モルフォAIソリューションズのプレスリリース)