AI-OCRで国立国会図書館の資料をテキスト化　約1300万文字のデータセットから開発　その舞台裏に迫る

NDLOCRの開発には、旧字体の認識や複雑なレイアウトへの対応などが必要だった（出典：モルフォAIソリューションズのプレスリリース）

記事に戻る