LLMの開発効率化に革新? 中国DeepSeekが「DeepSeek-OCR」発表 “テキストを画像化”でデータ圧縮

書籍内の写真を詳細なキャプションとして言語化し、ページ全体のテキストと画像を統合的に出力している例