UIとインフォグラフィックスの理解に特化した視覚言語モデル「ScreenAI」 Googleが開発

タスク生成パイプライン:1.さまざまなモデルを用いて画面にアノテーションを付ける。2.LLMを使用して、画面に関連するタスクを大規模に生成する。3.(オプション)別のLLMを使用して、または人間の評価者が、データを検証する(提供:Google)

タスク生成パイプライン:1.さまざまなモデルを用いて画面にアノテーションを付ける。2.LLMを使用して、画面に関連するタスクを大規模に生成する。3.(オプション)別のLLMを使用して、または人間の評価者が、データを検証する(提供:Google)