Microsoft、1枚の写真と音声から本当に話しているかのような動画を生成するAIモデル「VASA-1」を発表

視線の向きを変更(上) 頭部の遠近感を変更(中)感情を変更(下)(提供:Microsoft Research Asia)

視線の向きを変更(上) 頭部の遠近感を変更(中)感情を変更(下)(提供:Microsoft Research Asia)