テキストだけじゃない? 画像データも理解できる「VLM」(視覚言語モデル)を導入する方法

gpt-oss-20b以外のモデルをダウンロードするために、虫眼鏡アイコンをクリックしよう