超長文が処理できるオープンソース商用利用可LLM「MPT-7B」が公開

アカデミックタスクにおけるMPTとLLaMA-7B、他のモデルのゼロショットパフォーマンスの比較(提供:MosaicML Foundation)

アカデミックタスクにおけるMPTとLLaMA-7B、他のモデルのゼロショットパフォーマンスの比較(提供:MosaicML Foundation)