GPUの新時代を切り開く「Turing」アーキテクチャ徹底解説

NVIDIA GPUは、データ全体(グリッドと呼ばれる)を分割したブロックを複数同時に1つのスレッドプログラムで処理する。ブロックに含まれるデータの数だけプログラムが同時に実行されるが、GPU内部では、これを32スレッドのWARPに分割して実行する。SMが多ければ、同時に処理できるスレッドブロックの数が多くなり、結果的に処理性能が向上する