米NVIDIAのCEOが絶賛する“日本のCUDA”

気象モデルをCUDA環境に移植する作業では、まず浮動小数点演算の負荷が高い物理過程の一部だけを移植し、その結果を検討して、力学過程も含めたすべての処理を移植した(写真=左)。移植作業では、オリジナルコードのFORTRANをCUDAと親和性の高いC/C++に移植してから、CUDA環境に移植した。左下のグラフでは、格子数と演算性能の関係を1コアGPU(倍精度演算)と12コアCPU(倍精度演算)、GPU(倍精度演算)、GPU(単精度演算)で比較し、右下のグラフではGPU、CPUそれぞれのコア数と演算性能の関係をCPU(倍精度演算)、GPU(倍精度演算)、GPU(単精度演算)で比べている(写真=右)