GPUアーキテクチャ |
Ampere |
GPUメモリー |
40GB HBM2 |
メモリーインターフェース |
5,120bit |
メモリー帯域幅 |
1.5TB/s |
NVIDIA CUDAコア数 |
6,912 |
NVIDIA 第4世代 Tensorコア数 |
432 |
倍精度演算性能(TFLOPS)※1 |
9.7 |
単精度演算性能(TFLOPS)※1 |
19.5 |
Tensor性能(TFLOPS)※2 |
623.8 |
マルチインスタンスGPU |
最大7MIGインスタンス@5GB |
システムインターフェース |
PCI Express 4.0 x16 |
最大消費電力 |
240W |
サーマルソリューション |
アクティブ |
フォームファクター |
4.4(H)×10.5(L) inch, デュアルスロット, フルハイト |
ディスプレイコネクター |
なし(別途コンパニオンGPUが必要 ※3) |
電源コネクター |
PCIe CEM5 16pin×1 |
NVIDIA NVLink |
対応(2枚必要) |
|
※1 GPUブーストクロックに基づくピークレート |
|
※2 新しいスパース機能を使用した効果的なFP8 teraFLOPS |
|
※3 ディスプレイ出力機能をサポートするには、NVIDIA RTX 4000 Ada 世代、NVIDIA RTX A4000、または NVIDIA T1000のいずれかが必要です。 |