Auf der jährlichen GPU Technology Conference hat Nvidia den neuen Tesla P100 GPU High-Performance Computing-Accelerator vorgestellt. Er basiert auf der Pascal GP100-GPU.
Die im Tesla P100 HPC-Beschleuniger verwendete GPU “GP100“ ist im 16nm FinFET-Verfahren von TSMC gebaut, misst 610mm
2 und verfügt über 15.3 Milliarden Transistoren. Weiterhin bietet sie 16 GB der zweiten Generation an High Bandwidth Memory (HBM2) und stellt Rechenleistungen in Höhe von 5.3 TFLOPS bei FP64, 10.6 TFLOPS bei FP32 und 21.2 TFLOPS bei FP 16 bereit.
Der Grafikprozessor im Tesla P100 HPC-Beschleuniger zählt mit 56 Streaming Multiprocessor (SM)-Einheiten, was insgesamt 3584 CUDA-Kerne ergibt. Hierbei ist zu beachten, dass eine vollständig freigeschaltete GP100 60 SMs bietet, also 3840 CUDA-Kerne.
Die GPU wurde mit der Chip-On-Wafer-On-Substrate-Technologie von TSMC hergestellt, so dass die GPU und der HBM2-DRAM sich auf demselben Interposer befinden. Die 16GB HBM2 sind mit einem 4096-bit-Speicherinterface verbunden. Weiterhin liegt die Speichertaktrate bei 1.4Gbps, was in der beeindruckenden Bandbreite von 720GB/s resultiert.
Außerdem legte Nvidia hohen Wert auf den NV-Link-Support der Tesla P100. So bietet der Accelerator 4 NVLink-Controller. Dies erlaubt es den GPUs, sich direkt miteinander oder mit der CPU zu verbinden und so eine deutlich höhere Bandbreite als per PCI-Express 3.0-Interface zu bieten.
Nvidia zufolge befindet sich der Tesla P100 HPC-Beschleuniger momentan in de Massenproduktion und sollte Erstausrüstern für HPC-Server im ersten Quartal des nächsten Jahres zur Verfügung stehen.
Quelle:
Nvidia.com.