Auf einem Tech Day im kalifornischen Sonoma hat AMD zum ersten Mal seine neue Radeon Instinct-Produktlinie demonstriert. Deren neues Flaggschiff basiert höchstwahrscheinlich auf der Vega-GPU und trägt den Namen MI25.
Raja Koduri, Vorstand der AMD Radeon Technologies Group, hat persönlich den neuen Pixelbeschleuniger vorgestellt. Er gibt an, dass bereits seit einigen Wochen funktionierende Muster der neuen GPU existieren und AMD momentan die Karten weiter optimiert. Nichtsdestotrotz gab es Systeme, die mit Radeon Instinct MI25-Grafikbeschleuniger liefen. Auf einem dieser Rechner war Doom installiert, das über die Vulkan-API bei 4K mit beachtlichen 68 FPS lief.
Dabei hat Koduri explizit erwähnt, dass Vega „NCU” verwende und so die Entstehung neuer Gerüchte angefeuert. Eine der Theorien stammt von Computerbase und legt nahe, dass „NCU“ für „New/Next Compute Unit“ stünde. Dies würde bedeuten, dass AMD die Architektur stark überarbeitet hätte.
Darüber hinaus sieht es so aus, als wiese die Nummer in jeweiligen Namen auf die FP32-Leistung hin. So sollte MI25 25 TFLOPS erreichen, während MI8 8.2 TFLOPS schaffe und MI6 5.7 TFLOPS berechnen könne. Im Vergleich zu Fiji wäre die Rechenleistung somit verdreifacht worden. Es ist also denkbar, dass AMD ein Feature verwednet, mit dem sich zwei FP16-Kalkulationen über FP32-ALU gleichzeitig ausführen lassen. Bisher war nur die GP100-GPU von Nvidia dazu in der Lage.
Auf einer anderen Slide wird aufgeführt, dass sowohl High Bandwidth Cache als auch ein entsprechender Controller zum Einsatz kämen. Dies kommentierte Koduri zwar nicht, es wurde jedoch bereits offiziell bestätigt, dass Vega HBM2-VRAM verwenden wird. Doch wozu genau der HBM-Cache diene, ist noch unklar. So wäre ein HBM-Cache anscheinend nicht so schnell wie ein L2- oder L1-Cache.
Im Bezug auf die Verwendung von HBM2 ist einem AMD-Mitarbeiter herausgerutscht, dass MI25 512GB/s an Bandbreite böte. Hieraus lässt sich schlussfolgern, dass HBM2 entweder mit zwei oder mit vier Stacks implementiert wird. Zwei Stacks würden 8, 16, 32 oder 64 GB an Videospeicher ermöglichen, während Viererstapel in 16, 32, 64 oder 128 GB resultieren können.
Allerdings sind 64GB (2 Stacks) oder 128GB (4 Stacks) unwahrscheinlich, da es noch keinen HBM2-Speicher mit einer für solche Module notwendigen Dichte gibt.
Quelle:
Techpowerup -
ComputerBase