[UPDATE] Nvidia Titan X 12 GB: Neues Single-GPU-Flaggschiff

Ihr habt ein Händchen für Wechselkursspiele mit Britischem Pfund und Japanischen Yen? Ihr besitzt ein fantastisches Rezept für eine scharfe Soße, die weltweit vertrieben wird? Ihr seid just zum Partner in der Firma eures Schwiegervaters aufgestiegen? Wer eine dieser Fragen bejahen kann, gehört zu einer Elite, die sich keinerlei Sorgen um Geld machen muss und neben einem Strandhaus auch einen Bentley und reichlich Bulgari-Schmuck besitzt.

UPDATE 16.08.2015: Mit dem heutigen Update erweitern wir unseren Launch-Artikel von Nvidias GeForce GTX Titan X 12GB auf Pascal-Basis um die Messungen zu Leistungsaufnahme, Temperaturverhalten und Betriebsgeräusch, die – neben anderen Inhalten – wir von Tom’s Hardware Deutschland wegen unserer besonderen Messmöglichkeiten beisteuern.

Wie ihr wisst, sind diese Seiten normalerweise Teil des eigentlichen Launch-Artikels, der in diesem Fall am 3. August veröffentlich wurde.

Da Nvidia uns diesmal aber keine eigene Karte stellen konnte oder wollte, mussten wir das Tests-Sample unserer US-Kollegen nach Abschluss ihrer Messungen einfliegen lassen, was leider eine zeitliche Verzögerung bedeutet. Aber nun ist der Artikel ja endlich komplett.

Und für genau diese erlesene Käuferschicht bietet Nvidia nun auch die passende Grafikkarte für den heimischen Gaming-PC an: Die Titan X. Diese basiert auf der neuen GP102-GPU, bringt 3584 CUDA-Cores sowie 12 GByte GDDR5X mit, die über ein 384 Bit breites Speicherinterface angebunden sind. Die Karte wird nur über Nvidias eigenen Shop verkauft werden und soll 1200 US-Dollar kosten.

Bevor überhaupt ein einziges Benchmarkresultat veröffentlicht wurde, erhielt Nvidia bereits viel Lob für den Launch der dritten Pascal-GPU in ebenso vielen Monaten. Gleichzeitig gab es aber auch viel Kritik für den Preisaufschlag für das neue Flaggschiff – mit diesem Vorgehen hatte sich bereits zuvor Intel die Finger verbrannt, als der Core i7-6950X zu einem bis dato noch nie dagewesenen, offiziellen Verkaufspreis von 1723 US-Dollar vorgestellt wurde.

Weitere interessante Tests und Artikel zum Thema Grafikkarten
>>>   THDE intern: So messen und bewerten wir die Grafik-Performance
>>>   Pascal-Roundup: Nvidias GeForce GTX 1070 und GeForce GTX 1080 im Vergleich
>>>   Pascal-Roundup #2: Nvidia GeForce GTX 1060 im Vergleich
>>>   Nvidia GeForce GTX 1080 Founders Edition (Pascal, Launch-Artikel)
>>>   Nvidia GeForce GTX 1070 Founders Edition (Pascal, Launch-Artikel)
>>>   Effizienzanalyse & Leistungsaufnahme: GeForce GTX 1070/1080 vs. GTX 980 Ti
>>>   AMD Radeon RX 480 8GB (Polaris, Launch-Artikel)
>>>   AMD Radeon RX 480 im Detail: Leistungsaufnahme, Board-Layout & Normen
>>>   AMD Radeon RX 480: Neuer Treiber entlastet das Mainboard deutlich
>>>   AMD Radeon RX 470 4GB (Polaris, Launch-Artikel)
>>>   AMD Radeon RX 460 4GB (Polaris, Launch-Artikel)
>>>   Maxwell-Roundup: GeForce GTX 970 und GeForce GTX 980 im Vergleich

Diejenigen, die sich grundsätzlich nur das Beste vom Besten kaufen, werden sich trotzdem nur wenig um die schleichende Luxussteuer kümmern. Alle, die ihren PC produktiv und erwerbsmäßig nutzen, werden ebenfalls bereitwillig einen Premium-Aufschlag zahlen, um in kürzerer Zeit mehr Aufgaben erledigen und somit mehr Geld verdienen zu können.

Die Titan X kostet 70 Prozent mehr als eine GeForce GTX 1080, bietet dafür 40 Prozent mehr CUDA-Cores und 50 Prozent mehr Speicherbandbreite. Uns war somit bereits vor dem Erhalt eines Testmusters klar, dass Preis und Leistung kaum linear skalieren würden. Aber dennoch waren wir sehr gespannt auf die Benchmark-Werte. Die Kernfrage ist die folgende: Ist die Titan X in der Lage, bei 4k-Auflösung deutlich mehr FPS als alle anderen Single-GPU-Lösungen zu bieten und endlich High-Quality-Gaming deutlich jenseits von 1920 x 1080 Pixeln möglich zu machen?

GP102: Wie die GP104-GPU, nur größer

Erstmals zeigte uns Nvidia die GP104-GPU (High-End-Ausbaustufe der Pascal-Architektur) in Form der GeForce GTX 1080. Im Geiste ist diese GPU der Nachfolger des GM204-Chips (High-End-Ausbaustufe der Maxwell-Architektur), der zuletzt auf der GTX 980 zum Einsatz kam. Da die Vorstellung der Pascal-Architektur mit der Umstellung des Fertigungsprozesses auf 16-nm-FinFET und mit der Einführung des schnelleren GDDR5X-Speichers zusammenfiel, war es der GTX 1080 möglich, 30 Prozent und mehr FPS zu liefern als die GTX 980 Ti oder die alte Version der Titan X, die beide noch auf GM200-Basis arbeiteten (Ultra-High-End Ausbaustufe der Maxwell-Architektur).

Aufgrund dieses erheblichen Leistungsplus hielt sich der Wunsch nach einer noch größeren Ausbaustufe zunächst zumindest ein wenig in Grenzen – vor allem, da bereits im Vorfeld klar war, dass der GP100 mit seinen 15,3 Milliarden Transistoren (Ultra-High-End-Ausbaustufe der Pascal-Architektur) nicht für den normalen Desktop-Einsatz, sondern für GPU-Compute-Operationen gedacht sein würde.

Mit dem GP102-Chip bietet Nvidia eine Zwischenstufe zwischen Highest-End-GPU und GP104 an. Die Architektur des GP102 ist der des GP104 sehr ähnlich, die neue GPU fällt allerdings größer aus. Hier gibt es sechs statt vier Graphics-Processing-Cluster und aus 20 Streaming-Multiprozessoren (SM) werden 30. Bei 128 FP32 CUDA Cores pro SM kommt der GP102 auf insgesamt 3840 programmierbare Building Blocks. Der Chip selbst ist ausgesprochen komplex und besteht aus 12 Milliarden Transistoren. Um die Chip-Ausbeute zu verbessern, deaktiviert Nvidia bei der Titan X zwei SMs, wodurch die Anzahl der tatsächlich zur Verfügung stehenden CUDA Cores auf 3584 beschnitten wird. Da jeder SM auch acht Textureinheiten beinhaltet, schrumpft deren Anzahl ebenfalls auf 224.

Die Spezifikationen der Titan X nennen eine Basistaktrate von 1417 MHz, wobei der typische Boost-Takt im Bereich von 1531 MHz liegt. Dadurch erreicht die Grafikkarte eine FP32-Rate von über 10,1 TFLOPS, das sind 23 Prozent mehr als bei der GeForce GTX 1080.

Zweifelsfrei hätte die GP104-GPU von einem noch breiteren Speicherinterface profitieren können, vor allem bei der Wiedergabe von 4k-Inhalten. Aber das höhere Potential des GP102-Chips im Bereich Shading und Texturing erfordert ein Rebalancing. Das Backend der GPU wächst somit auf 12 32-Bit-Speichercontroller an, wobei jeder an acht ROPs und 256 KByte L2 Cache (wie beim GP104) gebunden ist, was sich somit insgesamt zu 96 ROPs und 3 MByte Shared Cache summiert. Der Speicher ist über ein 384 Bit breites Interface angebunden, an dessen Ende 12 GByte GDDR5X mit 10 Gbit/s sitzen. Diesen GDDR5X kennen wir bereits von der GTX 1080.

Die theoretische Speicherbandbreite liegt bei 480 GByte/s (50 Prozent mehr als bei der GTX 1080 mit 320 GByte/s), obwohl der effektive Durchsatz eingedenk der Verbesserungen der Delta Color Kompression der Pascal-Architektur höher ausfallen sollte.

Warum wird aber immer noch auf GDDR5X gesetzt, zumal AMD uns die Vorteile von HBM-Speicher bereits vor über einem Jahr vor Augen führte? Möglicherweise war sich Nvidia während des Design-Prozesses des GP102 nicht sicher, ob eine kontinuierliche HBM2-Versorgung gewährleistet werden könne und setzte deshalb mit GDDR5X auf die sichere Option. Damit bleiben GP100-basierte Grafikkarten die einzigen in Nvidias Lineup, auf denen bereits HBM2 zum Einsatz kommt.

GPU Titan X (GP102) GeForce GTX 1080 (GP104) Titan X (GM100)
SMs 28 20 24
CUDA Cores 3584 2560 3072
GPU Basis-Takt 1417 MHz 1607 MHz 1000 MHz
GPU Boost-Takt 1531 MHz 1733 MHz 1075 MHz
GFLOPs (Basistakt) 10,157 8228 6144
Textureinheiten 224 160 192
Texel Füllrate 342,9 GT/s 277,3 GT/s 192 GT/s
Speicher-Übertragungsrate 10 Gbit/s 10 Gbit/s 7 Gbit/s
Speicher-Bandbreite 480 GByte/s 320 GByte/s 336.5 GByte/s
ROPs 96 64 96
L2 Cache 3 MByte 2 MByte 3 MByte
TDP 250 Watt 180 Watt 250 Watt
Transistoren 12 Milliarden 7,2 Milliarden 8 Milliarden
Fläche des DIE 471 mm² 314 mm² 601 mm²
Fertigungsprozess 16nm 16nm 28nm

Interessant ist, dass Nvidia sich offenbar in letzter Minute dazu entschloss, mit der Titan X auf Distanz zur Gaming-Familie der GeForce-Reihe zu gehen. Auf der Geforce.com-Landing-Page wird sie als „The World’s Ultimate Graphics Card“ angepriesen und der Zusatz „Gaming“ somit ausgelassen. Da wir es hier aber im Prinzip einfach mit einer größeren Version des GP104 zu tun haben, sollte die Titan X sich auch in der Gaming-Disziplin entsprechend gut schlagen.

Nvidias Entscheidung, die Titan X bei einem AI-Treffen an der Stanford University zu präsentieren, zeigt, dass sich der Hersteller diesmal mehr auf den Deep-Learning-Bereich konzentriert. Während FP16- und FP64-Operationen auf dem GP104 fürchterlich langsam ablaufen (das gilt somit auch für den GP102), unterstützen beide GPUs INT8 bei 4:1, wodurch sich beim Basistakt der Titan X 40,6 TOPS ergeben.

Folgt Tom’s Hardware Deutschland auf Facebook, Google+ und Twitter.

Ebenfalls interessant...