Kleine, heiß-kalte Schwester: AMD RX Vega56 mit Effizienztest und VR

Inhaltsverzeichnis

>>

Genau das bleibt aber am Ende die spannendste Frage dieses Tages, denn von einer breiten Verfügbarkeit und vor allem stabiler Software war ja bisher kaum etwas zu spüren. Es kann also eigentlich nur besser werden.

Doch was bleibt einem am Schluss übrig, wenn man, aus welchen Gründen auch immer, erst einmal kein Sample erhält, um pünktlich zum vorgezogenen Launchtag mit am Start sein zu können? Wir haben deshalb versucht, mit einem zusätzlichen Abschnitt zur VR-Performance und einer Effizienzbetrachtung wenigstens noch etwas Mehrwert zu generieren, um nicht das 1001. Review von der Stange anzubieten, das eh keinen mehr interessiert.

Gerade der VR-Bereich rund um unsere FCAT-Messungen zeigt jedoch, dass nicht nur AMD offene Baustellen ohne Absicherung betreibt. Wir haben unseren Test nämlich mehrmals verschieben müssen, weil eine FCAT-Bibliothek fehlerhaft war. Zusammen mit Nvidia konnten wir dann exklusiv auch die neueste Software testen und nutzen. Zumindest diese Werte sind also auch exklusiv aktuell nur hier zu lesen und es hat schon einen gewissen Unterhaltungswert, dass sich sogar Nvidia extra bemüht, damit indirekt einen RX Vega56 Artikel noch einigermaßen zeitnah zu gewährleisten.

Wir verweisen an dieser Stelle natürlich auch noch einmal auf unseren Test der Vega Frontier Edition und den Launchartikel zur RX Vega64, die beide dann auch die entsprechenden Informationen zur Technologie und Theorie unter der Haube enthalten. Darüber hinaus hatten wir ja auch schon mit dem Wasserkühlungsumbau (“Übertaktet und abgekocht: AMD Radeon RX Vega64 wassergekühlt“) ein weiteres Follow-Up veröffentlicht, das andere Facetten zeigen konnte.

Was unterscheidet die Radeon RX Vega56 von der RX Vega64?

Die Radeon RX Vega 56 nutzt den gleichen Vega-10-Prozessor, wie wir ihn auch in der Vega64 finden. Es ist ein 486 mm² großer Chip mit 12,5 Milliarden Transistoren, der in GlobalFoundries 14LPP-Prozess hergestellt wird. Man findet vier Shader Engines, jede mit eigenem Geometrieprozessor und Draw Stream Binning Rasterizer.

Besitzt die RX Vega64 noch 64 aktive Compute Units in diesen Shader Engines, deaktiviert AMD bei der RX Vega56 zwei CUs pro Shader Engine, so dass es am Ende auf 56 hinausläuft. Womit sich dann auch die Namensgebung erklärt. Bei 64 Stream-Prozessoren und vier Textureinheiten pro CU erhält man folgerichtig 3584 Stream-Prozessoren und 224 Textureinheiten – also ca. 88% der Vega-NCU-Ressourcen.

Die niedrigere Rechenleistung und der gringere Texturendurchsatz sind auch durch die niedrigeren Basis- und typischen Boost-Taktraten bedingt. Die Radeon RX Vega56 taketet im Vergleich zur Vega64  nur noch mit 1156 MHz statt 1274 MHz, während der mögliche Boost-Takt der RX Vega56 bei 1471 MHz im Vergleich zu den 1546 MHz der RX Vega64 liegt. Die theoretische SP-Performance sinkt damit von maximal 13,7 TFLOPS auf 10,5 TFLOPS, wobei dies natürlich nur absolute Peak-Werte sind.

Jeder der Shader-Engines von Vega 10 besitzt vier Render-Back-Ends, die 16 Pixel pro Takt-Zyklus liefern, woraus sich die 64 ROPS ergeben. Diese Render Back-Ends hängen gemeinsam am L2, der jetzt 4 MB groß ist, während Fidji noch mit zwei MB L2-Kapazität auskommen müsste. Idealerweise bedeutet dies, dass die GPU weniger häufig auf den HBM2 zugreifen muss und die Abhängigkeit von Vega 10 von der Speicherbandbreite verringert. Da die Taktraten von Vega 10 auf der 56-Cu-Karte bis zu 40% höher sind als noch bei als Fiji ‘s, jedoch die Speicherbandbreite auf 102 GB/s sinkt, sollte ein größerer Cache hier also durchaus hilfreich sein, um Flaschenhälse auf dem Flaggschiff zu verhindern.

Der Einsatz von HBM2 ermöglicht AMD die Halbierung der Anzahl der Speicher-Stacks auf dem Interposer im Vergleich zu Fiji, was den aggregierten 4096-Bit-Bus quasi halbiert. Im Vergleich zu den 4GB-HBM-Modulen der Radeon R9 Fury X, nutzt die Radeon RX Vega56 recht komfortable 8 GB mit 4-Hi-Stacks, ähnlich wie die Vega64. Mit einer 1,6 GB/s Datenrate schafft man dann 410-GB/s-Bandbreite, was in der Theorie die Werte einer GeForce GTX 1070 bzw. GTX 1080 mit GDDR5 bzw. GDDR5X deutlich übertrifft.

Optik, Haptik und Anschlüsse

Die ca. 1064 Gramm schwere Karte (14 Gramm mehr als die Frontier Edition) ist 26,8 cm lang (ab Außenkante Slot-Blende bis Ende Gehäuse), 10,5 cm hoch (ab Oberkante Mainboard-Slot bis Oberkante Gehäuse) und 3,8 cm tief. Damit ist es eine echte Dual-Slot-Karte, auch wenn die Backplate noch einmal ca. 0,4 cm auf der Rückseite benötigt.

Gehäuseabdeckung und Backplate sind aus schwarz eloxiertem Aluminium, welches sich wertig und kühl anfasst. Die Oberflächenstruktur des Deckels wurde einfach per Kaltverformung vor dem Eloxieren realisiert. Alle Schrauben sind mattschwarz lackiert. Nur das aufgedruckte, rote Radeon-Logo an der Front hebt sich farblich deutlich ab.

Die Oberseite ist geprägt von den beiden 8-Pin PCIe-Spannunsgversorgungs-Anschlüssen, sowie dem beleuchteten, roten Radeon-Logo. Außerdem finden wir einen BIOS-Umschalter, der auf ein BIOS mit deutlich niedriger Leistungsaufnahme zugreifen lässt. Leiser, kühler und natürlich auch etwas langsamer. Zusammen mit den drei neuen Modi im Wattman “Turbo” (max. Power Limit), “Balanced” (Standardvorgabe) und “Power Save” (min. Power Limit) ergeben sich so mehrere Variationsmöglichkeiten, auf die wir später noch eingehen werden.

Das Kartenende ist geschlossen und am Rahmen findet man die bei Workstation-Karten üblichen Löcher fürs Mounting. Die mattschwarz pulverbeschichtete Slot-Blende beherbergt drei DP-Anschlüsse und einen HDMI-2.0. Auf einen DVI-I hat man aus strömungstechnischen Gründen cleverer Weise verzichtet, denn die Blende ist gleichzeitig ja der Auslass der warmen Abluft aus dem Kühlsystem.

Modell Radeon
Vega64
Radeon
Vega56
Radeon
R9 Fury X
Geforce
GTX 1080
Geforce
GTX 1070
GPU Vega 10 XTX Vega 10 XTX Fiji XT GP104 GP104
Chipgröße 484 mm² 484 mm² 596 mm² 314 mm²  314 mm² 
Transistoren 12.5 Mrd. 12.5 Mrd. 8.9 Mrd. 7,2 Mrd. 7,2 Mrd.
GPU-Basistakt/
Boost-Takt
1247 MHz
1630 MHz
1156 MHz
1471 MHz
k.A.
1050 MHz
1606 MHz
1733 MHz
1506 MHz
1683 MHz
Shader/SIMD 4096/64 3584/56 4096/64 2560/20 1920/15
Textur-Einheiten/ROPS
256/64 224/64 256/64 160/96 120/64
Speicheranbindung 2048 Bit 2048 Bit 4096 Bit 384 Bit 352 Bit
Speichertyp HBM2 HBM2 HBM GDDR5X GDDR5
Speicherbandbreite
483,8 GB/s 410 GB/s 512,0 GB/s 320,3 GB/s 256,3 GB/s
Geschw. Grafikspeicher
1,89 Gbps 1,6 Gbps 1,0 Gbps 10,0 Gbps 8,0 Gbps
Speicherausbau
8 GB 8 GB 4 GB 8 GB 8 GB
DX12 Feature-Level 12_1 12_1 12_0 12_1 12_1
PCIe-Buchsen 2 × 8-Pin 2 × 8-Pin 2 × 8-Pin 6 + 8-Pin 8-Pin
TBP 295 Watt 210 Watt 275 Watt <250 Watt  <150 Watt 

Testsystem und Messmethoden

Das neue Testsystem und die -methodik haben wir im Grundlagenartikel “So testen wir Grafikkarten, Stand Februar 2017” (Englisch: “How We Test Graphics Cards“) bereits sehr ausführlich beschrieben und verweisen deshalb der Einfachheit halber jetzt nur noch auf diese detaillierte Schilderung. Wer also alles noch einmal ganz genau nachlesen möchte, ist dazu gern eingeladen. Allerdings haben wir CPU und Kühlung erneut verbessert, um für diese schnelle Karte mögliche CPU-Flaschenhälse weitgehend auszuschließen.

Interessierten bietet die Zusammenfassung in Tabellenform schnell noch einen kurzen Überblick:

Testsysteme und Messräume
Hardware:
Intel Core i7-6900K @4,3 GHz
MSI X99S XPower Gaming Titanium
Corsair Vengeance DDR4-3200
1x 1 TByte Toshiba OCZ RD400 (M.2, System SSD)
2x 960 GByte Toshiba OCZ TR150 (Storage, Images)
Be Quiet Dark Power Pro 11, 850-Watt-Netzteil
Kühlung:
Alphacool Eisblock XPX
Alphacool Eiszeit 2000 Chiller
2x Be Quiet! Silent Wings 3 PWM (Closed Case Simulation)
Thermal Grizzly Kryonaut (für Kühlerwechsel)
Gehäuse:
Lian Li PC-T70 mit Erweiterungskit und Modifikationen
Modi: Open Benchtable, Closed Case
Monitor: Eizo EV3237-BK
Leistungsaufnahme:
berührungslose Gleichstrommessung am PCIe-Slot (Riser-Card)
berührungslose Gleichstrommessung an der externen PCIe-Stromversorgung
direkte Spannungsmessung an den jeweiligen Zuführungen und am Netzteil
2x Rohde & Schwarz HMO 3054, 500 MHz Mehrkanal-Oszillograph mit Speicherfunktion
4x Rohde & Schwarz HZO50, Stromzangenadapter (1 mA bis 30 A, 100 KHz, DC)
4x Rohde & Schwarz HZ355, Tastteiler (10:1, 500 MHz)
1x Rohde & Schwarz HMC 8012, Digitalmultimeter mit Speicherfunktion
Thermografie:
Optris PI640, Infrarotkamera
PI Connect Auswertungssoftware mit Profilen
Akustik:
NTI Audio M2211 (mit Kalibrierungsdatei)
Steinberg UR12 (mit Phantomspeisung für die Mikrofone)
Creative X7, Smaart v.7
eigener reflexionsarmer Messraum, 3,5 x 1,8 x 2,2 m (LxTxH)
Axialmessungen, lotrecht zur Mitte der Schallquelle(n), Messabstand 50 cm
Geräuschentwicklung in dBA (Slow) als RTA-Messung
Frequenzspektrum als Grafik
Treiber Radeon: 17.20.1035
Quadro: R381 U2 (382.05)
Betriebssystem Windows 10 Pro (Creators Update, alle Updates)

Ebenfalls interessant...

Seiten:

Tags: , , , ,

Schreibe einen Kommentar

Privacy Policy Settings

Google Analytics Wir sammeln anonymisierte Daten darüber, welche Beiträge und News gelesen werden. Wir ermitteln dabei auch die Zeit - ebenfalls anonymisiert - wie lange ein Beitrag gelesen wurde. Dadurch können wir einfacher Themen anbieten, die Sie interessieren.
This website stores some user agent data. These data are used to provide a more personalized experience and to track your whereabouts around our website in compliance with the European General Data Protection Regulation. If you decide to opt-out of any future tracking, a cookie will be set up in your browser to remember this choice for one year. I Agree, Deny
646 Verbiete Google Analytics, mich zu verfolgen