AMD Radeon R9 Nano: Mini-ITX-Gaming neu definiert

Inhaltsverzeichnis

<< >>

Wir wollen bewusst zwei Dinge voranstellen, die den nachfolgenden Benchmark und dessen Resultate etwas verständlicher machen und den Lesern helfen sollen, das Geschriebene objektiv einordnen zu können.

Mangels fertiger und ausgereifter DirectX-12-Spiele müssen wir gezwungenermaßen auf Ashes of the Singularity zurückgreifen, das sich sich aber noch im Pre-Beta-Status befindet. Das schränkt durch die fehlende Optimierung natürlich auch die pauschale Aussagekraft ein klein wenig ein, lässt aber trotz allem schon ganz gut erahnen, wo der Zug einmal hingehen wird. Eigentlich wollten wir noch Ark: Survival Evolved in unseren Benchmark-Parcours aufnehmen, aber da sich der mehrmals angekündigte DX12-Patch immer wieder verschob, mussten wir letztlich (diesmal) darauf verzichten.

Und genau da landen wir bei Punkt zwei unserer Vorbemerkungen, der zudem einer gewissen Pikanterie nicht enbehrt, aber auch mit Vorsicht zu interpretieren ist. Der Ausgangspunkt ist eine hochinteressante Foren-Diskussion auf overclock.net, deren Lektüre mehr aussagt, als es wir in wenigen Sätzen zusammenfassen könnten. Vor allem die Aussagen eines Mitarbeiters vom Studio Oxide Games und die darauf folgenden Reaktionen seitens Nvidia sowie AMD sprechen Bände, wenn man auch ein wenig zwischen den Zeilen liest und sich noch einige – mittlerweile ganz offensichtlich wieder gelöschte – Einzel-Postings hinzudenkt.

Konkret geht es hier um die DirectX-12-Funktion “Asynchronous Shading/Compute”, die ein paralleles und vor allem asynchrones (also voneinander in der Reihenfolge komplett unabhängiges) Abarbeiten von Grafikaufgaben (Shading) und reinen Berechnungen (Compute) ermöglicht. Dadurch kann die Latenzzeit bei sauberer Implementierung und voller Unterstützung durch die Hardware enorm sinken.

Was bleibt uns an dieser Stelle als vorläufige Zusammenfassung der ganzen Foren-Postings über ein vermutlich bestehendes Problem? Kurz: Alle aktuellen Grafikkarten von Nvidia ab Fermi könnten vermutlich in dieser speziellen Aufgabenstellung ein gewisses Effizienzproblem bekommen, da man stets nur einen Context zur Laufzeit ausführen könne.

Das ist an sich nicht neu und wurde von Nvidia seinerzeit wohl auch so kommuniziert. Dies betrifft vor allem den Punkt, bei dem man die Entwickler darauf hinweist, dass Befehlsketten generell so kurz wie möglich zu halten sind, um das Aufstauen von Aufgaben und das Umgehen von Prioriäten bei der Abarbeitung zu vermeiden.

Der Grund dürfte darin zu finden sein, dass Nvidia aktuell in den GPUs den sogenannten Draw-Level stets bevorzugt behandelt und Context-Switches für reine Compute-Operationen nur nach deren Beendigung faktisch eingeschoben werden können. Somit “hängt” die Karte bis zum Ende eines Calls quasi “fest”, bevor man wechseln kann.

Wer sich dazu tiefer belesen will: Nvidias kompletter Developer Guide von der GDC 2015

Da sich Nvidia noch nicht offiziell dazu geäußert hat, wollen und können wir uns mangels belastbarer Details nicht auf ein Urteil festlegen, sondern verweisen auf unsere nachfolgenden Benchmarks. Wir haben zudem einen eigenen Interpreter programmiert, der die Logfiles automatisch auswertet und die Anzahl der CPU-Aufrufe sowie das Verhältnis dieser Anzahl zu den tatsächlich gerenderten Frames ausgibt. Das ist dann schon sehr interessant und begründet vor allem auch, warum manche Benchmark-Ergebnisse (momentan) genau so nachteilig für Nvidia aussehen, wie sie eben aussehen.

Interessant sind auch wieder die Renderzeiten jedes einzelnen Frames aus den verschiedenen Betrachtungswinkeln. Die absolute Renderzeit zeigt einen Verlauf, der auch den Anspruch der einzelnen Benchmark-Szenen recht gut abbildet.

Nimmt man den rechnerischen Mittelwert des Gesamtdurchlaufes für die Renderzeit eines Frames und normalisiert das Ganze, erhält man einen ähnlichen Eindruck über die unterschiedlichen Lasten während des Benchmarks.

Kommen wir nun zur Glätte (“Smoothness”), also dem Verhalten zwischen den einzelnen Frames. Größere Sprünge sollte man eigentlich nur beim Szenenwechsel erwarten. Aber es zeigt sich wieder einmal deutlich, dass bei jeder Karte – ganz egal wie toll die FPS in den Charts und Kurven auch aussehen mögen – auch zwischendurch noch gewaltige Sprünge auftreten, die sich auch in wahrnehmbaren Rucklern äußern. Da hilft auch die Angabe von Min- und Max-FPS in den Balkengrafiken nicht weiter:

Nach den Benchmark-Ergebnissen mit FPS und Frame Time wenden uns nun der absoluten Anzahl der CPU-Aufrufe während des gesamten Benchmark-Durchlaufs als Balkengrafik zu. Dass schnellere Karte bei mehr gerenderten Frames auch mehr nach der CPU schreien, ist zwar logisch nachvollziehbar, aber am Ende eben doch nicht die ganze Weisheit:

Nun betrachten wir das Ganze nämlich detaillierter als Kurvenverlauf und stellen fest, dass vor allem am Anfang des Benchmarks alle AMD- und Nvidia-Karten untereinander zwar sehr ähnlich agieren, Hersteller-bereinigt jedoch große Unterschiede zu sehen sind – und das scheint die These von eben durchaus zu erhärten:

Zieht man dann das Fazit über den gesamten Verlauf und setzt zudem das Verhältnis von benötigten CPU-Aufrufen pro gerendertem Frame ins richtige Licht, dann steht AMD wirklich gut da:

Bei der Radeon R9 Nano irritieren ein wenig die schwankenden Werte bei steigender Auflösung, aber diese Entwicklung war reproduzierbar und definitiv nicht zufällig.

Zwischenfazit

Unterm Strich bleibt die Erkenntnis, dass die Radeon R9 Nano auch bei diesem DirectX-12-basierten Test eine gute Figur macht – und das an der ganzen Diskussion rund um “Asynchronous Shading/Compute” wohl durchaus etwas dran sein könnte. Wir werden das Ganze auf alle Fälle beobachten und freuen uns bereits jetzt auf die weiteren angekündigten DirectX-12-Titel bzw. die Spiele mit angekündigten DX12-Patches.

Auf dieser Liste stehen dann Games wie beispielsweise Caffeine, Project Cars, DayZ, Umbra, Deus Ex: Mankind Divided, Hitman, Fable Legends, Gears of War: Ultimate Edition, King of Wushu sowie einige Windows-10-exklusive Titel wie Minecraft Windows 10 Edition, Halo Wars 2, Gigantic und andere.

Update: Am gestrigen Mittwoch gab Nvidia bekannt, in Kürze einen passenden Treiber veröffentlichen zu wollen, der das Problem “Asynchronous Shading/Compute” mit einem treiberseitigen Ansatz lösen bzw. mildern soll. Genaueres war leider bisher noch nicht zu erfahren, so dass wir mit Sicherheit an dem Thema dranbleiben werden.

Ebenfalls interessant...

Tags: , , , ,

Seiten:

Schreibe einen Kommentar

Privacy Policy Settings

This website stores some user agent data. These data are used to provide a more personalized experience and to track your whereabouts around our website in compliance with the European General Data Protection Regulation. If you decide to opt-out of any future tracking, a cookie will be set up in your browser to remember this choice for one year. I Agree, Deny
608