Server-CPUs im Test: Broadwell-EP vs. Haswell-E(P) vs. Skylake

Nachdem unsere Schwester-Seite in den USA unlängst bereits Broadwell-EP (jedoch unter anderen Prämissen) getestet hatte, ziehen wir nun mit dem 8-Kern-Xeon ES-2620 v4 nach und vergleichen ihn mit dem Xeon ES-2620 v3 (Haswell-EP) als direktem Vorgängermodell, dem E3-1280 v5 (Skylake), sowie einem Core i7-5960X als Consumer-CPU aus dem Enthusiasten-Bereich.

Aktuelle Broadwell-EP-Xeons hat man als Redaktion nicht mal einfach so auf Lager und auch der direkte Generationsvergleich solcher Server-CPUs mit den Vorgängermodellen dürfte eher schwierig werden.  Deshalb haben wir zusammen mit der Happyware GmbH ein Server-Rack genutzt, auf dem die gleichen Benchmarks abliefen wie auf den beiden zusäzlichen Vergleichsplattformen.

Um einigermaßen vergleichbar zu bleiben, nutzen wir von dem ansonsten mit zwei CPUs bestückten Supermicro X10DRL-CT nur einen der beiden Prozessoren. Als Testsuite kommt SiSoft Sandra 2016 SP1 zum Einsatz, um auf allen Plattformen identische Testprogramme laufen lassen zu können. Grafische Aufgaben müssen auf dem Serverboard ja technisch bedingt ausfallen. Deshalb beschränken wir uns ausschließlich auf synthetische Leistungsbenchmarks.

Zunächst wird es interessant sein, wie sich der Broadwell-EP im Vergleich zum direkten Vorgänger schlagen kann, der zwar mit zwei Kernen weniger, dafür aber mit etwas mehr Takt antritt. In der Theorie sieht es für den Broadwell-EP, der im neuen 14nm FinFet-Verfahren produziert wird, ja erst einmal gar nicht schlecht aus. Der Sockel FCLGA 2011 bleibt gleich, dafür ändert sich aber vieles andere. Der von uns getestete E5-2620 v4 nutzt mit der LLC-Variante (Low Core Count) die kleinste der drei verfügbaren Die-Größen von Broadwell-EP.

Neben dem verbesserten Boost-Mode für AVX-Code bietet Broadwell-EP größere Translation Buffer, mehr OOO-Einträge (Out-Of-Order), eine verbesserte Sprungvorhersage und geringere Latenzen bei der Divider-Einheit sowie bei Vektor-Multiplikationen, die nunmehr in drei (vorher fünf) Taktzyklen erfolgen.

Darüber hinaus sorgt die neue Resource Director Technology dafür, dass die dritte Cache-Stufe per Resource Monitoring ID angesprochen und auch partitioniert werden kann, sowie eine Priorisierung der Blöcke erfolgt. Die Speichercontroller besitzen zudem eine ähnliche Steuerfunktion, was zu einer besseren Ausnutzung der Transfer-Rate führen soll. Außerdem unterstützen sie nunmehr auch DDR4-2133 statt nur DDR4-1866.

Eine weitere Verbesserung bei Broadwell-EP sind die feiner gestaffelten Turbo-Frequenzen bei den AVX-Berechnungen. Die Belastung der Kerne liegt deutlich höher als bei herkömmlichem Code, was stets zu einer Drosselung führt. An Stelle einer pauschalen Drosselung der gesamten CPU kann dies Code-abhängig nunmehr pro Kern erfolgen.

Aus dem Workstation-Bereich gesellt sich ein neuer Xeon E3-1280 v5 (Skylake) hinzu, den wir auf einem Asus P10S WS mit passendem DDR4-2133 ECC-RAM betreiben. Wie auch der Skylake unterstützt der Xeon E5-2620 v4 Intels neues Speed-Shifting, wodurch die CPU weitgehend selbst und eben nicht wie bisher das Betriebssystem über die einzelnen Taktraten entscheidet.

Der vierte im Bunde ist Intels Enthusiasten-CPU Core i7-5960X, den wir unübertaktet auf einem MSI X99S XPower AC und ebenfalls mit DDR4-2133 betreiben, um beim Speicher möglichst ähnliche Rahmenbedingungen zu schaffen, auch wenn sich der RAM ein wenig unterscheidet. So sind auf der Workstation Kingston 4 x 4 GB KVR21E15S8/4 unbuffered ECC, im Server stecken 8 x 8 GB Micron 18ASF1G72PZ-2G1A2 registered ECC und im Gaming 4 x 8 GB System Corsair Dominator.

Um alles im Blick zu behalten gibt es hier noch einmal die Tabelle mit den getesteten CPUs und Ihren Spezifikationen:


E5-2620 v4 E5-2620 v3 E3-1280 v5
Core i7-5960X
Architektur Broadwell-EP Haswell-EP Skylake Haswell-E
Intel® Smart Cache 20 MB 15MB 8MB 20 MB
Kerne
8 6 4 8
Threads
16 12 8 16
Grundtakt
2,1 GHz 2,4 GHz 3,7 GHz 3,0 GHz
Turbotakt
3,0 GHz 3,2 GHz 4,0 GHz 3,5 GHz
TDP 85 Watt 85 Watt 80 Watt 140 Watt
Befehlssatzerweiterung AVX 2.0 AVX 2.0 SSE4.1/4.2
AVX 2.0
SSE4.2,
AVX 2.0
AES
Lithographie 14 nm 22nm 14nm 22nm
Speichertypen DDR4 1600/1866/2133 DDR4 1600/1866 DDR4-1866/2133
DDR3L-1333/1600
DDR4 1333/
1600/2133
Max. Speicherkanäle 4 4 2 4
Max. Speicherbandbreite 68,3 GB/s 59 GB/s 34,1 GB/s 68 GB/s
ECC-Support
Ja Ja Ja Nein
PCI-Express-Lanes 40 40 16 40
TCASE max.
74°C 72.6°C k.A. 66.8°C
Sockel
FCLGA 2011 FCLGA 2011 FCLGA 1151 LGA2011-v3

Ebenfalls interessant...