OpenCL in Aktion: Programme zur Videonachbearbeitung beschleunigt

Als wir diese Artikelserie planten, stellten wir uns die Frage, was die Leser wirklich über DirectCompute/OpenCL-Beschleunigung wissen wollen. Ist es kompliziert in der Anwendung? Nein – in den aktuellen Treibern ist dieses Feature standardmäßig aktiviert, und die meisten Anwendungen, die GPU-Beschleunigung verwenden können, haben eine Konfigurationsoption, mit der man sie ein- und ausschalten kann. Es ist uns unklar, warum jemand die GPU-Beschleunigung abschalten würde, aber es macht uns das Testen viel einfacher.

Zu Beginn der Artikelserie testen wir zwei Video-Nachbearbeitungsprogramme: Total Media Theater (TMT) 5.2 von ArcSoft, das zum Zeitpunkt des Tests als Betaversion verfügbar war, und vReveal von MotionDSP.

Die SimHD-Komponente von TMT verwendet OpenCL und GPU-basierte Verarbeitung, um in Echtzeit Video vom Normalformat (480p) auf Beinahe-HD-Auflösung (720p) hinaufzuskalieren. Um das zu testen, haben wir die DVD ‘Minority Report’ einerseits mit GPU und andererseits ohne GPU, nur mit CPU, abgespielt. Wir haben die DVD im Split-Screen-Modus abgespielt, mit Normalauflösung auf der linken Bildschirmhälfte und Beinahe-HD auf der rechten. SimHD hat vier Einzelfeatures: Hochskalieren, Dynamische Helligkeit, Entrauschen und Glätten, aber wir haben nur die ersten drei eingeschaltet, und zwar auf Maximalstufe. Das Glättungs-Feature ist ohne GPU-Unterstützung gar nicht verfügbar, und deshalb haben wir aus Gründen der Vergleichbarkeit darauf verzichtet. Wir haben SimHD nur mit der AMD Radeon HD 5870 getestet, weil zum Zeitpunkt unseres Tests Total Media Theater die AMD Radeon HD 7970 noch nicht unterstützt hat. Das überrascht uns insofern nicht, als wir auch im AMD Radeon HD 7950 im Test: Nvidias GeForce GTX 580 im Visier schon Probleme hatten, die GPU-Beschleunigung mit Media Espresso von Cyberlink einzusetzen.

vReveal von MotionDSP hat eine gewisse Berühmtheit als das erste und das beste Programm für normale Anwender, das verwackelte Videos reparieren kann. Der Rechenaufwand dafür ist gewaltig, denn die Software muss mehrere Einzelbilder gleichzeitig analysieren, Bildelemente im Auge behalten und gegebenenfalls verschieben. Bei 1080p-Auflösung kann diese Rechenlast so manches System in die Knie zwingen. vReveal 3 weist auch einige andere Features auf, z.B. Bildschärfung, Helligkeitsanpassung und Rauschentfernung – und alle diese Features können gleichzeitig mit der Bildstabilisierung laufen. Im Idealfall kann die gesamte Bildbearbeitung in Echtzeit erfolgen.

Für unseren Test verwenden wir die beiden Videoclips, die der Download-Version von vReveal 3 beiliegen: Der ‘Barcelona’-Clip im 480p-Format und der ‘San Francisco’-Clip im 1080p-Format. Wir haben beide Clips jeweils zweimal getestet: Einmal nur mit aktivierter Bildstabilisierung und ein weiteres Mal in einer bezüglich der Rechenleistung anspruchsvolleren Variante mit fünf weiteren Effekten. Wir haben diese vier Testszenarien jeweils nur mit der CPU, mit APU-Beschleunigung und mit zwei unterschiedlichen PCIe-Grafikkarten getestet.

Test-Hardware
Testsystem 1
Prozessor AMD FX-8150 (Zambezi) 3.6 GHz, Socket AM3+, 8 MB Shared L3 Cache, Turbo Core enabled, 125 W
Motherboard Asus Crosshair V Formula (Socket AM3+), AMD 990FX/SB950
Arbeitsspeicher 8 GB (2 x 4 GB) AMD Performance Memory AE34G1609U2 (1600 MT/s, 8-9-8-24)
SSD 240 GB Patriot Wildfire SATA 6Gb/s
Grafikkarten AMD Radeon HD 7970 3 GB
AMD Radeon HD 5870 1 GB
Netzteil PC Power & Cooling Turbo-Cool 860 W
Betriebssystem Windows 7 Professional, 64-bit
Testsystem 2
Prozessor AMD A8-3850 (Llano) 2.9 GHz, Socket FM1, 4 MB L2 Cache, 100 W, Radeon HD 6550D Graphics
Motherboard Gigabyte A75-UD4H (Socket FM1), AMD A75 FCH
Arbeitsspeicher 8 GB (2 x 4 GB) AMD Performance Memory AE34G1609U2 (1600 MT/s, 8-9-8-24)
SSD 240 GB Patriot Wildfire SATA 6Gb/s
Grafikkarten AMD Radeon HD 7970 3 GB
AMD Radeon HD 5870 1 GB
Netzteil PC Power & Cooling Turbo-Cool 860 W
Betriebssystem Windows 7 Professional, 64-bit
Testsystem 3
Plattform Gateway NV55S05u
Prozessor AMD A8-3500M (Llano), 1.5 GHz, Socket FS1, 4 MB L2 Cache, 35 W, Radeon HD 6620G Graphics
Arbeitsspeicher 4 GB Elpida PC3-10600S-9-10-F2
2 GB Hynix PC3-10600S-9-10-B1
Systemlaufwerk Western Digital Scorpio Blue 640 GB, 5400 RPM, 8 MB Cache, SATA 3Gb/s
Betriebssystem Windows 7 Home Premium, 64-bit
Testsystem 4
Plattform HP Pavillion dv6
Prozessor Intel Core i5-2410M (Sandy Bridge), 2.3 GHz, Socket G2, 3 MB Shared L3 Cache, 35 W, HD Graphics 3000
Arbeitsspeicher 4 GB Samsung PC3-10600S-09-10-ZZZ
Systemlaufwerk Seagate Momentus 7200.4 500 GB, 7200 RPM, 16 MB Cache, SATA 3Gb/s
Betriebssystem Windows 7 Professional, 64-bit

Ebenfalls interessant...