Solide Optimierungstipps für CUDA

Beim Stöbern in “CUDA Fortran for Scientists and Engineers” habe ich gesehen, dass die Autoren wertvolle Optimierungstipps geben. Da bin ich neugierig geworden.

CUDA Fortran for Scientists and Engineers

Ich selber bin kein Fortran-Programmierer, kann daher das Buch aus dieser Perspektive nicht beurteilen. Aber für mich C++-Entwickler bietet dieses Buch viele wertvolle Hinweise über die Optimierung von CUDA-Kerneln.  Als Beispiel kann hier die mathematisch präzise Analyse der “Fused Multiply Add (FMA)”-Operation in Abschnitt 5.2.1 genannt werden. Das Buch wurde von zwei sehr kompetenten Autoren geschrieben und ist sehr solide. Die Autoren arbeiten beide bei NVIDIA, verfügen daher über Insider-Informationen.

Das Buch ist leider schon ein wenig veraltet, die aktuelle Maxwell-Architektur ist erst 2014 erschienen. Im Buch wird die Kepler-Architektur bis zur Compute Capability 3.5 behandelt.

Einen Punkt Abzug gibt es aber doch, weil im Anhang auf 61 Seiten Source-Code ausgedruckt wurde. Das ist doch heute nicht mehr zeitgemäß, den kann man sich herunterladen.

  • Gregory Ruetsch, Massimiliano Fatica
  • CUDA Fortran for Scientists and Engineers
  • Morgan Kaufman - 2013

Siehe auch die Renzension bei Amazon.

Anmerkung: Dieser Artikel wurde im November 2016 an das neue Blog-Format angepasst.

 "Die wunderbare Welt von P2P" "Zu kurzer Einstieg in PaaS"