Bitte benutzen Sie diese Referenz, um auf diese Ressource zu verweisen: doi:10.22028/D291-41680
Titel: Improving performance of simulations and heuristic optimization on GPUs
VerfasserIn: Köster, Marcel
Sprache: Englisch
Erscheinungsjahr: 2023
Erscheinungsort: Saarbrücken
Kontrollierte Schlagwörter: Hochleistungsrechnen
Grafikprozessor
Just-in-Time-Compiler
Compiler
Numerische Strömungssimulation
Echtzeitverarbeitung
Rendering
Computergrafik
Smoothed Particle Hydrodynamics
Freie Schlagwörter: high performance computing
graphics processing unit
JIT-Compiler
Compilers (Computer programs)
computational fluid dynamics
Meta Heuristics
mathematical optimization
real-time processing
computer graphics
DDC-Sachgruppe: 004 Informatik
510 Mathematik
530 Physik
Dokumenttyp: Dissertation
Abstract: Parallelization is a ubiquitous technique for improving runtime performance of algorithms. Although parallelization is generally challenging and often leads to programming bugs, it is a leading method for processing growing amounts of data today. Due to the ongoing trend of exploring the unexplored, known methods are reaching their limits in terms of scalability and thus applicability. Particularly challenging is the use of graphics processing units (GPUs) that require specially optimized algorithms but feature impressive compute power. Unfortunately, the term "optimized" usually refers to newly developed algorithms that exploit the peculiarities of the underlying GPUs or at least follow their specific programming methodologies. The list of tweaked algorithms available for GPUs is already quite long and touch a wide range of domains. These include the well-known fields of massively parallel simulations and solving of optimization problems. Prominent examples in this context include particle simulations of physical processes (like molecular-dynamics simulations) and machine-learning based optimizers. However, existing approaches from these two domains often suffer from severe runtime, memory consumption, and applicability limitations. In this thesis, we present new approaches for both domains. Our methods considerably outperform current state of the art in terms of runtime and memory consumption. We were able to achieve runtime speedups of up to several orders of magnitude while reducing the amount of memory required compared to existing methods. Regarding applicability, our algorithms are designed to fit seamlessly into existing simulation programs and optimizers. This makes them a particularly valuable contribution to real-world applications as well.
Parallelisierung ist eine allgegenwärtige Technik zur Verbesserung der Laufzeitleistung von Algorithmen. Obwohl Parallelisierung im Allgemeinen eine Herausforderung darstellt und oft zu Programmierfehlern führt, ist sie heute eine führende Methode zur Verarbeitung wachsender Datenmengen. Aufgrund des anhaltenden Trends, das Unerforschte zu erforschen, stoßen die bekannten Methoden an ihre Grenzen der Skalierbarkeit und damit der Anwendbarkeit. Eine besondere Herausforderung ist der Einsatz von Grafikprozessoren (GPUs), die speziell optimierte Algorithmen erfordern, aber eine beeindruckende Rechenleistung aufweisen. Allerdings bedeuted der Begriff "optimiert" in der Regel neue Algorithmen zu entwickeln, die die Besonderheiten der zugrundeliegenden GPUs ausnutzen oder zumindest deren spezifischen Programmiermethodologien folgen. Die Liste der optimierten Algorithmen, die für GPUs verfügbar sind, ist bereits lang und deckt ein breites Bereichsspektrum ab. Dazu gehören die bekannten Anwendungsfelder der massiv parallelen Simulationen und das Lösen von Optimierungsproblemen. Prominente Beispiele in diesem Zusammenhang sind Partikelsimulationen physikalischer Prozesse (wie z.B. Molekulardynamiksimulationen) und der Einsatz von Optimierern auf der Basis des maschinellen Lernens. Bestehende Ansätze aus diesen beiden Bereichen leiden jedoch oft an schwerwiegenden Einschränkungen in Bezug auf Laufzeit, Speicherverbrauch und Anwendbarkeit. In dieser Arbeit stellen wir neue Ansätze für beide Domänen vor. Sie übertreffen den aktuellen Stand der Technik in Bezug auf Laufzeit und Speicherverbrauch deutlich. Es konnten signifikante Beschleunigungen von bis zu mehreren Größenordnungen im Vergleich zu bestehenden Verfahren erreicht und dabei zugleich den Speicherbedarf deutlich reduziert werden. Hinsichtlich der Anwendbarkeit sind unsere Algorithmen so konzipiert, dass sie sich nahtlos in bestehende Simulationsprogramme und Optimierer integrieren lassen. Dies macht sie damit auch zu einem besonders wertvollen Beitrag für reale Anwendungen aus der Praxis.
Link zu diesem Datensatz: urn:nbn:de:bsz:291--ds-416803
hdl:20.500.11880/37315
http://dx.doi.org/10.22028/D291-41680
Erstgutachter: Krüger, Antonio
Tag der mündlichen Prüfung: 30-Jan-2024
Datum des Eintrags: 28-Feb-2024
Fakultät: MI - Fakultät für Mathematik und Informatik
Fachrichtung: MI - Informatik
Professur: MI - Prof. Dr. Antonio Krüger
MI - Prof. Dr. Philipp Slusallek
Sammlung:SciDok - Der Wissenschaftsserver der Universität des Saarlandes

Dateien zu diesem Datensatz:
Datei Beschreibung GrößeFormat 
PhD_Marcel_Koester_vFinal.pdfPhd Thesis39,77 MBAdobe PDFÖffnen/Anzeigen


Alle Ressourcen in diesem Repository sind urheberrechtlich geschützt.