Title data
Raithel, Philipp:
Optimierung paralleler Particle-In-Cell-Verfahren für Grafikprozessoren.
Bayreuth
,
2019
. - iv, 41 P.
- (Bayreuth Reports on Parallel and Distributed Systems
; 11
)
(
Bachelor thesis,
2019
, University of Bayreuth, Faculty of Mathematics, Physics and Computer Sciences)
![]() |
|
||||||||
Download (1MB)
|
Abstract
Diese Ausarbeitung behandelt die Implementierung von Particle-In-Cell-Verfahren für GPUs ausgehend von bereits vorhandenen parallelen Implementierungen für CPUs. Diese werden mit dem CUDA-Framework für Nvidia-GPUs entwickelt und im Verlauf der Arbeit weiter analysiert und optimiert. Zu Beginn wird auf die Unterschiede zwischen CPU- und GPU Implementierung eingegangen und die nötigen Schritte erläutert, wie GPU Implementierungen ausgehend von CPU-Codes entwickelt werden können. Anschließend wird eine erste konkrete Version der Particle-In-Cell-Verfahren implementiert, welche während der fortlaufenden Arbeit als Referenz für weitere Optimierungen dient. Mit Profiling durch den Visual-Profiler von Nvidia werden danach Bottlenecks identifiziert und mit unterschiedlichen Ansätzen behandelt. Um die Effizienz der einzelnen Ansätze vergleichen zu können, wird jede optimierte Variante in Bezug auf die jeweils anderen Varianten mithilfe von Laufzeitmessungen und Profiling Ergebnissen bewertet. Zum Schluss wird der Einfluss der Genauigkeit von Fließkommazahlen auf die Simulationsergebnisse und die Laufzeit der Simulationen untersucht.
Abstract in another language
This thesis covers the implementation of Particle-In-Cell methods for GPUs, which are based on existing parallel implementations for CPUs. These are developed with the CUDA framework for Nvidia-GPUs and are further analyzed and optimized in the course of the thesis. At the beginning, the differences between CPU and GPU implementations are discussed and the necessary steps to develop GPU implementations based on CPU codes are explained. Subsequently, a first concrete version of the Particle-In-Cell methods is implemented, which serves as a reference for further optimizations during the ongoing work. Bottlenecks are identified with profiling by the Visual-Profiler of Nvidia and treated with different approaches. In order to be able to compare the efficiency of the individual approaches, each optimized variant is evaluated in relation to the other variants using runtime measurements and profiling results. Finally, the influence of the accuracy of floating point numbers on the simulation results and the runtime of the simulations is investigated.
Further data
Item Type: | Bachelor thesis |
---|---|
Keywords: | Particle-In-Cell-Verfahren; Parallelverarbeitung; GPU; CUDA |
DDC Subjects: | 000 Computer Science, information, general works > 004 Computer science |
Institutions of the University: | Faculties > Faculty of Mathematics, Physics und Computer Science > Department of Computer Science > Chair Applied Computer Science II Faculties Faculties > Faculty of Mathematics, Physics und Computer Science Faculties > Faculty of Mathematics, Physics und Computer Science > Department of Computer Science |
Language: | German |
Originates at UBT: | Yes |
URN: | urn:nbn:de:bvb:703-epub-4233-6 |
Date Deposited: | 28 Feb 2019 07:57 |
Last Modified: | 28 Feb 2019 07:57 |
URI: | https://epub.uni-bayreuth.de/id/eprint/4233 |