Ein Team von Wissenschaftlern aus China und Russland hat die Nutzung der Ressourcen einer bekannten GPU gründlich analysiert. Die betreffende Grafikkarte wurde in ein unglaublich leistungsfähiges wissenschaftliches Berechnungstool umfunktioniert und auf ein nahezu unerreichbares Niveau gebracht.
Das Experiment fand in Shenzhen (Provinz Guangdong, China) statt, einer Stadt, die als Symbol für die technologische Innovation Chinas gilt. Es wurde gemeinsam von Wissenschaftlern der Lomonossow-Universität Moskau und des Peking Technology Institute durchgeführt. Die Ergebnisse dieser Forschung wurden vor über einem Monat am 8. Januar im Chinesischen Journal für Computational Mechanics veröffentlicht.
Der RTX 4070: Ein Supercomputer in der Hand
Die peri-dynamische Theorie, die ein komplexes mathematisches Modell darstellt, ermöglicht das Verhalten von Materialien auf atomarer Ebene zu simulieren und benötigt dafür enorme Rechenressourcen. Wozu dient diese Theorie?
Es handelt sich um eine nicht-lokale Theorie, was bedeutet, dass die physikalischen Interaktionen zwischen Punkten nicht nur von deren unmittelbarer Nachbarschaft abhängen, sondern auch von den Zuständen anderer Punkte, die sich in einer bestimmten Entfernung befinden. Diese Theorie wird verwendet, um die Wechselwirkungen zwischen Partikeln über ihre unmittelbare Umgebung hinaus zu analysieren, um präzise Vorhersagen über Brüche und Deformationen in komplexen Materialen zu ermöglichen. Dazu zählen spezielle Legierungen, Keramik, Silizium oder Polymere. In der Vergangenheit benötigten solche Berechnungen Supercomputer oder Cluster, also Netzwerke von miteinander verbundenen Computern, was ihre Zugänglichkeit auf große Institutionen mit spezieller Infrastruktur beschränkte.
Professor Yang Yang und sein Team haben dieses Paradigma durch die Entwicklung des PD-Generalansatzes in Frage gestellt, einem Rahmenwerk, das die Architektur der GPU-Berechnungen neu gestaltet. Dies wurde möglich durch umfassendes Wissen über die CUDA-Architektur von Nvidia in Verbindung mit einer Umstrukturierung der Berechnungsschemata und Datenströme der verwendeten Grafikkarte.
Die Grafikkarte, um die es sich handelt? Eine ganz normale RTX 4070, und was dabei erreicht wurde, ist durchaus beeindruckend: Die Berechnungen erfolgen 800 Mal schneller im Vergleich zu herkömmlichen sequentiellen Programmen und sind 100 Mal effektiver als parallele Lösungen, die auf OpenMP basieren. In nur fünf Minuten war die GPU in der Lage, 4.000 iterative Stufen zu verarbeiten.

Mögliche Anwendungsgebiete
Die Verarbeitung von 69,85 Millionen Iterationen in unter zwei Minuten bei großangelegten 2D-Simulationen könnte das entwickelte Framework für zuvor unvorstellbare Anwendungen in Verbraucherdevices nutzbar machen. Der Luftfahrtsektor könnte theoretisch das Verhalten von Verbundwerkstoffen in bestimmten Flugzeugen mit sehr hoher Genauigkeit analysieren. Baubüros könnten ein Werkzeug zur Verfügung haben, um die Alterserscheinungen von Gebäuden und Strukturen präziser vorherzusagen, alles ohne exorbitante Kosten.
Der einzige Nachteil besteht darin, dass zum Zeitpunkt der Erstellung dieses Artikels die Studien und ihre Ergebnisse möglicherweise noch nicht öffentlich zugänglich sind. Es wäre wünschenswert, mehr über das Modus Operandi dieser Forscher zu erfahren und zusätzliche Informationen zu diesem bemerkenswerten Projekt zu erhalten. Eine direkte Suche auf der Website der Zeitschrift ergibt derzeit keine Veröffentlichung zu diesem Thema.
Quellen: Toms Hardware,,,, Südchinesischen Morgenpfosten