Das Open-Source-Softwarepaket CP2K zählt global zu den drei führenden Anwendungen für die Simulation atomarer und molekularer Dynamiken. Ein wesentlicher Einsatzbereich liegt heute in der Erzeugung hochwertiger Trainingsdaten für Modelle der künstlichen Intelligenz, die darauf spezialisiert sind, molekulare Energien und Kräfte präzise vorherzusagen.
Seit seiner Einführung im Jahr 2002 wurde der Funktionsumfang von CP2K kontinuierlich ausgebaut. Maßgeblich beteiligt an dieser Entwicklung ist das Center for Advanced Systems Understanding (CASUS) am Helmholtz-Zentrum Dresden-Rossendorf (HZDR). In einer internationalen Kooperation mit Experten aus Deutschland, der Schweiz, Großbritannien und Kanada hat das CASUS-Team nun den aktuellen technologischen Stand der Software in einem umfassenden Übersichtsartikel dokumentiert. Der Beitrag legt einen besonderen Fokus auf die praktische Anwendung. Es dient als fundierte Orientierungshilfe für neue Anwenderinnen und Anwender aus der theoretischen Chemie, den Materialwissenschaften und verwandten Disziplinen.
CP2K als vielseitiges Werkzeug für die Materialforschung
Das Softwarepaket CP2K bietet ein umfassendes Arsenal an Algorithmen, um das Verhalten von Atomen und Molekülen auf Basis grundlegender physikalischer Prinzipien – sogenannter ab initio-Methoden – zu simulieren. Das Besondere an diesem Ansatz ist, dass die Berechnungen ausschließlich auf theoretischem Grundverständnis beruhen. Sie kommen ohne den Rückgriff auf experimentelle Messwerte aus. Dabei vereint die Software klassische und quantenmechanische Modelle, um sowohl statische Eigenschaften als auch das dynamische Verhalten verschiedenster Materieformen zu analysieren – von einzelnen Molekülen in Gasen oder Lösungen bis hin zu komplexen Kristallgittern und zweidimensionalen Materialien.
„Das Ziel von CP2K ist die Vorhersage gemittelter Eigenschaften, wie sie in der statistischen Mechanik und Thermodynamik auftreten – und das für beliebige Substanzen, die aus wechselwirkenden Elektronen und Kernen bestehen“, sagt Dr. Frederick Stein. „Eine Besonderheit von CP2K ist, dass Anwender*innen aus einer Vielzahl verschiedener klassischer und quantenmechanischer Energie- und Kraftmethoden die für ihre Bedürfnisse geeigneten Verfahren auswählen und kombinieren können.“
Das wachsende Interesse an CP2K spiegelt die zentrale Bedeutung der Software für die moderne Forschung wider. „Wir konnten in den vergangenen Jahren einen enormen Anstieg des Interesses an CP2K beobachten“, sagt Prof. Thomas D. Kühne. „Wenn ein wissenschaftliches Tool derart gefragt ist, sehen wir uns in der Verantwortung, die Suite zu pflegen und zu erweitern.“ Um diesem Bedarf gerecht zu werden, implementiert das CASUS-Team kontinuierlich neue, von der Fachgemeinschaft nachgefragte Funktionen. Darüber hinaus leisten sie umfassende Anwenderunterstützung, beteiligen sich an wissenschaftlichen Publikationen, leisten Öffentlichkeitsarbeit auf Konferenzen und beraten andere Entwicklungsteams bei der Erweiterung der Software.
CP2K optimiert Simulationen im Supercomputing
Besonders in den Materialwissenschaften haben sich Simulationen als unverzichtbares Werkzeug etabliert, um aus einer Vielzahl theoretisch möglicher Materialien die vielversprechendsten Kandidaten für experimentelle Untersuchungen vorab zu identifizieren. Da diese Rechenprozesse extrem ressourcenintensiv sind, bedarf es einer perfekten Abstimmung zwischen leistungsstarker Hardware und spezialisierter Software. CP2K nimmt hier eine Schlüsselrolle ein und beansprucht seit langem einen erheblichen Teil der Gesamtkapazität großer Supercomputing-Zentren weltweit.
„Die Software ist hochgradig skalierbar und ermöglicht effiziente Berechnungen mit Zehntausenden von Hauptprozessorkernen oder Tausenden von Grafikprozessorkernen gleichzeitig“, sagt Dr. Johann Pototschnig. „Sie ist auch hinsichtlich der zu simulierenden physikalischen Modelle und ihrer Algorithmen optimiert. So kann sie beispielsweise die Rechenzeit reduzieren, indem man die effizientesten Methoden aus dem klassischen oder quantenmechanischen Bereich auswählt.“
Software stellt für das Training von KI-Modellen erforderliche Daten bereit
In der Teilchenphysik und den Materialwissenschaften übernimmt CP2K eine Schlüsselrolle bei der Generierung hochwertiger Daten zur elektronischen Struktur. Diese Daten bilden die Grundlage für das Training leistungsfähiger KI-Modelle. Daher ist das Softwarepaket eine unverzichtbare Voraussetzung für den Einsatz fortschrittlicher künstlicher Intelligenz in der theoretischen Chemie und im Materialdesign.
Darüber hinaus integriert das CP2K-Paket verschiedene KI-Ersatzmodelle. Dabei handelt es sich um maschinell gelernte Näherungen für komplexe physikalische Abbildungen, die herkömmlicherweise extrem rechenintensiv wären. Anstatt bei jeder Simulation das vollständige quantenmechanische Problem explizit zu lösen, liefern diese Modelle präzise Ergebnisse zu einem Bruchteil der üblichen Rechenkosten.
Durch diesen Einsatz von KI innerhalb der Software lassen sich die zugänglichen Zeit- und Längenskalen massiv erweitern. Erst die synergetische Kombination aus groß angelegten Simulationen und spezialisierten KI-Modellen ermöglicht es der Forschung, selbst hochkomplexe physikalische Berechnungen erfolgreich und effizient zu bewältigen.
Ein wesentlicher Treiber für das massiv gestiegene Interesse an CP2K ist die Fähigkeit der Software, hochwertige Datensätze für das Training von KI-Modellen zu generieren. Dies zieht verstärkt Forschungsgruppen an, die bisher kaum Berührungspunkte mit dem Paket hatten. Um diesen Neulingen den Einstieg in die komplexe Welt der atomistischen Simulationen zu erleichtern, hat das CASUS-Team eine groß angelegte Initiative gestartet und zahlreiche Mitwirkende der weltweiten CP2K-Community für einen neuen Übersichtsartikel zusammengebracht.
Im Gegensatz zu hochspezialisierten Fachpublikationen bietet dieser Artikel einen umfassenden Überblick über alle Funktionen und die zugrunde liegenden Methoden der Software, wobei ein besonderes Augenmerk auf der praktischen Anwendung liegt. Damit fungiert die Veröffentlichung als zentrales Referenzwerk, das theoretisches Wissen mit konkreten Nutzungsszenarien verknüpft.
Dr. Andreas Knüpfer, Leiter des CASUS Scientific Computing Core, betont die strategische Bedeutung dieses Projekts: „Diese Veröffentlichung zu CP2K spiegelt die Mission unserer Abteilung wider, mit unserem Fachwissen in der Informatik Spitzenforschung in verschiedenen Bereichen zu unterstützen. Gleichzeitig ist es wichtig, die Ergebnisse zugänglich zu machen und ihren Transfer in andere Fachgebiete und Anwendungsbereiche zu ermöglichen. Letztendlich kommt dies auch CP2K selbst zugute. Denn nur mit einer großen Community, die neue Mitglieder willkommen heißt, kann es seine derzeitige Führungsrolle behaupten.“
Quelle
Helmholtz-Zentrum Dresden-Rossendorf (HZDR) (01/2026)
Publikation
M. Iannuzzi et al.: The CP2K Program Package Made Simple, in The Journal of Physical Chemistry B, 2026 (DOI: 10.1021/acs.jpcb.5c05851)
https://doi.org/10.1021/acs.jpcb.5c05851