Voc4Cat – erstes digitales Wörterbuch der Katalyseforschung

20. November 2025

Chemiker:innen am Rostocker Leibniz-Institut für Katalyse (LIKAT) haben eine digitale Plattform entwickelt. Sie verknüpft Forschungsdaten aus der Katalyse und steht der Fachwelt für Recherche, Austausch und künftige KI-Anwendungen bereit. Das cloudbasierte Herzstück dieser Datenbank ist das digitale Wörterbuch Voc4Cat. Es definiert relevante Begriffe – etwa zu Vorgehensweisen, Ausgangsstoffen, Laborprodukten, Analytik und Modellierung – nutzerfreundlich und maschinenlesbar. Voc4Cat ist der Community über GitHub als Open Source zugänglich.

Ähnlich wie bei Wikipedia können angemeldete Nutzer mitarbeiten und den digitalen Wissensspeicher kontinuierlich mit neuen Daten erweitern. Das System wurde am LIKAT im Rahmen des NFDI4Cat-Konsortiums (Teil der Nationalen Forschungsdateninfrastruktur, NFDI) mit DFG-Mitteln finanziert. Ein Team um den LIKAT-Chemiker Dr. David Linke entwickelte die Plattform in den letzten zwei Jahren. Linke programmierte zudem gemeinsam mit Dr. Nikolaos Moustakas das erste Vokabular für Voc4Cat, welches aktuell rund 500 Begriffe umfasst.

Katalyse als Schlüsseltechnologie

Die Katalyse entwickelt sich zur Schlüsseltechnologie für eine nachhaltige und klimafreundliche Energieversorgung. Diese Bedeutung spiegelt sich in einer rasch wachsenden Zahl von Publikationen und Daten wider. Laut Dr. Moustakas verwendet jedoch bisher jedes Forschungsteam bei der Dokumentation eigene Begriffe, was die KI-gestützte Verknüpfung von Forschungsdaten erschwert. Es war daher dringend notwendig, eine Grundlage für die Vernetzung der Forschungsergebnisse in der Katalysechemie und angrenzenden Bereichen wie dem Chemieingenieurwesen und der Verfahrenstechnik zu schaffen. Das Open-Source-Projekt ermöglicht es der gesamten „Community“, durch den Zugriff auf einen zentralen digitalen Speicher das Vokabular gemeinsam zu pflegen und zu erweitern.

FAIR-Kriterien für Datenmanagement

Die FAIR-Kriterien (Findability, Accessibility, Interoperability, Re-Usability) gelten weltweit als Standard für das digitale Management von Forschungsdaten. Speziell Interoperability verlangt, dass Forschungsdaten so aufbereitet und dokumentiert werden, dass sie von Maschinen eindeutig gelesen, ausgetauscht und verknüpft werden können. Voc4Cat leistet genau hierzu einen wichtigen Beitrag. „Für Programmierer ist vor allem die Datenkompatibilität eine Herausforderung, denn selbst in den sogenannten exakten Wissenschaften werden Fachbegriffe oft unterschiedlich verwendet“, sagt Nikolaos Moustakas. Zu jeder Vokabel gehört bei Voc4Cat deshalb neben der Definition eine international eindeutige Identifikationsnummer, kurz IRI. Hinterlegt sind ebenso Angaben zu Autoren und weiteren Quellen sowie Verweise auf Synonyme und auf inhaltliche Beziehungen zu anderen Methoden und Konzepten.

Kompatibel zu lokalen Netzwerken und ChemCatChem

Wer Forschungsergebnisse zur chemischen Katalyse veröffentlichen will, kann Schlüsselbegriffe des Papers nun mit Voc4Cat verlinken und der eigenen Formulierung eine definierte Bedeutung hinterlegen. Diese Vernetzung erleichtert es Autoren, ihre neuen Erkenntnisse im Netz auffindbar zu machen und sie mit anderen relevanten Themen in Beziehung zu setzen, was die Zitationsrate des Papers positiv beeinflusst.

In Zusammenarbeit mit der Fachzeitschrift ChemCatChem (Wiley Verlag) wurden die wichtigsten Schlagwörter bereits in Voc4Cat aufgenommen. Alle Informationen und Vokabeln in der Datenbank sind standardkonform und maschinenlesbar, was ihre einfache Integration in andere Software-Systeme, elektronische Laborjournale oder Forschungsdatenportale ermöglicht.

Nutzer finden eine Anleitung für eigene Einträge in das Wiki der Katalyse oder für Änderungsvorschläge im Vokabular unter dem GitHub-Link des NFDI4Cat-Konsortiums. Voc4Cat-Kuratoren können bei Bedarf unterstützen und prüfen die Einträge stets auf fachliche Richtigkeit. Kurator Nikolaos Moustakas betont: „Alles verläuft offen, jeder kann nachverfolgen, was wir tun.“ Zu den Kuratoren zählt auch David Linke.

KI macht Papers Voc4Cat-kompatibel

Die Nationale Forschungsdateninfrastruktur (NFDI e.V.) wurde vor fünf Jahren von Bund und Ländern gegründet, um den digitalen Umgang mit Forschungsdaten zu fördern. Im Rahmen dieser Initiative trainiert Dr. Moustakas derzeit eine eigene Sprach-KI-Lösung. Diese soll Chemikern helfen, ihre bereits veröffentlichten Paper für das digitale Wörterbuch aufzubereiten. Das Tool, gewissermaßen ein Voc4Cat-GPT, wird in der Lage sein, die relevanten Begriffe in den Texten automatisch zu erkennen. Die Verfügbarkeit dieses Tools ist für Ende des Jahres geplant.

Link zu Voc4Cat:
https://nfdi4cat.github.io/voc4cat/

Quelle

Leibniz-Institut für Katalyse / Informationsdienst Wissenschaft e. V. (11/2025)

Nach oben scrollen