Bioinformatik: KI sagt Funktion von Enzymen voraus |
Enzyme sind die Molekülfabriken in biologischen Zellen. Doch mit welchen molekularen Grundbausteinen sie arbeiten, um daraus Zielmoleküle zusammenzusetzen, ist vielfach unbekannt und schwer zu messen. Ein internationales Team mit Bioinformatikern der Heinrich-Heine-Universität Düsseldorf (HHU) ist hier einen wichtigen Schritt vorangekommen: Ihr KI-Verfahren sagt mit hoher Genauigkeit voraus, ob ein beliebiges Enzym einen bestimmten Baustein weiterverarbeiten kann.
Enzyme sind wichtige Biokatalysatoren in allen lebenden Zellen: Sie
ermöglichen chemische Reaktionen, mit denen alle für den Organismus
bedeutsamen Moleküle aus Grundsubstanzen (den Substraten) hergestellt
werden. Die meisten Organismen besitzen Tausende verschiedener Enzyme,
jedes ist für eine ganz bestimmte Reaktion verantwortlich. Die Funktion
aller Enzyme zusammen macht den Stoffwechsel aus und bedingt damit das
Leben und Überleben des Organismus.
Auch wenn Gene, die Enzyme
kodieren, recht leicht als solche erkannt werden können, so ist die
genaue Funktion des resultierenden Enzyms in den allermeisten Fällen –
bei mehr als 99 Prozent – unbekannt. Denn ihre Arbeit experimentell zu
charakterisieren und damit zu erkennen, welche Ausgangsmoleküle ein
bestimmtes Enzym konkret in welches Endmolekül umwandelt, ist extrem
aufwändig.
Das Forschungsteam um Prof. Dr. Martin Lercher von der
Arbeitsgruppe Computergestützte Zellbiologie an der HHU entwickelte
zusammen mit Kollegen aus Schweden und Indien eine Methode, die
KI-basiert vorhergesagt, ob ein beliebiges Enzym ein bestimmtes Molekül
als Ausgangsstoff für die von ihm katalysierte Reaktion verarbeiten
kann.
Prof. Lercher: „Die Besonderheit unseres ESP-Modells – dies
steht für „Enzyme-Substrate-Prediction“ – ist, dass wir nicht auf
einzelne, spezielle Enzyme und ihre nahen Verwandten beschränkt sind,
wie dies in bisherigen Ansätzen der Fall war. Unser allgemeines Modell
kann mit jeder Kombination aus einem beliebigen Enzym und über 1.000
verschiedenen Substraten arbeiten.“
Doktorand Alexander Kroll,
Erstautor der Studie, hat ein sogenanntes Deep Learning-Modell
entwickelt, in dem die Informationen über die Enzyme und die Substrate
in mathematischen Strukturen, sogenannten numerischen Vektoren, kodiert
wurden. Die Vektoren von rund 18.000 experimentell bekannten
Enzym-Substrat-Kombinationen – bei denen Enzym und Substrat tatsächlich
zusammenarbeiten – wurden als Trainingsmaterial in das Deep
Learning-Modell gefüttert. Alexander Kroll: „Das so von uns trainierte
Modell haben wir dann auf einen unabhängigen Testdatensatz angewandt,
für den wir die korrekten Antworten schon kannten. In 91 Prozent der
Fälle sagte das Modell korrekt voraus, welche Substrate zu welchen
Enzymen passen.“
Diese Methode hat erhebliches
Anwendungspotenzial. Sowohl in der Arzneimittelforschung als auch in der
Biotechnologie ist es von großer Bedeutung zu wissen, welche Stoffe von
Enzymen umgesetzt werden können. Prof. Lercher: „So können Forschung
und Industrie aus einer großen Menge an möglichen Kombinationen
diejenigen eingrenzen, die am vielversprechendsten sind, um damit neue
Medikamente, Chemikalien oder auch Biokraftstoffe enzymatisch
herzustellen.“ Kroll ergänzt: „Hiermit werden auch bessere Modelle
möglich, um den Stoffwechsel in Zellen zu simulieren. Darüber kann die
Physiologie verschiedener Organismen – von Bakterien bis zum Menschen –
verstanden werden.“
An der Studie waren neben Kroll und Lercher
auch Prof. Dr. Martin Engqvist von der Chalmers University of Technology
im schwedischen Gothenburg und Sahasra Ranjan vom Indian Institute of
Technology in Mumbai beteiligt. Engqvist hat das Studiendesign mit
erarbeitet, Ranjan hat das Modell implementiert, das die
Enzyminformationen kodiert, die in das von Kroll entworfene Gesamtmodell
eingespeist werden.
Den Artikel finden Sie unter:
https://www.hhu.de/news-einzelansicht/ki-sagt-funktion-von-enzymen-voraus
Quelle: Heinrich-Heine-Universität Düsseldorf (05/2023)
Publikation: Kroll,
A., Ranjan, S., Engqvist, M.K.M., Lercher, M., A general model to
predict small molecule substrates of enzymes based on machine and deep
learning. Nat Commun 14, 2787 (2023),
https://doi.org/10.1038/s41467-023-38347-2
|