Proteine zählen zu den grundlegendsten Bausteinen der Natur und nehmen eine zentrale Rolle bei den biologischen Prozessen aller Organismen ein. Angesichts dieser Bedeutung ist es ein erklärtes Ziel der Wissenschaft, ihre Struktur und Funktion so präzise wie möglich zu entschlüsseln. Als Polymere, die aus verschiedenen Aminosäuren aufgebaut sind, können Proteine eine große Vielfalt an dreidimensionalen Strukturen und Funktionen annehmen. Traditionell war es jedoch oft schwierig zuzuordnen, welche spezifischen Aminosäuren vorrangig die Proteinfunktion bestimmen und welche hauptsächlich für die strukturelle Stabilität verantwortlich sind.
Einem Forschungsteam um Andreas Winkler und Oliver Eder von der TU Graz ist nun mit dem Function-Structure-Adaptability-Ansatz (FSA) ein bedeutender Durchbruch gelungen. Diese neu entwickelte Methode vergleicht KI-generierte, idealisierte Proteinsequenzen mit den natürlichen Sequenzen, die das Ergebnis einer Jahrmillionen dauernden Evolution sind. Durch diesen Vergleich lassen sich die funktions- und strukturgebenden Aminosäuren mit einer bisher unerreichter Genauigkeit bestimmen. Dieses fundierte Wissen schafft eine wichtige Grundlage für die zielgerichtete Herstellung und Modifikation von Proteinen. Die potenziellen Anwendungen sind weitreichend: Sie reichen von der Entwicklung neuer Medikamente über die gezielte Verbesserung von Proteinen für industrielle Prozesse bis hin zu einem besseren Verständnis von Proteinveränderungen, beispielsweise im Kontext von Antibiotikaresistenzen.
Die Bausteine des Lebens besser verstehen
„Als Biochemiker wollen wir verstehen, wie Proteine in der Natur entstanden sind und dadurch herausfinden, welche Aminosäuren hierbei für die speziellen Funktionen relevant sind“, sagt Andreas Winkler. „Dafür haben wir das, was die Natur im Laufe ihrer Evolution konserviert hat, mit dem kombiniert, was ein KI-Modell als relevant für Stabilität und Struktur eines Proteins erachtet. Diese Verbindung aus Millionen Jahren an Entwicklungsgeschichte und neuester Technik vereinfacht die Analyse und das Verständnis von Proteinen sehr.“
Zur Entwicklung ihres Ansatzes nutzte das Forschungsteam das Deep-Learning-Modell ProteinMPNN, welches neue Proteinsequenzen generiert, um eine vorgegebene stabile 3D-Struktur zu erreichen. Diese KI-erzeugten Sequenzen wurden mit natürlichen Proteinsequenzen abgeglichen. Als Testsystem dienten die Bakteriophytochrome, Photorezeptoren von Bakterien, die für die Lichtwahrnehmung wichtig sind. Die Analyse ermöglichte eine klare Unterscheidung: Tritt eine Aminosäure in natürlichen Sequenzen häufig auf, jedoch nicht signifikant im ProteinMPNN-Modell (das nur auf Stabilität abzielt), spricht dies für eine primär funktionelle Rolle. Ist die Aminosäure hingegen in beiden Sequenzsammlungen stark vertreten, deutet dies auf eine strukturelle Bedeutung für das Protein hin.
Validierung und Kategorisierung im Labor
Für ihren Ansatz gruppierten die Forschenden Aminosäuren basierend auf ihren chemischen Eigenschaften, um einen statistischen Vergleich zwischen natürlichen und KI-generierten Proteinen durchzuführen. Dies ermöglichte die Klassifizierung der Aminosäuren in drei Kategorien: funktional (wichtig für die spezifische Proteinfunktion), strukturell (relevant für Stabilität und Faltung) und eine dritte Kategorie, die als anpassungsfähig bezeichnet wird und noch weiterer Forschung bedarf. Die hohe Trefferquote der neuen Analysemethode wurde bestätigt, indem die Ergebnisse mit bereits bekannten funktionalen Resten aus der Literatur verglichen wurden. Zudem validierte das Team die Ergebnisse mittels umfangreicher Laborversuche. Dabei beeinflussten gezielte Veränderungen an den klassifizierten Aminosäuren die funktionellen Eigenschaften der Proteine. Beispielsweise konnte so die Lichtwahrnehmung des verwendeten Photorezeptor-Testsystems gezielt gesteuert werden.
„Früher waren oftmals etliche Monate bis Jahre an Vorarbeit und Laborarbeit notwendig, um so eine Analyse durchzuführen“, sagt Oliver Eder. „Die Vorarbeiten zur Identifikation potenziell interessanter natürlicher Proteinsequenzen sind für ein neues Protein nun innerhalb einer Woche möglich. Und weil wir mit unserer Methode die funktionellen Aminosäuren wesentlich gezielter vorfiltern können, müssen wir im Labor auch viel weniger Zeit für die Überprüfung und Charakterisierung aufwenden. Da die Methode prinzipiell auf alle Proteinklassen anwendbar ist, können wir Proteine nun deutlich gezielter besser verstehen.“
Quelle
Publikation
Integrating protein sequence design and evolutionary sequence conservation to uncover spectral tuning sites in red-light photoreceptors
Autor*innen: Oliver Maximilian Eder, Massimo Gregorio Totaro, Stefan Minnich, Gustav Oberdorfer, Andreas Winkler
Erschienen in: Structure 33
DOI: https://doi.org/10.1016/j.str.2025.07.018