In einer Zusammenarbeit zwischen dem Forschungszentrum Jülich und der Heinrich-Heine-Universität Düsseldorf wurde mit „Helixer“ ein Werkzeug entwickelt, das die Genforschung grundlegend transformieren könnte. Diese Innovation ermöglicht es, Gene direkt aus DNA-Sequenzen zu bestimmen, ohne dass dafür Laborversuche oder spezifisches Vorwissen über den jeweiligen Organismus erforderlich sind.
Die Bedeutung dieses Fortschritts wird deutlich, wenn man die bisherigen Hürden der Genomanalyse betrachtet. Bevor biologische Aussagen über genetische Eigenschaften getroffen werden können, muss die strukturelle Genannotation erfolgen. Das ist die Identifizierung der genauen Positionen der Gene innerhalb der DNA-Abfolge. Dieser Prozess galt bislang als einer der anspruchsvollsten Schritte. Er war zwingend auf umfangreiche experimentelle Daten oder Informationen über bereits gut erforschte verwandte Arten angewiesen. Helixer vereinfacht und beschleunigt dieses Verfahren nun massiv.
Das System nutzt künstliche Intelligenz, um typische Merkmale von Genen direkt in den Sequenzen zu identifizieren. Dazu zählen neben Start- und Stoppsignalen auch die nicht-translatierten Bereiche (UTR), die strukturellen Elemente der kodierenden DNA-Sequenzen (CDS) sowie die dazwischenliegenden Introns.
Marie Bolger verdeutlicht den Durchbruch mit einem Vergleich: „Es ist, als würde man in einem völlig unbekannten Buch plötzlich Absätze, Kapitel und einzelne Wörter erkennen. Das macht die Genomforschung deutlich schneller.“
Ähnlich präzise wie klassische Verfahren
Helixer markiert einen Meilenstein in der Bioinformatik. Es ist als erstes KI-Werkzeug in der Lage, Gene über extrem unterschiedliche Organismengruppen hinweg – von Pflanzen und Pilzen bis hin zu Insekten und Wirbeltieren – zuverlässig zu bestimmen. Angesichts der Tatsache, dass weltweit jährlich tausende Genome entschlüsselt werden, darunter viele von bisher kaum erforschten Arten, bietet das Tool einen entscheidenden Zeitvorteil. Es liefert sofort nutzbare Geninformationen, für deren Gewinnung früher oft monatelange Analysen notwendig waren.
Dabei sagt die künstliche Intelligenz die Grenzen von Genen so präzise voraus, dass sie ohne zusätzliche Daten nahezu die Qualität manuell kuratierter Referenzannotationen erreicht. Besonders bei Wirbeltieren überzeugt Helixer durch eine hohe Genauigkeit. Es übertrifft etablierte Werkzeuge zur Genprädiktion über ein breites Artenspektrum hinweg. Herausragende Ergebnisse liefert der Deep-Learning-Ansatz zudem bei Pflanzen, wo die Vorhersage der Genstruktur im Vergleich zu herkömmlichen Methoden deutlich verbessert wurde.
Das Forschungsteam hatte das grundlegende Konzept bereits 2020 vorgestellt und Helixer seither zu einem praxistauglichen Werkzeug weiterentwickelt. Während neuere, spezialisierte Tools wie das 2024 veröffentlichte Tiberius der Universität Greifswald bei Säugetieren derzeit sogar noch präzisere Ergebnisse liefern, bleibt Helixer durch seine Vielseitigkeit über verschiedene taxonomische Gruppen hinweg einzigartig.
Neue Impulse für das Forschungsfeld
In der praktischen Anwendung erweist sich Helixer als vielseitiger Allrounder, dessen Relevanz weit über die Theorie hinausgeht. „Wir konnten zeigen, dass Helixer für eine Vielzahl von Organismen funktioniert, was für den Einsatz in der Pflanzenzüchtung, Biotechnologie und Umweltforschung entscheidend ist“, betont Bolger. „Diese Fortschritte in der KI-gestützten Genannotation sind für das Fachgebiet wirklich spannend.“
Dieser Durchbruch adressiert ein langjähriges Ungleichgewicht in der Biologie. Während die Genomsequenzierung bereits vor über zwei Jahrzehnten automatisiert wurde und seither eine enorme Datenfülle produziert, blieb die Genannotation lange Zeit das Nadelöhr der Genomanalyse. Erst jetzt beginnt die Auswertung der Daten, technologisch mit deren Erzeugung gleichzuziehen.
Prof. Björn Usadel ordnet die Entwicklung historisch ein: „Fast zwei Jahrzehnte lang gab es in diesem Bereich keine grundlegend neuen Ansätze“, sagt er. „Helixer zeigt, dass moderne KI-Methoden helfen können, diesen Engpass zu überwinden.“
Ausblick
Die Resonanz in der Fachwelt ist bereits jetzt bemerkenswert. Die praktische Relevanz unterstreicht Björn Usadel mit einem Blick auf die aktuelle Anwendung: „Wir sehen bereits, dass Helixer in vielen Projekten eingesetzt wird – von Nutzpflanzen bis hin zu Insekten, die ganze Ökosysteme prägen“, sagt Usadel. Doch die Entwicklung steht nicht still. Mit Blick auf die Zukunft arbeitet Felicitas Kindel bereits an innovativen Strategien, um die technologischen Fähigkeiten von Helixer noch weiter auszubauen und zu verfeinern.
Perspektiven für Forschung und Anwendung
Helixer eröffnet in verschiedenen Bereichen neue Möglichkeiten:
- Landwirtschaft: Identifizierung von Genen, die die Trockenheits- oder Krankheitsresistenz beeinflussen
- Umweltschutz: Identifizierung von Genen in Organismen, die an Stoffwechselwegen beteiligt sind, welche die Widerstandsfähigkeit von Ökosystemen unterstützen.
- Biotechnologie: Identifizierung von Genen in Pflanzen und Pilzen, die zur Biosynthese kommerziell wertvoller Produkte, darunter auch Arzneimittel, genutzt werden können.
Weiterhin kann Helixer etablierte Analyseverfahren sinnvoll ergänzen und damit selbst bei bereits gut erforschten Arten neue Erkenntnisse liefern.
Quelle
Forschungszentrum Jülich (01/2026)
Publikation
Holst, F., Bolger, A.M., Kindel, F. et al.
Helixer: ab initio prediction of primary eukaryotic gene models combining deep learning and a hidden Markov model.
Nat Methods (2025), DOI: https://doi.org/10.1038/s41592-025-02939-1