Struktur der DNA spielt wichtige Rolle bei der Proteinbindung
Forschende der Universität Bielefeld haben sich mit der Frage befasst, wie Transkriptionsfaktoren spezifisch DNA binden. Transkriptionsfaktoren sind Proteine, die steuern, an welcher Stelle die DNA abgelesen wird. Die Arbeitsgruppe um Biologie-Professorin Dr. Andrea Bräutigam untersuchte dafür DNA-Sequenzen der Ackerschmalwand (Arabidopsis thaliana). Theoretisch gibt es viele DNA-Positionen mit Bindung-ermöglichenden Basenpaaren, aber nicht an allen Stellen binden die 216 untersuchten Transkriptionsfaktoren.
Die Forschenden haben nun ein Modell entwickelt, das vorhersagt,
welche Proteine an welcher Stelle binden können. Die Studie ist am 12.
November in Nature Communications veröffentlicht worden.
Die
Ackerschmalwand ist eine typische Modellpflanze für DNA-Forschungen, da
sie die am besten analysierte Pflanze ist. Für ihre Forschung
analysierten die Mitglieder der Arbeitsgruppe zunächst die 3D-Struktur
der DNA der Pflanze und die Basenfolgen, an denen Transkriptionsfaktoren
binden. „Wir haben uns nicht nur bestimmte Basenmotive angeguckt, also
sich wiederholende Abfolgen der Basenpaare in der DNA, sondern auch auf
ihre Struktur im Raum geachtet“, sagt Janik Sielemann, Erstautor der
Studie und Doktorand in der Arbeitsgruppe.
In der
dreidimensionalen Doppelhelix der DNA können die Basenpaare
unterschiedlich zueinander stehen: Sie können zum Beispiel dicht
beieinander, etwas weiter voneinander entfernt, geneigt oder auch
verschoben sein. „Wir wollten testen, ob die räumliche Struktur eine
wichtige Rolle spielt“, sagt Sielemann. „Also haben wir durch
maschinelles Lernen ein Modell entwickelt, mit dem wir Vorhersagen
darüber treffen können, welche Proteine wo binden werden.“ Dieses sollte
zunächst anhand der Kombination der Basenfolgen und ihrer Struktur
Bindungsmuster erkennen.
„Wir sind davon ausgegangen, dass es
kombinatorische oder auch nicht-lineare Beziehung gibt“, sagt Bräutigam.
Für Anwendungen mit vielen unterschiedlichen Faktoren, die auf
ungeklärte Weise miteinander in Beziehung stehen, eignen sich
Anwendungen des maschinellen Lernens ganz besonders. Sie sind darauf
ausgelegt, bestimmte Muster in sehr großen Datensätzen zu erkennen. „Ein
Mensch könnte das möglicherweise auch, aber er würde dafür sehr viel
mehr Zeit benötigen“, sagt die Wissenschaftlerin.
Tatsächlich
ließen sich dadurch bestimmte, wiederkehrende Muster in der DNA
erkennen, die einen Einfluss auf die Bindung eines Transkriptionsfaktors
zu haben schienen. „Die räumliche Struktur der DNA war für uns die
Erklärung, warum ein Transkriptionsfaktor nicht an alle identischen
Basenfolgen binden, sondern nur an ganz bestimmten Stellen“, sagt
Bräutigam.
Die Forschenden wollten ihre Ergebnisse daraufhin
experimentell validieren, also in der Anwendung überprüfen. „Es ging uns
darum, das biologische Vorhersagepotenzial zu testen“, erläutert die
Professorin. Dafür verwendete die Gruppe verschiedene, eigens
angefertigte DNA-Sequenzen. „Diese Sequenzen kommen in unserer
Modellpflanze gar nicht vor.“ Daraufhin ließen sie den Algorithmus
Vorhersagen darüber treffen, an welchen Stellen dieser Sequenzen die
Transkriptionsfaktoren binden würden – und an welchen nicht. „Wir lagen
meist richtig.“
Diese Grundlagenforschung ist wichtig, da bislang
zu wenig verstanden ist, wie Gene reguliert sind und wie das die
Antwort der Pflanzen beispielsweise auf widrige Umweltbedingungen
steuert. „Das ist ein ungelöstes Problem für fast alle Organismen“, sagt
die Professorin. Eine präzise Vorhersage der Bindung ist ein erster
Schritt, Genregulation besser vorherzusagen. Solche Vorhersagen spielen
auch in der Landwirtschaft eine Rolle, da ein solches Verständnis
zielgerichtete Züchtung ermöglichen kann. „In Zukunft wird es darum
gehen, die Informationen zur Proteinbindung von der Ackerschmalwand auch
auf andere Spezies zu übertragen“, sagt Bräutigam. „Wir hoffen, dass
man auch dort durch maschinelles Lernen herausfinden kann, wo und wann
Gene offen für Bindungen sind.“
Publikation: Janik
Sielemann, Donat Wulf, Romy Schmidt, Andrea Bräutigam: Local DNA shape
is a general principle of transcription factor binding specificity in
Arabidopsis thaliana. Nature Communications, https://doi.org/10.1101/2020.09.29.318923