AlphaFold bringt Durchbruch der Proteinstrukturvorhersage
Laura Reich Diez
Bisher kannten Wissenschaftler nur von einem kleinen Teil der Proteine im menschlichen Körper die Struktur, dabei handelt es sich um die Grundbausteine des Lebens. Die Künstliche Intelligenz AlphaFold hat das nun geändert. Im vergangenen Jahr gelang Forschern der britischen Firma DeepMind, einer Tochter der Google-Holding Alphabet, etwas, das als unmöglich galt: nahezu perfekte Vorhersagen von Proteinstrukturen.
AlphaFold nutzt Deep Learning, um eine Proteinstruktur basierend auf der Aminosäuresequenz des Proteins vorherzusagen. Entstanden ist eine frei zugängliche Datenbank, die viele Tausend Proteinstrukturen enthält. Die möglichen Anwendungsbereiche sind breit gefächert: zum einen sollen die Daten zu Durchbrüchen in der medizinischen Forschung führen, zum anderen können sie aber auch genutzt werden, um Bakterien zu entwickeln, die Plastik in der Umwelt zersetzen können, sowie für die Pflanzenzucht.
Betreut wird die Datenbank vom Europäischen Laboratorium für Molekularbiologie (EMBL) und deckt beinahe die komplette Menge aller 20.000 beim Menschen vorkommenden Proteine, dem sogenannten Proteom ab. Allerdings unterscheiden sich hierbei die Genauigkeitsstufen der Vorhersage. Ebenso umfassen die AlphaFold Vorhersagen zahlreiche weitere Proteine, die in anderen für die Forschung wichtigen Modellorganismen wie Mäusen, Fruchtfliegen oder Coli-Bakterien von Bedeutung sind.
Im Interview mit Peter Kuhn von 5-HT spricht Christoph Müller, Leiter der Structural and Computational Unit des EMBL Heidelberg, über den Durchbruch der AlphaFold Proteinstrukturvorhersage, die Bedeutung der AlphaFold Database und den damit einhergehenden Fortschritt.
Christoph Müller, EMBL und Peter Kuhn, 5-HT (v.l.n.r.), Photo: 5-HT
Überraschende Reaktionen auf das Ergebnis von AlphaFold
„Ich war auf jeden Fall überrascht, so wie die gesamte Community,“ erzählt Müller von seiner Reaktion auf AlphaFold´s Ergebnis beim CASP Wettbewerb. „In der Vergangenheit hatte AlphaFold bereits gute Ergebnisse erzielt, aber immer noch im Feld mit den anderen Teilnehmern. Das aktuelle Ergebnis von AlphaFold ist hingegen deutlich besser und ein wichtiger Beitrag zur Lösung des Proteinfaltungsproblem.“ Deepminds AlphaFold 2.0 sagt Proteinfaltungen so gut voraus, dass Wissenschaftler des CASP die KI als Lösung für das 50 Jahre alte Problem der Proteinfaltung bezeichnen.
Christoph Müller, EMBL, Photo: 5-HT
Anfängliche Bedenken der praktischen Anwendungen von AlphaFold konnten rasch über Bord geworfen werden, denn es wurde schnell klar, dass die Methode robust ist und sich breit anwenden lässt. „Wenn ein Wissenschaftler überrascht ist, fragt er sich, was dahintersteckt, das liegt in unserer Natur. Zu Beginn waren wir vielleicht etwas skeptisch, aber insgesamt haben wir uns gefreut. Wir denken, dass dies ein immenser Schritt vorwärts ist.“
Bereits 2018 gewann DeepMind mit der KI-Anwendung AlphaFold den renommierten CASP Wettbewerb. Im vergangenen Jahr erzielten die Wissenschaftler bei einer erneuten Teilnahme revolutionäre Ergebnisse und somit einen Durchbruch bei einem der wichtigsten Probleme der Biologie.
„Critical Assessment of Protein Structure Prediction“- Hintergrund zum CASP Wettbewerb
Das „Critical Assessment of Protein Structure Prediction“ (CASP) ist ein Wettbewerb zur Überprüfung aktueller Methoden für die Vorhersage der Proteinfaltung mit dem Ziel, die besten Methoden für die Vorhersage von Proteinstrukturen zu finden und so zu fördern.
Bei dem Wettbewerb werden die Teilnehmer aufgefordert, Proteinstrukturen vorherzusagen, die zwar bereits von anderen Wissenschaftlern empirisch gelöst, aber noch nicht veröffentlicht wurden. Sie sind nur den beteiligten Wissenschaftlern und CASP bekannt. Dadurch kann CASP die Vorhersagen überprüfen, ohne dass die Teilnehmer zuvor Zugriff auf die empirischen Daten hatten.
Überwiegend richtige Ergebnisse mit AlphaFold – ein Durchbruch
„Früher war es so, dass eine vorhergesagte Struktur in manchen Bereichen richtig und in manchen Bereichen falsch war, aber insgesamt immer noch ziemlich falsch,“ erläutert Müller den Wissensstand vor AlphaFold. „Im Gegensatz hierzu sind die Alphafold Vorhersagen überwiegend richtig, und das ist ein super Ergebnis. Die Vorhersagen sind so genau, dass sie in einen Bereich kommen, den man bisher nur mit experimentellen strukturbiologischen Methoden erreichen konnte.“
Die AlphaFold-Proteinstruktur-Datenbank
Die AlphaFold Database bietet in Zusammenarbeit mit dem EMBL-European Bioinformatics Institute (EMBL-EBI) freien Zugang zu Proteinstrukturvorhersagen für das menschliche Proteom und 20 weiteren wichtigen Organismen, um die wissenschaftliche Forschung zu beschleunigen. Die Datenbank wurde gestern aktualisiert und enthält nun viel mehr Daten über verschiedene Organismen. Mit dieser Aktualisierung wird sich die Größe der AlphaFold-Datenbank mehr als verdoppeln, von 365.000 Proteinstrukturvorhersagen auf über 800.000 Proteinstrukturvorhersagen. Sie baut sowohl auf vielen früheren Beiträgen der internationalen wissenschaftlichen Gemeinschaft auf als auch auf den hochentwickelten algorithmischen Innovationen von AlphaFold und der jahrzehntelangen Erfahrungen von EMBL-EBI.
Photo EMBL Campus Credits: Massimo del Prete/EMBL
„Die einfache Bedienung der Webseite im Google-Style und die Daten selbst haben immense Auswirkungen für die Strukturbiologie, aber auch insgesamt für die Lebenswissenschaften und die medizinische Forschung bzw. deren praktischen Anwendungen. Zur Verdeutlichung: man tippt den Namen eines Proteins oder Gens ein und bekommt direkt das Ergebnis ausgeworfen. Die Tatsache, dass jeder, der an einem Problem arbeitet, sofort eine präzise dreidimensionale Strukturvorhersage abrufen kann, ist ein signifikanter Fortschritt. AlphaFold hilft Wissenschaftlern schon jetzt dabei, Entdeckungen zu beschleunigen,“ erläutert Christoph Müller die positiven Auswirkungen von AlphaFold. Hinzukommend bietet AlphaFold auch eine sehr große Zeitersparnis in der Forschung. Für deutsche Wissenschaftler ist AlphaFold von großer Bedeutung, denn was die Herkunft der User betrifft, befindet sich Deutschland unter den TOP 5 Ländern.
„In unserer eigenenForschung benutzen wir inzwischen viel Kryoelektronenmikroskopie um damit Strukturen von Komplexen zu lösen. Komplexe sind etwas, das AlphaFold bisher noch nicht vorhersagen kann, aber wenn man dann die Faltung der einzelnen Bausteine kennt, dann fällt die Interpretation der Gesamtstruktur dieser Komplexe sehr viel leichter,“ so Müller. Ein Komplex ist eine Zusammenlagerung mehrerer Proteine. Erst in diesem Komplex können viele Proteine ihre zelluläre Funktion bieten.
Vorhersage von Komponenten, die aus Wechselwirkungen zwischen den Proteinen entstehen
Die Vorhersage von Komplexen, die durch Wechselwirkungen zwischen den einzelnen Proteinen entstehen, könnte zukünftig mit Genauigkeit möglich sein. „Das ist sicher im Bereich des Möglichen. Da gibt es inzwischen auch schon erste Schritte und Publikationen, mit sehr guten Ergebnissen. Zumindest bei der Vorhersage von zwei Komponenten können Dimer-Strukturen aber auch Oligomere von zwei verschiedenen Proteinen relativ gut vorhergesagt werden. Das heißt, es ist zu erwarten, dass das einer der nächsten Schritte sein wird.“
Christoph Müller und seine Gruppe beim EMBL arbeiten im Bereich der Regulation der Transkription. Sie beschäftigen sich unter anderem mit der Frage: Wie wird die DNA im Messenger RNA oder andere RNA-Moleküle transkribiert? In den vergangenen Jahren konnten sie viele dieser Prozesse aufklären. „Uns interessieren jetzt vor allem Konformationsänderungen in molekularen Maschinen. Wie sind die Reaktionsmechanismen? Wie verändert sich die Struktur von Komplexen in Wechselwirkung mit anderen Faktoren?“
Potential eines Durchbruchs der Anwendungsfälle in Aussicht
„Bei sehr vielen Targets gibt es strukturelle Informationen und viele Vorhersagen, bei denen AlphaFold zu Rate gezogen werden kann. Aber dann kommen wir in den Bereich der Wechselwirkungen zwischen einem Protein und einem Liganden und die Vorhersagen dort. Komplexe zwischen Proteinen und Liganden und die Affinität des Liganden kann AlphaFold bisher nicht vorhersagen.
Ich denke, zur Zeit kann Alphafold in diesem Bereich vor allem zur Planung von Projekten beitragen. Es gibt einen strukturellen Rahmen für viele der Hypothesen. Innerhalb von diesem Bereich hat AlphaFold sehr viel beigetragen. Es sind inzwischen ca. 350.000 Strukturvorhersagen von Proteinen auf dem AlphaFold Server.
Mithilfe der AlphaFold Algorithmen kann man aber auch selbst Strukturen berechnen. Das Ziel ist es, dass am EMBL-EBI in Cambridge am Ende einige Millionen Strukturen deponiert werden, so dass quasi für jede Struktur, für die ein Gen in der Database deponiert ist, auch eine Vorhersage für diese dreidimensionale Struktur da sein wird.
Kein Zellbiologe/in wird daher behaupten können: Es gibt keine Struktur. Das Argument gilt nicht mehr, denn man muss sozusagen nur noch zu AlphaFold „hingehen, draufklicken“ und die Ergebnisse in seiner Forschung berücksichtigen.“
Lose Kontakte führen zu einer wertvollen Zusammenarbeit
„Lose Kontakte zwischen DeepMind und EMBL bestanden schon länger, die sich über die Jahre gefestigt haben, durch den gemeinsamen Wunsch, dass die Alphafold Strukturvorhersagen der Öffentlichkeit zugänglich gemacht werden müssen,“ rekapituliert Müller.
Daraufhin haben sich DeepMind und EMBL auf eine Zusammenarbeit verständigt, um die bisher vollständigste und genaueste Datenbank mit rund 20.000 Proteinen und ihren vorhergesagten Strukturen aus dem menschlichen Genom, d.h. das komplette menschliche Proteom, für die wissenschaftliche Gemeinschaft frei zugänglich zu machen.
„Die Welle ist angestoßen und es gibt andere Arbeitsgruppen, die ebenfalls in die gleiche Richtung gehen. Für uns ist es sehr wichtig, dass wir diese Daten deponieren und der Öffentlichkeit den Zugriff zu diesen Daten ermöglichen.“
Zwischen Krankheiten, Antibiotikaresistenzen und dem Recycling von Einwegkunststoffen - ein Blick in die Zukunft von AlphaFold
AlphaFold wird bereits jetzt genutzt, um seltene Krankheiten zu erforschen, Antibiotikaresistenzen zu untersuchen und Einwegkunststoffe zu recyclen. „Wir arbeiten derzeit an Komplexen mit Einzelpartikel Elektronenmikroskopie. Das heißt sehr große Komplexe, die in-vitro isoliert vorliegen und bei der wir deren Konformation betrachten. Inzwischen arbeiten wir aber auch viel mit zellulärer Kryoelektronen-Tomographie, wo diese Komplexe nicht mehr rausisoliert, sondern praktisch in der Zelle analysiert werden können. Das ist experimentell sehr aufwendig.
Diese Idee, dass wir in einer Zelle viele verschiedene Proteine sichtbar machen können, die dann alle in einer gewissen Konformation zueinander stehen und analysiert werden können, ist nicht mehr weit entfernt,“ erklärt Müller.
„Mithilfe von AlphaFold können diese Daten anschließend in einer Elektronenmikroskopie-Karte interpretiert werden. Das ist ein Schritt in die Zukunft. Ich gehe davon aus, dass es KI zukünftig gelingen wird, das Gesamtbild einer Zelle zu interpretieren. Es soll letzten Endes nicht mehr nur die dreidimensionale detaillierte Struktur eines einzelnen Proteins oder eines Komplex aufzeigen, sondern das Bild einer gesamten Zelle in atomarer Auflösung erstellen.
Stellen Sie sich vor, Sie sehen eine Krebszelle und sehen, wie die Signalwege, im Gegensatz zu einer gesunden Zelle, anders aussehen - das wäre doch großartig, oder?“
Auf dem Weg die Bausteine des Lebens zu verstehen
Das klingt so, als wäre man auf dem Weg die Bausteine des Lebens zu verstehen und modifizieren zu können? „Ich glaube das ist so. Es sind wahnsinnige große Datenmengen, auf die man Zugriff braucht. Gerade hier ist die KI ein elementares Instrument, um die Sortierung von Datenmengen zu vereinfachen, da die Informationsmenge überwältigend ist.“
Ein Riesensprung eröffnet unzählige Möglichkeiten
„Die Anwendungen, auch im Bereich des Umweltschutzes, sind breit gefächert:
Green Revolution
Neue Enzyme mit neuen Substratwirkungen usw.
Plastikabbauende Bakterien
Green Engineering
White Chemistry
Umweltschonendere Produktion gewisser Produkte
Die dreidimensionalen Strukturen sind essenziell für die enzymatische Reaktionen und für die Wechselwirkungen. Wenn man diese heranziehen möchte, müssen diese gut verstanden werden und hierbei können AlphaFold Vorhersagen ein wichtiger Baustein sein. Wir sind stolz, dass EMBL die AlphaFold Vorhersagen der Gemeinschaft zur Verfügung stellt.“
Über das Europäische Laboratorium für Molekularbiologie (EMBL)
Das EMBL ist Europas Vorzeigelabor für Biowissenschaften. Es wurde 1974 als zwischenstaatliche Organisation gegründet und wird von 27 Mitgliedsstaaten, 2 angehenden Mitgliedsstaaten und einem assoziierten Mitgliedsstaat unterstützt.
Das EMBL betreibt Grundlagenforschung in der Molekularbiologie und erforscht die Geschichte des Lebens. Das Institut bietet Dienstleistungen für die wissenschaftliche Gemeinschaft an, bildet zukünftige Generationen von Wissenschaftlern aus und bemüht sich um die Integration der Biowissenschaften in ganz Europa.
Das EMBL ist international, innovativ und interdisziplinär. Seine mehr als 1800 MitarbeiterInnen aus über 80 Ländern arbeiten an sechs Standorten in Barcelona (Spanien), Grenoble (Frankreich), Hamburg (Deutschland), Heidelberg (Deutschland), Hinxton (Großbritannien) und Rom (Italien). EMBL-WissenschaftlerInnen arbeiten in unabhängigen Gruppen, betreiben Forschung und bieten Dienstleistungen in allen Bereichen der Molekularbiologie an.
Die Forschung am EMBL treibt die Entwicklung neuer Technologien und Methoden in den Lebenswissenschaften voran. Das Institut arbeitet daran, dieses Wissen zum Nutzen der Gesellschaft zu transferieren.
Für mehr Informationen besuchen Sie: https://www.embl.org/
Über 5-HT Digital Hub for Chemistry & Health
Der 5-HT Digital Hub Chemistry & Health ist Teil der vom Bundesministerium für Wirtschaft und Energie initiierten Digital Hub Initiative (de:hub) zur Förderung digitaler Innovation in Deutschland.
Ziel des Digital Hubs ist es ein internationales Ökosystem von Startups, Investoren und Unternehmen aufzubauen, um digitale Innovation in den Branchen Chemie und Gesundheit voranzutreiben. Als zentrale Plattform bietet der Digital Hub den Akteuren die Möglichkeit zum Netzwerken, Kooperieren und Co-Entwickeln. Darüber hinaus führt der Digital Hub Hochschul-Challenges in Form des 5-HT Digital Qualifiers durch. Zudem bietet der Digital Hub mit dem 5-HT X-linker ein einwöchiges Startup-Bootcamp an, um nationale und internationale Startups auf ihr individuellen Zusammentreffen mit renommierten Chemie- und Pharmaunternehmen vorzubereiten. Außerdem erhalten die Startups durch einen Investorenpitch den Kontakt zu potenziellen Geldgebern.
Im Rahmen des Programms „Insuring Digital Health“ bringen der Digital Hub und EIT Health Startups und Krankenkassen zusammen, um innovative patientenzentrierte digitale Lösungen der Startups in das Leistungsportfolio der Krankenkassen zu integrieren.
Als Sponsoren am Digital Hub beteiligen sich die Unternehmen BASF, SAP, Pepperl+Fuchs, Merck, Roche, Gelita, Daikin, MEDI-MARKT, GWQ, Endress+Hauser, Accenture, IniNovation und Schrödinger. Die Aufnahme von weiteren Corporate Partnern ist möglich.
Für mehr Informationen besuchen Sie: https://www.5-ht.com/
Folgen Sie dem Digital Hub auf LinkedIn
5-HT Chemistry & Health Newsletter
Wollen Sie die neuesten Tech- und Branchennews, Veranstaltungen, relevante Infos aus dem Ökosystem und mehr?
Jetzt 5-HT Newsletter abonnieren Jetzt 5-HT Newsletter abonnierenWerden Sie Teil des 5-HT Chemistry & Health
Tauschen Sie sich in unserem Ökosystem mit innovativen Startups und zukunftsorientierten Unternehmen aus. Wir freuen uns auf Sie!