KI löst 50 Jahre altes Problem der Biologie

Mit AlphaFold ist es der Google-Tochter Deepmind, die in der Vergangenheit in der Welt von Go und Schach Aufsehen erregt hat, gelungen, das sogenannte Proteinfaltungsproblem in den Griff zu bekommen. [...]

Biologen können zunehmend KI als zentrales Forschungstool nutzen. (c) Pixabay
Biologen können zunehmend KI als zentrales Forschungstool nutzen. (c) Pixabay

Proteine sind essentiell für das Leben und unterstützen praktisch alle seine Funktionen. Sie sind große komplexe Moleküle, die aus Ketten von Aminosäuren bestehen. Was ein Protein tut, hängt weitgehend von seiner einzigartigen 3D-Struktur ab. Herauszufinden, in welche Formen sich Proteine falten, ist als „Proteinfaltungsproblem“ bekannt und war in den letzten 50 Jahren eine große Herausforderung für die Biologie. 

Die neueste Version des KI-Systems AlphaFold wurde von den Organisatoren der alle zwei Jahre stattfindenden Critical Assessment of protein Structure Prediction (CASP) als Lösung für diese große Herausforderung anerkannt – ein großer wissenschaftlicher Fortschritt, so Deepmind in einem Blogbeitrag. „Dieser Durchbruch zeigt, welchen Einfluss KI auf wissenschaftliche Entdeckungen haben kann und welches Potenzial sie hat, den Fortschritt in einigen der grundlegendsten Bereiche, die unsere Welt erklären und gestalten, dramatisch zu beschleunigen.“

Die Form eines Proteins ist eng mit seiner Funktion verknüpft, und die Fähigkeit, diese Struktur vorherzusagen, ermöglicht ein besseres Verständnis dessen, was es tut und wie es funktioniert. Viele der größten Herausforderungen der Welt, wie die Entwicklung von Therapien für Krankheiten oder die Suche nach Enzymen, die Industrieabfälle abbauen, sind grundlegend mit Proteinen und der Rolle, die sie spielen, verbunden.

Das „Proteinfaltungsproblem“

In seiner Dankesrede für den Chemie-Nobelpreis 1972 postulierte Christian Anfinsen, dass theoretisch die Aminosäuresequenz eines Proteins seine Struktur vollständig bestimmen sollte. Diese Hypothese löste eine fünf Jahrzehnte währende Suche nach einer Möglichkeit aus, die 3D-Struktur eines Proteins allein auf der Grundlage seiner 1D-Aminosäuresequenz rechnerisch vorherzusagen, als ergänzende Alternative zu den teuren und zeitaufwändigen experimentellen Methoden. Eine große Herausforderung besteht jedoch darin, dass die Anzahl der Möglichkeiten, wie sich ein Protein theoretisch falten könnte, bevor es seine endgültige 3D-Struktur annimmt, astronomisch ist. Im Jahr 1969 stellte Cyrus Levinthal fest, dass es länger als das Alter des bekannten Universums dauern würde, um alle möglichen Konfigurationen eines typischen Proteins mit Brute Force aufzuzählen – Levinthal schätzte 10^300 mögliche Varianten für ein typisches Protein. Doch in der Natur falten sich Proteine spontan, manche innerhalb von Millisekunden. 

Ergebnisse der CASP14-Bewertung

1994 gründeten Professor John Moult und Professor Krzysztof Fidelis das CASP als zweijährliche Blindbewertung, um die Forschung zu bündeln, den Fortschritt zu überwachen und den Stand der Technik bei der Vorhersage von Proteinstrukturen zu ermitteln. Es ist sowohl der Goldstandard für die Bewertung von Vorhersagetechniken als auch eine einzigartige globale Gemeinschaft, die auf gemeinsamer Anstrengung beruht. Entscheidend ist, dass CASP Proteinstrukturen auswählt, die erst vor kurzem experimentell bestimmt wurden, um als Ziele für die Teams zu dienen, an denen sie ihre Methoden zur Strukturvorhersage testen können; sie werden nicht im Voraus veröffentlicht. Die Teilnehmer müssen die Struktur der Proteine blind vorhersagen, und diese Vorhersagen werden anschließend mit den experimentellen Daten verglichen, sobald diese verfügbar sind. 

In den Ergebnissen des 14. CASP-Assessments, die vor kurzem veröffentlicht wurden, erreicht DeepMinds neuestes AlphaFold-System eine Vorhersagegenauigkeit von 92,4 Prozent. Diese Ergebnisse eröffnen Biologen das Potenzial, die computergestützte Strukturvorhersage als ein zentrales Werkzeug in der wissenschaftlichen Forschung einzusetzen. 

Trainigsdaten für Deep Learning

DeepMind hat sein System auf öffentlich zugänglichen Daten trainiert, die aus rund 170.000 Proteinstrukturen aus der Protein-Datenbank bestehen, zusammen mit großen Datenbanken, die Proteinsequenzen mit unbekannter Struktur enthalten. Verwendet wurden 16 TPUv3s (das sind 128 TPUv3-Kerne oder ungefähr das Äquivalent zu 100-200 GPUs), die über ein paar Wochen liefen, „eine relativ bescheidene Menge an Rechenleistung im Kontext der meisten großen State-of-the-Art-Modelle, die heute beim maschinellen Lernen verwendet werden“, so der Blogbeitrag von DeepMind. 


Mehr Artikel

News

Bad Bots werden immer menschenähnlicher

Bei Bad Bots handelt es sich um automatisierte Softwareprogramme, die für die Durchführung von Online-Aktivitäten im großen Maßstab entwickelt werden. Bad Bots sind für entsprechend schädliche Online-Aktivitäten konzipiert und können gegen viele verschiedene Ziele eingesetzt werden, darunter Websites, Server, APIs und andere Endpunkte. […]

Frauen berichten vielfach, dass ihre Schmerzen manchmal jahrelang nicht ernst genommen oder belächelt wurden. Künftig sollen Schmerzen gendersensibel in 3D visualisiert werden (c) mit KI generiert/DALL-E
News

Schmerzforschung und Gendermedizin

Im Projekt „Embodied Perceptions“ unter Leitung des AIT Center for Technology Experience wird das Thema Schmerzen ganzheitlich und gendersensibel betrachtet: Das Projektteam forscht zu Möglichkeiten, subjektives Schmerzempfinden über 3D-Avatare zu visualisieren. […]

Be the first to comment

Leave a Reply

Your email address will not be published.


*