KI löst 50 Jahre altes Problem der Biologie

Mit AlphaFold ist es der Google-Tochter Deepmind, die in der Vergangenheit in der Welt von Go und Schach Aufsehen erregt hat, gelungen, das sogenannte Proteinfaltungsproblem in den Griff zu bekommen. [...]

Biologen können zunehmend KI als zentrales Forschungstool nutzen. (c) Pixabay
Biologen können zunehmend KI als zentrales Forschungstool nutzen. (c) Pixabay

Proteine sind essentiell für das Leben und unterstützen praktisch alle seine Funktionen. Sie sind große komplexe Moleküle, die aus Ketten von Aminosäuren bestehen. Was ein Protein tut, hängt weitgehend von seiner einzigartigen 3D-Struktur ab. Herauszufinden, in welche Formen sich Proteine falten, ist als „Proteinfaltungsproblem“ bekannt und war in den letzten 50 Jahren eine große Herausforderung für die Biologie. 

Die neueste Version des KI-Systems AlphaFold wurde von den Organisatoren der alle zwei Jahre stattfindenden Critical Assessment of protein Structure Prediction (CASP) als Lösung für diese große Herausforderung anerkannt – ein großer wissenschaftlicher Fortschritt, so Deepmind in einem Blogbeitrag. „Dieser Durchbruch zeigt, welchen Einfluss KI auf wissenschaftliche Entdeckungen haben kann und welches Potenzial sie hat, den Fortschritt in einigen der grundlegendsten Bereiche, die unsere Welt erklären und gestalten, dramatisch zu beschleunigen.“

Die Form eines Proteins ist eng mit seiner Funktion verknüpft, und die Fähigkeit, diese Struktur vorherzusagen, ermöglicht ein besseres Verständnis dessen, was es tut und wie es funktioniert. Viele der größten Herausforderungen der Welt, wie die Entwicklung von Therapien für Krankheiten oder die Suche nach Enzymen, die Industrieabfälle abbauen, sind grundlegend mit Proteinen und der Rolle, die sie spielen, verbunden.

Das „Proteinfaltungsproblem“

In seiner Dankesrede für den Chemie-Nobelpreis 1972 postulierte Christian Anfinsen, dass theoretisch die Aminosäuresequenz eines Proteins seine Struktur vollständig bestimmen sollte. Diese Hypothese löste eine fünf Jahrzehnte währende Suche nach einer Möglichkeit aus, die 3D-Struktur eines Proteins allein auf der Grundlage seiner 1D-Aminosäuresequenz rechnerisch vorherzusagen, als ergänzende Alternative zu den teuren und zeitaufwändigen experimentellen Methoden. Eine große Herausforderung besteht jedoch darin, dass die Anzahl der Möglichkeiten, wie sich ein Protein theoretisch falten könnte, bevor es seine endgültige 3D-Struktur annimmt, astronomisch ist. Im Jahr 1969 stellte Cyrus Levinthal fest, dass es länger als das Alter des bekannten Universums dauern würde, um alle möglichen Konfigurationen eines typischen Proteins mit Brute Force aufzuzählen – Levinthal schätzte 10^300 mögliche Varianten für ein typisches Protein. Doch in der Natur falten sich Proteine spontan, manche innerhalb von Millisekunden. 

Ergebnisse der CASP14-Bewertung

1994 gründeten Professor John Moult und Professor Krzysztof Fidelis das CASP als zweijährliche Blindbewertung, um die Forschung zu bündeln, den Fortschritt zu überwachen und den Stand der Technik bei der Vorhersage von Proteinstrukturen zu ermitteln. Es ist sowohl der Goldstandard für die Bewertung von Vorhersagetechniken als auch eine einzigartige globale Gemeinschaft, die auf gemeinsamer Anstrengung beruht. Entscheidend ist, dass CASP Proteinstrukturen auswählt, die erst vor kurzem experimentell bestimmt wurden, um als Ziele für die Teams zu dienen, an denen sie ihre Methoden zur Strukturvorhersage testen können; sie werden nicht im Voraus veröffentlicht. Die Teilnehmer müssen die Struktur der Proteine blind vorhersagen, und diese Vorhersagen werden anschließend mit den experimentellen Daten verglichen, sobald diese verfügbar sind. 

In den Ergebnissen des 14. CASP-Assessments, die vor kurzem veröffentlicht wurden, erreicht DeepMinds neuestes AlphaFold-System eine Vorhersagegenauigkeit von 92,4 Prozent. Diese Ergebnisse eröffnen Biologen das Potenzial, die computergestützte Strukturvorhersage als ein zentrales Werkzeug in der wissenschaftlichen Forschung einzusetzen. 

Trainigsdaten für Deep Learning

DeepMind hat sein System auf öffentlich zugänglichen Daten trainiert, die aus rund 170.000 Proteinstrukturen aus der Protein-Datenbank bestehen, zusammen mit großen Datenbanken, die Proteinsequenzen mit unbekannter Struktur enthalten. Verwendet wurden 16 TPUv3s (das sind 128 TPUv3-Kerne oder ungefähr das Äquivalent zu 100-200 GPUs), die über ein paar Wochen liefen, „eine relativ bescheidene Menge an Rechenleistung im Kontext der meisten großen State-of-the-Art-Modelle, die heute beim maschinellen Lernen verwendet werden“, so der Blogbeitrag von DeepMind. 


Mehr Artikel

Gregor Schmid, Projektcenterleiter bei Kumavision, über die Digitalisierung im Mittelstand und die Chancen durch Künstliche Intelligenz. (c) timeline/Rudi Handl
Interview

„Die Zukunft ist modular, flexibel und KI-gestützt“

Im Gespräch mit der ITWELT.at verdeutlicht Gregor Schmid, Projektcenterleiter bei Kumavision, wie sehr sich die Anforderungen an ERP-Systeme und die digitale Transformation in den letzten Jahren verändert haben und verweist dabei auf den Trend zu modularen Lösungen, die Bedeutung der Cloud und die Rolle von Künstlicher Intelligenz (KI) in der Unternehmenspraxis. […]

News

Richtlinien für sichere KI-Entwicklung

Die „Guidelines for Secure Development and Deployment of AI Systems“ von Kaspersky behandeln zentrale Aspekte der Entwicklung, Bereitstellung und des Betriebs von KI-Systemen, einschließlich Design, bewährter Sicherheitspraktiken und Integration, ohne sich auf die Entwicklung grundlegender Modelle zu fokussieren. […]

News

Datensilos blockieren Abwehrkräfte von generativer KI

Damit KI eine Rolle in der Cyberabwehr spielen kann, ist sie auf leicht zugängliche Echtzeitdaten angewiesen. Das heißt, die zunehmende Leistungsfähigkeit von GenAI kann nur dann wirksam werden, wenn die KI Zugriff auf einwandfreie, validierte, standardisierte und vor allem hochverfügbare Daten in allen Anwendungen und Systemen sowie für alle Nutzer hat. Dies setzt allerdings voraus, dass Unternehmen in der Lage sind, ihre Datensilos aufzulösen. […]

Be the first to comment

Leave a Reply

Your email address will not be published.


*