9 Mythen vom maschinellen Lernen

Wenn eine Technologie so gehypt wird, wie es seit einiger Zeit bei Machine Learning der Fall ist, sind Missverständnisse und Irrglaube vorprogrammiert. [...]

„JEDER KANN EIN ML-SYSTEM BAUEN“

Eine ganze Reihe von Open-Source-Werkzeugen und Frameworks steht zu Machine-Learning-Zwecken zur Verfügung – und zahllose Online-Kurse und -Tutorials zeigen en detail, wie man diese anwendet. Nichtsdestotrotz handelt es sich bei maschinellem Lernen um ein Spezialgebiet und Sie müssen wissen, wie Sie Ihre Daten vorbereiten und partitionieren, um in Training und Testing einsteigen zu können. Sie sollten außerdem wissen, welcher Algorithmus für Ihre Zwecke am besten geeignet ist und welche Anwendungsmethoden dafür geeignet sind. Last but not least sollten Sie auch noch wissen, wie Sie das alles in ein zuverlässiges Produktionssystem verwandeln können. Sind diese Fragen beantwortet, muss das System natürlich auch überwacht werden, damit sichergestellt ist, dass die Ergebnisse fortwährend relevant sind.

Kurzum: Wer Machine Learning richtig machen will, braucht vor allem Erfahrung. Wenn Sie gerade erst einsteigen, sollten Sie sich nach entsprechender Data-Science- und Machine-Learning-Expertise umsehen, um Ihr eigenes ML-System bauen zu können.

„ALLE DATENMUSTER SIND NÜTZLICH“

Asthma- und Herz-Patienten sowie alte Menschen haben eine wesentlich bessere Chance, eine Lungenentzündung zu überleben, als Sie es erwarten würden. Diese Chance ist sogar so hoch, dass ein Machine-Learning-System, das die Krankenhausaufnahme automatisiert, diese Menschen möglicherweise abweisen und nach Hause schicken würde (ein regelbasiertes System hat exakt das getan). Unglücklicherweise liegt der Grund für die großen Überlebenschancen aber darin, dass genannte Personengruppen bei einer Lungenentzündung besonders gefährdet sind und deswegen im Regelfall sofort behandelt werden.

Das System erkennt also ein valides Muster in den Daten – allerdings ist dieses Muster unbrauchbar, um zu bestimmen, wer im Krankenhaus aufgenommen wird (auf der anderen Seite wäre es für Krankenversicherer geeignet, um die zu erwartenden Folgekosten abzuschätzen). Gefährlichkönnte es in diesem speziellen Fall auch werden: Schließlich wissen Sie nur dann von der Existenz dieser unbrauchbaren Muster in Ihren Daten, wenn Sie sie bereits entdeckt haben.

In anderen Fällen können Machine-Learning-Systeme zwar stichhaltige Muster erkennen, die aber dennoch nicht verwertbar sind weil sie nicht erklärbar sind. Das wäre zum Beispiel bei einem Gesichtserkennungssystemder Fall, das auf der Grundlage von Selfie-Aufnahmen die sexuelle Orientierung des abgebildeten Menschen ausgibt. Schließlich gibt das Bild an sich eher über Mimik und Gestik Aufschluss, denn über die angeborene sexuelle Orientierung.

Black-Box-Modelle sind zwar effizient, geben aber keinerlei Auskunft darüber, welche Muster sie erkannt, beziehungsweise gelrnt haben. Transparente, intelligente Algorithmen wie GAMs geben klare Auskunft darüber, was das Machine-Learning-System gelernt hat. Auf dieser Grundlage können Sie besser entscheiden, ob sich eine Ausrollung lohnt.

Sie sehen gerade einen Platzhalterinhalt von YouTube. Um auf den eigentlichen Inhalt zuzugreifen, klicken Sie auf die Schaltfläche unten. Bitte beachten Sie, dass dabei Daten an Drittanbieter weitergegeben werden.

Mehr Informationen

„REINFORCEMENT LEARNING GEHT IMMER“

So gut wie alle Systeme für maschinelles Lernen die heute im Einsatz sind, setzen auf „supervised learning“. Im Regelfall werden diese Systeme mit klar strukturierten und gelabelten Datensets trainiert, bei deren Vorbereitung Menschen involviert waren. Diese Datensätze zu kuratieren braucht nicht nur Zeit, sondern auch Hingabe.

Das führt zu einem gesteigerten Interesse an Formen des „unsupervised learning“, insbesondere „reinforcement learning“ (RL) steht hoch im Kurs. Hierbei lernt ein System im Trial-and-Error-Verfahren von der Interaktion mit seiner Umwelt und durchBelohnungen für korrektes Verhalten. Beim DeepMind-AlphaGo-System etwa kamen neben „supervised learning“ auch RL-Techniken zum Einsatz. Das Machine-Learning-System schaffte es durch einen Sieg gegen den menschlichen Go!-Guru in die Schlagzeilen.

Außerhalb des wissenschaftlichen Kosmos ist RL allerdings alles andere als gängig: Google nutzt DeepMind, um seine Data Center effizienter kühlen und so Strom sparen zu können und Microsoft bringt spezielle RL-Techniken namens „contextual bandits“ zum Einsatz, um Schlagzeilen für die User von msn.com zu personalisieren.


Mehr Artikel

News

Fünf Aspekte, die Führungskräfte über Datenbanken wissen sollten

Die Datenbanklandschaft hat sich in den letzten zehn Jahren gravierend verändert. Wo früher meist eine einzige Plattform zum Einsatz kam, entsteht in vielen Unternehmen heute geradezu ein Wildwuchs an unterschiedlichen Technologien. Redgate, Anbieter von DevOps-Lösungen für End-to-End-Datenbankmanagement, nennt fünf Gründe, wie es dazu kam – und was Business Leader wissen müssen. […]

News

Österreich ist Hotspot für Kreislaufwirtschaft

Die erstmals erstellte „Circularity Labs Austria“-Map demonstriert mit mehr als 25 Test-Laboren in Österreich eine europaweit wohl einzigartige Konzentration im Bereich der Kreislaufwirtschaft. Die meisten finden sich rund um die Montanuniversität Leoben. Unternehmen aus dem In- und Ausland erproben hier, welche Rohstoffe aus Abfällen künftig im Kreislauf genutzt werden können. […]

Be the first to comment

Leave a Reply

Your email address will not be published.


*