27. Dezember 2024

Machine Learning: Fehler in der Anwendung mit fataler Auswirkung

Neben den Machenschaften der Hacker ist im jungen Stadium des Machine Learning sicherlich der Entwickler und Anwender die größte Gefahr. Machine Learning ist neu und komplex und das Potenzial für selbst verschuldetes Versagen der Technologie ist hoch. [...]

Wenn die Trainingsdaten eine falsche oder nicht existente Korrelation enthalten, kann Machine Learning leicht die falschen Lektionen lernen. (c) Fotolia/phonlamaiphoto

Machine Learning ist eine Technologie, die alles verändern könnte. Sie hat sich bereits als bahnbrechende Technologie für so unterschiedliche Aufgaben wie das Aufspüren von Bankbetrug, das Fahren von Autos, das Verstehen menschlicher Sprache und das Erkennen von Malware bewährt.

In naher Zukunft werden Unternehmen viele Millionen investieren und Menschen werden Machine-Learning-Lösungen entwickeln und einsetzen. Doch neue Technologien führen oft zu neuen Fehlerquellen und Möglichkeiten für Cyberangriffe. Neben den Machenschaften der Hacker ist im jungen Stadium des Machine Learning sicherlich der Entwickler und Anwender die größte Gefahr. Machine Learning ist neu und komplex und das Potenzial für selbst verschuldetes Versagen der Technologie ist hoch.

Definition Machine Learning und Abgrenzung zu herkömmlicher Software

Traditionelle Software ist im Wesentlichen ein Regelwerk das festlegt, wonach sich ein Computer in einem bestimmten Kontext verhalten soll. Sie ist hervorragend im Umgang mit strukturierten Daten und insbesondere mit Dingen, in denen wir schlecht sind, namlich darin, hochkomplexe Befehlssätze perfekt und mit enormer Geschwindigkeit auszuführen.

Machine Learning hingegen ist ein Zweig der Künstlichen Intelligenz (KI). Hier werden Softwaremodelle verwendet, die anhand von Beispielen trainiert werden und ihre eigenen Regeln erstellen. Der Computerpionier Arthur Lee Samuel hält das maschinelle Lernen für einen „Forschungsbereich, der Computern die Möglichkeit gibt zu lernen, ohne explizit programmiert zu werden“. Während sich herkömmliche Software durch Transparenz und nachweislich korrektes Verhalten auszeichnet, ist Machine Learning unscharf, flexibel und undurchsichtig. Eine ausführlichere Abhandlung zum Thema Machine Learning ist auf Naked Security verfügbar.

Gutes Füttern ist Grundvoraussetzung

Modernes Machine Learning funktionieren gut, weil es komplexe Zusammenhänge aus Trainingsdaten lernen kann. Auf diese Weise erkennt es Dinge, seien es Gesichter, Betrugsmuster oder Spam, mit denen menschliche Programmierer nicht mithalten können. Aber diese Fähigkeit kann auf unerwartete Weise zum Bumerang werden. Wenn die Trainingsdaten eine falsche oder nicht existente Korrelation enthalten, kann Machine Learning leicht die falschen Lektionen lernen. Eine fatale Situation denn vielfach wird Machine Learning mit Big Data gefüttert, Daten, die voll von falschen Korrelationen sind.

Was ist TrensorFlow? Googles Open-Source-Bibliothek für maschinelles Lernen im Fokus.

Ein Beispiel: Man stelle sich ein Machine-Learning-Modell vor, um Spam-E-Mails zu erkennen. Die Trainingsdaten sind eine Datenbank mit E-Mails, die von Menschen gewissenhaft als „Ham“ (E-Mails die wir mögen) oder „Spam“(E-Mails die wir nicht haben wollen) gekennzeichnet sind. Nun passiert es, dass die Trainingsdaten eine plausible aber falsche Korrelation enthalten: Zufällig landet jede E-Mail mit einem Bildanhang, die von einer IP-Adresse mit der Endung 12 stammt, im Spam-Stapel. Und damit ist es geschehen: obwohl alles mit größter Sorgfalt gepflegt wurde, erhält das Machine-Learning-Modell Datenmüll – mit Folgen. Das komplexe Modell kann daraus schließen, dass das Vorhandensein der IP-Adresse eines Absenders, die mit 12 endet, in einer E-Mail mit einem Bildanhang ein sicherer Indikator für Spam ist, obwohl dies außerhalb unserer Trainingsdaten nicht der Fall ist. Wenn dieses Modell in der Security eingesetzt würde, blockiert die Anti-Spam-Engine eine Menge korrekter E-Mails von Personen, deren IP-Adresse mit einer 12 endet.

Tipps für das richtige Füttern von Machine Learning

Es gibt keine einfache Lösung für das Machine Learning. Aber es gibt einige Punkte auf die man achten sollte, um möglichst viele Probleme im Vorfeld auszuschließen:

Verwendung von guten Daten. Es ist wichtig, das Modell mit vielen gut beschrifteten Daten (Labels) aus Quellen zu füttern, die ein reales Bild repräsentieren.
Daten müssen bereinigt werden. Es ist mühevoll Daten zu reinigen, zu beschriften oder zu ändern, um Fehler zu minimieren. Aber der Aufwand lohnt.
Das Modell sollte nicht zu stark trainiert werden, um es nicht zu überfrachten. Denn es geht nicht darum, die Trainingsdaten mit perfekter Klarheit zu erkennen, sondern darum, Dinge zu erkennen, die Ähnlichkeiten mit den Trainingsdaten aufweisen.
False Positives und False Negatives sollten beim Test genau beachtet werden und das Modell sollte auch bei der Bereinigung der Daten unterstützen. Achtung: manchmal sind nur die Label falsch und das Modell ist richtig.
Deep Learning sollte bevorzugte Methode des maschinellen Lernens sein. Untersuchungen haben ergeben, dass es besser ist, mit vielen unterschiedlichen Labels umzugehen, als mit flacheren Lernmethoden.

Dr. Roman Stiftner, Präsident der BVL (c) Gary Milano

BVL beendet Kooperation mit ELA und stärkt ihr Engagement für die EU und die globale Logistik

24. Dezember 2024 pi/wf

Die Bundesvereinigung Logistik Österreich (BVL) hat beschlossen, ihre Mitgliedschaft in der European Logistics Association (ELA) zum 31. Dezember 2024 zu beenden. Diese Entscheidung spiegelt eine strategische Neuausrichtung wider, die darauf abzielt, Effizienz, Transparenz und eine wirkungsvolle Vertretung logistischer Interessen in Europa zu fördern. […]

„Agentic Automation“ ermöglicht es KI-Agenten, Wissensarbeiter zuverlässig zu unterstützen und Prozesse effizienter zu gestalten. (c) Pexels

2025: Der Durchbruch der KI-Agenten im Unternehmensalltag

23. Dezember 2024 pi/cb

2025 markieren KI-Agenten den nächsten Meilenstein in der Automatisierung: Mit Agentic AI werden Wissensarbeitende unterstützt und Arbeitsstrukturen neu definiert. Welche Chancen und Herausforderungen erwarten Unternehmen? […]

Cybersicherheit bei kritischen Infrastrukturen im Jahr 2025

23. Dezember 2024 Holger Fischer *

Strengere und weitreichende Compliance-Anforderungen werden die europäische Landschaft dominieren, da Unternehmen daran arbeiten, die NIS2-Richtlinie einzuhalten. Diese Richtlinie erweitert den Umfang kritischer Infrastruktursektoren und erhöht die Strafen, wodurch Cybersicherheit für mehr Unternehmen zu einer rechtlichen Notwendigkeit wird. […]

Samsung OLED-TV S95D im Test

23. Dezember 2024 Daniel Bader *

Extrem in allem: Samsungs brandneuer OLED-TV S95D ist ultradünn, ultraschmall gebaut und löst ultrascharf auf. Wir haben das neue OLED-Spitzenmodell mit mattem Bildschirm (!) und 65-Zoll-Bilddiagonale getestet. […]

Der Einfluss von 5G auf cloudbasiertes Fuhrparkmanagement

23. Dezember 2024 Simon Müller *

Die Einführung von 5G beeinflusst das cloudbasierte Fuhrparkmanagement erheblich. Echtzeitdatenübertragung zwischen Fahrzeugen und der Cloud ermöglicht eine präzise Betriebsoptimierung, die für Unternehmen unverzichtbar ist. […]

Große Sprachmodelle und Data Security: Sicherheitsfragen rund um LLMs

23. Dezember 2024

Bei der Entwicklung von Strategien zur Verbesserung der Datensicherheit in KI-Workloads ist es entscheidend, die Perspektive zu ändern und KI als eine Person zu betrachten, die anfällig für Social-Engineering-Angriffe ist. Diese Analogie kann Unternehmen helfen, die Schwachstellen und Bedrohungen, denen KI-Systeme ausgesetzt sind, besser zu verstehen und robustere Sicherheitsmaßnahmen zu entwickeln. […]

Machine Learning: Fehler in der Anwendung mit fataler Auswirkung

Neben den Machenschaften der Hacker ist im jungen Stadium des Machine Learning sicherlich der Entwickler und Anwender die größte Gefahr. Machine Learning ist neu und komplex und das Potenzial für selbst verschuldetes Versagen der Technologie ist hoch. [...]

Definition Machine Learning und Abgrenzung zu herkömmlicher Software

Gutes Füttern ist Grundvoraussetzung

Tipps für das richtige Füttern von Machine Learning

Mehr Artikel

BVL beendet Kooperation mit ELA und stärkt ihr Engagement für die EU und die globale Logistik

2025: Der Durchbruch der KI-Agenten im Unternehmensalltag

Cybersicherheit bei kritischen Infrastrukturen im Jahr 2025

Samsung OLED-TV S95D im Test

Der Einfluss von 5G auf cloudbasiertes Fuhrparkmanagement

Große Sprachmodelle und Data Security: Sicherheitsfragen rund um LLMs

Große Sprachmodelle und die Frage der Data Security

Punkt. MC02: Das Smartphone für maximale Datensouveränität

spusu gewinnt 2024 150.000 Neukunden

Be the first to comment

Leave a Reply Antworten abbrechen