25. März 2025

Ansätze und Vorgehensweisen beim maschinellen Lernen

Maschinelles Lernen (ML) gilt als Schlüsseltechnologie zur Neu- und Weiterentwicklung von Produkten, Prozessen und Dienstleistungen. Auch wenn die Aufgabenstellungen sehr unterschiedlich sind, ist die Vorgehensweise oft die gleiche. [...]

woman-5477735_1920 — Genauso wie Kleinkindern, fällt es auch einer Maschine nicht auf Anhieb leicht, eine Form in das richtige Loch zu stecken, wenn sie vorher zu dieser Aufgabe keine Informationen in Form von Daten erhalten hat (c) pixabay.com

Die Anwendungsbereiche von maschinellem Lernen sind sehr weit gestreut und haben teilweise bereits Einzug in unseren Alltag gefunden. Klassifikationsverfahren werden dazu verwendet automatisch Spam E-Mails zu filtern, Kundenabwanderung vorherzusagen, Kunden zu segmentieren und Betrugserkennungen vorzunehmen.
Des Weiteren werden Regressionsverfahren für Preisvorhersagen genutzt und kommen im Risikomanagement zum Einsatz. Auch die weit verbreiteten Kaufempfehlungen und individuellen Vorschläge, beispielsweise bei Musik- und Filmtiteln, verwenden Verfahren aus dem maschinellen Lernen. Obwohl diese Anwendungsbereiche sehr diversifiziert sind, gibt es wesentliche und gemeinsame Schritte beim Aufbau entsprechender Modelle.

Supervised und unsupervised Learning

Das maschinelle Lernen unterscheidet grundsätzlich zwei Lernansätze. Zum einen können Verfahren des überwachten Lernens, nachfolgend als supervised Learning bezeichnet, zur Anwendung kommen. Dabei werden die Daten vor der Verarbeitung markiert. Zum anderen gibt es unüberwachtes Lernen, nachfolgend als unsupervised Learning bezeichnet.

Ansätze des maschinellen Lernens (c) Mandy Goram

Supervised Learning

Beim supervised Learning geht es darum eine Funktion zu finden, mit der ungesehene bzw. unbekannte Beobachtungen eines Datensets einer Klasse oder einem Wert zugewiesen werden können. Hierfür werden die Daten mit einem sogenannten Label versehen. Die Anwendungsfälle für supervised Learning sind Regressionen, Klassifikationen, Empfehlungen und Imputationen.

Unsupervised Learning

Ziel des unsupervised Learning Ansatz ist es, aus den Daten unbekannte Muster zu erkennen und Regeln aus diesen abzuleiten. Hier kommen Verfahren wie das Gaussian Mixture Model und der k-Means Algorithmus zum Einsatz.

Für die Anwendung von unsupervised Learning Algorithmen werden in der Regel sehr viele Daten benötigt. Ohne ausreichende Datenmenge sind die Algorithmen nicht in der Lage Clusterungen vorzunehmen und damit eine entsprechende Prognose über einen unbekannten Datensatz bzw. ein ungesehenes Datenset zu erstellen.

Vor- und Nachteile beider Verfahren

Die Verfahren im supervised Learning sind aufgrund ihrer Strukturiertheit gut nachvollziehbar. Es besteht die Möglichkeit verschiedene Verfahren gegenüberzustellen, zu parametrisieren und dadurch eine für den Anwendungsfall optimale Lösung zu finden. Die Interpretation der Daten ist durch die gegebene Nachvollziehbarkeit einfacher als bei unsupervised Learning Methoden.

Der Nachteil besteht jedoch in einem oft sehr hohem manuellen Aufwand bei der Aufbereitung der Daten.

Die Vorteile des unsupervised Learning bestehen in der teilweise vollautomatisierten Erstellung von Modellen. Dabei können diese eine sehr gute Prognose über neue Daten hervorbringen oder gar neue Inhalte erstellen. Das Modell lernt mit jedem neuen Datensatz dazu und verfeinert gleichzeitig seine Berechnungen und Klassifizierungen. Ein manueller Eingriff ist dadurch nicht mehr notwendig. Neuronale Netze sowie das klassische Verständnis über künstliche Intelligenz basieren auf diesen selbstlernenden Verfahren.

Durch das Trainieren der Modelle werden diese immer mehr an die Eingangsdaten angepasst. Dies führt ab einem bestimmten Zeitpunkt zu einem sogenannten Overfitting, bei dem das Modell zwar gute Prognosen in Bezug auf eine bekannte Datenkategorie besitzt. Neuartige, unbekannte Daten werden jedoch nicht mehr richtig zugeordnet. Zudem kann es auch zu einem sogenannten Underfitting kommen, bei dem zu wenige Daten zum Modellaufbau bereitgestellt wurden und somit die Klassifizierung zu ungenau ist. Auch das führt zu schlechten Prognoseergebnissen.

Ab wann ein Modell ausreichend trainiert ist, also weder Overfitted noch Underfitted ist, kann nur durch Ausprobieren und Testen herausgefunden werden. Dabei handelt es sich um einen sehr aufwendigen Prozess.

Sie sehen gerade einen Platzhalterinhalt von YouTube. Um auf den eigentlichen Inhalt zuzugreifen, klicken Sie auf die Schaltfläche unten. Bitte beachten Sie, dass dabei Daten an Drittanbieter weitergegeben werden.

Mehr Informationen

Inhalt entsperren Erforderlichen Service akzeptieren und Inhalte entsperren

Vorgehen beim Aufbau von maschinellen Lernmodellen

Das Sammeln und die Aufbereitung der Daten sind die ersten Schritte zum Aufbau eines Modells. In der Regel sind die verwendeten Daten unvollständig und in keinem einheitlichen Format. Um die Daten verarbeiten zu können, sind diese meist in tabellarische Form zu bringen. Fehlende Werte können beispielsweise mit Hilfe von Imputation ergänzt werden.

Die aufbereiteten Daten werden anschließend analysiert, um herauszufinden wie die Daten aufgebaut sind und welche Abhängigkeiten es gibt. Sind die für die Prognosen wichtigen Variablen identifiziert, können verschiedene statistische Modelle verwendet werden. Nicht jedes Modell eignet sich gleichermaßen gut. Wie geeignet das jeweilige Modell ist, muss über eine Evaluation herausgefunden werden. Dieser Prozess ist in der Regel sehr aufwendig. Um ein gutes Prognosemodell zu finden, sollten verschiedene Verfahren getestet und gegenübergestellt werden. Ist ein passendes Modell gefunden, kann dieses meist noch optimiert werden. Anschließend kann das Modell zur Erstellung von Prognose auf neue Daten angewandt werden.

Vorgehen zur Erstellung von Modellen mittels maschinellem Lernens (c) Mandy Goram

Der Prozess ist als Kreislauf zu verstehen, da es, wie bei klassischen Data Warehouse und Business Intelligence Anforderungen, während der Entwicklung neue Erkenntnisse geben kann, die Änderungen in den Ausgangsdaten oder dem Modell nach sich ziehen.

Die Chancen zur Verbesserung bestehender Prozesse und Produkte sowie die Entwicklung neuer und hochwertigerer Service- und Dienstleistungen sind dank maschinellem Lernen enorm. Eine Auseinandersetzung mit der Thematik kann sich für viele Unternehmen lohnen, trotz der moderaten Anfangsinvestitionen. Wichtig sind eine klare Zielsetzung und Abgrenzung der Anwendungsfälle, da bereits kleine Änderungen in der Ausgangssituation große Auswirkungen auf die Zuverlässigkeit des Modells haben können. Eine gewisse Frustrationstoleranz ist ebenfalls wichtig, da die Modelle bis zur Fertigstellung meist mehrere Iterationen durchlaufen.

*Mandy Goram leitet den Bereich Business Intelligence eines mittelständischen pharmazeutischen Unternehmens. Ihr Schwerpunkt liegt in der strategischen und operativen Weiterentwicklung der unternehmensweiten DWH-, BI- und Analytics-Systeme.

Jens Hungershausen, DSAG-Vorstandsvorsitzender (c) Deutschsprachige SAP-Anwendergruppe e. V. (DSAG)

DSAG-Investitionsreport 2025

24. März 2025 pi/kdl

Auch in diesem Jahr hat die Deutschsprachige SAP-Anwendergruppe e. V. (DSAG) wieder nach den Investitionsplanungen der Unternehmen in Deutschland, Österreich und der Schweiz gefragt. Zentrale Ergebnisse: Die generelle Investitionsbereitschaft in IT-Lösungen und auch in SAP-Lösungen steigt weiter. […]

Emanuela Puglisi, Senior Channel Business Sales Manager DACH bei Barracuda Networks (c) Emanuela Puglisi

E-Mail-Sicherheitsmaßnahme: Die Fähigkeit, auf erfolgreiche Cyberangriffe zu reagieren

24. März 2025 Emanuela Puglisi*

E-Mail-Sicherheit umfasst inzwischen mehr als die Abwehr von Cyberbedrohungen. Vielmehr geht es auch darum, schnell und effektiv reagieren zu können, wenn es eine Bedrohung in den E-Mail-Posteingang schafft, denn selbst die fortschrittlichsten Sicherheitsmaßnahmen sind nicht zu 100 Prozent sicher. […]

So bringt man Deepfake-Anrufer aus dem Konzept

24. März 2025 Thomas Wrobel *

Deepfake-Betrug ist auf dem Vormarsch. Die technischen Möglichkeiten werden immer besser und die Maschen umso perfider. Thomas Wrobel von Clever Dialer, einer App für Spamschutz und Anruferkennung, erklärt, woran man eine KI-Stimme erkennt und gibt praktische Tipps, um Deepfake-Anrufer zu entlarven. […]

Ein Schritt zu mehr digitaler Souveränität für Europa

24. März 2025

CISPE (Cloud Infrastructure Services Providers in Europe) und Gaia-X integrieren das CISPE Gaia-X Digital Clearing House in das Gaia-X-Ökosystem. Das ermöglicht es Cloud-Kunden, Dienste auszuwählen und zu erwerben, die nachweislich den im Gaia-X Compliance-Dokument (Release 24.11) beschriebenen Richtlinien entsprechen. […]

Kombination aus passivem und aktivem Netzwerk-Monitoring ermöglicht die beste Überwachung

24. März 2025 Jörg Hollerith *

Das aktive Netzwerk-Monitoring prüft Netzwerke mit gezielten Testabfragen, etwa zu Verfügbarkeit, Latenz oder der Systemleistung. Beim passiven Monitoring wird der tatsächliche Datenverkehr in Echtzeit ausgewertet, um Anomalien, Sicherheitslücken und Probleme proaktiv und frühzeitig zu erkennen. […]

Warum Europas Payment-Landschaft vor einer Wende steht

24. März 2025

Der Wandel im Zahlungsverkehr ist in vollem Gange. Die zeb Payment Study 2025 zeigt: Digitale Zahlungen nehmen zu, Bargeld wird seltener genutzt. Beim P19 Payment Circle wurde diskutiert, wie Banken, Unternehmen und Verbraucher:innen diesen Wandel aktiv und sicher mitgestalten können. […]

Vier Best Practices für die erfolgreiche Verwaltung von E-Mail-Zertifikaten

24. März 2025 Jiannis Papadakis *

Seit mehreren Jahrzehnten schon werden E-Mails überall auf der Welt erfolgreich mit dem Standard Secure/Multipurpose Internet Mail Extensions (S/MIME) signiert und verschlüsselt. Der Standard hilft dabei, sicherzustellen, dass nur berechtigte Empfänger einer E-Mail die Nachrichten und angehängte Daten erhalten und einsehen können. […]

Durch den gezielten Einsatz von KI sind Händler in der Lage, Produktempfehlungen weiter zu verfeinern. (c) Pexels

Social Commerce: Steigende Nachfrage nach Personalisierung im Handel

24. März 2025

SOTI-Studie: 55 Prozent der befragten Verbraucher in Deutschland hätten Interesse an Kundenmitgliedschaften, die auf individuelle Bedürfnisse zugeschnittene Angebote bieten. […]

Seit Anfang des Jahres orchestriert Janina Stromberger das Neukundengeschäft bei SAP in Österreich. (c) SAP Österreich GmbH/Dominik Hofer

Janina Stromberger leitet Neukundengeschäft bei SAP Österreich

21. März 2025 pi/cb

Seit Jahresbeginn ist Janina Stromberger Head of Net New Names bei SAP Österreich. Sie ist damit ausschließlich für die Erweiterung des Kundenstamms über sämtliche Branchen hinweg zuständig. […]

Ansätze und Vorgehensweisen beim maschinellen Lernen

Maschinelles Lernen (ML) gilt als Schlüsseltechnologie zur Neu- und Weiterentwicklung von Produkten, Prozessen und Dienstleistungen. Auch wenn die Aufgabenstellungen sehr unterschiedlich sind, ist die Vorgehensweise oft die gleiche. [...]

Supervised und unsupervised Learning

Supervised Learning

Unsupervised Learning

Vor- und Nachteile beider Verfahren

Vorgehen beim Aufbau von maschinellen Lernmodellen

Mehr Artikel

DSAG-Investitionsreport 2025

E-Mail-Sicherheitsmaßnahme: Die Fähigkeit, auf erfolgreiche Cyberangriffe zu reagieren

So bringt man Deepfake-Anrufer aus dem Konzept

Ein Schritt zu mehr digitaler Souveränität für Europa

Kombination aus passivem und aktivem Netzwerk-Monitoring ermöglicht die beste Überwachung

Warum Europas Payment-Landschaft vor einer Wende steht

Vier Best Practices für die erfolgreiche Verwaltung von E-Mail-Zertifikaten

Social Commerce: Steigende Nachfrage nach Personalisierung im Handel

Janina Stromberger leitet Neukundengeschäft bei SAP Österreich

Be the first to comment

Leave a Reply Antworten abbrechen