24. Dezember 2024

Prozessautomatisierung – Generative künstliche Intelligenz

Bislang wurde der Begriff generative KI vor allem mit Deepfakes und Datenjournalismus in Verbindung gebracht. Doch die Technologie spielt eine immer wichtigere Rolle bei der Automatisierung von sich wiederholenden Prozessen in der digitalen Bild- und Audiokorrektur. [...]

Von Milad Safar.

Generative KI ist eine Technologie, die KI und Algorithmen des maschinellen Lernens einsetzt, um Maschinen in die Lage zu versetzen, aus vorhandenen Texten, Audiodateien, Bildern oder Originalmustern Inhalte zu erstellen. Bei der generativen KI verwenden Computer ihre Trainingsdaten, um das zugrundeliegende Muster zu erkennen, das mit der Eingabe verbunden ist, und Inhalte so zu produzieren, dass die Benutzer sie für echt halten.

Was bisher dem Menschen vorbehalten war, nämlich das Erzeugen von Artefakten, kann nun die generative KI leisten. Dabei liefert sie originelle Ergebnisse, die auf menschlichem Denken und menschlicher Erfahrung beruhen, und zwar ohne Voreingenommenheit. So kann generative KI beispielsweise Inhalte erstellen, die den Anschein erwecken, von Menschen geschrieben zu sein.

Generative KI erstellt automatisch neue Objekte oder Strukturen auf der Grundlage vorhandener Daten und Erkenntnisse, anstatt nur selbstlernende Algorithmen zu verwenden.

Wie funktioniert generative KI?

Bei der generativen KI handelt es sich im Grunde um Programme, die vorhandene Inhalte wie Texte, Audiodateien oder Bilder verwenden, um neue kohärente und überzeugende Inhalte zu erstellen. Die Computer sind in der Lage, das zugrundeliegende Muster in Bezug auf die Eingabe zu erlernen und es dann zu verwenden, um ähnliche Inhalte zu erzeugen. Drei Techniken bilden die Grundlage der generativen KI: Generative Adversarial Networks (GAN), Transformers und Variational Autoencoders.

GANs bestehen aus zwei neuronalen Netzen – einem Generator und einem Diskriminator. Der Generator ist, wie der Name schon sagt, für die Erzeugung neuer Daten oder Inhalte zuständig, die den Quelldaten ähneln. Der Diskriminator ist für die Unterscheidung zwischen den Quelldaten und den generierten Daten zuständig. In ständig wechselnden Trainingszyklen lernt der Generator fortlaufend, realistischere Daten zu erzeugen, während der Diskriminator trainiert wird, gefälschte Daten von echten Daten zu unterscheiden.

Transformatoren wie GPT-3, LaMDA und Wu-Dao ahmen die kognitive Aufmerksamkeit nach und messen die Bedeutung der Eingabedaten auf unterschiedliche Weise. Sie werden darauf trainiert, die Sprache oder das Bild zu verstehen, Klassifizierungsaufgaben zu erlernen und Text oder Bilder aus großen Datensätzen zu generieren.

Variational Autoencoder ist eine Deep-Learning-Technik, mit der komplexe generative Datenmodelle entworfen und an große Datensätze angepasst werden können. Diese Technik kann Bilder von fiktiven Gesichtern prominenter Personen und hochauflösende digitale Kunstwerke erstellen. Wie das GAN, so sorgt auch die VAE dafür, dass die Genauigkeit der Ausgabe verbessert wird.

Vom abstrakten Konzept zum täuschend echten Objekt

Laut Gartner geht es bei der generativen KI darum, aktuelle innovative Arbeitsabläufe gemeinsam mit Menschen zu verbessern. Generative KI kann zur Entwicklung von Objekten oder Gegenständen eingesetzt werden, die den Menschen bei der Erfüllung kreativer Aufgaben unterstützen. Sie können jedoch keine völlig neuen Bilder oder Texte erstellen, weil sie das, was sie wissen, auf bestmögliche Weise miteinander kombinieren.

Generative KI unterstützt ML-Modelle, befreit sie von Verzerrungen und realisiert abstraktere Konzepte durch Nachahmung der realen Welt. Mit generativer KI erstellte Avatare werden zum Schutz von Personen eingesetzt, die ihre Identität bei Vorstellungsgesprächen, Interviews oder bei der Arbeit nicht preisgeben wollen.

Die generative Modellierung kann sicherstellen, dass Modelle für maschinelles Lernen weniger voreingenommen sind, und es Bots ermöglichen, abstrakte Konzepte in Simulationen und in der realen Welt zu verstehen.

Aus Alt mach Neu

Generative KI erzeugt realistisch aussehende Fotos von menschlichen Gesichtern, Objekten und Szenen. Das Anwendungsszenario in der Film- und Werbeindustrie ist deshalb breit gefächert.

Bilder, die bei schlechten Licht- oder Wetterbedingungen aufgenommen wurden, können in die gewünschten Bedingungen umgewandelt werden. Sie ändert Farbbilder in Schwarz-Weiß-Bilder und Fotos bei Tag in Fotos bei Nacht. Mit Hilfe von Gesichtssynthese und Stimmenklonen kann die Originalstimme des Schauspielers mit einer Lippensynchronisation abgeglichen werden.

Generative KI kann alte, niedrig aufgelöste Bilder und Filme durch Hochskalierung auf 4K und höher verbessern, um genauere, klarere und detailliertere Bilder zu erhalten. Sie erzeugt 60 Bilder pro Sekunde anstelle von 23 oder weniger, beseitigt Rauschen und fügt Farbe hinzu.

Optimierte Gesichtsidentifizierung und Suchergebnisse

Generative KI wandelt Eingaben in Form von semantischen Bildern oder Skizzen in fotorealistische Bilder um. Bei der Erzeugung von Frontalansichten von Gesichtern generiert die generative KI Frontalfotos aus Fotos, die aus verschiedenen Winkeln aufgenommen wurden, zwecks Optimierung von Systemen zur Gesichtsüberprüfung oder -identifizierung.

Andere Anwendungsfälle sind die Umwandlung von realen Fotos in Emojis oder in kleine Cartoon-Gesichter oder die Alterung von Gesichtern auf der Grundlage eines Fotos eines jungen Gesichts. Generative KI ist auch in der Lage, Suchmaschinendienste beispielsweise durch Text-zu-Bild-Übersetzung auf die nächste Stufe zu heben. Sie erzeugt realistische Fotografien aus Textbeschreibungen von Objekten wie zum Beispiel Vögeln und Blumen.

Mehr als nur Anzeigentexte

Generative KI spielt auch bei der Texterstellung eine nicht zu unterschätzende Rolle. Mittlerweile gibt es schon Tools, deren Fähigkeiten über das Generieren von Anzeigenzeilen, Produktbeschreibungen und Betreffzeilen für Outreach-Kampagnen hinausgehen.

Dazu benötigt man nur noch eine Reihe von Schlüsselwörtern und die KI erstellt im Handumdrehen einen kompletten Text. Die Tools können auch analysieren, welche Texte am erfolgreichsten sind und dementsprechend neue, ähnlich konzipierte, aber bessere Texte verfassen.

Die britische Zeitung „The Guardian“ hat bereits versuchsweise generative KI benutzt, um einen Aufsatz von Grund auf zu schreiben, mit einem aus Sicht der Journalisten besorgniserregenden Ergebnis.

*Bernhard Lauer ist unter anderem freier Redakteur der dotnetpro und betreut hier beispielsweise die Rubrik Basic Instinct. Mit Visual Basic programmiert er privat seit der Version 1.0.

Cybersicherheit bei kritischen Infrastrukturen im Jahr 2025

23. Dezember 2024 Holger Fischer *

Strengere und weitreichende Compliance-Anforderungen werden die europäische Landschaft dominieren, da Unternehmen daran arbeiten, die NIS2-Richtlinie einzuhalten. Diese Richtlinie erweitert den Umfang kritischer Infrastruktursektoren und erhöht die Strafen, wodurch Cybersicherheit für mehr Unternehmen zu einer rechtlichen Notwendigkeit wird. […]

Samsung OLED-TV S95D im Test

23. Dezember 2024 Daniel Bader *

Extrem in allem: Samsungs brandneuer OLED-TV S95D ist ultradünn, ultraschmall gebaut und löst ultrascharf auf. Wir haben das neue OLED-Spitzenmodell mit mattem Bildschirm (!) und 65-Zoll-Bilddiagonale getestet. […]

Der Einfluss von 5G auf cloudbasiertes Fuhrparkmanagement

23. Dezember 2024 Simon Müller *

Die Einführung von 5G beeinflusst das cloudbasierte Fuhrparkmanagement erheblich. Echtzeitdatenübertragung zwischen Fahrzeugen und der Cloud ermöglicht eine präzise Betriebsoptimierung, die für Unternehmen unverzichtbar ist. […]

Große Sprachmodelle und Data Security: Sicherheitsfragen rund um LLMs

23. Dezember 2024

Bei der Entwicklung von Strategien zur Verbesserung der Datensicherheit in KI-Workloads ist es entscheidend, die Perspektive zu ändern und KI als eine Person zu betrachten, die anfällig für Social-Engineering-Angriffe ist. Diese Analogie kann Unternehmen helfen, die Schwachstellen und Bedrohungen, denen KI-Systeme ausgesetzt sind, besser zu verstehen und robustere Sicherheitsmaßnahmen zu entwickeln. […]

Mit dem MC02 möchte Punkt. Nutzern eine Alternative für eine bewusste und selbstbestimmte Smartphone-Nutzung bieten. (c) Punkt.

Punkt. MC02: Das Smartphone für maximale Datensouveränität

20. Dezember 2024 Christof Baumgartner

Das Punkt. MC02 verspricht eine neue Ära der Smartphone-Nutzung: volle Kontrolle über persönliche Daten, transparente Energieverwaltung und ein minimalistisches Design – ohne Kompromisse. […]

Franz Pichler ist Gründer und Geschäftsführer von spusu. (c) spusu

spusu gewinnt 2024 150.000 Neukunden

20. Dezember 2024 pi/cb

Der Mobilfunkanbieter spusu hat 2024 mit einem Zuwachs von 150.000 Neukunden und einem Umsatzplus von 19,4 Prozent ein Rekordjahr hingelegt. […]

Damir Leko, Country General Manager bei Nexi in Österreich (c) Nexi Austria GmbH

E-Commerce in Österreich: Vielfalt beim Bezahlen als Schlüssel zum Erfolg

20. Dezember 2024 pi/cb

Der österreichische Online-Handel verzeichnet einen bemerkenswerten Aufschwung: Die digitalen Ausgaben stiegen 2023 auf über 14 Milliarden Euro. Flexible Zahlungsmethoden und innovative Technologien wie „Tap to Pay“ prägen die Einkaufswelt. […]

v.l.n.r.: Daniela Drakulic, Helene Baumgartner, Nadia Tor, Nicol Weghofer, Marcel Aberle, Tatjana Lulevic-Heyny (c) 42 Vienna

42 Vienna: Top-Experten und Epertinnen beim CorporateMeetsStudents Event

20. Dezember 2024 pi/kdl

Über 150 Teilnehmer und Teilnehmernnen aus Wirtschaft, IT und Bildung kamen zum CorporateMeetsStudents Event am Campus 42 Vienna zusammen. Im Mittelpunkt der Diskussionen stand die zentrale Rolle von Software-Kompetenz nicht nur für das Wirtschaftswachstum, sondern auch für die gesamtgesellschaftliche Entwicklung Österreichs. […]

Digital wie im echten Leben: Ballast abzuwerfen, Räume reinigen und entrümpeln, um sich auf das kommende Jahr vorzubereiten. (c) Pixabay

Aufgeräumt ins neue Jahr: Wie Sie Ihre digitalen Altlasten loswerden