Prozessautomatisierung – Generative künstliche Intelligenz

Bislang wurde der Begriff generative KI vor allem mit Deepfakes und Datenjournalismus in Verbindung gebracht. Doch die Technologie spielt eine immer wichtigere Rolle bei der Automatisierung von sich wiederholenden Prozessen in der digitalen Bild- und Audiokorrektur. [...]

Foto: dotnetpro

Von Milad Safar.

Generative KI ist eine Technologie, die KI und Algorithmen des maschinellen Lernens einsetzt, um Maschinen in die Lage zu versetzen, aus vorhandenen Texten, Audiodateien, Bildern oder Originalmustern Inhalte zu erstellen. Bei der generativen KI verwenden Computer ihre Trainingsdaten, um das zugrundeliegende Muster zu erkennen, das mit der Eingabe verbunden ist, und Inhalte so zu produzieren, dass die Benutzer sie für echt halten.

Was bisher dem Menschen vorbehalten war, nämlich das Erzeugen von Artefakten, kann nun die generative KI leisten. Dabei liefert sie originelle Ergebnisse, die auf menschlichem Denken und menschlicher Erfahrung beruhen, und zwar ohne Voreingenommenheit. So kann generative KI beispielsweise Inhalte erstellen, die den Anschein erwecken, von Menschen geschrieben zu sein.

Generative KI erstellt automatisch neue Objekte oder Strukturen auf der Grundlage vorhandener Daten und Erkenntnisse, anstatt nur selbstlernende Algorithmen zu verwenden.

Wie funktioniert generative KI?

Bei der generativen KI handelt es sich im Grunde um Programme, die vorhandene Inhalte wie Texte, Audiodateien oder Bilder verwenden, um neue kohärente und überzeugende Inhalte zu erstellen. Die Computer sind in der Lage, das zugrundeliegende Muster in Bezug auf die Eingabe zu erlernen und es dann zu verwenden, um ähnliche Inhalte zu erzeugen. Drei Techniken bilden die Grundlage der generativen KI: Generative Adversarial Networks (GAN), Transformers und Variational Autoencoders.

GANs bestehen aus zwei neuronalen Netzen – einem Generator und einem Diskriminator. Der Generator ist, wie der Name schon sagt, für die Erzeugung neuer Daten oder Inhalte zuständig, die den Quelldaten ähneln. Der Diskriminator ist für die Unterscheidung zwischen den Quelldaten und den generierten Daten zuständig. In ständig wechselnden Trainingszyklen lernt der Generator fortlaufend, realistischere Daten zu erzeugen, während der Diskriminator trainiert wird, gefälschte Daten von echten Daten zu unterscheiden.

Transformatoren wie GPT-3, LaMDA und Wu-Dao ahmen die kognitive Aufmerksamkeit nach und messen die Bedeutung der Eingabedaten auf unterschiedliche Weise. Sie werden darauf trainiert, die Sprache oder das Bild zu verstehen, Klassifizierungsaufgaben zu erlernen und Text oder Bilder aus großen Datensätzen zu generieren.

Variational Autoencoder ist eine Deep-Learning-Technik, mit der komplexe generative Datenmodelle entworfen und an große Datensätze angepasst werden können. Diese Technik kann Bilder von fiktiven Gesichtern prominenter Personen und hochauflösende digitale Kunstwerke erstellen. Wie das GAN, so sorgt auch die VAE dafür, dass die Genauigkeit der Ausgabe verbessert wird.

Vom abstrakten Konzept zum täuschend echten Objekt

Laut Gartner geht es bei der generativen KI darum, aktuelle innovative Arbeitsabläufe gemeinsam mit Menschen zu verbessern. Generative KI kann zur Entwicklung von Objekten oder Gegenständen eingesetzt werden, die den Menschen bei der Erfüllung kreativer Aufgaben unterstützen. Sie können jedoch keine völlig neuen Bilder oder Texte erstellen, weil sie das, was sie wissen, auf bestmögliche Weise miteinander kombinieren.

Generative KI unterstützt ML-Modelle, befreit sie von Verzerrungen und realisiert abstraktere Konzepte durch Nachahmung der realen Welt. Mit generativer KI erstellte Avatare werden zum Schutz von Personen eingesetzt, die ihre Identität bei Vorstellungsgesprächen, Interviews oder bei der Arbeit nicht preisgeben wollen.

Die generative Modellierung kann sicherstellen, dass Modelle für maschinelles Lernen weniger voreingenommen sind, und es Bots ermöglichen, abstrakte Konzepte in Simulationen und in der realen Welt zu verstehen.

Aus Alt mach Neu

Generative KI erzeugt realistisch aussehende Fotos von menschlichen Gesichtern, Objekten und Szenen. Das Anwendungsszenario in der Film- und Werbeindustrie ist deshalb breit gefächert.

Bilder, die bei schlechten Licht- oder Wetterbedingungen aufgenommen wurden, können in die gewünschten Bedingungen umgewandelt werden. Sie ändert Farbbilder in Schwarz-Weiß-Bilder und Fotos bei Tag in Fotos bei Nacht. Mit Hilfe von Gesichtssynthese und Stimmenklonen kann die Originalstimme des Schauspielers mit einer Lippensynchronisation abgeglichen werden.

Generative KI kann alte, niedrig aufgelöste Bilder und Filme durch Hochskalierung auf 4K und höher verbessern, um genauere, klarere und detailliertere Bilder zu erhalten. Sie erzeugt 60 Bilder pro Sekunde anstelle von 23 oder weniger, beseitigt Rauschen und fügt Farbe hinzu.

Optimierte Gesichtsidentifizierung und Suchergebnisse

Generative KI wandelt Eingaben in Form von semantischen Bildern oder Skizzen in fotorealistische Bilder um. Bei der Erzeugung von Frontalansichten von Gesichtern generiert die generative KI Frontalfotos aus Fotos, die aus verschiedenen Winkeln aufgenommen wurden, zwecks Optimierung von Systemen zur Gesichtsüberprüfung oder -identifizierung.

Andere Anwendungsfälle sind die Umwandlung von realen Fotos in Emojis oder in kleine Cartoon-Gesichter oder die Alterung von Gesichtern auf der Grundlage eines Fotos eines jungen Gesichts. Generative KI ist auch in der Lage, Suchmaschinendienste beispielsweise durch Text-zu-Bild-Übersetzung auf die nächste Stufe zu heben. Sie erzeugt realistische Fotografien aus Textbeschreibungen von Objekten wie zum Beispiel Vögeln und Blumen.

Mehr als nur Anzeigentexte

Generative KI spielt auch bei der Texterstellung eine nicht zu unterschätzende Rolle. Mittlerweile gibt es schon Tools, deren Fähigkeiten über das Generieren von Anzeigenzeilen, Produktbeschreibungen und Betreffzeilen für Outreach-Kampagnen hinausgehen.

Dazu benötigt man nur noch eine Reihe von Schlüsselwörtern und die KI erstellt im Handumdrehen einen kompletten Text. Die Tools können auch analysieren, welche Texte am erfolgreichsten sind und dementsprechend neue, ähnlich konzipierte, aber bessere Texte verfassen.

Die britische Zeitung „The Guardian“ hat bereits versuchsweise generative KI benutzt, um einen Aufsatz von Grund auf zu schreiben, mit einem aus Sicht der Journalisten besorgniserregenden Ergebnis.

*Bernhard Lauer ist unter anderem freier Redakteur der dotnetpro und betreut hier beispielsweise die Rubrik Basic Instinct. Mit Visual Basic programmiert er privat seit der Version 1.0.


Mehr Artikel

News

Lauf-Apps als Sicherheitsrisiko

Lauf-Apps sammeln Informationen über das eigene Training und tracken somit alle Fortschritte, die man beim Laufen gemacht hat. Allerdings benötigen sie um richtig zu funktionieren präzise Daten, darunter auch den Standort von Nutzern.
Diese Daten stehen oft öffentlich zur Verfügung. […]

News

Heimischer Seilbahn-Spezialist Doppelmayr wechselt zu IFS Cloud

Der Schritt hin zu einer zentralen Cloud bedeutet, dass die weltweiten Vertriebsstandorte von Doppelmayr ebenso wie die Produktionsstätten mit demselben System arbeiten können. Die Implementierung, die sofort beginnen soll, wird die meisten Funktionsbereiche des Doppelmayr-Geschäfts abdecken und mehr als 3.000 Mitarbeiter an mehreren Standorten betreffen. […]

News

Game Development Studie 2024: Knowhow aus Österreich ist weltweit gefragt

Nie zuvor hat eine so große Zahl heimischer Entwickler zum Erfolg internationaler Top-Games aber auch zur digitalen Transformation der österreichischen Wirtschaft beigetragen. Die heimischen Game Developer generieren einen gesamtwirtschaftlichen Umsatz von 188,7 Millionen Euro. Jeder Arbeitsplatz in einem Unternehmen der Spieleentwicklung sichert mehr als einen weiteren Arbeitsplatz in Österreich ab. […]

Be the first to comment

Leave a Reply

Your email address will not be published.


*