10. Januar 2025

Microsoft-KI malt Bilder nach Beschreibung

Microsoft-Forscher haben ein KI-System entwickelt, das anhand beschreibender Texte Bilder malt. Dabei zeige die Künstliche Intelligenz (KI) auch eine "künstliche Vorstellungskraft", heißt es im Microsoft-Research-Blog. [...]

Aus Text wird mittels KI von Microsoft ein Bild. (c) Microsoft Research

Während der Ansatz bei realistischen Beschreibungen beispielsweise von Vögeln offenbar auch gut funktioniert, liefern absurde Texte wie von schwimmenden Doppeldecker-Bussen teils eher bizarre Bilder.

Vom Wort zum Bild
Das Microsoft-Team hat in der Vergangenheit mit dem CaptionBot ein System entwickelt, das automatisch Schlagworte zu Fotos generiert, sowie ein Tool, das Fragen zu Bildern beantwortet. „Nun wollen wir den Text dafür nutzen, um ein Bild zu generieren“, sagt Projektmitarbeiterin Qiuyuan Huang. Dazu setzt das Team auf ein sogenanntes Generative Adversarial Network. Dabei erstellt ein maschinenlernendes System ein Bild anhand eines Textes, ehe ein zweites die Glaubwürdigkeit der Darstellung beurteilt. Das erste System verfeinert sein Bild dann so lange, bis das zweite mit dem Ergebnis zufrieden ist.

Damit das funktioniert, haben die Forscher das System zunächst mit Datensets trainiert, die Paare aus Wörtern und entsprechenden Bildern umfassen. Tatsächlich hat die KI so gelernt, anhand der Beschreibung „Ein Vogel mit gelbem Körper, schwarzen Flügeln und kurzem Schnabel“ ein durchaus realistisches Bild zu erstellen. Wenn ein Text nicht vorgibt, wo sich der Vogel befindet, fügt das System meist einen Ast hinzu. Es hat offenbar gelernt, dass Vögel meist auf Ästen sitzen. Dieses Ergänzen von Bildern um Details ist auch ein Grund, weshalb Microsoft dem System eine künstliche Vorstellungskraft zuschreibt.

Absurd ergibt bizarr
Während das System bei realistischen Beschreibungen auch realistische Bilder liefert, stößt es bei absurden Texten an seine Grenzen. Das Team hat das beispielsweise mit dem Satz „Ein roter Doppeldecker-Bus, der auf einem See schwimmt“ getestet. Dazu lieferte die KI ein eher bizarres Konstrukt, das wie eine Kreuzung aus Boot und Bus wirkt. Die Forscher vermuten, dass das System intern damit zu kämpfen hatte, weil es weiß, dass Boote auf Seen schwimmen, der Text aber explizit einen Bus forderte.

Auch die auf den ersten Blick realistischen Bilder von Vögeln sind noch nicht perfekt, so die Forscher. Bei näherer Betrachtung seien fast immer Fehler zu finden, die darauf hindeuten, dass ein Computer das Bild erstellt hat. Das umfasst beispielsweise Vögel, die eine falsche Schnabelfarbe haben und Bananenstauden mit seltsam mutierten Früchten. Dennoch könnte die Technologie langfristig interessant sein, um beispielsweise automatisiert Entwurfszeichnungen zu verfeinern oder das Erstellen von Animationsfilmen zu erleichtern.

Transparenz in Gehaltsfragen wird für Unternehmen immer wichtiger, um im Wettbewerb um Talente bestehen zu können. (c) Pexels

IT-Branche & CO – so viel verdient man in Deutschland

10. Januar 2025 Wolfgang Franz

Der Stepstone Gehaltsreport 2025 bietet einen detaillierten Einblick in die aktuelle Gehaltslandschaft in Deutschland. Die IT-Branche nimmt in der Studie eine bedeutende Stellung ein. […]

Die wichtigsten Technologietrends für den Sicherheitssektor im Jahr 2025

10. Januar 2025

Axis Communications hat sechs Technologietrends identifiziert, die den Sicherheitssektor im Jahr 2025 prägen werden. Die Trends bringen sowohl Herausforderungen als auch Chancen mit sich, um beispielsweise mehr Flexibilität, Effizienz und verbesserte Wertschöpfung für Hersteller, Systemintegratoren und Endkunden zu erreichen. […]

GitHub Copilot Free: kostenloser KI-Coding-Assistent

10. Januar 2025 Patrick Hediger *

GitHub bietet jetzt mit Copilot Free eine kostenlose Version seines KI-basierten Coding-Assistenten an, die es Entwicklern ermöglicht, von intelligenten Code-Vorschlägen zu profitieren. […]

Künstliche Intelligenz kommt auf Endgeräten an

10. Januar 2025

Das Jahr 2025 wird an vielen Stellen für Umbrüche und Neuerungen sorgen. Ein genereller Trend ist dabei der weiter greifende Einsatz von KI-Funktionen: Unternehmen werden immer mehr Anwendungsfälle erkennen sowie implementieren – und dabei auch verstärkt auf lokale KI-Ressourcen und On-Prem-Hardware zurückgreifen. […]

Flexible Vernetzung dezentraler Unternehmensstrukturen

10. Januar 2025

Drei ergänzt sein Angebot für Geschäftskunden mit einer Vernetzungslösung für Firmenstandorte. Mit Drei SD-WAN lassen sich Standorte jeder Größe sowie Home-Office-Arbeitsplätze und Cloud-Anwendungen ans Firmennetz anbinden. […]

7 KI-Trends, die das Jahr 2025 prägen werden

10. Januar 2025

2025 wird wegweisend für die Weiterentwicklung der Künstlichen Intelligenz. Experten weltweit arbeiten daran, KI praxisnäher, präziser und vertrauenswürdiger zu machen. Mit besonderem Blick auf Datenarbeit skizziert Michael Berthold, CEO von KNIME, sieben wichtige Trends. […]

Andreas Müller, Vice President Enterprise Sales Central and Eastern Europe bei Delinea (c) Delinea

KI, Deepfakes und Quantenkryptografie bergen Bedrohungspotential

9. Januar 2025 Andreas Müller*

Die Bedrohungen im Cyberraum entwickeln sich schneller, als viele Unternehmen reagieren können – von KI-unterstützten Angriffen bis hin zu Deepfake-Technologien. Andreas Müller, Vice President Enterprise Sales Central and Eastern Europe bei Delinea, über die wichtigsten Cybersicherheits-Herausforderungen für 2025. […]

Florian Brence, Partner bei Deloitte Österreich (c) Deloitte

Diese Trends bestimmen die Tech-Welt 2025

9. Januar 2025 pi/wf

Deloitte-Analyse: Auch wenn der erste mediale Hype vorbei ist, wird vor allem das Thema Generative Artificial Intelligence (GenAI) den Markt in den kommenden Monaten aufmischen. Die Branche muss sich auf einen Umbruch einstellen, der neben Chancen und Potenzialen auch einige Herausforderungen bringen wird. […]

Markus Eisele, Developer Strategist bei Red Hat. (c) Red Hat

Warum offene Plattformen 2025 der Gamechanger für die KI werden

9. Januar 2025 Markus Eisele*

Künstliche Intelligenz wird auch 2025 ein entscheidender Treiber für die Innovations- und Wettbewerbsfähigkeit von Unternehmen sein. Laut Markus Eisele, Developer Strategist bei Red Hat, sollten IT-Verantwortliche und Führungskräfte im kommenden Jahr auf fünf Entwicklungen achten. […]

Microsoft-KI malt Bilder nach Beschreibung

Microsoft-Forscher haben ein KI-System entwickelt, das anhand beschreibender Texte Bilder malt. Dabei zeige die Künstliche Intelligenz (KI) auch eine "künstliche Vorstellungskraft", heißt es im Microsoft-Research-Blog. [...]

Mehr Artikel

IT-Branche & CO – so viel verdient man in Deutschland

Die wichtigsten Technologietrends für den Sicherheitssektor im Jahr 2025

GitHub Copilot Free: kostenloser KI-Coding-Assistent

Künstliche Intelligenz kommt auf Endgeräten an

Flexible Vernetzung dezentraler Unternehmensstrukturen

7 KI-Trends, die das Jahr 2025 prägen werden

KI, Deepfakes und Quantenkryptografie bergen Bedrohungspotential

Diese Trends bestimmen die Tech-Welt 2025

Warum offene Plattformen 2025 der Gamechanger für die KI werden

Be the first to comment

Leave a Reply Antworten abbrechen