5. Dezember 2025

Künstliche Intelligenz: Genial und begrenzt zugleich

Künstliche Intelligenz (KI) weist heute schon in zahlreichen Anwendungsbereichen ihre Fähigkeiten nach: unter anderem in der Industrie bei der Steuerung von Geräten und Maschinen, in der Robotik, bei Automatisierungsprozessen bis hin zur Medizin, wo sie Ärzte insbesondere in der Diagnostik wertvolle Unterstützung bietet. [...]

cranium-2099120_640 — Foto: GordonJohnson/Pixabay

Oder in Form von Gesundheits-Apps, die für manche Menschen bereits zum Lifestyle gehören. Gleichzeitig nehmen die Diskussionen über die Grenzen, aber auch die Risiken von KI weiter Fahrt auf.

In einem viel beachteten Essay in der aktuellen Ausgabe 619 der Fachzeitschrift ‚Nature‘ diskutiert Celeste Biever, wie KI-basierte LLMs (large language models) an vergleichsweise einfachen Aufgaben aus standardisierten Intelligenztests scheitern.

Für Aufsehen sorgt, dass Modelle, die mühelos Aufnahmeprüfungen renommierter Hochschulen bestehen und komplizierte Anforderungen in vielen Bereichen in Rekordzeit bewältigen, regelmäßig bei einfachen Abstraktionsaufgaben versagen.

Ihr Plädoyer vor diesem Hintergrund: „Wir müssen grundsätzlich verstehen, was sie können und wo sie scheitern.“ Im Hintergrund steht hier die Frage danach, ob KI-Systeme als unbeschränkt „genial“ einzustufen sind oder ob die Fähigkeiten Künstlicher Intelligenz nicht doch begrenzt sind?

Beides, meint Prof. Marco Barenkamp, KI-Experte und stellvertretender Vorsitzender des Aufsichtsrats und Gründer der auf die Anwendung von KI in der Industrie spezialisierten LMIS AG in Osnabrück.

ChatGPT vom US-Start-up OpenAI oder Bard von Google, aber auch andere LLM beherrschen so manche Fähigkeit, die noch vor wenigen Jahren als Meilenstein der Künstlichen Intelligenz (KI) gefeiert worden wäre, macht Prof. Barenkamp die Bedeutung dieser Entwicklung deutlich: Eloquent beantworten die Bots Fragen, bestehen akademische Prüfungen mit Bravour und verblüffen mit erstaunlichem Allgemeinwissen.

Allerdings bereiten dem Transformermodell „Chat Generative Pre-trained Transformer“, so die ausgeschriebene Bezeichnung von ChatGPT, bereits einfache visuelle Logik-Rätsel erhebliche Schwierigkeiten, während Menschen solche Aufgaben meist mühelos meistern.

Wie kann Künstliche Intelligenz realistisch bewertet werden?

Vor diesem Hintergrund rätseln Wissenschaftler derzeit, wie die Fähigkeiten von ChatGPT realistisch zu bewerten sind. Prof. Barenkamp verweist hierzu auf eine Studie, die jüngst in der akademischen Welt einige Aufmerksamkeit erregte und auch Grundlage des Essays von Celeste Biever ist: Ein Team um Melanie Mitchell vom Santa Fe Institute hatte dem Sprachmodell GPT 4 Aufgaben vorgelegt, bei denen farbige Blöcke in einem Raster anzuordnen waren.

Aus mehreren Beispielen sollte auf die zugrunde liegende Regel geschlossen und vorhergesagt werden, wie sich die Blöcke als nächstes verändern.

„Die meisten Menschen lösen solche Aufgaben mühelos“, erklärt Prof. Barenkamp. GPT 4 hingegen schaffte nur ein Drittel in einer Kategorie richtig und erreichte in anderen teils nur 3 Prozent. Andere KI-Systeme, die speziell für solche Rätsel entwickelt wurden, kamen demnach zwar auf bessere, aber immer noch deutlich schlechtere Ergebnisse als Menschen.

Die Studie zeige, dass es den künstlichen Systemen aktuell noch schwerfalle, zugrunde liegende Konzepte zu erkennen und daraus zu lernen, resümiert Experte Barenkamp. Eines der Kennzeichen menschlicher Intelligenz sei aber gerade die Fähigkeit zur Abstraktion und zum Transfer auf neue Situationen, betont er.

Künstliche Intelligenz lernt anders

So weit, so gut. Aber woran liegt es denn nun, dass KI-Systeme den Menschen in solchen Basisfähigkeiten noch so deutlich unterlegen sind, während sie in Konversationen zum Teil mit überraschender Eloquenz verblüffen? Zur Erklärung führt Prof. Barenkamp an, dass KI-Anwendungen eben anders lernen als Menschen.

So werden große Sprachmodelle wie GPT 4 zum Beispiel mittels Durchforsten gewaltiger Mengen an Texten trainiert. Dabei erkennt die Künstliche Intelligenz statistische Korrelationen zwischen Wörtern, wie Prof. Barenkamp erläutert, um bei einer Eingabe das wahrscheinlich nächste Wort zu ermitteln.

Menschen hingegen erleben schon als Kind konkrete Erfahrungen mit Objekten und Situationen, bauen ihr eigenes Abbild (Repräsentation) der Welt auf und entwickeln kognitive Fähigkeiten wie Abstraktionsvermögen und logisches Denken.

Dies kann aus Sicht von KI-Experte Barenkamp erklären, warum GPT 4 zwar Texte, wie von Menschen verfasst, in hoher Qualität auszugeben in der Lage ist, aber an einfachen visuellen Tests scheitert: Weil das Training in diesem Fall ausschließlich auf Sprache beruht und nicht auf realen Erfahrungen sowie dem notwendigen Verbinden von Sprache mit konkreten, erlebten Dingen.

Manche Forscher vermuten daher, dass KI-Systeme Wörter auch nicht so „verstehen“ wie wir Menschen, da sie dadurch keine echte Begrifflichkeit der Welt entwickeln können.

ai-society.org/

Mehr als nur ein Compliance-Kriterium: Cybersicherheit ist eine Angelegenheit der Unternehmenskultur

5. Dezember 2025 Nicholas Jackson *

Ein Blick in die Praxis zeigt: IT-Sicherheit scheitert nicht an Technologien oder Fehlverhalten, sondern bereits grundsätzlich an einem Mangel an Unternehmenskultur. Wenn Cybersicherheit in einer Organisation nur als eine schlecht durchgesetzte Aufgabe von anderen für andere verstanden wird, entsteht vielleicht eine oberflächliche Compliance, aber keine wirkliche Cyberresilienz. […]

Agile Transformation scheitert nicht am Budget, sondern an der Unternehmenskultur

5. Dezember 2025

Um den Erfolg agiler Arbeitsweisen zu messen, setzen Österreichs Unternehmen auf klare Kennzahlen. Dabei ist vor allem die Kundenzufriedenheit wichtig. Gleichzeitig gewinnt Effizienz im Hinblick auf die angespannte Wirtschaftslage an Bedeutung: kürzere Projektlaufzeiten werden immer wichtiger, genauso wie die Kontrolle der Implementierungskosten. […]

Copilot-Notebook Medion SPRCHRGD 14 S2 (MD62722) im Test

5. Dezember 2025 Daniel Bader *

Zugegeben, am kryptischen Namen des brandneuen 14-Zoll-Notebooks sollte Hersteller Medion noch etwas feilen. Das, worauf es bei einem Laptop aber ankommt, ist vom Feinsten. Der PCtipp-Test. […]

Michael Maier, Director Austria iteratec (c) iteratec

KI-Transformation in Unternehmen – Eine Revolution in fünf Schritten

4. Dezember 2025 Michael Maier*

Wie weit wird die Evolution der Künstlichen Intelligenz gehen und wie wird sie sich auf Wirtschaft und Gesellschaft als Ganzes auswirken? Was für Privatpersonen interessante Fragen sind, sind für Unternehmer existenzielle Themen, schließlich müssen diese wirtschaftlich gegenüber Konkurrenten bestehen, von denen viele bereits an einer effektiven Nutzung von KI arbeiten. […]

Künstliche Intelligenz: Dateninfrastruktur ist wichtiger als der Use Case

4. Dezember 2025

Damit KI-Anwendungen produktiv und skalierbar eingesetzt werden können, benötigen Unternehmen zunächst eine tragfähige technologische und organisatorische Basis. Insbesondere moderne Datenplattformen, klare Governance-Strukturen und eine hohe Datenqualität gelten als Voraussetzung für erfolgreiche KI-Nutzung. Aber genau hier besteht noch Nachholbedarf. […]

Diese Trends bestimmen 2026 das SAP-Universum

4. Dezember 2025

Vor allem Datensouveränität, Compliance und das nahende Ende des Supports für Legacy-Lösungen stehen im Fokus – neben den Dauerthemen Cloud und KI. […]

Rebranding: Tietoevry schlägt mit „Tieto“ ein neues Kapitel auf

4. Dezember 2025

Die neue Marke vereint den operativen Kern des Tech-Consulting-Dienstleisters und bekräftigt sein Engagement, Wirtschaft und Gesellschaft mit Technologie zu unterstützen. […]

Produktionsplanung 2026: Worauf es ankommt

4. Dezember 2025

Resilienz gilt als das neue Patentrezept, um aktuelle und kommende Krisen nicht nur zu meistern, sondern sogar gestärkt daraus hervorzugehen. Doch Investitionen in die Krisenprävention können zu Lasten der Effizienz gehen. Ein Dilemma, das sich in den Griff bekommen lässt. […]

Monitor Eizo FlexScan EV2740S im Test

4. Dezember 2025 Daniel Bader *

Was soll denn an einem 27 Zoll großen Monitor für Büroumgebungen schon besonders sein? Vieles, wie unser Test klar macht. […]

Künstliche Intelligenz: Genial und begrenzt zugleich

Wie kann Künstliche Intelligenz realistisch bewertet werden?

Künstliche Intelligenz lernt anders

Mehr Artikel

Mehr als nur ein Compliance-Kriterium: Cybersicherheit ist eine Angelegenheit der Unternehmenskultur

Agile Transformation scheitert nicht am Budget, sondern an der Unternehmenskultur

Copilot-Notebook Medion SPRCHRGD 14 S2 (MD62722) im Test

KI-Transformation in Unternehmen – Eine Revolution in fünf Schritten

Künstliche Intelligenz: Dateninfrastruktur ist wichtiger als der Use Case

Diese Trends bestimmen 2026 das SAP-Universum

Rebranding: Tietoevry schlägt mit „Tieto“ ein neues Kapitel auf

Produktionsplanung 2026: Worauf es ankommt

Monitor Eizo FlexScan EV2740S im Test

Be the first to comment

Leave a Reply Antwort abbrechen