Was ist Computer Vision?

Computer-Vision-Systeme können es längst mit dem menschlichen Auge aufnehmen. Das sollten Sie zum Thema wissen. [...]

Die visuellen Fähigkeiten von Computersystemen verbessern sich immer weiter. Das müssen Sie über Computer Vision wissen (c) pixabay.com

Autonomes Fahren, Virtual Reality und Augmented Reality sind nur einige der Anwendungsgebiete für Computer Vision.

Computer Vision – Definition

Computer Vision (dt.: computerbasiertes Sehen) bezeichnet Systeme, die Objekte in digitalem Stand- und Bewegtbildmaterial erkennen und entsprechend verarbeiten. Das Feld der Computer Vision hat sich im Laufe der vergangenen zwanzig Jahre entscheidend weiterentwickelt: Heutige Computer-Vision-Systeme erreichen eine Genauigkeit von 99 Prozent und laufen inzwischen auch auf mobilen Devices.

Um die Bildverarbeitung durch den visuellen Kortex zu abstrahieren, setzen Forscher in Sachen Computer Vision insbesondere auf künstliche neurale Netze. Mit Yann LeCuns LeNet-5 (einem siebenstufigen Convolutional Neural Network, das handgeschriebene Zahlen in digitalisierten Bildern mit einer Auflösung von 32×32-Pixeln erkennt) gelang im Jahr 1998 der Durchbruch. Dieses Modell wurde zielstrebig erweitert: Heutige Image-Classification-Systeme erkennen ganze Objektkataloge in HD-Auflösung und in Farbe.

Neben neuralen Netzen setzen Experten in Sachen Computer Vision auch auf Hybrid-Vision-Modelle, die Deep Learning mit klassischen Machine-Learning-Algorithmen kombinieren.

Computer Vision – Trainingsdaten

Um Computer-Vision-Modelle zu trainieren, stehen diverse öffentliche Bilddatenbanken zur Verfügung:

  • MNIST ist eine der simpelsten und ältesten Datenbanken und enthält ca. 70.000 handgeschriebene Zahlen in zehn verschiedenen Klassen. Das MNIST-Datenset lässt sich ohne Probleme in ein Modell überführen – selbst mit einem Laptop ohne Hardwarebeschleunigung.
  • COCO bietet ein großes Datenset – beispielsweise zur Objekterkennung und Bildsegmentierung. Mehr als 330.000 Bilder in 80 Objektkategorien stehen zur Verfügung.
  • ImageNet enthält circa 1,5 Millionen Bilder inklusive Labels und Begrenzungsrahmen.
  • Open Images beherbergt die URLs zu circa neun Millionen Bildern – ebenfalls inklusive Labels.
  • Google, Azure und AWS haben jeweils eigene Computer-Vision-Modelle, die mit großen Datensets trainiert wurden. Diese können entweder direkt eingesetzt werden oder per Transfer Learning mit eigenen Bilddatensätzen trainiert werden. Das spart im Vergleich zum grundlegenden Neuaufbau eines Modells extrem viel Zeit.
YouTube

Mit dem Laden des Videos akzeptieren Sie die Datenschutzerklärung von YouTube.
Mehr erfahren

Video laden

Computer Vision – Use Cases

Computer Vision ist nicht perfekt, aber die Systeme sind genau genug, um in verschiedenen Branchen zum praktischen Einsatz zu kommen.

Automotive

Waymo – ehemals Googles Vorzeigeprojekt in Sachen autonomes Fahren – hat seine Fahrzeugsoftware nach eigener Aussage mit Daten aus sieben Millionen zurückgelegten Kilometern trainiert. Bisher ist mindestens ein Unfall eines Waymo-Vans bekannt, allerdings soll die Software dafür nicht ursächlich gewesen sein.

Die Tesla-Modelle bieten bekanntermaßen ebenfalls Möglichkeiten, sich autonom fortzubewegen und setzen dabei auf Computer Vision. Nach einem tödlichen Unfall wurde die Fahrzeugsoftware so angepasst, dass sich die Hände des Fahrers in jedem Fall auf dem Lenkrad befinden müssen.

Handel

Amazon setzt in seinen Go Stores auf Self-Service und Computer Vision: Das System erkennt, wenn ein Kunde Produkte aus dem Regal nimmt oder zurückstellt, identifiziert und abgerechnet werden die Einkäufe über eine Smartphone-App. Sollte der Amazon Go Software dabei ein Produkt entgehen, ist es für den Kunden kostenlos – für fälschlicherweise berechnete Produkte erhält er eine Gutschrift.

Healthcare

Auch im Gesundheitswesen kommt Computer Vision regelmäßig zum Einsatz, etwa wenn es um Röntgenaufnahmen und andere medizinische Bildsysteme geht.

Finanzsektor

Im Bankenwesen kommt Computer Vision beispielsweise zur Betrugserkennung oder der von Dokumenten zum Einsatz.

Landwirtschaft

Geht es um Landwirtschaft 4.0, kommt Computer Vision ins Spiel – beispielsweise, wenn es um das Monitoring von Ackerflächen geht.

Kontroverse Einsatzzwecke

Auch Computer Vision wird zu kontroversen Zwecken zum Einsatz gebracht. Insbesondere Techniken zur Gesichtserkennung stehen (nicht nur) bei Autokratien hoch im Kurs. Auch Deepfakes und Trainings-Bias sind vielfach beschriebene Problemfelder.

YouTube

Mit dem Laden des Videos akzeptieren Sie die Datenschutzerklärung von YouTube.
Mehr erfahren

Video laden

Computer Vision – Frameworks & Modelle

Die meisten Deep Learning Frameworks bieten umfassenden Support für Computer Vision, zum Beispiel die Python-basierten Frameworks TensorFlowPyTorch oder MXNet.

  • Der Videoanalyse-Service Amazon Rekognition kann Objekte, Menschen, Texte und Aktivitäten erkennen – auch Gesichter und Custom Labels.
  • Der vortrainierte Analyserservice Google Cloud Vision API ermöglicht die Detektion von Objekten und Gesichtern, liest gedruckten und geschriebenen Text und versieht Bilderkataloge mit Metadaten. Mit Google AutoML Vision können auch Custom Image Models trainiert werden.
  • Microsofts Computer Vision API kann ebenfalls Objekte erkennen. Die Face API steht in der Cloud oder auch als Container-Lösung am Netzwerkrand zur Verfügung und kann neben Gesichtern auch Emotionen erkennen.
  • IBM Watson Visual Recognition klassifiziert Bilder auf Grundlage eines vortrainierten Modells und ermöglicht darüber hinaus Transfer Learning, Objekt-Detektion und -Zählung. Die IBM-Lösung läuft in der Cloud oder über iOS Devices mit Core ML.
  • MathWorks hat mit Matlab ebenfalls ein Analyse-Paket im Angebot, dass die Bilderkennung auf Grundlage von Machine und Deep Learning beherrscht.
  • Das Apple Vision Framework erkennt Gesichter, Text oder auch Barcodes. Zu Zwecken der Bild-Klassifizierung oder Objekterkennung können auch eigene CoreML-Modelle eingesetzt werden.

Computer-Vision-Modelle haben sich seit LeNet-5 rasant weiterentwickelt – die meisten dieser Modelle sind künstliche neurale Netze:

Computer Vision wird immer präziser und zuverlässiger und kann es bereits jetzt in vielen Fällen mit dem menschlichen visuellen Kortex aufnehmen. Durch die Weiterentwicklung von Frameworks und Modellen sowie die Möglichkeit des Transfer Learning braucht man inzwischen auch keinen Doktortitel mehr, um Computer Vision zum Einsatz zu bringen.

Dieser Beitrag basiert auf einem Artikel unserer US-Schwesterpublikation Infoworld.

YouTube

Mit dem Laden des Videos akzeptieren Sie die Datenschutzerklärung von YouTube.
Mehr erfahren

Video laden

*Martin Heller schreibt als freier Autor für die Schwesterpublikation InfoWorld.


Mehr Artikel

Die Teilnehmer des Roundtables (v.l.n.r.): Roswitha Bachbauer (CANCOM Austria), Thomas Boll (Boll Engineering AG), Manfred Weiss (ITWelt.at) und Udo Schneider (Trend Micro). (c) timeline/Rudi Handl
News

Security in der NIS2-Ära

NIS2 ist mehr ein organisatorisches Thema als ein technisches. Und: Von der Richtlinie sind via Lieferketten wesentlich mehr Unternehmen betroffen als ursprünglich geplant, womit das Sicherheitsniveau auf breiter Basis gehoben wird. Beim ITWelt.at Roundtable diskutierten drei IT-Experten und -Expertinnen über die Herausforderungen und Chancen von NIS2. […]

Christoph Mutz, Senior Product Marketing Manager, AME, Western Digital (c) AME Western Digital
Interview

Speicherlösungen für Autos von morgen

Autos sind fahrende Computer. Sie werden immer intelligenter und generieren dabei jede Menge Daten. Damit gewinnen auch hochwertige Speicherlösungen im Fahrzeug an Bedeutung. Christoph Mutz von Western Digital verrät im Interview, welche Speicherherausforderungen auf Autohersteller und -zulieferer zukommen. […]

Andreas Schoder ist Leiter Cloud & Managend Services bei next layer, Alexandros Osyos ist Senior Produkt Manager bei next layer. (c) next layer
Interview

Fokus auf österreichische Kunden

Der österreichische Backup-Experte next layer bietet umfassendes Cloud-Backup in seinen Wiener Rechenzentren. Im Interview mit ITWelt.at erläutern Andreas Schoder, Leiter Cloud & Managed Services, und Alexandros Osyos, Senior Produkt Manager, worauf Unternehmen beim Backup achten müssen und welche Produkte und Dienstleistungen next layer bietet. […]

Miro Mitrovic ist Area Vice President für die DACH-Region bei Proofpoint.(c) Proofpoint
Kommentar

Die Achillesferse der Cybersicherheit

Eine immer größere Abhängigkeit von Cloud-Technologien, eine massenhaft mobil arbeitende Belegschaft und große Mengen von Cyberangreifern mit KI-Technologien haben im abgelaufenen Jahr einen wahrhaften Sturm aufziehen lassen, dem sich CISOS ausgesetzt sehen. Eine große Schwachstelle ist dabei der Mensch, meint Miro Mitrovic, Area Vice President DACH bei Proofpoint. […]

Alexander Graf ist Geschäftsführer der Antares-NetlogiX Netzwerkberatung GmbH. (c) Antares-NetlogiX Netzwerkberatung GmbH
Interview

Absicherung kritischer Infrastrukturen

NIS2 steht vor der Tür – höchste Zeit, entsprechende Maßnahmen auch im Bereich der Operational Technology (OT) zu ergreifen. »Wenn man OT SIEM richtig nutzt, sichert es kritische Infrastrukturen verlässlich ab«, sagt Alexander Graf, Experte für OT-Security (COSP) und Geschäftsführer der Antares-NetlogiX Netzwerkberatung GmbH, im ITWelt.at-Interview. […]

Brian Wrozek, Principal Analyst bei Forrester (c) Forrester
Interview

Cybersicherheit in der Ära von KI und Cloud

Die Bedrohungslandschaft im Bereich der Cybersicherheit hat sich zu einer unbeständigen Mischung von Bedrohungen entwickelt, die durch zunehmende Unsicherheit und steigende Komplexität bedingt ist. Zu diesem Schluss kommt der Report »Top Cyber-security Threats In 2024« von Forrester. ITWelt.at hat dazu mit Studienautor Brian Wrozek ein Interview geführt. […]

Be the first to comment

Leave a Reply

Your email address will not be published.


*