Neue intelligente Software erkennt fast alles

Fraunhofer-Forscher haben hochkomplexe Engine für Optical Character Recognition trainiert. [...]

Zeichenerkennung: Neues System erkennt alles. (c) IAIS,animaflora/fotolia.de

Forscher des Fraunhofer-Instituts für Intelligente Analyse- und Informationssysteme (IAIS) haben zusammen mit der CIB software GmbH eine Künstliche Intelligenz entwickelt, die Zeichen mit menschenähnlicher Genauigkeit erkennt. Herzstück ist eine Engine für Optical Character Recognition (OCR).

Mit mehr als 2.000 Fonts sowie eigens erzeugten, schwer erkennbaren Zeichen haben die Forscher die künstlichen neuronalen Netze trainiert. So gelingt es der Technologie, neben gut lesbaren Materialien auch alte Schriften, Fotos mit mangelhafter Belichtung und schlecht erhaltene Dokumente zu entziffern.

Schwer Erkennbares deuten

Selbst Hinweisschilder auf Baustellen oder Plakattexte erkennt die Software laut den Experten problemlos, was ihren Einsatz über die klassische Dokumentenanalyse hinaus in anderen Bereichen ermöglicht, etwa dem Autonomen Fahren oder der Hilfe Sehbehinderter, denen künftig zum Beispiel Texte in ihrer Umgebung vorgelesen werden könnten.

„Eine Vielzahl der kommerziellen Engines ist offenbar primär auf gute Materialien ausgelegt. Hier liegt die Trefferquote bei nahezu perfekten 99 Prozent. Sobald die Qualität des Dokuments abnimmt, verringert sich die Erkennungsrate jedoch dramatisch. Deshalb haben wir uns insbesondere auf schwer erkennbare Dokumente konzentriert und so auf unserer Fraunhofer-Expertise im Maschinellen Lernen aufbauend eine schnelle und robuste Allzweck-OCR-Engine mit menschenähnlicher Genauigkeit geschaffen – auch bei schwierigen Scans“, so IAIS-Projektleiter Iuliu Konya.

Ein Zeichen, 5.000 Variationen

In 27 Monaten haben die Forscher die OCR-Engine trainiert – jedes Zeichen wurde mindestens 5.000 Mal in verschiedenen Variationen zum Training verwendet. Historische und neue Texte, verschiedene Graustufen – dort, wo es an Trainingsdaten mangelte, erzeugten die Forscher zudem selbst synthetische Texte. Nachdem die Software zunächst anhand einzelner annotierter Zeichen trainiert wurde, erkennt sie jetzt innerhalb ganzer Zeilen selbstständig die jeweiligen Buchstaben und Satzzeichen. Binnen kürzester Zeit werden Zeitungsseiten, juristische Dokumente oder medizinische Akten erfasst.


Mehr Artikel

Ismet Koyun, CEO und Gründer der KOBIL Gruppe (c) KOBIL Gruppe
Kommentar

Wie SuperApps den Mobilitätsmarkt revolutionieren können

Bahntickets, Busse, Carsharing, Taxis – wer mobil sein will, benötigt eine Vielzahl von Apps. Das muss nicht sein, sagt Ismet Koyun, Gründer und CEO des Unternehmens KOBIL, Weltmarktführer für digitale Identitäts- und mobile Sicherheitslösungen. Neue Technologien könnten all diese Angebote in einer einfachen, komfortablen und sicheren Lösung bündeln. Intelligente, vernetzte Verkehrssysteme und Datenaustausch auf österreichischer und europäischer Ebene bereiten dafür den Weg und schaffen die nötigen Voraussetzungen. […]

News

Fünf Aspekte, die Führungskräfte über Datenbanken wissen sollten

Die Datenbanklandschaft hat sich in den letzten zehn Jahren gravierend verändert. Wo früher meist eine einzige Plattform zum Einsatz kam, entsteht in vielen Unternehmen heute geradezu ein Wildwuchs an unterschiedlichen Technologien. Redgate, Anbieter von DevOps-Lösungen für End-to-End-Datenbankmanagement, nennt fünf Gründe, wie es dazu kam – und was Business Leader wissen müssen. […]

Be the first to comment

Leave a Reply

Your email address will not be published.


*