Dokumente mittels Künstlicher Intelligenz klassifizieren

Für ECM- bzw. DMS-Systeme war die digitale Dokumentenverarbeitung bisher eine große Aufgabe. Heute jedoch können Künstliche Intelligenz und Machine Learning die Trefferquote bei der Dokumentenklassifizierung deutlich erhöhen. [...]

Olaf Holst ist Chief Technology Evangelist bei Optimal Systems. (c) Optimal Systems GmbH

Laut einer aktuellen Umfrage von Bitkom Research erstellen mittlerweile vier von zehn Unternehmen elektronische Rechnungen. Sie nutzen bereits die Vorteile, die ihnen die digitale Rechnungsverarbeitung bietet, wie schnellere Prozesse, weniger Fehler und geringere Kosten. Demgegenüber steht ein hoher Anteil von Unternehmen, in denen „unstrukturierte Rechnungsformate wie die digitale Rechnung im PDF-Format (60 Prozent) oder die Papierrechnung (87 Prozent) noch weit verbreitet sind.“ Für letztere ist der Brieföffner wohl der wichtigste Bestandteil der täglichen Eingangsrechnungsverarbeitung. Moderne ECM-/DMS-Lösungen mit KI-Unterstützung ermöglichen es Unternehmen nun, solche manuellen Instrumente endlich abzulösen und auf eine umfassende Automatisierung durch einen ganzheitlichen digitalen Ansatz zu setzen.

Die Herausforderung der Dokumentenklassifizierung

Die Herausforderung bei allen Arten von Dokumenten besteht darin, dass sie richtig kategorisiert werden müssen. Dies gilt sowohl für analoge Papierdokumente als auch für „halbdigitale“ elektronische PDFs. Wer trifft diese Entscheidung normalerweise? Buchhalter, die damit beauftragt sind, Dokumente zu scannen oder an die entsprechenden Kollegen weiterzuleiten. Sowohl hier als auch im weiteren Verlauf des Prozesses, zum Beispiel bei der Übertragung von Buchhaltungsdaten in andere Systeme, können Fehler auftreten. Selbst die in einem Scanner integrierte OCR-Funktionalität bietet keine zuverlässige Garantie dafür, dass alle Informationen auf Anhieb korrekt aus dem Dokument extrahiert werden können.

Dokumentenklassifizierung mittels Machine Learning

Content-Services-Plattformen und Informationsmanagement-Anwendungen, die mit Hilfe von maschinellem Lernen Inhalte erkennen und verarbeiten, stellen den nächsten Schritt in der Dokumentenklassifikation dar. Der Begriff „Künstliche Intelligenz“ wird in diesem Zusammenhang häufig verwendet, ist aber nicht direkt anwendbar. Das liegt daran, dass ein KI-System zunächst dumm ist – die Intelligenz muss erst trainiert werden. Es muss lernen, was eine Rechnung ausmacht. Im Gegensatz zu herkömmlichen Dokumentenmanagementsystemen, die anhand von Belegpositionsdaten Informationen über Kunde, Lieferant, Rabatt, Mehrwertsteuer, Endsumme usw. erfassen, verfolgen KI-Systeme einen anderen Ansatz. Mittels „Natural Language Processing“ (NLP) wird die natürliche Sprache erfasst und über Algorithmen verarbeitet.

Grundlage für Machine Learning: valide Trainingsdaten

Die Qualität der Daten, mit denen ein ECM-System mit KI-Unterstützung trainiert wird, ist der entscheidende Faktor für dessen Intelligenzquotienten. Hierfür werden die historischen Rechnungsdaten des Unternehmens verwendet, von denen man weiß, dass sie korrekt sind. Nachdem das System auf diese Weise trainiert wurde, kann es auf neue Dokumente losgelassen werden. Durch die Einstellung von Schwellenwerten kann der Sachbearbeiter prüfen, mit welcher Wahrscheinlichkeit das System erkennt, dass es sich um einen spezifischen Kunden handelt. Ist dieser Schwellenwert bereits entsprechend hoch, ist eine erneute Prüfung nicht mehr notwendig. Wenn das System beispielsweise davon ausgeht, dass es sich bei dem Beleg zu 99,98 Prozent um eine Rechnung handelt, gibt es kaum Zweifel. Da alle im Beleg erkannten Positionsdaten geschätzt und als Prozentwert angezeigt werden, kann der Sachbearbeiter die Validierung Schritt für Schritt durchführen. Die Ergebnisse der menschlichen Bewertung fließen in das System zurück und verbessern die Erkennungsqualität in den folgenden Durchläufen.

Fazit

Dokumentenklassifizierung mittels Machine Learning birgt ein enormes Effizienzpotenzial für die Unternehmen. Voraussetzung ist eine entsprechende Digitalisierung der Prozesse, um Technologien wie KI einsetzen zu können.

*Der Autor Olaf Holst ist Chief Technology Evangelist bei Optimal Systems.


Mehr Artikel

Die Teilnehmer des Roundtables (v.l.n.r.): Roswitha Bachbauer (CANCOM Austria), Thomas Boll (Boll Engineering AG), Manfred Weiss (ITWelt.at) und Udo Schneider (Trend Micro). (c) timeline/Rudi Handl
News

Security in der NIS2-Ära

NIS2 ist mehr ein organisatorisches Thema als ein technisches. Und: Von der Richtlinie sind via Lieferketten wesentlich mehr Unternehmen betroffen als ursprünglich geplant, womit das Sicherheitsniveau auf breiter Basis gehoben wird. Beim ITWelt.at Roundtable diskutierten drei IT-Experten und -Expertinnen über die Herausforderungen und Chancen von NIS2. […]

Christoph Mutz, Senior Product Marketing Manager, AME, Western Digital (c) AME Western Digital
Interview

Speicherlösungen für Autos von morgen

Autos sind fahrende Computer. Sie werden immer intelligenter und generieren dabei jede Menge Daten. Damit gewinnen auch hochwertige Speicherlösungen im Fahrzeug an Bedeutung. Christoph Mutz von Western Digital verrät im Interview, welche Speicherherausforderungen auf Autohersteller und -zulieferer zukommen. […]

Andreas Schoder ist Leiter Cloud & Managend Services bei next layer, Alexandros Osyos ist Senior Produkt Manager bei next layer. (c) next layer
Interview

Fokus auf österreichische Kunden

Der österreichische Backup-Experte next layer bietet umfassendes Cloud-Backup in seinen Wiener Rechenzentren. Im Interview mit ITWelt.at erläutern Andreas Schoder, Leiter Cloud & Managed Services, und Alexandros Osyos, Senior Produkt Manager, worauf Unternehmen beim Backup achten müssen und welche Produkte und Dienstleistungen next layer bietet. […]

Miro Mitrovic ist Area Vice President für die DACH-Region bei Proofpoint.(c) Proofpoint
Kommentar

Die Achillesferse der Cybersicherheit

Eine immer größere Abhängigkeit von Cloud-Technologien, eine massenhaft mobil arbeitende Belegschaft und große Mengen von Cyberangreifern mit KI-Technologien haben im abgelaufenen Jahr einen wahrhaften Sturm aufziehen lassen, dem sich CISOS ausgesetzt sehen. Eine große Schwachstelle ist dabei der Mensch, meint Miro Mitrovic, Area Vice President DACH bei Proofpoint. […]

Alexander Graf ist Geschäftsführer der Antares-NetlogiX Netzwerkberatung GmbH. (c) Antares-NetlogiX Netzwerkberatung GmbH
Interview

Absicherung kritischer Infrastrukturen

NIS2 steht vor der Tür – höchste Zeit, entsprechende Maßnahmen auch im Bereich der Operational Technology (OT) zu ergreifen. »Wenn man OT SIEM richtig nutzt, sichert es kritische Infrastrukturen verlässlich ab«, sagt Alexander Graf, Experte für OT-Security (COSP) und Geschäftsführer der Antares-NetlogiX Netzwerkberatung GmbH, im ITWelt.at-Interview. […]

Brian Wrozek, Principal Analyst bei Forrester (c) Forrester
Interview

Cybersicherheit in der Ära von KI und Cloud

Die Bedrohungslandschaft im Bereich der Cybersicherheit hat sich zu einer unbeständigen Mischung von Bedrohungen entwickelt, die durch zunehmende Unsicherheit und steigende Komplexität bedingt ist. Zu diesem Schluss kommt der Report »Top Cyber-security Threats In 2024« von Forrester. ITWelt.at hat dazu mit Studienautor Brian Wrozek ein Interview geführt. […]

Be the first to comment

Leave a Reply

Your email address will not be published.


*