Mit KI gegen die Papierflut

90 Prozent aller Arztrechnungen gehen zur Kostenerstattung auch heute noch auf dem Postweg bei den österreichischen Sozialversicherungsträgern ein. Gleichzeitig steigt die Zahl der Erstattungsfälle von Jahr zu Jahr. Ein von der IT-Services der Sozialversicherung (ITSV) und Cloudflight entwickeltes KI-System zur teilautomatisierten Kostenerstattung von Arztrechnungen hilft nun dabei, das eingehende Papierrechnungen digitalisiert und weiterverarbeitet werden. [...]

Cloudflight bringt KI in der Kostenerstattung der SV. (c) Pixabay

In Österreich ist jede Person, abhängig von ihrem Arbeitgeber und der jeweiligen Branche, automatisch einem Sozialversicherungsträger zugewiesen. Diese öffentlichen Sozialversicherungsträger wiederum unterhalten Verträge mit sogenannten Kassenärzten, die in der Lage sind, erstattungsfähige Arztleistungen zu einem vereinbarten Tarif direkt mit den Trägern abzurechnen. Patienten und Patientinnen in Österreich steht es neben der Konsultation eines solchen Kassenarztes jedoch auch frei, einen Wahlarzt zu besuchen. Wahlärzte sind in Österreich niedergelassene Privatärzte – oftmals Fachärzte – die über keinen Vertrag mit den gesetzlichen Krankenkassen verfügen, ihr Honorar aber an deren Tarifen orientieren.

Statt die Leistungen direkt über den Sozialversicherungsträger abzurechnen, stellt der Wahlarzt eine Rechnung, die zunächst vom Patienten oder der Patientin beglichen wird. In Nachgang können Patienten und Patientinnen sich die Kosten der Behandlung anteilig erstatten lassen, indem sie die Rechnung bei ihrem Versicherungsträger einreichen.

Kostenerstattung ist Sisyphusarbeit

Für eine Kostenerstattung prüfen die Sachbearbeitenden der Sozialversicherungsträger die eingegangene Honorarnote auf den Erstattungsanspruch. Dabei werden die verrechneten Leistungen auf einen Leistungskatalog umgeschlüsselt und die Kosten dann prozentual beziehungsweise gedeckelt rückerstattet. Eine arbeitsintensive Tätigkeit: Da auch 2020 noch rund 90 Prozent der Rechnungen in Papierform und häufig mit handschriftlichen Vermerken über den Postweg bei den Versicherungsträgern eingehen, müssen die Sachbearbeitenden nicht nur die Umschlüsselung der einzelnen Rechnungen manuell vornehmen, sondern auch Informationen wie Arzt, Patient, versicherte Person (bei Mitversicherung), Leistungen und Diagnosen händisch erfassen, um sie weiterverarbeiten zu können. Das heißt, die Sachbearbeitenden sind einen Großteil ihrer Zeit mit dem Abtippen von Arztrechnungen befasst – was weder effizient noch für die Mitarbeitenden eine befriedigende Tätigkeit ist und darüber hinaus ein gesteigertes Fehlerpotenzial birgt.

Zusätzlich zum hohen Aufwand wird die Verarbeitung von Arztrechnungen zur Kostenerstattung für die Versicherungsträger dadurch erschwert, dass sich die Österreicher und Österreicherinnen immer häufiger dazu entschließen, einen Wahl- anstelle eines Kassenarztes zu besuchen. Jährlich steigt die Zahl der Rechnungen, die manuell erfasst und bearbeitet werden müssen um etwa 8 Prozent [IÖB]. Bei einer Bevölkerung von 8,9 Millionen rechnen die österreichischen Sozialversicherungen kurzfristig mit rund 7 Millionen Erstattungsfällen jährlich. Eine enorme Zahl, die die Mitarbeitenden der Versicherungsträger kaum stemmen können. Schon heute wird der Rückstau an offenen Erstattungsfällen täglich größer. Um den Prozess einfacher, effizienter und weniger ressourcenintensiv zu gestalten, musste eine neuartige Lösung gefunden werden.

KI statt Abtippen

Zentral gesteuert und koordiniert werden die IT-Aktivitäten der österreichischen Sozialversicherung seit 2004 von der IT-Services der Sozialversicherung (ITSV) GmbH, einer 100%igen Tochter der österreichischen Sozialversicherungsträger. Die ITSV begleitet dabei nicht nur fast 9 Millionen Versicherte ein Leben lang, sondern fungiert darüber hinaus mit ihren rund 800 Mitarbeitenden als Digitalisierungs-Enabler des österreichischen Gesundheitswesens. Dabei setzt das Technologieunternehmen neben einer Zusammenarbeit mit Start-Ups im Rahmen eines Innovations-Hubs auf innovative Projekte im Bereich künstliche Intelligenz (KI). Moderne Technologien sollten nun auch dabei helfen, die Kostenerstattung effizienter zu gestalten und den Sachbearbeitenden die Verarbeitung von Arztrechnungen zu erleichtern.

Dafür suchte der österreichische IT-Provider über einen aufwendigen Ausschreibungsprozess nach einem geeigneten Partner mit der entsprechenden Expertise. Schlussendlich fiel die Wahl auf das IT-Unternehmen Cloudflight, das mit europaweit rund 400 Software-Entwicklern, Data Scientists und KI-Experten bestens aufgestellt ist. „Die Ausschreibung der ITSV erstreckte sich über mehrere Runden“, erzählt Katrin Strasser, Senior Data Scientist und Natural Language Processing Engineer bei Cloudflight, die das Projekt von Beginn an begleitet und das Data-Science-Team geleitet hat. „Ausschlaggebend dafür, dass wir uns bei der finalen Angebotslegung gegen die anderen Firmen mit Rahmenvertrag durchgesetzt haben, war dabei neben unseren breit aufgestellten Kompetenzen in allen gefragten Bereichen und unserem agilen Ansatz vor allem ein ,Proof-of-Concept‘, den wir innerhalb von nur zwei Wochen entwickelt haben. Damit konnten wir schon vor Beginn des eigentlichen Projektes beweisen, dass der neuartige Ansatz, für den wir uns entschieden haben, funktioniert.“

Die Idee von Cloudflight: ein teilautomatisiertes System, das die für die Kostenerstattung erforderlichen Daten mithilfe von KI extrahiert, über Drittsysteme validiert und die so angereicherten Informationen den Sachbearbeitenden anschließend zur Bewertung des Falls präsentiert. Damit entfällt der zeitaufwendige, monotone Arbeitsschritt des manuellen Abtippens. Die Sachbearbeitenden erhalten einen aufbereiteten, mit ergänzenden Informationen aus Backend-Systemen angereicherten Fall, den sie nur noch prüfen, gegebenenfalls nachbearbeiten und anschließend freigeben müssen. Auch mit Einsatz des neuen Systems werden die Erstattungsfälle also nicht von der KI abgeschlossen, sondern stets von den geschulten und erfahrenen Mitarbeitenden der Sozialversicherungen.

Softwareentwicklung trifft KI-Entwicklung

Innerhalb von rund 18 Monaten hat Cloudflight zusammen mit der ITSV ein modulares System entwickelt, das den Sachbearbeitenden alle automatisierbaren Schritte im Kostenerstattungsprozess von Arztrechnungen abnimmt. Einzelne Prozessschritte wie Preprocessing, Text- und Entitätenerkennung kommunizieren dazu entkoppelt über Queues miteinander. Die dafür notwendigen automatischen Arbeitsschritte werden über Nachrichten in den Queues und Daten aus Datenbanken koordiniert. Dabei ist das System so aufgebaut, dass Verarbeitungsschritte in unterschiedlichen Systemen – wo immer möglich – parallel erfolgen und Folgeverarbeitungen anstoßen, sobald alle erforderlichen vorgehenden Schritte abgeschlossen sind. Das Ergebnis des Verarbeitungsprozesses wird den Mitarbeitenden über eine Weboberfläche angezeigt, die auch eine Nachbearbeitung oder Korrekturen erlaubt, bevor die Kostenerstattung an den Antragsteller erfolgt. Auf Wunsch der ITSV ist das neue System sowohl skalierbar als auch fehlertolerant gegenüber Ausfällen einzelner Instanzen. Das heißt, fällt eine der KI-Komponenten aus, können die Sachbearbeitenden problemlos weiterarbeiten.

„Gemeinsam mit dem IT-Team der ITSV, mit dem wir während der gesamten Entwicklung intensiv zusammengearbeitet haben, ist es uns gelungen, ein hoch skalierbares System zu schaffen, das große Datenmengen bewältigt“, fasst Strasser zusammen. „Darüber hinaus haben wir mehrere komplexe Verarbeitungsschritte mithilfe maschineller Texterkennung in Verbindung mit Inhaltserkennung über künstliche Intelligenz kombiniert.“ So wurde das System dahingehend trainiert, dass es unterschiedlich aufgebaute Dokumente klassifizieren und die für die Kostenerstattung relevanten Inhalte darin finden kann, um diese automatisch weiterzuverarbeiten.

Vom Scanner zum Sachbearbeiter

Zunächst werden die über den Postweg eingegangenen Schreiben über eine zentrale Stelle eingescannt oder abfotografiert. Sind die Rechnungen digitalisiert, beginnt der mehrstufige Verarbeitungsprozess über verschiedene Microservices hinweg:

Preprocessing: Eingescannte oder abfotografierte Dokumente sind für die Texterkennung oftmals nicht optimal dargestellt – sie sind schief, es sind Schatten zu sehen oder das Papier wurde gefaltet. Im Preprocessing werden die Bilddateien daher mithilfe diverser Bildverarbeitungsfilter zunächst für den nächsten Verarbeitungsschritt optimiert und „lesbar“ gemacht.

Optical Character Recognition (OCR): Im nächsten Schritt wird Optical Character Recognition angewendet, um die Symbole und Wörter auf dem Bild zu erkennen und sie für die nachfolgenden Microservices in Text umzuwandeln. In einem ersten Schritt ermittelt die Texterkennung dabei die Positionen im Dokument, an denen sich Text befindet, dann erfolgt die Mustererkennung. Der aus dem Bild extrahierte Text wird – jetzt als reiner Textblock – in maschinenlesbarer Form weitergeleitet und dem System so verfügbar gemacht.

Named Entity Recognition (NER): Im nächsten Prozessschritt geht es darum, die vordefinierten Entitäten, also jene Informationen, die erforderlich sind, um den Erstattungsfall abzuschließen, zu extrahieren und nach Zusammengehörigkeit zu clustern. Zur Named Entity Recognition (NER) setzt das neue System auf ein mithilfe von Beispieldaten trainiertes domainspezifisches neuronales Netz. Zu den erkannten Entitäten zählen derzeit:

  • Name und Fachgebiet des Arztes
  • Postleitzahl und Ort in Adressen
  • Patientenname und Versichertennummer
  • Leistungsinformationen (inkludiert den Leistungstext, einen zugehörigen Code sowie Datum und Anzahl)
  • Gesamtrechnungsbetrag
  • Diagnose

Parallel zur NER ermittelt das System zudem, ob sich handschriftliche Vermerke wie „Bitte auf dieses Konto überweisen“ oder Ähnliches auf der Rechnung befinden. Diese werden nicht ausgelesen; der Sachbearbeitende erhält jedoch einen entsprechenden Hinweis. Eine Ausnahme bilden von den Patienten handschriftlich vermerkte IBANs, die für die Kostenerstattung benötigt werden. Sie erkennt das System nicht nur, sondern liest sie auch entsprechend aus und stellt sie dem System zur Weiterverarbeitung zur Verfügung.

Position Relation Extraction: Sind die einzelnen Entitäten ermittelt, beginnt ein Algorithmus damit, die zusammengehörigen Entitäten anhand der Koordinaten der Positionen der Entitäten in verschiedene Cluster (z. B. Arztdaten, Patientendaten, Leistungsdaten) zu gruppieren. So hat das System unter anderem gelernt, dass eine Postleitzahl oder eine Adresse entweder zum behandelnden Arzt oder dem Patienten gehören muss. Auch die Leistungsdaten werden auf diese Weise in einzelne Leistungs-Cluster (Leistung – Datum – Anzahl) zusammengefasst.

Validation and Enrichment: Im letzten Prozessschritt werden die geclusterten Entitäten mit den eingebundenen Drittsystemen abgeglichen und um ergänzende Informationen angereichert. Dabei wird unter anderem der behandelnde Arzt mittels Name, Adresse und Fachgebiet über eine entsprechende Datenbank validiert, und ermittelt, ob Leistungen des Fachgebiets erstattungsfähig sind. Auch werden die Leistungstexte, die sich von Rechnung zu Rechnung unterscheiden, mit den vorliegenden Leistungskatalogen abgeglichen und die korrekte Bezeichnung nach Leistungskatalog ermittelt. So wird beispielsweise der Eintrag „Erste Ordination“ automatisch in „Grundleistungsvergütung“ umgeschlüsselt, wie es dem offiziellen Katalog entspricht. Auf die Katalogcodierung umgeschlüsselt werden auch die Diagnosen.

Technische Umsetzung

„Die Herausforderung bei diesem Projekt war vor allem die Vielfalt der über den Postweg eingesendeten Dokumente“, erklärt Strasser. „So verfügen die eingehenden Honorarnoten oder Zahlungsbelege weder über ein einheitliches Format noch sind die Wahlärzte verpflichtet, ein einheitliches Wording zu verwenden, das den Leistungskatalogen der Kassen entspricht. Erschwerend hinzu kommen handschriftliche Vermerke – wie IBANs oder ähnliche ergänzende Informationen.“

Statt in den eingescannten oder abfotografierten Rechnungen bestimmte, vorab aufgeteilte Textblöcke mittels Computer Vision zu tracken, wie es beim Auslesen von Daten aus Dokumenten üblich ist, entschied sich Cloudflight im vorliegenden Fall für einen anderen Ansatz. „Bei diesem Projekt gehen wir direkt vom Text aus. So umgehen wir einen Prozessschritt und damit eine potenzielle Fehlerquelle,“ sagt Strasser.

Um die vielfältigen Dokumente auszulesen, adaptierte das Team NER-Methoden für OCR-Text. Obwohl OCR-Techniken mittlerweile sehr gut funktionieren, treten dabei immer wieder Erkennungs- und Darstellungsfehler auf. Das gilt vor allem für längere Texte und Texte mit grafischen Elementen wie Tabellen oder Trennlinien. Da NER normalerweise auf Fließtext ausgelegt ist, musste das Modell für die Entitätenextraktion, das eigentlich für Chat-Bots verwendet wird, dahingehend angepasst werden, dass es neben häufigen OCR-Fehlern wie fehlenden oder falschen Buchstaben auch mit abgeschnittenen Textteilen, unvollständigen Sätzen, Einzelinformationen und Tabellen umgehen kann. „Als Basis für die KI-Bausteine nutzen wir hier, wie auch in unseren anderen Projekten, Open-Source-Bibliotheken, die wir entsprechend anpassen“, erklärt Strasser. „So sind wir stets auf dem neusten Stand der Technik und verhindern zudem, dass der Kunde über kurz oder lang von einem bestimmten Anbieter abhängig wird.“

Zusätzlich zur NER, mit deren Hilfe die benötigten Informationen aus den Texten extrahiert und die zusammengehörigen Entitäten ermitteln werden, nutzt das System Machine-Learning-Methoden und weitere KI-Bausteine wie Document Classification für die Unterscheidung der eingehenden Dokumente (Rechnung, ärztliche Überweisung, Zahlungsbestätigung, Sonstiges) sowie Object Detection, um zu erkennen, ob sich ein handschriftlicher Vermerk, eine Unterschrift, eine IBAN oder ein Stempel auf dem Dokument befindet. Mittels Object Detection & Recognition ist es dem System zudem möglich, handschriftlich ergänzte IBAN-Nummern auszulesen (Ziffer und Ländercode).

Um die KI entsprechend zu trainieren, wurde mit einem Trainings-Set mit 5.000 Fällen und einem Test-Set gearbeitet, das aus 2.000 Fällen bestand. Um zu gewährleisten, dass die KI-Komponenten in der Lage sind, auch Dokumente zu verarbeiten, die völlig neu für das System sind, musste ein Overfitting verhindert werden. „Damit das System auch im Live-Betrieb mit unbekannten Dokumenten arbeiten kann, war es besonders wichtig, zu gewährleisten, dass die KI gut generalisiert. Sonst hätte sie mit zukünftigen Daten nicht funktioniert“, erklärt Strasser. Hierfür setzte das Team auf mehrere verschiedene Test- und Trainingssets, zwischen denen es keine inhaltlichen Überschneidungen gab.

Während der gesamten Entwicklungszeit wurde die Anwendung fortwährend gegen verschiedene Kennzahlen geprüft, um festzustellen, wie sich Änderungen am System auf die Erkennungszuverlässigkeit sowohl der Einzelkomponenten als auch des Gesamtsystems auswirken. „Ergänzend zu diesem Vorgehen haben wir mit den Usern End-to-End-Tests erstellt und mit ihrer Hilfe auch das System getestet und Feedback eingeholt. Schließlich bringt selbst das beste System nur etwas, wenn die Anreicherungs- und Matching-Prozesse zu verwertbaren Ergebnissen führen“, so Strasser. Dazu haben die Sachbearbeitenden ein Test-Set zusammengestellt. Mit Unterstützung der End User wurden die Ergebnisse anschließend gegen die – zuvor abgefragten – erwarteten Ergebnisse geprüft. „Die Möglichkeit, so eng mit den späteren Nutzern zusammenzuarbeiten, war wirklich ein großer Gewinn für uns. So konnten wir Resultate erzielen, von denen die Sachbearbeitenden im Arbeitsalltag wirklich profitieren.“

Im Testbetrieb seit April 2020

Das neue System mit KI-Komponenten befindet sich bereits seit April 2020 in Wien im Testbetrieb. Mittlerweile werden täglich rund 1.000 Fälle darüber abgearbeitet. Trotz anfänglicher Skepsis sind die Sachbearbeitenden, die das System bereits nutzen, äußerst zufrieden mit der Lösung. Die neue Software ermöglicht es ihnen mit vielfach höherem Tempo und weniger repetitiver Arbeit, Kostenerstattungen von Arztrechnungen zu bearbeiten. Auch das neue, moderne User Interface wird von ihnen geschätzt.

Mussten die Sachbearbeitenden bisher alle Arztrechnungen, die auf dem Postweg eingingen, manuell verarbeiten, erhalten sie nun ein mittels KI ein vorverarbeitetes und um ergänzende Informationen angereichertes Formular, das sie nur noch prüfen und freigeben müssen. Selbst für einen möglichen Ausfall der KI-Komponenten ist vorgesorgt. Das System von Cloudflight ist so angelegt, dass die Mitarbeiter die Honorarnoten im System auch ohne KI-Unterstützung bearbeiten können. Derzeit wird das neue teilautomatisierte Kostenerstattungssystem für Arztrechnungen auch bei Trägern in weiteren Bundesländern eingeführt.

Fazit

Gemeinsam haben ITSV und Cloudflight ein KI-System entwickelt, das die Sachbearbeitenden bei der Wahlarztkostenerstattung einiger österreichischer Krankenkassenträger unterstützt. Eingehende Wahlarztrechnungen werden nun digitalisiert, verarbeitet und digital archiviert. Dabei werden wichtige Informationen wie Arzt, Patient, Versicherungsnummer und Leistung automatisch extrahiert und gegen Daten aus Bestandssystemen geprüft. So entfällt das zeitaufwendige manuelle Abtippen und die Mitarbeitenden können sich auf das Prüfen der Fälle und die anschließende Kostenerstattung konzentrieren.


Mehr Artikel

Gregor Schmid, Projektcenterleiter bei Kumavision, über die Digitalisierung im Mittelstand und die Chancen durch Künstliche Intelligenz. (c) timeline/Rudi Handl
Interview

„Die Zukunft ist modular, flexibel und KI-gestützt“

Im Gespräch mit der ITWELT.at verdeutlicht Gregor Schmid, Projektcenterleiter bei Kumavision, wie sehr sich die Anforderungen an ERP-Systeme und die digitale Transformation in den letzten Jahren verändert haben und verweist dabei auf den Trend zu modularen Lösungen, die Bedeutung der Cloud und die Rolle von Künstlicher Intelligenz (KI) in der Unternehmenspraxis. […]

News

Richtlinien für sichere KI-Entwicklung

Die „Guidelines for Secure Development and Deployment of AI Systems“ von Kaspersky behandeln zentrale Aspekte der Entwicklung, Bereitstellung und des Betriebs von KI-Systemen, einschließlich Design, bewährter Sicherheitspraktiken und Integration, ohne sich auf die Entwicklung grundlegender Modelle zu fokussieren. […]

News

Datensilos blockieren Abwehrkräfte von generativer KI

Damit KI eine Rolle in der Cyberabwehr spielen kann, ist sie auf leicht zugängliche Echtzeitdaten angewiesen. Das heißt, die zunehmende Leistungsfähigkeit von GenAI kann nur dann wirksam werden, wenn die KI Zugriff auf einwandfreie, validierte, standardisierte und vor allem hochverfügbare Daten in allen Anwendungen und Systemen sowie für alle Nutzer hat. Dies setzt allerdings voraus, dass Unternehmen in der Lage sind, ihre Datensilos aufzulösen. […]

Be the first to comment

Leave a Reply

Your email address will not be published.


*