Enterprise Content Management: Die digitale Poststelle

Immer mehr Unternehmen und Organisationen richten eine digitale Poststelle ein und geben die Eingangspost nur noch elektronisch in Umlauf. Diese Entwicklung nimmt zwar Fahrt auf, hat aber noch zahlreiche Herausforderungen zu meistern. Lesen Sie, was nach dem Stand der Technik bereits möglich ist und wie die ehrgeizigen Ziele erreicht werden können. [...]

Von einem verbindlich definierten Begriff kann im Zusammenhang mit der „digitalen Poststelle“ noch keine Rede sein. Viele Experten und Anwender von Dokumenten-Management Systemen (DMS) verstehen bereits die „normale“ Scanstelle als digitale Poststelle, falls dort der Posteingang digitalisiert und über elektronische Postkorbsysteme zu den Sachbearbeitern weitergeleitet wird.
Andere Anwender, die vielleicht noch kein DMS einsetzen, fassen die digitale Poststelle weiter und setzen den Begriff mit einem anderen ebenso wenig definierten Terminus gleich, der sogenannten Mailroom-Lösung. Hierunter versteht man in der Regel, dass jeglicher Dokumenteneingang in der Poststelle zentral aufgenommen und anschließend digital in die Fachabteilungen verteilt wird, egal, aus welcher Quelle er stammt beziehungsweise auf welchem Wege er übermittelt wurde. In diesem weiter gehenden Verständnis ist der Posteingang somit nicht auf die Papierpost begrenzt, sondern umfasst alle Medien und Verfahren, die bearbeitungsrelevante Dokumente zustellen, in vorderster Front E-Mail, aber auch Fax-Eingang und Datenübermittlungen wie EDI sowie andere elektronische Datenaustauschverfahren.
HERAUSFORDERUNGEN IM FRÜHEN PAPIEREINGANG-SCANNEN
Das frühe Scannen des gesamten Papiereingangs stellt zunächst zahlreiche Herausforderungen an Unternehmen. Auf der organisatorischen Seite gibt es wesentliche Fragen zu klären, beispielsweise nach welchen fachlichen Kriterien der Dokumentenzuschnitt erfolgen soll oder ob der Anhang als separates Dokument oder als Folgeseiten des Anschreibens gescannt werden soll.
Zudem gilt es zu klären und zu organisieren, wo das Papier im Anschluss an die Scanverarbeitung gelagert werden soll. Diese Aufgabe ist wichtig, wenn beispielsweise ein spürbarer Anteil der Post noch im Original benötigt wird – wie etwa Kundenunterlagen, die wieder zurückgesendet werden müssen. Anwender müssen definieren, für welchen Zeitraum die Lagerung der Originale vorzusehen ist: Zunächst sind diejenigen Unterlagen, die dauerhaft aufbewahrt werden sollen, von den zu vernichtenden Unterlagen zu trennen und anschließend in eine entsprechende Lagerstätte zu transportieren. Häufig kommen für die Trennung Regeln zum Einsatz, die von der Klassifizierung der Dokumente abhängig sind, wie zum Beispiel „Verträge 10 Jahre aufbewahren, Korrespondenz nach kurzer Zwischenlagerung vernichten“.
Werden die Dokumente jedoch erst nach dem Scanvorgang klassifiziert, dann müssen die gescannten Unterlagen nachträglich in den aufzubewahrenden und den zu vernichtenden Teil getrennt werden, eine relativ mühselige und fehlerträchtige Tätigkeit. Insgesamt wachsen durch das frühe Scannen die Anforderungen an die Post- beziehungsweise Scanstelle deutlich. Es wird dort ein erweitertes Verständnis für die Sachbearbeitung verlangt. Damit wächst die Verantwortung der Mitarbeiter in diesem Bereich teilweise deutlich.
NUTZEN AUTOMATISCHER ERKENNUNG
Das frühe Scannen allein bietet Anwenderunternehmen den Vorteil, die Eingangspost schneller durch die Bearbeitung schleusen zu können und bereits frühzeitig eine hohe Auskunftsfähigkeit herbeizuführen. Wenn Daten innerhalb der Eingangsbearbeitung zudem automatisch erkannt werden, lassen sich überdies Dateneingaben sowohl im Dokumentenerfassungsprozess sowie in der eigentlichen Sachbearbeitung einsparen. Das gelingt dank erstaunlich leistungsfähiger Erkennungsprodukte (auch „Capture“-Produkte genannt) heute erheblich besser als noch vor wenigen Jahren.
Lassen sich alle benötigten Vorgangsdaten aus dem Dokumenteninhalt ermitteln, erfolgt immer häufiger eine vollautomatische fachliche Bearbeitung, die sogenannten „Dunkelverarbeitung“. Diese Variante bietet natürlich das höchste Einsparpotenzial, bedingt aber besonders gute Erkennungsraten und Sicherheit in der Datenermittlung. Das ist mit heutiger Technik nur für einige vollständig strukturierte Formulare und für wenige zumindest halbwegs strukturierte Dokumente, wie manche Rechnungen, erreichbar.
ZWEI HAUPTAUFGABEN: KLASSIFIZIERUNG UND DATENERMITTLUNG
Für eine geordnete DMS-Ablage und Zuleitung früh gescannter Unterlagen zum zugehörigen Sachbearbeiter müssen in der Regel zwei unterschiedliche Arten fachlicher Zuordnungen stattfinden: Zunächst ist das Dokument in eine vorgegebene Dokumentenklasse einzuordnen („Vertrag“, „Bestellung“, „Rechnung“, etc.). Anschließend sind die zugehörigen Suchkriterien abhängig von der Dokumentenklasse zu ermitteln, beispielsweise bei Bestellungen die Bestellnummer und der Debitor, bei Rechnungen die Rechnungsnummer und der Kreditor.
Erfassungslösungen stellen daher für diese beiden Aufgabenstellungen häufig separate Anwendungsmodule bereit. Diese Trennung ist sinnvoll, denn längst nicht in allen Erfassungsumgebungen werden beide Funktionen – die Klassifizierung und die Datenermittlung – benötigt. So kann eine Vorsortierung von Papierunterlagen, zum Beispiel das Bilden von Rechnungsstapeln, eine elektronische Klassenermittlung unnötig machen, wenn die Dokumentenklasse (hier: Rechnung) direkt bei der Stapelanlage angegeben wird. Basis jeglicher Erkennung ist in den meisten Fällen die vorherige Wandlung der Bildinhalte in Text, die mittels OCR-/ICR-Technik (Optical / Intelligent Character Recognition) erfolgt.
DOKUMENTENKLASSE ERMITTELN
Für die automatische Ermittlung der Dokumentenklasse kommen zumeist „Trainings“-Verfahren zum Einsatz. Hierfür stellt ein Fachadministrator zunächst eine Trainingsmenge gescannter Unterlagen mit vorgegebener Dokumentenklassenzuordnung zur Verfügung. Im Rahmen des automatisch ablaufenden Trainings ermittelt das Capture-System dann eigenständig Regeln zur Unterscheidung der einzelnen Dokumentenklassen, die es je nach Produkt aus den Layout- und Textinformationen der bereitgestellten Dokumente ableitet.
Einige Produkte erlauben dem Administrator, anschließend durch Customizing oder Programmierung zusätzlich Einfluss auf die Regelverarbeitung zu nehmen. Manche Systeme sind überdies mit einer dynamischen Lernfunktion ausgestattet, die Korrektureingaben der Anwender überwacht und selbstständig das Regelwerk im laufenden Betrieb anpasst. Hierdurch erhöht sich zwar die Flexibilität der Regelpflege enorm, allerdings wird es für die Anwender immer schwieriger nachzuvollziehen, welche Einstellungsänderung welche Erkennungswirkung hervorruft. Gerade wenn sich die Erkennungsleistung verschlechtert, ist das jedoch besonders wichtig.
DIE VORGABEN BESTIMMEN DEN ERFOLG
Ein großer Erfahrungsschatz hilft dabei, die Dokumentenklassen festzulegen und die Trainingsmengen richtig zusammenzusetzen. Denn ungünstig gestaltete Klassifizierungsanforderungen verhindern einen hohen Automationsgrad. Bei unzureichenden Erkennungsraten sind häufig nicht nur die Produkteinstellungen, sondern gegebenenfalls auch die Trainingsdokumente und der Klassifizierungsrahmen anzupassen.
Bei der produktiven Eingangsbearbeitung wenden die Erkennungslösungen die Klassifizierungsregeln an und ermitteln Wahrscheinlichkeiten für die Zuordnung des einzelnen Dokuments zu den verschiedenen trainierten Dokumentenklassen. Über teilweise einstellbare Schwellwerte wird entschieden, ob die ermittelte Dokumentenklasse ungeprüft übernommen oder ob eine von einem Bediener besetzte Korrekturfunktion angesteuert wird.
In vielen Fällen besteht die Unsicherheit darin, ob das Dokument einer Klasse A oder der alternativen Klasse B zuzuordnen ist. Bei der Schwellwertvergabe für die automatische Entscheidung kann der Administrator daher in einigen Systemen festlegen, wie hoch die Mindestwahrscheinlichkeit für die Zuordnung zur Klasse B ausfallen muss und in manchen Systemen auch, wie groß die Differenz zwischen den Zuordnungswahrscheinlichkeiten zwischen A und B liegen muss, um eine „sichere“ Entscheidung zu treffen.
NIE SICHER – IMMER NUR WAHRSCHEINLICH
Diese auf Wahrscheinlichkeiten beruhende Entscheidung kann allerdings dennoch falsch sein – man spricht dann von einer „False Positive“-Zuordnung. Solche Fehlzuordnungen können indes gravierende Auswirkungen haben: Im harmlosesten Fall gelangt das Dokument zum „falschen“ Bearbeiter, der eine Korrektureingabe tätigen und hiermit die Zuleitung zum zuständigen „richtigen“ Sachbearbeiter initiieren muss. In ungünstigeren Fällen gelangt das Dokument beispielsweise aber gar nicht erst in die Bearbeitung und bleibt in der falschen Akte liegen oder ein besonders schützenswertes Dokument könnte Mitarbeitern zugänglich werden, die fachlich gar nicht zugriffsberechtigt sind.
Als Nebenbedingung für die automatische Klassifizierung ist für viele Anwender daher wichtig, „False Positive“-Entscheidungen tunlichst zu vermeiden. Hierfür eignen sich einerseits die in den Produkten enthaltenen manuellen Prüffunktionen sowie die fachliche Aufteilung der Dokumente in möglichst eindeutig erkennbare Klassen.
SUCHKRITERIEN ERMITTELN
Für die zweite Erkennungsaufgabe, die Ermittlung von Recherche- und Fachdaten, verwenden die Lösungen für Formulare zumeist positionsbezogene Datenermittlungsverfahren und für semi-strukturierte Dokumente wie Rechnungen und Bestellungen komplexere Text-, Phrasen- und Datensuchverfahren. Positionsbezogene Datenermittlungsverfahren liefern heutzutage bei guten Vorlagen bereits sehr hohe Erkennungsraten – allerdings muss der Administrator in den meisten Systemen für alle Formulare und für alle Formularvarianten angeben, an welcher Position welche Daten auszulesen sind. Hierdurch entsteht ein hoher Pflegeaufwand, der sich nur bei einem entsprechend hohem Formularaufkommen rechnet.
Die Datenermittlungsaufgabe ist für semi-strukturierte Dokumente erheblich komplexer als für Formulare: In diesen Lösungen muss die Erfassungsanwendung eigenständig die gesuchten Informationen finden und sucht hierbei beispielsweise zunächst nach Begriffen wie „Bestellung“ oder „Bestellnummer“ in allen möglichen Schreibweisen sowie deren Synonyme, um im Umfeld dieses Begriffs im nächsten Schritt die Bestellnummer zu ermitteln, auf die sich die Rechnung bezieht. Um fachliche Fehler, insbesondere Fehlzuordnungen, zu vermeiden, wird in Scan-Umgebungen typischerweise auf Fachdaten zurückgegriffen. Hierfür werden die Indexier-Anwendungen mit Prüfroutinen und Nachschlagetabellen versehen, die es der Lösung erlauben, die Einheit der Dokumenteninhalte mit den zum Dokument vergebenen Schlüsselzuordnungen (Kunde, Lieferantennummer, etc.) und weiteren Zuordnungsdaten, wie Name und Adresse, abzugleichen.
DIE RICHTIGE LÖSUNG FINDEN
Bei der Auswahlentscheidung für eine bestimmte Erkennungslösung muss daher immer auch die Möglichkeit zur Datenintegration berücksichtigt werden, die am besten über eine vom Hersteller mitgelieferte Standardfunktion bereitgestellt wird. Die Schnittstelle sollte bi-direktional gestaltet sein, denn einerseits nutzt die Erkennungslösung bestehende Fachdaten für die Verifizierung ermittelter Daten, und andererseits stellt die Lösung erkannte Daten für die Fachanwendung bereit. Für gängige Fachdaten- und ERP-Systeme, insbesondere für SAP, bieten die Hersteller von Erkennungssystemen häufig Standard-Schnittstellen an.
VORKONFIGURIERTE LÖSUNGEN
Für einzelne Anwendungsbereiche, wie die Rechnungseingangsbearbeitung, werden heute zumeist vorkonfigurierte Lösungen im Markt angeboten. Wesentlicher Bestandteil sind dabei Erfassungsfunktionen, die bereits auf typische Belegarten wie Rechnungen und Gutschriften trainiert sind. Daher kennen diese Anwendungen in der Regel den typischen Grundaufbau bestimmter Dokumentenarten und sind darauf eingerichtet, typische Dokumentendaten wie Teil- und Gesamtbeträge, Mehrwertsteuer-Sätze und -Beträge sowie Steuernummern und Bankverbindungen eigenständig zu ermitteln.
Zu den besonderen Herausforderungen der Rechnungsdatenerkennung gehören, die Kreditoren zu ermitteln sowie Rechnungseinzelposten automatisch zu erkennen. Die Kreditorenermittlung gestaltet sich umso schwieriger, je mehr Adress- und Firmendaten auf einer einzigen Rechnung zu finden sind, was zum Beispiel bei Rechnungen von Unternehmen größerer Konzerne häufiger der Fall ist.
Die Rechnungseinzelpostenerkennung stellt deshalb eine Herausforderung dar, weil es keine einheitliche (Tabellen-)Struktur von Rechnungsposten gibt und die einzelnen Rechnungsposten für die Erkennungssoftware schwierig voneinander abzugrenzen sind, da sie sich über mehrere Zeilen erstrecken können.
Was das menschliche Auge schnell als zusammengehörig erkennt, kann für eine automatisierte Erkennung zu einer echten Herausforderung werden. Dies gilt auch häufig für die Bankverbindungsdaten, die vornehmlich im Fußbereich klein gedruckt bei einigen Rechnungen vertikal und bei anderen Rechnungen horizontal tabellarisch aufgeführt sind.
FACHFUNKTIONEN ERWEITERN DIE LÖSUNGEN
Zumeist enthalten Rechnungseingangslösungen neben Erkennungsfunktionen auch Postkorb- und Fachfunktionen, wie zum Beispiel das Rechnungseingangsbuch. Diese Fachlösungen bieten den Unternehmen daher häufig einen besonders schnellen, fachspezifischen Einstieg in die digitale Posteingangsbearbeitung. Gleichzeitig verbessert sich damit die Übersicht über laufende Prozesse und Außenstände.
Vorkonfigurierte Erkennungslösungen werden zunehmend auch für weitere Fachfunktionen angeboten, wie zum Beispiel für das Bestellwesen oder die Personal- und Vertragsverwaltung. Allerdings ist das Angebot für die elektronische Eingangsrechnungsbearbeitung derzeit am weitesten ausgebaut.
Viele Anwender sind der Meinung, dass die automatisierte Verarbeitung des E-Mail-Posteingangs mit sogenannten Mailroom-Lösungen erheblich einfacher funktionieren sollte als die potenziell fehlerbehaftete Umwandlung von Papierunterlagen mittels OCR sowie die anschließende Extraktion von Fachdaten aus diesen Dokumenten. Tatsächlich müssen Anwender jedoch auch erhebliche Hürden nehmen, um E-Mails automatisch zu klassifizieren, Schlüssel zu ermitteln und Daten auszulesen. Die Schwierigkeiten liegen einerseits darin, dass es praktisch keine verbindlichen Dateiformate und Layoutvorgaben für E-Mails gibt. Zudem kann die elektronische Post durch enthaltene Dateianhänge eine bisweilen sehr komplexe Struktur aufweisen. Darüber hinaus erfolgt die Korrespondenz per E-Mail häufig erheblich individueller und unvollständiger als per Briefpost, so dass Sachverhalte und Zusammenhänge in E-Mails vielfach nicht klar ausgeführt sind, da sie parallel bereits über einen anderen Kommunikationskanal ausgetauscht wurden.
POSTVERTEILUNG: VON DER SCANSTELLE IN DIE SACHBEARBEITUNG
Funktionen für die Postverteilung und den Postkorbzugriff werden zwar in den angesprochenen Rechnungsverarbeitungslösungen häufig mitgeliefert, reine Capture-Lösungen enthalten solche Funktionskomponenten in der Regel jedoch nicht. Zu Recht gehen die Anbieter von Capture-Lösungen davon aus, dass es für diese Aufgabenstellungen bereits etablierte, häufig auf das jeweils eingesetzte DMS bezogene Postkorblösungen gibt, für die eine Anbindung sinnvoller ist als die Schaffung eines Postkorb-Konkurrenzproduktes.
Für Anwenderunternehmen bedeutet die Einführung der digitalen Poststelle allerdings, dass sie neben der Erfassungsfunktion zusätzlich eine Postkorbfunktion inklusive Dokumentenverteilung benötigen. Während die Anwender das Zuordnungsregelwerk für Eingangspost in fast allen Projekten zunächst als trivial einstufen, wird das Ausmaß der Komplexität häufig erst im weiteren Projektverlauf deutlich. Gruppen- und rollenbezogene Postkörbe sollen dann häufig die Anwendung unabhängig von der Verfügbarkeit einzelner Personen gestalten. Allerdings besteht auch in diesen Umgebungen die Notwendigkeit zu überwachen, ob die Gruppen beziehungsweise Rollen überhaupt besetzt sind und die zugeordnete Eingangspost auch abgearbeitet wird. Hier helfen Postkorblösungen, die neben der reinen Zustellfunktion flexible Verteilfunktionen bieten und bestehende Postkorbinhalte nicht aus dem Auge verlieren.
WESENTLICHE NICHT-FUNKTIONALE ANFORDERUNGEN
Auf der technischen Seite erfordert die digitale Posteingangsbearbeitung zugleich erheblich höhere Systemressourcen – einerseits für die automatisierten Erfassungsaufgaben und andererseits für die erhöhte Zugriffslast, die das DMS-/Postkorbsystem bedienen muss. Bedingt durch die elektronische Bereitstellung der Unterlagen finden in Postkorblösungen bereits während der Sachbearbeitung zahlreiche Dokumentenzugriffe auf die Eingangspost statt, die dann in den nachgelagerten Archivierungsumgebungen entfallen.
Im Bereich der Erfassungslösungen besteht in der Regel ständiger Optimierungsbedarf. Um die hierfür notwendigen Konfigurationsänderungen sicher in die Produktionsumgebung einspielen zu können, ohne hierbei Einbußen in der bestehenden Produktion hinnehmen zu müssen, sind Test- und Change-Verfahren sowie deren systemtechnische Unterstützung von besonders hoher Bedeutung.
Zudem gilt es, durch geeignete technische Maßnahmen sicherzustellen, dass die Erfassungs- und Postkorb-Lösung ständig verfügbar ist. Fällt diese aus, lässt sich die Eingangspost nicht bearbeiten und die Sachbearbeiter drehen Däumchen. In einigen Kundenumgebungen ist es überdies wichtig, dass die Erfassungslösung unterschiedliche Verarbeitungskanäle bereitstellt und über Priorisierung ermöglicht, dass einzelne Kanäle, wie zum Beispiel der Faxeingang, zu einer unmittelbaren Erkennung geleitet werden, vergleichbar der Schnellkasse im Supermarkt.
FAZIT
Wesentlicher Faktor für den Erfolg bei der Einrichtung einer digitalen Poststelle ist, den Automatisierungsumfang realistisch einzuschätzen und zu planen. Unternehmen sollten ihre Ausgangspost dahingehend analysieren, welche Schreiben und Formulare vom Partner ausgefüllt zurückgesendet werden sowie diese mit einem Barcode oder QR-Code versehen. In der digitalen Poststelle können diese Markierungen mit besonders hoher Sicherheit eine Klassifizierung unterstützen und gegebenenfalls auch zur Datenermittlung genutzt werden.
Für die Auswahl der „richtigen“ Lösung sind außerdem die gesamten Dokumenteneingänge zu analysieren sowie möglichst griffige Klassendefinitionen zu finden, wobei die Zuordnungen aus den Dokumenteninhalten möglich sein sollten. Um Lösungen geordnet vergleichen zu können, hat es sich bewährt, Anforderungskataloge mit den wesentlichen geforderten Funktionskomponenten zu verwenden – auch wenn diese noch keine Antwort auf die Frage bieten können, welche Erkennungsraten die einzelnen Produkte tatsächlich liefern. Die Abschätzung der tatsächlichen Erkennungsraten erfolgt in vielen Projekten auf Basis von Teststellungen. Doch aufgepasst – die ordentliche Planung und Durchführung von Erkennungstests erfordert einen hohen Vorbereitungs-, Durchführungs- und Auswertungsaufwand.
Die digitale Poststelle ist zu Recht auf dem Vormarsch. Auf dem Markt gibt es inzwischen zahlreiche Lösungsangebote, die teilweise unter Verwendung gänzlich unterschiedlicher Techniken arbeiten. Einige Lösungen gehen über reine Erfassungsfunktionen hinaus und unterstützen eine weitergehende Postkorbbearbeitung sowie Fachfunktionen. Mit geeigneten Werkzeugen und dem richtigen Vorgehen finden Anwender die passende Lösung, die sowohl die funktionalen als auch die nicht-funktionalen Anforderungen abdeckt und deren Beschaffungs- und Betriebskosten in einer wirtschaftlichen Relation zum Automatisierungserfolg stehen.
* Volker Halstenbach ist Redakteur der deutschen Computerwoche.