Daten und Dokumente – einmal hin und zurück

Mit dem Wechsel von rein physischem zu elektronischem Versand ist das Ziel einer modernen Dokumentenlogistik noch lange nicht erreicht. Letztlich geht es um den direkten Austausch von Rohdaten über eine zentrale Output-Instanz. [...]

Wie sieht die klassische Dokumentenverarbeitung heute aus? Da werden zunächst aus den Fachan-wendungen die Rohdaten eines Vorgangs in für den Menschen lesbare Inhalte umgewandelt (Composition), dann formatiert, also als A4-Dokument aufbereitet, gedruckt und schließlich an den Empfänger geschickt. Dort geht es dann den gesamten Weg zurück, also Scannen, Analy-se/Texterkennung per OCR (Optical Character Recognition), de-Formatieren des Dokuments und schließlich das Extrahieren der Rohdaten.

Oder: Digitale Dokumente, die an sich von Maschinen gelesen und verarbeitet werden könnten, bringt man erst in eine analoge Form (Druck) und wandelt sie in TIF- oder JPG-Dateien um. Aus Content entstehen also »Pixelwolken«. Der eigentliche Inhalt wird erst verschlüsselt (Rasterbilder) und dann wieder mittels OCR »lesbar« gemacht. Das ist nicht nur umständlich, sondern geht mit dem Verlust von semantischen Strukturinformationen einher, die für eine spätere Wiederverwendung notwendig sind.

Das Problem: Dieser Weg orientiert sich am Seitenformat A4. Es eignet sich zwar für Druck, Fax und Archiv – wohl aber kaum für mobile Endgeräte und fürs Web. Viel besser wäre es doch, nur die Rohdaten zu transferieren. Mit anderen Worten: Erstellung und Versand eines Dokuments müssen außerhalb der jeweiligen Fachanwendung stattfinden. Das heißt: Die Wahl der Seitengröße und des Ausgabekanals erfolgt nicht in der Fachanwendung, sondern von ihr losgelöst zu einem viel späteren Zeitpunkt als es heute allgemein üblich ist.

IST PDF-VERSAND NOCH ZEITGEMÄSS?
Sicher ist die Umstellung auf den inzwischen allgemein üblichen elektronischen PDF-Versand ein wichtiger Schritt, um den eingangs beschriebenen Kreislauf »abzukürzen«. Es ist aber eben nur ein Anfang. Denn was nützt ein PDF-Dokument, wenn ihm keine Metadaten für die mehrkanalfähige Aufbereitung beigegeben werden? Gut: Technologien wie XMP und ZUGFeRD sind gerade deshalb entwickelt worden, um Metadaten in einem elektronischen Dokument zu hinterlegen, sie auf Empfängerseite automatisch auszulesen und in die jeweilige Fachanwendung (ERP, CRM, etc.) zu übernehmen.
Auf diese Weise soll die Automatisierung in der Dokumentenverarbeitung weiter forciert werden. Doch das Ende der Fahnenstange ist damit noch lange nicht erreicht – zumal auch PDF auf A4 basiert und daher für den Versand zum Beispiel auf mobilen Endgeräten wieder mühsam de-formatiert werden muss. Es wäre hier also nicht viel gewonnen, denn gerade Prozesse wie De-Formatierung und »De-Composition« sind komplex  und meist nur mit teuren Tools machbar.

DREHSCHEIBE FÜR DATEN
Wie sieht also die Dokumentenverarbeitung der Zukunft aus? Die eleganteste Methode ist zweifelsohne, eine Schnittstelle zu den reinen Daten zu schaffen, losgelöst von Seitenformat, Layout und Kanal. Denn nur so lassen sich Dokumente jedes Typs und Formats auch wirklich für alle digitalen und physikalischen Kommunikationswege effizient aufbereiten. Für Unternehmen bedeutet das: Sie müssen Erstellung und Versand voneinander trennen und eine zentrale Dokumenten- und Output-Management-Instanz etablieren. Diese »Drehscheibe« entscheidet auf Grund von definierten Regeln und Kriterien der Fachabteilungen (beispielsweise Vertrieb, Marketing oder Service), welche Daten in welchem Layout und Format auf welchem Kanal ausgegeben werden; natürlich immer bezogen auf den jeweiligen Empfänger.

Diese Zentralisierung hat nicht nur den Vorteil, dass der Sachbearbeiter entlastet wird – schließlich soll er sich auf sein Kerngeschäft konzentrieren. Vielmehr bekommt man einen zu-verlässigen Überblick darüber, welche Dokumente das Unternehmen in einem bestimmten Zeitraum verlassen haben. Das kann man dann natürlich nach verschiedenen Kriterien selektieren. Dieses Monitoring ist ein nicht zu unterschätzender Nutzen, denn viele Firmen wissen nicht genau, wie viel insgesamt gedruckt, gefaxt und elektronisch versendet wird. Was fehlt, ist der 360-Grad-Blick im Dokumenten-Management.

EMPFÄNGER UND VORGANG BESTIMMEN DEN KANAL
Streng genommen bedeutet Multi-Channel-Kommunikation also die Loslösung von einem bestimmten Seitenformat, damit jedes Dokument auf jedem Kanal ohne teure Umwege wie De-Formatierung, etc. ausgegeben werden kann. Denn heute kommunizieren Kunden ja auf unterschiedlichen Kanälen mit einem
Unternehmen: So will Herr X beispielsweise seine Versicherungspolice nach wie vor als Papierdokument haben, seine monatliche Abbuchungsmitteilung aber als E-Mail-Anhang oder am besten gleich auf sein Smartphone.
Mit anderen Worten: Die Wahl des jeweiligen Versandmediums wird bei jedem Geschäftsvorgang neu entschieden. Und das kann eben nur in einer zentralen Verarbeitung erfolgen, in der alle dokumentenbezogenen Kommunikationswege zusammenlaufen; zumal man damit auch flexibler bei der Anbindung neuer Kanäle ist.

In diesem Zusammenhang hat HTML5 der modernen Dokumentenverarbeitung sicher den Weg bereitet. Die textbasierte Auszeichnungssprache gibt schon heute auf mobilen Plattformen wie iPhone, iPad und Android-Geräten den Ton an. Kein Wunder: Inhalte in HTML5 können problemlos für alle elektronischen Ausgabekanäle aufbereitet werden, für Smartphone & Co. genauso wie als Webseite. Und wer es trotzdem weiter gedruckt mag – diese Option bleibt ja nach wie vor.
Auch die Konvertierung in PDF-Dateien ist pro­blemlos möglich.
HTML5 ist derzeit das intelligenteste Format für die größen- und kanalunabhängige Erstellung und Darstellung von Dokumenten. Es ermöglicht eine dynamische, größenabhängige Darstellung, beispielsweise von A4 zum Smartphone-Display, die Konvertierung beliebiger Layouts in textorientierte Formate, die Extraktion von Einzeldaten (u.a. Rückgewinnung von Rechnungspositionen) und den Aufbau von Inhaltsverzeichnissen und Indexlisten.

Fakt ist: In Zeiten von Multi Channel ist das »Malen« von A4-Seiten mittels Page Composition Tools der falsche Weg, weil das Ziellayout alles zwischen zwei und 24 Zoll sein kann. Stattdessen sollte man in eine Dokumentenlogistik investieren, die in der Lage ist, die Daten der jeweiligen Fachanwendung entgegenzunehmen und sie empfänger- und kanalgerecht aufzubereiten. Gefragt ist also eine IT, die den gesamten Kreislauf der Dokumentenbewirtschaftung in einem zentralen System abbildet, und zwar für alle Applikationen, die Dokumente produzieren. Dazu hinterlegt man mittels Geschäftslogik klar definierte Regeln für das Corporate Design, die Ausgabeformate und die Behandlung von Metadaten.

Dabei wird die Frage, was Daten und was Dokumente sind, immer wichtiger. Nicht immer ist dabei eine klare Grenze zu ziehen, doch sollte man sich im Klaren darüber sein: Je weiter die Entscheidung über den Ausgabekanal in der Dokumentenlogistik nach hinten rückt bzw. je stärker Geschäftsvorgang und Erstellung voneinander getrennt sind, desto flexibler bleibt man als Unternehmen.   

* Der Autor Stefan Wagner ist Regional Manager Compart Northern Europe.


Mehr Artikel

News

Bad Bots werden immer menschenähnlicher

Bei Bad Bots handelt es sich um automatisierte Softwareprogramme, die für die Durchführung von Online-Aktivitäten im großen Maßstab entwickelt werden. Bad Bots sind für entsprechend schädliche Online-Aktivitäten konzipiert und können gegen viele verschiedene Ziele eingesetzt werden, darunter Websites, Server, APIs und andere Endpunkte. […]

Frauen berichten vielfach, dass ihre Schmerzen manchmal jahrelang nicht ernst genommen oder belächelt wurden. Künftig sollen Schmerzen gendersensibel in 3D visualisiert werden (c) mit KI generiert/DALL-E
News

Schmerzforschung und Gendermedizin

Im Projekt „Embodied Perceptions“ unter Leitung des AIT Center for Technology Experience wird das Thema Schmerzen ganzheitlich und gendersensibel betrachtet: Das Projektteam forscht zu Möglichkeiten, subjektives Schmerzempfinden über 3D-Avatare zu visualisieren. […]

Be the first to comment

Leave a Reply

Your email address will not be published.


*