Das gebildete Papier

"Intelligente Dokumente" – das sind digitale Dokumente, die mehr können als nur gedruckt und versendet zu werden. Sie enthalten Informationen, Codes und Daten für eine Verarbeitung auf allen physischen und elektronischen Kanälen, die weit über die reine Ausgabe hinausgeht. Die heute immer noch anzutreffende Vernichtung von wichtigen Strukturinformationen auf dem Weg zur Ausgabe von Dokumenten ist nicht mehr zeitgemäß. [...]

Ein Phänomen, das in vielen Unternehmen immer noch zu beobachten ist: Elektronische Dokumente, die eigentlich von Maschinen gelesen und verarbeitet werden könnten, werden erst gedruckt und anschließend wieder digitalisiert, beispielsweise als TIF- oder JPG-Dateien. Das heißt, aus Content entstehen Pixel. Was nichts anderes bedeutet als dass der Inhalt erst verschlüsselt (Rasterbilder) und anschließend mittels Optical Character Recognition (OCR) wieder „lesbar“ gemacht wird. Ein umständliches und überflüssiges Prozedere, zumal dabei wichtige Informationen für die Weiterverarbeitung verloren gehen.

Besser wäre es doch, von Beginn an digitale Dokumente zu schaffen, die mehr Funktionalitäten enthalten als nur die Möglichkeit, gedruckt zu werden. Nicht nur, dass die Versandwege inzwischen vielfältiger sind als noch vor wenigen Jahren und man sich deshalb mit dem Thema Multikanalfähigkeit beschäftigen sollte. Die heute immer noch anzutreffende Vernichtung von wichtigen Strukturinformationen auf dem Weg zur Ausgabe der Dokumente ist nicht mehr zeitgemäß.

Gefragt sind „intelligente Dokumente“ mit interaktiven Elementen und Daten, die sich an nachgelagerte Anwendungen übertragen lassen. Das können beispielsweise Anweisungen an die Kuvertierstraße sein, welche Beilagen in welcher Stückzahl einer bestimmten Sendung beigefügt werden sollen.

INTERAKTIVER INHALT
Vorbei sind die Zeiten, in denen Dokumente nur gedruckt und bestenfalls elektronisch verschickt werden. Heute übernehmen sie vielmehr die Rolle eines „Informationscontainers“, der es Anwendern ermöglicht, verschiedene Aktionen auszulösen, die weit über die Erstellung und den Versand hinausgehen. Gemeint sind Prozesse wie Datenrecherche, Transaktionen oder das Hinterlegen von Archivierungsregeln und von Steuerungscodes zur portooptimierten Sendungserstellung (Zusammenfassen von mehreren Dokumenten an denselben Empfänger/bessere Ausschöpfung von Portorabatten). Den ursprünglich nur für den Druck vorgesehenen Dokumenten werden auf dem Weg zur Ausgabe verschiedene Metadaten, Multimediainformationen, Hyperlinks, Business-Grafiken und sonstige Daten mitgegeben, so dass sie nicht nur über jeden beliebigen Kanal ausgegeben werden können, sondern sich mit anderen Prozessen verknüpfen lassen. „Intelligente“ Dokumente – das bedeutet aber auch Barrierefreiheit. Jedem Menschen, unabhängig von seiner geistigen und körperlichen Verfassung, muss der Inhalt in vollem Umfang zugänglich gemacht werden – ob nun als Audiodatei oder PDF-Dateien, die durch automatisches Umfließen und Verändern der Schriftgröße Sehbehinderten den Inhalt zugänglich machen.

Ein Thema, das beispielsweise Behörden und öffentlichen Einrichtungen umsetzen müssen. So sind etwa Standardformulare und Broschüren so aufzubereiten, dass sie von einem „Screenreader“ inhaltlich und sprachlich korrekt vorgelesen werden können. Auch hier handelt es sich um die Aufwertung von Dokumenten: Man hinterlegt Informationen als Metadaten („Tagging“), die für eine korrekte Wiedergabe und Ausgabe, über welchen Kanal auch immer, erforderlich sind. Dabei geht es vor allem um Angaben zur Textstruktur wie Leserichtung, Vorlesesprache, Spaltenreihenfolge, Silbentrennung, Querverweise, Hinweisen zu Fußnoten etc. Das „Taggen“ solcher Keywords ist dafür eben unerlässlich.

In diesem Zusammenhang spielt das Format PDF/UA (Universal Accessibility) sicher eine wichtige Rolle. Im Sommer letzten Jahres als ISO-Standard 14289-1 offiziell zertifiziert, wird es die Erstellung von allgemein zugänglichen und damit intelligenten Dokumenten wesentlich vereinfachen. Besser noch: Man setzt auf das Format HTML5. Die textbasierte Auszeichnungssprache gibt schon heute auf mobilen Plattformen den Ton an. Kein Wunder, Inhalte in HTML5 lassen sich einfach für alle elektronischen Ausgabekanäle aufbereiten, für Smartphone & Co. genauso wie für den Webauftritt. Und wer das Dokument zusätzlich drucken will, dem bleibt diese Option ja erhalten. Auch die Konvertierung in PDF-Dateien jeder beliebigen Seitengröße ist möglich.

HTML5 ist derzeit das intelligenteste Format für die größen- und kanalunabhängige Erstellung und Darstellung von Dokumenten. Es ermöglicht die Reformatierung, beispielsweise von A4 zum Smartphone-Display, die Konvertierung von Seitenformate in textorientierte Formate, die Extraktion von Einzeldaten (u.a. Rückgewinnung von Rechnungspositionen) und den Aufbau von Inhaltsverzeichnissen und Indexlisten. Mehr noch: Mit HTML5 lassen sich auch audiovisuelle Elemente, Weblinks und Charts einbetten. So entstehen auf diese Weise nicht nur multikanalfähige, sondern auch multimediale Dokumente, die dem Nutzer einen über die reine Textdarstellung hinausgehenden Mehrwert bieten.

KLEIN ANFANGEN
Für Unternehmen wird es also Zeit, sich mit diesem Thema zu beschäftigen. Dabei müssen es nicht immer großangelegte Projekte sein – die Anreicherung von Dokumenten mit Informationen kann ganz klein beginnen. Ein in Süddeutschland bekannter regionaler Energieversorger beispielsweise arbeitet in der Abrechnung mit Indexwerten („Keywords“), mittels derer sich Rechnungen im Archiv schneller recherchieren lassen. Konkret: Alle Abrechnungen für Strom, Gas und Wasser werden zunächst als AFP-Dateien (AFP ist das gängige Format für den hochvolumigen Produktionsdruck) erzeugt und anschließend ins PDF/A-Format für die Archivierung konvertiert. Mittels spezieller Applikationen lassen sich aus den AFP-Dateien verschiedene Schlüsselinformationen wie Kundenname, Art der Belieferung, Rechnungsnummer und Kundennummer auslesen und als Indexwerte in die Archivdatei (PDF) einbetten.

Oft sind es die berühmten kleinen Schritte, die zum Erfolg führen. Entscheidend ist, dass man überhaupt mit der Aufwertung von Dokumenten zu „Informationsträgern“ beginnt – ob nun das Hinzufügen eines elektronischen Signaturfeldes, die Einbettung von audiovisuellen Inhalten oder das Hinterlegen von zusätzlichen Funktionen und Regeln für nachgelagerte Prozesse.

* Bernd Steglich ist Bereichsleiter Education bei Compart.


Mehr Artikel

Gregor Schmid, Projektcenterleiter bei Kumavision, über die Digitalisierung im Mittelstand und die Chancen durch Künstliche Intelligenz. (c) timeline/Rudi Handl
Interview

„Die Zukunft ist modular, flexibel und KI-gestützt“

Im Gespräch mit der ITWELT.at verdeutlicht Gregor Schmid, Projektcenterleiter bei Kumavision, wie sehr sich die Anforderungen an ERP-Systeme und die digitale Transformation in den letzten Jahren verändert haben und verweist dabei auf den Trend zu modularen Lösungen, die Bedeutung der Cloud und die Rolle von Künstlicher Intelligenz (KI) in der Unternehmenspraxis. […]

News

Richtlinien für sichere KI-Entwicklung

Die „Guidelines for Secure Development and Deployment of AI Systems“ von Kaspersky behandeln zentrale Aspekte der Entwicklung, Bereitstellung und des Betriebs von KI-Systemen, einschließlich Design, bewährter Sicherheitspraktiken und Integration, ohne sich auf die Entwicklung grundlegender Modelle zu fokussieren. […]

News

Datensilos blockieren Abwehrkräfte von generativer KI

Damit KI eine Rolle in der Cyberabwehr spielen kann, ist sie auf leicht zugängliche Echtzeitdaten angewiesen. Das heißt, die zunehmende Leistungsfähigkeit von GenAI kann nur dann wirksam werden, wenn die KI Zugriff auf einwandfreie, validierte, standardisierte und vor allem hochverfügbare Daten in allen Anwendungen und Systemen sowie für alle Nutzer hat. Dies setzt allerdings voraus, dass Unternehmen in der Lage sind, ihre Datensilos aufzulösen. […]

Be the first to comment

Leave a Reply

Your email address will not be published.


*