Der digitale Versand verdrängt den physikalischen – mit der Folge, dass Dokumente jeden Formats und jeder Quelle multikanalfähig gemacht werden müssen. Am besten schon zum Zeitpunkt ihrer Erstellung. HTML 5 und PDF spielen dabei eine entscheidende Rolle. [...]
Europaweit sinkt das Aufkommen an physischen Dokumenten. Aktuelle Erhebungen der Universal Postal Union (UPU) sprechen von einem Rückgang im zweistelligen Bereich. Schon heute verschicken viele Unternehmen Rechnungen, Kontoauszüge etc. elektronisch als E-Mail-Anhang oder stellen sie als Downloaddatei in Webportalen zur Verfügung. Tendenz steigend. Im digitalen Versand liegen riesige Einsparpotenziale, denn die Kosten für Druck und Porto fallen weg. Daher schreitet die Digitalisierung hier auch am schnellsten voran. Wahrscheinlich wird in einigen Jahren weit mehr als die Hälfte aller Dokumente elektronisch versendet; selbst Versicherungspolicen, Vertragskündigungen und Schreiben, die aus rechtlichen Gründen heute noch an die Papierform gebunden sind, werden sicher irgendwann ebenfalls auf diesem Weg verschickt. Druck und physischer Versand bleibt dann Schriftstücken vorbehalten, bei denen Haptik und Optik wichtig sind, vor allem Mailings, hochwertige Produktkataloge und Imagebroschüren. Papier entwickelt sich somit zunehmend zum Premium-Produkt.
HTML5 FÜR ALLE FÄLLE
Wie auch immer – das Verhältnis zwischen physikalischem und digitalem Versand verschiebt sich und beeinflusst die Erstellung insgesamt. Die Herausforderung hier: jedes Dokument, egal welcher Art, so aufzubereiten und mit Strukturinformationen zu versehen, dass es auf jedem Ausgabekanal darstellbar ist. Das bedeutet, dass sich Output-Management-Systeme von der A4-Metapher lösen und Inhalte auch für elektronische Ausgabegeräte bereitstellen müssen, unabhängig von der Größe des Displays oder Bildschirms. Man denke nur an Tablet, Smartphone etc., die im Businessalltag zunehmend zum mobilen Büro werden. Mit anderen Worten: Die ursprünglich nur für den Druck vorgesehenen Dokumente werden zu multikanalfähigen umgewandelt. Dazu „reichert“ man sie auf ihrem Weg zur Ausgabe mit möglichst vielen Informationen wie Metadaten, Hyperlinks und Hinweisen zur Textstrukturierung an.
Vor diesem Hintergrund spielt das Format HTML5 eine entscheidende Rolle bei der Strukturierung und semantischen Beschreibung von Dokumenten. Die textbasierende Auszeichnungssprache gibt schon heute auf mobilen Plattformen wie iPhone, iPad und Android-Geräten den Ton an. Kein Wunder, Inhalte in HTML5 lassen sich problemlos für alle elektronischen Ausgabekanäle aufbereiten, für Smartphone und Co. genauso wie als Webseite. Bei Bedarf lässt sich das HTML5-Dokument zusätzlich drucken oder anderweitig physikalisch ausgeben. Auch die Konvertierung in PDF-Dateien jeder beliebigen Seitengröße ist möglich.
HTML5 ist derzeit das intelligenteste Format für die größen- und kanalunabhängige Erstellung und Darstellung von Dokumenten. Es ermöglicht die Reformatierung, beispielsweise von A4 zum Smartphone-Display, die Konvertierung von Seitenformate in textorientierte Formate, die Extraktion von Einzeldaten (u.a. Rückgewinnung von Rechnungspositionen) und den Aufbau von Inhaltsverzeichnissen und Indexlisten. Mehr noch: Mit HTML5 lassen sich auch audiovisuelle Elemente, Weblinks und Charts einbetten. So entstehen auf diese Weise nicht nur multikanalfähige, sondern auch intelligente Dokumente, die dem Nutzer einen über die reine Textdarstellung hinausgehenden Mehrwert bieten.
Was liegt also näher, als ein Output-Management-System (OMS) so auszurichten, dass alle Dokumente von Anfang an in HTML5 erstellt werden – oder zumindest in PDF, denn auch dieses Format ist bereits sehr fortgeschritten in Sachen Hinterlegung von Strukturinformationen? Doch viele Unternehmen halten sich damit (noch) zurück. Sie haben in der Regel viel Zeit und Geld in ihre Systeme investiert und sind verständlicherweise für neue Formatierungstools schwer zu begeistern. Sie stehen somit vor der Frage, wie sich aus den bestehenden Anwendungen (Legacy) zumindest ein Teil an Strukturinformationen für die Weiterverarbeitung gewinnen lassen. OMS-Anbieter und Dienstleister haben sich genau darauf spezialisiert, Grunddaten aus bereits fertig formatierten Dokumenten innerhalb der Legacy-Systeme „auszulesen“ und als HTML5- oder XML-Dateien aufzubereiten, die dann um zusätzliche Informationen weiter aufgewertet können, beispielsweise um Farbe oder Video- und Audiodateien.
ZURÜCK ZUR QUELLE
Letztlich geht es darum, die textuellen Quellen innerhalb der Dokumenterzeugung zu identifizieren. Wo kommen die Daten her? Lassen sich aus den Quellen genügend Strukturinformationen für die Wiederverwendung extrahieren? Fragen, die am Anfang jeder Betrachtung stehen müssen, wenn es darum geht, Dokumente „intelligent“ zu machen. Fakt ist: Die heute oft anzutreffende Vernichtung von Informationen auf dem Weg zur Ausgabe, über welchen Kanal auch immer, ist nicht mehr zeitgemäß. Oft werden digitale Dokumente, die an sich von Maschinen gelesen und verarbeitet werden könnten, erst in eine analoge Form, also gedruckt, und dann in TIF- oder JPG-Dateien umgewandelt. Aus Content entstehen „Pixelwolken“. Der eigentliche Inhalt wird erst verschlüsselt (Rasterbilder) und dann wieder mittels Optical Character Recognition (OCR) „lesbar“ gemacht. Das ist nicht nur umständlich, sondern geht mit dem Verlust von semantischen Strukturinformationen einher, die für eine spätere Wiederverwendung notwendig sind. Nicht so, wenn man Dokumente in einem Format erzeugt, das die für die Ausgabe notwendigen Daten mit sich führt und der Inhalt dadurch auf allen Kanälen dargestellt werden kann – ob nun als Webseite, auf einem mobilen Endgerät oder auch als Druck.
* Harald Grumser ist CEO von Compart.
Be the first to comment