Skip to main content

PDFx

Analyse, Aufbereiten und Ausgabe von PDF-Dokumenten.

PDF-Dokumente analysieren, verändern und ausgeben.

Das von Adobe entwickelte PDF-Format (Portable Dokument Format) bietet vielfältige Vorteile beim Austausch digital erzeugter Dokumente. Ein PDF-Dokument vereint in einer Datei den eigentlichen Inhalt und trennt hiervon alle Formatierungsinformationen, wie Schriftart, Schriftgröße oder Zeilenabstand. Andere Elemente, etwa Grafiken und Tabellen werden ebenfalls im Dokument eingebunden. Hierbei sind alle Teile des Dokuments über entsprechende Editoren auch nach der Erstellung eines PDFs editierbar.

Aus der ursprünglichen Idee des plattformübergreifenden Austausches von Dokumenten ist mittlerweile ein komplexes Öko-System entstanden, in dem der PDF-Standard als kleinster gemeinsamer Nenner eine Vielzahl komplexer Anwendungen erlaubt. Neben dem rechtssicheren Signieren von digitalen Dokumenten, lassen sich PDF-Dokumente heute mit unterschiedlichsten zusätzlichen Informationen anreichern oder barrierefrei gestalten und ermöglichen so komplexe, hochdynamische Ausgabeprozesse.

So kann eine PDF-Datei für Rechnungen als Vorlage dienen und wird dann innerhalb eines Druckprozesses mit individuellen Rechnungsdaten aus ERP-Systemen ergänzt, ausgedruckt oder direkt per E-Mail versandt. Ein anderes Beispiel sind individualisierte Mailings, die aus einer PDF-Quelle gespeist, um Adress-Daten und individualisiertem Anschreiben erweitert und anschließend auf verschiedenen Druck- und Ausgabesystemen weiterverarbeitet und konfektioniert werden.

Ferner erlaubt das PDF-Format eine Aufteilung von Inhalten, so können im Rahmen personalisierter Anschreiben einzelne Teile eines Dokuments aus- oder eingeblendet werden, etwa Anzeigen oder spezielle Angebote. Die Möglichkeiten des dynamischen Eingriffs in Dateien machen das PDF-Format gerade im Konzernumfeld attraktiv, mit hochkomplexen Druck-Prozessen, die eine Vielzahl von Daten dynamisch integrieren und mit unterschiedlichen Druckdienstleistern oder eigenen Druckstraßen arbeiten.

profiforms bietet mit der PDFx-Familie verschiedene Module, die sich individuell in vorhandene Systemarchitekturen einbetten lassen und darüber vorhandene Datensätze erweitern, Druckdaten umwandeln und anreichern oder die Leistung vorhandener Drucksysteme erweitern. Ziel aller Module ist die Steigerung der Flexibilität im Druckprozess, verbunden mit der Verbesserung der Effizienz der Steuerung der vorhandenen Ausgabesysteme.

Übersicht

Die PDFx-Familie besteht aus verschiedenen Modulen, die entweder im Umfeld der 
Customer Communication Management-Lösung von profiforms oder auch als Einzel-Komponenten Verwendung finden. Allen gemein ist die komfortable Integration in die vorhandene Systemarchitektur. 

PDFxPlore – Datenanalyse und Datenextraktion

Die Analyse der Daten, auch die Entnahme von Inhalten erledigt PDFxPlore, ohne Änderungen im eigentlichen Dokument auszuführen. Damit wird die Analyse nicht nur extrem schnell, es ist auch eine revisionssichere Verarbeitung der Dateien sichergestellt. 

PDFxPlore dient der Analyse von existierenden PDF-Dateien, mit dem Ziel, die enthaltenen Daten im weiteren Druckprozess zu nutzen. Das Tool liest zuerst die Metadaten einer PDF-Datei aus, in denen die Eigenschaften eines Dokuments beschrieben werden. Aus den hinterlegten Informationen zu Inhalt und Struktur werden so die Werte identifiziert, die im weiteren Verarbeitungsprozess benötigt werden.

Das können Seitenanzahl, Papierformat und -typen, Ersteller-Informationen und weitere signifikante Inhalte sein. Die Metadaten werden anschließend in strukturierter Form an den Spooler übergeben, der sie nach einem vorab definierten Prozessworkflow weiterverarbeitet.

Weiterhin untersucht PDFxPlore die Texte im PDF-Dokument nach festgelegten Parametern, etwa einzelnen Wörtern oder Textbausteinen. Alternativ kopiert das Tool in einem weiteren Arbeitsschritt auch den kompletten Text aus einem PDF-Dokument. Die Daten stehen anschließend in vielfältiger Weise zur Steuerung der Weiterverarbeitung, etwa der Sortierung oder Zuordnung zu bestimmten Prozessen, die Anreicherung mit externen Daten oder der Übernahme in ein Textverarbeitungsprogramm, bereit.

Leistungsmerkmale 

  • Export von Metadaten (Anzahl der Seiten, Erzeuger-Informationen usw.)
  • Bestimmung von Papierformat und -typ
  • Suchen und Extrahieren von signifikanten Inhalten (z. B. Dateianhänge)
  • vollständige Textextraktion (z. B. in eine XML-Datei oder als Blocktext)
  • Erstellung XTF-Format zur externen Indexierung der PDF-Datei
  • Analyse von PDF-Eigenschaften (z. B. Farberkennung, Verwendung von Transparenzen, Informationen zu eingebetteten Schriftarten)

Plattformen

  • Windows Server > 2016
  • Linux

Eingangs-Formate

  • PDF

Ausgabe-Format

  • XML (VOL)
  • TXT
  • XTF 
  • PDF 

PDFxFlight – Strukturanalyse und Korrektur

Die enorme Popularität des PDF-Formats sorgt für eine Vielzahl von Weiterentwicklungen rund um den eigentlichen Standard, etwa neue Ausgabetechniken oder gerätespezifische Funktionen. Oft entstehen überdies Fehler bei der Erzeugung von PDF-Dokumenten, so werden Schriften nicht eingebettet, Transparenzen nicht geglättet oder Grafiken im falschen Farbsystem anlegt. Diese Inkompatibilitäten führen zu unterschiedlichsten Problemen in der Ausgabe.

Daher gilt es besonders bei der Übernahme vorhandener Dokumente, diese einer Prüfung auf eventuelle Abweichungen von Standards zu überprüfen. PDFxFlight analysiert den Inhalt einer PDF-Datei und eine Reihe anderer Bedingungen und stellt fest, ob die Datei für die weitere Verarbeitung oder den Druck geeignet ist. 

Korrektur der PDF-Datei

Nach der Ermittlung möglicher Probleme und Fehler in der Datei werden die entsprechenden Parameter geändert, etwa die PDF-Version angepasst, das Farbmanagement durchgeführt und Farben in den korrekten Farbraum konvertiert.

Dazu können das Format der Datei verändert werden, Seiten gedreht und eingebettete Grafiken und Bilder in eine passende Auflösung konvertiert werden.

Multithreading

PDFxFlight unterstützt das sogenannte Multithreading, um eine Massendatenbearbeitung zu vereinfachen. Hierbei werden umfangreiche PDF-Dateien in mehrere kleine PDFs zerteilt und in einem parallelen Prozess auf mehreren Instanzen des Tools ausgeführt. 

Leistungsmerkmale

  •  Analyse von PDF-Dateien auf Basis eines vorgebenden Ausgabe-Profile
  • Ermitteln von Problemen und Fehlern
  • Korrektur der ermittelten Fehler
  • Umfangreiches Farbmanagement
  • Unterstützt Multithreading

Plattformen

  • Windows Server > 2016
  • Linux 

Eingangs-Formate

  • PDF

Ausgabe-Format

  • PDF

PDFxOut – Ausgabe in beliebige Systeme

Das Modul läuft als Teil des Spoolers und arbeitet dort als Druckertreiber, etwa vergleichbar mit einem Windows-Druckertreiber. Allerdings erzeugt PDFxOut seine Druckdaten nicht aus einem Datenstrom, sondern aus dem Plattform-unabhängigen PDF-Format. 

PDFxOut dient zur Umwandlung von PDF-Dateien in andere Formate zur direkten Druckeransteuerung, wie PCL und PostScript. Ziel ist, von den Möglichkeiten und der Flexibilität des PDF-Formats zu profitieren und am Ende in der Ausgabe nicht PDF-kompatible Ausgabegeräte zu unterstützen, was aktuell noch für beachtlich viele Massendrucksysteme gilt.

PDFxOut erkennt, basierend auf den hinterlegten Informationen, die Möglichkeiten der Ausgabegeräte und wandelt die PDFs in das Zielformat des jeweiligen physischen Ausgabegerätes um, das dann problemlos ausgegeben werden kann. Gleiches gilt für andere verknüpfte Informationen, etwa externe Schriftdateien, die von PDFxOut integriert werden. 

Plattformen

Voraussetzungen

  • OMS Spooler

Eingangs-Formate

  • PDF

Ausgabe-Format

  • PDF

Voraussetzungen

  • OMS Spooler

Eingangs-Formate

  • PDF

Ausgabe-Format

  • PDF

PDFxIn – aus jedem Datenstrom entsteht ein PDF

Das PDF-Format bietet bei der prozessgesteuerten Weiterverarbeitung in dynamischen Kommunikations-Systemen weitreichende Vorteile. So lässt sich der Inhalt einer PDF-Datei direkt im Verarbeitungsprozess verändern, mit Daten anreichern oder nach vorgegebenen Regeln analysieren und in unterschiedlichen Varianten darstellen und ausgeben. Hinzukommt, dass viele Systeme heute den PDF-Standard als Eingabeformat fordern, damit Dokumente eingestellt und weiterverarbeitet werden können.

Aufgrund häufig vielschichtigen IT-Landschaften in Unternehmen, die oft der eingesetzten ERP-Lösungen oder anderen Faktoren geschuldet ist, werden in vielen Fällen proprietäre Ausgabeformate, so etwa im SAP-Umfeld das SAPGOF-Format verwendet. Letzteres ist auf den Einsatz in SAP-Systemen optimiert und lässt sich daher in anderen Systemen nicht effizient weiterverarbeiten. Mit PDFxIn besteht nun auch für diese Dokumenten-Typen die Möglichkeit einer flexiblen und umfangreichen Aufbereitung innerhalb komplexer Druckprozesse.

Offen für Input

Die offene Struktur von PDFxIn ermöglicht es, nahezu beliebige Systeme anzubinden, da hierfür nur die Anpassung der standardisierten Schnittstelle notwendig ist.

Die Vorteile von PDFxIn:

Leistungsmerkmale

  • Unterstützung von Unicode
  • Barcodemapping im Falle von SAPGOF
  • Erstellung geräteunabhängiger Daten (Basis von PDF)
  • Auflösung von Abhängigkeiten an Drucker oder Druckerhersteller
  • Einsatz unabhängig von Druckereigenschaften
  • Einfach Integration in andere OMS-Module (Spooler, EOMS, Logistics, Archiver, PDFxOut)
  • grafisches und einheitliches Erscheinungsbild auf allen Druckern
  • weniger Aufwand bei der Konfiguration
  • Barcode-Funktionalität für alle Drucker im Unternehmen
  • zentrale Schriftartenkonfiguration
  • ideal auch zur Abgabe an den Druckdienstleister

Wie arbeitet PDFxIn?

PDFxIn erzeugt aus verschiedenen Eingabeformaten (SAPGOF, PCL5, PDF) ein einheitliches PDF-Format, das anschließend in unterschiedlichen Systemen und komplexen Druckprozessen weiterverarbeitet und verändert werden kann. So lassen sich jetzt Dateien auch in vorhandene Umgebungen, die bereits auf dynamische Datenverarbeitung setzen, einfach und ohne Verzicht auf Funktionen, integrieren.

Das System ist auf den Austausch mit anderen PDFx-Modulen optimiert und lässt sich direkt in eine OMS-Umgebung integrieren. Auf diese Weise erzeugen Sie etwa mit PDFxIn eine PDF, die dann mit PDFxFlight auf ein spezielles PDF-Format optimiert und anschließend über den Spooler ausgegeben, mit weiteren Daten angereichert und nach der Ausgabe direkt archiviert wird. 

Eingangsschnittstellen

  • SAPGOF (LIST, OTF)
  • PDF (ADS)
  • PCL

Ausgangsschnittstellen

  • PDF

Plattformen

  • Windows Server >2016
  • Linux

Voraussetzungen

  • OMS Spooler

Eingangs-Formate

  • PDF

Ausgabe-Format

  • PDF

Demo-Termin PDFxFamilie

Vereinbaren Sie heute noch einen unverbindlichen Demo-Termin, um zu erfahren, wie die PDFxFamilie in erfolgreich in Ihre Systemlandschaft integriert werden kann.