Logo Adobe Certified Expert (ACE) und Adobe Certified Instructor (ACI) für Adobe Acrobat

22. Februar 2006

Ein PDF für die Archivierung: PDF/A

PDF-A LogoEnde letzten Jahres wurde eine neue ISO-Norm gültig: ISO 19005-1 (Dokumenten-Management – Teil 1: Verwendung von PDF 1.4), kurz einfach PDf/A genannt. Diese Norm soll die Langzeit-Archivierung von Geschäftsdokumenten regeln, betrifft also die Handhabung von PDF in der Druckvorstufe nicht. (Hier sollte unbedingt PDF/X auch für die Archvierung verwendet werden.)

Trotzdem betrifft die Norm die Betriebe der Druckvorstufe – zumindest soweit diese PDF auch ausserhalb des Druckraums einsetzen. Die PDF/A-Norm definiert PDF teilweise ähnlich wie PDF/X (es wird zum Beispiel eine Ausgabebedingung verlangt), in weiten Bereichen aber auch völlig anders. Es werden zum Beispiel alle Inhalte verboten, welche eine langfristige Nutzbarkeit eines Dokumentes beeinträchtigen.

Einige beispielhafte Regeln:

  • es muss die Version PDF 1.4 verwendet werden
  • sämtliche Schriften müssen eingebettet sein
  • eingebettete Audio- oder Videodaten sind verboten
  • JavaScript ist verboten
  • analog zu PDF/X ist Transparenz verboten

PDF/A wird zusätzlich in Unternormen aufgeteilt, welche den Grad der Normeinhaltung festlegen:

  • PDF/A-1a: vollständige Übereinstimmung mit der ISO-Norm
  • PDF/A-1b: Mindestanforderungen, die für eine Langzeitarchivierung eingehalten werden müssen.

Der Unterschied liegt im Wesentlichen in der internen Repräsentation der Textlogik: PDF/A-1a verlangt zusätzlich zu den oben aufgeführten Beispielen, dass der Text aus dem PDF in logischer und korrekter Reihenfolge extrahiert werden kann; ausserdem muss das PDF gemäß des »US Rehabilitation Act« Barrierefrei sein. Das ist nur möglich, wenn das PDF »getagged« ist, wie Adobe diese Technologie nennt. Derzeit können »Tagged PDF« meines Wissens nur aus Adobe Indesign und aus Office-Programmen erstellt werden, aus Office-Programmen allerdings ausschließlich unter Windows und auf dem Weg über den PDF-Maker, also über die PDF-Makros, die zusammen mit Acrobat in den Office-Programmen installiert werden. Es ist derzeit also nicht möglich, aus Druckvorstufen-PDFs ein PDF/A-1a zu erstellen; man müsste sich mit PDF/A-1b begnügen.

Die weitaus meisten derzeit produzierten PDF-Dateien erfüllen diesen strengen Standard nicht. So werden zum Beispiel bei der Verwendung der Distiller-Optionen »Standard« und »Kleinste Dateigröße« die Standardschriften Arial etc. nicht eingebettet. Damit erreichen praktisch alle heute aus Acrobat 6 oder 7 erstellten Office- oder Internet-PDFs nicht die Minimalanforderungen des PDF/A-Standards. Am nächsten kommen noch die PDFs aus der Druckvorstufe, sie erfüllen die meisten der Forderungen und könnten – sobald entsprechende Tools zu Verfügung stehen – in ein PDF/A umgewandelt werden.

Tools

Derzeit ist der Distiller von Acrobat 7 das einzige mir bekannte Tool, das PDF/A erstellen kann (Distiller-Option PDF/A - Draft). Mir ist momentan kein Tool bekannt, mit dem bereits vorhandene PDFs in ein PDF/A umgewandelt werden können. Analog zu den bisherigen Erfahrungen mit PDF/X ist vermutlich mit der nächsten Version von Acrobat mit einer ganzen Reihe von Werkzeugen zu PDF/A zu rechnen. Adobe hat das auch bereits angekündigt.

Fazit

Ich hoffe sehr, dass diese Norm vom Markt akzeptiert wird und sich in ähnlichem Umfang verbreitet wie derzeit PDF/X in der Druckvorstufe. Mit dieser Norm erhalten wir eine reelle Chance auf ein Datenformat, das in 20 oder 30 Jahren tatsächlich noch les- und druckbar sein wird, und aus dem man sogar den Text wieder in sinnvoller Form extrahieren kann. Zusätzlich besteht die Hoffnung, dass über den Zwang der Schrifteinbettung endlich die Qualität der Office- und Internet-PDFs steigt.

Informative Links zu PDF/A

Zum Thema Barrierefreiheit verweise ich ausserdem auf meine Artikel in der Rubrik »Barrierefreiheit« in meinem Blog hier. Weitere Links zur Barrierefreiheit finden Sie in der Rubrik Ressourcen.

Von Peter am 22.02 um 21:39 Uhr. Kategorie: Acrobat | Barrierefreiheit

Trackbacks

  1. Trackback-URL: http://www.lisardo.de/trackback/329/KZcCoHgC/

Kommentare

  1. Um den unvermeidlichen Kommentarspam zu verringern, musste ich leider einige Hürden einbauen: zunächst muss eine gültige E-Mailadresse eingegeben werden, die allerdings auf der öffentlichen Webseite nicht erscheint. Ausserdem kann der Kommentar erst nach dem Aufrufen einer eigenen Vorschau-Seite gespeichert werden. Sie müssen ausserdem einen Namen angeben (Vorname, Nachname, Spitzname oder Pseudonym).
Dieser Eintrag kann nicht mehr kommentiert werden.

Aktuelle Seminartermine:

Seminarkalender abonnieren

Icon einer Kalenderdatei
Seminarkalender als .ics-Datei: Für Kalenderanwendungen herunterladen (alle Systeme)
Icon einer Kalenderdatei
Seminarkalender für iCal: Kalender abonnieren (nur Mac OS X)