Von Dirk Hansmeier auf Donnerstag, 25. Juli 2019
Kategorie: Data Management

Mit PDF/A Dokumente für Langzeitarchivierung erstellen

Im Jahre 1977 wurden die beiden Raumsonden Voyager 1 und 2 auf eine Reise in den interstellaren Raum geschickt. Mit an Board sind jeweils eine „Golden Record" mit einer geschätzten Lebensdauer von 500 Millionen Jahren. Die „Golden Records" sollen die Geschichte der Menschheit im Universum erzählen. Sie beinhalten zusätzlich eine universelle Anleitung wie die Daten zu interpretieren sind. Sollten die Voyager Sonden nach langer Zeit im Weltraum von einem Intelligenten Wesen gefunden werden, können sich diese Wesen ein Bild von der Erde und der Menschheit verschaffen.

Was haben die „Golden Records" mit PDF-Dateien für die Langzeitarchivierung gemeinsam? Wenn Sie heute unabhängig von der verwendeten Hardware ein großes Dokumentenarchiv für ein Unternehmen, bestehend aus vielen PDF Dateien, anlegen,  können diese Dateien wahrscheinlich in der Zukunft (z.B. in 50 Jahren) nicht mehr ohne weiteres interpretiert werden. Der PDF-Standard wird sich jedes Jahr weiterentwickeln und es gibt keine 100%ige  Garantie, dass alte PDF-Formate mit der zukünftig neuesten Version des Acrobat Readers gelesen und angezeigt werden können. Dieses Phänomen heißt Digitale Amnesie (Vergessen) , es kann alle Dateiformate sowie die verwendeten Physikalischen Speichermedien betreffen. Regelmäßige Dateimigrationen auf einen neuen Stand sind deshalb zu empfehlen.

An PDF Dokumente für die Langzeitarchivierung (z.B. bei Banken und Versicherungen) werden deshalb besondere Anforderungen gestellt. Seit 2005 ist PDF/A ein stabiler, international akzeptierter ISO-Standard für die Langzeitarchivierung. Ein PDF/A -konformes Dokument kann den Inhalt auf verschiedenen Computern mit unterschiedlichen Betriebssystemen und unter verschiedenen Druckumgebungen visuell gleich reproduzieren. Es bettet z. B. alle Schriften und Farbprofilinformationen in das Dokument ein. Dynamischer Inhalt eines PDFs ist nicht gestattet. Der PDF/A Standard ist also eine Einschränkung auf die wesentlichen Informationen.

Dennoch kann eine PDF/A-Datei größer sein als die ursprüngliche PDF Datei, da z.B. Unicode-Zeicheninformationen bei dem Standard PDF/A -2U hinzugefügt werden. Der PDF/A-Standard befindet sich derzeit in der Entwicklung durch die PDF Association. Zu Beginn der Entwicklung stand die Version PDF/A-1  basierend auf der PDF Version 1.4. Innerhalb der Version PDF/A-1 werden die Level B (Basic) und A (Accessible) unterschieden. Mit PDF/A-2  basierend auf der PDF Version 1.7  ist der Level U (Unicode) hinzugekommen. In 2012 wurde der PDF/A 3-Standard veröffentlicht. Hier dürfen z.B. XML Dokumente im PDF eingebunden werden. Mit PDF/A-4  basierend auf der PDF Version 2.0  werden die Level (B, A, U) wiederzusammengeführt und es wird nur noch zwischen PDF-Dokumenten mit und ohne „Tags" unterschieden.

Wie werden PDF/A-Dateien erstellt?

Mit der aktuellen MS Office-Version können PDF/A-konforme Dateien erstellt werden. Hierfür muss die PDF-Option „PDF/A-Kompatibel" aktiviert werden. Eine Auswahl der PDF/A-Version ist mit MS Office allerdings nicht möglich,  hier wird ein  PDF/A -3 Level-A-kompatibles Dokument erstellt.



Der Ghostwriter von Artifex Software kann eine bestehende PDF-Datei in eine PDF/A-konforme Datei umwandeln.

Kommando:

"C:\Program Files\gs\gs9.19\bin\gswin64c" -dPDFA=2 -sDEVICE=pdfwrite
-sColorConversionStrategy=/RGB -dPDFACompatibilityPolicy=2
-dPDFSETTINGS=/default
-dAutoRotatePages=/All
-dNOPAUSE
-dBATCH
-o "C:\GS_PDFA\10257294K_A.pdf"
"C:\GS_PDFA\PDFA_def.ps"
"C:\GS_PDFA\10257294K.pdf"

Ausgabe:

GPL Ghostscript 9.19 (2016-03-23)
Copyright (C) 2016 Artifex Software, Inc.All rights reserved.
This software comes with NO WARRANTY: see the file PUBLIC for details.
Processing pages 1 through 4.
Page 1
Loading NimbusRomNo9L-Reg font from %rom%Resource/Font/NimbusRomNo9L-Reg... 4499312 3096518 2561164 1168276 3 done.
Page 2
Page 3
Page 4

Wie kann die PDF/A Konformität überprüft werden?

Das Validierungstool „Verapdf" analysiert PDF-Dokumente und erstellt einen Report. Verapdf kann im Rahmen der „GNU General Public License" eingesetzt werden.

Der Report von Verapdf listet im Detail die bestandenen PDF/A-Validierungen auf.

Wie reagiert der Acrobat Reader beim öffnen einer PDF/A-konformen Datei ?

Beim Öffnen einer PDF/A-Datei im Acrobat Reader erscheint ein Hinweis, dass es sich um eine PDF/A-Datei handelt und diese schreibgeschützt ist. Im Info-Feld wird die zugehörigen PDF/A-Version angezeigt.

PDF/A ist der Versuch der Digitalen Amnesie entgegenzuwirken. Ob dieses Bestreben erfolgreich ist, kann nur die Zukunft zeigen. Die Betreiber von Langzeitarchiven sind jedenfalls durch gesetzliche Vorgaben dazu angehalten, in der Form von PDF/A-konformen Dateien zu archivieren.  

Links

https://www.pdflib.com/de/pdf-know-how/pdfa/die-pdfa-standards/

https://de.wikipedia.org/wiki/PDF/A

https://verapdf.org

https://artifex.com/

Kommentare hinterlassen