alte Dokumente unlesbar (Codierung?)

Hallo Rainer,

ein bisschen selbst recherchieren wäre auch ganz gut:
Datei -> Expoertieren als -> Als PDF exportieren..., dann hast du unter ALlgemein auf der rechten Seite u.s. die Auswahl PDF/A

Gruß

Gerhard

Hallo Gerhard,

ein bisschen selbst recherchieren wäre auch ganz gut:

Du weiß sicher, dass ich nicht recherchiert habe?

Datei -> Expoertieren als -> Als PDF exportieren..., dann hast du
unter ALlgemein auf der rechten Seite u.s. die Auswahl PDF/A

Danke. Diesen Weg bin ich noch nie gegangen, sondern habe immer die
Schaltfläche benutzt - und dort gibt es diese Option nicht.

Da ich mittlerweile ja massenhaft pdf-Dateien habe: Lässt sich prüfen,
ob die im PDF/A-Format angelegt wurden?

Viele Grüße

Rainer

Hallo Rainer,

ich habe es ausprobiert und einfach eine PDF/A-Datei erzeugt. Wenn ich sie im Acrobat-Reader öffne, erscheint eine Info-Meldung, die beginnt mit "Diese Datei verlangt Konformität mit dem PDF/A-Standard". Durch Klicken auf das i im Kreis davor kann man die Meldung aus- und einblenden, also ggf. da drauf klicken.
Weitere Informationen, ob das Dokument PDF/A unterstützt, habe ich im Dokument nicht entdecken.
Aber vielleicht hilft dir das Tool zum Prüfen weiter, das unter https://verapdf.org/ zu finden. Diese Seite habe ich über den Wikipedia-Artikel über PDF/A gefunden.

Gruß

Gerhard

Hallo Gerhard,

ich habe es ausprobiert und einfach eine PDF/A-Datei erzeugt. Wenn
ich sie im Acrobat-Reader öffne, erscheint eine Info-Meldung, die
beginnt mit "Diese Datei verlangt Konformität mit dem
PDF/A-Standard". Durch Klicken auf das i im Kreis davor kann man die
Meldung aus- und einblenden, also ggf. da drauf klicken.

Deine Rahmenbedingungen sind andere, als meine: Du arbeitest mit
Windows, ich mit Linux, und Du benutzt den Acrobat-Reader, ich Atril.

Weitere Informationen, ob das Dokument PDF/A unterstützt, habe ich im
Dokument nicht entdecken.

Ich inzwischen schon: Schaue ich in einem geöffneten Dokument unter
Eigenschaften nach, ist dort eine Zeile "Format" zu finden und darin
z.B. "PDF-1.4".

Aber vielleicht hilft dir das Tool zum Prüfen weiter, das unter
https://verapdf.org/ zu finden. Diese Seite habe ich über den
Wikipedia-Artikel über PDF/A gefunden.

Hatte ich auch schon vor meiner Nachfrage und deshalb im Posting
geschrieben:

Die Wiki-Seite bietet zwar einen Link zu einer entsprechenden Seite
an, und dort ist von einem Checker die Rede. Aber schlau werde ich
nicht daraus. Scheint eine Software zu sein.

Natürlich hatte ich mir vorher angesehen, wie weit ich mit "Explore ->
Validation" komme, bin auf der Seite aber hängengeblieben.

Abgesehen davon scheint mir die Sache aussichtslos: Auf meinem System
befinden sich dermaßen viele pdf-Dokumente, die so verstreut sind, dass
ich mir nicht vorstellen kann, wie sie alle ins PDF/A-Format zu bringen
sein könnten. Hinzu kommt, dass sie aus verschiedensten Quellen stammen
(LO, Scanner, Download, etc.) und verschiedene Format-Angaben
enthalten. Und auf das Format neuer Dokumente, die mittels Druckfunktion
von Websites generiert werden, habe ich keinen Einfluss (müssten also -
sofern möglich - vom abgespeicherten Format wieder ins PDF/A
konvertiert werden). Meine Einschätzung: Praktisch nicht umsetzbar,
weil der Aufwand viel zu groß.

Viele Grüße

Rainer

Hallo,

vorweg: Ich habe (aus Zeitgründen) die bisherige Diskussion nur sporadisch verfolgt, ich erinnere, Du nutzt LINUX?
Folgender Abschnitt ist mir aufgefallen:

Abgesehen davon scheint mir die Sache aussichtslos: Auf meinem System
befinden sich dermaßen viele pdf-Dokumente, die so verstreut sind, dass
ich mir nicht vorstellen kann, wie sie alle ins PDF/A-Format zu bringen
sein könnten. Hinzu kommt, dass sie aus verschiedensten Quellen stammen
(LO, Scanner, Download, etc.) und verschiedene Format-Angaben
enthalten. Und auf das Format neuer Dokumente, die mittels Druckfunktion
von Websites generiert werden, habe ich keinen Einfluss (müssten also -
sofern möglich - vom abgespeicherten Format wieder ins PDF/A
konvertiert werden). Meine Einschätzung: Praktisch nicht umsetzbar,
weil der Aufwand viel zu groß.

Ich denke, Du kannst mit einem BASH / find eine Liste aller PDF-Dateien erzeugen, egal wo sie auf Deiner Platte gespeichert sind.
So weit ich in Erinnerung hatte, prüft OCRmyPDF, ob bereits durchsuchbarer Text vorhanden ist und fügt ihn hinzu, falls dies noch nicht vorhanden ist; siehe hierzu diese Diskussion. <https://github.com/jbarlow83/OCRmyPDF/issues/72>
Ich habe es nicht getestet, aber wenn das so funktioniert, könntest Du wieder per BASH Deine Liste durch OCRmyPDF schicken und die neue erzeugten Files speichern lassen. Schließlich  - wenn gewünscht - die alten Dateien nach Listeneinträgen löschen und die neuen nach den Listeneinträgen umbenennen.

Gruß
Michael