freanki.net

zurück

Dokumente archivieren unter Linux

March 25, 2012, 10:03 a.m.

Da wir einen neuen Multifunktionsdrucker haben, der eine automatische Dokumentenzufuhr für bis zu 40 Blatt hat, habe ich mir Gedanken zur Dokumentenarchivierung gemacht. Man könnte meinen, dass man einfach alles einscanned, als pdf speichert und fertig. Die Ergebnisse waren jedoch durchwachsen. Man möchte die Vorlagen noch richtig gedreht haben (der Einzug ist nicht perfekt), Weiß soll Weiß sein und Schwarz soll Schwarz sein, etc. Hier also mein aktueller Workflow:

    [caption id="attachment_1608" align="alignright" width="236" caption="Sane Beispiel"][/caption]
  1. Scannen mit Xsane:

    Ich habe einige Backends durchprobiert, bin dann aber doch bei Xsane geblieben. Alle Dokumente werden mit 300 dpi als Graustufenbild eingescanned und als tiff gespeichert. Die Einstellungen sieht man Rechts auf dem Foto. Die Dateien werden selbstständig nummeriert. Wenn man doppelseitige Dokumente scannen möchte, kann man z.B. den Wert zur Erhöhung auf +2 statt +1 stellen. Man kann aber auch später die Dokumente mit pdftk abwechselnd in ein neues pdf speichern.
  2. Bearbeitung mit scantailor

    Scantailor ist ein Frontend für unpaper. Man könnte alle Schritte vollautomatisieren, jedoch benötigt die Bearbeitung der Seiten doch schon mal ein bisschen Handarbeit, daher ist scantailor meine Wahl geworden. Fix Orientation würde die Seiten richtig ausrichten, aber ich lege die Dokumente schon richtig in den Dokumenteneinzug :) Split Pages ist nützlich, sollten zwei Seiten auf ein DIN A4 Dokument gedruckt worden sein. Ich brauche es nicht. Ich klicke direkt auf Deskew, welches dafür zuständig ist, die Dokumente so zu drehen, dass der Inhalt "gerade" ist. Der Dokumenteneinzug liest die Blätter nicht perfekt ein, wodurch die Bilder schon mal um 1-2° gedreht werden müssen. Dies ist der Hauptgrund, warum ich scantailor nutze! Select Content erkennt die Stellen mit Inhalt. Erst wenn dies durchgeführt wurde, kann man unter Output alle Bilder speichern. Dort wähle ich 300 dpi und wieder Graustufen.
  3. Bearbeitung mit Gimp

    Ich nutze Gimp, um die Gradationskurve zu ändern. Alle Programme, dich ich gefunden habe, konvertieren die Dokumente in Schwarz/Weiß, ich möchte jedoch Graustufen, da ich damit bessere Ergebnisse erziele. Trotzdem soll Weiß Weiß sein und Schwarz Schwarz. Nach dem Scannen ist jedoch der eigentlich weiße Hintergrund grau. Dies händisch zu machen, wäre natürlich viel zu viel Arbeit, daher kommt nun ein Script von mir ins Spiel, welches per Bash aufgerufen werden kann und mir diese Arbeit abnimmt. (define (color-curve pattern) (let* ((filelist (cadr (file-glob pattern 1)))) (while (not (null? filelist)) (let* ((filename (car filelist)) (image (car (file-tiff-load RUN-NONINTERACTIVE filename filename))) (write filename) (drawable (car (gimp-image-get-active-layer image)))) (gimp-curves-spline drawable 0 12 #(0 0 51 0 102 85 153 170 204 255 255 255 )) (file-tiff-save RUN-NONINTERACTIVE image drawable filename filename 1) (gimp-image-delete image)) (set! filelist (cdr filelist))))) Man speichere es unter #~.gimp2-6/scripts/ als color-curve.scm ab. Aufgerufen wird es mit: gimp-console-2.6 -i -b '(color-curve "*.tif")' -b '(gimp-quit 0)'
  4. Zusammenfügen der tif zu einem einzigen Multilayer tif

    Dazu benötigt man das Programm tiffcp, welches es in fast allen Distributionen gibt. tiffcp -c lzw *.tif temp.tif
  5. Konvertierung von tif zu pdf

    tiff2pdf -z temp.tif -o Dateiname.pdf Auch tiff2pdf ist fast überall verfügbar. Nun hat man eine PDF-Datei mit allen Dokumenten in guter Qualität. Bei mir verbraucht eine Seite zwischen 500kb und 1 MB. Die letzten drei Schritte habe ich in einem Bash Script vereinigt: Zum Erstellen: sudo vi /usr/local/bin/dokumente2pdf.sh i drücken und folgendes einfügen: #!/bin/bash #************************** #* visit: www.freanki.net * #************************** # dokumente2pdf.sh if [ $# -ne 1 ] ; then echo "Aufruf:" echo "dokumente2pdf.sh [Name des pdf]" exit 32 fi #Weiß wird weiß und Schwarz wird Schwarz. Umgehung von Schwarz/Weiß Palette. Genutzt wird curve von gimp, das sieht schöner aus :) gimp-console-2.6 -i -b '(color-curve "*.tif")' -b '(gimp-quit 0)' #Alle tif's zu einem tif zusammen fassen tiffcp -c lzw *.tif temp.tif #Nun dieses Multiplepages tif zu einem pdf umwandeln tiff2pdf -z temp.tif -o $1 rm temp.tif Das Skript muss nun noch ausführbar gemacht werden: sudo chmod +x /usr/local/bin/dokumente2pdf.sh

weiter
Impressum