PDF-Literatur-Sammlung verwalten


 

Wie in diesem Beitrag beschrieben, verwende ich bevorzugt JabRef, um meine zahlreichen PDF- und DJVU-Literatur-Dokumente zu katalogisieren. Aber wie verwaltet man am besten seine physischen Dateien auf der Festplatte? Hier ein paar Tips:

  1. Kurze Dateinamen: In JabRef vergebe ich einen kurzen Schlüssel, z.B. Altmeier2003, genauso heißt auch meine Datei: Altmeier2003.pdf. Man kann zwar direkt vom Dateinamen nicht mehr auf den Inhalt/Titel schließen, aber dazu gibt's ja JabRef!
  2. Volltext-Indizierung: JabRef speichert zwar Autoren, Titel, Erscheinungsjahr und sonstige Meta-Infos zur Literaturquelle, zeigt aber nichts aus dessen Inhalt an. Dazu dienen Desktop-Indizierungsprogramme wie DocFetcher oder Recoll (beide für den GNU/Linux-Desktop) die den gesamten Literaturbestand scannen und indizieren. Das dauert ein paar Stunden bei vielen Dokumenten, dafür kann man anschließend sekundenschnelle Suchbegriffe in allen seinen Dokumenten heraussuchen.
  3. PDF-Metadateien: Da die genannten Desktop-Suchmaschinen die Suchtreffer in einer Art Liste (Autoren, Titel…) aufzeigen, ist es sinnvoll, wenn die PDFs vernünftige Einträge in den Metadateien haben: Zu jedem PDF werden Titel, Autor(en) und andere Informationen in den sog. Meta-Dateien gespeichert, die eben eine Desktop-Suchmaschine ausliest und auflistet. Steht aber in dem pdf-Meta-Tag für »Titel« statt des richtigen Dokumententitels nur ein nichtssagendes jwe9834.doc (meist der Arbeitstitel des Quelldokuments), listet das auch Recoll oder eine andere Suchmaschine auf – und man kann damit ebenso nichts anfangen. Ich schlage daher vor, in JabRef den jeweiligen Literatur-Eintrag mit dem entsprechenden PDF in seinem Dokumente-Ordner zu verknüpfen und dann über den Menü-Eintrag Extras | Schreibe XMP-Metadateien in PDFs die Informationen aus JabRef in die Metadaten dem jeweiligen PDF einzutragen! So gibt's auch besser verständliche Suchtreffer bei der Desktop-Volltext-Suche! PS: Die PDF-Metainfos enthalten eine Vielzahl eventuell brisanter Informationen, beispielsweise mit welcher Software das PDF erstellt wurde, wer der Autor war oder mit welcher Software der Text eigentlich geschrieben wurde (jwe9834.doc, siehe oben). Schon allein deshalb könnte man dort für Ordnung sorgen, was mit JabRef ja nun wirklich einfach ist.
  4. Von der Gruppierungs-Funktion in JabRef Gebrauch machen: Jeder Eintrag kann per Rechtsklick einer (vorher angelegten) Gruppe zugeordnet werden, z.B. »Diplomarbeit«. Klickt man diese Gruppe, werden in JabRef auch nur jene Quellen hervorgehoben, die dieser Gruppe zugeordnet wurden.