Dokumente und Dateien automatisiert ablegen: Immer aufgeräumt

Es gibt zwei Arten von Computerbenutzern: Diejenigen, deren Dateien dort liegen bleiben, wo das Betriebssystem sie eben ablegt, und die anderen, die alle Dateien dorthin verschieben, wo sie sie selbst haben wollen. Was die zweite Gruppe tut, läßt sich mit Software wie Hazel automatisieren, so ich mich nicht mehr drum kümmern muss.

Wenn du hier schon eine Weile liest, weißt du, dass ich die papierlose Ablage benutze, also jegliches eingehende Papier digitalisiere und flach in einem Ordner ablege. Du weißt außerdem, dass ich sehr gerne wiederkehrende Aufgaben automatisiere. Und du weißt, dass ich regelmäßig Backups mache.

In diesem Beitrag liest du, wie ich Automatisierung auf dem Mac einsetze, und wie ich unter Windows vorgehe.

Viele Quellen, viele Ziele

Auch in diesem Jahrzehnt noch sind Dateien die Basis der Arbeit am Computer, egal ob das ein Desktop, Laptop oder ein Tablet ist. Sie alle arbeiten mit einem Dateisystem und Dateien. Bei Tablets vergisst man das ganz gerne, weil Dateien nicht mehr so präsent sind. Bei Laptops mit „klassischen“ Betriebssystemen ist das Konzept „Datei“ nach wie vor sehr sichtbar.

Jedes Foto, jedes Word-Dokument, jedes Tabellendokument, alles ist eine Datei.

Der Feld-Wald-Wiesennutzer, der alle Dateien genau dort fallen läßt, wo das Betriebssystem vorschlägt, und das für diese Nutzer auch funktioniert, muss sich darüber nicht viele Gedanken machen. Die Dateisuche in Linux, macOS, Windows ist so gut, dass es weniger darauf ankommt als früher, wo eine Datei liegt.

Wer aber mehr mit dem Computer arbeitet, wer Cloud-Dienste wie Dropbox, pCloud oder Google Drive nutzt, wer Ordner mit anderen teilt, und wer heruntergeladene Dateien auch viel später wiederfinden möchte, der legt sich Ordner an und verschiebt Dateien stets dorthin, wo sie hingehören.

Die Frau™ nennt diese Tätigkeit „Dateien schieben“ und bezichtigt mich, dies exzessiv und vornehmlich zu Entspannungszwecken zu tun. Dies weise ich weit von mir, das ist ein notwendiges Übel.

Es geht also darum, Dateien von mehreren Quellen korrekt auf mehrere Ziele mit dem korrekten Namen abzulegen. Und dabei noch weitere Veränderungen vorzunehmen falls nötig.

Hazel als Software im Zentrum

Das Verschieben von Dateien mache ich nicht gerne selbst. Denn spätestens bei der dritten gleichartigen Datei schreit mein Informatikerherz ob der wiederholten, stupiden manuellen Handlung nach Automatisierung.Hazel Logo

Diese Automatisierung gibt es, auf dem Mac heißt die Software Hazel. Passenderweise ist das Icon für dieses Programm ein Staubwedel, der symbolisieren soll, dass eine Dienstbotin mit Namen Hazel hinter einem herwedelt und das Dateisystem immer schön ordentlich hält. Die Software kostet etwas, und ich bin in diesem Fall weder als Affiliate noch sonst irgendwie damit verbandelt, sondern einfach nur begeisterter Anwender.

Was Hazel nun konkret macht, hängt davon ab, welche Regeln ich dem Programm vorgebe.

Quellen

Hazel überwacht bestimmte Ordner im Dateisystem auf Veränderungen. Welche Ordner dies sind, lege ich selbst fest. Damit der Computer nicht ausgebremst wird, empfiehlt sich, eher weniger als mehr Ordner überwachen zu lassen, und auch nicht unbedingt Ordner, in denen hochfrequent irgendwelche Dateien abgelegt oder geändert werden.

In meinem Fall sind dies die häufigsten Quellen für Dateien, als Ordner, in denen am ehesten neue Dateien, Dokumente auf den Computer gelangen:

  1. Downloads: Der ganz normale, vom Betriebssystem für jeden Benutzer angelegte Downloads-Ordner. Was ich im Browser herunterlade, kommt alles hier raus, falls ich nicht einen anderen Ordner angegeben habe. Damit besteht hier für mich der größte Bedarf nach automatisierter Ordnung.
  2. Referenzmaterial: Hier kommen alle Dateien an, die ich durch meinen Einzugscanner jage. Manche dieser PDF-Dokumente benötigen eine Nachbehandlung.
  3. Desktop: Ich habe meinen Desktop immer gerne so leer wie möglich. Manche Programme und Aktionen legen hier Dateien ab, die müssen weg.
  4. tmp: Im Ordner für temporäre Dateien sammelt sich viel Unrat an, der mit der Zeit aufgeräumt werden sollte.

Regeln für Referenzmaterial in Downloads

Bei den diversen Banken und Versicherungen bekommt man seine Dokumente mittlerweile online. Eben nicht per Mail, sondern indem man sich einloggt und die Dokumente dann als PDF herunterlädt. Diese ganzen Dokumente gehören natürlich nicht in den Downloads-Ordner, sondern zum Referenzmaterial. Das ganze aber mit solchen Dateinamen, dass ich sie später auch wieder finde. Ich muss also die Dateien erkennen, umbenennen und dann verschieben.

Für jede Institution folgen die Dateinamen einem bestimmten Muster. Und dieses Muster bringe ich Hazel in den Regeln bei. Da taucht beispielsweise immer dasselbe Schlüsselwort auf (dann ist es einfach), oder dieselbe Art einer Ziffernfolge (dann ist es ein bisschen schwieriger). Dabei muss ich darauf achten, dass die Muster nicht so allgemein sind, dass auch Dateien erfasst werden, die gar nicht dazu gehören.

Automatisierung mit Hazel: Downloads Overview
Übersicht der Ordner-Regeln für die Automatisierung in Hazel

Sind die Muster erfasst, lege ich die Handlungen fest. Also zunächst umbenennen, dann verschieben. Die jeweilige Regel teste ich mit dem, was eben momentan im Downloads-Ordner liegt, dann ist dieser Schritt der Automatisierung fertig.

Automatisierung mit Hazel_Banking_Move
Dateien nach Name finden und automatisch verschieben mit Hazel

Folgende Arten von Aktivitäten führe ich im Downloads-Ordner aus:

  • Videos, die länger als eine Woche hier liegen, werden in den Filme-Ordner verschoben. Die Wartezeit habe ich, damit nicht Videos, die ich nur mal kurz oder aus Versehen heruntergeladen habe, gleich abgelegt werden.
  • Verdienstmitteilungen, Kontoauszüge, Versicherungsmitteilungen werden identifiziert, gegebenenfalls umbenannt, damit sie meinem Namensschema der papierlosen Ablage genügen, und dann ins Referenzmaterial verschoben. Das Identifizieren vor dem Umbenennen geht teilweise nach Dateiname, bei manchen jedoch über die im PDF einkodierte Quell-URL.
  • Foto-Archive von Death to the Stock Photo, deren Fotos ich hier im Blog bisweilen verwende, werden automatisch ausgepackt, die Fotos mittels ImageMagick passend für den Blog verkleinert und mit dem Copyright-Hinweis versehen und in meinen Dropbox-Ordner für Blog-Fotos verschoben. Eine immense Aufwands- und Zeitersparnis.
Automatisierung mit Hazel: Banking_Rename
Dateien nach Inhalt finden und automatisiert umbenennen mit Hazel

Desktop sauber halten

Mac OS legt Screenshots, die mit den Tastenkombinationen CMD–3 oder CMD–4 angefertigt werden, standardmäßig auf dem Desktop ab. Da will ich sie natürlich nicht haben, sondern in einem zentralen Screenshots-Ordner in meiner Dropbox.

Dazu gibt es eine ganz einfache Regel, die Dateien im Desktop-Ordner mit Bildschirmfoto im Namen erkennt und entsprechend verschiebt.

Referenzmaterial klar halten

Ich mag meinen Workflow für die papierlose Ablage, und den dazu gehörigen Dokumentenscanner. Die Software für den Fujitsu ScanSnap iX500 erkennt die Ausrichtung der Blätter meistens selbständig. Manchmal jedoch wird eine Seite kopfüber eingelesen. Die Scanner-Software hat selbst leider keine Funktion, manuell die Seitenausrichtung einzelner Seiten nach dem Scannen in der Prüfansicht vor dem Speichern zu ändern.

Ich müsste also die PDF-Datei aus dem Referenzmaterial-Ordner hersuchen, mit der Vorschau auf dem Mac öffnen und die Seitenausrichtung ändern. Das möchte ich natürlich nicht immer tun.

Deshalb kann ich einfach im Scan-Dialog an den Dateinamen, den ich ja händisch vergebe, einen Unterstrich „_“ anhängen, Hazel findet diese Datei, führt ein Shell-Skript aus, welches danke PDFtk das gesamte PDF-Dokument um 180 Grad dreht und ohne Unterstrich im Dateinamen abspeichert.

Automatisierung: PDF-Dokumente drehen mit Hazel und PDFtk
Automatisierung: PDF-Dokumente drehen mit Hazel und PDFtk

Bei manchen Scans werden die meisten Seiten richtig in der Ausrichtung erkannt und nur ein oder zwei stehen falsch herum. Dann will ich natürlich nicht das ganze Dokument drehen, sondern das einfach in der Vorschau-App korrigieren.

Dazu füge ich an den Dateinamen ein Ausrufezeichen „!“ an. Hazel findet diese Datei und nimmt das als Anlass, die Datei eben mit der Vorschau-App zu öffnen. Das geht schneller und robuster als wenn ich anfange, in den Dateinamen die Seitenzahlen reinzukodieren, ist halt nur eine halbe Automatisierung.

Halbe Automatisierung: Dateien zur Klärung öffnen mit Hazel
Halbe Automatisierung: Dateien zur Klärung öffnen mit Hazel

Referenzmaterial verschlüsselt in die Cloud laden

Wer meinen Beitrag Mach ein Backup gelesen hat, der weiß, dass ich ein vollständiges automatisches Daten-Backup zu pCloud mache.

pCloud verschlüsselt ähnlich wie Dropbox standardmäßig die Übertragung und auf deren Server, aber eben nicht clientseitig. Das bedeutet, dass die Firma selbst und damit auch Nachrichtendienste einen Schlüssel haben und alles ansehen können. Während das für die meisten Dateien nicht relevant ist, möchte ich das für meinen Referenzmaterial-Ordner nicht. Deshalb nutze ich die Crypto-Option von pCloud, die direkt auf dem Client verschlüsselt, so wie das z.B. auch das Augsburger Softwareprodukt BoxCryptor für Dropbox u.a. macht. Warum nicht BoxCryptor? Ich wollte eine Lösung aus einer Hand, und mochte das Modell 1x-Kaufen reizvoller als monatliche Zahlung.

Der Crypto-Ordner allerdings muss separat mit eigenem Schlüssel geöffnet werden, und das eben auch lokal. Das heißt im ungeöffneten Zustand kann ich auch lokal nicht reinschauen. Das wiederum macht es für mich risikoreich, meinen Referenzmaterial in den Crypto-Ordner zu verlegen, denn bei einem Softwarefehler könnte ich gar nicht mehr reinschauen und verlöre alle meine Dokumente. Das ist nicht Sinn und Zweck eines Backups.

Also muss ich den Referenzordner in den Crypto-Ordner kopieren, und das immer wieder und automatisch. Dank Hazel muss ich mir hier nichts mit rsync bauen, da das Programm selbst eine Aktion zur asymmetrischen Synchronisierung von Ordnern hat.

Automatisiert Ordner synchronisieren mit Hazel
Automatisiert Ordner synchronisieren mit Hazel

So lasse ich den Referenzmaterial-Ordner überwachen, und Änderungen in den Crypto-Ordner replizieren. Auf diese Weise habe ich meinen ganz normalen, unverschlüsselten Referenzmaterial-Ordner und das verschlüsselte Cloud-Backup. Da Referenzmaterial nur wenige hundert Megabyte umfasst, macht mir die Doppelung der Dateien auf meinem Mac nichts aus.

Kompliziert? Nur einmal beim Einrichten, dann nicht mehr.

Tipps fürs Automatisieren

Wenn du dich im Web umsiehst, wirst du die unglaublichsten Rezepte für Hazel finden. Im Umgang mit diesem Tool für Automatisierung empfehle ich, folgende Prinzipien zu berücksichtigen, damit du nachher nicht schlechter dastehst als vorher.

  1. So wenig Ordner wie möglich überwachen lassen. Je mehr Ordner die Software überwacht, desto mehr Last erfährt der Computer, was sich auf Performance und Akkulaufzeit auswirkt. Außerdem verlierst du rasch den Überblick, und dann geschehen auf einmal Dinge, die du gar nicht wolltest.
  2. So einfache Regeln wie möglich. Die einfachste Regel und Aktion ist meist die beste, denn die verstehst du auch noch in ein paar Monaten selbst. Je ausgefeilter die Erkennungsmuster und Aktionen werden, desto eher verlierst du den Überblick, und dann geschehen auf einmal Dinge, die du gar nicht wolltest.
  3. So wenig Regeln wie möglich. Es gilt dasselbe wie bei den beiden vorigen Prinzipien. Einfach gewinnt.

Einfach gewinnt fast immer. Komplizierte Vorgehensweisen machen die ganze Automatisierung komplex, und das macht es schwieriger für dich, das ganze am Laufen zu halten. Und baue deine Rezepte und Regeln selbst, denn nur dann weißt du, was sie wirklich tun.

Automatisierung bringt nur etwas, wenn du in Summe mehr Aufwand dadurch ersparst als du durch Einrichtung verbrätst.

Also immer überlegen: Brauche ich das, was ich da mache, tatsächlich? Tritt es oft genug auf?

Hazel für Windows?

Hazel ist eine reine Mac-Software, das heißt es gibt sie nicht für Windows, das ich im Hauptberuf verwende. Für Windows habe ich mich noch nicht final entschieden. Das kommerzielle Tool File Juggler ist eine Option, derzeit verwende ich jedoch das quelloffene DropIt.

Die Hauptfunktionalität von DropIt ist ein Symbol auf dem Desktop, auf dem man beliebige Dateien und Ordner per Drag & Drop fallen lässt und daraufhin Aktionen durchgeführt werden. Das brauche ich nicht, jedoch kann DropIt auch Ordner überwachen, und das auch ohne Admin-Rechte.

Dabei musste ich feststellen, dass zum einen DropIt mit einem festen Prüfzyklus arbeitet, also beispielsweise alle 60 Sekunden nachsieht, ob sich etwas geändert hat. Das erzeugt Prozessorlast. Außerdem wird zunächst der komplette Ordner indiziert. Enthält der Ordner viele Dateien, so wird DropIt sehr träge, bis hin zum Einfrieren. Deshalb verwende ich es derzeit nur auf den Downloads-Ordner, und auch diesen habe ich zunächst händisch von ausgepackten Downloads großer Installationsarchive befreit.

Eine finale Empfehlung für Windows möchte ich daher noch nicht aussprechen, weil das eine nicht optimal ist und das andere ich noch nicht selbst getestet habe.

Für Mac schon: Hazel kostet Geld, und ist mir jeden Cent wert.

Locker bleiben

Und wie siehst Du das? Was verwendest du zur Automatisierung auf dem Computer? Was automatisierst du und wie?

Lasse die anderen Leser ebenso wie mich teilhaben an Deinen Gedanken und kommentiere!

Photo: www.joachimschlosser.de, License Creative Commons Attribution Share-Alike

MerkenMerkenMerkenMerken

MerkenMerken

Teilen & Verweilen

Kommentare

13 Antworten zu „Dokumente und Dateien automatisiert ablegen: Immer aufgeräumt“

  1. Hi Dr. Joachim, vielen Dank für diesen hilfreichen Beitrag! Es ist mir unerklärlich, aber ich bin über diesen Blog gestolpert, während ich nach Google Drive Synchronisations-Fehlern gesucht habe. Jedenfalls würde mich interessieren, ob über 3 Jahre später Hazel weiterhin im Einsatz ist oder inzwischen vielleicht durch die boardeigene Automator-App abgelöst wurde? VG aus Butthausen

    1. Hazel ist für mich immer noch das Mittel der Wahl und rennt hier nach wie vor.

  2. Avatar von Guido

    Hallo,

    zunächst einmal vielen Dank für die tollen Artikel und Anregungen. Ich hatte Mitte 2019 die Nase voll, immer noch in Ordnern nach alten Unterlagen zu suchen. Das Einscannen von PDFs mit meinem MFP machte keinen Spaß und da der ADF nur einseitig scannen kann, hat mich letztendlich die Geschwindigkeit immer wieder vom Scannen abgehalten. Trotzdem wollte ich alle Dokumente als PDF auf meinem NAS haben.

    Daher habe ich mir zunächst einen Dokumenten Scanner zugelegt und zwar den Brother ADS-1700W, da ich Dokumente direkt auf das NAS Scannen wollte, ohne den Rechner anmachen zu müssen. Mit Stichtag 01.01.2020 wird jetzt alles gescannt, was ins Haus kommt und keine Werbung ist.

    Im nächsten Schritt habe ich mir dann eine OCR-Lösung direkt auf dem NAS (synOCR) installiert. Nun wird meine Scan-Ablage alle 10 Minuten nach neuen Dokumenten durchsucht und diese per OCR durchsuchbar gemacht.

    Der nächste Schritt war etwas tricky. Solange ich noch meinen MAC hatte, war ich mit Hazel glücklich. Leider musste dazu der MAC immer laufen bzw. angeschaltet werden. Nach dem Wechsel zu einem PC, musste ich für Hazel einen Ersatz finden. Der FileJuggler hatte mich „fast“ überzeugt, aber der Kaufpreis und der fehlende Support , sowie die lange Update Pause der Lösung haben für mich nicht zusammengepasst.

    Der nächste Kandidat und derzeit aktuell im Test ist „Organize“ – gefunden auf GitHub. Das Ganze kann man auch per Docker auf dem NAS laufen lassen.

    Nun werden die Dokumente, nach dem OCR-Prozess mit regulären Regeln überprüft und automatisch umbenannt und verschoben. Das alles, ohne den Rechner anmachen zu müssen. Damit bin ich dem digitalen Büro einen großen Schritt näher gekommen.

    1. Wunderbar, danke! Ja, da kann man schon einiges mehr machen.

    2. Hallo Guido says

      Gibt es eine Anleitung wie man den “Organize” auf NAS unter Docker zum laufen bringt?

      Danke

    3. Avatar von Guido von Gösseln
      Guido von Gösseln

      Die Anwendung „Organize“ findet man auf GitHub. Die Anleitung mit der ich die ersten Schritte hinbekommen habe, fand ich im Synology Support Forum:

      https://www.synology-forum.de/threads/synocr-gui-fuer-ocrmypdf.99647/post-870777

      Die Einrichtung der Anwendung „Organize“ ist das auf den Seiten des Entwicklers sehr gut beschrieben. Unbedingt darauf achten, dass bei den Skripten, die Einrückung der Spalten wichtig ist.

  3. Avatar von Marco

    Hallo Joachim,

    toller Artikel, vielen Dank dafür!

    Nun habe ich noch eine Frage:
    Ich benutze auch den iX500 + Hazel (und bei Windows schaue ich mir noch den File Juggler an).
    Ich möchte monatlich einen ganzen Stapel Mitarbeiter-Abrechnungen einscannen. Dabei soll automatisiert aus dem Dokument der Name + Monat-Jahr ausgelesen und in den Dateinamen geschrieben werden. Weißt du, ob das irgendwie möglich ist?

    Grüße,
    Marco

    1. Wenn die Texterkennung/OCR aktiviert ist und die gesuchten Informationen immer an derselben Stelle stehen, dann müsste man das schon einrichten können. Selbst benötigt und probiert habe ich es noch nicht.

  4. Moin
    vielen Dank. Ich bin seit Jahren bei File Juggler unter Windows gelandet. Nicht perfekt, aber eine große Erleichterung.

  5. Avatar von Andreas

    Hallo Joachim,

    Deine Artikel sind Resultat einer Praxis auf dem sicherlich langen Weg zu Deiner heutigen papierlosen Ablage, also Anregung pur durch das Benennen der Entscheidungen für Hard-, Software und Workflow. Dank dafür!

    Die Dokument-Suche und das Finden durch / im -Dateinamen- und das Aufstellen von Regeln dieser hatte ich bis vor zwei Jahren ähnlich gemacht, auch in immer flacher werdenden Strukturen (vor 20 Jahren waren es komplexe Ordner mit kurzen Namen). Der wesentliche Vorteil Dateinamen für die Suche zu verwenden besteht aus meiner Sicht darin, Verwaltungs-Software unabhängig zu sein und in den besser gewordenen Suchmöglichkeiten mit Betriebssystem „Bordmitteln“.
    Seit einiger Zeit verwende ich jedoch die Software „ecoDMS“. Diese läuft bei mir via Docker auf einem NAS. Auf Dateinamen muss ich nicht mehr achten. Vorhandene Dokumente werden ebenso wie die den Dokumenten-Scanner verlassende Papier-Scans inhaltlich gut erkannt, dass ein Auffinden funktioniert. Sind Dokumentenarten und die Klassifizierung der Dokumente eingerichtet, das ist die Hauptvorbereitungszeit, funktioniert das Erfassen und „Einsortieren“ der Dokumente sehr rasch. Für mich war das auslösende Moment für die Entscheidung auf eine solche Ablage „umzusteigen“, die gesetzliche Vorgabe einer revisionssicheren Verwaltung. Dennoch, Deine Variante mag auch in Zukunft sicherlich die Flexibelste sein. Ähnlich ist das auch mit Bildern. Befüllte IPTC-Felder eines Bildes sind weitestgehend unabhängig von der Verwendung bestimmter Software. Schließlich wollen „wir“ nicht noch einmal mit einem Archiv neu beginnen (müssen) und möglichst den Workflow auch in zeitlicher Hinsicht optimieren.

    Auf Deine Artikel freue ich mich und grüße die Leser und Dich
    Andreas

  6. Toller Artikel vielen Dank dafür.

  7. Hallo Joachim,

    zunächst mal vielen Dank für die tolle Blog-Posts. Diese haben mich schon in vielen Fällen nach vorne gebracht. Ich verfolge deinen Blog nun schon einige Zeit und bin vor etwa 1,5 Jahren darauf gestoßen, als ich Informationen über One Note gesucht habe. Seit dem bin ich „hängen“ geblieben und freue mich jedes Mal, wenn es etwas neues gibt – hoch lebe der Feed.
    Zu aktuellem Thema habe ich in den letzten Wochen ebenfalls ein brauchbares Tool für Windows gesucht, bin aber mangels Zeit noch nicht zum Probieren gekommen. Das „Hazel für Windows“ habe ich jedenfalls noch nicht gefunden oder gesehen. Ich bilde mir ein, dass gerade in der Windowswelt viele Tools brauchbar aber völlig überladen sind mit Funktionen, die keiner braucht…
    Nun ja, wir werden sehen. Falls ich vor dir fündig werde, lasse ich es dich wissen!

    Viele Grüße und mach weiter so! :)
    Volker

    1. Danke, Volker, den File Juggler werde ich mir auch noch ansehen. Stimmt, viele Tools sind zu überladen oder nicht schön gemacht.

Schreiben Sie einen Kommentar

Ihre E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert