wget --output-document und das Datum der Datei

Kommentieren Jun 02 2010

 

Wenn man mit wget eine URL abfrägt und sich das Ergebnis in eine Datei schreiben lässt, dann wird man sich freuen oder nicht.

Denn die Datei hat das Datum der angefragten URL.

In vielen Fällen nützlich. Aber leider nicht immer.

Wenn man nun diese Methode dazu nimmt um Inhalte mit anderen abzugleichen, dann kommt man zu dem Punkt bei dem man sich frägt wie oft dies geschehen soll. Ok hat man die Möglichkeit auf einen cronJob dann ist das eh egal.

Hat man aber diese Möglichkeit nicht, dann muss man sich irgendwas einfallen lassen, wie man herausfinden kann ob man die Aktion erneut ausführen soll oder nicht. Denn es ist ja unnötig die Abfrage zu starten wenn eh nichts neues dabei raus kommt.

Da ja nun die Datei aber das Erstelldatum hat und nicht das Datum an dem die letzte Abfrage durchgeführt wurde, kann man nicht über die Datumsinfo der Datei gehen wie alt den diese ist. Oder doch ?

Nun ja im Grunde ganz einfach ;-)

#!/bin/bash

wget -q urld.de -O savefile.html

touch -d `date +%R` savefile.html


Damit wir das Änderungsdatum der savefile.html Datei auf die aktuelle Systemzeit gesetzt.

Somit hat man nun die Möglichkeit über das Änderungsdatum der Datei herauszufinden ob diese zu alt ist oder nicht.