» SelfLinux » Internet » Web » Tools » wget » Abschnitt 2 SelfLinux-0.10.0
zurück   Startseite Kapitelanfang Inhaltsverzeichnis GFDL   weiter

SelfLinux-Logo
Dokument wget - Abschnitt 2 Revision: 1.1.2.7
Autor:  Johnny Graber
Formatierung:  Torsten Hemm
Lizenz:  GFDL
 

2 Spiegeln von Webseiten

Mit wget können nicht nur einzelne Dateien gespeichert, sondern auch ganze Seiten gespiegelt werden. Die dafür zu verwendende Option ist -r. Damit wird bei der angegebene Seite rekursiv den Links gefolgt. Standardmässig folgt -r den Links 5 Ebenen entlang. Dabei wird nicht unterschieden, ob die Seite vom gewünschten Server stammt, oder nicht.

Die Sache mit den Ebenen ist am Anfang recht mühsam zu verstehen. Man muss sich dies wie eine gewöhnliche Sitzung mit einem Browser vorstellen. Jeder Link, den man anklickt, öffnet eine neue Ebene. Ein -r bedeutet also, das man von der Startseite 5 tiefer gelegene Seiten aufrufen kann.

Weist ein Link auf der 2. Seite zu de www.linux.de, wird auch dort wiederum den Links gefolgt und die Dateien auf dem eigenen Rechner abgelegt. Je nach Seiten kann dies sehr schnell mühsam werden.

Die Option -l num steht für "level" und passt die Tiefe von -r an. num muss durch eine beliebige positive Zahl ersetzt werden.

user@linux ~$ wget -r -l 2 www.selflinux.de

Speichert alle Dateien, die über eine andere Datei verlinkt sind, im Verzeichnis www.selflinux.de. Die gefundene Verzeichnisstruktur wird dabei übernommen. Allerdings wird nur 2 Ebenen tief gesucht, was bei grossen Kapiteln dazu führt, das nicht alle Dateien heruntergeladen werden.

wget ist gut um sich schnell einige Seiten zu holen. Für ein effektives Spiegeln eines Servers sollte man sich ein anderes Tool suchen.



zurück   Seitenanfang Startseite Kapitelanfang Inhaltsverzeichnis GFDL   weiter