Menü Navigation schließen
Menü
Suchen

Webseiten speichern

Mit der Speicherung einer Webseite können verschiedene Ziele verfolgt werden:

  1. Soll das „look and feel“ und die Funktionalität eines Webauftritts gesichert werden?
  2. Sollen bestimmte Inhalte (Texte, Bilder, Filme…) dauerhaft gesichert werden?
  3. Soll eine schnell rekonstruierbare Version der Webseite gespeichert werden?

Abhängig davon, warum eine Website gesichert werden soll, ergeben sich verschiedene praktische Ansätze.

Webseiten „look and feel“ inklusive Funktionalitäten speichern

Die einfachste Möglichkeit eine Webseite zu speichern, besteht darin, sie lokal über den Browser auf den eigenen Rechner zu sichern. Gängige Browser bieten an, entweder die komplette Webseite inklusive Grafikdateien, nur HTML-Seiten oder nur den Text zu sichern. Dies geschieht in der Regel über die Browserfunktion Datei / Speichern unter. Es besteht auch die Möglichkeit, über Plugins die Seite als pdf-Datei zu speichern.

Möchte man aber den gesamten Webauftritt mit allen Unterseiten und weiterführenden Links speichern, so benötigt man eine bestimmte Software. Crawler-Software „kriecht“ von einem Start-URL (Uniform Resource Locator) über einen vom Benutzer definierten Bereich und speichert das Ergebnis in verschiedenen Dateiformaten lokal ab. So wird eine statische Kopie des Webauftritts erstellt. Mit einem Browser kann die lokal gespeicherte Seite dann aufgerufen werden.

Für den privaten Gebrauch eignet sich z.B. das kostenfrei herunterladbare Werkzeug httrack (deutschsprachige Kurzanleitung). Bei den Crawling-Einstellungen ist zu beachten, dass häufig Inhalte auf verschiedenen Plattformen/Servern (z.B. Filme bei Youtube, Podcasts bei Podigee etc.) gehostet werden. Diese Internetadressen müssen beim Crawlen dann mitberücksichtigt werden.

Verschiedene Software-Tools sind unten exemplarisch aufgelistet. Häufig werden diese Werkzeuge auch als „Offline-Browser“ bezeichnet. Sie wurden in Zeiten vor den heute kostengünstigen Daten-Flatrates entwickelt, um kostenpflichtiges Surfen zu vermeiden. Unter diesem Begriff lassen sich auch weitere Software-Tools im Internet finden.

Inhalte dauerhaft sichern

Problematisch bleibt, dass diese lokale Version der Webseite viele unterschiedliche Dateiformate und Skripte enthält. Nicht alle diese Formate sind für eine dauerhafte Sicherung geeignet. Das bedeutet, dass ihre Darstellung (das Anzeigen oder Abspielen) später eventuell nicht mehr möglich ist.

Die technische Umgebung, in der gespeicherte Webseiten angesehen werden können, verändert sich ebenfalls. Browsertechnologien unterliegen einem rapiden technischen Wandel. Auch deshalb besteht die Möglichkeit, dass die „korrekte“ Darstellung der Webseite langfristig eingeschränkt ist. Wenn man also bestimmte Inhalte (Texte, Bilder, Filme, Töne) dauerhaft sichern möchte, sollte man diese aus dem Kontext einer gespeicherten Webseite herauszulösen. Am besten macht man dies bereits bevor man den Inhalt auf die Webseite hochlädt. Hochauflösende Fotos werden beispielsweise für die Webseite heruntergerechnet und hochgeladen. Das hochauflösende Foto selbst wird in einem geeigneten Format gespeichert (siehe hierzu: Erstellen einer Fotodokumentation) .

Backup

Bei einem Hackerangriff auf die eigene Webseite, versehentlichen Löschungen oder schweren technischen Problemen helfen die oben beschriebenen Sicherungsmaßnahmen in der Regel nicht. Die Webseite kann hiermit nicht ohne Weiteres wiederhergestellt werden. Ein möglichst regelmäßig erstelltes Backup ist daher empfehlenswert. Dabei werden nicht nur die Text- und Grafikelemente gesichert, sondern auch Inhalte aus Datenbanken und deren Struktur aus einem Content Managemenet System (CMS). Gängige Möglichkeiten zur Erstellung eines Backups sind:

  • Automatisierte Backups über den Hoster der Webseite
  • Manuelle Backups per FTP-Client
  • Backup über Plugins des Content Management Systems (z.B. BackWPup Plugin für WordPress)

Das Backup muss regelmäßig erstellt werden, damit eventuelle Datenverluste so gering wie möglich sind. Bei der Beurteilung einer Backup-Lösung sollte auch darauf geachtet werden, wie aufwändig das Zurückspielen eines Backups ist.

Zusammenfassung und Tipp

Unter Abwägung von persönlichen Bedürfnissen und zeitlichem Aufwand wird man vielleicht eine Mischung aus verschiedenen der oben genannten Maßnahmen ergreifen.

Sollte die Webseite von Interesse für die Öffentlichkeit sein (Verein, Bürgerinitiative etc.) besteht die Möglichkeit, sie aktiv einem zuständigen Archiv anzubieten. Archive betreiben für ihre digitalen Objekte – darunter auch Webseiten – professionelle Sicherungsmechanismen, die die Verfügbarkeit der digitalen Objekte langfristig gewährleisten.

Weitere Informationen

Backups vom Fließband Mit Duplicati in fünf Minuten zum Trojaner-sicheren Backup

Ronald Eikenberg:

Backup erstellen – so macht man es von Hand

Eric-Oliver Mächler:

Tools

HTTrack

HTTrack ist ein kostenfreies Werkzeug , das eine funktionsfähige lokale Kopie einer Webseite mit CSS, HTML, Skripten und Bildern erzeugt. Es gibt für die englischsprachige Version auch ein deutschsprachiges Tutorial.  

Webspider

Webspider ist ein kostenfreies Werkzeug für die Offline-Speicherung (Spiegelung) von Webseiten.

Pablo

Pablo ist ein kommerzielles Werkzeug, das für jede Webseite einen Screenshot als Bilddatei und eine professionelle Strukturdatei (METS -Datei) erstellt. Die Bilddatei zeigt die Webseite im Browser und man kann weiterhin in den Bilddateien „surfen“. Dynamische Inhalte können nicht dargestellt werden.

Offline Explorer

Offline Explorer ist ein Werkzeug mit dem bis zu 2000 Dateien einer Webseite kostenlos gespiegelt werden können. Für umfangreichere Webseiten gibt es eine kostenpflichtige Pro Version.

Heritrix

Heritrix ist ein professioneller Open-Source-Crawler und – Harvester, welcher in den Dateiformaten WARC und ARC speichert. Heritrix hat keine grafische Benutzeroberfläche und ist nur technisch versierten Benutzern zu empfehlen. Crawls können sehr feinteilig definiert werden. Für eine einmalige Offline-Speicherung (Spiegelung) einer kleinen Webseite ist dieses Werkzeug aufwändig zu installieren bzw. überdimensioniert.

WebCopier

 WebCopier lädt komplette Websites herunter, die Links werden so konvertiert. dass sie auch offline funktionieren. Es gibt eine 7 Tage kostenfreie Version sowohl für Windows wie auch für Mac.

Duplicati

Duplicati ist eine freie Software zum Erstellen von Datensicherungen. Sicherungen können verschlüsselt werden. Die Sicherungen können auf unterschiedlichen Datenträgern (auch Cloud-Services) abgelegt werden.