Dateiformate
Mit der Wahl des richtigen Dateiformats können Sie ganz wesentlich dazu beitragen, dass Sie Ihre Dateien auch zukünftig nutzen können. Eine wichtige Regel ist dabei ein Format zu wählen, das weit verbreitet und anerkannt ist. Dennoch bleiben Unwägbarkeiten, die beachtet werden sollten. Diese betreffen Privatleute genauso wie Archivierungsprofis.
Digitale Informationen sind immer in Bits und Bytes und damit in „0“ und „1“ codiert. Eine Datei besteht also aus einer lange Folge von „Nullen“ und „Einsen“. Damit man sich ein digitales Objekt, z.B. einen Text oder ein Foto, anschauen können, muss eine Software diese Bitfolge lesen können. Die Regel dafür ist im Dateiformat festgelegt. Nur wenn die Anwendungssoftware dieses Format lesen kann, werden die darin codierten Informationen auf dem Bildschirm dargestellt.
Vermeiden Sie herstellerspezifische Formate
Sie haben Fotos mit einer Digitalkamera aufgenommen, die produktspezifische (auch „propriertär“ genannte) Dateiformate produziert. Dann kann es gut passieren, dass die Fotodatei mit den heute allgemein verwendeten Programmen (z.B. Windows Media Player oder IrfanView) nicht mehr geöffnet werden kann. Folglich sollten Sie, wenn Sie digitale Objekte dauerhaft nutzen wollen, diese entweder
- regelmäßig in andere, aktuellere Formate konvertieren
- oder grundsätzlich nur Dateiformate verwenden, die so weit verbreitet und anerkannt sind, dass sie sehr wahrscheinlich auch in der Zukunft noch von den meisten Programmen gelesen werden können.
Dateiformate im privaten Umfeld
- Vermeiden Sie einen „Formatzoo“, d.h. nutzen Sie möglichst wenig unterschiedliche Dateiformate.
- Wählen Sie Archivformate aus dem professionellen Bereich, wenn Ihnen dies möglich ist (z.B. speichern Sie Texte im TXT- und/oder PDF/A-Dateiformat).
- Wenn Ihnen Archivformate aus dem professionellen Bereich zu speicherintensiv sind oder auch dort (noch) nicht klar definiert wurden, kann es besser sein, weit verbreitete Dateiformate zu wählen (selbst wenn diese mit gewissen Risiken verbunden sind). Bei weit verbreiteten Formaten ist die Wahrscheinlichkeit sehr hoch, dass später Lösungen für die Überführung in längerfristig günstige Dateiformate gefunden werden.
- Prüfen Sie regelmäßig, ob Sie Ihre Dateien noch aufrufen können – um ggf. zeitnah handeln zu können.
Empfehlungen für Dateiformate
Folgende Formatstandards können derzeit aus professioneller Sicht als relativ langzeitstabil empfohlen werden:
++ geeignet / + mit Einschränkungen geeignet / – mit Risiken behaftet
Texte und Tabellen
Nr | Art | Endung | Bewertung | |
1 | Text | ++ | ||
2 | Text | txt | ++ | |
3 | Text, Tabelle | xml | ++ | |
4 | Tabelle | csv | + |
Erläuternde Bemerkungen:
- Das Portable Document Format (PDF) ist grundsätzlich als Archivformat geeignet. In der professionellen Archivierung wird in der Regel PDF/A-1 oder PDF/A-2 verwendet. PDF/A ist eine international standardisierte Version des PDF-Formats, das für die langfristige Archivierung und Aufbewahrung elektronischer Dokumente entwickelt wurde. Eine PDF/A-konforme Datei beinhaltet alle Teile, die für die eindeutige Wiedergabe benötigt werden (z.B. sind Schriften eingebettet). Die verschiedenen PDF-Varianten sind nicht über die Dateiendung erkennbar. Microsoft Office und Open Office unterstützen mittlerweile die Erstellung von PDF/A Dokumenten. (Anleitung zur Erstellung von PDF/A Dokumenten)
- TXT ist das stabilste Format der Informatik. Layout- und Formatierungsangaben sind in diesem Format allerdings kaum vorhanden.
- XML ist eine Auszeichnungssprache. Es werden hierarchisch strukturierter Daten im Format einer Textdatei dargestellt. Die Datei ist sowohl von Maschinen, wie auch von Menschen lesbar.
- In CSV-Dateien werden Werte, Felder und Spalten durch Trennzeichen (normalerweise das Komma) separiert in einer Textdatei abgespeichert. Das Format ist für das Speichern von Tabellen geeignet. Verschachtelte Tabellen sollten besser in XML abgespeichert werden.
Fotos und Grafiken
Nr | Art | Endung | Bewertung | ||
1 | Foto | tiff, tif | ++ | ||
2 | Foto | jpg | – | ||
3 | Grafik | png | ++ | ||
4 | Vektorgrafik | svg | – |
Erläuternde Bemerkungen:
- Im professionellen Bereich ist das TIFF-Format der quasi-Standard für die Archivierung von Fotos und Bildmaterial. Das Format benötigt viel Speicherplatz, da in ihm Daten in der Regel unkomprimiert gespeichert werden
- Das JPG-Format ist das weltweit verbreitetste Format für digitale Fotos. Daten werden komprimiert und damit mit Informationsverlusten abgespeichert. Das Format benötigt wenig Speicherplatz. Allerdings besteht bei Migrationen, also wenn das Format in ein anderes Dateiformat überführt werden muss, das Risiko von Informationsverlusten. Einrichtungen, die einen langfristigen Bewahrungsauftrag auch für digitale Daten haben, wie Bibliotheken, Archive und Museen, meiden daher das JPG-Format.
- Im PNG-Format werden Daten verlustfrei komprimiert abgespeichert, das Format wird häufig für Grafiken / Diagramme verwendet.
- Für Vektorgrafiken (CAD-Zeichnungen, Grafiken und Diagramme) hat sich bislang kein stabiler Standard entwickelt, die Library of Congress empfiehlt mit Einschränkungen das SVG-(Scalable Vector Graphics) Format.
Audio- und Videoformate
Nr | Art | Endung | Bewertung | |
1 | Audio | wav | ++ | |
2 | Audio | flac | + | |
3 | Audio | mp3 | – | |
4 | Film | keine Formatempfehlung |
Erläuternde Bemerkungen:
- Das WAV-Format wird in der Regel zur Archivierung von Audiodateien empfohlen. In den Gedächtnisinstitutionen wird WAV häufig mit dem Audiocodec PCM / unkomprimiert gespeichert. Die Dateien werden damit sehr groß.
- Alternativ verwenden Archive um die Speicherkapazität zu reduzieren häufig auch Flac. Flac ist ein Codec zur verlustfreien Kompression von Audiodaten und benötigt ca. 60 % des Speicherplatzes von WAV.
- MP3-Dateien sind kleiner, da in diesem Format die Daten komprimiert werden. Ähnlich wie JPG im Bildbereich werden bei einer Überführung in ein anderes Dateiformat (Migration) weitere Informationsverluste verursacht. Im privaten Bereich stellt das Format eventuell eine Alternative zu WAV dar. Es ist weit verbreitet und es gibt zahlreiche Player (Software), die das Format abspielen. Sie können also davon ausgehen, dass es später Softwarelösungen geben wird, die eine Migration in ein neues Format ermöglichen. Allerdings u.U. mit im Moment nicht genau zu benennenden Qualitätsverlusten zur Originaldatei..
- Es hat sich bislang kein Standard für die Archivierung von digitale Filmdaten durchgesetzt. Es gibt Formate, die bezogen auf das Verhältnis Komprimierung zu Speicherplatzbedarf ein vergleichsweise gutes Ergebnis erzielen und damit von Gedächtnisinstitutionen als geeignet angesehen werden können (FFV1 FFmpeg-Videokodec im Matroska oder Avi Container, Dateiendung .mkv oder avi; Motion JPEG2000, Dateiendung: .mj2, .mjp2). Allerdings sind diese Formate noch vergleichsweise neu und ihre Verbreitung ist nicht sehr groß. Ähnlich wie beim Bildformat JPG oder dem Audioformat mp3 kann es eine Strategie sein, ein weit verbreitetes Format als persönliches Archivformat zu wählen, auch wenn dieses die Daten komprimiert.
Zusammenfassung
Jedes digitale Format birgt ein gewisses Risiko. Gedächtnisinstitutionen, d.h. z.B. Archive, Bibliotheken und Museen, versuchen mit hohem technischen, personellem und auch finanziellem Aufwand dieses Risiko so klein wie möglich zu halten. Dies machen diese Organisationen übrigens z.B. auch für analoge Objekte aus Papier. Kaum jemand hat zuhause für seine Papierunterlagen permanent 18 Grad, eine relative Luftfeuchtigkeit von 40-55 % und lagert diese in säurefreien Kartons und in Räumen mit einem hohem Brandschutz. Dennoch gehen die meisten Menschen zu Recht davon aus, dass ihre Papierunterlagen zuhause vergleichsweise risikoarm lagern. Daher sollte man auch bei digitalen Unterlagen seine persönlichen Möglichkeiten und Ansprüche nicht unbedingt an professionellen Gedächtnisinstitutionen messen, sondern bei den Dateiformaten zwischen Aufwand und Risiko abwägen.
Weitere Informationen
Katalog archivischer Dateiformate (KAD)
https://kost-ceco.ch/cms/dateiformate.html
Deutschsprachige Auflistung und Bewertung von archivischen Datenformaten der schweizerischen Koordinationsstelle für die dauerhafte Archivierung elektronischer Unterlagen KOST. , KOST (Koordinationsstelle für die dauerhafte Archivierung elektronischer Unterlagen),
Archivtaugliche Dateiformate
https://documentation.library.ethz.ch/display/RC/Archivtaugliche+Dateiformate
Bezieht sich auf Forschungsdaten, aber deswegen interessant, weil hier zwischen archivierungstauglichen, begrenzt archivierungstauglichen und nicht archivierungstauglichen Formaten unterschieden wird, ETH Zürich,
Memoriav Empfehlungen Digitale Archivierung von Film und Video
https://memoriav.ch/wp-content/uploads/2017/09/Empfehlungen_Digitale-Archivierung_Version1.1_DE.pdf
Memoriav – Verein zur Erhaltung des audiovisuellen Kulturgutes der Schweiz, 2017,
Leitfaden für die digitale Langzeitarchivierung audivisueller Medien
https://d-nb.info/1159746311/34
NESTOR MATERIALIEN 19 Leitfaden für die digitale Langzeitarchivierung audiovisueller Medien, Kompetenznetzwerk Langzeitarchivierung und Langzeitverfügbarkeit Digitaler Ressourcen für Deutschland, 2016,
Unterschied von WAV und MP3: Was ist geeigneter wofür?
https://praxistipps.chip.de/unterschied-von-wav-und-mp3-was-ist-geeigneter-wofuer_49409
Tim Ziemer: Unterschied von WAV und MP3: Was ist geeigneter wofür?, CHIP-Praxistipp vom 31.08.2016, 2016,
Recommended Formats Statement
https://www.loc.gov/preservation/resources/rfs/TOC.html
Library of Congress Recommended Formats Statement , Library of Congress, 2020,