Dateioperationen
ZIP-Entpacker
Entpacke ZIP-Dateien vollständig im Browser und liste, prüfe und lade den Inhalt herunter. Erkennt und korrigiert automatisch verstümmelte Dateinamen aus ZIP-Dateien, die unter Windows (Shift_JIS) erstellt wurden. Die Dateien werden niemals an einen Server gesendet.
Tipps zum Entpacken von ZIP-Dateien
- Verstümmelte Dateinamen entstehen meist dadurch, dass das ZIP-Format selbst in vielen Fällen nicht speichert, welche Zeichenkodierung ein Dateiname verwendet. Eine unter japanischem Windows erstellte ZIP-Datei nutzt fast immer Shift_JIS, während die meisten anderen UTF-8 verwenden – wenn Namen also verstümmelt aussehen, versuche, die Kodierung im Dropdown auf Shift_JIS umzustellen.
- Dateien, deren UTF-8-Kodierung innerhalb der ZIP-Datei selbst ausdrücklich markiert ist, erhalten niemals die Markierung ?. Nur Dateinamen, die erraten werden mussten, tragen diese Markierung.
- Klicke auf eine Ordnerzeile, um sie ein- oder auszuklappen. Klicke auf eine Dateizeile, um Text- oder Bilddateien direkt dort in der Vorschau anzuzeigen.
- In Chrome oder Edge wird bei der Auswahl eines Ordners über „Alles entpacken" alles direkt unter Beibehaltung der ursprünglichen Ordnerstruktur geschrieben. In anderen Browsern werden die Dateien einzeln heruntergeladen, wobei die Ordnerstruktur nicht erhalten bleiben kann (stattdessen wird der Pfad mit Unterstrichen in den Dateinamen aufgenommen).
Häufig gestellte Fragen
Übrigens – Warum ZIP-Dateinamen verstümmelt werden
Als das ZIP-Format 1989 entstand, gab es keinen Mechanismus, um festzuhalten, welche Zeichenkodierung ein Dateiname verwendet. Jedes Land und jedes Betriebssystem schrieb Dateinamen einfach in seiner eigenen lokalen Kodierung (Shift_JIS für Japanisch, Windows-1252 für westeuropäische Sprachen usw.), sodass verstümmelter Text beim Öffnen einer ZIP-Datei auf einem anderen System gewissermaßen „spezifikationsgemäßes Verhalten" war.
Um dieses Problem zu lösen, wurde ab etwa 2007 ein Mechanismus namens „Language Encoding Flag (EFS)" eingeführt. Er nutzt ein einzelnes Bit in den Flags jedes ZIP-Eintrags, um explizit zu kennzeichnen: „Dieser Dateiname ist in UTF-8 geschrieben." Da aber ältere ZIP-Tools sowie manche Software, die dieses Flag bis heute nicht setzt, weiterhin im Einsatz sind, ist das Problem verstümmelter Dateinamen zwischen Windows und Mac auch in den 2020er-Jahren noch nicht vollständig gelöst.
Wichtig ist: Diese Verstümmelung ist keine Beschädigung der Daten selbst. Der eigentliche Dateiinhalt (die Bytes des Textes oder Bildes) bleibt vollkommen intakt – lediglich der Dateiname, ein Stück Metadaten, wird nach der falschen Regel interpretiert. Genau deshalb kann ein Werkzeug wie dieses den korrekten Namen nachträglich wiederherstellen, sobald die richtige Kodierung bekannt ist.