Operaciones con archivos
Extractor de ZIP
Extrae archivos ZIP por completo en tu navegador y muestra, previsualiza y descarga su contenido. Detecta y corrige automáticamente los nombres de archivo con caracteres corruptos de los ZIP creados en Windows (Shift_JIS). Los archivos nunca se envían a un servidor.
Consejos para extraer archivos ZIP
- Los nombres de archivo con caracteres corruptos suelen deberse a que el propio formato ZIP, en muchos casos, no guarda qué codificación de caracteres usa un nombre de archivo. Un ZIP creado en Windows japonés casi siempre usa Shift_JIS, mientras que la mayoría de los demás usan UTF-8; así que, si los nombres se ven corruptos, prueba a cambiar el desplegable de codificación a Shift_JIS.
- Los archivos cuya codificación UTF-8 está marcada explícitamente dentro del propio ZIP nunca reciben la marca ?. Solo llevan esa marca los nombres de archivo que tuvieron que deducirse.
- Haz clic en una fila de carpeta para expandirla o contraerla. Haz clic en una fila de archivo para previsualizar archivos de texto o imagen directamente ahí.
- En Chrome o Edge, al elegir una carpeta con "Extraer todo" se escribe todo directamente conservando la estructura original de carpetas. En otros navegadores, los archivos se descargan de forma individual y no se puede conservar la estructura de carpetas (en su lugar, la ruta se incorpora al nombre del archivo mediante guiones bajos).
Preguntas frecuentes
A propósito — Por qué los nombres de archivo ZIP se corrompen
Cuando nació el formato ZIP en 1989, no existía ningún mecanismo para registrar qué codificación de caracteres usaba un nombre de archivo. Cada país y cada sistema operativo escribía los nombres de archivo directamente con su propia codificación local (Shift_JIS para el japonés, Windows-1252 para las lenguas de Europa occidental, etc.), así que obtener caracteres corruptos al abrir un ZIP en otro sistema era, en cierto modo, "un comportamiento conforme a la especificación".
Para solucionar este problema, a partir de aproximadamente 2007 se añadió un mecanismo llamado "bandera de codificación de idioma (EFS)". Utiliza un único bit de las banderas de cada entrada ZIP para indicar explícitamente que "este nombre de archivo está escrito en UTF-8". Sin embargo, siguen existiendo herramientas ZIP antiguas, así como parte del software que todavía no activa esta bandera, por lo que, incluso en la década de 2020, el problema de los caracteres corruptos entre Windows y Mac no se ha resuelto por completo.
Cabe señalar que esta corrupción no daña los datos en sí. El contenido real del archivo (los bytes del texto o la imagen) permanece intacto; lo único que ocurre es que el nombre del archivo, un metadato, se interpreta con la regla equivocada. Precisamente por eso, en cuanto se conoce la codificación correcta, una herramienta como esta puede corregirlo después y restaurar el nombre correcto.