El proceso para guardar una página web completa en el ordenador no es ningún misterio. Por lo general, la combinación Ctrl+S es más que suficiente, pero cuando exploramos esa copia offline, descubrimos que ha perdido integridad o le faltan varias imágenes. La extensión SingleFile compatible con Firefox y varios sabores de Chromium elimina ese problema de raíz al fusionar los elementos esenciales de la página en un único archivo HTML que funciona correctamente en cualquier parte, sin dependencias.
Tal vez haya perdido un poco de popularidad últimamente, pero almacenar contenido offline es una estrategia fundamental para minimizar el impacto de la falta de conectividad, y de otros detalles técnicos inesperados. Por ejemplo, la versión Go de la aplicación de YouTube nos permite conservar copias locales de los vídeos en el dispositivo móvil, y otros servicios habilitan mecanismos similares como parte de sus paquetes premium.
Sin embargo, hoy nos vamos a concentrar en páginas web básicas. Nada nos impide visitar el Internet Archive y buscar una versión previa de una página que ha desaparecido, pero si piensas que su información es muy útil o demasiado importante, nada supera a una copia offline. El inconveniente es que los navegadores no hacen un gran trabajo, y en más de una ocasión dejan material por el camino. ¿Cómo podemos cambiar ese comportamiento?
Cómo guardar páginas en un HTML único con SingleFile
Una posible solución es la extensión SingleFile de Gildas Lormeau. En vez de utilizar el clásico Ctrl+S de los navegadores, SingleFile reduce el proceso a un solo clic, y almacena el contenido de la página web conservando su estructura general. La mejor parte es que lo hace utilizando un único archivo HTML, en vez de guardar recursos secundarios dentro de una carpeta.
La configuración de fábrica funciona muy bien, pero puedes cambiar múltiples aspectos de la extensión, comenzando por la longitud del nombre generado para el archivo HTML, el borrado (o no) de fuentes e imágenes duplicadas, la eliminación de fuentes de audio y vídeo, el guardado «en crudo» (o sea, sin interpretar JavaScript), y el envío del archivo HTML a nuestra cuenta de Google Drive, entre otras cosas.
Ahora, SingleFile no es técnicamente un crawler, y no guardará todos los recursos de la página, sólo los necesarios para mantener su apariencia y no generar errores mayores. De lo contrario, algunos archivos HTML podrían terminar con un tamaño gigantesco. Dicho eso, es una excelente herramienta para sumar a tu navegador (Firefox, Chrome y sus clones inmediatos). Si dependes de páginas web offline, no lo dudes.
Sitio oficial y descargas: Haz clic aquí
yo ahora suelo es sacar captura de toda la pagina como imagen. es mas facil y mantiene la integridad (visual) de la pagina que es lo que me interesa.
Anteriormente Firefox me permitia guardar las paginas en un archivo MHTML que era un solo archivo y allí reposaba toda la pagina, lo mismo que describe este articulo, lastimosamente esa opcion ya no está disponible, no sé qué paso. De todos modos, para el caso de la Wikipedia, hay un enlace en el menú del lado izquierda de la propia Pagina Web que permite descargar el artículo en PDF, por si acaso