



Todos los días, miles de sitios web desaparecen sin rastro. Y con ellos recuerdos, conocimiento y fragmentos de nuestra historia se esfuerzan. Si todo parece estar fuera, es paradójico que la World Wide Web (www), que llamamos Internet, este inmenso archivo digital de nuestra civilización global, se evapore.
Hace casi 4.000 años, un concesionario escribió una queja sobre una chica de cobre defectuosa en una mesa de arcilla. Este reclamo ha sobrevivido hasta el día de hoy. En cambio, los blogs, foros y sitios web personales que se publicaron hace quince años han desaparecido. ¿Cómo es posible que una queja en la Edad de Bronce sea más constante que una contribución de 2009?
Leer también
La clave es la fragilidad de Internet. Si no se conserva activamente, el contenido digital es naturalmente breve.
A diferencia del soporte físico, como el sonido, el papiro o el papel, los sitios web dependen de los servidores que requieren mantenimiento, dominios que deben renovarse y formatos que están desactualizados tarde o temprano.
Cuando un servidor desaparece, se ejecuta un dominio, las desviaciones están mal administradas o una página se basa en tecnologías que no son consumo, el resultado es el mismo: El contenido se vuelve inaccesible y cuando finalmente desaparecen, nadie se da cuenta.
Leer también
Este fenómeno significa Responsabilidad (En español, «enlaces perezosos») y es continuo. En un análisis de los tweets que publiqué entre 2007 y 2023, se descubrió que esto se encontró El 13 % de los enlaces no funcionaban, y si el tweet tenía más de diez años, el número aumentó al 30 %. Esto significa que casi un tercio del contenido vinculado era inaccesible hace una década … si no han desaparecido por completo.
La falla de energía silenciosa
En Blade Runner 2049Una gran falla de energía causada por los activistas replicantes eliminan todos los registros de datos digitales. Sin embargo, no es necesario lograr un escenario tan extremo para que las grandes cantidades de información desaparezcan para parpadear. Aunque, como en la película, el resultado es el resultado de decisiones conscientes que generalmente fueron tomadas por empresas privadas. Por ejemplo, El cierre de plataformas como Yahoo! Las respuestas, geocidades, tuenti o foros de meristación significaban la pérdida de millones de textos, imágenes y conversaciones que documentaron parte de nuestras vidas y nuestra cultura digital.
Por otro lado, en contraste con los gobiernos anteriores que implementaron pautas para obtener la información disponible en los sitios web del gobierno. La administración de Donald Trump ha eliminado sistemáticamente miles de lados y datos oficiales En agencias como los Centros para el Control y la Prevención de Enfermedades (CDC), la Oficina Nacional de Administración Oceánica y Atmosférica (NOA) y la Agencia de Protección Ambiental (EPA).
Leer también
Estos eliminados han influido principalmente en el contenido en relación con la salud pública, el cambio climático, la diversidad y los derechos sociales. Han causado y alertado una pérdida significativa de información pública y científica, especialmente en la comunidad científica.
La paradoja es obvia: nuestra civilización crea más contenido que nunca, pero esto en formatos volátiles y también pierde más rápido de lo que imagina.
Todo esto sucede durante Más y más información (Protocolos parlamentarios, boletines oficiales, artículos científicos o manuales técnicos, entre otras cosas) Se publica en formato digital, a menudo sin copia física.
La paradoja es obvia: nuestra civilización crea más contenido que nunca, pero esto en formatos volátiles y también pierde más rápido de lo que imagina.
A pesar de este panorama, hay un esfuerzo por preservar nuestra memoria digital. La más conocida es la computadora Wayback del Archivo de Internet, que ha presentado miles de millones de sitios web desde 1996. Instituciones de trabajo nacionales como la Biblioteca Nacional de España o sus equivalentes en Gran Bretaña y Australia para obtener parte del patrimonio digital.
¿Qué se hace?
Del mismo modo, varias organizaciones trabajan frente a la misa y eliminó deliberadamente la eliminación, según lo llevado a cabo por la administración Trump para archivar la información eliminada. Estas iniciativas intentan garantizar el acceso futuro a los datos públicos no solo para fines de investigación, sino también el registro histórico.
Por supuesto que no es una tarea fácil. El WWW actual es mucho más complejo que el de la década de 1990: el contenido es dinámico e interactivo, no más simples documentos HTML. Además, el archivo de las redes sociales o el contenido multimedia no es solo un enorme desafío técnico, que aumenta los obstáculos impuestos por las plataformas autoimpuestas, sino que también causa dilemadores éticos y legales en relación con la privacidad y aprobación de los usuarios. En otras palabras, no todo puede o debe conservarse.
Sin embargo, todos podemos contribuir a esto: Herramientas como ahora guardar desde la computadora o archivo Wayback.
En 4.000 años, nadie encontrará nuestras quejas sobre los férecos defectuosos, sino nuestras recetas, memes y discusiones en foros y con ellos de los que fuimos.
Finalmente, para decir que WWW Rots dice que una bosque frase: Siempre hay algo que muere, pero también algo que naceYa que la red está en una transformación constante. Lo más importante es saber que Podemos registrar fragmentos, mantener lo esencial y construir una memoria digital más fuerte que sea menos susceptible a las fluctuaciones tecnológicas o las decisiones de algunas menos empresas o gobiernos.
En 4.000 años, nadie encontrará nuestras quejas sobre los férecos defectuosos, sino nuestras recetas, memes y discusiones en foros y con ellos de los que fuimos.
Daniel Gayo-Barlo
La conversación (**)
Profesor en el Departamento de Ciencias de la Computación de la Universidad de Oviedo.
. Este artículo se reproduce aquí bajo la licencia Creative Commons.No hay más de cuatro de cada diez de los sitios web de 2013
Foto:
Istock En este 1 de enero, Internet, como lo conocemos, tenía 42 años, y en estas más de cuatro décadas, los usuarios han generado mucha información en la Web: solo 2023 fueron 120 Zettabytes (por ejemplo), y este año se espera que el número aumente en un 150 %este año y 181, por ejemplo, se logró de acuerdo con la información recopilada. En esta ilustración, debe decirse que un Terabyte (TB), por ejemplo, corresponde a y solo 128 TB en el mercado actual.
Sin un acoplamiento, lo que entra en la red no siempre permanece. Es probable que más que si tenga clics en un enlace y haya encontrado las noticias «404 no encontradas», lo que ella no lleva a la persona que estaba buscando. Un informe publicado por el Centro de Investigación Pew en 2024 mostró esto
Parte del contenido digital se pierde con el tiempo, incluso en lugares que se consideran de manera confiable, como portales gubernamentales, medios de comunicación, redes sociales y Wikipedia.
Leer también Según algunos estudios en la región, hasta el 89 por ciento de los padres en América Latina publican fotos de sus hijos al menos una vez al mes. El estudio analizó una muestra de casi un millón de sitios web que se guardaron entre 2013 y 2023 a través de Common Crawl, un servicio de archivos que regularmente está disponible en Internet instantáneo como en diferentes momentos. Los resultados mostraron esto
El 25 % de todas las páginas analizadas ya no estaban accesibles para octubre de 2023. Interrumpido, este número es la suma del 16 % de las páginas caídas, pero eso proviene de un dominio principal que permaneció activamente, y el 9 % de los sitios web inaccesibles, ya que sus commemares raíz ya no se usan.El análisis también mostró que
Cuanto más viejo sea el lado, más opciones que había desaparecido debido a las muestras recolectadas en 2013, el 38 % ya no era accesible para 2023
Leer también Anna Lembke
El deterioro digital no solo afecta las páginas personales o las oficinas de bajo tráfico. El Centro de Investigación Pew comprendió 500,000 sitios web de gobiernos locales, estatales y estatales en los Estados Unidos que usan la instantánea a partir de marzo/abril de 2023 del rastreo común, y en estas páginas se encontró que hasta octubre de 2023, El 21 % contenía al menos un enlace roto, y el 16 % de los enlaces dentro de los sitios web que fueron redirigidos a las URL diferían de los que se mencionaban originalmente.
En el caso de los medios de comunicación, la exposición también fue de 500,000 páginas de fotografía de marzo/abril de 2023 juntos. Las páginas provenían de 2.063 sitios web que fueron clasificados por las métricas de la audiencia de comScore como «noticias/información», y se descubrió que en el momento del estudio en octubre de 2023, El 23 % de las páginas tenían enlaces rotos.
Incluso Wikipedia, uno de los sitios web más visitados del mundo, presenta este problema: