Más que un fallo: cómo el juicio contra Internet Archive podría romper la memoria digital

Internet Archive, la organización sin ánimo creada para preservar la memoria de la web, se encuentra en juicio con cuatro editoriales multinacionales. De perder el juicio, se pone en peligro parte del patrimonio cultural digital de la humanidad.

El caso contra Internet Archive

La semana pasada, la comunidad de bibliotecas y archivos digitales a nivel internacional se vio revolucionada por un fallo judicial contra Internet Archive, una organización sin ánimo de lucro basada en Estados Unidos cuyo objetivo principal es la preservación de la memoria de la web. 

El fallo se da en el contexto de un juicio que cuatro editoriales multinacionales (Hachette, Penguin-Random House, Wiley y HarperCollins) mantienen contra Internet Archive. Las editoriales demandan a Internet Archive por su proyecto Open Library, iniciado en 2006, pero que cobró notoriedad y relevancia pública a partir de la apertura en marzo de 2020 de la National Emergency Library (Biblioteca Nacional de Emergencia) debido a la pandemia de COVID-19. En ese marco, Internet Archive decidió suspender su sistema de Controlled Digital Lending y permitir el acceso irrestricto a 1.4 millones de libros, basándose en el fair use (uso justo) y la doctrina de la primera venta de la ley de derecho de autor de los Estados Unidos.

A partir de allí, se inició un proceso judicial que el 24 de marzo culminó con un primer fallo en contra de Internet Archive, producido por el juez del distrito de Manhattan, John G. Koeltl. En este fallo, el juez encontró que no había justificación para considerar el uso que hacía Internet Archive como «uso justo» o cumpliendo con la doctrina de la «primera venta».

Más allá de los argumentos legales, ¿por qué esta noticia debería importarnos como usuarios y usuarias habituales de la web?

Error 404

Según Wikipedia, Internet Archive fue creada en 1996 por Brewster Kahle como una organización sin ánimo de lucro, cuyo objetivo «es la preservación de archivos, capturas de sitios públicos de la web, recursos multimedia y software». La mayoría de internautas, sin embargo, conocen a Internet Archive por uno de sus productos estrellas, la Wayback Machine. Esta iniciativa contiene copias de millones de páginas web, lo que permite que estén disponibles más allá de la capacidad de quienes las crearon en primer lugar para mantenerlas en línea. 

En los primeros tiempos de la web (allá por la década de los 90) era muy común que cualquier persona con una computadora, una conexión a Internet y algo de conocimiento básico de HTML buscara publicar su versión personal de «Hola, mundo». En 1994, la llegada de Geocities revolucionó la publicación de páginas web, y la compañía fue adquirida en 1999 por Yahoo. En el 2009, sin embargo, Yahoo anunció que daría de baja finalmente el proyecto, y en octubre de ese mismo año reseteó todos los servidores que alojaban información sobre Geocities.

¿Y quiénes estuvieron al rescate de ese enorme archivo de la web? Por supuesto, Internet Archive. Para entender el rol fundamental que Internet Archive cumple en nuestros días, hay que pensar en Internet Archive como una versión digital de los árabes que copiaron y estudiaron a los filósofos griegos luego de la caída del Imperio Romano. Este trabajo de copia trabajosa y re-interpretación permitió preservar uno de los pilares fundamentales de la cultura occidental durante los tiempos turbulentos de la Edad Media.

Así, Internet Archive reúne a través de sus diferentes proyectos, una colección de más de 800 mil millones de páginas web y 20 millones de otros tipos de objetos digitales, entre libros, audio y recursos multimedia digitalizados, software y videojuegos preservados, entre otros. Aunque el juicio sea por un proyecto puntual, lo que está en juego es una parte importante del patrimonio cultural digital de la humanidad.

Wikipedia e Internet Archive: una relación simbiótica

Desde Wikimedistas de Uruguay, observamos con muchísima preocupación el desarrollo de este juicio en los Estados Unidos. Como grupo afiliado a la Fundación Wikimedia, una de nuestras tareas centrales es promover Wikipedia y los proyectos Wikimedia. Sin embargo, creemos que esta no es una tarea que debe ser realizada en solitario, sino que colaboramos con otras organizaciones, como Internet Archive, para contribuir al desarrollo de un ecosistema digital de conocimiento libre, colaborativo y abierto.

Una de las políticas oficiales de Wikipedia es que toda la información que se vierte allí debe estar respaldada por una fuente fiable. Sin embargo, como veíamos en el caso de Geocities, a menudo los sitios web de los que se extrae la información pueden fallar. Los periódicos (digitales o no) pueden abrir y cerrar. Una institución puede cambiar de ubicación sus archivos en su sitio web, sin dejar rastro o URL estable que permita volver a localizar dónde estaba la información. Los archivos científicos y académicos pueden adoptar nuevos sistemas de almacenamiento, volviendo inaccesible comunicaciones científicas fundamentales para la sociedad. La información en la web es pública, pero no permanente. 

Para Wikipedia, esto representa un problema enorme, ya que la información que se agregó a la enciclopedia en 2005 puede no estar disponible hoy en 2023. Y si bien ciertas comunidades, como la comunidad científica, han hecho enormes avances para proveer URLs estables y permanentes, a través de sistemas como el DOI (Digital Object Identifier o Identificador de Objetos Digitales), todavía sigue siendo un desafío garantizar la permanencia de la información en línea.

Allí es donde entra Internet Archive y su colosal tarea de preservar la memoria de la web. Solamente para entender la magnitud de este trabajo, en la Wikipedia en español, más de 2 millones y medio de enlaces se dirigen a la Wayback Machine de Internet Archive (sí, 2.500.000 de enlaces). En términos crudos, hay más enlaces a la Wayback Machine de Internet Archive que artículos en la Wikipedia en español, que actualmente cuenta con alrededor de 1,8 millones de artículos. A su vez, en los artículos de Wikipedia en español hay más de 130 mil referencias que dirigen a libros digitalizados o alojados por Internet Archive.

Si pierde Internet Archive, perdemos todos

El mundo de la información digital es actualmente frenético, acelerado y caótico. Desde ChatGPT hasta la desinformación promovida por grupos extremistas en redes sociales, es difícil entender las direcciones que están tomando las tecnologías digitales. Sin embargo, algo es claro: los proyectos colaborativos, sin ánimo de lucro, con objetivos y misiones de interés público, estamos perdiendo lentamente la pulseada.

El ecosistema digital se parece cada vez más a un barrio residencial cerrado, donde es necesario pagar por cada servicio, y donde no hay obligación de salir al exterior o interactuar con otros integrantes de la comunidad. El sueño de la función democratizadora de Internet para crear un mundo donde todas las personas pudieran ejercer sus derechos de acceso a la información, la ciencia y la cultura, produjo los monstruos de la corporativización, la plataformización y la dictadura del algoritmo.

Este es el contexto en el que se produce este primer fallo contra Internet Archive. Aunque una mirada reduccionista tratará a esta organización como piratas de la Internet, lo cierto es que su rol como guardianes de la memoria digital excede con mucho los argumentos legales que puedan ser esgrimidos alrededor de la ley de derecho de autor. Más aún cuando, como han expuesto nuestras compañeras de Wikimedia Chile, es urgente balancear la ley de derecho de autor con el interés público y garantizar el disfrute de los derechos culturales.

Esta batalla legal no es contra Internet Archive y su sistema de Controlled Digital Lending, su programa de la Biblioteca Nacional de Emergencia o el límite del uso justo en la ley de derecho de autor. Es, en definitiva, una parte más de la controversia entre quienes defienden el conocimiento como un jardín cerrado de altos muros y quienes preservan el conocimiento de manera desinteresada para que cualquier persona pueda participar en el espacio público, sea este digital o no. Es por eso que desde Wikimedistas de Uruguay, junto a otras organizaciones de América Latina, firmamos el Pronunciamiento conjunto en apoyo a Internet Archive. Aunque pequeña, es una parte fundamental de nuestra misión de contribuir a un ecosistema de conocimiento libre, colaborativo, abierto y de calidad, en tiempos cada vez más turbulentos.