Internet Archive

Internet Archive
Internet Archive logo and wordmark.svg
Internet Archive mirror servers - Bibliotheca Alexandrina.jpg
Creador Brewster Kahle
Tipo archivo, sitio web, organización sin fines de lucro, biblioteca digital y archivo web
Campo web archiving y preservación digital
Forma legal organización sin fines de lucro
Fundación mayo de 1996
Fundador Brewster Kahle
Sede antigua sede de la Cuarta Iglesia de Cristo, Científica (Estados Unidos)
Presidente Brewster Kahle
Productos Cover Art Archive
Ingresos 14 000 000 dólares estadounidenses
Empleados 200
Miembro de Asociación de Bibliotecas de Estados Unidos, Digital Library Federation, International Internet Preservation Consortium, Digital Preservation Coalition y Coalition for Networked Information
Coordenadas 37°46′56″N 122°28′18″O / 37.78227145, -122.47158652715
Sitio web archive.org

El Internet Archive (Archivo de Internet) es una biblioteca digital gestionada por una organización sin ánimo de lucro dedicada a la preservación de archivos, capturas de sitios públicos de la Web, recursos multimedia y también software. Creada el 12 de mayo de 1996, su sede central estuvo desde esa fecha y hasta el año 2009 en el histórico edificio del Presidio de San Francisco (California) y, desde ese año, se halla en la calle Funston en San Francisco (California). Esta organización existe con el apoyo de Alexa Internet y de otros colaboradores que han donado materiales y colecciones como la Biblioteca del Congreso y otras muchas bibliotecas públicas y privadas. Alberga una gran cantidad de archivos de muchos tipos como audio, vídeo y texto, la gran mayoría de ellos en dominio público, o con licencias de tipo Creative Commons u otras licencias que permiten su distribución gratuita.[1]

Entre sus secciones se encuentra la colección llamada Moving Images que contiene aproximadamente 19 000 archivos de vídeo (estimación de agosto de 2005). La colección máxima es la Colección de Prelinger, llamada Prelinger Archives, con un total de 1977 archivos (en agosto de 2005) que incluye una gran cantidad catalogada del "Cine Efímero Publicitario", educacional, industrial (películas para promoción de empresas) y amateurs. Las películas son de entre los años 1927 a 1987.

En otra parte del sitio, para volver atrás en el tiempo, existe la Wayback Machine que tiene 608 mil millones de páginas de Internet grabadas desde 1996.[2]​ Se puede ver la primera versión de IMDb y de la famosa página de ventas por Internet Amazon, así como también una sección especial que cataloga noticias en su versión original de dichas fechas.

Hay que tener en cuenta que Wayback Machine no almacena todas las páginas web que existen en la red, sino las enlazadas desde otros sitios ya recogidos y aquellas que se han solicitado almacenar, por tal motivo puede que si se busca una página concreta no se encuentre; se tendría que registrar manualmente para que a partir de ese momento se recoja en el registro histórico.

Internet Archive contiene las siguientes secciones donde se albergan distintas colecciones: web, vídeo, texts (textos), audio, e images (imágenes).

La Bibliotheca Alexandrina (Biblioteca de Alejandría) alberga una copia (mirror) del Internet Archive.

Sección web

Sede del Internet Archive, entre 1996 y 2009, en el Presidio Real de San Francisco, antiguamente una base militar en San Francisco.
La nueva sede del Internet Archive, en la calle Funston, num. 300, San Francisco, CA, desde noviembre de 2009.

Ejemplo de archivos de la WaybackMachine:

Logo de la Wayback Machine

Sección vídeo (Moving Images)

  • Democracy Now
  • Cinemocracy
  • Net Café
  • Youth Media
  • Open Mind
  • Shaping San Francisco
  • Mosaic Middle East News
  • World at War
  • Media Burn
  • The BBS Documentary Video Collection.
  • Prelinger Archives (Colección de películas de Rick Prelinger)
  • Open Source Movies (Películas misceláneas de cine independiente)
  • Feature Films (Largometrajes de dominio público)
  • Computer Chronicles (Programa de televisión transmitido entre 1983 y 2002)
  • Election 2004 (Elecciones presidenciales de 2004)
  • Independent News (Noticias Independientes, 252 vídeos)
  • SIGGRAPH (Dedicado a los comienzos de la animación por computadora, 111 vídeos)
  • Brick Films (películas de cine independiente dedicado a la realización de películas cuadro por cuadro con ladrillos LEGO)
  • Game Videos (sección sobre la historia de los videojuegos con presentaciones de ellos y una sección beta de programas antiguos)
  • Film Chest Vintage Cartoons (56 dibujos animados que ya están en dominio público, se incluyen cortos como "Falling Hare", "Fresh Hare" y "Superman: The Mechanical Monsters)
  • AV Geeks (ésta es una colección de Skip Elsheimer que dedicó su búsqueda por 10 años de películas de proyección en las escuelas y para militares, se incluye unos de los cortos educativos más raros como Private SNAFU: The Home Front (1943), que servía para el entrenamiento militar y cómo hacer decisiones correctas en situaciones de riesgo.)
  • SabuCat Movie Trailers (sección destinada a los tráileres publicitarios, un total de 103)
  • Universal Newsreels (antes de la era de la televisión los noticieros se proyectaban en el cine, ocasionalmente antes de una película o un show temático, Universal realizó noticieros entre 1929 y 1967. Un total de 601 vídeos.
  • Se incluye desde el 2007 la colección British Government Public Information Films, la colección incluyen 22 cortos de servicio público Inglés.

Sección Texts

La sección Texts del Internet Archive alberga libros digitalizados y colecciones de varias bibliotecas y de instituciones y fundaciones culturales procedentes de todo el mundo.

El Internet Archive opera unos 33 centros de escaneado en cinco países, digitalizando alrededor de 1000 libros al día, y contaba con más de 4 millones de libros (en 2013). Se descargaban 15 millones de libros al mes.[3]

Entre aproximadamente 2006 y 2008, la Microsoft Corporation tuvo una relación especial con la sección texts del Internet Archive a través de su proyecto Live Search Books, mediante el cual escaneó más de 300 000 libros que fueron aportados a la colección, proporcionó apoyo financiero y aportó equipos de escaneado. El 23 de mayo de 2008 Microsoft anunció que interrumpía su proyecto[4]​ y puso los libros escaneados a disposición sin limitación contractual y donó los equipos de escaneado.

Hacia octubre de 2007, algunos usuarios del Internet Archive empezaron a subir al Archive libros en dominio público procedentes del Google Book Search.[5]​ En noviembre de 2013, había más de 900 000 libros escaneados por Google en la colección del Archive. Los libros eran idénticos a los que había en Google excepto que no tenían las marcas de agua de Google y no tenían restricciones de uso. Brewster Kahle reveló en 2013 que este esfuerzo de archivado fue coordinado por Aaron Swartz y un grupo de amigos, que bajaban libros en dominio público de Google de manera lenta y desde suficiente número de ordenadores diferentes para no sobrepasar los límites de Google. Hicieron esto para asegurar el acceso general a materiales que ya estaban en dominio público. El Archive se aseguró de que los archivos se atribuían correctamente y se enlazaban a Google. Google nunca se quejó, aunque sí algunas bibliotecas.

En noviembre de 2015 había 134 740 libros en español en el Internet Archive, de un total de 8 millones de textos, de los cuales 6 millones eran en inglés.

Sección Audio

La sección Audio del Archive incluye música, audiolibros, grabaciones de programas de radio antiguos y noticieros, entre otros archivos sonoros. Hay más de 200 000 grabaciones digitales gratuitas. Hay subcolecciones también de pódcast.

Otra subcolección es el Live Music Archive, que alberga 100 000 grabaciones de conciertos tanto de artistas independientes como de artistas consagrados o de conjuntos con normas de difusión permisivas de grabaciones de conciertos como The Grateful Dead o The Smashing Pumpkins.

En esta sección Audio se alberga también la colección de audiolibros LibriVox. En enero de 2016 esta colección contenía 9500 libros en dominio público. Aunque la gran mayoría son audiolibros en inglés, hay también libros en otras lenguas, y una pequeña parte están en español.

Sección Image

Esta sección contiene colecciones de diversas procedencias. Contiene, por ejemplo, colecciones de imágenes del Metropolitan Museum of Art, mapas del Servicio Geológico de los Estados Unidos, una colección de clips de la NASA o una colección de 500 000 carátulas de discos.

Biblioteca Nacional de Emergencias

En medio de la pandemia de COVID-19 que cerró muchas escuelas, universidades y bibliotecas, Archive anunció el 24 de marzo de 2020 que estaba creando la Biblioteca Nacional de Emergencia al eliminar las restricciones de préstamos que tenía para 1,4 millones de libros digitalizados en su biblioteca abierta, pero limitando a los usuarios a la cantidad de libros que pueden sacar y haciendo cumplir su devolución; normalmente el sitio solo permitiría un préstamo digital por cada copia física del libro que se tuviera, mediante el uso de un archivo cifrado que se volvería inutilizable una vez finalizado el período de préstamo. Esta biblioteca permanecería como tal hasta al menos el 30 de junio de 2020 o hasta que la emergencia nacional de los EE. UU. terminara, lo que ocurra después. En el lanzamiento, Internet Archive permitió a los autores y titulares de derechos presentar solicitudes de exclusión voluntaria para que sus obras se omitieran de la Biblioteca Nacional de Emergencias.

El Archive de Internet dijo que la Biblioteca Nacional de Emergencia abordó una "necesidad global e inmediata sin precedentes de acceso a material de lectura e investigación" debido al cierre de bibliotecas físicas en todo el mundo. Justificaron el accionar de varias maneras. Legalmente, dijeron que estaban promoviendo el acceso a esos recursos inaccesibles, lo que afirmaron era un ejercicio de los principios de Uso Justo (Fair Use). Archive continuó implementando su política de préstamos digitales controlados anteriores a la Biblioteca Nacional de Emergencia, lo que significa que todavía encriptaban las copias prestadas y no era más fácil que antes para los usuarios crear nuevas copias de los libros. La determinación final de si la Biblioteca Nacional de Emergencias constituía o no un uso legítimo solo podía ser realizada por un tribunal. Moralmente, también señalaron que Internet Archive era una biblioteca registrada como cualquier otra, que pagaban ellos mismos los libros o los recibían como donaciones, y que los préstamos a través de bibliotecas eran anteriores a las restricciones de derechos de autor.

Sin embargo, Archive ya había sido criticada por autores y editores por su enfoque de préstamo anterior, y tras el anuncio de la Biblioteca Nacional de Emergencias, los autores (como Neil Gaiman y Chuck Wendig), editores y grupos que representan a ambos tomaron cartas en el asunto, equiparando la medida a la infracción de derechos de autor y la piratería digital, y el uso de la pandemia de COVID-19 como una razón para ampliar los límites del derecho de autor (ver también: Biblioteca abierta § Acusaciones de violación de derechos de autor). Después de que los trabajos de algunos de estos autores fueran en respuesta ridiculizados, Jason Scott, de Internet Archive, pidió que los partidarios de la Biblioteca Nacional de Emergencias no denigren los libros de nadie: "Me doy cuenta de que hay un fuerte debate y desacuerdo aquí, pero los libros son vivificantes y vivificantes, y estos escritores los escribieron".

Demanda de editores

El funcionamiento de la Biblioteca Nacional de Emergencia es parte de una demanda presentada contra Archive de Internet por cuatro importantes editoriales de libros en junio de 2020, desafiando la validez de los derechos de autor del programa de préstamos digitales controlados. En respuesta, Internet Archive cerró la Biblioteca Nacional de Emergencias el 16 de junio de 2020, en lugar del previsto para el 30 de junio de 2020, debido a la demanda. Los demandantes, apoyados por Copyright Alliance, afirmaron en su demanda que las acciones de Internet Archive constituían una "infracción masiva intencionada de derechos de autor". Además, el senador Thom Tillis (republicano por Carolina del Norte), presidente del subcomité de propiedad intelectual del Comité Judicial del Senado, dijo en una carta al Internet Archive que estaba "preocupado porque Internet Archive piensa que determinar el alcance de la ley de derechos de autor". En agosto de 2020, el juicio de la demanda estaba programado tentativamente para comenzar en noviembre de 2021.

Como parte de su respuesta a la demanda de los editores, a fines de 2020, Archive lanzó una campaña llamada Empowering Libraries (hashtag #EmpoweringLibraries) que describió la demanda como una amenaza para todas las bibliotecas.

En diciembre de 2020, Publishers Weekly incluyó la demanda entre sus "10 mejores historias de bibliotecas de 2020".

En un artículo preimpreso de 2021, Argyri Panezi argumentó que el caso "presenta dos preguntas importantes, pero separadas, relacionadas con el acceso electrónico a las obras de la biblioteca; primero, plantea preguntas sobre la práctica legal de los préstamos digitales, y segundo, pregunta si el uso de emergencia del material protegido por derechos de autor podría ser de uso legítimo "y argumentó que las bibliotecas tienen un papel de servicio público para permitir que" las generaciones futuras sigan teniendo igual acceso, o oportunidades de acceso, a una pluralidad de fuentes originales ".

  • Página web oficial (en inglés)
  • [1] Sitio creado por Archive para promocionar el hashtag #EmpoweringLibraries.

Copyright