La Biblioteca Nacional de España, en colaboración con la Biblioteca de Galicia, ha completado, por sexto año consecutivo, la recolección del dominio .gal.
Las recolecciones masivas suponen el archivado general de un dominio, que, realizándose de manera anual, dan una visión panorámica sobre la evolución y crecimiento de éste, a través de los años.
En esta edición se han incorporado 6.525 dominios suministrados por la Asociación PuntoGal, que lo mantiene desde su creación en 2014. Del total de dominios recolectados, el 33 % de ellos se ha guardado completamente, mientras que el resto ha alcanzado el tope de 150 MB por dominio, límite que se establece para este tipo de recolecciones masivas. Con estos parámetros, se ha guardado un total de 285 GB de información.
El robot Heritrix, el mismo que se encarga del guardado de sitios web para el Archivo de la Web Española, comenzó el rastreo del dominio .gal el 26 de octubre, finalizándolo en tan solo 14 horas, proceso que se ha ido acortando a lo largo de los años, si lo comparamos con los tres días que tardó en realizarse en la primera recolección de este dominio en 2017.
Colecciones web: clave para el estudio de la sociedad en el futuro
Desde la entrada en vigor del Real Decreto 635/2015, de 10 de julio, por el que se regula el depósito legal de las publicaciones en línea, y en el marco del Consejo de Cooperación Bibliotecaria, los centros de conservación de las comunidades autónomas (los competentes en materia de depósito legal) y la BNE colaboran para la construcción y gestión de un depósito legal colaborativo. En ese ámbito de colaboración se han creado colecciones web de alcance y temática autonómica que gestionan los propios centros de conservación.
Esta recolección masiva del dominio .gal -unida a la conservación del dominio .es, realizado desde 2016, o del dominio .cat, incorporado por primera vez este año- permiten a la Biblioteca Nacional de España ofrecer una completa representación sobre el patrimonio cultural español en Internet, que será clave para el estudio de nuestra sociedad en el futuro.
El Archivo de la Web Española es la colección formada por los sitios web (incluidos blogs, foros, documentos, imágenes, vídeos, etc.) que se recolectan. Debido al enorme tamaño de Internet, hoy en día es imposible aspirar a la exhaustividad en el archivado web. Por eso, para intentar guardar la mayor cantidad posible de información web, la BNE ha optado por un modelo mixto que combina recolecciones masivas y selectivas, como hacen otras bibliotecas nacionales del mundo.
Estas colecciones se pueden consultar tanto en la Biblioteca Nacional de España como en los Centros de Conservación de las diferentes Comunidades Autónomas.