Alojamiento de datos

Una guía rápida para tomar buenas decisiones sobre cómo alojar datos compartidos con GBIF

wikimedia-servers
Wikimedia Foundation servers. Photo 2012 Victor Grigas, Wikimedia Foundation, licensed under CC BY-SA 3.0.

GBIF.org es un índice de datos sobre biodiversidad publicados a través de una red mundial de infraestructuras nacionales, temáticas y de proyectos. Dentro de este sistema interconectado, es esencial que los editores de datos garanticen que los datos que comparten tengan un punto de acceso persistente y estable. Este requisito supone un reto para muchas instituciones, especialmente para aquellas que son nuevas en GBIF y pueden no disponer de las instalaciones necesarias para alojar y mantener los datos en servidores que permanezcan siempre en línea.

Una forma de empezar a abordar el reto es distinguir entre publicación de datos y alojamiento de datos. Aunque estas actividades están relacionadas, no existe ningún requisito formal o técnico que obligue a la misma institución a realizar ambas tareas (aunque así sea generalmente).

Publicación de datos es el acto de organizar y compartir datos estandarizados para su uso a través de la red de GBIF. Una institución se convierte en publicador de datos de GBIF al completar un formulario de registro en línea y recibir la aprobación, ya sea a través de uno de los Participantes nacionales u organizativos de la red de GBIF o del Grupo Directivo de Nodos.

El alojamiento de datos es el acto de almacenar los datos en una plataforma web estable y accesible. Aunque no existe un acuerdo estándar para prestar este servicio, el alojamiento de datos representa un compromiso significativo que requiere una capacidad dedicada y a largo plazo que mantenga una plataforma conectada a la web persistente y altamente fiable.

Independientemente de quién aloje los conjuntos de datos, GBIF trabaja para atribuir los créditos tanto a la institución que publica los datos como a su país de registro. Lo que sigue es una guía rápida para tomar decisiones informadas sobre cómo alojar los datos compartidos con GBIF.


Pasos de alojamiento

Una vez organizados los datos en los formatos admitidos, proceda como se indica a continuación:

  1. Conviértase en publicador de datos de GBIF completando el formulario de registro de publicadores
  2. Elija una plataforma de publicación y alojamiento de datos. El Integrated Publishing Toolkit de GBIF puede ser autohospedado, alojado por un nodo nacional o temático (incluido uno de los varios sistemas de datos confiables disponibles) centros de alojamiento, o alojados en uno de los IPT regionales basados ​​en la nube del Secretariado de GBIF.
  3. Obtenga acceso al manual de IPT y a los recursos de formación
  4. Empiece a publicar sus conjuntos de datos


Introducción al IPT: Integrated Publishing Toolkit

El IPT es un software gratuito, de código abierto desarrollado y respaldado por el Secretariado de GBIF que organizaciones de todo el mundo utilizan para publicar y compartir conjuntos de datos sobre biodiversidad a través de la red GBIF. El IPT también puede funcionar como un repositorio de datos referenciados en un artículo, como en este ejemplo de una instalación de IPT alojada por la red Canadensys.

Obtenga más información sobre los requisitos técnicos para albergar un IPT

Modo de prueba

El IPT se puede instalar en modo de prueba, lo que significa que sus recursos alojados no estarán indexados ni serán accesibles públicamente mediante búsquedas en GBIF.org. Si decide instalar su propio IPT, GBIF recomienda que primero experimente el modo de prueba para comprender el proceso de registro. El modo de prueba se utiliza para ejecutar el IPT mientras se lo evalúa o se realiza una capacitación; los registros del modo de prueba se ingresarán en un registro de prueba y los recursos nunca se indexarán.

Una vez que esté seguro de que el IPT funciona como espera, tendrá que reinstalar el software en modo de producción para que los datos sean realmente detectables a través de GBIF. El modo de producción registra conjuntos de datos y los publica para que estén indexados y sean accesibles públicamente a través de GBIF.org.

Tanto la instancia IPT como su organización asociada deben estar registradas en GBIF. Si su organización aún no está registrada, se le pedirá que complete este paso y proporcione información básica a través de un breve formulario en el IPT. Obtenga más información sobre cómo funciona esto en el Manual del usuario de IPT


Términos de Uso

El uso de un servidor de datos externo por parte de un editor de datos debe negociarse entre las respectivas partes, idealmente con un acuerdo de nivel de servicio que describa los términos y obligaciones tanto del editor como del servidor de datos. El uso del IPT alojado en la nube de GBIF se regirá por el Acuerdo de publicación de datos de GBIF.