Las herramientas digitales ofrecen oportunidades cada vez mayores para que la ciencia colaborativa aborde desafíos globales, pero con demasiada frecuencia los datos valiosos necesarios para fundamentar ese trabajo quedan fuera del alcance de los investigadores.
Los datos pueden estar enterrados en una colección imposible de buscar, codificados con una terminología idiosincrásica o de una manera que no permite que funcionen fácilmente con otros datos, o no pueden usarse fácilmente porque los científicos no pueden verificar detalles sobre los datos en sí, como sus orígenes o términos de uso.
“Este es un problema que en realidad es tan antiguo como la ciencia misma”, explica Simón Hodson, el director ejecutivo de la Comité de Datos (CODATA) del Consejo Científico Internacional (ISC), que trabaja para mejorar la disponibilidad y usabilidad de los datos.
Estos problemas de datos pueden limitar las oportunidades de investigación y desperdiciar tiempo y dinero. Según la investigación Según un estudio publicado por la Comisión Europea en 2018, limpiar datos de baja calidad para hacerlos utilizables es, con diferencia, la tarea que requiere más tiempo en un proyecto medio de análisis de datos y puede representar el 80% del esfuerzo total.
El Feria Mundial El proyecto, una colaboración entre CODATA y el Consejo Científico Internacional (ISC), abordó este problema. El proyecto tenía como objetivo “hacer que los datos funcionen” fomentando la adopción de la FAIR Principios de datos (Encontrables, Accesibles, Interoperables, Reutilizables), que fomentan una mejor gestión de datos e investigación respaldada por análisis asistido por máquinas.
Con el proyecto finalizado, CODATA pretende continuar y expandir la iniciativa con Feria Mundial+, que incluirá nuevos socios y estudios de casos internacionales que pondrán en práctica las lecciones aprendidas durante el proyecto WorldFAIR de dos años de duración.
La nueva fase se estructurará como una “federación” de proyectos, que proporcionará un marco de colaboración en el que los científicos podrán compartir conocimientos técnicos y aprovechar el trabajo de los demás. CODATA invita a los socios potenciales a sugerir estudios de casos y a participar.
El trabajo inicial de CODATA que proporcionó la base para WorldFAIR comenzó en 2017, con el apoyo del ISC y la financiación de la Asociación China de Ciencia y TecnologíaEse trabajo formativo incluyó talleres que condujeron al desarrollo de tres estudios de caso, cada uno de los cuales se centró en el uso de datos en un campo específico: enfermedades infecciosas, planificación urbana y reducción del riesgo de desastres. En las etapas iniciales del proyecto, CODATA también desarrolló una asociación clave con la Iniciativa de Documentación de Datos (IDD).
Sobre la base de estos esfuerzos, CODATA consiguió financiación de la Comisión Europea para WorldFAIR. El proyecto apoyó 11 estudios de caso que examinaron el uso de datos en una amplia gama de campos, incluidos el patrimonio cultural, los nanomateriales y las ciencias oceánicas. Los estudios de caso abarcaron 13 países, incluidos Brasil, Kenia, Nueva Zelanda y los EE. UU.
Las lecciones aprendidas del proyecto sirvieron de base para 11 recomendaciones de política para mejorar el uso y la disponibilidad de datos para la ciencia, y condujo al desarrollo de la Marco de interoperabilidad entre dominios (CDIF), que tiene como objetivo hacer que los datos de diferentes campos científicos sean más interoperables.
Al mismo tiempo, CODATA ha publicado nuevos Terminología de gestión de datos de investigación, que proporciona definiciones claras de los términos utilizados en el campo; esos términos ahora se han publicado como un documento legible por máquina.Vocabulario FAIR”, y pronto estará disponible en línea en un formato más fácil de leer para los humanos.
Cada uno de los 11 estudios de caso también generó su propio Informes y orientación para el uso de datos, con el objetivo de hacer recomendaciones relevantes en diferentes dominios de la ciencia.
Uno de los estudios de caso analizó biodiversidad agrícola, centrándose en la polinización, un campo en el que el modelo para describir y categorizar los datos aún se está definiendo. Basándose en datos y aportes de colegas de todo el mundo, investigadores de media docena de países (Brasil, Kenia, Argentina, Estados Unidos, Reino Unido y Países Bajos) desarrollaron un Guía completa y conjunto de herramientas. para obtener datos relacionados con cómo interactúan las plantas y los polinizadores.
Es un tema extremadamente específico, pero que es relevante prácticamente en todas partes y para científicos de distintos campos, quienes ahora pueden beneficiarse de una forma unificada y estándar de abordar los datos, lo que hace más fácil aprovechar el trabajo de sus colegas y acelerar su propia investigación.
“Pasar de enfoques diversos e iniciativas aisladas a datos de interacciones entre plantas y polinización de FAIR ampliamente disponibles para científicos y tomadores de decisiones permitirá el desarrollo de estudios integradores que mejoren nuestra comprensión de la biología, el comportamiento, la ecología, la fenología y la evolución de las especies”, Escriben los investigadores que trabajaron en el estudio de caso..
En otro estudio de caso, los investigadores analizaron reducción de Desastres“Como es probable que el cambio climático y el aumento de la población incrementen tanto la gravedad como la frecuencia de los desastres, la necesidad de datos confiables para fundamentar nuestras respuestas se vuelve cada vez más crítica”, escriben.
Los científicos y las agencias nacionales e internacionales que trabajan en el ámbito del riesgo de desastres analizan el pasado para estimar el impacto de posibles eventos futuros y entender cómo mitigarlos y recuperarse después. También recurren a los datos que generan constantemente sensores en la Tierra y en satélites, administrados por fuentes públicas y privadas.
Pero en el estudio de caso, los investigadores encontraron difícil obtener el tipo de información necesaria para hacer evaluaciones precisas, porque gran parte de los datos relevantes no se ajustan a los principios de datos FAIR. A menudo falta información vital, como el número de personas heridas en un desastre o la rapidez con la que se desarrolló el evento. En otros casos, las autoridades nacionales utilizan sus propios métodos para calcular puntos de datos clave sin mostrar su trabajo, lo que dificulta la comparación para otros.
Basándose en su amplia investigación, el equipo de estudio de caso formuló una serie de recomendaciones de prácticas que deberían facilitar la toma de decisiones políticas basadas en evidencia en este campo cada vez más urgente: “un paso fundamental hacia la construcción de comunidades y naciones más seguras y resilientes”, escriben.
Investigadores de la Unión Internacional de Química Pura y Aplicada (IUPAC) emprendió un estudio de caso para analizar cómo los datos y la terminología relacionados con los productos químicos pueden hacerse más fáciles de usar tanto para humanos como para máquinas.
La IUPAC tiene Más de un siglo de experiencia Convocar a químicos para definir y estandarizar la forma en que los científicos de campo trabajan con sustancias químicas y hablan sobre ellas. Pero, como las herramientas digitales (y cada vez más la inteligencia artificial y la tecnología relacionada) ofrecen nuevas formas de trabajar, el estudio de caso de la IUPAC analizó cómo se podrían hacer más eficientes esas normas y facilitar que otros científicos reutilicen los datos de química.
Uno de los productos del estudio de caso fue un “libro de cocina”, un recurso abierto de pautas para ayudar a los científicos, incluidos estudiantes, profesores y profesionales en activo, a comprender cómo trabajar con datos de química y cómo hacer que sus propios datos sean más accesibles para otros.
El proyecto también describió un nuevo y ambicioso protocolo digital abierto que podría conectar muchas bases de datos químicas globales diferentes, permitiendo a los científicos encontrar y acceder a datos con una sola consulta y, del mismo modo, verificar si sus propios datos son legibles por máquina.
Reunir a científicos para hablar sobre los datos que producen y tratar de entender cómo otros trabajan con sus propios datos ha sido revelador, explica Hodson.
Y al establecer estándares y definiciones claras, los científicos no sólo están ayudando a la investigación actual, sino que también hacen más fácil para las generaciones sucesivas aprovechar su trabajo, tal vez en formas que los autores originales tal vez nunca hubieran considerado, añade.
“Algo que descubrimos en WorldFAIR fue lo fascinante y útil que fue simplemente tener estas conversaciones, reunir a todos los estudios de caso en una sala y hacer que hablaran sobre sus datos y lo que hacen y cómo funcionan y cómo lo describen, y en algunos casos identificar conexiones que no necesariamente habíamos imaginado de antemano”, dice.
Imagen de taylor vick on Unsplash.
Disclaimer
La información, opiniones y recomendaciones presentadas en nuestros blogs invitados son las de los contribuyentes individuales y no reflejan necesariamente los valores y creencias del Consejo Científico Internacional.