Cómo los principios FAIR están reconstruyendo la confianza en la ciencia

“Si construyes un conjunto de datos y nadie puede encontrarlo, ¿es útil?” pregunta un nuevo reportaje de Nature publicado el 1 de julio. “No tanto como podría serlo.” La pregunta es retórica, pero lo que está en juego no lo es: con la confianza en la ciencia bajo una presión sostenida de actores partidistas y la desinformación viral, la accesibilidad y transparencia de la información científica se han convertido en una cuestión de urgencia institucional.

El artículo examina el estado de los principios FAIR una década después de su primera redacción. FAIR,Findable, Accessible, Interoperable, Reusable (localizable, accesible, interoperable, reutilizable), es un marco diseñado para garantizar que los datos de investigación puedan ser localizados, abiertos, combinados con otros conjuntos de datos y utilizados por otros mucho después de la publicación del estudio original. Los principios fueron publicados formalmente en Scientific Data en 2016 por Wilkinson y más de 40 coautores bajo el paraguas de FORCE11, y el artículo ha acumulado desde entonces aproximadamente 16.000 citas.

Barend Mons, el biólogo molecular neerlandés que concibió el marco FAIR, dijo a Nature que su propósito central es la rendición de cuentas. “Cuanto más comprensibles sean los datos para personas distintas de los creadores, más podremos determinar no solo la confiabilidad del conjunto de datos en sí, sino también la de sus supuestos creadores.”

Lo que FAIR realmente exige

Un conjunto de datos FAIR ideal, tal como se describe en el artículo, está debidamente documentado con metadatos detallados,cuándo, dónde y cómo se crearon los datos. Está diseñado antes de que comience la recolección de datos, con planes de gestión de datos que especifican licencias apropiadas e identificadores persistentes. Está estructurado para que tanto las computadoras como los humanos puedan encontrarlo e integrarlo con otros conjuntos de datos.

Los principios son deliberadamente generales. Como señaló Mons, FAIR “no puede abordar las especificidades de cada aplicación”. Otros investigadores han ampliado desde entonces el marco para cubrir algoritmos, software de investigación y proyectos de código abierto a través de iniciativas como FAIR4RS y FAIR-USE4OS.

FAIR en la práctica

El artículo destaca varias implementaciones específicas por disciplina. En física de altas energías, el proyecto FAIR4HEP ha evaluado los datos del Gran Colisionador de Hadrones para el cumplimiento de FAIR. La Universidad Carnegie Mellon ha publicado guías FAIR dedicadas para química, matemáticas, neurociencia y psicología. La Sociedad Ecológica Británica publicó una guía de código reproducible basada en los principios FAIR. En inteligencia artificial, la plataforma HuggingFace promueve “tarjetas de modelo” que documentan el uso previsto, las métricas de rendimiento, los datos de entrenamiento y las limitaciones.

“En muchos sentidos, es como cocinar”, dijo Amelia Jimenez-Sanchez, investigadora de integridad de datos en la Universidad de Barcelona. “Una vez que tienes los ingredientes correctos,o te familiarizas con las prácticas FAIR, se vuelve más fácil preparar una comida. Con el tiempo, simplemente se convierte en parte de cómo trabajas.”

Natalie Cooper, macroecóloga del Museo de Historia Natural de Londres, enfatizó que los datos por sí solos no son suficientes. “Los datos son datos, pero también está todo el sistema de infraestructura construido alrededor de ellos para almacenar, compartir y analizar esa información, y esas herramientas también deben ser FAIR y reproducibles.”

Neil Chue Hong del Instituto de Sostenibilidad de Software de la Universidad de Edimburgo agregó: “Ahora es muy difícil analizar o visualizar datos sin software, y al mismo tiempo, es muy difícil que exista software sin datos de alta calidad.”

Impulso político

Los gobiernos, las agencias de financiamiento y los editores han convertido cada vez más el intercambio de datos conforme a FAIR en un requisito. El Australian Research Data Commons ofrece una Herramienta de Autoevaluación de Datos FAIR que brinda orientación práctica para mejorar el cumplimiento de FAIR. Ahora existen recursos FAIR específicos por disciplina para astronomía, ciencia de materiales, genética y genómica unicelular.

El artículo aparece junto a un artículo complementario en Nature que pregunta si la confianza en la ciencia ha disminuido genuinamente,y la respuesta, basada en datos de encuestas, es más complicada de lo que sugiere una narrativa simple. Pero el marco FAIR se posiciona como una respuesta estructural: no una campaña para persuadir a los escépticos, sino una infraestructura técnica que hace que la ciencia sea verificable por diseño.

Con 10 años de existencia, el concepto ha ido mucho más allá de sus orígenes en la bioinformática. Si podrá estar a la altura de la ambición de sus fundadores de incorporar la reproducibilidad en el ADN de la práctica científica dependerá, al final, de si los investigadores de todos los campos están dispuestos a aprender la receta.

Traducido por Alessandra

Scroll to Top