217 9 22MB
Spanish Pages [184] Year 2017
■W
FERNANDA PESETY LUIS-MILLÁN GONZÁLEZ
CIENCIA ABIERTA Y GESTIÓN DE DATOS DE INVESTIGACIÓN ( r Dm ) Fernanda Peset y Luis-Millán González
EDICIONES TREA
Colección Biblioteconomía y Administración Cultural, 301 © del texto: Fernanda Peset y Luis-Millán González, 2017 © de esta edición: Ediciones Trea, S. L. María González la Pondala, 98, nave D 33393 Somonte-Cenero. Gijón (Asturias) Tel.: 985 303 801. Fax: 985 303 712
Corrección: Olaya González Dopazo Cubiertas: Impreso Estudio Impresión: Gráficas Ápel Encuadernación: Encuastur Depósito legal: AS 00234-2017 is b n : 978-84-9704-907-8 Impreso en España — Printed. in Spain Todos los derechos reservados. No se permite la reproducción total o parcial de este libro, ni su incorporación a un sistema informático, ni su transmisión en cualquier forma o por cualquier medio, sea este electrónico, mecánico, por fotocopia, por gra bación u otros métodos, sin el permiso previo por escrito de Ediciones Trea, S. L. La Editorial, a los efectos previstos en el artículo 32.1 párrafo segundo del vigente t r l p i,
se opone expresamente a que cualquiera de las páginas de esta obra o partes
de ella sean utilizadas para la realización de resúmenes de prensa. Cualquier forma de reproducción, distribución, comunicación pública o transfor mación de esta obra solo puede ser realizada con la autorización de sus titulares, salvo excepción prevista por la ley. Diríjase a cedro (Centro Español de Derechos Reprográficos) si necesita fotocopiar o escanear algún fragmento de esta obra (< www.conlicencia.com>; 917 021 970 / 932 720 447).
Agradecimiento s
I\>r lodo el tiempo de trabajo previo y la atención a las consultas que siempre sin gen, .1 Antonia Ferrer-Sapena, Alicia García-García, Tomás Saorín, Ricardo Albina na, Halar! Aleixandre, Antonio Vidal, Antonio Fernández, Imma Subirats, Florencia Diei 1, VK loi Nina, Luis Martínez-Uribe, Daniel Torres-Salinas, Xavi García-Massó, José I m I oca-Herrera, Vicenta Cruz Gay Lacueva, por su alegría y dedicación, a Sergio Km/, Miguel Villamón, Tomás Baiget, Yolanda Blasco, Pilar Montañana, Consol ( ¡au ia y otros muchos que olvidamos ahora. Y un especial reconocimiento a los alumno*, del curso de
«Gestión de datos de investigación» y a los bibliotecarios de la l Jniversidad de Cádiz. sedic
índice
Introducción
I
I. C ontexto.......................................................
I
1.1. Agentes sociales involucrados y sus roles
I
1.2. Actividades científicas............................... 1.3. Nuevas formas de divulgar la ciencia___
)i
1.4. Research d a t a ............................................... 2. Fundamentos ..............................................................................................................
V
2 .1. Producción de datos de un proyecto de investigación...................................
V
2.2. Perspectiva de las agencias de financiación.......................................................
7
2.3. Ciclo de vida en los servicios de d a to s...............................................................
{>
2.4. Papel del data manager............................................................................................
I\
t. Infraestructuras de almacenamiento e intercambio......................................
II
3.1. Propuestas m etodológicas.....................................................................................
14
L2. Infraestructuras tecnológicas................................................................................
14
3.3. Casos de é x ito ..........................................................................................................
I0
4. Lecciones..................................................................................................................
10
4.1 . Pautas y guías............................................................................................................
lo
4.2. Tendencias futuras..................................................................................................
10‘
G losario........................................................................................................................
17
índice de tablas............................................................................................................
17
Indice de ilustraciones...............................................................................................
174
Bibliografía
Introducción
I ,a era de los datos ya está aquí. Ante la avalancha de información, la sociedad al com pleto necesita datos con los que corroborar de forma concreta lo que se toma como ciérto. Diríamos que esta forma de interpretar la realidad está bastante cerca de lo qur hacían los científicos: analizar las evidencias que se han desarrollado con un método, que se explicita para permitir la comprobación de las hipótesis. Esta forma de traba jai ha llegado incluso a los niveles más altos de los gobiernos. La Cumbre de Líderes del (¡8
(junio del 2013) incluye como valiosos para la economía los datos derivados de la
investigación y los resultados de experimentos científicos. Pero, ¿por dónde empoza i a abordar un panorama tan complejo? Es el momento de esbozar una hoja de rula que permita asesorar a los investigadores y a los propios organismos de investigación. Las buenas prácticas de otros países pueden guiar nuestros pasos: Estados Unidos, Australia, Gran Bretaña. Este libro responde a preguntas como: ¿Qué son los datos de investigación? ¿Por qué debo compartirlos? ¿Qué herramientas de cita existen? ¿Qué es open access y ciencia abierta? ¿Cómo almaceno mis datos? ¿Qué metadatos debo conocer? ¿Qué datos han de preservarse a largo plazo y cuál es la función de una biblioteca en ello? ¿Qué son los requerimientos de los financiadores sobre los datos? ¿Cómo descubro los datos que los investigadores están creando? ¿Qué recursos existen para trabaj,u con la gestión de datos? A lo largo del texto se desarrollan los contenidos para conocer el tema de gestión de los datos en profundidad y se proponen mediante recuadros posibles ampliaciones con el objetivo de guiar nuevos descubrimientos. El mapa de las infraestructuras que presentamos incluye no solo al personal involucrado o la tecnología, sino también las políticas o los estándares habituales. Esta multitud de recursos puede ser utilizada en diferentes contextos, tanto por los grupos de investigación, los gestores de la ciencia y los infomediarios como por bibliotecarios o documentalistas. El trabajo se estructura en cuatro capítulos. El primero de ellos encuadra la ges tión de los datos en el contexto de la ciencia abierta. Su primer apartado, «Agentes sociales involucrados y sus roles», pretende reflejar la complejidad del ecosistema de la ciencia actual. El segundo, «Actividades científicas», da a conocer cuál es el trabajo principal de los investigadores actualmente. El tercer apartado da cuenta de las «Nuevas formas de divulgar la ciencia» y algunas de las herramientas digitales
L12J
CIENCIA ABIERTA Y GESTIÓN DE DATOS DE INVESTIGACIÓN (RDM)
que pueden ayudar en la investigación como Many Eyes o Galaxy Zoo. Su cuarto punto, «Research d a ta » , centra los conceptos que se han barajado hasta entonces en los datos derivados de la investigación, y también ofrece información sobre cómo está la situación actualmente según algunas encuestas nacionales e internacionales. El segundo capítulo muestra ya el corazón de los contenidos. En él se atienden los aspectos necesarios para desarrollar el trabajo con datos y se revisan los métodos de la investigación, de la planificación del ciclo de vida de la información y el papel que un gestor de información asume con respecto a ellos. Su primer apartado, «Producción de datos de un proyecto de investigación», desarrolla aspectos que quizá no son muy conocidos por la comunidad de gestión de la información y que son absolutamente imprescindibles para poder generar servicios de apoyo. Entender el proceso investiga dor facilita la adaptación de los perfiles profesionales al nuevo entorno de trabajo con datos. Su segundo punto, la «Perspectiva de las agencias de financiación», comenta los casos de estudio británico, estadounidense y europeo en cuanto a los requerimien tos de las agencias financiadoras. El tercero, sobre la gestión del ciclo de vida de los datos en una organización, aborda la planificación de un servicio de gestión de datos integral, incidiendo en los aspectos de gestión que son inherentes al trabajo con datos. Su cuarto apartado, «Papel del data m anager», contiene información útil para crear un programa de formación adecuado a los retos a los que actualmente se enfrenta un gestor de información. El tercer capítulo cubre los contenidos que es necesario conocer para trabajar de forma global en el sector de los datos. Su primer apartado, sobre fuentes de datos, re sume cómo ahora mismo se están depositando los datos y relata los proyectos de tipo metodológico. El segundo, sobre infraestructuras, clasifica y recoge las plataformas técnicas que existen. El tercer punto, los «Casos de éxito», detalla dos experiencias muy distintas: una de alcance nacional, otra de alcance mundial,
rda
ands
(Australian Nacional Data System), y
(Research Data Alliance).
El último capítulo concluye con las lecciones aprendidas hasta el momento a escala internacional. Sus apartados, sobre pautas y guías y tendencias recientes, pretenden ser un resumen de la cuestión y ofrecer recursos útiles al lector. Este libro ha podido desarrollarse gracias al apoyo en la investigación por parte del Plan Nacional i + d y la Fundación m a pfr e «OpenDataScience. Centro de re cursos para la preservación y gestión de datos abiertos de investigación», CS 0
2 0 1 2
-
39632-C 02-02, . Tiene sus orígenes en un curso impartido en sedic en marzo del 2014.
1
Contexto
l I A(¡ EN TES SOCIALES INVOLUCRADOS Y SUS ROLES ' ii iIijuut hecho social es inseparable de las personas que lo generan, razón por la que •mu n/amos este texto detallando cuáles son los agentes sociales involucrados en el * enano de la gestión de los datos, con indicación de los roles que cada uno asume. I Mvei \os autores dibujan el mapa de las infraestructuras incluyendo en primer lugai * I»♦. .11 lores y sus relaciones, aunque también influyan en él las políticas, estándares, »•i nologías, prácticas habituales... (Edwards y otros, 2007; Bowker y Star,
1 9 9 0
;
i»nn>, 2015). IVn otra parte, más allá de las funciones que asumen de forma aislada, varios in Immes ( Thomson Reuters, 13 agosto 2013; Halbert, 2013; Erway, 2013) destacan |ii* el reto de desbloquear los datos de investigación requiere la cooperación entre i •mlos ellos. Ninguna organización, sea gubernamental, académica o comercial, puede * mu lucirlo de forma aislada, por lo que la comunicación va a ser la clave. i 'oí no en otros escenarios que tienen que ver con la comunicación científica, iden ulii .unos tres grandes grupos que asumen las funciones habituales de la cadena de |'inducción de la ciencia: creación, gestión y diseminación. Con esta estructura, to maivinos sus características con respecto al manejo de datos del informe recoleg í a ( /OI 2 ), RoyalSociety (2012) y Thomson Reuters (2013), así como otros materiales:
\ I os productores y consumidores de los datos de investigación. Para la Royal h icty, aspiran a entender y comunicar la naturaleza, las personas y la sociedad que nos rodea para el beneficio general. I\ira recolecta , los productores «proporcionan la evidencia y validación cient í lu a de las investigaciones. Si bien esta categoría se compone fundamentalmente de investigadores, en algunos casos hay conjuntos de datos que ya existen y los científicos los utilizan para validar sus tesis. La comunidad investigadora puede ser considerada i orno productores, autores y usuarios de los datos de investigación». I /os científicos se han agrupado tradicionalmente en academias y sociedades cien 111 icas, que están jugando un papel clave en este nuevo entorno. Véase como ejemplos el trabajo de codata (Committee on Data for Science and Technology), del icsu (International Council for Science) o el citado informe de la Royal Society.
Y GESTION DE DATOS DE INVESTIGACIÓN (RDM)
HOMZ \ COOAÍAm.OO |
íi; -: :;
•HE» |ABOUT
'
í:g|
sÑUv•*••**>;:
CO DATA
ü
• ;&ü:
fW $m m AHM A }
'Ü
Er&tei*síemh&£rm $
Sisare
fnlemauonal Coimes ?or Science Commrnee on Data ?o? Suence mú Tecrmoiogy
|mm mms •
OONTACT
?'. - 'éánámW£Í fASKG&OiíFS VV0RKIN
81.00 j
/va