Datos de investigación

Datos de investigación

Autor: Alejandro Uribe Tirado

Docente UdeA

Aunque este curso busca una mirada de la investigación y sus datos desde la perspectiva abierta u open, y por eso hablamos de ciencia abierta y de datos abiertos de investigación, es necesario, antes de “abrirlos”, conocer unos pasos previos.

Los datos como proceso y resultado de la labor científica en el mundo de hoy tienen cada vez mayor importancia, por todas sus posibilidades de ser compartidos y, por ende, utilizados y reutilizados por otros investigadores e investigaciones, pero para hacerlo bien hay que seguir un proceso y una adecuada gestión; por eso se inicia con este recurso que nos da un panorama general de los datos de investigación abiertos o no.

¿Qué son los datos de investigación (abiertos o no)?

Para entender qué son los datos de investigación, sean abiertos o no, podemos retomar las siguientes citas de varios textos, que nos dan elementos clave para entender de qué estamos hablando en sentido general, aunque nuestro énfasis sean estos datos, pero principalmente los abiertos (“tan abierto como sea posible, tan cerrado como sea necesario”) y su importancia como componente de la ciencia abierta:


“Los datos de investigación se definen como registros de hechos –puntuaciones numéricas, textos, imágenes y sonidos– utilizados como fuentes primarias para la investigación y cada vez son más aceptados en la comunidad científica como necesarios para validar los resultados (OECD, 2007). Ejemplos de estos datos son las estadísticas, mediciones, respuestas a encuestas, grabaciones de entrevistas, fotografías y observaciones resultantes del trabajo de campo. En concreto, Arano et al. (2011) distinguen como datos primarios a los experimentos científicos; los modelos y simulaciones; las observaciones; los datos derivados, tanto del proceso como de la combinación de datos sin procesar (raw data); los datos referenciales (por ejemplo, estructuras químicas o secuencias genómicas); y el material complementario, como instrucciones de codificación y guías para entrevistadores, entre otros”.

En Alejandro Morales Vargas y Lluís Codina (2019). En Atributos de calidad web para repositorios de datos de investigación en universidades (ver más)

“En términos generales, podemos decir que los datos de investigación son datos que son recolectados, observados o creados para ser analizados y producir resultados de investigación originales. Sin embargo, es importante tener en cuenta que no existe una única definición, y que diferentes disciplinas o comunidades pueden diferir en su entendimiento de este concepto. Así, puede haber grandes diferencias entre lo que constituye un dato para investigadores de las humanidades, de las artes o de las ciencias. En cualquiera de estos casos, es importante tener en cuenta que los datos pueden ser de tipo cuantitativo o cualitativo, y que pueden venir en muchos formatos y soportes, ya sean físicos o digitales”.

En ¿Qué son los datos de investigación? (ver más)

“Los datos abiertos de investigación heredan las características de los open data en cuanto a la garantía de transparencia y a su relación con la rendición de cuentas y la reutilización (Peset y Fernández-López, 2014), especialmente al hablar de investigaciones llevadas a cabo mediante fondos públicos. Pero, además, se definen por el contexto en el que surgen y al que sirven. Así, pueden considerarse datos de investigación “todo aquel material que ha sido registrado durante la investigación, reconocido por la comunidad científica y que sirve para certificar los resultados de la investigación que se realiza” (Torres-Salinas y otros, 2012). Si a ello sumamos su carácter abierto, obtendremos que han de poder ser utilizados, reutilizados y redistribuidos libremente por cualquier persona, siempre que se reconozca su autoría y que se vuelvan a compartir una vez se hayan transformado durante un uso posterior. En palabras de Melero y Hernández-San Miguel (2014), el acceso a estos datos evita duplicar esfuerzos en su obtención, y su agregación o transformación puede generar nuevos datos y favorecer otras interpretaciones y colaboraciones interdisciplinares”.

Críspulo Travieso Rodríguez y Ronaldo Ferreira Araújo (2019). En Aspectos metodológicos de los datos abiertos de investigación: análisis de los conjuntos de datos de la colección SciELO incluidos en Figshare (ver más)

Traducción: Los datos abiertos generalmente se aplican a una variedad de materiales no textuales, incluidos conjuntos de datos, estadísticas, transcripciones, resultados de encuestas y los metadatos asociados con estos objetos. Los datos son, en esencia, la información objetiva que es necesaria para replicar y verificar los resultados de la investigación. Las políticas de datos abiertos generalmente abarcan la noción que la extracción de máquinas, la manipulación y el metaanálisis de datos deberían ser permisibles.


Además de estas citas, el siguiente video ilustra de manera adecuada lo que son los datos de investigación, sean abiertos o no:



Teniendo claro qué son los datos de investigación, y antes de profundizar en su ciclo, gestión y apertura, es importante entender que la relevancia actual de los datos ha generado un nuevo paradigma en la gestión de información y del conocimiento, que ha llevado a lo que se denomina ciencia de datos.