Datos y metodologías abiertas

Datos y metodologías abiertas

Autor: Alejandro Uribe Tirado

Docente UdeA

Ahora que comprendemos lo que son los datos en sentido general y los datos de investigación, nos aproximaremos de manera específica a lo que son e implican los datos abiertos de investigación.

En esta ocasión profundizaremos más en esas características que deben tener los open data y las metodologías. Para esto es importante retomar, en un inicio, otras definiciones al respecto:


¿Qué son los datos de investigación abiertos y las metodologías de investigación abiertas?

La Royal Society (2012) define los datos abiertos como aquellos datos que cumplen ciertos criterios cuando son liberados; es decir, son accesibles, usables, evaluados/certificados e inteligibles.

Por su parte, desde el Handbook de Open Data (s.f.) se indica que los datos abiertos son aquellos que pueden ser utilizados, reutilizados y redistribuidos libremente por cualquier persona, y que se encuentran sujetos al requerimiento de atribución y de compartirse de la misma manera en que aparecen. La definición de abierto da detalles precisos de lo que significa. Para resumir lo más importante, siguiendo con ese portal, tenemos:

  • Disponibilidad y acceso: la información debe estar disponible como un todo y a un costo razonable de reproducción, preferiblemente descargándola de internet. También debe estar disponible en una forma conveniente y modificable.
  • Reutilización y redistribución: los datos deben ser provistos bajo términos que permitan reutilizarlos y redistribuirlos, e incluso integrarlos con otros conjuntos de datos.
  • Participación universal: todos deben poder utilizar, reutilizar y redistribuir la información. No debe haber discriminación alguna en términos de esfuerzo, personas o grupos. Restricciones “no comerciales” que prevendrían el uso comercial de los datos; o restricciones de uso para ciertos propósitos (por ejemplo, sólo para educación) no son permitidos.

Para comprender por qué es tan importante ser claros respecto de lo que significa ser abierto y por qué se usa esta definición, hay una respuesta simple: interoperabilidad que, según Chankray (s.f.), “es la capacidad de dos o más sistemas de información, o componentes que permite el intercambio de información y uso de esta, entre los distintos sistemas. Así, la sincronización entre todas las partes estará más que garantizada”.

En el contexto de la ciencia abierta, es clave ya que “el ser una fuente de datos abierta denota su capacidad para trabajar junto a distintos sistemas y organizaciones, mezclándose con diferentes conjuntos de datos (…). El fundamento de todo código de datos (que en el caso del open data es su parte abierta y compartible) es que una pieza de material contenida en los mismos puede mezclarse libremente con otro material diferente y con el que, en principio, no existía relación alguna” (Logicales, 2015)

Por tanto, los datos abiertos de investigación cumplen ciertas características que los hacen realmente abiertos, y que (Melbourne University; en Recolecta, 2012, p. 10):

(…) pueden ser numéricos, descriptivos o visuales… pueden ser en estado bruto o analizado… pueden ser experimentales u observacionales. Los datos incluyen: cuadernos de laboratorio, cuadernos de campo, datos de investigación primaria (incluidos los datos en papel o en soporte informático), cuestionarios, cintas de audio, videos, desarrollo de modelos, fotografías, películas, y las comprobaciones y las respuestas de la prueba. Las colecciones datos para la investigación pueden incluir diapositivas; diseños y muestras. En la información sobre la procedencia de los datos también se podría incluir: el cómo, cuándo, donde se recogió y con que (por ejemplo, instrumentos). El código de software utilizado para generar, comentar o analizar los datos también pueden ser considerados datos.

Como lo indican Alcalá y Anglada (2019), los datos han sido siempre fundamentales en la investigación, pero el contexto actual es lo que ha hecho que se pueda decir que “los datos son el nuevo oro del siglo XXI” (Alcalá y Anglada, 2019, p. 2):

La ciencia siempre ha usado datos como materia prima para la investigación y el avance del conocimiento. Pero hasta hace poco, éstos eran difíciles de difundir, compartir y reutilizar. Actualmente la capacidad de procesar, conservar y comunicar de los ordenadores y las redes de comunicación ha cambiado profundamente el sistema de comunicación científica y lo ha hecho más eficiente, transparente y colaborativo. Así lo señala, por ejemplo, la CRUE cuando afirma que: ´la actividad investigadora actual es intensiva en la generación, consumo y explotación de datos y su preservación y reutilización son clave en la investigación del siglo XXI´ (CRUE, 2019). Por este motivo se considera que los datos son el ‘nuevo oro’ del siglo XXI, se les asigna un alto valor estratégico y en estos últimos años están en el centro de la atención de la comunidad científica y de los órganos gestores de la investigación.

En tal sentido, los datos son fundamentales en la ciencia actual, pero no solo éstos, ya que los datos son recopilados y analizados gracias a la metodología, que implica la investigación respectiva; es decir, sus métodos e instrumentos, sean desde un enfoque cuantitativo, cualitativo o mixto, o desde la visión de cada disciplina.

Por tanto, compartir los datos de investigación como datos abiertos no implican solo los datos mismos, sino también compartir en abierto los medios que permitieron capturar y estudiar esos datos (open research) (Ver What is open research?), para así cumplir con los aspectos claves de la visión abierta de los datos: interoperabilidad, transparencia (ver Transparency and Openness Promotion), reutilización y reproductibilidad ( ver Project TIER (transparency and replicability in the research).

Beneficios de compartir datos y metodologías

Diferentes autores y organizaciones han resumido los beneficios de los datos abiertos.

Principios de la Denton Declaration: Open Data Manifiesto

Melero y Hernández (2014). Esquema basado en los principios de la Denton Declaration: An open access manifestó. https://cutt.ly/soHLa1r