Introducción

«Los datos son una cosa preciosa y durarán más tiempo que los propios sistemas».

Tim Berners-Lee

La Ciencia de Datos es un término abierto aplicable a un gran número de disciplinas, y lo entendemos como el conjunto de técnicas y principios que regulan la recopilación y medición de datos sobre un determinado proceso. En el ámbito específico de la educación, nos referimos al proceso de enseñanza y de aprendizaje mediante el cálculo de indicadores y métricas que permitan interpretar los resultados del fenómeno objeto de estudio, el proceso a través del cual los estudiantes construyen conocimiento significativo de manera conjunta.

Un claro ejemplo de aplicación de la Ciencia de Datos en el ámbito educativo es la predicción del rendimiento académico de los estudiantes, gracias a la construcción de modelos predictivos en base a datos históricos con el objetivo de detectar el fracaso o el abandono de los estudiantes antes de que ocurra; y al emprendimiento de medidas correctoras que se basan en el conocimiento adquirido en el análisis de los modelos de datos. Otro ejemplo de aplicación es la personalización del aprendizaje, tanto en contenidos didácticos como en actividades de evaluación e itinerarios formativos. De este modo, se consigue mejorar la experiencia de los estudiantes al aumentar su rendimiento y al facilitar la adquisición de los objetivos curriculares.

En la Sociedad de la Información y el Conocimiento, recientemente bautizada con el nombre de Sociedad de la Inteligencia Artificial, los datos y el uso que se hace de ellos cobran una gran relevancia. La Inteligencia Artificial (IA) es la combinación de algoritmos planteados con el propósito de crear máquinas que presenten las mismas capacidades que el ser humano que, a su vez, han sido generados por las propias personas para generar productos de conocimiento (escritos, orales o en formato de video).

Es importante destacar que, si bien la mejora en los algoritmos y el manejo de grandes cantidades de datos puede ofrecer más oportunidades en el uso de la IA (Chat GPT), también es esencial tener en cuenta las limitaciones que esta tecnología presenta, dado que tomar decisiones informadas sobre el uso de la IA en la educación requiere una comprensión clara de su naturaleza y de sus limitaciones.

Sin embargo, es aún más importante la explotación o «minado» de estos datos con diversos fines como, por ejemplo, descubrir patrones en ellos que nos ayuden a comprender un fenómeno; o bien para comprobar teorías científicas y construir modelos que nos ayuden a predecir el comportamiento de un sistema; entre otros. Es por este motivo que la Ciencia de Datos se retroalimenta de un conjunto de disciplinas relacionadas (figura 1), que a continuación describiremos.

Figura 1. Disciplinas relacionadas con la Ciencia de Datos
Fuente: elaboración propia

La Minería de Datos (Data Mining) es una disciplina de la que algunos investigadores ya hablaban en la década de los ochenta. Desde sus inicios fue considerada como un campo de investigación de carácter técnico-matemático, puesto que se centraba en el uso de técnicas algorítmicas para la detección de patrones y la obtención de información, más allá de las de carácter estadístico-descriptivo para la extracción de información relevante y aparentemente opaca que se encuentra dentro de los datos. Dichos datos se recogen y se almacenan por medios telemáticos y digitales.

Entendemos la Minería de Datos como el campo relacionado con el empleo de grandes cantidades de datos para apoyar el descubrimiento de información novedosa y potencialmente útil. También puede ser definida como una disciplina que permite descubrir información de una potencial utilidad en un gran número de datos. Sin embargo, la aplicación de determinadas herramientas y metodologías propias de la Minería de Datos en el contexto educativo es lo que se conoce como Minería de Datos Educativos (Educational Data Mining). Esta extracción de información de los datos en entornos educativos permite poner a prueba las teorías del aprendizaje y permite obtener información sobre las prácticas educativas.

Con la Minería de Datos Educativos podemos alcanzar diversos objetivos: por un lado, la información obtenida se puede vincular con técnicas analíticas y modelos predictivos para mejorar la toma de decisiones en las instituciones educativas. Este uso recibe el nombre de analíticas académicas (Academic Analytics) y las podemos describir como la aplicación de la inteligencia de negocios para el área del aprendizaje. Pero lo que motiva el presente material es el enfoque pedagógico, en el que emerge la disciplina de las analíticas del aprendizaje (Learning Analytics) y sus aplicaciones (Minguillón et al., 2014). Es decir, se pretende analizar toda la información que el estudiante en línea proporciona a través de sus acciones cuando interacciona con los agentes del proceso educativo, aplicando metodologías adecuadas y seleccionando la información necesaria para conocer su desarrollo cuando desempeña actividades de aprendizaje de tipo colaborativo. Esta idea radica en la necesidad de facilitar el seguimiento de los estudiantes por parte del profesorado y en la de evaluar este tipo de actividades de aprendizaje en entornos en línea (Cooper y Khosravi, 2018).

En el ámbito educativo superior, las técnicas de Minería de Datos han estimulado poderosos movimientos, entre los cuales destaca particularmente las analíticas del aprendizaje (Buckingham y Deakin, 2016; Ferguson et al., 2016). Algunos investigadores consideran que las analíticas del aprendizaje son herramientas que ofrecen información sobre los procesos de interacción entre los estudiantes (Caballé y Clarisó, 2016), mientras que otros autores (Gañán et al., 2017) las consideran más como un servicio que monitoriza el progreso de los procesos de enseñanza y aprendizaje en línea a través de sistemas y aplicaciones de aprendizaje virtual (e-learning). De hecho, uno de los retos a los que se enfrenta el profesorado es la interpretación de cuadros de mandos que monitorizan datos sobre el rendimiento de los estudiantes (Herodotou et al., 2023).

Para concluir con la contextualización de las analíticas del aprendizaje y su vinculación con las disciplinas descritas anteriormente, se ha de remarcar la contribución de Long  y Siemens (2011), que identifican los rasgos comunes entre las analíticas del aprendizaje, las analíticas académicas y la Minería de Datos Educativos a través de la figura 2.

Figura 2. Aspectos comunes de las disciplinas AA, LA y EDM
Fuente: Adaptación a partir de Long y Siemens, 2011

Como aspectos comunes más relevantes de la anterior figura, los autores destacan que las tres disciplinas ofrecen un enfoque centrado en el uso de los datos, una búsqueda del éxito del estudiante, la ayuda a la toma de decisiones y a la planificación, y una contribución de base para la investigación de campo. El reto se encuentra en contrarrestar la idea que el profesorado tiene en torno a las analíticas del aprendizaje de que a menudo se le da prioridad a la producción de datos sobre la actividad del estudiante más que en apoyar el aprendizaje de estos.

Los entornos de aprendizaje en línea posibilitan el registro de todas las interacciones que se producen entre los estudiantes a través de grandes bases de datos. Dichos datos por sí mismos no tienen significado hasta que no se les otorga sentido, se analizan, se resumen y, finalmente, se utilizan para alcanzar unos objetivos o metas concretos. En este contexto emergen nuevas disciplinas que se encargan del estudio de los datos y de la forma en la que pueden ser relacionados entre sí para comprender mejor la realidad pasada, presente o, incluso, su predicción. Este es el caso de las analíticas del aprendizaje.