Introducció

«Les dades són una cosa preciosa i duraran més temps que els propis sistemes».

Tim Berners-Lee

La Ciència de Dades és un terme obert aplicable a un gran nombre de disciplines, i ho entenem com el conjunt de tècniques i principis que regulen la recopilació i mesurament de dades sobre un determinat procés. En l’àmbit específic de l’educació, ens referim al procés d’ensenyament i d’aprenentatge mitjançant el càlcul d’indicadors i mètriques que permetin interpretar els resultats del fenomen objecte d’estudi, el procés a través del qual els estudiants construeixen coneixement significatiu de manera conjunta.

Un clar exemple d’aplicació de la Ciència de Dades en l’àmbit educatiu és la predicció del rendiment acadèmic dels estudiants, gràcies a la construcció de models predictius sobre la base de dades històriques amb l’objectiu de detectar el fracàs o l’abandonament dels estudiants abans que ocorri; i a l’emprenedoria de mesures correctores que es basen en el coneixement adquirit en l’anàlisi dels models de dades. Un altre exemple n’és la personalització de l’aprenentatge, tant en continguts didàctics com en activitats d’avaluació i itineraris formatius. D’aquesta manera, s’aconsegueix millorar l’experiència dels estudiants quan s’augmenta el seu rendiment i quan es facilita l’adquisició dels objectius curriculars.

En la Societat de la Informació i el Coneixement, recentment batejada amb el nom de Societat de la Intel·ligència Artificial, les dades i l’ús que se’n fa d’ells cobren una gran rellevància. La Intel·ligència Artificial (IA) és la combinació d’algorismes plantejats amb el propòsit de crear màquines que presentin les mateixes capacitats que l’ésser humà que, al seu torn, han estat generats per les pròpies persones per crear productes de coneixement (escrits, orals o en format de vídeo).

És important destacar que, si bé la millora en els algorismes i el maneig de grans quantitats de dades pot oferir més oportunitats en l’ús de la IA (Xat GPT), també és essencial tenir en compte les limitacions que aquesta tecnologia presenta, atès que prendre decisions informades sobre l’ús de la IA en l’educació requereix una comprensió clara de la seva naturalesa i de les seves limitacions.

No obstant això, és encara més rellevant l’explotació o «minat» d’aquestes dades amb diverses finalitats com, per exemple, descobrir-ne patrons que ens ajudin a comprendre un fenomen; o bé per comprovar teories científiques i construir models que ens ajudin a predir el comportament d’un sistema; entre d’altres. És per aquest motiu que la Ciència de Dades es retroalimenta d’un conjunt de disciplines relacionades (figura 1), que a continuació descriurem.

Figura 1. Disciplines relacionades amb la Ciència de Dades
Font: elaboració pròpia

La Mineria de Dades (Data Mining) és una disciplina de la qual alguns investigadors ja parlaven en la dècada dels vuitanta. Des dels seus inicis va ser considerada com un camp de recerca de caràcter tècnic-matemàtic, ja que se centrava en l’ús de tècniques algorítmiques per la detecció de patrons i l’obtenció d’informació, més enllà de les de caràcter estadístic-descriptiu per l’extracció d’informació rellevant i aparentment opaca que es troba dins de les dades. Aquestes dades es recullen i s’emmagatzemen per mitjans telemàtics i digitals.

Entenem la Mineria de Dades com el camp relacionat amb l’ús de grans quantitats de dades per donar suport al descobriment d’informació nova i potencialment útil. També pot ser definida com una disciplina que permet descobrir informació d’una potencial utilitat en un gran nombre de dades. No obstant això, l’aplicació de determinades eines i metodologies pròpies de la Mineria de Dades en el context educatiu és el que es coneix com Mineria de Dades Educatives (Educational Data Mining). Aquesta extracció d’informació de les dades en entorns educatius permet posar a prova les teories de l’aprenentatge i obtenir informació sobre les pràctiques educatives.

Amb la Mineria de Dades Educatives podem aconseguir diversos objectius: d’una banda, la informació obtinguda es pot vincular amb tècniques analítiques i models predictius per millorar la presa de decisions en les institucions educatives. Aquest ús rep el nom d’analítiques acadèmiques (Academic Analytics) i les podem descriure com l’aplicació de la intel·ligència de negocis per l’àrea de l’aprenentatge. Tanmateix, el que motiva aquest material és l’enfocament pedagògic, en el qual emergeix la disciplina de les analítiques de l’aprenentatge (Learning Analytics) i les seves aplicacions (Minguillón et al., 2014). És a dir, es pretén analitzar tota la informació que l’estudiant en línia proporciona a través de les accions quan interacciona amb els agents del procés educatiu, aplicant metodologies adequades i seleccionant la informació necessària per conèixer el seu desenvolupament quan exerceix activitats d’aprenentatge de tipus col·laboratiu. Aquesta idea radica en la necessitat de facilitar el seguiment dels estudiants per part del professorat i en la d’avaluar aquest tipus d’activitats d’aprenentatge en entorns en línia (Cooper i Khosravi, 2018).

En l’àmbit educatiu superior, les tècniques de Mineria de Dades han estimulat poderosos moviments, entre els quals destaquen particularment les analítiques de l’aprenentatge (Buckingham i Deakin, 2016; Ferguson et al., 2016). Alguns investigadors consideren que les analítiques de l’aprenentatge són eines que ofereixen informació sobre els processos d’interacció entre els estudiants (Caballé i Clarisó, 2016), mentre que altres autors (Taujà et al., 2017) les consideren més com un servei que monitora el progrés dels processos d’ensenyament i aprenentatge en línia a través de sistemes i aplicacions d’aprenentatge virtual (e-learning). De fet, un dels reptes als quals s’enfronta el professorat és la interpretació de quadres de comandaments que monitoren dades sobre el rendiment dels estudiants (Herodotou et al., 2023).

Per concloure amb la contextualització de les analítiques de l’aprenentatge i la seva vinculació amb les disciplines descrites anteriorment, s’ha de remarcar la contribució de Long i Siemens (2011), que identifiquen els trets comuns entre les analítiques de l’aprenentatge, les analítiques acadèmiques i la Mineria de Dades Educatives a través de la figura 2.

Figura 2. Aspectes comuns de les disciplines AA, LA i EDM
Font: Adaptació a partir de Long i Siemens, 2011

Com a aspectes comuns més rellevants de l’anterior figura, els autors destaquen que les tres disciplines ofereixen un enfocament centrat en l’ús de les dades, una cerca de l’èxit de l’estudiant, l’ajuda a la presa de decisions i a la planificació, i una contribució de base per a la recerca de camp. El repte es troba a contrarestar la idea que el professorat té respecte a les analítiques de l’aprenentatge, ja que sovint es dona prioritat a la producció de dades sobre l’activitat de l’estudiant, més que a donar-los suport a l’aprenentatge d’aquests.

Els entorns d’aprenentatge en línia fan possible el registre de totes les interaccions que es produeixen entre els estudiants a través de grans bases de dades. Aquestes dades per si mateixes no tenen significat fins que no se’ls atorga sentit, s’analitzen, es resumeixen i, finalment, s’utilitzen per aconseguir uns objectius o metes concrets. En aquest context, emergeixen noves disciplines que s’encarreguen de l’estudi de les dades i de la forma en la qual es poden relacionar entre si per comprendre millor la realitat passada, present o, fins i tot, la seva predicció. Aquest és el cas de les analítiques de l’aprenentatge.