Elena Kubalíková
11 min readJun 8, 2018

Educational Data Mining a možnosti jeho využitia

Fakt, že žijeme v dobe dátovej, nie je žiadna novinka. Postupom rokov sa počet vyprodukovaných dát neustále zvyšuje, za posledné dva roky bolo vyprodukovaných 90 % všetkých svetových dát, pričom tento trend bude naďalej stúpať. Dátová analytika, strojové učenie či predikčné systémy sa tak stávajú bežnou praxou v mnohých odvetviach. Výnimkou nie je ani oblasť vzdelávania, kde sa intenzívnejšie o dátovej analytike začalo hovoriť pred približne 10 rokmi, kedy sa postupne ustálili termíny ako Educational Data Mining a Learning Analytics. V roku 2011 bolo založené International Educational Data Mining Society, ktoré zoskupuje odborníkov v oblasti z celého sveta, venuje sa organizácií konferencií a novinky v obore publikuje vo svojom oficiálnom časopise Journal of Educational Data Mining.

educationaldataminig.org

Eduactional Data Mining

Eduactional Data Mining (EDM) predstavuje interdisciplinárnu vedeckú disciplínu, ktorá sa zaoberá vývojom metód skúmania dát pochádzajúcich zo vzdelávania. EDM využíva a aplikuje postupy a techniky zo štatistiky, strojového učenia, dolovania dát, umelej inteligencie, neurónových sietí, exploratívnej vizualizácie dát či iných techník, za pomoci ktorých dokážu analytici objavovať nové informácie z oblasti vzdelávania. Hlavnou náplňou disciplíny je za pomoci analýzy dát pochopiť proces učenia, správanie a potreby študentov, na základe čoho je následne možné zefektívniť vzdelávacie procesy.

Zdroje dát

Dáta pre analýzu v rámci EDM pochádzajú najčastejšie z informačných systémov univerzít, systémov na riadenie výučby (Learning Management System — LMS), otvorených online kurzov (Massive Open Online Course — MOOC) či inteligentných systémov na doučovanie (Intelligent Tutoring System — ITS). Správna analýza a následné kroky môžu v konečnom dôsledku zlepšiť a zefektívniť samotné systémy, z ktorých sú dáta čerpané.

Nástroje a metódy EDM sa najčastejšie využívajú na analýzu dát z veľkých systémov, ktoré využívajú tisíce až státisíce ľudí. Aj keď takto veľké systémy poskytujú väčší objem dát, EDM sa dá využiť aj pre menšie vzdelávacie systémy či malé školy. Ak sa zameriame práve na menšie školy či univerzity, môžeme možnosti využitia EDM deliť podľa koncového užívateľa, ktorého potreby chceme uspokojiť — zvlášť pre študentov, pedagógov a samotné inštitúcie.

EDM pre študentov

EDM je vo všeobecnosti študentami najviac využívaný v rámci e-learningu. Nakoľko sú e-learningové systémy v základe navrhnuté tak, aby uspokojili potreby všetkých študentov, je dôležitá personalizácia e-learningu. Príkladom môže byť využite umelej inteligencie pri učení, ktorá pracuje s dátami, ktoré študent pri učení vygeneruje. Na rovnakom princípe fungujú napríklad výukové projekty, v rámci ktorých sa študenti učia programovať. Takýmto projektom na výuku je napríklad Robomise. Jedná sa o výukový kurz najmä pre deti, ktoré sa chcú naučiť základy programovania. Robomise využíva umelú inteligenciu a prispôsobuje úlohy študentom tak, aby sa prispôsobili ich zručnostiam. Príklady vo výuke sa tak zameriavajú na to, aby si študent precvičil to, s čím má problém a príklady zvládol.

Robomise.cz

V rámci EDM sú pre študentov a ich samostatné štúdium dôležité doporučovacie systémy. V rámci e-learningu je na základe dát z učebného procesu študenta možné odporučiť ďalšie zdroje pre štúdium alebo konkrétny materiál pre lepšie pochopenie preberanej látky. Inteligentné systémy pracujúce s dátami dokážu odporučiť aj ďalšie kurzy, ktoré na momentálne preberané učivo nadväzujú. Okrem ďalších kurzov systémy dokážu odporúčať aj online diskusie alebo knihy.

Významným pomocníkom pre študentov môžu byť nápovede pri učení. Na základe dát z učebného procesu sa vytvárajú nápovede, ktoré môžu následne pomôcť ďalším študentom, ktorí študujú v danom kurze.

EDM a pedagógovia

Prvým a najčastejším spôsobom akým pedagógovia využívajú Educational Data Mining je získavanie a analýza spätnej väzby od študentov na konci semestra. Je to jedna z prvých metód EDM vôbec, ktoré učitelia začali využívať ešte formou papierových dotazníkov, ktoré rozdali na konci semestra požiadali študentov o vyplnenie. Dnes sa vo väčšine prípadov spätná väzba zbiera prostredníctvom informačných systémov škôl a má k nej prístup aj vedenie školy. V prvom rade je však najdôležitejšia pre učiteľov, ktorí vďaka nej vedia reagovať zmenou alebo reorganizáciou vo výuke v rámci svojich premetov. Spätná väzba môže byť podnetom aj pre rozsiahlejšie zmeny, najlepšie však v kontexte analýzy ďalších dát.

Učitelia na základe dát, ktoré študenti vyprodukujú v rámci ich predmetov, dokážu analyzovať študentské návyky svojich študentov. Študentské návyky je možno okrem sledovania v učebni pozorovať aj v informačnom systéme danej vzdelávacej inštitúcie. Napríklad, môžeme sledovať ako dlho pred termínom študenti odovzdávajú domáce úlohy, či na ktoré skúšobné termíny sa študenti prihlasujú a ako často svoje prihlásenia menia.

Ďalšou možnosťou ako využiť EDM je detekcia študentov, ktorým je potrebné poskytnúť špeciálny prístup a poskytnúť im individuálny študijný plán. Často sa stáva, že študenti s hendikepom nevedia, že majú nárok na adaptáciu štúdia. Často sú to práve učitelia, ktorí si problémy študenta všimnú skôr ako on sám a môžu mu následne odporučiť, aby sa obrátil pre pomoc do univerzitného centra, ktoré je oprávnené poslať študenta na vyšetrenia a na základe výsledkov vyšetrenia študentovi individuálny študijný plán poskytnúť.

Učitelia môžu využiť metódy EDM na detekcie a analýzu najčastejších chýb, ktoré študenti robia. Následne sa tak učiteľ môže vo výuke na chyby zamerať a pokúsiť sa ich odstrániť.

EDM a inštitúcie

Vo vzdelávacích inštitúciách sa EDM najčastejšie využíva na posilnenie rozhodovacích procesov v snahe maximálne využiť dostupné ľudské zdroje a prostriedky na zefektívnenie vzdelávania. Príkladom môže byť prípad, kedy sa univerzita rozhoduje, či otvorí nový študijný obor či dokonca založí novú fakultu. Analýzou dát môže univerzita zistiť, či bude o novootvorený obor záujem ale aj to, na aký obsah predmetov sa zamerať aby boli následní absolventi oboru pripravení na trh práce. Dáta pre analýzu môžu získať z voľne odstupných dát a výročných správ konkurenčných univerzít, sociálnych sietí, webov zameraných na výber vysokej školy či dát z vlastných informačných systémov, v ktorých sa môže nachádzať celá rada dát o predmetoch a študentoch, ktorí na univerzite študujú v predmetoch blízkych chystanému novému oboru. Ako aj v predchádzajúcich prípadoch, aj v tomto prípade je dôležité zohľadňovať veľké množstvo dát rôzneho druhu a hľadať medzi nimi súvislosti.

Častejšie môžeme vidieť využitie EDM pri bežnejších rozhodovacích procesoch — ktorý kurz otvoriť aj v budúcom roku, akej téme sa v predmetne venovať prednostne alebo ako rozložiť povinnosti študentom v rámci predmetu.

Druhým najčastejším využitím EDM v riadení inštitúcií je jeho využitie v prijímacom konaní uchádzačov o štúdium. Jedná sa o (podporný) spôsob prijímania študentov, ktorý je bežnejší skôr na západných univerzitách.

Posledný spôsob, ktorý je potrebné spomenúť, nakoľko sa postupom rokov dostáva čoraz viac do pozornosti najmä na vysokých školách a univerzitách, ktorý sa postupom rokov stále viac využíva, je predikcia neúspešnosti štúdia prostredníctvom nástrojov a metód EDM. Rovnako ako v prípade prijímacieho konania, je aj predikcia neúspešnosti štúdia skôr záležitosťou západných univerzít a univerzít vyspelých ázijských krajín.

Zriadenie centier pomoci

Niektoré vzdelávacie inštitúcie, najmä západné univerzity, prevádzkujú vlastné centrá, v ktorých zamestnávajú odborníkov, ktorí sa venujú analýze dát zo systémov obsahujúcich dáta o študentoch. Predikčné systémy, ktoré sú v centrách vyvíjané, pracujú s najrôznejšími dátami a algoritmami, ktoré dokážu predpovedať, že študent začína vykazovať znaky, ktoré vedú k neúspešnosti štúdia. Študijní asistenti v centre tak môžu následne rizikového študenta zachytiť a pokúsiť sa študentov „osud“ zvrátiť. Predikčné systémy pracujú s obrovským množstvom dát, ktoré systémy zohľadňujú. Predikčné systémy zohľadňujú napríklad známky študentov, počet absencií a ich druh a dĺžku, kombinácia zapísaných predmetov v semestri, poberanie štipendia a sociálne pomery študenta, pohlavie a mnoho ďalších. Každá univerzita má svoje špecifiká, či už vzhľadom na nastavený študijný systém či krajinu, v ktorej sa univerzita nachádza. Napríklad, v multikultúrnom prostredí hrá značnú rolu aj etnický pôvod študentov.

Prípad Masarykovej univerzity

Masarykova univerzita disponuje troma centrami, ktoré pomáhajú študentom na ceste za úspešným ukončením štúdia ako aj pri hľadaní svojho miesta na trhu práce. Všetky nižšie uvedené centrá disponujú dátami, ktoré majú pre smerovanie univerzity značný potenciál:

Stredisko Teiresiás je centrom pre pomoc študentom so špecifickými nárokmi. Teiresiás je samostatnou jednotkou v rámci Masarykovej univerzity, ktorá sa stará a pomáha všetkým jej študentom, ktorí majú zdravotné problémy a potrebujú špeciálnu pomoc pri plnení svojich školských povinností. Značnú časť študentov tvoria zrakovo s sluchovo postihnutí študenti, ktorí majú v rámci štúdia pridelených asistentov, ktorí hendikepovaným študentom pomáhajú napríklad s prekladom prednášok, seminárov a cvičení do posunkovej reči.

Štúdium s hendikepom je časovo aj finančne náročnejšie, každý študent v stredisku Teiresiás tak stojí školu peniaze navyše. Napriek špecializovanej pomoci a vynaloženým prostriedkom sa študijná úspešnosť študentov, ktorí patria do správy strediska, drží okolo 15 %. Navyše, systém strediska je nastavený tak, že študentom pomáha iba vtedy, keď o to sami proaktívne požiadajú. Nejedná sa o žiadne študijné úľavy, ale o adaptáciu štúdia tak, aby ju študent s hendikepom mohol zvládnuť aj na napriek svojmu hendikepu.

Aj napriek obmedzeným možnostiam Strediska Teiresiás, je študijná neúspešnosť okolo 85% veľmi vysoká. Práve EDM by mohol stredisku pomôcť lepšie pochopiť potreby študentov, a nastaviť ich individuálne študijné programy tak, aby štúdium vedeli reálne zvládnuť.

Poradenské centrum Masarykovej univerzity — jedná sa o najnovšie centrum Masarykovej univerzity, ktoré zahájilo svoju činnosť v novembri 2018. Svoju činnosť centrum odštartovalo kampaň kampaňou „Jedno ucho“. Cieľom centra je pomáhať študentom, aby zvládli základnú orientáciu v štúdiu a zoznámili sa s univerzitným prostredím. Centrum pomáha študentom, aby si zvládli zapísať predmety v školskom informačnom systéme, aby našli knižnicu alebo ich centrum pošle na kurz, kde študentov naučia citovať. V prípade mnohých študentov sa jedná o banality, avšak univerzita musela zareagovať na dopyt po tejto službe, nakoľko mnoho novo prichádzajúcich študentov má v novom prostredí značný problém s orientáciou.

Samotné poradenské centrum však vzniklo ako odpoveď na vysokú mieru neúspešnosti štúdia, ktorá je do značnej miery spôsobená aj tým, že študenti „prebiehajú“ medzi obormi a dlho si vyberajú, čo je pre nich to pravé. Boj proti neúspešnosti štúdia sa tak stal samostatným projektom — MUNI 4.0. V rámci boja s negatívnymi číslami, ktoré univerzitu vrhajú do zlého svetla, sa univerzita rozhodla reformovať väčšinu študijných oborov naprieč všetkými fakultami. V Poradenskom centre pôsobia zástupcovia vybraných fakúlt, ktorých úlohou je starať sa, kontrolovať a navrhovať opatrenia tak, aby sa študijná neúspešnosť znižovala. Poradenské centrum s dátami o študentoch pracuje, do akej miery je však zatiaľ otázne. O viditeľných výsledkoch projektu je momentálne ešte predčasné písať, nakoľko centrum funguje približne pol roka a konkrétnejšie výsledky o jeho činnosti sa objavia pravdepodobne až vo výročnej správe o stave univerzity za rok 2019.

Kariérne centrum — funguje na rovnakom princípe ako predchádzajúce dve centrá — spolupráca so študentom začína, až keď študent sám prejaví iniciatívu a zapojí sa do akcií organizovaných Kariérnym centrom alebo využije niektorú zo služieb centra, akým je napríklad psychologické a osobnostné testovanie. Akcie centra sa sústredia primárne na stretnutie s budúcimi zamestnávateľmi, usporadúvajú workshopy a veletrhy práce, kde ich študenti môžu spoznať. Zatiaľ najväčším projektom Kariérneho centra je sprevádzkovanie kariérneho portálu JobCheckIN, v ktorom je momentálne registrovaných približne 8 000 študentov a absolventov z Masarykovej univerzity. Práve portál JobCheckIN je miestnom s obrovským dátovým potenciálom, s ktorým by mala univerzita určite pracovať. Uchádzači o zamestnanie z radov študentov na portáli prezentujú svoje schopnosti, znalosti a zručnosti, ktoré zaškrtávajú v checkboxoch. Systém následne študentom odporučí konkrétne ponuky práce, ktoré najviac zodpovedajú ich vyplneným znalostiam a zručnostiam. Práve dáta o svojich zručnostiach, ktoré sypú do systému samotní študenti, môžu byť pre univerzitu kľúčové pri tvorbe kurikula. Vďaka stretu akademického a pracovného sveta tak možno vidieť rozdiely medzi oboma svetmi. V prípade porovnávania dát z oboch strán je potrebné sledovať, čo presne pracovný svet od absolventov očakáva a či je študentom poskytnutá možnosť takéto znalosti na univerzite získať.

Nedostatky a slabé miesta

Ako to už býva, nie všetko sa dá použiť všade. To je aj prípad Educational Data Miningu a možností interpretácie výsledkov, ktoré vďaka EDM získavame. Nie vždy sú dáta dostatočné a v niektorých prípadoch potrebujeme ďalej skúmať, čo naozaj stojí za daným zistením, ktoré nám dáta ukázali.

Príkladom môže byť percentuálne počítanie úspešnosti absolvovania niektorých premetov na Masarykovej univerzite.

Na Fakulte informatiky sa vyučuje predmet IB00 Algoritmy a dátové štruktúry, ktorý patrí na bakalárskom štúdiu medzi neťažšie a mnoho študentov kvôli nemu nedobrovoľne ukončuje svoje štúdium. Úspešnosť predmetu sa za posledné roky, kedy predmet prevzala nová vyučujúca, pohybuje okolo 60%. V roku 2015 sa však úspešnosť zdvihla na závratných 98 %. Pre študentov, ktorí sa orientujú pri zápise predmetov percentuálnou úspešnosťou predmetu, je to jasný pokyn k zápisu, pretože sa určite jedná o „kreditovku“ a danému predmetu nie je potrebné venovať príliš veľa času. Opak je však pravdou.

V roku 2015 sa zaviedli implementačné testy, ktoré keď študent nesplnil, nedostal sa ku skúške. V danom roku bol navyše na implementačný test iba jeden pokus, ktorý sa približne polovici študentov nepodaril. Študenti dostali v hodnotení „-“ a zaradili sa do rovnakej kolónky ako tí, ktorí mali predmet iba zapísaný. Vo výsledku to však vyzerá tak, že predmet patrí k tým najúspešnejším.

Vo veľkých vzdelávacích inštitúciách môže mať na kvalitu dát v informačných systémoch vplyv fakt, že dáta do systému zadáva veľké množstvo ľudí. Nie všetci sa riadia pokynmi alebo zadávanie dát do systému obchádzajú. Jedná sa napríklad o absenciu zadávania hodnotenia známok študentom, ktorí predmet nesplnili podmienky na pripustenie ku skúške alebo nevyužívanie aplikácie v informačnom systéme na zadávanie dochádzky na seminároch a cvičeniach. Takto sa do systému nedostávajú dáta, ktoré by neskôr mohli byť osožné pre analytikov, ktorí dáta skúmajú. Pri práci s dátami je dôležití ochrana súkromia a potreba dbať na etiku práce s dátami.

Zdroje

BAKHSHINATEGH, Behdad, Osmar R. ZAIANE, Samira ELATIA a Donald IPPERCIEL. Educational data mining applications and tasks: A survey of the last 10 years. Education and Information Technologies. Cham: Springer International Publishing, 2018, 2018–07–24, 23(1), 537–553. DOI: 10.1007/s10639–017–9616-z. ISBN 978–3–319–76471–9. ISSN 1360–2357. Dostupné také z: http://link.springer.com/10.1007/s10639-017-9616-z

BHULLAR, Manpreet Singh a Amritpal KAUR. Use of Data Mining in Education Sector. Proceedings of the World Congress on Engineering and Computer Science. San Francisco, USA, 2012, 2012(1), 4. ISSN 2078–0966. Dostupné také z: http://www.iaeng.org/publication/WCECS2012/WCECS2012_pp513-516.pdf

DAHIYA, Vandna a . A Survey on Educational Data Mining. International Journal of Research in Humanities, Arts and Literature. 2018, 6(5), 7. ISSN 2321–8878. Dostupné také z: https://www.researchgate.net/publication/325181159_A_SURVEY_ON_EDUCATIONAL_DATA_MINING

Educational Data Mining [online]. State of Massachusetts: International Educational Data Mining Society, 2011 [cit. 2018–05–28]. Dostupné z: http://educationaldatamining.org/

GASEVIC, Dragan. Tools for Educational Data Mining. Journal of Educational and Behavioral Statistics. 2016, 42(1), 85–106. DOI: 10.3102/1076998616666808. ISSN 1076–9986. Dostupné také z: http://journals.sagepub.com/doi/10.3102/1076998616666808

Kariérní portál Masarykovy univerzity. JobCheckIN [online]. Brno: Masarykova univerzita, 2016 [cit. 2018–05–28]. Dostupné z: https://www.jobcheckin.muni.cz/

MARR, Bernard. How Much Data Do We Create Every Day? The Mind-Blowing Stats Everyone Should Read. Forbes [online]. Forbes, 2018 [cit. 2019–05–12]. Dostupné z: https://www.forbes.com/sites/bernardmarr/2018/05/21/how-much-data-do-we-create-every-day-the-mind-blowing-stats-everyone-should-read/#7c9ff35d60ba

PEÑA-AYALA, Alejandro, ed. Learning Analytics: Fundaments, Applications, and Trends: A View of the Current State of the Art to Enhance e-Learning (Studies in Systems, Decision and Control). 2. New York: Springer, 2017, 303 s. Studies in Systems, Decision and Control (Book 94). ISBN 978- 3319529769.

RAY, Santosh a Mohammed SAEED. Applications of Educational Data Mining and Learning Analytics Tools in Handling Big Data in Higher Education. Applications of Big Data Analytics. Cham: Springer International Publishing, 2018, 2018–07–24, , 135–160. DOI: 10.1007/978–3–319–76472–6_7. ISBN 978–3–319–76471–9. Dostupné také z: http://link.springer.com/10.1007/978-3-319-76472-6_7

VENTURA, Sebastian a Christóbal ROMERO. Educational Data Mining: A Review of the State of the Art. Transactions on Systems, Man, and Cybernetics. 2010, 20(10), 17. DOI: 10.1109. Dostupné také z: https://www.researchgate.net/publication/224160756_Educational_Data_Mining_A_Review_of_the_State_of_the_Art

Video: Jsme jedno ucho, pokud jde o vaše problémy. Zprávy z MUNI [online]. Brno: Masarykova univerzita, 2018 [cit. 2019–05–28]. Dostupné z: https://www.em.muni.cz/student/11062-video-jsme-jednou-ucho-pokud-jde-o-vase-problemy

Tento článok je záverečnou prácou k predmetu VIKMA16 Učící se společnost na Masarykovej univerzite.