21. juni 2017

Gymnasieelever, pas på med at snyde! I bliver sandsynligvis opdaget

Eksamenssnyd

Flere end 6% af de danske gymnasieelever snyder til eksamen. Nogle gribes på fersk gerning. Andre formår at krybe under radaren. På Datalogisk Institut på KU (DIKU) har man i flere år forsket i at afsløre snyd på basis af enkeltpersoners skrivestile. Metoden anvender big data og kan med stadig større sikkerhed sandsynliggøre, om en elev har snydt med en opgave.

I disse dage uddeles de sidste huer til den stolte årgang af nyuddannede studenter. Snart vil de festlige toner fra åbne ladvogne og andre køretøjer bekendtgøre, at en ny generation af studenter har forladt deres ungdomsuddannelse for enten at styre direkte ind på en videregående uddannelse eller tage et velfortjent sabbatår oven på et hektisk og hårdt eksamensforløb.

Men uanset at mange nyudklækkede studenter har puklet for at nå frem til deres flotte karaktergennemsnit, så viser forskning og helt almindelige stikprøver, at der snydes med opgaverne som aldrig før. Ifølge TV2 Nyheder har mere end 6% af landets gymnasieelever bedrevet en eller anden form for snyd i forbindelse med deres eksamen: http://nyheder.tv2.dk/samfund/2017-05-14-rektorer-slaar-alarm-snyd-under-eksamen-er-et-stigende-problem. Også Berlingske har dækket fænomet gennem en artikelserie om Fix-Min-Opgave (kræver abonnement).

Lectio-systemet har kunnet afsløre plagiater i en del år

Almindelig plagiering, dvs. afskrift fra andre elevers opgaver, kan forholdsvis let afsløres maskinelt, fx via Lectio-platformen, der anvendes på de fleste danske gymnasier, ved at analysere elevens konkrete opgave i forhold til tidligere opgaver afleveret af andre elever.  Dette er en hjælp til læreren, nemlig et værktøj til at underbygge lærerens egen mavefornemmelse om, at eleven muligvis har snydt.

Ghost-writing er nyeste skud på plagiattræstammen

Hvis eleven derimod har bestilt en opgave ude i byen, er det straks sværere for maskinen at fange snyd, da den ikke kan sammenligne med tilsvarende opgaver i Lectios system. Her kommer de nye forskningsmetoder, der er baseret på maskinlæring og big data, som analyserer elevens personlige skrivestil, i spil:

Computeren har på basis af elevens tidligere indleverede opgaver på forhånd ’lært’, hvordan elevens profil ser ud ved at kigge på typiske ord og udtryk, brug af lange vs. korte ord og sætninger samt andre personlige karakteristika. Viser analysen, at en opgave afviger væsentligt fra elevens normale skrivestil, er det ikke nødvendigvis ensbetydende med at eleven rent faktisk har snydt eller skrevet for meget af. Men maskinen vil alligevel kunne udsende en alarm til den lærer, der skal rette opgaven, så læreren har mulighed for at dykke mere kritisk ned i opgaven.

I Danmark er fænomenet med at få ’ghost writers’ til at skrive en opgave ret nyt, mens det har været kendt i USA i længere tid. Her findes der såkaldte ’papermills’, hvis forretningsmodel er at skrive opgaver for studerende. På universitetsniveau har 7% amerikanske studerende indrømmet at have afleveret en opgave skrevet af en anden. Den nyetablerede danske virksomhed Fix-min-opgave bygger på samme koncept og har i 2017 oplevet overordentlig stor interesse fra pressede danske gymnasieelever.

Snyd kan og skal bekæmpes - bl.a. gennem forskning i maskinlæring og big data

Jo større sammenligningsgrundlag, jo bedre metoder får man til at komme snydefænomenet til livs. Virksomheden MaCom, som står bag den digitale platform Lectio, råder over et meget stort korpus på 15 mio. afleverede opgaver indleveret digitalt af landets gymnasielever gennem en årrække.

Professor Stephen Alstrup, DIKU

Disse opgaver indgår nu i et forskningsprojekt, som udføres af forskere på Københavns Universitet i samarbejde med MaCom. Formålet er at afdække ghost-writing, Professor Stephen Alstrup, der leder et større projekt om Big Data og digitalisering i undervisningssektoren som led i det landsdækkende projekt DABAI.DK, fortæller:

- Allerede i 2013 begyndte vi sammen med MaCom at arbejde med metoder til at analysere elevers personlige skrivestil. Kandidatstuderende på Datalogisk Institut på KU (DIKU) Niels Dalum Hansen, som skrev projekt om plagiatkontrol for MaCom, kunne dengang på grundlag af 100.000 indleverede opgaver nå op på en 60%’s sandsynliggørelse af, om en person havde snydt med sin opgave.

Nøjagtighed på 73,3% - og det kan blive bedre

I dag (2017) sidder en ny DIKU-kandidatstuderende og arbejder videre med nye og mere raffinerede analysemetoder til afsløring af ghost-writing. Her sammenligner vi bl.a. skrivestilen i en opgave med skrivestile for et sæt af andre studerende for at påvise, om andre i gruppen med større sandsynlighed har skrevet opgaven.

De foreløbige resultater er lovende, idet man er oppe på at kunne påvise afvigelser eller plagiater med en nøjagtighed på 73,3%. Til analyserne anvendes forskellige maskinelt trænede algoritmer.

Opgave X sammenlignes med et bredt korpus af tidligere opgaver i forhold til elevens personlige skrivestil. Er Opgave X for afvigende, kan metoden med 73% sikkerhed afsløre snyd.

Efterhånden som mængden af basismateriale øges, og metoderne bliver stadig mere raffinerede, vil man kunne inddrage endnu flere analyseelementer og endnu mere komplekse sammenligningsmetoder, der evt. også vil kunne følge den enkelte elevs skrivestil over tid.

Formålet er ikke først og fremmest at agere ’Big Brother’ og jagte eksamenspressede gymnasieelever – og maskinanalysens resultater vil aldrig kunne stå alene. Ideen er at give gymnasielærerne et generelt advarselssystem og hjælpeværktøj til at identificere mulig snyd, så at der kan sættes forebyggende ind og grelle snydere hurtigere kan pågribes. Et måske lige så vigtigt formål er, at metoden på sigt vil kunne bruges til at hjælpe den enkelte elev med at styrke sin egen læringsstil og sikre en god progression gennem gymnasieårene.

Så, gymnasieelever, tag jer i agt – det kan ikke betale sig at snyde. Konsekvensen kan være en mistet studenterhue eller fratagne karakterer.