Vores computere er sexistiske overfor kvindelige og mandlige politikere
Kvindelige politikere bliver ofte beskrevet som ’smukke’ eller ’hysteriske’ i sprogmodeller, hvor deres mandlige kolleger i stedet behæftes med ord som ’modige’ og ’selvstændige’. Det viser en ny analyse foretaget af blandt andre forskere fra Københavns Universitet. Den sexistiske og stereotype beskrivelse af kønnene er et problem for ligestillingen, lyder det fra forsker bag undersøgelsen.
Når Google giver os forslag til søgeord eller hjælper os med at oversætte en tekst fra dansk til engelsk, interagerer vi med sprogmodeller – en slags algoritmer - der forsøger at regne det næste mest sandsynlige ord i en sætning ud.
Men de sprogmodeller viser sig at være sexistiske, når det gælder beskrivelsen af mandlige og kvindelige politikere. Det afslører et igangværende forskningsprojekt støttet af Danmarks Frie Forskningsfond, udarbejdet af forskere fra Københavns-, Zürich- og Cambridge Universitet.
Vores computere kæder nemlig ofte kvindelige politikere sammen med ord, der beskriver deres udseende, svagheder og familiemæssige status, hvor deres mandlige kolleger i stedet beskrives ud fra deres handlekraft og politiske overbevisning, lyder det fra en af forskerne bag projektet.
”Hvor kvinderne beskrives med ord som ’hysterisk’ og ’skrøbelig’, bliver de mandlige politikere behæftet med ord som ’selvstændig’ og ’modig’. Og det er et problem for ligestillingen i vores samfund. Sprogmodeller, der behandler kønnene uens, kan nemlig forstærke den måde, vi tænker og taler om hinanden på ude i virkeligheden,” siger Isabelle Augenstein, der er lektor på Datalogisk Institut på Københavns Universitet og leder af sektionen Natural Language Processing.
Sammen med forskerholdet er hun i færd med at analysere et kæmpe datasæt over, hvordan 250.000 politikere beskrives i forskellige sprogmodeller på tværs af seks sprog, nemlig engelsk, arabisk, hindi, spansk, russisk og kinesisk. De er endnu ikke klar med den danske del af analysen, men forventer, at lignende tendenser vil gælde herhjemme.
Ugifte kvinder og stærke mænd
Forskerne har fundet en liste over de mange politikere på opslagsværket wikidata – en søsterside til Wikipedia. Derefter har de indsat politikernes navne i en sprogmodel, der er trænet til at forudsige det næste mest sandsynlige adjektiv i en sætning. Og indtil videre kan de altså konkludere, at modellerne, på tværs af de seks sprog, ofte foreslår ord, der knytter sig til udseende og familierelationer, når det gælder kvindelige politikere.
”Ord der beskriver familiemæssig eller ægteskabelig status, såsom ’skilsmisse’, ’ugift’, ’gravid’ eller ’mor’ bliver brugt langt mere for kvindelige politikere end for mænd. Det samme gælder ord som ’blond’ og ’smuk’,” forklarer Isabelle Augenstein.
De mandlige politikere beskrives derimod i højere grad ud fra deres virke som politikere, og hvordan de tackler deres arbejde, selvom det ikke nødvendigvis er i positive vendinger, uddyber hun.
’Kapitalist’, ’stærk’ ’bolsjevik’ og ’militant’ er nemlig nogle af de betegnelser, som sprogmodeller associerer med mandlige politikere, fremgår det af den foreløbige undersøgelse.
”Det er et problem rent etisk, hvis vi ønsker et samfund, hvor politikere beskrives ud fra deres faglige kvalifikationer og arbejdsindsats fremfor ud fra, hvordan de ser ud, eller hvordan deres familiesituation er. Og når mænd beskrives i relation til deres handlinger, og kvinder i forhold til deres udseende, er det en skævhed, vi bør tage alvorligt,” siger Isabelle Augenstein.
Sprogmodeller bør være mindre sexistiske
Sprogmodeller trækker eksempelvis på data fra hjemmesider, sociale medier og Wikipedia så den måde, vi skriver om hinanden på, påvirker de svar, vi får fra Google og andre søgemaskiner.
Derfor er det ikke let at komme de stereotype og sexistiske kategoriseringer af mandlige og kvindelige politikere til livs, påpeger Isabelle Augenstein.
”Løsningen er dobbeltsidig. Vi skal forsøge at holde en god tone, når vi skriver på nettet. Samtidig bør vi overveje at basere sprogmodeller på data, der i mindre grad indeholder sexistiske og racistiske vendinger. Herhjemme kunne man eksempelvis basere modellerne på tekstdata fra kilder med høj kvalitet, eksempelvis Danmarks Radio, hvor de sproglige standarder generelt er højere end på sociale medier, og andre lande kunne gøre noget tilsvarende,” slutter hun.
Derfor er sprogmodeller vigtige
- Vi interagerer med sprogmodeller dagligt, når vi er på nettet, og søgemaskiner giver os forslag til søgeord eller oversætter en tekst for os.
- Derudover kan NLP-sprogmodeller lave resuméer af store tekstmængder, hvilket eksempelvis er brugbart for kommuner og regioner, der skal have overblik over store mængder data om borgere. Sprogmodeller bruges også til at sortere jobansøgninger for virksomheder.
- Derfor er det, ifølge Isabelle Augenstein, vigtigt, at vi sørger for at basere sprogmodellerne på data, der indeholder et minimalt omfang af sexistisk eller racistisk sprogbrug.
Kontakt
Isabelle Augenstein
Lektor på Datalogisk Institut
Københavns Universitet
+45 93 56 59 19, augenstein@di.ku.dk
Ida Eriksen
Journalist
Det Natur- og Biovidenskabelige Fakultet
Københavns Universitet
+45 93516002, ier@science.ku.dk