Sprogforskere udvikler bedre maskinoversættelse til små sprog – Københavns Universitet

Københavns Universitets nyhedsportal
Videresend til en ven Resize Print Bookmark and Share

Nyheder > Alle nyheder > 2012 > 2012.12 > Sprogforskere udvikler...

12. december 2012

Sprogforskere udvikler bedre maskinoversættelse til små sprog

sprogteknologi

Et netop afsluttet EU-forskningsprojekt med deltagelse af forskere fra Københavns Universitet er godt nyt for mindre sprog som dansk og svensk, der ikke er optimalt understøttet af de mest udbredte programmer til maskinoversættelse: Forskerne har udviklet en platform, der gør det muligt at skræddersy maskinoversættelse af høj kvalitet til mindre sprog og specifikke fagområder.

- De bedste maskinoversættelsesprogrammer i dag er baseret på statistisk behandling. Populært sagt: Jo flere teksteksempler vi kan putte ind i dem, jo bedre bliver oversættelserne, der kommer ud i den anden ende. Det betyder, at store sprog har en kæmpe fordel, fordi der fx på engelsk findes så utrolig mange oversatte tekster inden for næsten alle fagområder, som man kan fodre oversættelsesprogrammerne med, forklarer udviklingsingeniør Lene Offersgaard fra Center for Sprogteknologi på Københavns Universitet, som står for den danske del af et EU-forskningsprojekt om maskinoversættelse ved navn Let's MT!

Maskinoversættelsen foregår ude i skyen

I Danmark og Sverige er der ikke lige så mange offentligt tilgængelige tekster med tilhørende oversættelser, og Google har fx ikke kunnet give sit Translate-program nok dansk fagtekst at arbejde med. Derfor kan danske virksomheder ikke bruge de mest udbredte oversættelsesprogrammer til at få oversat især deres fagspecifikke tekster.

- Let's MT! handler netop om at udvikle en online platform til maskinoversættelse, som især tilgodeser de små sprogs brugere ved allerede at have store mængder oversatte tekster integreret. På platformen kan offentlige og private virksomheder og helt almindelige brugere uploade egne tekstsamlinger, som derefter bliver integreret med de bestående tekster. På den måde får vi et skræddersyet system, der kan levere gode oversættelser inden for brugerens eget fagområde – det kunne fx være en dansk finansiel virksomhed, som har brug for at få oversat tekster med sine egne termer, eller en offentlig forvaltning der har behov for sine administrative tekster på engelsk.

Teksterne i sikkerhed "i skyen"

Ifølge Lene Offersgaard og de andre udviklere er der ingen risiko forbundet ved at levere tekster til platformen. Virksomhederne og organisationerne kan selv vælge, hvem der skal have adgang til deres data:

- Vi har lavet en aftale med Amazon om at bruge deres servere. Vi kan derfor ikke tilbyde platformen gratis, for Amazon skal selvfølgelig have penge for at opbevare dataene. Til gengæld er det meste af softwaren på platformen open source, og platformen kan integreres i fx webbrowsere og lokale oversættelsesprogrammer, understreger Lene Offersgaard.

Center for Sprogteknologi, som altså har udført den danske del af EU-projektet, vil gerne hjælpe flere danske brugere i gang med at benytte platformen.

Læs mere på projekthjemmesiden eller kontakt Lene Offersgaard fra Center for Sprogteknologi.

Kontakt

Udviklingsingeniør Lene Offersgaard
Center for Sprogteknologi, Københavns Universitet
Mobil: 28 18 30 07

Kommunikationsmedarbejder Carsten Munk Hansen
Det Humanistiske Fakultet
Mobil: 28 75 80 23