Sprogforskere udvikler bedre maskinoversættelse til små sprog

Skrevet af John Meyer

12/12/2012

Dagens topnyheder

- De bedste maskinoversættelsesprogrammer i dag er baseret på statistisk behandling. Populært sagt: Jo flere teksteksempler vi kan putte ind i dem, jo bedre bliver oversættelserne, der kommer ud i den anden ende. Det betyder, at store sprog har en kæmpe fordel, fordi der f.eks. på engelsk findes så utrolig mange oversatte tekster inden for næsten alle fagområder, som man kan fodre oversættelsesprogrammerne med, forklarer  udviklingsingeniør Lene Offersgaard fra Center for Sprogteknologi på Københavns Universitet. Centret står for den danske del af et EU-forskningsprojekt ved navn Let’s MT!


Maskinoversættelsen foregår ”ude i skyen”
På dansk og svensk er der ikke lige så mange offentligt tilgængelige tekster med tilhørende oversættelser, og Google har f.eks. ikke kunnet give sit Translate-program nok dansk fagtekst at arbejde med. Derfor kan danske virksomheder ikke bruge de mest udbredte oversættelsesprogrammer til at få oversat især deres fagspecifikke tekster.


- Let's MT! handler netop om at udvikle en online platform til maskinoversættelse, som især tilgodeser de små sprogs brugere ved allerede at have store mængder oversatte tekster integreret. På platformen kan offentlige og private virksomheder og helt almindelige brugere uploade egne tekstsamlinger, som derefter bliver integreret med de bestående tekster. På den måde får vi et skræddersyet system, der kan levere gode oversættelser inden for brugerens eget fagområde – det kunne f.eks. være en dansk finansiel virksomhed, som har brug for at få oversat tekster med sine egne termer, eller en offentlig forvaltning der har behov for sine administrative tekster på engelsk.