Gå til indholdet

Bolette kæmper for det danske sprog i algoritmernes tidsalder

Bolette Sandford Pedersen har arbejdet med sprogmodeller siden 1989. Dengang hed det maskinoversættelsessystemer, og kunstig intelligens var ikke en del af ligningen. I dag er feltet eksploderet, og professoren fra Københavns Universitet er netop blevet indlemmet i Danmarks Top 100 kvinder inden for AI. Mød datalingvisten fra DFM, der nægter at lade lukkede, udenlandske modeller definere vores danske sprogsamfund.


Bolette Sandford Pedersen

Der er noget, der har ændret sig, når Bolette Sandford Pedersen er til familiefester. Det er ikke den dårlige onkelhumor eller de hjemmelavede lejlighedssange. Det, der har ændret sig, er, at hun ikke længere skal bruge halve timer på at forklare, hvad hun laver. I dag er hendes forskningsfelt, sprogmodeller, blevet allemandseje.

"Samfundets bevågenhed på mit felt er eksploderet fuldstændig. Jeg har nørdet med det her i snart 40 år, og den voldsomme interesse er fantastisk sjov, men også udfordrende," siger Bolette Sandford Pedersen, som til daglig leder Center for Sprogteknologi på Københavns Universitet.

Med lanceringen af ChatGPT fik offentligheden for alvor øjnene op for den teknologi, Bolette har dedikeret sit arbejdsliv til siden 1989, hvor hun udviklede maskinoversættelsessystemer. Det har ført til, at hun som en del af Danish Foundation Models (DFM) i dag har en central rolle i evalueringen af sprogmodeller, der er tilpasset det danske sprog. Hun er med til at sikre, at fremtidens kunstige intelligens overhovedet forstår, hvad det vil sige at skrive og forstå dansk.

I maj blev hun også kåret som en af de ti mest indflydelsesrige kvinder inden for AI i Danmark i kategorien 'Research and Science'.

"Jeg er meget beæret over denne udnævnelse, for det ligger mig meget på sinde, at vi skaber et diverst udviklingsmiljø, hvor forskellige køn, alder og kulturer indgår og sikrer forskellige perspektiver på AI. Det er netop vores forskelligheder, der kvalificerer samtalen om, hvad sprogmodellerne egentlig skal kunne," siger datalingvisten.

Rugbrødsarbejde og for små sko

I DFM har Bolette Sandford Pedersen blandt andet stået i spidsen for et unikt metafor-datasæt med tusindvis af typiske danske metaforer beregnet til at evaluere de store AI-modeller. For her falder sprogmodellerne ofte igennem.

"'Rugbrødsarbejde' er for eksempel en herlig del af vores billedsprog i Danmark, som kræver en del kulturel kontekst for at blive forstået, fordi begrebet refererer tilbage til en grundbestanddel i vores kost: nemlig rugbrødet. Og faste vendinger som 'at gå i for små sko' eller 'være som snydt ud af næsen på nogen' fejlfortolker modellerne også i stor stil. Samtidig er de glade for at opdigte sammensatte ord som 'våbenstilstand' og 'isvogn', som er ord, vi måske nok forstår, men som faktisk ikke findes på dansk," siger hun.

I sidste ende er kampen for gode sprogmodeller på dansk også en kamp for suverænitet. Hvis vi lader de engelsktrænede modeller sætte dagsordenen uden at tilpasse dem ordentligt til vores forhold, risikerer vi, at det danske sprog ikke blot bliver fattigere, men at dets helt fundamentale strukturer ændres, mener hun:

"Jeg er ikke så bekymret for låneordene, vi importerer fra engelsk. Jeg er mere bekymret for vores arvesølv: hvordan vi konstruerer sætninger, og hvordan vores ordforråd og billedsprog er sammensat på dansk. Hele vores betydningssystem skrider i retning af engelsk, når vi for eksempel begynder at bruge ordet 'hjælpsom' om andet end mennesker, bare fordi man på engelsk bruger 'helpful' mere bredt. Det går stærkt lige nu, og jeg mener, at vi skal holde et vågent øje med udviklingen."

Push-ups for sproghjernen

Selvom Bolette Sandford Pedersen har dedikeret sit liv til sprogteknologien, advarer hun mod at blive for magelig i selskab med den.

"Hvis vi ikke passer på, risikerer vores sprog at blive ekstremt homogeniseret af kunstig intelligens. Modellerne har en tendens til at skrive meget standardiseret og tungt med mange passivkonstruktioner og substantivkomplekser. Det vil være utroligt trist for os som sprogsamfund, hvis brugen af sprogmodeller fører til, at det danske sprog forvitrer, og vi mister alle de små, lækre virkemidler, vi har, til at udtrykke os som lige præcis som dem vi er," siger hun.

Hendes råd til de nysgerrige bordherrer og -damer til familiefesterne – og til danskerne generelt – er derfor lige så analogt, som det er kontant:

"Jeg frygter ærligt talt, at vi kollektivt bliver dummere, fordi vi er dovne af natur og derfor altid vil ty til den letteste løsning. Også når det gælder om at tjekke og efterprøve AI'ens svar. Vi burde læse mindst 20 sider god skønlitteratur om dagen. Fuldstændig ligesom vi laver push-ups for kroppen," afslutter hun.


Danish Foundation Models er en del af regeringens strategiske AI-indsats. Målet er at post-træne, evaluere, vedligeholde og give åben adgang til store danske sprogmodeller. Projektet er et samarbejde mellem Aarhus Universitet, Syddansk Universitet, Københavns Universitet og Alexandra Instituttet. Læs mere om DFM her.