Sprogteknologi og EU
Introduktion
Dansk sprogteknologi er ikke kun et nationalt anliggende, og der findes mange fordele i at udvikle sprogteknologi på tværs af landegrænser, hvor synergier og såkaldte ’transfer effects’ er med til at hæve sprogmodellers ydeevne på tværs af sprog. I Europa er der et stort fokus på at fremme sprogteknologi på europæiske sprog, så fremtidens AI-teknologier også kan være konkurrencedygtige på fx dansk, græsk og lettisk. Digitaliseringsstyrelsen repræsenterer i den forbindelse Danmark i nogle centrale europæiske projekter på området, som du kan læse mere om her på siden.
Alliancen for sprogteknologi (ALT-EDIC)
Alliancen for sprogteknologi, også kaldet ALT-EDIC, er et af de første ’konsortier for europæisk digital infrastruktur’ (EDIC’er), og blev etableret i forbindelse med EU-Kommissionens lancering af AI-innovationspakken i ja-nuar 2024. ALT-EDIC er en sammenslutning af lande, som bestræber sig på at fremme europæisk sprogteknologi gennem fem indsatsområder. ALT-EDIC vil:
- Sikre adgang til højkvalitetsdata på europæiske sprog og i forskellige modaliteter.
- Indsamle, finjustere og optimere eksisterende sprogmodeller, så de bliver lettere at tage i brug.
- Understøtte udvikling af nye sprogmodeller, fx ved at pulje ressourcer som ekspertise og computerkraft
- Udvikle metoder og standarder for evaluering, certificering og normalisering af sprogteknologi med et særligt fokus på at mitigere diskrimination og bias.
- Fostre det europæiske sprogteknologiske økosystem gennem inku-bation af start-ups, rådgivning til offentlige myndigheder, afholdelse af workshops og oplysningskampagner, mv.
Siden d. 27. maj 2024 har Danmark været medlem af ALT-EDIC og er repræsenteret af Digitaliseringsstyrelsen, hvor sekretariatet for Sprogteknologi.dk sidder med i ALT-EDIC’s Assembly of Members. Hvis du har spørgsmål til ALT-EDIC, er du derfor meget velkommen til at kontakte os på info@sprogteknologi.dk.
Hvad er en EDIC?
EDIC står for ’konsortium for europæisk digital infrastruktur’ (European Digital Infrastructure Consortium). EDIC’er er et nyt instrument, som er ble-vet introduceret i forbindelse med det europæiske program for det digitale årti (Digital Decade Program), der søger at fremme europæisk digital suve-rænitet frem mod 2030. Formålet med EDIC’er er at give medlemslande et redskab til at danne juridiske enheder på tværs af landegrænser, som kan løfte flerlandeprojekter (Multi Country Projects) inden for områder med sær-lig relevans for Europas digitale suverænitet, fx sprogteknologi. EDIC’er handler derfor i høj grad om at udvikle og implementere infrastrukturløs-ninger. Læs mere om EDIC’er på EU-Kommissionens hjemmeside.
Vil du deltage i den danske referencegruppe for ALT-EDIC?
Sprogteknologi.dk koordinerer Danmarks nationale ressourcecenter, som understøtter ALT-EDIC’s indsatsområder for det danske sprog, og sekretariatet varetager i den forbindelse en dansk referencegruppe for ALT-EDIC. Formålet med referencegruppen er at sikre videndeling omkring indsatser, beslutninger og strategiske overvejelser i ALT-EDIC, så danske aktører på området har mulighed for at komme med inputs, som Digitaliseringsstyrelsen kan tage med til diskussionerne i ALT-EDIC’s Assembly of Members. Du kan læse mere om, hvad det indebærer at være med i referencegruppen her. Hvis du eller nogen fra din organisation gerne vil deltage i referencegruppen, beder vi dig sende os en mail på info@sprogteknologi.dk.
Language Data Space (LDS)
Som led i den europæiske datastrategi har EU besluttet at skabe et europæisk marked for data gennem en række fælleseuropæiske ’data spaces’ inden for strategisk relevante domæner. Det fælleseuropæiske Language Data Space (LDS) udgør ét af disse og har til formål at muliggøre let udveksling af sprogdata mellem offentlige-, private- og forskningsaktører. En helt central agenda med LDS er dermed at skabe en infrastruktur, hvor et metadatakatalog i samspil med et økosystem af ’LDS connectors’ muliggør transparent og gnidningsfri dataudveksling på tværs af Europa, så flere sprogdata kan komme i spil i udviklingen af sprogteknologi.
Hvad er en LDS Connector?
En LDS connector er et stykke software, som forbinder deltagere i LDS, og som faciliterer en række automatiserede processer i forbindelse med dataudveksling. Fx vil LDS connectoren give adgang til metadatakataloget og udveksle information om et givet datasæt og dets tilhørende brugsvilkår. Connectoren vil også facilitere kontraktindgåelse og selve dataoverførslen mellem dataejer og dataanvender, og herunder facilitere finansielle transaktioner, såfremt datasættet stilles til rådighed mod betaling.
Arbejdet med at etablere LDS påbegyndte i januar 2023, og projektet løber frem til og med 2026 med mulighed for forlængelse til og med 2027. Herefter er det planen, at den videre drift af og styring med LDS overgår til ALT-EDIC.
Digitaliseringsstyrelsen og Digitaliserings- og Ligestillingsministeriet repræsenterer Danmark i LDS, hvor sekretariatet for Sprogteknologi.dk sidder med i LDS’ Center of Excellence for Language Technologies (CELT). CELT består af myndighedsrepræsentanter fra alle EU-landene og har til formål at aktivere de nationale økosystemer og videndele om mulighederne ved LDS. Hvis du har spørgsmål til LDS er du velkommen til at kontakte os på info@sprogkteknologi.dk.
Vil du deltage i LDS User Group?
For at sikre værdien af LDS for dataindehavere og dataanvendere i Europa har man oprettet en ’User Group’, som består af europæiske offentlige-, private- og forskningsaktører. Gruppen er for de, som aktivt benytter sig af LDS, og som har lyst til at bidrage med inputs til det videre arbejde med at forme LDS og infrastrukturen bag. Hvis du eller nogen fra din organisation gerne vil deltage i LDS User Group, er du velkommen til at tilmelde dig her.
Digital Europe Programmet
Både LDS og ALT-EDIC bliver hhv. helt og delvist finansieret af EU’s Digital Europe Program (ej at forveksle med Digital Decade Programmet), der har til formål at understøtte den digitale omstilling i Europa, fx når det kommer til kunstig intelligens, cybersikkerhed og supercomputere. Programmet løber fra 2021 til og med 2027 og er med et samlet budget på 55,9 mia. kr. en vigtig kilde til medfinansiering af digitale projekter, også for danske aktører. Foruden LDS og ALT-EDIC er der på nuværende tidspunkt også udlovet medfinansiering til udviklingen af en open-source europæisk grundmodel, som europæiske aktører skal kunne bygge videre på og fine-tune.
I regi af Digital Europe Programmet udstilles desuden en række multilinguale sprogteknologiske værktøjer til fx oversættelse og tekstresuméring. Disse værktøjer kan tilgås her.
Digitaliseringsstyrelsen er et dansk nationalt ankerpunkt for Digital Europe Programmet, og her kan du læse mere om hvem du kan kontakte i forbindelse med spørgsmål til programmets projekter.