Tilbage

I dag er Det Centrale Ordregisters indeks tilgængeligt for test

22. maj 2022

Dekorativt indhold

Udviklingen af Centralt Ordregister for dansk (COR) er et samarbejdsprojekt mellem Det Danske Sprog- og Litteraturselskab, Dansk Sprognævn, Center for Sprogteknologi på KU og Digitaliseringsstyrelsen om at udvikle en dansk sprogressource til AI-formål.

I dag er den formelle specifikation for COR-rammeværket, altså indekseringen i registeret, lanceret og gjort tilgængeligt for test. COR er et (maskinlæsbart) register der dækker hele det centrale danske ordforråd. COR indeholder de ca. 65.000 lemmaer som har en officiel staveform. Hver ordform har et unikt ID-nummer, som vil blive fastholdt i fremtiden. Hvis den officielle stavenorm ændres, bliver ændringerne gjort centralt tilgængelige således, at sprogteknologiske produkter automatisk kan holdes ajour (fx stavetjekkere, automatisk tekstgenerering, talegenkendelse og talesyntese). COR-indekseringen vil også gøre det lettere at lave søgninger på tværs af store sprogressourcer (fx tekstsamlinger, fagordbøger, talekorpora, termbaser).

Du kan nu hente og udforske COR-indekset for at se, om det kan gavne jeres sprogteknologiske projekt.

I forbindelse med lanceringen havde Dansk Sprognævn inviteret interesserede parter til Bogense, hvor der blev holdt oplæg om COR projektet, use-cases for COR, samt mulighed for at få "hænderne på" COR og undersøge indekset.

Løbende brugertester udviklere af sprogteknologi COR-indekseringen og i september 2022 vil der blive publiceret tilhørende dokumentation som fx manualer, use-cases, tekniske specifikationer og lignende.

Flere nyheder

Det gik du glip af til workshop om evaluering og benchmarking af sprogmodeller på dansk
25. november 2024

Evaluering og benchmarking af sprogmodeller er en forudsætning for dels at finde de bedst egnede løsninger til en given opgave, og dels for at målrette det videre...
More

Tilmeldingen til Sprogteknologisk Konference 2024 er åben!
17. september 2024

Kom og vær med, når Sprogteknologisk Konference bliver en afholdt d. 28. november på Københavns Universitet Amager (KUA). Det er i år fjerde gang i...
More

Bredt samarbejde skal hjælpe danske virksomheder og forskere med fri adgang til nogle af verdens største computere
12. september 2024

Digitaliseringsstyrelsen, Uddannelses- og Forskningsstyrelsen og universitetssamarbejdet DeiC opfordrer danske virksomheder, forskere og myndigheder til at bruge den massive compu-...
More

Mød sprogteknologi.dk på festivallen Vilde Teknologier
14. august 2024

Den 30. og 31. august 2024 kan du møde sprogteknologi.dk til festivallen Vilde Teknologier på Dokk1 i Aarhus! Sammen med Alexandra Instituttet parkerer vi et mobilt...
More

Invitation til workshop om evaluering og benchmarking af sprogmodeller på dansk
25. juni 2024

Digitaliseringsstyrelsen inviterer til workshop om evaluering og benchmarking af sprogmodeller på dansk fredag d. 20. september 2024 fra 10:00-15:00, med mulighed for networking...
More