Skip to main content

XLS-R-300m-danish-nst-cv9

'Finetuned version af XLS-R-300m-danish til talegenkendelse på dansk.

Modellen er finetuned på træningssættet af NST ASR og Common Voice 9, og har en word error rate på 5-10% på på tværs af Alvenir, NST og Common Voice 9 test sættene. Modellen performer omtrent 20% bedre end XLS-R og 50% bedre end wav2vec-base-da finetuned på samme datasæt.

Modellen er trænet af Lasse Hansen ved (Center for Humanities Computing ved Aarhus Universitet) i samarbejde med Alvenir.

Data og ressourcer

Nøgleord

Yderligere info

URI https://data.gov.dk/dataset/lang/8b0f2a68-2016-4624-8027-1bd5a88a4104
Destinationsside https://huggingface.co/chcaa/xls-r-300m-danish-nst-cv9
Høstes af Datavejviser
Udgivelsesdato 15-08-2022
Seneste ændringsdato
Opdateringsfrekvens ubekendt
Dækningsperiode  / 
Emne(r)
  • 16.05.07 Sprog og retskrivning
  • Uddannelse, kultur og sport
Adgangsrettigheder offentlig
Overholder
Proveniensudsagn
Dokumentation