Skip to main content

XLS-R-300m-danish

XLS-R-300m-danish er en general dansk talemodel der bygger på wav2vec2.0 arkitekturen og er en fortsat prætræning af XLS-R checkpointet. Modellen er trænet på 141.000 timers dansk tale fra DR P1 og Radio24syv, og kan finetunes til alle formål der indebærer analyse af dansk tale.

Efter finetuning performer modellen omtrent 20% bedre end XLS-R og 50% bedre end wav2vec2-base-da på dansk talegenkendelse. Klik her for at læse mere om den fintuned model.

Modellen er trænet af Lasse Hansen fra Center for Humanities Computing Aarhus i samarbejde med Alvenir på UCloud platformen.

Data og ressourcer

Nøgleord

Yderligere info

URI https://data.gov.dk/dataset/lang/523b01af-e39b-4cd1-ab73-33165724b338
Destinationsside https://huggingface.co/chcaa/xls-r-300m-danish
Høstes af Datavejviser
Udgivelsesdato 15-08-2022
Seneste ændringsdato
Opdateringsfrekvens ubekendt
Dækningsperiode  / 
Emne(r)
  • 16.05.07 Sprog og retskrivning
  • Uddannelse, kultur og sport
Adgangsrettigheder offentlig
Overholder
Proveniensudsagn
Dokumentation