XLS-R-300m-danish er en general dansk talemodel der bygger på wav2vec2.0 arkitekturen og er en fortsat prætræning af XLS-R checkpointet. Modellen er trænet på 141.000 timers dansk tale fra DR P1 og Radio24syv, og kan finetunes til alle formål der indebærer analyse af dansk tale.
Efter finetuning performer modellen omtrent 20% bedre end XLS-R og 50% bedre end wav2vec2-base-da på dansk talegenkendelse. Klik her for at læse mere om den fintuned model.
Modellen er trænet af Lasse Hansen fra Center for Humanities Computing Aarhus i samarbejde med Alvenir på UCloud platformen.