Skip to main content

Alvenir Wav2vec2

En word2vec2 model, som er trænet på omtrent 1300 timers dansk taledata fra podcasts og lydbøger. Modellen er trænet på 16kHz taledata, hvilket også er formatet, der skal anvendes ved brug af modellen. Det er Alvenir, som har skabt modellen og stillet den til rådighed for offentligheden. Modellen skal fin-tunes før den kan anfvendes til talegenkendelse.

Udgivet under en Apache 2.0 licens.

Data og ressourcer

Nøgleord

Yderligere info

URI https://data.gov.dk/dataset/lang/4791e0c1-218e-4023-93df-065ae458ebd2
Destinationsside https://huggingface.co/Alvenir/wav2vec2-base-da
Høstes af Datavejviser
Udgivelsesdato 28-11-2021
Seneste ændringsdato
Opdateringsfrekvens
Dækningsperiode  / 
Emne(r)
  • 16.05.07 Sprog og retskrivning
  • Uddannelse, kultur og sport
Adgangsrettigheder offentlig
Overholder
Proveniensudsagn
Dokumentation