Skip to main content

DanSpeech

Open-source Python-pakke til dansk talegenkendelse (tale-til-tekst).

DanSpeech har arbejdet på at udvikle generelle talegenkendelsesmodeller siden 2018. Projektet har levet som en række studenterprojekter hos Danmarks Tekniske Universitet (DTU) og kulminerede i et fælles kandidatspeciale vejledt af Lars Kai Hansen i forårssemesteret 2019. Projektet lykkedes med at anvende dyb læring på et relativt begrænset offentligt datasæt (ca. 360 timers transskriberet tale). Resultatet har gjort det muligt at arbejde med nyere og mere fleksible måder at modellere talegenkendelse på, og i sommeren 2019 blev første etape af DanSpeech-projektet sat i vandet hos DTU med det formål at offentliggøre og videreudvikle en række af de modeller, som var udviklet i løbet af specialeperioden samt frigive kodebasen, så andre kan træne modeller på deres egne data. Det er de modeller, som nu er tilgængelige under ressourcen.

Data og ressourcer

Nøgleord

Yderligere info

URI https://data.gov.dk/dataset/lang/cfbba84f-2dde-402d-8cd9-c8d7d13aec4d
Destinationsside https://github.com/danspeech/danspeech
Høstes af Datavejviser
Udgivelsesdato 01-01-2019
Seneste ændringsdato
Opdateringsfrekvens
Dækningsperiode  / 
Emne(r) Uddannelse, kultur og sport
Adgangsrettigheder offentlig
Overholder
Proveniensudsagn
Dokumentation