Skip to main content

Nota lyd- og tekstdata

Datasættet indeholder både tekst- og taledata fra udvalgte dele af Nota's lydbogsbibliotek. Datasættet består af over 500 timers oplæsninger og medfølgende transskriptioner på dansk. Al lyddata er i .wav-format, mens tekstdata er i .txt-format.

I data indgår indlæsninger af Notas eget blad "Inspiration" og "Radio/TV", som er udgivet i perioden 2007 til 2022.
Nota krediteres for arbejdet med at strukturere data, således at tekst og lyd stemmer overens.

Nota er en institution under Kulturministeriet, der gør trykte tekster tilgængelige i digitale formater til personer med synshandicap og læsevanskeligheder, fx via produktion af lydbøger og oplæsning af aviser, magasiner, mv.

ReadMe

Alvenir har lagt datasættet på Hugging Face, så du også kan tilgå data via Hugging Face. Du finder adgang til datasættet på Hugging Face under distributionerne.

Data og ressourcer

Nøgleord

Yderligere info

URI https://data.gov.dk/dataset/lang/5cb5dde0-7062-4e6f-879e-9a02cbd6a977
Destinationsside https://sprogteknologi-new.digst.govcloud.dk/dataset/nota-lyd-og-tekstdata
Høstes af Datavejviser Nej
Udgivelsesdato 07-10-2022
Seneste ændringsdato
Opdateringsfrekvens aldrig
Dækningsperiode  / 
Emne(r)
  • 16.05.07 Sprog og retskrivning
  • Uddannelse, kultur og sport
Adgangsrettigheder offentlig
Overholder
Proveniensudsagn
Dokumentation