Skip to main content

DK-CLARIN Referencekorpus med dansk almensprog

DK-CLARIN Reference Corpus of General Danish has been collected as part of DK-CLARIN project, WP2.1, 2008 - 2011. All texts are in XML TEIP5 format (TEIP5DKCLARIN-format), with tokenisation, ePOS-tagging, sentence and paragraph segmentation, and lemmatisation. The corpus comprises 45,113,245 words.

Data og ressourcer

Nøgleord

Yderligere info

URI http://hdl.handle.net/20.500.12115/36
Destinationsside https://repository.clarin.dk/repository/xmlui/handle/20.500.12115/36#
Høstes af Datavejviser Ja
Udgivelsesdato 01-01-2011
Seneste ændringsdato
Opdateringsfrekvens
Dækningsperiode  / 
Emne(r)
  • 16.05.07 Sprog og retskrivning
  • Uddannelse, kultur og sport
Adgangsrettigheder offentlig
Overholder
Proveniensudsagn
Dokumentation