Skip to main content

Danish Gigaword

A billion-word corpus of Danish text. Split into many sections, and covering many dimensions of variation (spoken/written, formal/informal, modern/old, rigsdansk/dialect, and so on).

The license is CC-BY 4.0, Creative Commons with Attribution.

Data og ressourcer

Nøgleord

Yderligere info

URI https://data.gov.dk/dataset/lang/9cb913b5-3f49-4563-8307-8846f1429aa1
Destinationsside https://gigaword.dk/
Høstes af Datavejviser
Udgivelsesdato 03-06-2021
Seneste ændringsdato
Opdateringsfrekvens
Dækningsperiode  / 
Emne(r)
  • 16.05.07 Sprog og retskrivning
  • Uddannelse, kultur og sport
Adgangsrettigheder offentlig
Overholder
Proveniensudsagn
Dokumentation