Skip to main content

ScandiNER

ScandiNER er en NER (named entity recognition) model, som er bygget på den norske model fra det norske nationalbiblioteks AI labbet. Modellen er fin tunet på et kombineret dansk, norsk (bokmål og nynorsk), svensk, islandsk og færøsk NER datasæt.

SacndiNER opnår state-of-the-art performance i alle 5 sprog, fylder 3x mindre end tidligere danske state-of-the-art modeller (DaCy-large) og er 5x hurtigere.

Licens: udgivet under en MIT-licens.

Data og ressourcer

Nøgleord

Yderligere info

URI https://data.gov.dk/dataset/lang/d157317c-ffa8-4e5e-8c72-d2aaaf1c0f3e
Destinationsside https://huggingface.co/saattrupdan/nbailab-base-ner-scandi
Høstes af Datavejviser
Udgivelsesdato 28-09-2021
Seneste ændringsdato
Opdateringsfrekvens ubekendt
Dækningsperiode  / 
Emne(r)
  • 16.05.07 Sprog og retskrivning
  • Uddannelse, kultur og sport
Adgangsrettigheder offentlig
Overholder
Proveniensudsagn
Dokumentation