Skip to main content

NERDA

NERDA' er et værktøj (udgivet som Python-pakke) til at fine-tune NLP transformer-modeller til at identificere personer, organisationer, lokationer m.m. i tekster (=Named-Entity Recognition(NER)). 'NERDA' gør det muligt at fine-tune en hvilken som helst transformer til et hvilket som helst NER-datasæt på et hvilket som helst sprog, herunder specielt dansk. 'NERDA' indeholder desuden to præ-trænede modeller til Named-Entity Recognition på dansk, hhv. ELECTRA og BERT fine-tunet på DaNE-datasættet.

Den bagvedliggende kode til 'NERDA' er frit tilgængelig på https://github.com/ebanalyse/NERDA, hvor også performance for de prætrænede modeller er dokumenteret. De præ-trænede danske modeller bygger på DaNE-datasættet, der er beskrevet her: https://github.com/alexandrainst/danlp/blob/master/docs/docs/datasets.md#dane.

Data og ressourcer

Nøgleord

Yderligere info

URI https://data.gov.dk/dataset/lang/c41d0900-b519-4bf0-8354-262480a6cea1
Destinationsside https://github.com/ebanalyse/NERDA
Høstes af Datavejviser Nej
Udgivelsesdato 26-01-2021
Seneste ændringsdato 08-12-2022
Opdateringsfrekvens kontinuerlig
Dækningsperiode  / 
Emne(r)
  • 16.05.07 Sprog og retskrivning
  • Uddannelse, kultur og sport
Adgangsrettigheder offentlig
Overholder
Proveniensudsagn
Dokumentation