Skip to main content

Evalueringsdatasæt for 1000 danske talemåder og faste udtryk

Det Danske Sprog- og Litteraturselskab har udviklet et datasæt til evaluering af sprogmodeller på dansk. Datasættet indeholder samlet 1000 danske talemåder og faste udtryk med overførte betydninger baseret på Den Danske Ordbogs samling af faste udtryk med tilhørende definitioner. Til hver af de 1000 talemåder og faste udtryk er der endvidere udarbejdet tre falske definitioner.

Datasættet kan bruges til at teste sprogmodellers præstationer i forbindelse med at udpege korrekte definitioner for danske talemåder og faste udtryk.

Datasættet udgives med en CC-BY licens, hvilket betyder at Det Danske Sprog- og Litteraturselskab skal krediteres ved brug.

Data og ressourcer

Nøgleord

Yderligere info

URI https://data.gov.dk/dataset/lang/36a5da6d-7787-4f0d-802b-c608dfddd1d5
Destinationsside https://sprogteknologi.dk/dataset/1000-talemader-evalueringsdatasaet
Høstes af Datavejviser Ja
Udgivelsesdato 20-11-2024
Seneste ændringsdato 20-11-2024
Opdateringsfrekvens aldrig
Dækningsperiode  / 
Emne(r)
  • 16.05.07 Sprog og retskrivning
  • Uddannelse, kultur og sport
Adgangsrettigheder offentlig
Overholder
Proveniensudsagn
Dokumentation