Skip to main content

ScandiQA

ScandiQA er et datasæt bestående af spørgsmål og svar på dansk, norsk og svensk. Alle samples kommer fra Natural Questions (NQ) datasættet, som er et stort datasæt med spørgsmål og svar fra Googlesøgninger. Det skandinaviske datasæt med spørgsmål og svar kommer fra MKQA-datasættet, hvor 10.000 NQ-samples er blevet manuelt oversat til blandt andet dansk, norsk og svensk.

Data og ressourcer

Nøgleord

Yderligere info

URI https://data.gov.dk/dataset/lang/23018089-c7b8-48d0-95bc-f138be887731
Destinationsside https://huggingface.co/datasets/alexandrainst/scandiqa
Høstes af Datavejviser
Udgivelsesdato 01-09-2022
Seneste ændringsdato
Opdateringsfrekvens aldrig
Dækningsperiode  / 
Emne(r)
  • 16.05.07 Sprog og retskrivning
  • Uddannelse, kultur og sport
Adgangsrettigheder offentlig
Overholder
Proveniensudsagn
Dokumentation