Skip to main content

Context-Aware-Splits

Datasæt genereret vh.a. DanskGPT og brugt til at træne modellen Context-Aware-Splitter.

Context-aware-splitter er en model til retrieval augmented generation. Modellen er udviklet til at opdele tekster på den mest optimale måde givet en kontekst.

Opdeling af tekster er vigtigt ift. retrieval augmented generation, da de skal bruges til at finde de relevante stykker tekst frem.

Data og ressourcer

Nøgleord

Yderligere info

URI https://data.gov.dk/dataset/lang/a57691fe-9645-40b7-9dae-fbb01cc5ea88
Destinationsside https://huggingface.co/datasets/mhenrichsen/context-aware-splits
Høstes af Datavejviser
Udgivelsesdato 17-09-2023
Seneste ændringsdato
Opdateringsfrekvens ubekendt
Dækningsperiode  / 
Emne(r)
  • 16.05.07 Sprog og retskrivning
  • Uddannelse, kultur og sport
Adgangsrettigheder offentlig
Overholder
Proveniensudsagn
Dokumentation