Privatperson - Udgivere - sprogteknologi.dk

Named Entity Recognition dataset til Danske juridiske tekster

Named entity recognition dataset til Danske juridiske tekster er et datasæt bestående af 2415 sætninger fra dokumenter i domsdatabasen. Disse dokumenter er annoteret med 8...

HTML

Heidrun-Mistral-7B-Chat

Heidrun-Mistral-7B-chat er en chat-baseret model, som bygger på Heidrun-Mistral-7B-base og er blevet finjusteret på OpenHermes og SkoleGPT instruktion/chat datasættene. Modellen...

HTML

Heidrun-Mistral-7B

Heidrun-Mistral-7B-base er en generativ sprogmodel, som bygger på Mistral-7B og er blevet yderligere prætrænet på det danske Wikipedia, Wikibooks og små dele af hestenettet. Den...

HTML

DaLUKE

DaLUKE er udviklet i forbindelse med et bachelorprojekt i Kunstig Intelligens og Data ved Danmarks Tekniske Universitet. DaLUKE er en dansk version af LUKE, som er en...

HTML

Ælectra

Ælæctra er en transformer-baseret NLP sprogmodel, der er udarbejdet ved at benytte prætræningsmetoden ELECTRA-Small på The Danish Gigaword Projects datasæt (Der henvises til...

Binary Data

5 datasæt fundet

Named Entity Recognition dataset til Danske juridiske tekster

Heidrun-Mistral-7B-Chat

Heidrun-Mistral-7B

DaLUKE

Ælectra