The Danish Parliament Corpus 2009 - 2017, v2, w. subject area annotation indeholder udskrifter af taler holdt i Folketinget, session 2009 til 2017 (6/10 2009 - 7/9 2017) og er downloadet fra Folketingets ftp server: ftp://oda.ft.dk. Korpusset har metadata om Folketingets medlemmer (navn, køn, alder, rolle, titel, partipolitisk tilhørsforhold), tidspunkt for talerne og subject area annotion for hver dagsorden. Informationen omkring alder og køn er blevet hentet fra eksterne kilder, og subject area annotation blev semi-automatisk tilføjet til hver tale ud fra de annoterede titler på dagsordenerne. Korpusset er organiseret i txt-filer, hvor der der er en fil pr. møde og en zip-fil per session. Korpusset The Danish Parliament Corpus 2009 - 2017 følger licensen for Open Data med angivelse af følgende: "Folketinget tillader en global, fri, ikke-eksklusiv og uindskrænket ret til brug af data fra Folketingets åbne datakatalog. Dataene kan frit benyttes til: 1) kopiering, distribuering og udgivelse, 2) tilpasning og i kombination med andet materiale, 3) til kommercielt og ikke-kommercielt brug." Derudover kan, med overholdelse af ophavsretsloven, talerne blive distribueret uden samtykke fra taleren så længe taleren af teksten/talen er tydeligt angivet. Folketinget er anerkendt som kilden.