Norsk dependenstrebank (NDT) blei utvikla av Språkbanken ved Nasjonalbiblioteket i samarbeid med Tekstlaboratoriet i perioden 2011-2014. Nynorskdelen og bokmålsdelen har omlag 300 000 token kvar (ordformer og skiljeteikn).
Den morfologiske analysen følgjer Norsk referansegrammatikk, medan dependensgrammatikk er nytta for den syntaktiske analysen. Det er laga eigne retningslinjer for annoteringa av korpuset. Sjølv om annoteringa i si tid blei gjort maskinelt, er begge trebankane kvalitetssjekka og manuelt korrigerte av to lingvistar.
NDT kan lastast ned i CoNLL format, og har vore mykje nytta til språkteknologiske oppgåver.
Når NDT nå er søkbar i Glossa, vil trebankane vere enklare å nytte for språkstudentar og språkforskarar.
Arbeidet med NDT i Glossa er finansiert med Teksthub-midlar.
- Les meir om NDT og last ned trebankane
- Kari Kinn, Per Erik Solberg og Pål Kristian Eriksen, 2013. Retningslinjer for morfologisk og syntaktisk annotasjon i Norsk dependenstrebank