Søk i Norsk dependenstrebank (NDT)

Dei to trebankane NDT nynorsk og NDT bokmål er nå søkbare i søkegrensesnittet Glossa. Du kan søke på både morfologiske og syntaktiske kategoriar, og få syntaktiske tre som resultat.

Syntaktisk tre i NDT

Norsk dependenstrebank (NDT) blei utvikla av Språkbanken ved Nasjonalbiblioteket i samarbeid med Tekstlaboratoriet i perioden 2011-2014. Nynorskdelen og bokmålsdelen har omlag 300 000 token kvar (ordformer og skiljeteikn).

Den morfologiske analysen følgjer Norsk referansegrammatikk, medan dependensgrammatikk er nytta for den syntaktiske analysen. Det er laga eigne retningslinjer for annoteringa av korpuset. Sjølv om annoteringa i si tid blei gjort maskinelt, er begge trebankane kvalitetssjekka og manuelt korrigerte av to lingvistar.

NDT kan lastast ned i CoNLL format, og har vore mykje nytta til språkteknologiske oppgåver.

Når NDT nå er søkbar i Glossa, vil trebankane vere enklare å nytte for språkstudentar og språkforskarar.

Arbeidet med NDT i Glossa er finansiert med Teksthub-midlar.
 

 

 

 

Publisert 26. apr. 2024 14:19 - Sist endret 26. apr. 2024 14:19