Oslo-Bergen-taggeren

Oslo-Bergen-taggeren er en robust morfologisk tagger for bokmål og nynorsk som er utviklet ved Universitetet i Oslo og Uni Computing i Bergen.

obt står det med bokstaver. Logo.

Taggeren består av tre hovedmoduler:

  • en preprosessor med sammensetningsanalysator og multitagger
  • en grammatikk-modul for morfologisk disambiguering (Constraint Grammar)
  • en statistisk modul som fjerner siste rest av gjenstående morfologisk flertydighet (foreløpig bare for bokmål)

Grammatikk-modulen bruker en kompilator utviklet ved Syddansk universitet i Odense.

Multitaggeren benytter fullformsleksikonet Norsk ordbank.

Oslo-Bergen-taggeren videreutvikles og moderniseres nå gjennom infrastrukturprosjektet Clarino+.

 

Analyser bokmålstekst med OBT på nett

Last ned Oslo-Bergen-taggeren


 

 

Tekstlab. står det med svarte bokstaver på hvit bakgrunn. Logo.

Publisert 28. apr. 2010 12:31 - Sist endret 8. sep. 2022 15:54