Oslo-Bergen-taggeren

Oslo-Bergen-taggeren er en robust morfologisk og syntaktisk tagger som er utviklet ved Universitetet i Oslo og Uni Computing i Bergen.

Taggeren består av tre hovedmoduler:

  • en preprosessor med sammensetningsanalysator og multitagger
  • en grammatikk-modul for morfologisk og syntaktisk disambiguering (constraint grammar)
  • en statistisk modul som fjerner siste rest av gjenstående morfologisk flertydighet (bare for bokmål)

Grammatikk-modulen bruker en kompilator utviklet ved Syddansk universitet i Odense.

Multitaggeren benytter fullformsleksikonet Norsk ordbank.

Les mer om taggeren

 

Last ned Oslo-Bergen-taggeren


 

 

Publisert 28. apr. 2010 12:31 - Sist endret 12. apr. 2012 10:53