Oslo-Bergen-taggeren
Oslo-Bergen-taggeren er en robust morfologisk og syntaktisk tagger som er utviklet ved Universitetet i Oslo og Uni Computing i Bergen.
Taggeren består av tre hovedmoduler:
- en preprosessor med sammensetningsanalysator og multitagger
- en grammatikk-modul for morfologisk og syntaktisk disambiguering (constraint grammar)
- en statistisk modul som fjerner siste rest av gjenstående morfologisk flertydighet (bare for bokmål)
Grammatikk-modulen bruker en kompilator utviklet ved Syddansk universitet i Odense.
Multitaggeren benytter fullformsleksikonet Norsk ordbank.
Les mer om taggeren
Publisert 17. mar. 2010 10:46
- Sist endret 12. apr. 2012 10:53