English version of this page

Glossa

Tekstlaboratoriet fortsetter å videreutvikle søkegrensesnittet Glossa.

Glossa tilbyr et moderne, enkelt og funksjonelt søkegrensesnitt med avansert resultathåndtering for både skriftspråkskorpus, flerspråklige korpus og talespråkskorpus.

Glossa er enkel å installere slik at institusjoner og forskere kan lage egne korpus og søke i dem på egen server eller til og med på egen laptop.

Glossa skal også kunne brukes til å søke i flere forskjellige typer korpus. Den skal blant annet kunne søke i korpus som ligger på andre servere enn der Glossa selv er installert ved å benytte seg av infrastrukturen i CLARIN.

Glossa har et moderne grensesnitt der utseende og metadatameny lett kan tilpasses egne ønsker.  Søkegrensesnittet finnes i flere utgaver: En enkel (Google-aktig) utgave, en mer avansert utgave med klikkbare muligheter for blant annet lemmasøk og ordklassesøk, og til slutt en mulighet for å søke med regulære uttrykk.

Glossa tilbyr innlogging via Feide og CLARIN, og har et godkjenningssystem for ulike korpuslisenser. 

Arbeidet med Glossa har vært finansiert av CLARINO og LIA-prosjektet, og hele systemet har åpen kildekode som kan lastes ned til fri benyttelse. Systemet er fortsatt under utvikling, nå med finansiering av infrastrukturprosjektet CLARINO+. I dette prosjektet vil hovedfokuset være å utvikle flere løsninger for resultatvisninger.

Les mer og se hvilke korpus som er tilgjengelig i Glossa her

De fleste korpus i Glossa har egne brukerveiledninger. Les for eksempel brukerveiledningen for skriftspråkskorpuset Leksikalsk bokmålskorpus eller talespråkskorpuset LIA.

 

Last ned Glossa fra GitHub

 

Nye Glossa ble valgt ut som "showcase" under Annual CLARIN meeting 2013 i Praha. Se presentasjonen på CLARIN-siden.


Referanser:

Nøklestad, Anders, Hagen, Kristin, Johannessen, Janne Bondi, Kosek, Michal and Joel Priestley. 2017. A modernised version of the Glossa corpus search system. In Jörg Tiedemann (ed.): Proceedings of the 21st Nordic Conference on Computational Linguistics (NoDaLiDa). 2017, 251-254. Les artikkelen.

 

Kosek, Michal , Anders Nøklestad, Joel Priestley, Kristin Hagen, and Janne Bondi Johannessen. 2015. In Gintarė Grigonytė, Simon Clematide, Andrius Utka and Martin Volk (eds.): Visualisation in speech corpora: maps and waves in the Glossa system, Proceedings of the Workshop on Innovative Corpus Query and Visualization Tools at NODALIDA 2015, May 11-13, 2015, Vilnius, Lithuania, NEALT Proceedings Series 25, 23–31. Les artikkelen.

 

Les om den gamle versjonen av Glossa

 

Bildet kan inneholde: tre, anlegg, font, frukt, kunst.

Publisert 25. apr. 2017 15:40 - Sist endret 12. sep. 2022 14:05