To nye korpus: samisk og estlandssvensk

Tekstlaboratoriet har utviklet to nye talespråkskorpus, ett for samisk og ett for estlandssvensk. Begge er tilgjengelige i søkegrensesnittet nye Glossa.

Samisk
Det samiske talespråkskorpuset, LIA sápmi, består av nesten 60 000 ord fra eldre samiske opptak med nordsamiske dialekter.  Korpuset er ordklassetagga av Giellatekno. Les mer om LIA-prosjektet og det samiske korpuset.

 

Estlandssvensk
Det estlandssvenske korpuset, Den estlandssvenska korpusen,  er laget i samarbeid med Institutionen för svenska språket ved Göteborgs universitet. Korpuset består av 34 000 ord og er innleste dialoger og historier fra boka  En bok om Estlands svenskar 3 B.

Estlandssvenska ble snakket i Estland på øyer og ellers langs kysten fra middelalderen og fram til andre verdenskrig (http://www.estlandssvenskarna.se/).

Les mer om korpuset.

 

Publisert 24. sep. 2018 11:49 - Sist endret 24. sep. 2018 11:50