Korpus

Ved ILN er det utviklet en rekke korpus som er tilgjengelig for andre forskere.

Lege-pasient-korpuset er et unikt korpus med transkripsjoner av samtaler mellom leger og pasienter i forskjellige typer konsultasjoner på Akershus universitetssykehus (Ahus).

BigBrother-korpuset er et talespråkskorpus som består av ortografiske transkripsjoner knyttet til lyd og videoopptak fraTVNorges Big Brother-sendinger fra 2001.

ELENOR (Español Lengua Extranjera en Noruega) er et korpus som inneholder eksamensoppgaver skrevet på spansk av studenter i Norge.

LIA-trebanken inneheld talemålssegment frå LIA norsk - korpus av eldre dialektopptak. Segmenta er annoterte med morfologisk og syntaktisk informasjon.

Mandarin Audio Idiolect Dictionary (MAID) er en ca. 2000 timer lang lydordbok på Manchu, en Peking-kinesisk dialekt.

NDC-trebanken inneholder talemålssegmenter fra den norske delen av Nordisk dialektkorpus. Segmentene er annotert med morfologisk og syntaktisk informasjon.

NORINT-korpuset inneholder muntlig materiale fra 51 og skriftlig materiale fra 116 voksne internasjonale studenter som gikk på norskkurs på høyere nivå ved Universitetet i Oslo sommeren 2014 og 2015.

RuN-korpuset er et parallellkorpus med tekster på 10 språk, blant annet norsk, russisk og engelsk.

TAUS er et talespråkskorpus fra Oslo.

Materialet til TAUS ble samlet inn ved Universitetet i Oslo tidlig på 1970-tallet, og siktemålet for prosjektet var å granske sosiale forskjeller i Oslo-målet.