Språk

Akademisk ordliste – bokmål

Akademisk ordliste er ei liste på 750 ord med ord som er nyttige å kunne dersom man skal ha fullt utbytte av undervisning og lærebøker over videregående nivå og kanskje selv skal skrive oppgaver og andre akademiske tekster.

BigBrother-korpuset

BigBrother-korpuset er et talespråkskorpus som består av ortografiske transkripsjoner knyttet til lyd og videoopptak fraTVNorges Big Brother-sendinger fra 2001.

Bokselskap-korpuset

Bokselskap-korpuset inneholder tekster fra nettstedet bokselskap.no. Korpuset inneholder mer enn 16 millioner ord, og vil bli oppdatert med nye tekster hvert år.

Bosnisk-korpuset

Bosnisk-korpuset består av 1,5 millioner ord skrevet av forfattere fra Bosnia-Hercegovina.

ELENOR

ELENOR (Español Lengua Extranjera en Noruega) er et korpus som inneholder eksamensoppgaver skrevet på spansk av studenter i Norge.

KAL-korpuset

Elevtekster fra avgangsprøven i norsk hovedmål.

LIA norsk - korpus av eldre dialektopptak

LIA norsk inneholder opptak og transkripsjoner av eldre dialektopptak fra fire norske universitet. Korpuset har hele 1374 informanter fra 226 kommuner i Norge, i alt cirka 3,5 millionar ord.

MAID

Mandarin Audio Idiolect Dictionary (MAID) er en cirka  2000 timer lang lydordbok på Manchu, en Peking-kinesisk dialekt.

Nordisk dialektkorpus

Nordisk dialektkorpus er et talespråkskorpus med norske, svenske, danske, islandske og færøyske dialekter.

Normkorpuset

5000 elevtekster skrevet av elever på 3. og 4., 6. og 7. trinn i grunnskolen.

NoTa-Oslo

Norsk talespråkskorpus - Oslodelen

NoWaC

Norsk webkorpus med 700 millioner ord.

Oslo Multilingual Corpus

Oslo Multilingual Corpus (OMC) er en samling av flerspråklige tekstkorpus som består av originaltekster og oversettelser.

Oslo-Bergen-taggeren

Oslo-Bergen-taggeren er en robust morfologisk og syntaktisk tagger som er utviklet ved Universitetet i Oslo og Uni Computing i Bergen.

Ruija-korpuset

Ruija-korpuset er et korpus med talemål fra kvensk- og finskspråklige områder.

RuN-korpuset

RuN-korpuset er et parallellkorpus med tekster på 10 språk, blant annet norsk, russisk og engelsk.

SKRIV-korpuset

Tekster skrevet av elever i videregående opplæring på yrkesfaglige utdanningsprogrammer.

Språk gjennom livet

Informasjon om både typisk og atypisk språkutvikling. Du kan også lese om språkvansker hos barn og voksne.

TALKO

Talespråkskorpus med finlandssvensk.

TAUS

TAUS er et talespråkskorpus fra Oslo. Materialet til TAUS ble samlet inn ved Universitetet i Oslo tidlig på 1970-tallet, og siktemålet for prosjektet var å granske sosiale forskjeller i Oslo-målet.

The French Newspaper Corpus

Nyhetstekster fra the Linguistic Data Consortium.

Publisert 24. juni 2021 13:09 - Sist endret 11. jan. 2022 14:09