English version of this page

NORINT-korpuset

NORINT-korpuset inneholder muntlig og skriftlig norsk innlærerspråk av voksne internasjonale studenter med norskferdigheter på eller over nivå B1 i henhold til det felles europeiske rammeverket (Common European Framework of Reference for Languages (CEFR)).

NORINT-korpuset består av tre delkorpus:

  • NORINT tale består av intervjuer av og samtaler med 48 informanter, i alt nesten 104 000 token (ord og skilletegn). Det er gjort video- og lydopptak der studentene intervjues av en underviser som stiller spørsmål om deres bakgrunn, studier, arbeid og fremtidsplaner. Temaene er begrenset for å sikre like rammer for intervjuene. I tillegg er det gjort video- og lydopptak der informantene samtaler to og to om emner som kultur, fritid, reiser eller livet i Norge. Hva det snakkes om, velger studentene fritt fra en liste over mulige samtaleemner de fikk utdelt rett før opptakene. Intervjuene og samtalene er nesten like lange, og opptak av hver student utgjør totalt 30–40 minutter.

    Opptakene er transkribert med transkripsjonsprogrammet ELAN. NORINT tale er dessuten annotert med grammatisk informasjon som ordklasse og ulike morfologiske trekk samt med informasjon som beskriver den muntlige interaksjonen, f.eks. «sukk», «kremter», «hvisking». Den grammatiske informasjonen er automatisk lagt til ved hjelp av NoTa-taggeren, en automatisk talemålstagger.

Les transkripsjonsveiledningen for NORINT tale
 

Søk i NORINT tale
 

  • NORINT opplest har 57 informanter, 48 av dem er de samme som har bidratt til NORINT tale. Informantene leser opp 60 utvalgte setninger og en kort historie. De løsrevne setningene og teksten er de samme som ved Språkmøterprosjektet ved Norsk teknisk-naturvitenskapelige universitet. Det finnes bare lydopptak av opplesningene, og setningene i NORINT opplest er ikke grammatisk tagget.

Se/last ned setningene og teksten som blir lest opp
 

Søk i NORINT opplest
 

  • NORINT tekst er et skriftspråkskorpus og består av 116 eksamensbesvarelser som delvis er skrevet av de samme studentene som er informanter i de muntlige delene av korpuset. Av hensyn til personvern er det imidlertid ikke synlige koplinger i korpuset, men det er mulig å kontakte Tekstlaboratoriet (tekstlab-post@iln.uio.no) for å få denne informasjonen.

    Tekstene foreligger i tre ulike versjoner: a) en pdf av den håndskrevne originalversjonen av den skriftlige eksamensbesvarelsen i sin helhet (lytteprøvesvar, leseforståelsesoppgaver, grammatikkoppgaver og en stiloppgave (en argumenterende/fortellende innlærertekst)), b) en innskrevet nøyaktig kopi av den argumenterende/fortellende innlærertekstens originalversjon og c) en versjon av samme tekst der alle ortografiske feil er rettet, sammen med utvalgte morfologiske og syntaktiske feil. Innskrevet kopi av den argumenterende/fortellende innlærertekstens originalversjon og den korrigerte versjonen er lenket sammen. Tekstene er automatisk annotert med en grammatisk tagger for skriftspråk, Oslo-Bergen-taggeren.

Søk i NORINT tekst
 


Innlogging. Logg deg inn med Feide eller CLARIN, der du bruker ditt vanlige universitets-brukernavn og passord. Om du ikke får tilgang via Feide eller CLARIN, kontakt Tekstlaboratoriet (tekstlab-post@iln.uio.no).

Brukerveiledning. Du kan lese om hvordan du bruker korpuset i brukerveiledningen for NORINT-korpuset.

Søkesystemet Glossa. Tekster og transkripsjoner i NORINT-korpuset er lagt inn i det enkle og funksjonelle søkesystemet Glossa. Slik ser søkegrensesnittet til korpuset ut:
 

 

Publisert 14. feb. 2017 15:11 - Sist endret 29. jan. 2024 15:55