De leksikografiske bokmålssamlingene

Instituttet har bygd opp flere viktige digitale leksikografiske samlinger til bruk for forskning på bokmål/riksmål og på det tidligere norsk-danske skriftspråket.

Om bokmålssamlingene

Samlingene består av både ekserpter (dvs. enkeltbelegg) og hele tekster. Noen av dem er digitale, mens andre bare finnes på papir. På denne siden er informasjon om:

  • Samlingen av litterære tekster
  • Nyordsdatabasen
  • Leksikografisk bokmålskorpus (LBK)

Samlingen av litterære tekster

Ved Institutt for nordistikk og litteraturvitenskap, forløperen til ILN, ble det bygd opp en seddelsamling på 3-3,5 millioner sedler med ekserpter fra litterære tekster skrevet i perioden 1550-1900. Da bokmåls- og nynorsksamlingene skulle digitaliseres på 1990-tallet, fant man ut at det var mye mindre ressurskrevende å skanne selve tekstene enn å digitalisere sedlene. De skannede tekstene er tilgjengelige på nettet, og de fleste er tilrettelagt for søking.

Materialet omfatter verker av Asbjørnsen og Moe, Bjørnstjerne Bjørnson, Andreas Bull, Jonas Dahl, Lorentz Dietrichson, Conradine Dunker, Hans Jæger, Alexander Kielland, Harald Meltzer, Jørgen Moe, Sigbjørn Obstfelder, Mattis Størssøn, Henrik Wergeland og flere andre.

Det digitaliserte tekstmaterialet ligger her.

Nyordsdatabasen

I årene 1968-2000 ble det drevet aktiv innsamling av nyord på bokmål. Nyordsarkivene ble bygd opp ved ekserpering av aviser, tidsskrifter og noe skjønnlitteratur. Nyordsdatabasen er et digitalt arkiv som inneholder store deler av det innsamlede nyordsmaterialet. Nyordene er merket med relevante opplysninger som normert form, ordklasse og teksttype, og ordene er også klassifisert etter hvilken type nyord det dreier seg om.

Alle disse opplysningene kan brukes når man søker i databasen, som er tilgjengelig her.

Leksikografisk bokmålskorpus (LBK)

Leksikografisk Bokmålskorpus (LBK) er et representativt, vektet korpus laget for leksikografiske formål. Korpuset er tagget med Oslo-Bergen-taggeren og er fullt søkbart gjennom Tekstlaboratoriets korpusgrensesnitt Glossa. Korpuset inneholder også informasjon om tekstprodusentenes kjønn, alder og geografiske tilhørighet; samt sjanger, emne og andre vanlige kildeopplysninger. Denne informasjonen kan brukes for å begrense hvilke deler av korpuset man ønsker å søke mot.
 
Leksikografisk Bokmålskorpus er fritt tilgjengelig for forskning. Logg inn med Feide, eduGAIN, Clarin eller ta kontakt med tekstlab-post@iln.uio.no.

Søk i leksikografisk bokmålskorpus

Mer informasjon om korpuset

Publisert 11. juni 2010 17:52 - Sist endret 14. mai 2018 11:54