English version of this page

LIA gjer gamle data tilgjengelege (avslutta)

Hovudmålet for prosjektet var å redde gamle talemålsopptak med norsk og samisk språk, transkribere og annotere dei og leggje dei inn i databasar slik at dei kunne revitaliserast som verdifullt forskingsmateriale.

Kassett med lydsignaler over og over der en sky.

Foto: Tekstlaboratoriet, illustrasjon.

Om prosjektet

I løpet av dei siste 60 åra er det samla inn mange talemålsopptak for ulike formål rundt omkring i Noreg. Nokre av dei er digitaliserte og katalogiserte på systematisk vis, andre ligg i arkivskåp og skuffar. Mange av dei står i fare for å bli øydelagde.

Mål

LIA-prosjektet samla inn flest mogleg opptak frå universiteta i Oslo, Bergen, Tromsø og Trondheim.

Opptaka ble digitalisert ved Nasjonalbiblioteket i Mo i Rana og kopiar ble langtidslagra der. Deretter høyrde prosjekttilsette på LIA igjennom opptaka, katalogiserte dei og utstyrte dei med mest mogleg metadata.

Dei mest interessante opptaka med god kvalitet ble transkribert. Opptaka ble transkribert på to måtar: ein talemålsnær variant og ein med nynorsk ortografi. Transkripsjonane ble kopla til kvarandre og til dei originale lydfilene Dei transkriberte opptaka ble til slutt lagt inn i Nye Glossa, eit brukarvennleg korpussøkegrensesnitt.

Opptak og transkripsjonar er også fritt tilgjengelege for andre via ei nedlastingsside.

Opptaka i LIA er av to typar:

Diakrone data: dialektopptak frå heile Noreg, inkludert opptak med samisk språk
Norsk i Amerika: Opptak frå feltarbeid i Amerika frå 1931 og fram til i dag

Eit mål i prosjektet var også å annotere dei transkriberte opptaka automatisk. Dette krevde nyutvikling av ein parser for talemål. Glossa må dessutan videreutviklast for å kunne søkje i hierarkiske strukturar.

Store delar av arbeidet ble gjort ved Tekstlaboratoriet, men dei tre andre universiteta tilsatte også eigne transkribører.

Finansiering

LIA-prosjektet var finansiert gjennom forskningsinfrastrukturprogrammet til Norges forskningsråd.

Varigheit

2014 - 2019.

Samarbeid

LIA (Language Infrastructure made Accessible) var eit nasjonalt samarbeidsprosjekt mellom:

Universitetet i Oslo
Universitetet i Bergen
Universitetet i Tromsø
Noregs teknisk-naturvitskaplege universitet
Norsk Ordbok 2014
Språkbanken ved Nasjonalbiblioteket.

Gå til prosjektets heimeside

Publisert 5. okt. 2020 13:40 - Sist endra 29. jan. 2021 02:41

Kontakt

tekstlab-post@iln.uio.no

Janne Bondi Johannessen
Prosjektleiar

Deltakarar

Kristin Hagen Universitetet i Oslo
Joel James Priestley Universitetet i Oslo
Lilja Øvrelid Universitetet i Oslo
Anders Nøklestad Universitetet i Oslo
Åse Wetås Universitetet i Oslo
Hans A Eide Universitetet i Oslo
Svein Arne Solbakk
Gjert Kristoffersen
Helge Sandøy
Lisbeth Johannessen
Øystein Alexander Vangsnes
Tor A. Åfarli
Lene Antonsen
Trond Trosterud
Anke Lüdeling
Joe Salmons
Mike Putnam
Joakim Nivre
Eckhard Bick
Lars Borin

Detaljert oversikt over deltakarar