English version of this page

LIA gjer gamle data tilgjengelege

LIA (Language Infrastructure made Accessible) er eit femårig nasjonalt samarbeidsprosjekt mellom fire universitet (UiO, UiB, UiT og NTNU), Norsk Ordbok 2014 og Språkbanken ved Nasjonalbiblioteket.

Hovudmålet for prosjektet er å redde gamle talemålsopptak med norsk og samisk språk, transkribere og annotere dei og leggje dei inn i databasar slik at dei kan revitaliserast som verdifullt forskingsmateriale.

Illustrasjon: Tekstlaboratoriet

Om prosjektet

I løpet av dei siste 60 åra er det samla inn mange talemålsopptak for ulike formål rundt omkring i Noreg. Nokre av dei er digitaliserte og katalogiserte på systematisk vis, andre ligg i arkivskåp og skuffar. Mange av dei står i fare for å bli øydelagde. LIA-prosjektet skal samle inn flest mogleg opptak frå dei fire universiteta: Universitetet i Oslo, Universitetet i Bergen, Universitetet i Tromsø og Noregs teknisk-naturvitskaplege universitet. Opptaka skal digitaliserast ved Nasjonalbiblioteket i Mo i Rana og kopiar skal langtidslagrast der. Deretter vil prosjekttilsette på LIA høyre igjennom opptaka, katalogisere dei og utstyre dei med mest mogleg metadata. Dei mest  interessante opptaka med god kvalitet vil bli transkriberte.

Opptaka skal transkriberast på to måtar: ein talemålsnær variant og ein med nynorsk ortografi. Transkripsjonane vil vere kopla til kvarandre og til dei originale lydfilene, Dei transkriberte opptaka vil til slutt bli lagt inn i Nye Glossa, eit brukarvennleg korpussøkegrensesnitt.
Opptak og transkripsjonar vil også vere fritt tilgjengelege for andre via ei nedlastingsside.

Opptaka i LIA vil vere av to typar:

  • Diakrone data: dialektopptak frå heile Noreg, inkludert opptak med samisk språk
  • Norsk i Amerika: Opptak frå feltarbeid i Amerika frå 1931 og fram til i dag

Eit mål i prosjektet er også å annotere dei transkriberte opptaka automatisk. Dette krev nyutvikling av ein parser for talemål. Glossa må dessutan videreutviklast for å kunne søkje i hierarkiske strukturar.

Prosjektet er leia av professor Janne Bondi Johannessen ved ILN og Tekstlaboratoriet. Store delar av arbeidet vil bli gjort ved Tekstlaboratoriet, men dei tre andre universiteta vil også tilsette eigne transkribører.

Finansiering

LIA-prosjektet er finansiert gjennom forskingsinfrastrukturprogrammet til Forskingsrådet.


LIA i pressen

Der norsken svinner (forskning.no 2. mai 2014)

Midler til ny språkteknologi (HF-aktuelt 31. oktober 2013)

Deler ut halv milliard til vitenskapelig utstyr (Uniforum 30. oktober 2013)

Varigheit 

2013–2018

 

Publisert 26. mai 2014 13:46 - Sist endret 13. okt. 2016 15:44