International Comparable Corpus - Norwegian component (ICC-NO)

The Norwegian component of the International Comparable Corpus (ICC-NO) is currently under development at the University of Oslo.

Den norske delen av the International Comparable Corpus (ICC-NO) er under utvikling ved Universitetet i Oslo.

The International Comparable Corpus (ICC) is a new international collaborative project in the field of contrastive corpus-based linguistics. The ultimate goal of the project is the facilitation of contrastive studies between English and other languages involving highly comparable datasets of spoken, written and electronic registers.

The ICC corpus will largely rely on re-using existing language resources and will be modelled to be comparable with the ICE family corpora. Thus, for the field of contrastive linguistics, a striking and unique feature of each new corpus in ICC will be its substantial spoken component, at present comprising ca. 600,000 words (or 60% of the current total).

The development of the Norwegian component of ICC will be coordinated by Signe Oksefjell Ebeling and Jarle Ebeling, University of Oslo.


The International Comparable Corpus (ICC) er et nytt internasjonalt samarbeidsprosjekt innenfor korpusbasert kontrastiv analyse. Hovedmålet med prosjektet er å legge til rette for kontrastive studier mellom engelsk og andre språk på grunnlag av sammenlignbare muntlige og skriftlige datasett.

ICC-korpuset tar sikte på å, i så stor grad som mulig, gjenbruke allerede eksisterende språkressurser/korpustekster, og vil bygges opp etter modell av ICE (International Corpus of English), som inneholder tekster fra en mengde teksttyper fordelt over 60% muntlig og 40% skriftlig språkdata. Den relativt store muntlige delen i hvert ICC-delkorpus vil tilføre en ny og unik dimensjon til feltet kontrastiv lingvistikk.

Oppbyggingen av det norske ICC-delkorpuset blir koordinert av Signe Oksefjell Ebeling og Jarle Ebeling, Universitetet i Oslo.

 

Published Nov. 6, 2017 3:20 PM - Last modified Aug. 7, 2018 11:29 AM