Har skapt orden i ordene

Mer enn 1600 ord. Alle systematisert. En ny database utviklet ved Humanistisk fakultet kan bli et unikt verktøy for logopeder, lingvister, psykologer og pedagoger.

Postdoktor Marianne Lind, masterstudent Elisabeth Holm, stipendiat Pernille Hansen og professor Hanne Gram Simonsen ved Institutt for lingvistiske og nordiske studier. (Foto: John Hughes)

I mer enn to år har Forskergruppen i klinisk lingvistikk og språktilegnelse ved Institutt for lingvistiske og nordiske studier (ILN) jobbet med å utvikle et nytt – og helt unikt – verktøy for fagfolk som jobber med språkvansker og språkutvikling.

Resultatet er blitt Ordforrådet, en database med 917 substantiv, 509 verb og 225 adjektiv. Alle ordene er systematisert etter ordenes egenskaper, slik som blant annet antall stavelser, hvor vanlige ordene er og hvilke andre ord de ligner på.

- Målet er først og fremst at databasen skal være et nyttig verktøy i praktisk arbeid med språkvansker, men den kan også brukes til forskning og testutvikling, sier professor Hanne Gram Simonsen ved ILN.

Hun har i samarbeid med postdoktor Marianne Lind ledet arbeidet med å utvikle Ordforrådet. Med seg har de hatt stipendiat Pernille Hansen og masterstudent Elisabeth Holm.

Størst i verden?

Ideen til prosjektet dukket opp våren 2010 da Marianne Lind startet opp et prosjekt om billedlighet ved ILN.

Enkelt sagt innebærer billedlighet hvor lett et ord fremkaller et tydelig sanseinntrykk. For eksempel er "paraply" og "tannbørste" høybilledlige ord - de viser til konkrete gjenstander som det er lett å se for seg. I motsatt ende av skalaen finner man ord som ”metarefleksjon” og ”tema”.

- Tanken var å systematisere hvilke ord som blir oppfattet som billedlige og hvilke som ikke blir det, og så studere hvorvidt dette har noe å si for hvor enkle ordene er å lære og bruke, sier Simonsen.

Men så vokste prosjektet. Langt flere egenskaper ved de utvalgte ordene ble inkludert i databasen.

Til slutt var databasen blitt så stor at Simonsen ikke vet om det finnes noen database av tilsvarende type og størrelse i verden.

Et nyttig verktøy

I tillegg til å være systematisert etter egenskaper, er ordene i Ordforrådet ordnet etter det som på fagspråket kalles ”subjektiv tilegnelsesalder”, altså når man selv mener man lærte et ord.

I arbeidet med utviklingen av databasen har forskergruppen fått 300 informanter til å gå gjennom et utvalg ord og oppgi når de mener at de lærte de ulike ordene. ”Mamma” og ”pappa” er ikke uventet de ordene så godt som alle mener de lærte først.

- Den subjektive plasseringen av når man lærte ulike ord stemmer godt overens med det vi fra tidligere forskning vet om når barn lærer ulike ord, sier Simonsen.

Egenskapene som dekkes i Ordforrådet, er egenskaper som spiller inn på hvor tidlig de læres og hvor lett de kan hentes frem fra hukommelsen når man snakker.

Derfor kan databasen bli et nyttig verktøy for alle som jobber med barns språkutvikling og med voksne og barn med språkvansker. Det være seg logopeder, pedagoger, psykologer eller spesialpedagoger.

Brukervennlig

– Et mål med databasen har vært å gjøre den så brukervennlig og så intuitiv som mulig, slik at den lettere kan brukes i fagfolks daglige arbeid, sier Marianne Lind.

Tekstlaboratoriet ved ILN har bidratt med å lage et godt søkegrensesnitt.

Ordforrådet er lagt opp slik at du kan søke på bestemte ord og få opp egenskaper ved ordet. Du kan også søke på ulike kombinasjoner av egenskaper og raskt få opp hvilke ord som oppfyller kriteriene. I tillegg er det mulig å laste ned alle ordene til en excel-fil.

Ordene som er valgt ut til å være med i databasen er i hovedsak hentet fra kartleggingstester som benyttes i arbeid med personer med språkvansker.

- Det gjør databasen særlig relevant for logopeder og andre fagpersoner, ettersom de allerede bruker mange av ordene i sitt arbeid, sier Simonsen.

I tillegg er enkelte ord hentet fra beskrivelser personer med afasi har gitt når de er blitt bedt om å fortelle en historie til et bilde. Dermed er også enkelte nokså sjeldne ord – slik som ”potetnese” og ”hobbybonde” – med i databasen.

Ordenes egenskaper

Et grundig og omfattende arbeid ligger bak innsamlingen av data til Ordforrådet. Stipendiat Pernille Hansen og masterstudent Elisabeth Holm har stått for mye av jobben.

For eksempel har de kartlagt hvor hyppig et ord opptrer i språket – på fagspråket kalt  et ords bruksfrekvens. Dette har de gjort ved å ta utgangspunkt i hvor mange ganger et ord opptrer i webkorpuset NoWaC, som finnes tilgjengelig ved Tekstlaboratoriet ved ILN.

Ordene i NoWaC er samlet inn ved at alle dokumenter på .no-domenet, altså norske internettekster, automatisk ble gjennomgått, lastet ned og bearbeidet til NoWaC over en to måneders periode i 2009-2010. Med utgangpunkt i NoWaC har forskerne bak Ordforrådet klassifisert et ords bruksfrekvens som høy, middels eller lav.

Andre egenskaper, slik som ordenes lengde, lydstruktur og kompleksitet, er systematisert og lagt inn i databasen for alle ordene.

Når det gjelder billedlighet har rundt 400 informanter plassert et utvalg ord på en skala fra 1 til 7 over hvor enkelt ordene fremkaller et sanseinntrykk.

Interessant nok fant forskerne ut at ord lettere fremkaller sanseinntrykk jo eldre man blir. Også når det gjelder subjektiv tilegnelsesalder er det forskjeller mellom yngre og eldre informanter.

- For eksempel slår pizza og PC ut som ord man lærer sent. Dette skyldes at disse ordene er nye ord, som de eldre informantene nødvendigvis lærte sent. Dagens barn lærer disse ordene tidlig, sier Hansen.

Et enkelt ord?

Hva gjør at et ord er enkelt? Hva gjør det lett å lære? Lett å produsere? Teorien tilsier at ord som har høy billedlighet, ikke har konsonantgrupper, er korte, vanlige i bruk og ligner på mange andre ord som regel er de enkleste ordene.

Simonsen understreker at Ordforrådet ikke gir svar på hva som i praksis er vanskelige eller lette ord for personer med språkvansker.

- Databasen har systematisert ordene etter egenskaper som i teorien gjør dem enkle eller vanskelige å huske. Dette må selvsagt sjekkes opp mot virkeligheten. Ordforrådet kan gjøre denne jobben enklere, sier Simonsen.

Databasen ble lansert 7. februar 2013.

Søk i Ordforrådet

Av Kamilla Simonnes, journalist
Publisert 7. feb. 2013 13:19 - Sist endret 1. juli 2016 11:16