Hva er en norsk språkbank?
En norsk språkbank skal være en digital samling språklige råvarer og verktøy som er nødvendige for å lage språkteknologiske tjenester og produkt med norsk tale og tekst. Fra banken vil man kunne få tekst, tale, leksikalske data, terminologi og verktøy for (språkteknologisk) bruk.
Å samle inn, merke, tilrettelegge og gjøre tilgjengelig språkressurser for språkteknologisk bruk er kostbart. Kostnadene er omtrent de samme for alle språk, selv om vi for norsk får litt ekstra kostnader fordi vi har to offisielle skriftspråk. De innsamlede ressursene må være tilgjengelige for alle som har behov for dem, enten det er forskere som trenger underlag for sin forskning eller det er et kommersielt firma som f.eks. skal lage en kunstig stemme eller et oversettingsprogram.
Språkrådet har derfor foreslått at myndighetene tar ansvar for å etablere en språkbank for det norske samfunnet og trekker inn alle relevante miljø i dette arbeidet. Språkbanken må være selvstendig og styres av et faglig sammensatt styre som kan sørge for den nødvendige prioriteringen når man starter innsamling og tilrettelegging av det som skal inngå i banken.
Etableringen av Norsk språkbank er det største og mest kostbare tiltaket som blir foreslått i «Handlingsplanen for norsk språk og IKT» og St.meld.nr. 35 (2007–2008) «Mål og meining».
Hvorfor trenger vi en norsk språkbank?
Om etablering av Norsk språkbank står det i St.meld. nr. 35 «Mål og meining» følgende:
«Ein norsk språkbank er eit viktig språkpolitisk tiltak for å styrkja norsk språk i ei global språkutvikling der små språksamfunn er utsette for aukande press. Språk er dessutan den fremste beraren av kulturell identitet, og satsing på ein norsk språkbank er difor eit vesentleg og vidfemnande kulturtiltak i vår tid.» (s.135)
Regjeringa ser Språkbanken som en sentral del av en språkpolitisk og kulturell satsing på norsk språk. At nye teknologiske løsninger blir tilgjengelige på norsk, er avgjørende for at norsk som samfunnsbærende språk skal bestå og utvikle seg videre i en verden der kommunikasjonsmåter og teknologiske løsninger byttes ut i et høgt tempo. Norge har små, men høgt kompetente fagmiljø innenfor språkteknologi, og når Språkbanken er etablert, får disse miljøene den infrastrukturen de trenger til videre og mer avansert forskning og produktutvikling.
I Stortingsmeldinga foreslås det at Språkbanken etableres fra 1. januar 2009. Stortingsmeldinga ble vedtatt i Stortinget 28. april 2009.
Materiale som skal inn i Norsk språkbank
I årene 2001–2005 satset Forskningsrådet stort på språkteknologi gjennom programmet KUNSTI – kunnskapsutvikling for norsk språkteknologi. Programmet forutsatte at flere av prosjektene skulle ha tilgang til bearbeidet språkmateriale fra en språkbank, men banken ble ikke etablert den gangen. Programmet ble likevel gjennomført. Det betyr at flere av prosjektene selv samlet inn og bearbeidet språkmateriale de trengte. Det er rimelig å anta at store deler av materialet fra disse prosjektene er aktuelle for Språkbanken. Her kan du lese mer om KUNSTI.
Nordisk Språkteknologi Holding AS (NST) på Voss var et norsk firma som utviklet språkteknologiske produkt og tjenester for hele Norden. Firmaet, som gikk konkurs i 2003, hadde lagt ned et stort arbeid i bearbeiding av språkmaterialet de samlet inn. Basene med lydopptak (tale) og tilhørende leksikalske data var av særlig stor interesse for en framtidig norsk språkbank. Høsten 2006 kjøpte Språkrådet, sammen med Universitetet i Bergen, Universitetet i Oslo, Norges teknisk-naturvitenskapelige universitet og IBM Norge AS, det materialet NST hadde samlet og bearbeidet. De fem eierne dannet et interimsstyre og inngikk en intensjonsavtale om at språkmaterialet skal distribueres gjennom Norsk språkbank når den blir opprettet.
Materialet fra NST besto av datamaskiner, dokument, flere databaser og filer i ulike format og på ulike lagringsmedier. Materialet måtte gjennomgås, sorteres og lagres på medier og i format som egner seg for gjenbruk. Forskningsrådet bevilget i juni 2007 penger til dette arbeidet, og gjennomgangen var fullført ved årsskiftet 2007/2008.
Interimsstyret gjorde språkressursene tilgjengelig fra høsten 2008, og Språkrådet forvalter lisensieringen.
Mer informasjon om materialet og innholdet som er tilgjengelig, finner du på nettsidene til Språkbanken.
Lenker til viktige dokument om Norsk språkbank
- Plan for etablering av Norsk språkbank [pdf, 1 MB], Språkrådet (august 2008)
Rapport fra Språkrådet til KKD. I 2008 fikk Språkrådet i oppdrag å konkretisere hva man måtte gjøre første året i etableringsfasen for en språkbank: organisering, økonomi, personale, lokalisering samt en strategi for en oppbyggingsfase på fem-seks år.
- St.meld.nr. 35 (2007–2008) «Mål og meining. Ein heilskapleg norsk språkpolitikk»
- Norsk språkbank – brev fra Språkrådet til Kultur- og kirkedepartementet (august 2006). Oppdatert oversikt over norsk språkteknologi og behovet for en norsk språkbank.
- Norsk språkbank, Samling og tilgjengeleggjering av norske språkressursar [pdf, 520 kB], Norsk språkråd (2002)
Engelsk utgave: Consolidating and increasing the availability
of Norwegian human language technology resources [pdf, 215 kB], Norsk språkråd (2002)
- Norsk språk og IKT – handlingsplan [pdf], Norsk språkråd (2001)
- Norsk språkbank – utredning om et nasjonalt korpus for språkteknologi [rtf], (1999)
Sist oppdatert: 9. september 2009