[Forrige artikkel] [Indeks] [Neste artikkel] [CW hjemmeside]

Snakker snart norsk

TF lager norsk talegjenkjenning


Arne er ikke så flink å snakke, men han er bare seks måneder gammel. Til høsten skal han kjenne igjen og uttale 16 ord. Arne er første versjon av Telenors Forskningsinstitutt (TF) norske språkprogram.

Einar Ryvarden

Programvare fra IBM, Novell og Kurtzweil forstår og snakker bra engelsk, men er helt blanke på norsk. Fordi det norske markedet er så lite, har vi ikke fått de samme mulighetene som engelsk programvare gir. Norges-kontorene til de store programvare-leverandører synes det blir for dyrt, men nå har Telenors Forskningsinstitutt (TF) tatt på seg mye av jobben.

Gjennom sitt arbeide med forskjellige telefonsystemer, legger TF grunnarbeidet for norsktalende PC-programvare. Men dette ligger langt frem.

-- Vårt første oppgave er system som automatiserer de telefontjenester som man i dag styrer med stjerne og firkanttastene. Dette menysystemet er klønete og derfor et velegnet testprosjekt for talestyring og talesyntese, sier Jon Emil Natvik, leder for TFs TABU-prosjekt.

Med seg på TABU-prosjektet (Talebaserte brukergrensesnitt) har Natvik 7 TF-forskere, men han samarbeider også med universitetsmiljøene i Bergen, Trondheim og Oslo.

Prøvesystem

Første mål er i løpet av høsten å gjennomføre et prøvesystem som kan gjenkjenne og uttale 16 ord. Dette er det første målet, men ut fra hvor godt de lykkes, får prosjektet videre oppgaver.

Ønsket om å digitalisere det norske språket er ikke nytt. Allerede i 1985 ble det startet et nasjonalt, tverrfaglig prosjekt for "digitalisering" av det norske språk. Planen var å utarbeide en grunnmodul som kan tolke norsk tale. Med kunnskapen i denne grunnmotoren kan man lage systemer som kan snakke norsk og analysere norsk grammatikk.

De tekniske utfordringene er enorme, påpeker Natvik. Men TF har støttet seg på forskning både fra USA, Sverige og Danmark, som startet sin prosjekter tidligere. I disse landene har man klart å lage systemer som kan gjenkjenne hele ord av gangen. Neste skritt er evnen til å plukke ut nøkkelord av lengre setninger og forkaste det som ikke er interessant.

Et stykke inn i fremtiden ser man for seg systemer som kan gjenkjenne og tolke ordene i en setning og ut fra gramatikkregler redusere antall feiltolkninger. Parallelt med tolkningsarbeidet jobber TF med talesyntese -- prosessen av å omsette tekst til tale.

Foreløpig er ikke Arne så flink, men det kommer seg. Forskningen på feltet brøyter ny mark innen fonetikk, men det er mye steiner i jorden. Foreløpig minner Arne mest om meteorologen Vidar Teisen. Rytmen i språket er dårlig og han klarer ikke å legge vekt på et ord i setningen slik vi gjør når vi prater.

Trening

Skjelletstrukturen for hvordan man skal løse talegjennkjenning er delevis på plass. Ifølge Natvik er ikke det norske språket så spesielt som vi liker å tro. Men det videre arbeidet bruker teknikker fra forskning på kunstig intelligens. Trening og atter trening er den eneste måten å lære opp systemet.

-- For å trene opp våre systemer har vi samlet inn talen til 1.000 nordmenn som sier den samme teksten. Disse stemmene, som er lagret på fire CD-plater, danner grunnlaget for opptreningen av tolkeren, forteller Natvik

For det er ikke småtterier telefonsystemet skal takle. I utgangspunktet er den tekniske kvaliteten på telefonlinjene lav og støy forekommer. I tillegg må systemet gjenkjenne et meget bredt spenn av dialekter og stemmer fra både kvinner, menn, barn og gamle. Over en telefonlinje blir for eksempel s og f svært like, forteller Natvik.

Arne må bli voksen ganske fort. Ellers risikerer vi at alle nordmenn må snakke engelsk med sine datamaskiner.

NORSK: Jon Emil Natvik og forsker Ingunn Amdal er to av syv fedre til Arne, den første versjonen av Telenors norsktalende datasystem. Mellom seg har de Telenors høreprøve-dukke.


Digital norsk
Lykkes TF i sitt arbeid, åpner det seg store muligheter. Forutsatt at man klarer å flytte Unix-systemene til PC-er, ser Natvik for seg disse applikasjonene:

Oversettelsesprogram mellom bokmål og nynorsk
Gramatikksjekker for tekstbehandlere
Dikteringsystemer
Opplesning av tekst
Hjelpemidler for blinde
Multimedia-systemer

[Forrige artikkel] [Indeks] [Neste artikkel]


[Image map not available]
Artikkel automatisk generert, 19/01-95, kl. 01.26 cw@oslonett.no