Einar Ryvarden
Arne er ikke så flink å snakke, men han er bare seks måneder gammel. Til høsten skal han kjenne igjen og uttale 16 ord. Arne er første versjon av Telenors Forskningsinstitutt (TF) norske språkprogram.
Programvare fra IBM, Novell og Kurtzweil forstår og snakker bra engelsk, men er helt blanke på norsk. Fordi det norske markedet er så lite, har vi ikke fått de samme mulighetene som engelsk programvare gir. Norges-kontorene til de store programvare-leverandører synes det blir for dyrt, men nå har Telenors Forskningsinstitutt (TF) tatt på seg mye av jobben.
Gjennom sitt arbeide med forskjellige telefonsystemer, legger TF grunnarbeidet for norsktalende PC-programvare. Men dette ligger langt frem.
-- Vårt første oppgave er system som automatiserer de telefontjenester som man i dag styrer med stjerne og firkanttastene. Dette menysystemet er klønete og derfor et velegnet testprosjekt for talestyring og talesyntese, sier Jon Emil Natvik, leder for TFs TABU-prosjekt.
Med seg på TABU-prosjektet (Talebaserte brukergrensesnitt) har Natvik 7 TF-forskere, men han samarbeider også med universitetsmiljøene i Bergen, Trondheim og Oslo.
Ønsket om å digitalisere det norske språket er ikke nytt. Allerede i 1985 ble det startet et nasjonalt, tverrfaglig prosjekt for "digitalisering" av det norske språk. Planen var å utarbeide en grunnmodul som kan tolke norsk tale. Med kunnskapen i denne grunnmotoren kan man lage systemer som kan snakke norsk og analysere norsk grammatikk.
De tekniske utfordringene er enorme, påpeker Natvik. Men TF har støttet seg på forskning både fra USA, Sverige og Danmark, som startet sin prosjekter tidligere. I disse landene har man klart å lage systemer som kan gjenkjenne hele ord av gangen. Neste skritt er evnen til å plukke ut nøkkelord av lengre setninger og forkaste det som ikke er interessant.
Et stykke inn i fremtiden ser man for seg systemer som kan gjenkjenne og tolke ordene i en setning og ut fra gramatikkregler redusere antall feiltolkninger. Parallelt med tolkningsarbeidet jobber TF med talesyntese -- prosessen av å omsette tekst til tale.
Foreløpig er ikke Arne så flink, men det kommer seg. Forskningen på feltet brøyter ny mark innen fonetikk, men det er mye steiner i jorden. Foreløpig minner Arne mest om meteorologen Vidar Teisen. Rytmen i språket er dårlig og han klarer ikke å legge vekt på et ord i setningen slik vi gjør når vi prater.
-- For å trene opp våre systemer har vi samlet inn talen til 1.000 nordmenn som sier den samme teksten. Disse stemmene, som er lagret på fire CD-plater, danner grunnlaget for opptreningen av tolkeren, forteller Natvik
For det er ikke småtterier telefonsystemet skal takle. I utgangspunktet er den tekniske kvaliteten på telefonlinjene lav og støy forekommer. I tillegg må systemet gjenkjenne et meget bredt spenn av dialekter og stemmer fra både kvinner, menn, barn og gamle. Over en telefonlinje blir for eksempel s og f svært like, forteller Natvik.
Arne må bli voksen ganske fort. Ellers risikerer vi at alle nordmenn må snakke engelsk med sine datamaskiner.
NORSK: Jon Emil Natvik og forsker Ingunn Amdal er to av syv fedre til Arne, den første versjonen av Telenors norsktalende datasystem. Mellom seg har de Telenors høreprøve-dukke.
Lykkes TF i sitt arbeid, åpner det seg store muligheter. Forutsatt at man klarer å flytte Unix-systemene til PC-er, ser Natvik for seg disse applikasjonene:
Digital norsk
Oversettelsesprogram mellom bokmål og nynorsk
Gramatikksjekker for tekstbehandlere
Dikteringsystemer
Opplesning av tekst
Hjelpemidler for blinde
Multimedia-systemer