Prosjektet Talebaserte grensesnitt og resonnerende systemer har som målsetting å utvikle et resonnerende system for automatisk ruteopplysning der tale er grensesnittet ("kontaktflaten") til brukerne. Prosjektet har en tidsramme på 3 år (1996-1999).
De innovative sidene av prosjektet ligger i at taleteknologisk og lingvistisk kompetanse kobles sammen med kompetanse om kunstig intelligens. Ved UNIT finnes idag pilotsystemer for resonnering, talegjenkjenning, talesyntese og automatisk setningsanalyse, men de er ikke knyttet sammen. Ved prosjektslutt skal det eksistere en demo-versjon som prosjektet og deltakermiljøenes kompetanse kan evalueres mot.
I et talebasert dialogsystem blir tale vha. automatisk talegjenkjenning omdannet til et (eller flere) forslag til ord-sekvenser, altså en tale til tekst konvertering. En pefølgende syntaktisk og semantisk analyse produserer en semantisk struktur for ordsekvenser som er velformede setninger. Syntaksanalysen sørger for at ugrammatiske ordsekvenser filtreres ut. Deretter vil et resonnerende system tolke den semantiske strukturen og hente relevant informasjon fra en database. Denne informasjonen har en semantisk form som det er mulig å generere en (eller flere) setninger fra. Setningen returneres til bruker som tale vha. talesyntese eller såkalt 'tale-skjøting'. Svaret kan være den informasjonen brukeren søker eller en forespørsel fra systemet om tilleggsinformasjon. Systemet kan bare fungere godt dersom brukerne mener det er enkelt å bruke og ikke minst at de får fornuftige svar. Begge disse forholdene er avhengig av at dialogene er funksjonelle og informative. Dette betyr at dialoganalyse er en meget sentral del i utviklingen av et talebasert dialogsystem.
Prosjektet Talebaserte grensesnitt og resonnerende systemer er et forsøk på å realisere en norsk pilotanvendelse innen dette feltet. Prosjektet skal munne ut i et implementert automatisk, talebasert informasjonssystem for offentlige transportmidler (buss, trikk, tog). Det er etablert kontakt med Trondheim Trafikkselskap, Trondheim Sentralstasjon og Oslo og Akershus Trafikkservice. Alle har uttrykt stor interesse for prosjektet. Ukentlig får Trondheim Trafikkselskap ca. 300 telefonhenvendelser om ruter, Trondheim Sentralstasjon ca. 500 ruteoppringninger og Oslo og Akershus Trafikkservice hele 25.900 oppringninger om ruter og rutetider. Prosjektets anvendelsespotensiale er derfor reelt. Prosjektets verdi er imidlertid ikke utelukkende begrenset til systemer for ruteopplysning. Det blir lagt vekt på generiske løsninger, noe som gjør det mulig å tilpasse systemet til andre domener, men det bør anføres at slik transformasjon vil være arbeidskrevende.
Deltakerermiljøene har kompetanse innen ulike felter av tale- og språk-teknologi:
Dialogkorpuset vil ha stor verdi utover dette prosjektet, spesielt fordi det vil være en viktig del av det samlede transkriberte norske talekorpus. Slikt korpusmateriale er helt sentralt i alle forsøk på å trene opp generelle talegjenkjenningssystemer. Dessverre er mengden av transkriberte korpus for norsk beskjeden. Videre er slike korpus viktige for å avgjøre hvilke analyse- og genereringsalgoritmer som er adekvate i dialogsystemer. Dersom man på empirisk grunnlag kan vise at man greier seg med enklere algoritmer enn det som kreves for analyse av alle typer tekster, kan man konstruere effektive systemer uten kompleksitetsteoretiske fallgruver.
Resonneringsmodulen bester av følgende hovedkomponenter:
I en realistisk dialogsituasjon skal applikasjonen hjelpe brukeren til å løse et problem, ikke bare svare på konkrete spørsmel. Brukeren vil da eksplisitt eller implisitt uttrykke hvilket mål han ønsker oppnedd, og resonneringsmodulen vil lage en plan for at brukeren kan oppnå målet. Dialogen må lages som et samarbeidende system, der systemet svarer på det som det finner at brukeren egentlig trenger av informasjon, og ikke bare på hva det direkte blir spurt om.
Resonneringsmodulen vil ha to aspekter:
Leksikonet er spesielt viktig i grammatikkmodulen. Der blir både konseptuell (semantisk), lydlig og grammatisk informasjon samlet for ordene som påtreffes i korpuset. Leksikonet vil være basert på et teoretisk begrunnet allmen-format, bl.a. brukt i NorKompLeks, et prosjekt for konstruksjon av leksikon for norsk under oppbygning ved Lingvistisk institutt.
Sluttproduktet fra komponenten som genererer svar er setninger som foreligger i ortografisk form. Talesyntesekomponenten har som oppgave å omsette slike setninger til forsteelig og behagelig tale. I dag brukes to metoder ved talesyntese. Den ene typen setter sammen brokker av naturlig menneskelig tale. Den andre metoden er regelbasert syntese, som betyr at en datamaskin produserer kunstlig tale ved hjelp av synteseregler. Den siste metoden er å foretrekke fordi man da har et system som kan generere tale fra vilkårlig tekst.
I tillegg til det opprinnelige korpuset blir det laget et nytt dialogkorpus som brukes til å trene demonstratoren. Det nye korpuset blir bygget opp med et sekalt "Wizard of Oz"-eksperiment der man simulerer menneske-maskin kommunikasjon på følgende måte: Et individ stiller spørsmel ved å snakke inn i en mikrofon og får svar i form av syntetisk tale. Den som stiller spørsmel vet ikke at komponentene talegjenkjenning, resonnering og setningsgenerering er eller kan være utført av et menneske som simulerer dialogsystemet som fungerer feilfritt. De naturligspreklige ytringene fra mennesket som søker informasjon blir lagret og kan brukes senere til å modifisere de andre systemkomponentene (grammatikk- og resonneringsmodulene).
For nærmere opplysninger, kontakt prosjektleder Magne Hallstein Johnsen