[go: up one dir, main page]

Hopp til innhald

Talesyntese

Frå Wikipedia – det frie oppslagsverket

Talesyntese er namnet på ein spesiell type dataprogram, som simulerer menneskeleg tale. Talesynteseprogram er av to typar. Dei kan enten lese opp tekst dei får som input (som når ein brukar får eit program til å lese opp e-posten for seg), eller dei kan generere tale ut frå eit visst sett av inputdata (som når programmet formidlar informasjon på grunnlag av inputdata, t.d. kan det generere ei setning Neste buss går om 25 minutt. ut i frå informasjon henta i ein busstabell, og kunnskap om kva klokka er akkurat no).

Ulike metodar for talesyntese

[endre | endre wikiteksten]

Talesynteseprogram har lenge brukt den såkalla difonmodellen, i dei siste åra har dei også brukt Hidden Markov Models, eller HMM. Tidlegare har det og vore arbeidd med fullstendig syntetisk tale, der lydane har vorte produsert med å kombinere formantane for kvar lyd. Problemet med den syntetiske innfallsvinkelen er at resultatet blir nett syntetisk, ei stemme med «robotklang». Dei fonetiske eigenskapane til menneskeleg tale er langt meir komplisert enn berre dei lågaste formantane.

Eit alternativ til talesyntese er å spela inn alle replikkane ein vil at maskina skal seie, og så spele dei av i rett augneblink (t.d. beskjedar av typen «Neste stopp - Storgata» og «For opplysningar om saldo - tast fire». Problemet med dette alternativet er at systemet er lukka, det kan berre lese opp eit viss mengd setningar. Forsøk på å kombinere slike meldingar (t.d. ved å lese inn talord eitt og eitt og deretter setje dei saman til store tal) gjev svært dårlege resultat, i og med at setningsintonasjonen i dei ulike bitane ikkje passar saman.

Det motsette av talesyntese er taleattkjenning, dataprogrma som er i stand til å overføre tale til skrift.

Opne kjeldekode-versjonar av talesyntese

[endre | endre wikiteksten]

Universitetet i Edinburgh har utvikla den såkalla Festival-plattforma, som eir ei utviklingsplattform for talesyntese, og som er tilgjengeleg for engelsk, spansk, kroatisk og walisisk. For finsk er det no tilgjengeleg ein open syntetisator, Suopuhe, frå 2004.

Norsk talesyntese

[endre | endre wikiteksten]

Den mest kjende norske talesyntesen er Telenors Talsmann. Elles har SINTEF arbeidd med talesyntese, det same gjorde Nordisk språkteknologi før dei gjekk konkurs.