FI97919C - Puheentunnistusmenetelmä ja -järjestelmä puheella ohjattavaa puhelinta varten - Google Patents
Puheentunnistusmenetelmä ja -järjestelmä puheella ohjattavaa puhelinta varten Download PDFInfo
- Publication number
- FI97919C FI97919C FI922606A FI922606A FI97919C FI 97919 C FI97919 C FI 97919C FI 922606 A FI922606 A FI 922606A FI 922606 A FI922606 A FI 922606A FI 97919 C FI97919 C FI 97919C
- Authority
- FI
- Finland
- Prior art keywords
- value
- word
- calculated
- telephone
- probability
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 42
- 238000004364 calculation method Methods 0.000 claims description 15
- 230000006870 function Effects 0.000 claims description 7
- 230000011664 signaling Effects 0.000 claims 4
- 238000007430 reference method Methods 0.000 claims 2
- 230000005540 biological transmission Effects 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000009413 insulation Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Navigation (AREA)
- Telephonic Communication Services (AREA)
- Machine Translation (AREA)
Description
5 97919
Puheentunnistusmenetelmä ja -järjestelmä puheella ohjattavaa puhelinta varten - Taligenkänningsförfarande och -system för en med tai kontrollerbar telefon
Esillä oleva keksintö koskee puheentunnistusmenetelmää ja -järjestelmää puheella ohjattavaa puhelinta varten, jossa ohjataan puhelinta puheella normaalitoiminnassa lasketaan puheentunnistimella referenssisanalle arvo käyttäjän lausu-10 man sanan perusteella ja tehdään tunnistuspäätös kyseisen arvon perusteella.
Puhelimissa on tavallisesti keskeisenä osana kuuloke, jota käyttäjä pitää kädessään puhuessaan. Näin on myös käytettä-15 essä radiopuhelimia, kuten autopuhelimia. Täten ajamiseen jää vain toinen käsi vapaaksi ja ajaminen vaikeutuu. Ratkaisuna tähän ongelmaan on autoon sijoitettava erillinen mikrofoni sekä erillinen kaiutin, joka on säädettävissä sopivalle voimakkuudelle ja joka sijaitsee sopivalla etäisyydellä 20 käyttäjästä siten, että käyttäjä kuulee vastapuolen selkeästi. Tälläkin ratkaisulla käyttäjä sitoo toisen kätensä puhelimen käyttöön puhelua aloittaessaan eli valitessaan vastapuolen numeroa tai vastatessaan puheluun sekä puhelua lopettaessaan.
25
Jotta puhelimen käyttäjä voisi täysin keskittyä ajamiseen, on kehitetty nk. kädet vapaana -puhelimia, joiden toimintoja voidaan ohjata puheella. Puheella voidaan tällöin ohjata puhelimen kaikkia toimintoja, kuten päälle/päältä -kytkemis-30 tä, lähetystä/vastaanottoa, äänenvoimakkuuden säätöä, puhelinnumeron valintaa, puheluun vastaamista, ja käyttäjä voi näin ollen keskittyä ajamiseen. Kuljettajan ei tarvitse irrottaa kättä ohjauspyörästä eikä siirtää katsettaan tieltä, joten kädet vapaana -puhelin lisää huomattavasti liikenne-35 turvallisuutta.
Puheella ohjattavan puhelimen haittapuolena on se, että puheentunnistus ei ole täysin virheetöntä. Autossa on ympäristön aiheuttama taustamelu korkea ja puheen tunnistus vaikeu- 2 97919 tuu tästä johtuen. Puheentunnistusta on yritetty markkinoida jossain määrin matkapuhelimien yhteydessä, mutta sen epäluotettavuuden takia käyttäjien kiinnostus puheohjattuja puhelimia kohtaan on ollut pieni. Nykyisten puheentunnisti-5 mien tunnistustarkkuus ei ole kovin hyvä varsinkaan vaikeissa olosuhteissa, kuten liikkuvassa autossa, jossa korkea taustamelu haittaa oleellisesti luotettavaa sanojen tunnistusta. Väärät tunnistuspäätökset aiheuttavat yleensä eniten hankaluuksia käyttäjäliitynnän toteuttamisessa, koska ne 10 saattavat käynnistää ei-toivottuja toimintoja, kuten puhelun lopettamisen kesken puhelun, joka on luonnollisesti erityisen häiritsevää käyttäjälle. Tavallisimpia virheellisten puheentulkintojen seurauksia on puhelun valinta väärään numeroon. Tästä syystä käyttäjäliityntä suunnitellaankin si-15 ten, että puheentunnistin ei tee tunnistuspäätöstä lainkaan jos sillä ei ole riittävää varmuutta käyttäjän lausumasta sanasta ja tavallisesti käyttäjää pyydetään tällöin toistamaan komento.
20 Lähes kaikki puheentunnistimet perustuvat siihen toiminnalliseen periaatteeseen, että käyttäjän lausumaa sanaa verrataan jollakin tavallisesti varsin monimutkaisella menetelmällä joukkoon referenssisanoja, jotka on talletettu puheentunnistimen muistiin aikaisemmin. Puheentunnistimet laskevat 25 yleensä kullekin referenssisanalle jonkin luvun, joka kuvaa, kuinka paljon käyttäjän lausuma sana muistuttaa ko. refe-renssisanaa. Tunnistuspäätös tehdään lopuksi näiden lukujen perusteella siten, että päätökseksi valitaan se referenssi-sana, jota lausuttu sana eniten muistuttaa. Tunnetuimpia 30 menetelmiä lausutun sanan ja referenssisanojen välisessä vertailussa ovat dynaaminen aikasovitus (Dynamic Time Warping, DTW) ja tilastollinen HMM-menetelmä (Hidden Markov Model -menetelmä). 1
Sekä DTW- että HMM-menetelmässä vertaillaan tuntematonta puhekuviota tunnettuihin referenssikuvioihin. Dynaamisessa aikasovituksesa puhekuvio jaetaan useaan kehykseen ja jokaiseen kehykseen sisältyvän puheosan ja referenssikuvion vas- 3 97919 taavan puheosan välinen paikallinen etäisyys lasketaan. Tällä tavalla saatujen paikallisten etäisyyksien perusteella etsitään sanan alku- ja loppupisteen välille minimipolku DTW-algoritmilla. Näin ollen dynaamisella aikasovituksella 5 saadaan jokin etäisyys lausutun sanan ja referenssisanojen välille. HMM-menetelmässä tuotetaan puhekuvioita ja tätä pu-hekuvion generointivaihetta mallitetaan tilanmuutosmallilla Markovin menetelmän mukaan. Kyseinen tilanmuutosmalli on siis HMM. Puheentunnistus vastaanotetuille puhekuvioille 10 tapahtuu tällöin määrittelemällä tarkkailutodennäköisyys kyseisille puhekuvioille HMM-mallin avulla. Puheentunnistuksessa HMM-menetelmää käyttäen muodostetaan aluksi HMM-malli jokaiselle sanalle, joka pitäisi tunnistaa, eli jokaiselle referenssisanalle. Nämä HMM-mallit talletetaan puheentunnis-15 timen muistiin. Kun puheentunnistin vastaanottaa puhekuvion, lasketaan jokaiselle muistissa olevalle HMM-mallille tark-kailutodennäköisyys ja tunnistustuloksena saadaan sana sille HMM-mallille, jolle saadaan suurin tarkkailutodennäköisyys.
Toisin sanoen kullekin referenssisanalle lasketaan todennä-20 köisyys, jolla se olisi käyttäjän lausuma sana. Edellä mainittu suurin tarkkailutodennäköisyys kuvaa vastaanotetun puhekuvion ja lähimmän HMM-mallin eli lähimmän referenssipu-hekuvion yhtäläisyyttä.
25 Nykyisissä järjestelmissä puheentunnistin laskee siis tietyn luvun referenssisanoille käyttäjän lausuman sanan perusteella; DTW-menetelmässä luku on sanojen välinen etäisyys ja HMM-menetelmässä luku on todennäköisyys sanojen yhtäläisyydelle. Käytettäessä HMM-menetelmää puheentunnistimille ase-30 tetaan tavallisesti tietty kynnystodennäköisyys, joka todennäköisimmän referenssisanan on saavutettava tunnistuspäätök-sen tekemiseksi. Toinen tunnistuspäätökseen vaikuttava tekijä voi olla esim. todennäköisimmän ja toiseksi todennäköisimmän sanan todennäköisyyksien erotus; sen on oltava tar-35 peeksi suuri, jotta voidaan tehdä tunnistuspäätös. Suoritettaessa tunnistuspäätöstä todennäköisimmän sanan tunnistusto-dennäköisyyden perusteella saa erehtymistodennäköisyys olla esim. korkeintaan 0,1. Täten on mahdollista, että taustame- 4 97919 lun ollessa korkea saadaan käyttäjän lausuman komennon perusteella muistissa olevalle referenssisanalle, esim. referenssisa-nalle "yksi", jokaisella yrityksellä suurin todennäköisyys muihin referenssisanoihin nähden, esim. todennäköisyys 0,8. Koska toden- -5 näköisyys jää alle kynnystodennäköisyyden 0,9, ei tätä hyväksytä ja käyttäjä voi joutua lausumaan komennon useamman kerran ennen kuin tunnistustodennäköisyysraja ylittyy ja puheentunnistin hyväksyy komennon, vaikka todennäköisyys on voinut olla erittäin lähellä hyväksyttävää arvoa. Tämä on erittäin häiritsevää käyt-10 täjälle. Nykyisellä tekniikalla päästään oikeaan tunnistustulok-seen ensimmäisellä yrityksellä varsin usein silloin, kun auton nopeus on pienempi kuin 80-90 km/h auton äänieristyksestä ja käyttäjän puhetavasta riippuen. Suuremmilla nopeuksilla tunnistimen suorituskyky heikkenee kuitenkin erittäin jyrkästi ja 15 useimmissa autoissa ei puheentunnistin enää toimi riittävän luotettavasti yli 100 km/h nopeuksilla, jotta sitä voitaisiin pitää käyttökelpoisena. Kuitenkin juuri näillä nopeuksilla liikenneturvallisuuden lisäämisen tarve on suurempi kuin pienemmillä nopeuksilla.
20
Esillä olevan keksinnön tarkoituksena on toteuttaa puheentunnis-tusmenetelmä ja -laite, jolla puheentunnistus tapahtuu luotettavasti ja nopeasti huonoissakin olosuhteissa, jolloin voidaan välttää edellä mainittuja ongelmia. Tämän toteuttamiseksi on me-25 netelmälle tunnusomaista se, että - selvitetään, onko kyseessä edellisen sanan toisto, ja jos on, - lasketaan referenssisanalle uusi arvo puheentunnistimen laskeman arvon ja muistissa olevan aikaisemmin referenssisanalle lasketun arvon perusteella, ja 30 - tehdään tunnistuspäätös uuden arvon perusteella.
Vastaavasti keksinnön mukaiselle puheentunnistusjärjestelmälle on tunnusomaista se, että siinä on - välineet, jotka selvittävät ja antavat tiedon järjestelmälle, 35 onko kyseessä edellisen sanan toisto, - välineet referenssisanalle lasketun arvon tallettamiseksi, ja - välineet referenssisanan uuden arvon laskemiseksi puheentunnistimen laskeman arvon ja muistivälineisiin talletetun aikaisemmin referenssisanalle lasketun arvon perusteella.
40 97919 5
Keksinnön mukaisessa menetelmässä puheentunnistin laskee refe-renssisanoille tunnistustodennäköisyydet ja tekee tunnistuspää-töksen, jos jokin todennäköisyys ylittää ennalta määrätyn kyn-' nysarvon, muuten pyydetään käyttäjää lausumaan sana uudestaan ja 5 tehdään sitten tunnistuspäätös, jos jonkin referenssisanan todennäköisyys ylittää ennalta määrätyn kynnysarvon, muuten lasketaan uusi todennäköisyys käyttäen hyväksi senhetkistä puheentunnistimen laskemaa todennäköisyyttä ja sen yhdellä tai useammalla edeltävällä kerralla laskemaa todennäköisyyttä, edellyttäen että ne 10 ovat saman referenssisanan todennäköisyyksiä, ja tehdään tunnistuspäätös, jos kyseinen todennäköisyys ylittää ennalta määrätyn kynnysarvon. Mikäli puheentunnistimen laskema todennäköisyys ei ylitä ennalta määrättyä kynnysarvoa, talletetaan laskettu todennäköisyys muistiin, pyydetään käyttäjää lausumaan sana uudestaan 15 ja käytetään muistiin talletettua arvoa yhdessä seuraavan/seuraa-vien puheentunnistimen samalle sanalle laskeman/laskemien toden-näköisyyden/todennäköisyyksien kanssa näiden todennäköisyyksien perusteella laskettavan uuden todennäköisyyden laskemiseksi (jotta voidaan tehdä tunnistuspäätös, jos edelliset todennäköisyydet 20 huomioon ottaen saavutetaan kynnystodennäköisyys). Sitten, kun puheentunnistin laskee kynnysarvon ylittävän todennäköisyyden tai se saavutetaan edeltävät todennäköisyydet huomioon ottaen, tyhjennetään muisti. Myös siinä tapauksessa, että kyseessä ei ole edellisen sanan toisto, tyhjennetään muisti ennen tunnistuspää-25 töksen tekemistä. Muisti tyhjennetään myös silloin, kun laitteeseen kytketään virrat päälle, ja jos jokin toiminto keskeytetään.
Keksintöä selostetaan seuraavassa yksityiskohtaisesti viittaamalla oheisiin kuviin, joista 30 kuva 1 esittää periaatteellista kulkukaaviota menetelmässä suo-‘ ritettavista toimenpiteistä, ja kuva 2 esittää lohkokaaviota menetelmän liittämisestä järjestelmään, jossa puheentunnistusta käytetään.
35
Kuvassa 1 selvennetään keksinnön mukaista puheentunnistusmene-telmää. Menetelmä ei liity suoraan puheentunnistimen sisäiseen, puheentunnistuksessa käytettävään menetelmään, vaan tällä menetelmällä nopeutetaan tunnistuspäätöksen syntymistä ja paranne-40 taan tunnistustarkkuuttaa puuttumatta var- 6 97919 sinaisen puheentunnistimen ominaisuuksiin. Kun laitteeseen kytketään 1 virrat päälle, tyhjennetään muisti ja jäädään odottamaan käyttäjän lausahdusta 2, jolloin puheentunnistin laskee 2 todennäköisyyden kaikille referenssisanoille ja 5 antaa tunnistustuloksena sen referenssisanan, jonka todennäköisyys on suurin eli sen referenssisanan, jota käyttäjän lausuma sana eniten muistutti. Mikäli referenssisanan todennäköisyys ei ylitä ennalta määrättyä kynnysarvoa tai todennäköisimmän ja toiseksi todennäköisimmän sanan todennäköi-10 syyksien erotuksen kynnysarvoa, joita tässä kutsutaan yhteisesti puheentunnistuksen kynnysarvoiksi, selvitetään 3 onko tarkasteltava sana edellisen sanan toisto. Jos kyseessä ei ole edellisen sanan toisto, tyhjennetään 4a muisti (poistetaan siellä mahdollisesti oleva tieto). Kun käyttäjä on lau-15 sunut sanan vasta yhden kerran, ei muistissa ole ensimmäisellä laskukierroksella vielä mitään, jolloin ei myöskään lasketa uutta todennäköisyyttä, vaan tehdään tunnistuspäätös 6a ja mikäli luotettavaa tunnistusta ei voida tehdä 6b, talletetaan 7 muistiin puheentunnistimen laskema todennäköisyys 20 ja jäädään odottamaan käyttäjän seuraavaa lausahdusta. Mikäli luotettava tunnistus voidaan tehdä 6b, tyhjennetään 4b muisti ja jäädään odottamaan käyttäjän seuraavaa lausahdusta 2, jne. Jos taas sana on edellisen sanan toisto, lasketaan 5 muistissa mahdollisesti olevan edellisen tunnistusyrityksen 25 jälkeen sinne talletettua todennäköisyyttä laskuissa hyväksi käyttäen uusi todennäköisyys ja tehdään 6a, 6b tämän perusteella tunnistuspäätös. Jos laskusuorituksilla 5 saavutettu uusi todennäköisyys ylittää kynnysarvon eli voidaan tehdä 6b luotettava tunnistus, tyhjennetään 4b muisti ja jäädään odo-30 ttamaan käyttäjän seuraavaa lausahdusta 2 ja puheentunnistimelta saatavaa tunnistustulosta 2, jne. Jos uusi todennäköisyys jää alle kynnysarvon, jolloin luotettavaa tunnistusta ei voida tehdä, talletetaan 7 kyseinen uusi todennäköisyys muistiin ja jäädään odottamaan käyttäjän seuraavaa lausah-35 dusta 2, jne. Mikäli jokin toiminto keskeytetään, tyhjennetään muisti, jottei sinne jää mitään, mikä saattaisi vääristää keskeytyksen jälkeen aloitettavaa uutta tunnistusta. Keksinnön mukainen menetelmä voidaan toteuttaa myös siten, 7 97919 että tunnistuspäätös 6a, 6b tehdään ennen selvitystä 3, onko kyseessä edellisen sanan toisto. Tällöin, jos puheentunnistimen toistetulle sanalle laskema arvo ylittää asetetun kynnysarvon, uuden todennäköisyyden laskemista, jossa huomioi-5 daan edellisillä tunnistusyrityksillä laskettuja arvoja, ei tarvitse suorittaa eli vältetään turhan laskennan suorittaminen.
Edellisen yhden tai useamman tunnistusyrityksen tuottaman 10 todennäköisyyden käyttö uuden todennäköisyyden laskemisessa on menetelmässä olennaista. Laskun suorittamiseksi voidaan kehittää useita laskutapoja, joita käyttämällä saadaan tuloksena parempi todennäköisyys käyttämällä laskuissa hyväksi edellistä todennäköisyyttä. Sopivin kaava on kuitenkin ehdol-15 lisen todennäköisyyden laskukaava. Menetelmässä käytettävän laskutavan havainnollistamiseksi selostetaan seuraavassa tarkemmin ehdollisen todennäköisyyslaskun käyttöä keksinnön mukaisessa menetelmässä. Tällöin tarkastellaan tilannetta, jossa käyttäjä lausuu aluksi sanan A ja seuraavaksi sanan B, kun 20 järjestelmä on pyytänyt käyttäjää toistamaan sanan. Puheentunnistin laskee kummallekin sanalle A ja B esim. seuraavat todennäköisyydet: P(A=l) = 0,7 (todennäköisyys, että A oli "yksi") 25 P(A=2) = 0,3 (todennäköisyys, että A oli "kaksi") P(B=1) = 0,8 (todennäköisyys, että B oli "yksi") P(B=2) = 0,2 (todennäköisyys, että B oli "kaksi")
Jos tunnistuspäätöksen kynnysarvoksi on asetettu 0,9, ei kum-30 mastakaan tunnistuksesta voida tehdä tunnistuspäätöstä. Kun tiedetään, että käyttäjä lausui kummallakin kerralla saman sanan, voidaan tunnistuksen varmuutta kasvattaa käyttämällä , hyväksi yhden tai useamman edellisen sekä nykyisen tunnistuk sen laskemaa todennäköisyyttä uuden todennäköisyyden laskemi-35 seksi. Tämä voidaan tehdä esim. ehdollisella todennäköisyyslaskulla seuraavasti.- P(B=i ja A=B) P (B=l I A=B) = .............. = P (A=B) 8 97919 P(B=1 ja ((A=l ja B=l) tai (A=2 ja B=2))) 5 P(A=B) P((A=l ja B=l) tai (B=l ja A=2 ja B=2)) 10 P(A=B) P(A=1 ja B=l) 15 P((A=1 ja B=l) tai (A=2 ja B=2)) 0,7 * 0,8 0,56 = - = = 0,903 20 0,7 * 0,8 + 0,3 * 0,2 0,62
Edellä suoritettu laskutoimitus, jossa laskettiin todennäköisyys sille, että toinen sana eli B on "yksi", ehdolla, että A on yhtä kuin B eli että ensimmäinen sana on sama kuin 25 toinen, antaa uuden todennäköisyyden, joka tässä tapauksessa ylittää kynnysarvon ja tunnistuspäätös voidaan tehdä. Vaikkei uusi todennäköisyys ylittäisikään kynnysarvoa, se on kuitenkin parempi kuin puheentunnistimen laskema yksittäinen todennäköisyys, ja täten tämä uusi todennäköisyys tallete-30 taan muistiin ja käytetään seuraavan uuden todennäköisyyden laskemisessa yhdessä puheentunnistimen laskeman seuraavan todennäköisyyden kanssa. Samalla huomataan, että erotus seu-raavaksi todennäköisimpään sanaan kasvaa. Edellä esitettyä kaavaa voidaan yksinkertaistaa käyttämällä nimittäjän sijaan 35 pelkkää osoittajaa sopivalla vakiolla Y kerrottuna: P(B=x|A=B) = Y*P(A=x ja B=X) = Y*P(A=x)*P(B=x) Näin ollen, jos käyttäjä lausuu sanan N kertaa, saadaan kun-40 kin referenssisanan r kokonaistodennäköisyydeksi: P(r) = Y*P(r,l)*P(r,2)*...*P(r,N) 9 97919 jossa P(r,l) on referenssisanan r ensimmäinen lausumiskerta, P(r,2) toinen ja N on viimeinen lausumiskerta. Edellä esitetyssä esimerkissä laskettiin todennäköisyys tietylle refe-renssisanalle. Puheentunnistuksen kynnyskriteerien mukaises-5 ti tarkastellaan myös kahden referenssisanan (puheentunnistimelta suurimman ja toiseksi suurimman todennäköisyyden saaneen referenssisanan) todennäköisyyksien erotusta, jolloin tuloksena on automaattisesti myös tämän eron suureneminen ja siten tunnistusvarmuuden paraneminen. Edellä esitet-10 tyjä laskentatapoja on yksinkertaista käyttää, kun puheentunnistin käyttää HMM-menetelmää, koska se laskee silloin kullekin referenssisanalle todennäköisyyden, jolla se olisi käyttäjän lausuma sana. Dynaamista aikasovitusta käytettäessä ei laskenta ole aivan yhtä suoraviivaista, koska puheen-15 tunnistin ei tällöin laske referenssisanoille todennäköisyyttä, vaan jonkin etäisyyden tai normin sille, kuinka kaukana käyttäjän lausuma sana on kustakin referenssisanasta.
Näin ollen, jotta voidaan parantaa tunnistusvarmuutta menetelmän mukaisesti aikaisempia todennäköisyyksiä hyväksi 20 käyttäen, on kyseinen normi tai etäisyys ensin muunnettava todennäköisyydeksi. Dynaamisessa aikasovituksessa voidaan siis kuvata jollakin luvulla D(r,i), kuinka hyvin kukin re-ferenssisana r muistuttaa lausuttua sanaa toistokerralla i. Tällöin tästä luvusta voidaan laskea todennäköisyys jonkin 25 funktion f(), esim. epälineaarisen funktion, avulla seuraavasti : D(r) = f(D(r,l),D(r,2),...,D(r,N)) 30 Toinen vaihtoehto on estimoida referenssisanan todennäköisyys dynaamisen aikasovitusalgoritmin antamasta tuloksesta jollakin estimaatilla g(), jolloin puheentunnistimen laskema tulos saadaan muunnettua todennäköisyydeksi ja referenssisanan r i:nnen toistokerran todennäköisyys on tällöin 35 P(r,i) = g(D(r,i)), jolloin lukua P(r,i) voidaan käyttää menetelmän mukaisesti uuden todennäköisyyden laskemisessa kuten edellä on esitetty.
10 97919
Keksinnön mukaisen menetelmän toteuttamisesta puheentunnistus järjestelmässä on esitetty eräs vaihtoehto kuvassa 2. Menetelmällä voidaan parantaa puheentunnistusjärjestelmän tunnistustarkkuutta, jossa puheentunnistin 8 tuottaa tunnis-5 tustuloksia eli tunnistustodennäköisyyksiä, jotka syötetään tunnistustulosten käsittely-yksikköön 9. Kukin tunnistustu-los sisältää listan tunnistettavista sanoista, joille kullekin on laskettu todennäköisyys (tai muu hyvyysluku), joka kuvaa, kuinka hyvin käyttäjän lausuma sana muistuttaa kuta-10 kin referenssisanaa. Referenssisanat on voitu tallettaa etukäteen puheentunnistimen 8 sisäiseen referenssisanamuistiin tai se voi oppia käyttäjän lausumia sanoja. Sillä ei kuitenkaan ole merkitystä keksinnön kannalta, miten ja milloin referenssisanat on talletettu referenssisanamuistiin eikä pu-15 heentunnistimessa 8 ole välttämätöntä olla referenssisana- muistia. Jos sanaa ei voida tunnistaa riittävällä varmuudel-la, pyytää käyttäjäliityntä 11 käyttäjää toistamaan sanan. Tällöin käyttäjäliityntä 11 antaa tunnistustulosten käsitte-lylohkolle 9 tiedon siitä, onko odotettavissa, että käyttäjä 20 toistaa sanan. Kun käyttäjäliityntä 11 antaa käsittelyloh-kolle 9 tiedon, että sanan toisto on odotettavissa, haetaan muistista 10 edellisen tunnistusyrityksen yhteydessä talletetut tiedot ja lasketaan referenssisanoille uudet todennäköisyydet keksinnön mukaisesti jollakin tunnetulla edelliset 25 arvot huomioon ottavalla tavalla. Jos uusien todennäköisyyksien perusteellakaan ei voida tehdä riittävän luotettavaa tunnistusta, talletetaan nämä lasketut uudet suuremmat todennäköisyydet kuitenkin muistiin 10. Sen jälkeen kun tehdään onnistunut tunnistus, muisti 10 tyhjennetään. Muisti 30 tyhjennetään myös, jos käyttäjäliitynnästä 11 tulee käsittely lohkolle 9 tieto, ettei seuraava sana ole sama kuin edellinen. Käytännössä järjestelmä voi olla sellainen, että tunnistustulosten käsittelylohko 9, muisti 10 ja käyttäjä-liityntälohko 11 ovat osana samaa prosessoria eli toteutet-35 tuja prosessorin avulla. Prosessori voi olla puheentunnis-tusjärjestelmää varten järjestetty tai se voi olla radiopuhelimen keskusprosessori. Tavallisesti myös puheentunnistin 8 käsittää signaaliprosessorin.
11 97919
Esillä olevan keksinnön avulla voidaan parantaa puheentun-nistustarkkuutta, vaikka itse puheentunnistimen perussuori-tuskykyä ei paranneta lainkaan. Tunnistustarkkuuden parantuessa nopeutuu tunnistuspäätöksen teko ja täten voidaan 5 toteuttaa käyttäjäystävällisempi kädet vapaana -puhelin.
Esillä oleva keksintö ei rajoitu kuvan 1 esittämän esimerkin kaavioon, vaan eri toiminnot on mahdollista suorittaa myös muussa järjestyksessä. Olennaista on, että referenssisanalle lasketaan uusi arvo puheentunnistimen laskeman arvon ja 10 muistissa olevan aikaisemmin referenssisanalle lasketun arvon perusteella.
Claims (13)
1. Taligenkänningsförfarande för en med tai kontrollerbar telefon, i vilket det vid kontroll av en telefon med tai 20 under normalfunktion räknas (2) med en taligenkänningsanord-ning (8) ett värde för ett referensord pä basen av det ord som en användare uttalat och pä basen av det ifrägavarande värdet görs ett igenkänningsbeslut (6a, 6b), käxmetecknat av att 25. det utrönes (3) om det är fräga om repetition av det före- gäende ordet och ifall det är, - räknas (5) ett nytt värde för referensordet pä basen av det av taligenkänningsanordningen uträknade värdet och ett i minnet befinnande för referensordet tidigare uträknat värde, 3. och - ett igenkänningsbeslut (6a, 6b) görs pä basen av det nya värdet.
1. Puheentunnistusmenetelmä puheella ohjattavaa puhelinta varten, jossa ohjattaessa puhelinta puheella normaalitoiminnassa lasketaan (2) puheentunnistimella (8) referenssisanalle 5 arvo käyttäjän lausuman sanan perusteella ja tehdään tunnistuspäätös (6a, 6b) kyseisen arvon perusteella, tunnettu siitä, että - selvitetään (3), onko kyseessä edellisen sanan toisto, ja jos on, 10. lasketaan (5) referenssisanalle uusi arvo puheentunnistimen laskeman arvon ja muistissa olevan aikaisemmin referenssisanalle lasketun arvon perusteella, ja - tehdään tunnistuspäätös (6a, 6b) uuden arvon perusteella.
2. Förfarande enligt patentkrav 1, kännetecknat av att ett 35 nytt värde räknas (5) för referensordet pä basen av det av taligenkänningsanordningen uträknade värdet och ett i 15 97919 minnet befinnande för referensordet uträknat värde som ut-räknats i samband med användarens senaste uttal av samma ord.
2. Patenttivaatimuksen 1 mukainen menetelmä, tunnettu sii tä, että referenssisanalle lasketaan (5) uusi arvo puheentunnistimen laskeman arvon ja muistissa olevan referenssisanalle käyttäjän saman sanan edellisen lausahduksen yhteydessä lasketun arvon perusteella. 20
3. Förfarande enligt patentkrav l, kännetecknat av att 5 ifall det inte är fräga om repetition av det föregäende or-det tömrnes (4a) minnet (10) och ett igenkänningsbeslut (6a, 6b) görs pa basen av det av taligenkänningsanordningen (8) uträknade värdet. 10 4. Förfarande enligt patentkrav l, kännetecknat av att ett igenkänningsbeslut (6a, 6b) görs ytterligare före det utrö-nes (3) om det är fräga om repetition av det föregäende or-det. 15 5. Förfarande enligt nägot föregäende patentkrav, känne tecknat av att vid utförande av igenkänningsbeslutet (6a, 6b) kontrolleras det om det för referensordet uträknade värdet uppfyller förutbestämda villkor, och ifall det uppfyller sä tömrnes (4b) minnet (10) och man blir och vänta pä använ-20 darens följande uttal (2).
3. Patenttivaatimuksen 1 mukainen menetelmä, tunnettu siitä, että jos kyseessä ei ole edellisen sanan toisto, tyhjennetään (4a) muisti (10) ja tehdään tunnistuspäätös (6a, 6b) puheentunnistimen (8) laskeman arvon perusteella. 25
4. Patenttivaatimuksen 1 mukainen menetelmä, tunnettu siitä, että tunnistuspäätös (6a, 6b) tehdään lisäksi ennen kuin selvitetään (3), onko kyseessä edellisen sanan toisto.
5. Jonkin edellisen patenttivaatimuksen mukainen menetelmä, tunnettu siitä, että tunnistuspäätöstä (6a, 6b) tehtäessä tarkistetaan, täyttääkö referenssisanalle laskettu arvo ennalta määrätyt vaatimukset, ja jos se täyttää ennalta määrätyt vaatimukset, tyhjennetään (4b) muisti (10) ja jäädään 35 odottamaan käyttäjän seuraavaa lausumaa (2).
6. Förfarande enligt patentkrav 5, kännetecknat av att ifall det för referensordet uträknade värdet inte uppfyller förutbestämda villkor lagras (7) det ifrägavarande värdet i 25 minnet, användaren bedes repetera ordet och man blir och vänta pä användarens följande uttal (2).
6. Patenttivaatimuksen 5 mukainen menetelmä, tunnettu siitä, että jos referenssisanalle laskettu arvo ei täytä ennalta 13 97919 määrättyjä vaatimuksia, talletetaan (7) kyseinen arvo muistiin, pyydetään käyttäjää toistamaan sana ja jäädään odottamaan käyttäjän seuraavaa lausahdusta (2).
7. Förfarande enligt patentkrav 4 och 5, kännetecknat av att ifall det för referensordet uträknade värdet inte upp- 30 fyller förutbestämda villkor - utrönes (3) det om det är fräga om repetition av det föregäende ordet och ifall det är, - räknas (5) ett nytt värde för referensordet pä basen av det av taligenkänningsanordningen uträknade värdet och det i 35 minnet befinnande för referensordet tidigare uträknade värdet och igenkänningsbeslutet (6a, 6b) görs pä basen av det nya värdet. 16 97919
7. Patenttivaatimuksen 4 ja 5 mukainen menetelmä, tunnettu siitä, että jos referenssisanalle laskettu arvo ei täytä ennalta määrättyjä vaatimuksia, - selvitetään (3), onko kyseessä edellisen sanan toisto, ja jos on, 10. lasketaan (5) referenssisanalle uusi arvo puheentunnistimen laskeman arvon ja muistissa olevan aikaisemmin referenssisanalle lasketun arvon perusteella ja tehdään tunnistuspäätös (6a, 6b) uuden arvon perusteella.
8. Förfarande enligt patentkrav 1, kännetecknat av att det för referensordet uträknade värdet är en sannolikhet.
8. Patenttivaatimuksen 1 mukainen menetelmä, tunnettu sii tä, että referenssisanalle laskettu arvo on todennäköisyys.
9. Förfarande enligt patentkrav 5 och 8, kännetecknat av 5 att det förutbestämda villkoret är ett förutbestämt tai som sannolikmeten för det mest sannolika referensordet mäste överskrida.
9. Patenttivaatimuksen 5 ja 8 mukainen menetelmä, tunnettu siitä, että ennalta määrätty vaatimus on ennalta määrätty 20 luku, jonka todennäköisimmän referenssisanan todennäköisyyden on ylitettävä.
10. Förfarande enligt patentkrav 5 och 8, kännetecknat av 10 att det förutbestämda villkoret är ett förutbestämt tai som skillnaden mellan sannolikmeterna för det mest sannolika och det näst sannolika referensordet mäste överskrida.
10. Patenttivaatimuksen 5 ja 8 mukainen menetelmä, tunnettu siitä, että ennalta määrätty vaatimus on ennalta määrätty 25 luku, jonka todennäköisimmän referenssisanan ja toiseksi todennäköisimmän referenssisanan todennäköisyyksien erotuksen on ylitettävä.
11. Förfarande enligt patentkrav 8, kännetecknat av att den 15 nya sannolikheten för referensordet räknas (5) med en vill- korlig sannolikhetsräkning.
11. Patenttivaatimuksen 8 mukainen menetelmä, tunnettu sii-30 tä, että referenssisanan uusi todennäköisyys lasketaan (5) ehdollisella todennäköisyyslaskulla. . 12. Puheentunnistusjärjestelmä puheella ohjattavaa puhelinta varten, jossa puhelimen ohjaamiseksi puheella normaalitoimin-35 nassa on - puheentunnistin (8) arvon laskemiseksi referenssisanalle käyttäjän lausuman sanan perusteella, ja 14 97919 - välineet (9) tunnistuspäätöksen tekemiseksi, kun kyseinen arvo täyttää ennalta määrätyt vaatimukset, tunnettu siitä, että siinä on - välineet (11), jotka selvittävät ja antavat tiedon järjes-5 telmälle, onko kyseessä edellisen sanan toisto, - välineet (10) referenssisanalle lasketun arvon tallettamiseksi, ja - välineet (9) referenssisanan uuden arvon laskemiseksi puheentunnistimen (8) laskeman arvon ja muistivälineisiin (10) 10 talletetun aikaisemmin referenssisanalle lasketun arvon perusteella .
13. Patenttivaatimuksen 12 mukainen järjestelmä, tunnettu siitä, että siinä on välineet (9) muistin (10) tyhjentämi-15 seksi.
12. Taligenkänningssystem för en med tai kontrollerbar te-lefon, i vilket det vid kontroll av en telefon med tai under 20 normalfunktion finns - en taligenkänningsanordning (8) för uträkning av ett värde för ett referensord pä basen av det ord som en användare uttalat, och - medel (9) för att göra ett igenkänningsbeslut da det if-25 rägavarande värdet uppfyller förutbestämda villkor, kännetecknat av att det omfattar - medel (11) för utröning och givande av information at sys-temet om det är fräga om repetition av det föregäende ordet, - medel (10) för lagring av ett för referensordet uträknat 30 värde, och - medel (9) för uträkning av ett nytt värde för referensordet pä basen av det av taligenkänningsanordningen (8) uträknade värdet och ett i minnesmedlen (10) lagrat för re-ferensordet tidigare uträknat värde. 35
12 97919
13. System enligt patentkrav 12, kännetecknat av att det omfattar medel (9) för tömning av minnet (10).
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FI922606A FI97919C (fi) | 1992-06-05 | 1992-06-05 | Puheentunnistusmenetelmä ja -järjestelmä puheella ohjattavaa puhelinta varten |
DE69324629T DE69324629T2 (de) | 1992-06-05 | 1993-06-04 | Verfahren und Vorrichtung zur Spracherkennung |
EP93304340A EP0573301B1 (en) | 1992-06-05 | 1993-06-04 | Speech recognition method and system |
JP5135782A JPH06161489A (ja) | 1992-06-05 | 1993-06-07 | 音声認識方法およびそのシステム |
US08/417,727 US5640485A (en) | 1992-06-05 | 1995-04-06 | Speech recognition method and system |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FI922606 | 1992-06-05 | ||
FI922606A FI97919C (fi) | 1992-06-05 | 1992-06-05 | Puheentunnistusmenetelmä ja -järjestelmä puheella ohjattavaa puhelinta varten |
Publications (4)
Publication Number | Publication Date |
---|---|
FI922606A0 FI922606A0 (fi) | 1992-06-05 |
FI922606A FI922606A (fi) | 1993-12-06 |
FI97919B FI97919B (fi) | 1996-11-29 |
FI97919C true FI97919C (fi) | 1997-03-10 |
Family
ID=8535429
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
FI922606A FI97919C (fi) | 1992-06-05 | 1992-06-05 | Puheentunnistusmenetelmä ja -järjestelmä puheella ohjattavaa puhelinta varten |
Country Status (5)
Country | Link |
---|---|
US (1) | US5640485A (fi) |
EP (1) | EP0573301B1 (fi) |
JP (1) | JPH06161489A (fi) |
DE (1) | DE69324629T2 (fi) |
FI (1) | FI97919C (fi) |
Families Citing this family (59)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4857215A (en) * | 1986-03-25 | 1989-08-15 | Wong John L | Semi-fluid lubricant for extreme climates |
FI97919C (fi) * | 1992-06-05 | 1997-03-10 | Nokia Mobile Phones Ltd | Puheentunnistusmenetelmä ja -järjestelmä puheella ohjattavaa puhelinta varten |
TW323364B (fi) * | 1993-11-24 | 1997-12-21 | At & T Corp | |
US5960395A (en) | 1996-02-09 | 1999-09-28 | Canon Kabushiki Kaisha | Pattern matching method, apparatus and computer readable memory medium for speech recognition using dynamic programming |
US6397180B1 (en) * | 1996-05-22 | 2002-05-28 | Qwest Communications International Inc. | Method and system for performing speech recognition based on best-word scoring of repeated speech attempts |
FI101333B (fi) * | 1996-09-02 | 1998-05-29 | Nokia Mobile Phones Ltd | Puhekomennoilla ohjattava telepäätelaite |
BR9712979A (pt) * | 1996-09-10 | 2000-10-31 | Siemens Ag | Processo para adaptação de um modelo acústico hidden markov em um sistema de identificação de fala |
US5950160A (en) * | 1996-10-31 | 1999-09-07 | Microsoft Corporation | Method and system for displaying a variable number of alternative words during speech recognition |
US5899976A (en) * | 1996-10-31 | 1999-05-04 | Microsoft Corporation | Method and system for buffering recognized words during speech recognition |
US5829000A (en) * | 1996-10-31 | 1998-10-27 | Microsoft Corporation | Method and system for correcting misrecognized spoken words or phrases |
US5884258A (en) * | 1996-10-31 | 1999-03-16 | Microsoft Corporation | Method and system for editing phrases during continuous speech recognition |
US6148100A (en) * | 1996-12-20 | 2000-11-14 | Bechtel Bwxt Idaho, Llc | 3-dimensional telepresence system for a robotic environment |
FI114247B (fi) | 1997-04-11 | 2004-09-15 | Nokia Corp | Menetelmä ja laite puheen tunnistamiseksi |
FI111673B (fi) | 1997-05-06 | 2003-08-29 | Nokia Corp | Menetelmä puhelinnumeron valitsemiseksi puhekomennoilla ja puhekomennoilla ohjattava telepäätelaite |
FI972723A0 (fi) | 1997-06-24 | 1997-06-24 | Nokia Mobile Phones Ltd | Mobila kommunikationsanordningar |
FI973093A (fi) * | 1997-07-23 | 1999-01-24 | Nokia Mobile Phones Ltd | Menetelmä telepalvelun ohjaamiseksi ja päätelaite |
FR2769118B1 (fr) * | 1997-09-29 | 1999-12-03 | Matra Communication | Procede de reconnaissance de parole |
KR100277105B1 (ko) | 1998-02-27 | 2001-01-15 | 윤종용 | 음성 인식 데이터 결정 장치 및 방법 |
GB9806401D0 (en) * | 1998-03-25 | 1998-05-20 | Domain Dynamics Ltd | Improvements in voice operated mobile communications |
DE19816933A1 (de) | 1998-04-16 | 1999-10-21 | Nokia Mobile Phones Ltd | Verfahren zum Steuern einer elektronischen Einrichtung, insbesondere einer Mobilstation eines Mobilfunknetzes |
US6393304B1 (en) | 1998-05-01 | 2002-05-21 | Nokia Mobile Phones Limited | Method for supporting numeric voice dialing |
FI981127A (fi) | 1998-05-20 | 1999-11-21 | Nokia Mobile Phones Ltd | Ääniohjausmenetelmä ja äänellä ohjattava laite |
FI981154A (fi) | 1998-05-25 | 1999-11-26 | Nokia Mobile Phones Ltd | Menetelmä ja laite puheen tunnistamiseksi |
DE19825760A1 (de) | 1998-06-09 | 1999-12-16 | Nokia Mobile Phones Ltd | Verfahren zum Zuweisen einer auswählbaren Möglichkeit zu einem Stellmittel |
FI105641B (fi) | 1998-08-10 | 2000-09-15 | Nokia Mobile Phones Ltd | Resurssien varaus pakettimuotoisessa tiedonsiirrossa |
FI116991B (fi) | 1999-01-18 | 2006-04-28 | Nokia Corp | Menetelmä puheen tunnistamisessa, puheentunnistuslaite ja puheella ohjattava langaton viestin |
US6230135B1 (en) | 1999-02-02 | 2001-05-08 | Shannon A. Ramsay | Tactile communication apparatus and method |
US6393305B1 (en) | 1999-06-07 | 2002-05-21 | Nokia Mobile Phones Limited | Secure wireless communication user identification by voice recognition |
DE19930522A1 (de) * | 1999-07-05 | 2001-02-01 | Univ Ilmenau Tech | Verfahren zur Erkennung von Lautsignalen |
US6487531B1 (en) | 1999-07-06 | 2002-11-26 | Carol A. Tosaya | Signal injection coupling into the human vocal tract for robust audible and inaudible voice recognition |
US6490443B1 (en) * | 1999-09-02 | 2002-12-03 | Automated Business Companies | Communication and proximity authorization systems |
DE10063901A1 (de) * | 2000-12-21 | 2002-07-04 | Deere & Co | Bedienungsvorrichtung |
US7295982B1 (en) | 2001-11-19 | 2007-11-13 | At&T Corp. | System and method for automatic verification of the understandability of speech |
US7657540B1 (en) | 2003-02-04 | 2010-02-02 | Seisint, Inc. | Method and system for linking and delinking data records |
US7827032B2 (en) * | 2005-02-04 | 2010-11-02 | Vocollect, Inc. | Methods and systems for adapting a model for a speech recognition system |
US8200495B2 (en) | 2005-02-04 | 2012-06-12 | Vocollect, Inc. | Methods and systems for considering information about an expected response when performing speech recognition |
US7895039B2 (en) * | 2005-02-04 | 2011-02-22 | Vocollect, Inc. | Methods and systems for optimizing model adaptation for a speech recognition system |
US7949533B2 (en) * | 2005-02-04 | 2011-05-24 | Vococollect, Inc. | Methods and systems for assessing and improving the performance of a speech recognition system |
US7865362B2 (en) | 2005-02-04 | 2011-01-04 | Vocollect, Inc. | Method and system for considering information about an expected response when performing speech recognition |
US7826945B2 (en) * | 2005-07-01 | 2010-11-02 | You Zhang | Automobile speech-recognition interface |
US8473295B2 (en) * | 2005-08-05 | 2013-06-25 | Microsoft Corporation | Redictation of misrecognized words using a list of alternatives |
US7590536B2 (en) * | 2005-10-07 | 2009-09-15 | Nuance Communications, Inc. | Voice language model adjustment based on user affinity |
KR20080107376A (ko) * | 2006-02-14 | 2008-12-10 | 인텔렉츄얼 벤처스 펀드 21 엘엘씨 | 화자 독립 음성 인식을 구비한 통신 장치 |
JP5576113B2 (ja) * | 2006-04-03 | 2014-08-20 | ヴォコレクト・インコーポレーテッド | 音声認識システムにモデルを適合させるための方法およびシステム |
US20070286398A1 (en) * | 2006-06-07 | 2007-12-13 | Venkatesan Ramamoorthy | Voice Recognition Dialing For Alphabetic Phone Numbers |
US20070286399A1 (en) * | 2006-06-07 | 2007-12-13 | Venkatesan Ramamoorthy | Phone Number Extraction System For Voice Mail Messages |
US20080037745A1 (en) * | 2006-07-31 | 2008-02-14 | Venkatesan Ramamoorthy | Systems, Methods, And Media For Automated Conference Calling |
US20090125299A1 (en) * | 2007-11-09 | 2009-05-14 | Jui-Chang Wang | Speech recognition system |
US8266168B2 (en) | 2008-04-24 | 2012-09-11 | Lexisnexis Risk & Information Analytics Group Inc. | Database systems and methods for linking records and entity representations with sufficiently high confidence |
WO2010003061A1 (en) * | 2008-07-02 | 2010-01-07 | Lexis Nexis Risk & Information Analytics Group, Inc. | Database systems and methods |
US8965765B2 (en) * | 2008-09-19 | 2015-02-24 | Microsoft Corporation | Structured models of repetition for speech recognition |
US9002713B2 (en) * | 2009-06-09 | 2015-04-07 | At&T Intellectual Property I, L.P. | System and method for speech personalization by need |
US9411859B2 (en) | 2009-12-14 | 2016-08-09 | Lexisnexis Risk Solutions Fl Inc | External linking based on hierarchical level weightings |
US9189505B2 (en) | 2010-08-09 | 2015-11-17 | Lexisnexis Risk Data Management, Inc. | System of and method for entity representation splitting without the need for human interaction |
US8914290B2 (en) | 2011-05-20 | 2014-12-16 | Vocollect, Inc. | Systems and methods for dynamically improving user intelligibility of synthesized speech in a work environment |
US9978395B2 (en) | 2013-03-15 | 2018-05-22 | Vocollect, Inc. | Method and system for mitigating delay in receiving audio stream during production of sound from audio stream |
KR101595090B1 (ko) * | 2015-04-30 | 2016-02-17 | 주식회사 아마다스 | 음성 인식을 이용한 정보 검색 방법 및 장치 |
US10714121B2 (en) | 2016-07-27 | 2020-07-14 | Vocollect, Inc. | Distinguishing user speech from background speech in speech-dense environments |
US10135989B1 (en) | 2016-10-27 | 2018-11-20 | Intuit Inc. | Personalized support routing based on paralinguistic information |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CH644246B (fr) * | 1981-05-15 | 1900-01-01 | Asulab Sa | Dispositif d'introduction de mots a commande par la parole. |
JPS6024597A (ja) * | 1983-07-21 | 1985-02-07 | 日本電気株式会社 | 音声登録方式 |
US5003603A (en) * | 1984-08-20 | 1991-03-26 | Gus Searcy | Voice recognition system |
US4852171A (en) * | 1984-11-09 | 1989-07-25 | Alcatel Usa Corp. | Apparatus and method for speech recognition |
JPH0632012B2 (ja) * | 1985-03-25 | 1994-04-27 | 株式会社東芝 | 音声認識装置 |
US4783803A (en) * | 1985-11-12 | 1988-11-08 | Dragon Systems, Inc. | Speech recognition apparatus and method |
JPS62232000A (ja) * | 1986-03-25 | 1987-10-12 | インタ−ナシヨナル・ビジネス・マシ−ンズ・コ−ポレ−シヨン | 音声認識装置 |
US4837831A (en) * | 1986-10-15 | 1989-06-06 | Dragon Systems, Inc. | Method for creating and using multiple-word sound models in speech recognition |
JPS63225300A (ja) * | 1987-03-16 | 1988-09-20 | 株式会社東芝 | パタ−ン認識装置 |
DE3819178A1 (de) * | 1987-06-04 | 1988-12-22 | Ricoh Kk | Spracherkennungsverfahren und -einrichtung |
GB8809898D0 (en) * | 1988-04-27 | 1988-06-02 | British Telecomm | Voice-operated service |
US5212764A (en) * | 1989-04-19 | 1993-05-18 | Ricoh Company, Ltd. | Noise eliminating apparatus and speech recognition apparatus using the same |
US5165095A (en) * | 1990-09-28 | 1992-11-17 | Texas Instruments Incorporated | Voice telephone dialing |
FI97919C (fi) * | 1992-06-05 | 1997-03-10 | Nokia Mobile Phones Ltd | Puheentunnistusmenetelmä ja -järjestelmä puheella ohjattavaa puhelinta varten |
-
1992
- 1992-06-05 FI FI922606A patent/FI97919C/fi not_active IP Right Cessation
-
1993
- 1993-06-04 EP EP93304340A patent/EP0573301B1/en not_active Expired - Lifetime
- 1993-06-04 DE DE69324629T patent/DE69324629T2/de not_active Expired - Lifetime
- 1993-06-07 JP JP5135782A patent/JPH06161489A/ja active Pending
-
1995
- 1995-04-06 US US08/417,727 patent/US5640485A/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
FI922606A0 (fi) | 1992-06-05 |
JPH06161489A (ja) | 1994-06-07 |
EP0573301B1 (en) | 1999-04-28 |
FI922606A (fi) | 1993-12-06 |
US5640485A (en) | 1997-06-17 |
FI97919B (fi) | 1996-11-29 |
EP0573301A1 (en) | 1993-12-08 |
DE69324629T2 (de) | 1999-09-30 |
DE69324629D1 (de) | 1999-06-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
FI97919C (fi) | Puheentunnistusmenetelmä ja -järjestelmä puheella ohjattavaa puhelinta varten | |
US8880402B2 (en) | Automatically adapting user guidance in automated speech recognition | |
US8639508B2 (en) | User-specific confidence thresholds for speech recognition | |
US8688451B2 (en) | Distinguishing out-of-vocabulary speech from in-vocabulary speech | |
US8296145B2 (en) | Voice dialing using a rejection reference | |
US8438028B2 (en) | Nametag confusability determination | |
KR100984528B1 (ko) | 분산형 음성 인식 시스템에서 음성 인식을 위한 시스템 및방법 | |
US8423362B2 (en) | In-vehicle circumstantial speech recognition | |
EP1159732B1 (en) | Endpointing of speech in a noisy signal | |
US8600760B2 (en) | Correcting substitution errors during automatic speech recognition by accepting a second best when first best is confusable | |
US5452397A (en) | Method and system for preventing entry of confusingly similar phases in a voice recognition system vocabulary list | |
CA2117932C (en) | Soft decision speech recognition | |
US7676363B2 (en) | Automated speech recognition using normalized in-vehicle speech | |
US7826945B2 (en) | Automobile speech-recognition interface | |
US9245526B2 (en) | Dynamic clustering of nametags in an automated speech recognition system | |
US20080010057A1 (en) | Applying speech recognition adaptation in an automated speech recognition system of a telematics-equipped vehicle | |
EP0757342B1 (en) | User selectable multiple threshold criteria for voice recognition | |
US20030012347A1 (en) | Method for the training or adaptation of a speech recognition device | |
US20120323577A1 (en) | Speech recognition for premature enunciation | |
EP1525577B1 (en) | Method for automatic speech recognition | |
US9473094B2 (en) | Automatically controlling the loudness of voice prompts | |
US20120197643A1 (en) | Mapping obstruent speech energy to lower frequencies | |
EP1377000B1 (en) | Method used in a speech-enabled automatic directory system | |
US20090138264A1 (en) | Speech to dtmf generation | |
JP2003177788A (ja) | 音声対話システムおよびその方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FG | Patent granted |
Owner name: NOKIA MATKAPUHELIMET OY |
|
BB | Publication of examined application | ||
MA | Patent expired |