SE521465C2 - Mobiltelefon med taligenkänningssystem innehållande en beräkningsenhet för spektralavstånd. - Google Patents

Mobiltelefon med taligenkänningssystem innehållande en beräkningsenhet för spektralavstånd.

Info

Publication number
SE521465C2
SE521465C2 SE9902103A SE9902103A SE521465C2 SE 521465 C2 SE521465 C2 SE 521465C2 SE 9902103 A SE9902103 A SE 9902103A SE 9902103 A SE9902103 A SE 9902103A SE 521465 C2 SE521465 C2 SE 521465C2
Authority
SE
Sweden
Prior art keywords
spectrum
noise
spectral distance
incoming
speech recognition
Prior art date
Application number
SE9902103A
Other languages
English (en)
Other versions
SE9902103L (sv
SE9902103D0 (sv
Inventor
Alberto Jimenez Feltstroem
Jim Rasmusson
Original Assignee
Ericsson Telefon Ab L M
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ericsson Telefon Ab L M filed Critical Ericsson Telefon Ab L M
Priority to SE9902103A priority Critical patent/SE521465C2/sv
Publication of SE9902103D0 publication Critical patent/SE9902103D0/sv
Priority to PL00352164A priority patent/PL352164A1/xx
Priority to IL14672100A priority patent/IL146721A0/xx
Priority to KR1020017015420A priority patent/KR20020010684A/ko
Priority to EP00939227A priority patent/EP1203367A1/en
Priority to PCT/SE2000/001124 priority patent/WO2000075918A1/en
Priority to CNB008086079A priority patent/CN1174375C/zh
Priority to AU54350/00A priority patent/AU766857B2/en
Priority to JP2001502112A priority patent/JP2003501701A/ja
Priority to BR0011379-4A priority patent/BR0011379A/pt
Priority to US09/588,629 priority patent/US6983245B1/en
Publication of SE9902103L publication Critical patent/SE9902103L/sv
Priority to IL146721A priority patent/IL146721A/en
Priority to HK02108929.7A priority patent/HK1047341B/zh
Publication of SE521465C2 publication Critical patent/SE521465C2/sv

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/10Speech classification or search using distance or distortion measures between unknown speech and reference templates
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Telephone Function (AREA)
  • Optical Radar Systems And Details Thereof (AREA)
  • Radar Systems Or Details Thereof (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
  • Measurement Of Optical Distance (AREA)
  • Mobile Radio Communication Systems (AREA)

Description

U 20 25 30 w . = 2000 -lO-OG \\CURREN'T\DB\PUBLICšDOC\P\l8741355.dpC V0 1.1 ÜJ 2 Några tidigare kända telefoner är försedda med en en- kel art av AVA-funktionalitet baserad på energidetektorer.
Telefonen är känslig för och detekterar ett AVA-kommando när talet har en högre energinivå än en fördefinierad trös- kel. handahállas, vanligtvis väljs "avvisa samtalet".
Som en följd därav kan endast en svarsfunktion till- En tidigare känd mobiltelefon, som tillhandahålls av sökanden, Ericsson Tl8, är försedd med en automatisk tal- uppringningsfunktion.
AVA-funktioner baserade på energidetektorer är be- gränsade att acceptera endast ett kommando enligt ovan. Det är inte lämpligt att tillhandahålla flera kommandon när AVA-funktionerna är baserade på energidetektorer, eftersom det är mycket sannolikt att AVA-funktionerna hos telefonen är känsliga för ljud såsom ringsignalen, som omger telefo- nen. Å andra sidan är AVA-funktioner baserade på taligen- känning känsliga för interferens från andra ljud med lik- nande spektrala karakteristikor såsom tal. En anledning till detta är att den i taligenkänningsenheten använda dis- similaritetsmätningen mestadels är baserad på skillnaden mellan korttidsspektralkarakteristikor hos det förnimmade ljudet eller talet och hos de förtränade talreferenserna eller mallarna.
En annan lösning är baserad på làgpassfiltrering av mikrofonsignalerna, som ökar igenkänningsnivån hos AVA-kom- mandona. En nackdel hos denna lösning är emellertid att all talinformation med frekvenser över filtergränsfrekvensen inte kan användas av en taligenkänningsenhet även om ring- signalen inte täcker alla frekvenser över gränsen.
Vid ytterligare ett angreppssätt för att lösa detta problem kan mobiltelefonen förses med ett adaptivt filter mellan mikrofonen och taligenkänningsenheten för att fil- trera ut olika ringsignaler.
W 20 25 2000-10-06 \\CURRENT\DB\PUBLIBDÉ\PTB74IÃSßlCJCrW/O Det adaptiva filtret kan realiseras såsom ett adap- tivt notchfilter, varvid placeringen av notcharna uppdate- ras kontinuerligt på ett sådant sätt att endast störda fre- kvenser dämpas. Som en följd därav åstadkoms högre igen- känningsnivåer genom att använda denna metod. En sådan adaptiv algoritm kräver emellertid en mängd beräkningar.
Dessutom adapteras de inte momentant och en brytpunkt mellan stabilitet och konvergenstid för adaptionen måste utföras.
GP-A-2 137 791 visar en spektralavståndsprocessor för att jämföra spektra tagna från tal i närvaro av bakgrunds- brus, som måste uppskattas. För att förbereda ett inkom- mande spektrum och ett referensspektrum för jämförelse har processorn organ för att maska det inkommande spektrumet med avseende på en uppskattning av ett inkommande brus- spektrum, organ för att maska referensspektrumet med spek- trum till en uppskattning av ett referensbrusspektrum och organ för att markera sampel hos varje maskat spektrum be- roende på om samplet avser brus eller tal.
Under maskningsoperationerna förbinds brusmarkeringar med det maskade inkommande spektrumet respektive mönster- spektrumet, huruvida värdet uppkommer från brus eller tal och togs i beaktande vid de spektrala avståndsberäkningarna för spektrumen.
Där det större av de maskade spektralsamplen markeras såsom innehållande brus, tilldelas ett defaultbrusavstånd istället för avståndet mellan de två maskade spektrumen.
Eftersom den spektrala avståndsprocessorn enligt GB-A-2 137 791 är avsedd att fungera vid fluktuerande eller höga brusnivåförhållanden är detta sålunda anledningen till den komplexa designen.
Vid taligenkänning i en mobiltel fon där användaren e elefonen enligt ovan, är rf 1 r' 1 A F" 4-4- 4-_..,-.-. an go taikommandon for att styla emel ertid en komplex spektralavståndsprocessor inte nöd- 20 25 30 35 2000-10-06 \\CURRENT\DB\PUBLIC\DOC\P\l874135$.dOC V0 r- . r 21 4e5 I. vändig, eftersom det aktuella bruset inte fluktuerar och inte har någon hög nivå.
Uppfinningen Det är därför ett ändamål med föreliggande uppfinning att tillhandahålla en förbättrad beräkningsenhet för spek- tralavstånd, som är användbar vid varje taligenkänning, som använder den spektrala differensen såsom en dissimilari- tetsmätning, speciellt lämplig vid låga brusnivåförhållan- den.
I enlighet med en aspekt hos föreliggande uppfinning innefattar beräkningsenheten för det spektrala avståndet beräkningsorgan för det spektrala avståndet för att utföra spektralavståndsberäkningar för jämförelse av ett inkom- mande spektrum från en inkommande signal i närvaro av en brussignal och ett referensspektrum, minnesorgan för att förlagra ett brusspektrum från brussignalen och organ för att maska det spektrala avståndet mellan det inkommande spektrumet med hänsyn till det förlagrade brusspektrumet.
I enlighet med en annan aspekt hos föreliggande upp- finning har bruset en lägre nivå än det inkommande spek- trumet.
Ett annat ändamål med uppfinningen är att tillhanda- hålla ett taligenkänningssystem för att jämföra ett inkom- mande spektrum och ett referensspektrum innehållande en be- räkningsenhet för ett spektralavstånd enligt ovan, varvid igenkänningssystemet innefattar utväljningsorgan för att välja ett referensspektrum, som minimerar ett fullständigt spektralavständ mellan de inkommande spektrumen och refe- rensspektrumen.
Ytterligare ett ändamål med uppfinningen är att till- handahålla en mobiltelefon innehållande taligenkännings- system enligt ovan.
En fördel med uppfinningen är att automatiska tal- hos en svarsfunktioner (AVA = Automatic Voice Answering) 20 25 30 y 2000-10-06 \\CURREN'I'\DB\PUBLIC\DOC\P\lB74l35S.dOC V0: mobiltelefon med ett taligenkänningssystem, försett med en beräkningsenhet för spektralavständet enligt uppfinningen är tillförlitlig i att svara på olika AVA-kommandon i när- varo av ringsignaler, som omger telefonen.
Kort beskrivning av ritningarna För att beskriva uppfinningen mera i detalj och för- delarna och egenskaperna hos uppfinningen kommer en före- dragen utföringsform att beskrivas i detalj nedan, varvid hänvisning görs till de bifogade ritningarna, pä vilka FIG 1 visar ett exempel på ett inkommande spektrum innehållande ett känt brus, ett referensspektrum och det kända brusspektrumet; och FIG 2 illustrera bruskompenseringen enligt upp- finningen.
Detaljerad beskrivning av uppfinningen En utföringsform av en beräkningsenhet för spektral- avstànd enligt uppfinningen innefattar beräkningsorgan för spektralavständ för att utföra spektralavstàndsberäkningar för jämförelse av ett inkommande spektrum beroende av brus och ett referensspektrum. För att hantera interfererande brus innefattar avståndsberäkningsenheten dessutom mask- ningsorgan för att maska spektralavstándet mellan det in- kommande spektrumet och referensspektrumet med hänsyn till ett känt eller fördefinierat brus, lagrat i ett minnes- organ.
Avståndsberäkningsorganet i utföringsformen är base- rad på cityavstånd och diskret spektral representation av tal. Denna lösning kan emellertid generaliseras till andra spektrala representationer hos tal inom uppfinningstanken.
En beräkningsenhet för spektralavstànd enligt upp- _ _J_.___--__ 10 15 20 25 30 35 2000 - 10-06 \\CURRENT\DB\PUBLlC\DOC\P\1874135S _ doc V0: f 21 ÅÉ-t-S le' tet eller avstàndsmätning, exempelvis i en mobiltelefon styrd av talkommandon.
En användare av ett taligenkänningssystem talar i en mikrofon, varvid varje ljud bryts ned i sina olika frekven- ser. De mottagna ljuden i varje frekvens digitaliseras så att de kan manipuleras av taligenkänningssystemet. Mikro- fonsignalen betecknas s(n) och dess motsvarande spektrala representation betecknas med Sn(f), där n är tiden för varje sampel och f är den aktuella frekvensen.
Den digitaliserade versionen av ljudet matchas mot en uppsättning mönster eller referenssignaler förlagrade i ett systemminne. Ett mönster eller en referenssignal betecknas med r(n) och en motsvarande spektral representation hos mönstersignalen betecknas med Rn(f). Den kända brussignalen i inmatningen betecknas med x(n) och den motsvarande spek- trala representationen betecknas Xn(f).
Mätningen av de dissimilariteten eller avståndet an- vänt i taligenkänningsenheten ges exempelvis av uttrycket: nn = 2|Rnl i Det inkommande signalspektrumet Sn(f) matchas sålunda mot liknande utformade referenssignaler R¶(f) bland lagrade referenssignaler i det elektroniska minnet. Denna match- ningsprocedur genomförs genom att välja ut referens- signalen, som minimerar det kompletta spektrala avståndet, dvs minimerar följande uttryck: ED n n Denna utväljningsprocedur tar emellertid inte hänsyn till någon information om interfererande brussignaler.
I en mobiltelefon, som tillhandahåller taligen- känningsfunktioner eller speciellt så kallade automatiska talsvars- in- (AVA = Automatic Voice Answering) funktioner, 10 15 20 25 30 35 2000 - 10 -06 \\CURRENT\DB\PUBLIC\DOC\P\15'74135S:dOC VO ' , .
P05 7 terfererar den av telefonen genererade ringsignalen starkt med det givna AVA-kommandot.
Ringsignalen är en känd "brus" -signal och spek- trumet, som representerar ringsignalen, kan följaktligen vara förlagrat i minnesorganet förbundet med beräknings- enheten för spektralavstånd.
Ringsignalen är exempelvis en summer eller en person- lig ringsignal, såsom en enkel melodi, vald eller program- merad av användaren. När ringsignalen är vald eller pro- grammerad är den emellertid "känd" av telefonen och ett spektrum representerande den aktuella ringsignalen kan vara lagrat i minnesorganet för förlagrade brusspektra. I en al- ternativ utföringsform kan ett flertal spektra från olika ringsignaler vara förlagrade och den aktuella valda ring- signalen markeras med en bit satt i minnet. Sedan kan be- räkningsenheten för spektralavstånd identifiera och välja ut det aktuella spektrumet, som skall användas vid mask- ningsproceduren enligt uppfinningen.
Enligt FIG I exponeras den inkommande signalen för en jämförelse med ett känt brus i spektrumet mellan de två frekvenserna fa och fb. Den motsvarande referenssignalen R (f) X1 för jämförelse med den inkommande signalen anses inte innehålla något brus. För att få en fullständig jämförelse mellan insignalen och referenssignalen eller deras spektra mäste sålunda insignalen maskas på något sätt för att kom- pensera för det kända bruset. Enligt uppfinningen modifie- ras den spektrala avständsberäkningen eller mätningen av dissimilariteten med en vikt Ad enligt det följande ut- trycket: D = ÉA« I detta uttryck är Ai lika med noll om frekvensen fi hos den inkommande signalen innehåller något känt brus och är Ai 1 om inget brus är närvarande vid den aktuella fre- kvensen fp 10 15 20 25 2000- 10-06 \\CURRENT\DB\PU'BLICÉOCÖP\18741355 .dQC V0: ' -1 lÉ-tß a FIG 2 illustrerar bruskompenseringen enligt upp- finningen, varvid det spektrala avståndet mellan det inkom- till- delas ett nollvärde i spektrumet mellan de två frekvenserna fa och fb.
I en utföringsform av beräkningsenheten för spektral- mande spektrumet Sn(fi) och referensspektrumet Rn(fQ avstånd enligt uppfinningen är den anordnad i ett taligen- känningssystem för jämförelse av ett inkommande spektrum och ett referensspektrum, innefattande utväljningsorgan för att välja ut ett referensspektrum, som minimerar det kom- pletta spektrala avståndet mellan det inkommande spektrumet och referensspektrumet.
Taligenkänningssystemet inryms i en mobiltelefon för- sedd med AVA-funktioner, såsom "acceptera samtalet" om en användare av telefonen vill besvara samtalet eller "avvisa samtalet" om han inte vill svara på samtalet eller "vidare- koppla" om det inkommande samtalet skall kopplas till röst- brevlåda eller ett annat telefonnummer. Även om uppfinningen har beskrivits med en specifik utföringsform är det uppenbart att föreliggande uppfinning tillhandahåller en beräkningsenhet för viktade spektral- avstånd, som fullständigt uppfyller ändamålen och fördel- arna enligt ovan och alternativ, modifikationer och varia- tioner år uppenbara för fackmannen inom området.
I en annan utföringsform av uppfinningen är exempel- vis beråkningsenheten försedd med ett adaptivt notchfilter, som inte bara filtrerar insignalen men också referens- signalen. Denna lösning har den fördelaktiga effekten att en mera tillförlitlig utväljning av referenssignalen er- hålls, insignal jämförs med en filtrerad referenssignal. Denna eftersom beräkningen blir mera exakt om en filtrerad lösning kräver dessutom inte några adaptiva algoritmer och Än? 'Finne Åhman \r1-1'nv'_| rnvhc- “vc LJJUi-.J ...iiyvn jdcvn* tar momentant och den saknar stabilitetsproblem. Det auto- 10 , v 2000~ 10406 \\CURRENT\DB\PUBLIC\D§P§BïIBSSÄOC IIVO: i -1) 9 (Ü matiska talsvarsorganet kräver emellertid kontinuerlig kännedom om de störda frekvenserna.
I alternativa utföringsformer av den andra utförings- formen tillhandahålls mera sofistikerade vikter, genom an- vändning av realvärdes-Aí, som tillåter olika nivåer hos undertryckningen beroende på hur mycket de specifika fre- kvenserna fi är störda.

Claims (8)

10 ß 20 25 30 35 2000-10- 06 \\CURRENT\DB\PU'BLIC\DOC\P\I874l3Sš-nyêrkraV .dOC V0 521 4@5 W NYA KRAV PATENTKRAV
1. En mobiletelefon med ett taligenkänningssystem innehållande en beräkningsenhet för spektralavstànd, inne- fattande organ för jämförelse av ett inkommande spektrum fràn en insignal i närvaro av en brussignal mot en uppsättning förlagrade referensspektrum, kännetecknad av minnesorgan för förlagring av ett brusspektrum fràn brussignalen, organ för maskning av det spektrala avståndet mellan det inkommande spektrumet och referensspektrumet med hänsyn till det förlagrade brusspektrumet, organ för att välja ut ett referensspektrum fràn uppsättningen av förlagrade referensspektrum, som minimerar ett komplett spektralavstànd mellan det inkommande spektrumet och referensspektrumet, varvid det valda referensspektrumet motsvarar ett röstkommando för att styra telefonen.
2. Mobiltelefon enligt krav 1, kännetecknad av organ för att tilldela spektralavstàndet mellan det inkommande spektrumet och referensspektrumet ett nollvärde för varje frekvens hos det inkommande spektrumet, som innehåller brus.
3. Mobiltelefon enligt krav l eller 2, kännetecknad av att bruset har en nivå lägre än det inkommande spektrumet.
4. Mobiltelefon enligt krav 4, kännetecknad av att det kompletta spektralavstàndet är summan av de spektrala avstàndsberäkningarna för antalet sampel, som urskiljer referensspektrumen från varandra.
5. Mobiltelefon enligt något av föregående krav, kännetecknad av samtalssvarsorgan operativt förbundet med 10 15 2000-10- 06 \\CURRENT\DB\PU'BLIC\DOC\P\18Hllåslnya-krav fdoc V0 521 4165 »l taligenkänningssystemet, varvid svarsorganet reagerar pà talsvarskommandon.
6. Mobiltelefon enligt krav 5, kännetecknad av att svarsorganet reagerar pà ett kommando för att acceptera ett samtal.
7. Mobiltelefon enligt krav 5 eller 5, kännetecknad av att svarsorganet reagerar pà ett kommando för att avvisa ett samtal.
8. Mobiltelefon enligt nàgot av kraven 5-7, känne- tecknad av att svarsorganet reagerar pá ett kommando för vidarekoppling av ett samtal.
SE9902103A 1999-06-07 1999-06-07 Mobiltelefon med taligenkänningssystem innehållande en beräkningsenhet för spektralavstånd. SE521465C2 (sv)

Priority Applications (13)

Application Number Priority Date Filing Date Title
SE9902103A SE521465C2 (sv) 1999-06-07 1999-06-07 Mobiltelefon med taligenkänningssystem innehållande en beräkningsenhet för spektralavstånd.
BR0011379-4A BR0011379A (pt) 1999-06-07 2000-05-31 Calculador de distância espectral, sistema de reconhecimento de voz incluindo um calculador de distância espectral, e, telefone móvel incluindo um sistema de reconhecimento de voz
CNB008086079A CN1174375C (zh) 1999-06-07 2000-05-31 加权频谱距离计算器
JP2001502112A JP2003501701A (ja) 1999-06-07 2000-05-31 重み付けされたスペクトル距離の計算機
KR1020017015420A KR20020010684A (ko) 1999-06-07 2000-05-31 가중된 스펙트럼 거리 계산기
EP00939227A EP1203367A1 (en) 1999-06-07 2000-05-31 Weighted spectral distance calculator
PCT/SE2000/001124 WO2000075918A1 (en) 1999-06-07 2000-05-31 Weighted spectral distance calculator
PL00352164A PL352164A1 (en) 1999-06-07 2000-05-31 Calculator for the weighted spectral spacing
AU54350/00A AU766857B2 (en) 1999-06-07 2000-05-31 Weighted spectral distance calculator
IL14672100A IL146721A0 (en) 1999-06-07 2000-05-31 Weighted spectral distance calculator
US09/588,629 US6983245B1 (en) 1999-06-07 2000-06-07 Weighted spectral distance calculator
IL146721A IL146721A (en) 1999-06-07 2001-11-25 Weighted radiation distance game
HK02108929.7A HK1047341B (zh) 1999-06-07 2002-12-09 加權頻譜距離計算器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
SE9902103A SE521465C2 (sv) 1999-06-07 1999-06-07 Mobiltelefon med taligenkänningssystem innehållande en beräkningsenhet för spektralavstånd.

Publications (3)

Publication Number Publication Date
SE9902103D0 SE9902103D0 (sv) 1999-06-07
SE9902103L SE9902103L (sv) 2000-12-08
SE521465C2 true SE521465C2 (sv) 2003-11-04

Family

ID=20415932

Family Applications (1)

Application Number Title Priority Date Filing Date
SE9902103A SE521465C2 (sv) 1999-06-07 1999-06-07 Mobiltelefon med taligenkänningssystem innehållande en beräkningsenhet för spektralavstånd.

Country Status (12)

Country Link
US (1) US6983245B1 (sv)
EP (1) EP1203367A1 (sv)
JP (1) JP2003501701A (sv)
KR (1) KR20020010684A (sv)
CN (1) CN1174375C (sv)
AU (1) AU766857B2 (sv)
BR (1) BR0011379A (sv)
HK (1) HK1047341B (sv)
IL (2) IL146721A0 (sv)
PL (1) PL352164A1 (sv)
SE (1) SE521465C2 (sv)
WO (1) WO2000075918A1 (sv)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1327976B1 (en) * 2001-12-21 2004-10-27 Dietmar Dr. Ruwisch Method and system for recognition of speech in a noisy environment
JP2003319092A (ja) * 2002-04-25 2003-11-07 Ntt Docomo Inc 通信端末、サービス提供部、共通設定情報管理部及び通信制御方法
US7697827B2 (en) 2005-10-17 2010-04-13 Konicek Jeffrey C User-friendlier interfaces for a camera
US20070293270A1 (en) * 2006-06-20 2007-12-20 Franco Montebovi Voice acceptance of incoming call without voice recognition
DE102007061383A1 (de) * 2007-12-19 2009-06-25 Robert Bosch Gmbh Verfahren zum Betreiben eines elektrischen Gerätes sowie elektrisches Gerät
CN101419800B (zh) * 2008-11-25 2011-12-14 浙江大学 基于频谱平移的情感说话人识别方法
JP4918732B2 (ja) * 2010-03-05 2012-04-18 日本電気株式会社 光測定装置及び方法
JP7077645B2 (ja) * 2017-08-10 2022-05-31 トヨタ自動車株式会社 音声認識装置
US10171058B1 (en) * 2018-02-02 2019-01-01 Motorola Mobility Llc Electronic device with in-pocket audio transducer adjustment and corresponding methods

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB1514162A (en) 1974-03-25 1978-06-14 Ruggles W Directional enhancement system for quadraphonic decoders
GB2137791B (en) * 1982-11-19 1986-02-26 Secr Defence Noise compensating spectral distance processor
US4897878A (en) * 1985-08-26 1990-01-30 Itt Corporation Noise compensation in speech recognition apparatus
US4918732A (en) * 1986-01-06 1990-04-17 Motorola, Inc. Frame comparison method for word recognition in high noise environments
DE3766124D1 (de) * 1986-02-15 1990-12-20 Smiths Industries Plc Verfahren und vorrichtung zur sprachverarbeitung.
GB8608288D0 (en) * 1986-04-04 1986-05-08 Pa Consulting Services Noise compensation in speech recognition
IL84948A0 (en) * 1987-12-25 1988-06-30 D S P Group Israel Ltd Noise reduction system
JP2745535B2 (ja) * 1988-05-24 1998-04-28 日本電気株式会社 音声認識装置
WO1991011696A1 (en) 1990-02-02 1991-08-08 Motorola, Inc. Method and apparatus for recognizing command words in noisy environments
DE69225084T2 (de) * 1991-03-06 1998-11-12 Nokia Mobile Phones Uk Tragbares Telefon
JPH0548702A (ja) * 1991-08-19 1993-02-26 Clarion Co Ltd 音声着呼機能付音声ダイヤル装置
JP2509789B2 (ja) 1992-08-22 1996-06-26 三星電子株式会社 可聴周波数帯域分割を利用した音響信号歪み補正装置
US5319713A (en) 1992-11-12 1994-06-07 Rocktron Corporation Multi dimensional sound circuit
ES2137355T3 (es) * 1993-02-12 1999-12-16 British Telecomm Reduccion de ruido.
FI102799B1 (sv) 1993-06-15 1999-02-15 Nokia Technology Gmbh Förbättrad Dolby Prologic -avkodare
US5590242A (en) * 1994-03-24 1996-12-31 Lucent Technologies Inc. Signal bias removal for robust telephone speech recognition
JP3180655B2 (ja) * 1995-06-19 2001-06-25 日本電信電話株式会社 パターンマッチングによる単語音声認識方法及びその方法を実施する装置
JPH10177393A (ja) * 1996-12-19 1998-06-30 Toyota Motor Corp 音声認識装置
US5953700A (en) * 1997-06-11 1999-09-14 International Business Machines Corporation Portable acoustic interface for remote access to automatic speech/speaker recognition server
US6032116A (en) * 1997-06-27 2000-02-29 Advanced Micro Devices, Inc. Distance measure in a speech recognition system for speech recognition using frequency shifting factors to compensate for input signal frequency shifts
US6097943A (en) * 1997-07-02 2000-08-01 Telefonaktiebolaget L M Ericsson Application bound parameter storage
EP1021868B1 (en) * 1997-09-19 2005-12-28 Richard J. Helferich Paging transceivers and method for selectively erasing information and retrieving messages
US5970446A (en) * 1997-11-25 1999-10-19 At&T Corp Selective noise/channel/coding models and recognizers for automatic speech recognition
FI981127A (sv) * 1998-05-20 1999-11-21 Nokia Mobile Phones Ltd Förfarande och anordning för ljudstyrning
GB9822930D0 (en) * 1998-10-20 1998-12-16 Canon Kk Speech processing apparatus and method

Also Published As

Publication number Publication date
PL352164A1 (en) 2003-07-28
US6983245B1 (en) 2006-01-03
AU5435000A (en) 2000-12-28
HK1047341B (zh) 2005-06-10
IL146721A0 (en) 2002-07-25
CN1174375C (zh) 2004-11-03
EP1203367A1 (en) 2002-05-08
SE9902103L (sv) 2000-12-08
IL146721A (en) 2006-10-31
CN1354871A (zh) 2002-06-19
WO2000075918A1 (en) 2000-12-14
JP2003501701A (ja) 2003-01-14
KR20020010684A (ko) 2002-02-04
HK1047341A1 (en) 2003-02-14
AU766857B2 (en) 2003-10-23
BR0011379A (pt) 2002-03-05
SE9902103D0 (sv) 1999-06-07

Similar Documents

Publication Publication Date Title
CN107644642B (zh) 语义识别方法、装置、存储介质及电子设备
CA2278444C (en) Method and apparatus for locating a desired record in a telephone directory
US5960393A (en) User selectable multiple threshold criteria for voice recognition
EP1670221B1 (en) Receiver position optimizing device for mobile communication terminal and method thereof
US8244653B2 (en) Profile configuration for a mobile computing device
EP0605549A1 (en) Handsfree telephone apparatus
SE521465C2 (sv) Mobiltelefon med taligenkänningssystem innehållande en beräkningsenhet för spektralavstånd.
CN107608853A (zh) 终端使用时间的控制方法、装置、存储介质及智能终端
SE0003366D0 (sv) Metod och system för att hantera bärbar telefon med röstigenkänning
US20040138877A1 (en) Speech input apparatus and method
CN107135316A (zh) 一种通话音量的调节方法、装置、存储介质及终端
GB2327321A (en) Portable telephone with automatic call response or hold
GB2457986A (en) Acoustic echo cancellation
EP1517522A2 (en) Mobile terminal and method for providing a user-interface using a voice signal
JP2559031B2 (ja) 音声認識方式
JPH0613940A (ja) エコーキャンセラ
Hänsler Acoustic echo and noise control: where do we come from—where do we go?
CN117221764B (zh) 无线终端对讲系统及智能对讲方法
US5255316A (en) Hands-free telephone apparatus
KR100491753B1 (ko) 음성처리보드의 음성신호 검출 방법
JP2962133B2 (ja) ダイヤル検出装置
JP2962210B2 (ja) ダイヤル検出装置
JP2970421B2 (ja) ダイヤル検出装置
KR100228662B1 (ko) 적응적 무선호출기능을 구비한 자동응답전화기
CN113488076A (zh) 音频信号处理方法及装置

Legal Events

Date Code Title Description
NUG Patent has lapsed