SK31896A3 - Voice activity detector - Google Patents

Voice activity detector Download PDF

Info

Publication number
SK31896A3
SK31896A3 SK318-96A SK31896A SK31896A3 SK 31896 A3 SK31896 A3 SK 31896A3 SK 31896 A SK31896 A SK 31896A SK 31896 A3 SK31896 A3 SK 31896A3
Authority
SK
Slovakia
Prior art keywords
input signal
signal
gain
detector
voice
Prior art date
Application number
SK318-96A
Other languages
English (en)
Other versions
SK281796B6 (sk
Inventor
Paul Alexander Barrett
Original Assignee
British Telecomm
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=27235491&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=SK31896(A3) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Priority claimed from GB939324967A external-priority patent/GB9324967D0/en
Priority claimed from GB9412451A external-priority patent/GB9412451D0/en
Application filed by British Telecomm filed Critical British Telecomm
Publication of SK31896A3 publication Critical patent/SK31896A3/sk
Publication of SK281796B6 publication Critical patent/SK281796B6/sk

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q1/00Details of selecting apparatus or arrangements
    • H04Q1/18Electrical details
    • H04Q1/30Signalling arrangements; Manipulation of signalling currents
    • H04Q1/44Signalling arrangements; Manipulation of signalling currents using alternate current
    • H04Q1/444Signalling arrangements; Manipulation of signalling currents using alternate current with voice-band signalling frequencies
    • H04Q1/46Signalling arrangements; Manipulation of signalling currents using alternate current with voice-band signalling frequencies comprising means for distinguishing between a signalling current of predetermined frequency and a complex current containing that frequency, e.g. speech current
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L25/84Detection of presence or absence of voice signals for discriminating voice from noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L2025/783Detection of presence or absence of voice signals based on threshold decision
    • G10L2025/786Adaptive threshold
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M19/00Current supply arrangements for telephone systems
    • H04M19/08Current supply arrangements for telephone systems with current supply sources at the substations

Landscapes

  • Engineering & Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Geophysics And Detection Of Objects (AREA)
  • Measuring Pulse, Heart Rate, Blood Pressure Or Blood Flow (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Telephone Function (AREA)
  • Investigating Or Analyzing Materials By The Use Of Electric Means (AREA)
  • Control Of Amplification And Gain Control (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Radio Relay Systems (AREA)
  • Investigating Or Analysing Materials By The Use Of Chemical Reactions (AREA)
  • Electromechanical Clocks (AREA)
  • Cosmetics (AREA)
  • Digital Transmission Methods That Use Modulated Carrier Waves (AREA)
  • Measuring Fluid Pressure (AREA)
  • Burglar Alarm Systems (AREA)
  • Circuit For Audible Band Transducer (AREA)

Description

Vynález sa týka detektora hlasu na zisťovanie prítomnosti reči vo vstupnom signáli.
Doterajší stav techniky
Detektor hlasu je zariadenie, do ktorého je privádzaný vstupný signál s cieľom stanoviť úseky tohoto signálu obsahujúce reč alebo úseky obsahujúce iba šum. Jedným obzvlášť významným použitím takýchto detektorov hlasu, na ktoré však tento vynález nie je obmedzený, sú mobilné rádiové telefonické systémy, kde údaje o prítomnosti či neprítomností reči v signáli môžu byt využívané na zníženie spotreby energie a na zníženie interferencie spôsobenej vypínaním telefónu v úsekoch ticha. U týchto mobilných systémov je v dôsledku umiestnenia jednotiek vo vozidlách obvykle vysoká úroveň šumu. Ďalšou možnosťou je ich použitie u rádiových systémov na zlepšenie využitia rádiového spektra.
Na obr. 1 je zobrazený známy detektor hlasu tak, ako je opísaný v PCT patentovej prihláške č. W089/08910.
Na jeho vstupe 1 sú prijímané signály. Pamäť 2 potom obsahuje údaje definujúce predpoklad alebo model frekvenčného spektra šumu. Tieto údaje sú následne porovnávané 2 so spektrom prichádzajúceho signálu a získa sa miera ich podobnosti, ktorá sa ďalej porovnáva 4 s prahovou hodnotou. Na sledovanie zmien v šumovej zložke je model šumu aktualizovaný zo vstupu a to iba v dobe neprítomnosti reči vo vstupnom signáli. Taktiež uvedená prahová hodnota môže byť upravovaná (adaptérom 6).
S cieíom zaručiť, že k úpravám modelu šumu dôjde len v obdobiach, keď vstupný signál obsahuje iba šum, bez nebezpečia postupnej nesprávnej aktualizácie, ktorá by nasledovala po zlom rozhodnutí, je jeho úprava uskutočňovaná riadením pomocným detektorom 7, ktorý zahrňuje detektor nehlasových zvukov 8 a detektor hlasových zvukov 9. Pomocný detektor 7 považuje reč za prítomnú vo vstupnom signáli, ak oba detektory 8 a 9. zistia zvuk. Po tomto zistení je následne umožnená aktualizácia šumového modelu i úprava prahovej hodnoty hlavného detektora. Detektor nehlasových zvukov 8 získava sadu LPC koeficientov signálu a porovnáva autokorelačnú funkciu týchto koeficientov medzi po sebe nasledujúcimi snímkami, zatial čo detektor hlasových zvukov 9 skúma zmeny autokorelácie LPC zvyškového signálu.
Toto usporiadanie je velmi úspešné pre rozlišovanie úsekov reči a úsekov, v ktorých je prijímaný iba šum. Problém je však v tom, že pomocný detektor 7 považuje za bežný šum i signálne tóny (t.j. pomocný detektor 7 v nich nerozpozná reč) tak, že hlavný detektor aktualizuje model šumu podía týchto tónov, ako keby boli šumom, a ďalej v tom, že dôjde k zabráneniu prenosu signálnych tónov, alebo aspoň k predčasnému prerušeniu ich prenosu.
Tento problém by bolo možné prekonať pridaním tónových detektorov, pričom každý by bol naladený na frekvenciu kono krétneho signálneho tónu. Rozmanitosť jednotlivých signálnych tónov vo svete je však značná, takže by bolo potrebné veíké množstvo jednotlivých detektorov, aby napríklad užívate! mobilného telefónu uskutočňujúci medzinárodný hovor mohol počuť obsadzovací tón nezávisle od krajiny, v ktorej vznikol.
Podstata vynálezu
Detektor hlasu na zisťovanie prítomnosti reči vo vstupnom signáli zahrňuje:
a) prostriedky na uchovanie modelu šumovej zložky vstupného signálu;
b) prostriedky zisťujúce spektrálnu podobnosť vstupného signálu s uloženým modelom šumu na vytváranie výstupného rozhodovacieho signálu;
c) prostriedky na aktualizáciu uloženého modelu šumu;
d) pomocný detektor usporiadaný na ovládanie aktualizačných prostriedkov tak, aby k aktualizácii došlo iba v dobe, keď pomocný detektor udáva, že vstupný signál neobsahuje reč.
Podstata riešenia podlá tohoto vynálezu potom spočíva v tom, že detektor hlasu zahrňuje prostriedky na výpočet parametra predurčeného zisku vstupného signálu a dalej modifikačné prostriedky usporiadané na znemožnenie aktualizácie uloženého modelu šumu v prípade, že predurčený zisk prekročí prahovú hodnotu.
Prehľad obrázkov na výkresoch
Následne budú opísané niektoré uskutočnenia tohoto vynálezu s odkazom na priložené výkresy, kde:
obr. 1 zobrazuje blokovú schému známeho detektora hlasu podlá PCT prihlášky vynálezu Č.W089/08910;
obr. 2 predstavuje blokovú schéma zvukového kodéru s detektorom hlasu podlá tohoto vynálezu;
obr. 3 a obr. 4 ukazujú graficky hodnoty predurčeného zisku u rôznych vstupných signálov;
obr. 5, obr. 6 a obr. 7 predstavujú blokové schémy ďalších uskutočnení tohoto vynálezu.
Príklady uskutočnenia vynálezu
Bežný zvukový kodér 100 na obr. 2 má zvukový vstup 101. Zvukový signál je tu vzorkovaný pri 8 kHz a prevádzaný do digitálnej formy analógovo-digitálnym prevodníkom 102. Jednotka 103 rozdeluje zvukové vzorky do snímok s (napríklad) 160 vzorkami (t.j. do 20ms vzoriek) a znásobuje ich funkciou, ktorá znižuje podiel vzoriek na začiatku a na konci snímky. Korelátor 104 prijíma digitalizované zvukové vzorky a vytvára pre každú snímku autokorelačné koeficienty R^. Jednotka LPC analýzy 105 vypočítava s použitím známej metódy, napr.
i \
Levinson-Durbinovým alebo Schurrovým algoritmom, koeficienty a^ filtra (niekedy označovaného ako syntézny filter), majúceho frekvenčnú charakteristiku, ktorá zodpovedá frekvenčnému spektru vstupného zvukového signálu.
Digitalizovaný vstupný signál prechádza taktiež inverzným filtrom (alebo analýzovým filtrom) 106, ovládaným koeficientmi, na vytvorenie zvyškového signálu, ktorý je dalej analyzovaný jednotkou 107 dlhodobej predpovede, ktorá vypočítava optimálne oneskorenie ňa predurčenie LPC zvyškového signálu z jeho predchádzajúcich hodnôt a zodpovedajúcu hodnotu zisku na predurčenie. Analýzová jednotka 106 vytvára tiež druhý zvyškový signál (t.j. rozdiel medzi súčasným LPC zvyškovým signálom a LPC zvyškovým signálom po oneskorenie a vyváženie získanými parametrami). Budiaca jednotka 108 získava parametre pre prenos do dekodéra zo zvyškového signálu dlhodobého predurčenia (LTP), alebo inými známymi prostriedkami.
LPC koeficienty air oneskorenie d, zisk g a budiace parametre e sú prenášané do dekodéra.
Hlavný detektor hlasu podlá skôr zmienenej patentovej prihlášky zisťuje priemer autokorelačných koeficientov Rj_ pomocou nivelizačného zariadenia 110, ktoré vytvára vážený súčet R^ súčasných koeficientov a koeficientov z predchádzajúcich snímok, uložených v pamäti 111. Ďalší autokorelátor 112 vytvára autokorelačné koeficienty B£ týchto LPC koeficientov a^, ktoré prechádzajú do pamäte 113. Obsah pamäte je aktualizovaný iba v priebehu úsekov vstupného signálu, o ktorých pomocný detektor, ktorý bude opísaný nižšie, predpokladá, že obsahujú iba šum. Obsah pamäte 113 potom predstavuje odhad šumového spektra vstupného signálu. Násobná/súčtová jednotka 114 potom vytvára mieru M spektrálnej podobnosti medzi vstupným signálom a šumovým modelom, ktorá je definovaná ako n R'i B'i
M = Β'θ + 2 Σ Nulový spodný index značí počiatočný autokorelačný koeficient a n je počet vzoriek vo zvukovej snímke.
Miera M spektrálnej podobnosti sa potom v komparátore 115 porovnáva s prahovou hodnotou a na výstupe 116 sa vytvára signál indikujúci prítomnosť alebo neprítomnosť reči vo vstupnom signáli. Prahová hodnota môže byť prispôsobiteíne nastavená (117) podía aktuálnej úrovne šumu.
Aktualizácia modelu šumu uloženého v pamäti 113 nie je ovládaná výstupom 116 práve opísaného detektora, lebo chyba v rozpoznaní reči by mala za následok aktualizáciu pamäte informácií o reči a následné ďalšie chyby v rozpoznávaní. Z tohoto dôvodu je aktualizácia riadená pomocným detektorom 200. Aby bolo možné odlíšiť šum a nehlasový zvuk je vytváraný (201) súčet (nespriemerovaných) autokorelačných koeficientov B.£ LPC koeficientov. Odčítač 202 porovnáva tento súčet so zodpovedajúcim súčtom u predchádzajúcej zvukovej snímky uloženej v pamäti 203. Tento rozdiel, predstavujúci spektrálnu podobnosť medzi po sebe nasledujúcimi snímkami vstupného signálu, je pre vytvorenie rozhodovacieho signálu porovnaný s prahovou hodnotou (204).
Na rozpoznanie hlasového zvuku s jednotkou 205 analýzy výšok meria oneskorenie d. Výstup tejto jednotky je v súčtovom hradle 206 zlúčený s výstupom prahujúceho stupňa 204. Pomocný detektor 200 indikuje prítomnosť hlasu vo vstupnom signáli, ak každá z jednotiek 204 a 205 vytvára výstupný signál indikujúci prítomnosť hlasu. Ako bolo diskutované už v úvode, ak má systém prepúšťať signálne tóny, musia tieto rozpoznávať skôr ako reč než ako šum. Práve opísaný pomocný detektor však nie je na dosiahnutie tohoto cieľa príliš efektívny. Hoci rozpoznáva určité signálne tóny, iné (všeobecne tie, ktoré majú relatívne chudobný spektrálny obsah) nie sú rozpoznané. Keď dôjde k chybe pomocného detektora 200, dôjde taktiež k chybe hlavného detektora, lebo model šumu v pamäti 113 je potom adaptovaný podľa signálneho tónu.
Na zisťovanie signálnych tónov vo vstupnom signáli je preto vytvorený ďalší pomocný detektor. Výhodne je využívané zistenie, že signálne tóny, ktoré sú umelo generované, obsahujú malý počet kmitočtových zložiek (ktoré môžu byt modulované) . Pre takéto signály je použitím rozlíšenia medzi tónovo založenými signálmi (včítane viactónových signálov) a pozadím alebo šumovými signálmi okolia výkon LPC predurčovača obzvlášť vysoký.
LPC predurčený zisk Gp je definovaný ako pomer výkonu vstupného signálu a výkonu výstupného signálu u hlasovej snímky n-1
Σ x2(i) i=0 n-1
Σ y2(i) i=0 kde Xi je vstup filtra a je výstup inverzného filtra:
m y(t) = x(t) + Σ y(t - i) a± i=l kde m je počet koeficientov filtra, ktorý býva obvykle 8 alebo 10. Signály x(i) a y(i) sa získavajú z LPC kodéra 100, na výstupoch prevodníka 102 resp. filtra 106. Tieto hodnoty sú umocnené (301, 302) a predurčený zisk sa stanoví v aritmetickej jednotke 303, ktorá vypočítava Gp podlá hore uvedenej rovnice.. Výstup tejto jednotky 303 je v komparátore 304 porovnaný s pevnou prahovou hodnotou T. Ak predurčený zisk presahuje túto prahovú hodnotu (obvykle T = 63 dB alebo T = 18 dB), je tón pokladaný za rozpoznaný. Existuje niekoľko možných reakcií na rozpoznanie tónu:
a) nahradil, výstup hlavného detektora prostriedkami súčtového hradia 303;
b) nahradil pomocný detektor prostriedkami tretieho vstupu do súčtového hradia 206;
c) obe predchádzajúce možnosti.
Samozrejme namiesto výpočtu podielu môže byl výraz Σχ2 porovnávaný s výrazom Σy2, vynásobeným prahovou hodnotou. Na obr. 3 sú zobrazené histogramy predurčených ziskov v dB, ktoré boli získané zo šumu pozadia, z reči, zo šumu pozadia v signálnych tónoch a zo samotných signálnych tónov. Na obr. 4 sú potom zobrazené diagramy predurčeného zisku v závislosti na čase u rôznych signálnych tónov používaných vo Velkej Británii, konkrétne u:
obsadzovacieho tónu, oznamovacieho tónu, vyzváňacieho tónu, tónu volané číslo neexistuje, a tónu zariadenie obsadené.
V praxi sú obsadzovací tón, oznamovací tón a tón volané číslo neexistuje úspešne rozpoznávané ďalším detektorom, rovnako ako multifrekvenčné tóny. Vyzváňací tón a tón zariadenie obsadené sú rozpoznávané jednotkou 205 analýzy výšok.
Ďalší detektor 300 je možné považovať za detektor určitých druhov tónov, alternatívne (u uskutočnenia z obr. 2) môže byť považovaný za detektor situácie, keď zvyškový signál y^ je taký malý, že funkcia jednotky 107 dlhodobého predurčenia (a tým jednotky 205 analýzy výšok) nie je silná.
Alternatívnou možnosťou zisťovania hlasového zvuku je nahradiť detektor výšok 205 jednotkami analogickými k jednotkám 301, 302, 303 a 304 a založiť vytváranie predurčeného zisku na analýze dlhodobého predurčenia 107.
Ďalej budú s odkazom na obr. 5 opísané dve modifikácie zariadenia z obr. 2. Vypočítavaný zisk je u uskutočnenia z obr. 2 ziskom LPC analýzy zvukového kodéra 100, ktorá by mohla obvykle používať predurčovač ôsmeho alebo desiateho rádu. Vo vedomí toho, že základom tejto časti analýzy je, že informačné tóny rezultujú vo väčších predurčených ziskoch než šum prostredia a že čím vyšší je rád analýzy, tým vyššia je schopnosť predurčovača modelovať šum prostredia, bolo zistené, že obmedzením výpočtu zisku na analýzu štvrtého rádu dávajú informačné signály, pozostávajúce z jedného alebo dvoch tónov, vysoký predurčený zisk, zatiai čo predurčený zisk u šumu prostredia môže byť znížený.
Principiálne by toto bolo možné dosiahnuť použitím analýzy štvrtého rádu a použitím filtra vedia jednotiek 105, 106 pre zásobovanie pomocného detektora signálom, avšak ľahšie je vypočítať predurčený zisk z reflexných koeficientov (niekedy uvádzaných ako Parcor koeficienty). Na obr. 5 sú tieto reflexné koeficienty vypočítavané známym spôsobom z autokorelačných koeficientov jednotkou 400 (hoci v závislosti na uskutočnení zvukového kodéra by mohlo byt možné snímať ich z medziiahlého bodu jednotky 105 LPC analýzy). Mieru predur9 čeného zisku, chybu predurčenia Pe, možno získal: výpočtom z prvých štyroch reflexných koeficientov Rc^ podía vzorca:
pe = H (i_rcí2)
1=1
Tento výpočet sa uskutočňuje v jednotke 401. Velká chyba predurčenia Pe zodpovedá nízkemu predurčenému zisku a naopak. Signálny tón sa preto považuje za prítomný vo vstupnom signáli, ak hodnota Pe je menšia než prahová hodnota Pth. Toto porovnanie 403 nahradilo porovnávanie 304 z obr. 2.
Šum okolitého prostredia mobilného telefónu obsahuje velmi silné rezonancie na nízkych frekvenciách. Na zistenie, či je tón pod prahovou frekvenciou, sa uskutočňuje ďalší test. Volba prahovej hodnoty v sebe zahrňuje určitý stupeň kompromisu, avšak doporučovaná je hodnota 385 Hz, lebo väčšina signálnych tónov leží pod 400 Hz.
Tento ďalší test pracuje tak, že sú stanovené pólové frekvencie LPC filtra. Na zmenšenie komplexnosti analýzy je výhodný filter nízkeho rádu. Následne by mohla byt uskutočnená ďalšia LPC analýza, ale jednoduchšie je pokŕačovat, ako u uskutočnenia na obr. 5, výpočtom LPC koeficientov z reflexných koeficientov. Za predpokladu, že sa použijú iba prvé dva reflexné koeficienty z jednotky 400, sú LPC koeficienty a^ vypočítané bežným spôsobom jednotkou 404, ktorá je definovaná tak, aby citlivosť syntézneho filtra bola:
H(z) = 1/ (aQ + a-L z“1 + a2 z-2)
Potom sú polohy pólov v rovine z dané riešením kvadratickej rovnice a0 z2 + ai z + a2 = 0 ao = 1
Ak výraz pod druhou odmocninou je záporný, potom póly ležia na reálnej osi a vstupný signál nie je signálnym tónom. Ak je tento výraz kladný, ale reálna časť polohy pólu je záporná (t.j. a-L < 0), potom je pól v ľavej polovici roviny z. To nevyhnutne znamená, že frekvencia je viac než 25% hodnoty vzorkovacej frekvencie, t.j. viac než 2 000 Hz pre vzorkovaciu frekvenciu fg = 8 kHz. V takomto prípade je výpočet zbytočný a signál 385 môže byť ihneď generovaný.
Pólová frekvencia je daná rovnicou:
r f = arctan’ 4 a-, - a
2tt
Podmienku, že f < 385 Hz možno zapísať (vylúčením druhých odmocnín) ako:
f 2π x 385 (4a2 - a-j_2) / a·,2 < tan2 « alebo ako:
(4a2 - a3 2) / aj_2 < 0,0973 pri fs = 8kHz
Tento výpočet sa uskutočňuje v jednotke 405. Jej výstup je zlúčený v AND hradle 406 s výstupom komparátora 403, takže rozhodnutie o tom, že sa jedná o signálny tón vznikne iba, keď predurčený zisk je veľký a zároveň keď je pólová frekvencia väčšia než 385 Hz.
Ak je to požadované, môže byt pólová frekvencia vyššia než 2 000 Hz (alebo vyššia než nejaký iný horný limit) tiež odlúčená, aby vysoké frekvencie nad predpokladaným rozsahom signálnych tónov nemohli byt rozpoznané ako signálne tóny.
Ak sa pri riešení kvadratickej rovnice použije zvláštny výpočet, je možné použiť tiež tretí a štvrtý reflexný koeficient. V tomto prípade by mohli byť zistené dva združené komplexné páry pólov s dvoma frekvenciami. Je zrejmé, že v takomto prípade by signálny tón nebol pokladaný za prítomný vo vstupnom signáli, keby obe frekvencie boli pod prahovou hodnotou.
Bolo už uvedené, že uskutočnenia vynálezu z obr. 2 a obr. 5 používajú pred autokorelačným výpočtom 103 rozdelenie zvukových vzoriek do snímok (ako je bežné u LPC analýzy založenej na autokorelácii). Ak sa u hlasového kodéra nepožaduje uskutočňovať túto činnosť, je možnou alternatívou prípadu z obr. 5 vypustiť jednotku 103 a nahradiť výpočet reflexného koeficienta 400 konverziou autokorelačných hodnôt na kovariantné hodnoty, jednotky 401. 404 modifikovať na využitie týchto kovariantných hodnôt oproti využitiu reflexných koeficientov. Alternatívne, ako ukazuje obr. 6 (kde sú zobrazené iba tie časti, ktoré boli oproti obr. 5 zmenené), môže byt počiatočné spracovanie uskutočnené prostriedkami kovariantnej analýzy 109. ktorých výstup je privádzaný do kalkulátora 400 reflexného koeficienta a do jednotky 104 modifikácie autokorelačného koeficienta. Jednotka 105 LPC analýzy môže byt spojená, ako predtým, s autokorelačnou jednotkou 104, alebo, ako je zobrazené, priamo s jednotkou 109 kovariantnej analýzy.
Vyššie opísané uskutočnenia na detekciu signálnych tónov majú dobré výsledky, avšak môžu zlyhať u mechanicky generovaných tónov, ktoré sa používajú v určitých teritóriách. Tieto mechanicky generované tóny majú vyššiu harmonickú zložku rezultujúcu v malom predurčenom zisku. Prosté odfiltrovanie vyšších harmonických nie je riešením, lebo vloženie filtra vedie ku zvýšeniu autokorelácie všetkých signálov a tým k väčším predurčeným ziskom taktiež u ostatných signálov. Bolo zistené, že predurčovač má snahu skôr upravovať póly filtra než charakteristiky vstupného signálu. Jednako však bolo tiež zistené, že dobré výsledky je možné získať filtráciou, ak analýza predurčeného zisku je obmedzená na stanovenie predurčenia signálu len vo frekvenčnom rozsahu zodpovedajúcom pásmu priepustnosti harmonického filtra. Toto sa dosiahne vzorkovaním signálu frekvenciou dvojnásobnou oproti šírke pásma filtra pred analýzou predurčeného zisku.
Uskutočnenie vynálezu zobrazené na obr. 7, ktoré je v iných ohľadoch podobné uskutočneniu z obr. 5, preto používa filter 450. ktorým je nízkopriepustný FIR filter, majúci pásmo priepustnosti do 600 (3 dB) a majúci zoslabenie potlačovaného pásma 20 dB pri 1 200 Hz. Výhodné je, keď zoslabenie potlačovaného pásma nie je príliš veľké. Výstup filtra 450 je vzorkovaný pri 1200 Hz vo vzorkovacej jednotke 451.
U tohto filtrovania sú velmi redukované možnosti tónovej detekcie zdieľať komponenty s hlasovým kodérom 100; do filtra 450 je teda digitalizovaný vstupný signál privádzaný priamo z analógovo-digitálneho prevodníka 102 a jeho výstup smeruje do jednotky 400 analýzy reflexných koeficientov alebo do jednotky kovariantnej alebo autokorelačnej analýzy tak, ako bolo opísané predtým.
Ďalšie uskutočnenie vynálezu zmierňuje problém harmonických zložiek bez nadmerného obmedzovania frekvenčného pásma analýzy predurčovaného zisku. Toto sa dosiahne použitím filtrov rozdeľujúcich vstupný signál na dve alebo viac frekvenčných pásiem, kde každé toto pásmo je dostatočne úzke na to, aby nemohlo obsahovať základnú a tretiu harmonickú zložku signálneho tónu. Každý kanál je potom vzorkovaný a podrobený oddelenej analýze predurčeného zisku.
V uskutočnení podía obr. 8 je signál filtrami 450a a 450b rozdelený na dve frekvenčné pásma 400 až 1 200 Hz a 1 200 až 2 000 Hz a vzorkovaný pri 1,6 kHz (451a. 451b). Výpočet reflexného koeficientu 400a a 400b. analýza chyby predurčenia 401a, 401b a prahovanie 403a, 403b šú uskutočňované oddelene pre obe pásma. Dva výstupy z komparátorov 403a a 403b sú vedené na oddelené vstupy súčtového hradia 206 tak, aby vysoký predurčený zisk v oboch kanáloch bol pokladaný za indikáciu prítomnosti signálneho tónu. Ostatné prvky íoo až 303 z obr. 7 nie sú na obr. 8 zobrazené, lebo sú u oboch uskutočnení rovnaké.

Claims (7)

1. Detektor hlasu na zisťovanie prítomnosti reči vo vstupnom signáli zahrňujúci:
a) prostriedky na uchovanie modelu šumovej zložky vstupného signálu;
b) prostriedky zisťujúce spektrálnu podobnosť vstupného signálu s uloženým modelom šumu na vytváranie výstupného rozhodovacieho signálu;
c) prostriedky na aktualizáciu uloženého modelu šumu;
d) pomocný detektor usporiadaný na riadenie aktualizačných prostriedkov tak, aby k aktualizácii došlo iba v dobe, ked pomocný detektor udáva, že vstupný signál neobsahuje reč;
vyznačujúci sa tým, že zahrňuje prostriedky na výpočet parametra predurčeného zisku vstupného signálu a modifikačné prostriedky usporiadané na znemožnenie aktualizácie v prípade, že predurčený zisk prekročí prahovú hodnotu;
2. Detektor hlasu podľa nároku 1, vyznačujúci sa tým, že pomocný detektor zahrňuje detektor hlasových zvukov reagujúci na signály odvodené z LPC zvyškového signálu.
3. Detektor hlasu podľa nároku 1 alebo 2, vyznačujúci sa tým, že parameter zisku predstavuje predurčený zisk LPC predurčenia šiesteho alebo nižšieho rádu.
4. Detektor hlasu podľa nároku 3, vyznačujúci sa tým, že parameter zisku predstavuje predurčený zisk LPC predurčenia štvrtého alebo nižšieho rádu.
5. Detektor hlasu podía ktoréhokoľvek z predchádzajúcich nárokov, vyznačujúci sa tým, že ďalej zahrňuje prostriedky na zisťovanie jednej alebo viac primárnych frekvenčných zložiek vstupného signálu a prostriedky schopné porovnať frekvencie s vopred stanovenou prahovou hodnotou a umožniť potlačenie aktualizácie len v prípade, že uvedená primárna zložka prekračuje prahovú hodnotu.
6. Detektor hlasu podía ktoréhokoľvek z predchádzajúcich nárokov, vyznačujúci sa tým, že pred prostriedkami na výpočet zisku je predradený filter na odstránenie hornej časti frekvenčného rozsahu vstupného signálu, pričom výpočet zisku je uskutočňovaný iba pre frekvenčné zložky ležiace v pásme priepustnosti filtra.
Ί. Detektor hlasu podía nároku 6, vyznačujúci sa tým, že má dva filtre s príslušnými pásmami priepustnosti a príslušné výpočtové prostriedky na výpočet parametrov zisku u príslušných pásiem priepustnosti, modifikačné prostriedky usporiadané na potlačenie aktualizácie v prípade, že predurčený zisk presahuje v oboch pásmach priepustnosti prahovú hodnotu.
8. Detektor hlasu podía nároku 6 alebo 7, vyznačujúci sa tým, že zahrňuje prostriedky na vzorkovanie filtrovaného signálu (signálov).
SK318-96A 1993-09-14 1994-09-14 Detektor hlasu SK281796B6 (sk)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
EP93307211 1993-09-14
GB939324967A GB9324967D0 (en) 1993-12-06 1993-12-06 Voice activity detector
GB9412451A GB9412451D0 (en) 1994-06-21 1994-06-21 Voice activity detector
PCT/GB1994/001999 WO1995008170A1 (en) 1993-09-14 1994-09-14 Voice activity detector

Publications (2)

Publication Number Publication Date
SK31896A3 true SK31896A3 (en) 1997-03-05
SK281796B6 SK281796B6 (sk) 2001-08-06

Family

ID=27235491

Family Applications (1)

Application Number Title Priority Date Filing Date
SK318-96A SK281796B6 (sk) 1993-09-14 1994-09-14 Detektor hlasu

Country Status (23)

Country Link
US (2) US5749067A (sk)
EP (1) EP0719439B1 (sk)
JP (1) JP3224132B2 (sk)
KR (1) KR100363309B1 (sk)
CN (1) CN1064772C (sk)
AT (1) ATE182420T1 (sk)
BR (1) BR9407535A (sk)
CA (1) CA2169745C (sk)
CZ (1) CZ286743B6 (sk)
DE (1) DE69419615T2 (sk)
DK (1) DK0719439T3 (sk)
ES (1) ES2136204T3 (sk)
FI (1) FI118195B (sk)
GR (1) GR3031515T3 (sk)
HK (1) HK1014392A1 (sk)
HU (1) HU219994B (sk)
IN (1) IN184794B (sk)
MY (1) MY111134A (sk)
NO (1) NO307979B1 (sk)
NZ (1) NZ273045A (sk)
SG (1) SG48935A1 (sk)
SK (1) SK281796B6 (sk)
WO (1) WO1995008170A1 (sk)

Families Citing this family (96)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IN184794B (sk) * 1993-09-14 2000-09-30 British Telecomm
JP3522012B2 (ja) * 1995-08-23 2004-04-26 沖電気工業株式会社 コード励振線形予測符号化装置
FI100840B (fi) 1995-12-12 1998-02-27 Nokia Mobile Phones Ltd Kohinanvaimennin ja menetelmä taustakohinan vaimentamiseksi kohinaises ta puheesta sekä matkaviestin
JP4307557B2 (ja) * 1996-07-03 2009-08-05 ブリティッシュ・テレコミュニケーションズ・パブリック・リミテッド・カンパニー 音声活性度検出器
US6708146B1 (en) * 1997-01-03 2004-03-16 Telecommunications Research Laboratories Voiceband signal classifier
JPH10247098A (ja) * 1997-03-04 1998-09-14 Mitsubishi Electric Corp 可変レート音声符号化方法、可変レート音声復号化方法
US6531982B1 (en) 1997-09-30 2003-03-11 Sirf Technology, Inc. Field unit for use in a GPS system
US5970446A (en) 1997-11-25 1999-10-19 At&T Corp Selective noise/channel/coding models and recognizers for automatic speech recognition
US6385548B2 (en) * 1997-12-12 2002-05-07 Motorola, Inc. Apparatus and method for detecting and characterizing signals in a communication system
US6327471B1 (en) 1998-02-19 2001-12-04 Conexant Systems, Inc. Method and an apparatus for positioning system assisted cellular radiotelephone handoff and dropoff
US5991718A (en) * 1998-02-27 1999-11-23 At&T Corp. System and method for noise threshold adaptation for voice activity detection in nonstationary noise environments
US6182035B1 (en) 1998-03-26 2001-01-30 Telefonaktiebolaget Lm Ericsson (Publ) Method and apparatus for detecting voice activity
US6348744B1 (en) 1998-04-14 2002-02-19 Conexant Systems, Inc. Integrated power management module
US6453289B1 (en) 1998-07-24 2002-09-17 Hughes Electronics Corporation Method of noise reduction for speech codecs
US7545854B1 (en) 1998-09-01 2009-06-09 Sirf Technology, Inc. Doppler corrected spread spectrum matched filter
US7711038B1 (en) 1998-09-01 2010-05-04 Sirf Technology, Inc. System and method for despreading in a spread spectrum matched filter
US6693953B2 (en) 1998-09-30 2004-02-17 Skyworks Solutions, Inc. Adaptive wireless communication receiver
US6448925B1 (en) 1999-02-04 2002-09-10 Conexant Systems, Inc. Jamming detection and blanking for GPS receivers
US6606349B1 (en) 1999-02-04 2003-08-12 Sirf Technology, Inc. Spread spectrum receiver performance improvement
US6556967B1 (en) 1999-03-12 2003-04-29 The United States Of America As Represented By The National Security Agency Voice activity detector
US6577271B1 (en) 1999-03-30 2003-06-10 Sirf Technology, Inc Signal detector employing coherent integration
US6304216B1 (en) 1999-03-30 2001-10-16 Conexant Systems, Inc. Signal detector employing correlation analysis of non-uniform and disjoint sample segments
US6618701B2 (en) * 1999-04-19 2003-09-09 Motorola, Inc. Method and system for noise suppression using external voice activity detection
US6381568B1 (en) 1999-05-05 2002-04-30 The United States Of America As Represented By The National Security Agency Method of transmitting speech using discontinuous transmission and comfort noise
US6351486B1 (en) 1999-05-25 2002-02-26 Conexant Systems, Inc. Accelerated selection of a base station in a wireless communication system
JP3929686B2 (ja) * 2000-08-14 2007-06-13 松下電器産業株式会社 音声スイッチング装置およびその方法
US6931055B1 (en) 2000-04-18 2005-08-16 Sirf Technology, Inc. Signal detector employing a doppler phase correction system
US6714158B1 (en) 2000-04-18 2004-03-30 Sirf Technology, Inc. Method and system for data detection in a global positioning system satellite receiver
US6952440B1 (en) 2000-04-18 2005-10-04 Sirf Technology, Inc. Signal detector employing a Doppler phase correction system
US6788655B1 (en) 2000-04-18 2004-09-07 Sirf Technology, Inc. Personal communications device with ratio counter
FR2808391B1 (fr) * 2000-04-28 2002-06-07 France Telecom Systeme de reception pour antenne multicapteur
US7885314B1 (en) 2000-05-02 2011-02-08 Kenneth Scott Walley Cancellation system and method for a wireless positioning system
US6778136B2 (en) * 2001-12-13 2004-08-17 Sirf Technology, Inc. Fast acquisition of GPS signal
JP4201470B2 (ja) * 2000-09-12 2008-12-24 パイオニア株式会社 音声認識システム
JP4201471B2 (ja) * 2000-09-12 2008-12-24 パイオニア株式会社 音声認識システム
US7472059B2 (en) * 2000-12-08 2008-12-30 Qualcomm Incorporated Method and apparatus for robust speech classification
US7437286B2 (en) * 2000-12-27 2008-10-14 Intel Corporation Voice barge-in in telephony speech recognition
US6707869B1 (en) * 2000-12-28 2004-03-16 Nortel Networks Limited Signal-processing apparatus with a filter of flexible window design
DE10121532A1 (de) * 2001-05-03 2002-11-07 Siemens Ag Verfahren und Vorrichtung zur automatischen Differenzierung und/oder Detektion akustischer Signale
JP3859462B2 (ja) * 2001-05-18 2006-12-20 株式会社東芝 予測パラメータ分析装置および予測パラメータ分析方法
KR100399057B1 (ko) * 2001-08-07 2003-09-26 한국전자통신연구원 이동통신 시스템의 음성 활성도 측정 장치 및 그 방법
US20030110029A1 (en) * 2001-12-07 2003-06-12 Masoud Ahmadi Noise detection and cancellation in communications systems
US7689406B2 (en) * 2002-03-08 2010-03-30 Koninklijke Kpn. N.V. Method and system for measuring a system's transmission quality
US7454331B2 (en) 2002-08-30 2008-11-18 Dolby Laboratories Licensing Corporation Controlling loudness of speech in signals that contain speech and other types of audio material
US20040064314A1 (en) * 2002-09-27 2004-04-01 Aubert Nicolas De Saint Methods and apparatus for speech end-point detection
US7146316B2 (en) * 2002-10-17 2006-12-05 Clarity Technologies, Inc. Noise reduction in subbanded speech signals
US7272552B1 (en) * 2002-12-27 2007-09-18 At&T Corp. Voice activity detection and silence suppression in a packet network
US7230955B1 (en) * 2002-12-27 2007-06-12 At & T Corp. System and method for improved use of voice activity detection
JP2004341339A (ja) * 2003-05-16 2004-12-02 Mitsubishi Electric Corp 雑音抑圧装置
KR101164937B1 (ko) * 2003-05-28 2012-07-12 돌비 레버러토리즈 라이쎈싱 코오포레이션 오디오 신호의 인식된 라우드니스를 계산 및 조정하는방법, 장치 및 컴퓨터 프로그램
EP1661916A4 (en) 2003-07-16 2008-10-01 Daikin Ind Ltd PROCESS FOR PREPARING FLUOROUS POLYMER, AQUEOUS DISPERSION OF FLUOROUS POLYMER, 2-ACYLOXYCARBOXYLENE DERIVATIVE AND TENSID
SG119199A1 (en) * 2003-09-30 2006-02-28 Stmicroelectronics Asia Pacfic Voice activity detector
JP4497911B2 (ja) * 2003-12-16 2010-07-07 キヤノン株式会社 信号検出装置および方法、ならびにプログラム
US20050209762A1 (en) * 2004-03-18 2005-09-22 Ford Global Technologies, Llc Method and apparatus for controlling a vehicle using an object detection system and brake-steer
FI20045315A (fi) * 2004-08-30 2006-03-01 Nokia Corp Ääniaktiivisuuden havaitseminen äänisignaalissa
CN101048935B (zh) 2004-10-26 2011-03-23 杜比实验室特许公司 控制音频信号的单位响度或部分单位响度的方法和设备
US8199933B2 (en) 2004-10-26 2012-06-12 Dolby Laboratories Licensing Corporation Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
JP4729927B2 (ja) * 2005-01-11 2011-07-20 ソニー株式会社 音声検出装置、自動撮像装置、および音声検出方法
BRPI0610719B1 (pt) * 2005-04-18 2015-11-24 Basf Ag preparação, processo para a produção da mesma, e, uso de preparações
US7826945B2 (en) * 2005-07-01 2010-11-02 You Zhang Automobile speech-recognition interface
DE102006032967B4 (de) * 2005-07-28 2012-04-19 S. Siedle & Söhne Telefon- und Telegrafenwerke OHG Hausanlage und Verfahren zum Betreiben einer Hausanlage
GB2430129B (en) * 2005-09-08 2007-10-31 Motorola Inc Voice activity detector and method of operation therein
JP4971351B2 (ja) * 2005-12-05 2012-07-11 クゥアルコム・インコーポレイテッド トーンコンポーネントの検出のためのシステム、方法および装置
US8417185B2 (en) * 2005-12-16 2013-04-09 Vocollect, Inc. Wireless headset and method for robust voice data communication
US7885419B2 (en) 2006-02-06 2011-02-08 Vocollect, Inc. Headset terminal with speech functionality
US7773767B2 (en) 2006-02-06 2010-08-10 Vocollect, Inc. Headset terminal with rear stability strap
WO2007091956A2 (en) 2006-02-10 2007-08-16 Telefonaktiebolaget Lm Ericsson (Publ) A voice detector and a method for suppressing sub-bands in a voice detector
US8920343B2 (en) 2006-03-23 2014-12-30 Michael Edward Sabatino Apparatus for acquiring and processing of physiological auditory signals
TWI517562B (zh) 2006-04-04 2016-01-11 杜比實驗室特許公司 用於將多聲道音訊信號之全面感知響度縮放一期望量的方法、裝置及電腦程式
JP5185254B2 (ja) * 2006-04-04 2013-04-17 ドルビー ラボラトリーズ ライセンシング コーポレイション Mdct領域におけるオーディオ信号音量測定と改良
AU2007243586B2 (en) 2006-04-27 2010-12-23 Dolby Laboratories Licensing Corporation Audio gain control using specific-loudness-based auditory event detection
CN101149921B (zh) * 2006-09-21 2011-08-10 展讯通信(上海)有限公司 一种静音检测方法和装置
WO2008051347A2 (en) 2006-10-20 2008-05-02 Dolby Laboratories Licensing Corporation Audio dynamics processing using a reset
US8521314B2 (en) * 2006-11-01 2013-08-27 Dolby Laboratories Licensing Corporation Hierarchical control path with constraints for audio dynamics processing
US20080147389A1 (en) * 2006-12-15 2008-06-19 Motorola, Inc. Method and Apparatus for Robust Speech Activity Detection
WO2008143569A1 (en) * 2007-05-22 2008-11-27 Telefonaktiebolaget Lm Ericsson (Publ) Improved voice activity detector
CN101790758B (zh) * 2007-07-13 2013-01-09 杜比实验室特许公司 用于控制音频信号的信号处理的设备和方法
US20090043577A1 (en) * 2007-08-10 2009-02-12 Ditech Networks, Inc. Signal presence detection using bi-directional communication data
US8190440B2 (en) * 2008-02-29 2012-05-29 Broadcom Corporation Sub-band codec with native voice activity detection
EP2107553B1 (en) * 2008-03-31 2011-05-18 Harman Becker Automotive Systems GmbH Method for determining barge-in
US8611556B2 (en) * 2008-04-25 2013-12-17 Nokia Corporation Calibrating multiple microphones
US8275136B2 (en) * 2008-04-25 2012-09-25 Nokia Corporation Electronic device speech enhancement
US8244528B2 (en) 2008-04-25 2012-08-14 Nokia Corporation Method and apparatus for voice activity determination
CN101572090B (zh) * 2008-04-30 2013-03-20 向为 一种自适应多速率窄带编码方法及编码器
USD605629S1 (en) 2008-09-29 2009-12-08 Vocollect, Inc. Headset
KR101547344B1 (ko) 2008-10-31 2015-08-27 삼성전자 주식회사 음성복원장치 및 그 방법
TWI384423B (zh) * 2008-11-26 2013-02-01 Ind Tech Res Inst 以聲音事件為基礎之緊急通報方法與系統以及行為軌跡建立方法
CN101609678B (zh) * 2008-12-30 2011-07-27 华为技术有限公司 信号压缩方法及其压缩装置
US8160287B2 (en) 2009-05-22 2012-04-17 Vocollect, Inc. Headset with adjustable headband
KR20120091068A (ko) 2009-10-19 2012-08-17 텔레폰악티에볼라겟엘엠에릭슨(펍) 음성 활성 검출을 위한 검출기 및 방법
US8438659B2 (en) 2009-11-05 2013-05-07 Vocollect, Inc. Portable computing device and headset interface
FR2956539B1 (fr) * 2010-02-16 2012-03-16 Dominique Retali Procede de detection du fonctionnement d'un dispositif de transmission sans fil de signaux de voix.
US20120143604A1 (en) * 2010-12-07 2012-06-07 Rita Singh Method for Restoring Spectral Components in Denoised Speech Signals
CN102883244B (zh) * 2011-07-25 2015-09-02 开曼群岛威睿电通股份有限公司 声震防护的装置及方法
US9363603B1 (en) 2013-02-26 2016-06-07 Xfrm Incorporated Surround audio dialog balance assessment
CN111261197B (zh) * 2020-01-13 2022-11-25 中航华东光电(上海)有限公司 一种复杂噪声场景下的实时语音段落追踪方法

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4358738A (en) * 1976-06-07 1982-11-09 Kahn Leonard R Signal presence determination method for use in a contaminated medium
JPS53105303A (en) * 1977-02-25 1978-09-13 Hitachi Ltd Preprocessing system for audio recognition
JPS5850360B2 (ja) * 1978-05-12 1983-11-10 株式会社日立製作所 音声認識装置における前処理方法
JPS59115625A (ja) * 1982-12-22 1984-07-04 Nec Corp 音声検出器
US4731846A (en) * 1983-04-13 1988-03-15 Texas Instruments Incorporated Voice messaging system with pitch tracking based on adaptively filtered LPC residual signal
DE3370423D1 (en) * 1983-06-07 1987-04-23 Ibm Process for activity detection in a voice transmission system
US4700392A (en) * 1983-08-26 1987-10-13 Nec Corporation Speech signal detector having adaptive threshold values
US4696039A (en) * 1983-10-13 1987-09-22 Texas Instruments Incorporated Speech analysis/synthesis system with silence suppression
JPH0748695B2 (ja) * 1986-05-23 1995-05-24 株式会社日立製作所 音声符号化方式
EP0548054B1 (en) * 1988-03-11 2002-12-11 BRITISH TELECOMMUNICATIONS public limited company Voice activity detector
US5276765A (en) * 1988-03-11 1994-01-04 British Telecommunications Public Limited Company Voice activity detection
JP2573352B2 (ja) * 1989-04-10 1997-01-22 富士通株式会社 音声検出装置
US5680508A (en) * 1991-05-03 1997-10-21 Itt Corporation Enhancement of speech coding in background noise for low-rate speech coder
IN184794B (sk) * 1993-09-14 2000-09-30 British Telecomm
US5659622A (en) * 1995-11-13 1997-08-19 Motorola, Inc. Method and apparatus for suppressing noise in a communication system

Also Published As

Publication number Publication date
US5749067A (en) 1998-05-05
IN184794B (sk) 2000-09-30
CA2169745C (en) 2000-05-16
DK0719439T3 (da) 2000-02-07
DE69419615T2 (de) 2000-05-25
NO961032L (no) 1996-03-13
NO961032D0 (no) 1996-03-13
JPH09502814A (ja) 1997-03-18
DE69419615D1 (de) 1999-08-26
BR9407535A (pt) 1997-08-26
AU7619894A (en) 1995-04-03
FI961158A (fi) 1996-03-13
CN1130952A (zh) 1996-09-11
KR960705303A (ko) 1996-10-09
US6061647A (en) 2000-05-09
CN1064772C (zh) 2001-04-18
GR3031515T3 (en) 2000-01-31
CA2169745A1 (en) 1995-03-23
FI961158A0 (fi) 1996-03-13
SG48935A1 (en) 1998-05-18
EP0719439B1 (en) 1999-07-21
ATE182420T1 (de) 1999-08-15
HU9600641D0 (en) 1996-05-28
SK281796B6 (sk) 2001-08-06
ES2136204T3 (es) 1999-11-16
AU673776B2 (en) 1996-11-21
FI118195B (fi) 2007-08-15
KR100363309B1 (ko) 2003-02-17
CZ67896A3 (en) 1996-07-17
NZ273045A (en) 1996-11-26
MY111134A (en) 1999-08-30
NO307979B1 (no) 2000-06-26
HU219994B (hu) 2001-10-28
JP3224132B2 (ja) 2001-10-29
WO1995008170A1 (en) 1995-03-23
EP0719439A1 (en) 1996-07-03
HK1014392A1 (en) 1999-09-24
HUT73986A (en) 1996-10-28
CZ286743B6 (en) 2000-06-14

Similar Documents

Publication Publication Date Title
SK31896A3 (en) Voice activity detector
EP1875466B1 (en) Systems and methods for reducing audio noise
US6023674A (en) Non-parametric voice activity detection
CA2210490C (en) Spectral subtraction noise suppression method
EP1065657B1 (en) Method for detecting a noise domain
CA2153170C (en) Transmitted noise reduction in communications systems
US5970441A (en) Detection of periodicity information from an audio signal
WO2000041169A9 (en) Method and apparatus for adaptively suppressing noise
US20030216909A1 (en) Voice activity detection
US5806022A (en) Method and system for performing speech recognition
JP3418005B2 (ja) 音声ピッチ検出装置
US8788265B2 (en) System and method for babble noise detection
US7023981B2 (en) Method and apparatus for signal detection
Puder Kalman‐filters in subbands for noise reduction with enhanced pitch‐adaptive speech model estimation
EP1729287A1 (en) Method and apparatus for adaptively suppressing noise
AU673776C (en) Voice activity detector
Tanyer et al. Voice activity detection in nonstationary Gaussian noise
Barrett Information tone handling in the half-rate GSM voice activity detector

Legal Events

Date Code Title Description
MK4A Patent expired

Expiry date: 20140914