SK281796B6 - Detektor hlasu - Google Patents

Detektor hlasu Download PDF

Info

Publication number
SK281796B6
SK281796B6 SK318-96A SK31896A SK281796B6 SK 281796 B6 SK281796 B6 SK 281796B6 SK 31896 A SK31896 A SK 31896A SK 281796 B6 SK281796 B6 SK 281796B6
Authority
SK
Slovakia
Prior art keywords
input signal
predetermined gain
update
signal
detector
Prior art date
Application number
SK318-96A
Other languages
English (en)
Other versions
SK31896A3 (en
Inventor
Paul Alexander Barrett
Original Assignee
British Telecommunications Public Limited Company
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=27235491&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=SK281796(B6) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Priority claimed from GB939324967A external-priority patent/GB9324967D0/en
Priority claimed from GB9412451A external-priority patent/GB9412451D0/en
Application filed by British Telecommunications Public Limited Company filed Critical British Telecommunications Public Limited Company
Publication of SK31896A3 publication Critical patent/SK31896A3/sk
Publication of SK281796B6 publication Critical patent/SK281796B6/sk

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q1/00Details of selecting apparatus or arrangements
    • H04Q1/18Electrical details
    • H04Q1/30Signalling arrangements; Manipulation of signalling currents
    • H04Q1/44Signalling arrangements; Manipulation of signalling currents using alternate current
    • H04Q1/444Signalling arrangements; Manipulation of signalling currents using alternate current with voice-band signalling frequencies
    • H04Q1/46Signalling arrangements; Manipulation of signalling currents using alternate current with voice-band signalling frequencies comprising means for distinguishing between a signalling current of predetermined frequency and a complex current containing that frequency, e.g. speech current
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L25/84Detection of presence or absence of voice signals for discriminating voice from noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L2025/783Detection of presence or absence of voice signals based on threshold decision
    • G10L2025/786Adaptive threshold
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M19/00Current supply arrangements for telephone systems
    • H04M19/08Current supply arrangements for telephone systems with current supply sources at the substations

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Geophysics And Detection Of Objects (AREA)
  • Measuring Pulse, Heart Rate, Blood Pressure Or Blood Flow (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Telephone Function (AREA)
  • Control Of Amplification And Gain Control (AREA)
  • Investigating Or Analyzing Materials By The Use Of Electric Means (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Radio Relay Systems (AREA)
  • Investigating Or Analysing Materials By The Use Of Chemical Reactions (AREA)
  • Electromechanical Clocks (AREA)
  • Cosmetics (AREA)
  • Digital Transmission Methods That Use Modulated Carrier Waves (AREA)
  • Measuring Fluid Pressure (AREA)
  • Burglar Alarm Systems (AREA)

Abstract

Detektor hlasu na zisťovanie prítomnosti reči vo vstupnom signáli, ktorý má šumovú zložku, pozostávajúci z prostriedkov (113) na uchovanie modelu šumovej zložky vstupného signálu, z prostriedkov (114, 115) na zistenie spektrálnej podobnosti vstupného signálu s uloženým modelom šumu na vytváranie výstupného rozhodovacieho signálu, z prostriedkov (112) na aktualizáciu uloženého modelu šumu a z pomocného detektora (200) na riadenie prostriedkov (112) na aktualizáciu tak, aby k aktualizácii došlo iba v čase, keď pomocný detektor (200) udáva, že vstupný signál neobsahuje reč. Detektor hlasu ďalej zahrnuje prostriedky (303) na výpočet parametra predurčeného zisku vstupného signálu a modifikačné prostriedky (304) na potlačenie aktualizácie v prípade, že predurčený zisk prekročí prahovú hodnotu.ŕ

Description

Oblasť techniky
Vynález sa týka detektora hlasu na zisťovanie prítomnosti reči vo vstupnom signáli, ktorý má šumovú zložku, pozostáva z prostriedkov na uchovanie modelu šumovej zložky vstupného signálu, z prostriedkov na zistenie spektrálnej podobnosti vstupného signálu s uloženým modelom šumu na vytváranie výstupného rozhodovacieho signálu, z prostriedkov na aktualizáciu uloženého modelu šumu a z pomocného detektora na riadenie prostriedkov na aktualizáciu tak, aby k aktualizácii došlo iba v čase, keď pomocný detektor udáva, že vstupný signál neobsahuje reč.
Doterajší stav techniky
Detektor hlasu je zariadenie, do ktorého je privádzaný vstupný signál s cieľom stanoviť úseky tohto signálu obsahujúce reč alebo úseky obsahujúce iba šum. Jedným obzvlášť významným použitím takýchto detektorov hlasu, na ktoré však tento vynález nie je obmedzený, sú mobilné rádiové telefonické systémy, kde údaje o prítomnosti či neprítomnosti reči v signáli môžu byť využívané na zníženie spotreby energie a na zníženie interferencie spôsobenej vypínaním telefónu v úsekoch ticha. Pri týchto mobilných systémoch je v dôsledku umiestnenia jednotiek vo vozidlách obvykle vysoká úroveň šumu. Ďalšou možnosťou je použitie pri rádiových systémoch na zlepšenie využitia rádiového spektra.
Na obr. 1 je zobrazený známy detektor hlasu tak, ako je opísaný v PCT patentovej prihláške č. WO 89/08910.
Na jeho vstupe 1 sú prijímané signály. Pamäť 2 potom obsahuje údaje definujúce predpoklad alebo model frekvenčného spektra šumu. Tieto údaje sú následne porovnávané v komparátore 3 so spektrom prichádzajúceho signálu a získa sa miera ich podobnosti, ktorá sa ďalej porovnáva v prvku 4 s prahovou hodnotou. Na sledovanie zmien v šumovej zložke je model šumu aktualizovaný zo vstupu a to iba v čase neprítomnosti reči vo vstupnom signáli. Taktiež uvedená prahová hodnota môže byť upravovaná adaptérom
6.
S cieľom zaručiť, že k úpravám modelu šumu dôjde len v obdobiach, keď vstupný signál obsahuje iba šum, bez nebezpečia postupnej nesprávnej aktualizácie, ktorá by nasledovala po zlom rozhodnutí, je jeho úprava uskutočňovaná za riadenia pomocným detektorom 7, ktorý zahrnuje detektor 8 nehlasových zvukov a detektor 9 hlasových zvukov. Pomocný detektor 7 považuje reč za prítomnú vo vstupnom signáli, ak oba detektory 8 a 9 zistia zvuk. Po tomto zistení je následne umožnená aktualizácia šumového modelu i úprava prahovej hodnoty hlavného detektora. Detektor 8 nehlasových zvukov získava súbor LPC koeficientov signálu a porovnáva autokorelačnú funkciu týchto koeficientov medzi po sebe nasledujúcimi snímkami, zatiaľ čo detektor 9 hlasových zvukov skúma zmeny autokorelácie LPC zvyškového signálu.
Toto usporiadanie je veľmi úspešné na rozlišovanie úsekov reči a úsekov, v ktorých je prijímaný iba šum. Problém je však v tom, že pomocný detektor 7 považuje za bežný šum i signálne tóny (t. j. pomocný detektor 7 v nich nerozpozná reč) tak, že hlavný detektor aktualizuje model šumu podľa týchto tónov, ako keby boli šumom, a ďalej v tom, že dôjde k zabráneniu prenosu signálnych tónov, alebo aspoň k predčasnému prerušeniu ich prenosu.
Tento problém by bolo možné prekonať pridaním tónových detektorov, pričom každý by bol naladený na frekvenciu konkrétneho signálneho tónu. Rozmanitosť jednot livých signálnych tónov vo svete je však značná, takže by bolo potrebné veľké množstvo jednotlivých detektorov, aby napríklad používateľ mobilného telefónu uskutočňujúci medzinárodný hovor mohol počuť obsadzovací tón nezávisle od krajiny, v ktorej vznikol.
Podstata vynálezu
Uvedené nedostatky odstraňuje detektor hlasu na zisťovanie prítomnosti reči vo vstupnom signáli, ktorý má šumovú zložku, pozostávajúci z prostriedkov na uchovanie modelu šumovej zložky vstupného signálu, z prostriedkov na zistenie spektrálnej podobnosti vstupného signálu s uloženým modelom šumu na vytváranie výstupného rozhodovacieho signálu, z prostriedkov na aktualizáciu uloženého modelu šumu a z pomocného detektora na riadenie prostriedkov na aktualizáciu tak, aby k aktualizácii došlo iba v čase, keď pomocný detektor udáva, že vstupný signál neobsahuje reč, podľa vynálezu, ktorého podstata spočíva v tom, že ďalej zahrnuje prostriedky na výpočet parametra predurčeného zisku vstupného signálu a modifikačné prostriedky na potlačenie aktualizácie v prípade, že predurčený zisk prekročí prahovú hodnotu.
Podľa výhodného uskutočnenia pomocný detektor zahrnuje detektor hlasových zvukov reagujúci na signály odvodené z kódovania s lineárnou predikciou zvyškového signálu.
Podľa ďalších výhodných uskutočnení sú prostriedky na výpočet parametra predurčeného zisku upravené na výpočet predurčeného zisku kódovania s lineárnou predikciou predurčenia šiesteho alebo nižšieho rádu, prípadne štvrtého alebo nižšieho rádu.
Podľa ďalšieho výhodného uskutočnenia detektor hlasu ďalej zahrnuje prostriedky na zisťovanie jednej alebo viacerých primárnych frekvenčných zložiek vstupného signálu a na porovnanie frekvencie s vopred stanovenou prahovou hodnotou a na umožnenie potlačenia aktualizácie iba v prípade, že uvedená primárna zložka prekračuje prahovú hodnotu.
Pred prostriedky na výpočet parametra predurčeného zisku môže byť predradený filter na odstránenie hornej časti frekvenčného rozsahu vstupného signálu, pričom prostriedky na výpočet parametra predurčeného zisku sú upravené na výpočet parametra predurčeného zisku iba pre frekvenčné zložky ležiace v pásme priepustnosti filtra.
Podľa iného výhodného uskutočnenia má detektor hlasu dva filtre s príslušnými pásmami priepustnosti a príslušné prostriedky na výpočet parametrov predurčeného zisku pri príslušných pásmach priepustnosti a modifikačné prostriedky na potlačenie aktualizácie v prípade, že predurčený zisk presahuje v oboch pásmach priepustnosti prahovú hodnotu.
Je tiež výhodné, pokiaľ detektor hlasu zahrnuje prostriedky na vzorkovanie filtrovaného signálu/signálov.
Podstata riešenia podľa tohto vynálezu potom spočíva v tom, že detektor hlasu zahrnuje prostriedky na výpočet parametra predurčeného zisku vstupného signálu a ďalej modifikačné prostriedky usporiadané na znemožnenie aktualizácie uloženého modelu šumu v prípade, že predurčený zisk prekročí prahovú hodnotu.
Prehľad obrázkov na výkresoch
Následne budú opísané niektoré uskutočnenia tohto vynálezu s odkazom na priložené výkresy, kde:
SK 281796 Β6 obr. 1 zobrazuje blokovú schému známeho detektora hlasu podľa PCT prihlášky vynálezu Č.W089/08910;
obr. 2 predstavuje blokovú schému zvukového kodéra s detektorom hlasu podľa tohto vynálezu;
obr. 3 a obr. 4 ukazujú graficky hodnoty predurčeného zisku pri rôznych vstupných signáloch;
obr. 5, obr. 6 a obr. 7 predstavujú blokové schémy ďalších uskutočnení tohto vynálezu.
Príklady uskutočnenia vynálezu
Bežný zvukový kodér 100 na obr. 2 má zvukový vstup 101. Zvukový signál je tu vzorkovaný pri 8 kHz a prevádzaný do digitálnej formy analógovodigitálnym prevodníkom 102. Jednotka 103 rozdeľuje zvukové vzorky do snímok napríklad so 160 vzorkami (t. j. do 20 ms vzoriek) a znásobuje ich funkciou, ktorá znižuje podiel vzoriek na začiatku a na konci snímky. Korelátor 104 prijíma digitalizované zvukové vzorky a vytvára pre každú snímku autokorelačné koeficienty R,. Jednotka 105 LPC analýzy (LPC = = Linear Predictive Coding = kódovanie s lineárnou predikciou) vypočítava s použitím známej metódy, napr. Levinsonovým-Durbinovým alebo Schurrovým algoritmom, koeficienty aj filtra (niekedy označovaného ako syntézny filter), majúceho frekvenčnú charakteristiku, ktorá zodpovedá frekvenčnému spektru vstupného zvukového signálu.
Digitalizovaný vstupný signál prechádza taktiež inverzným filtrom, alebo analýzovým filtrom 106, ovládaným koeficientmi, na vytvorenie zvyškového signálu, ktoiý je ďalej analyzovaný jednotkou 107 dlhodobého predurčenia, ktorá vypočítava optimálne oneskorenie na predurčenie LPC zvyškového signálu z jeho predchádzajúcich hodnôt a zodpovedajúcu hodnotu zisku na predurčenie. Analýzový filter 106 vytvára tiež druhý zvyškový signál (t. j. rozdiel medzi súčasným LPC zvyškovým signálom a LPC zvyškovým signálom po oneskorení a vyvážení získanými parametrami). Budiaca jednotka 108 získava parametre na prenos do dekodéra zo zvyškového signálu dlhodobého predurčenia (LTP), alebo inými známymi prostriedkami.
LPC koeficienty aj, oneskorenie d, zisk g a budiace parametre e sú prenášané do dekodéra.
Hlavný detektor hlasu podľa skôr zmienenej patentovej prihlášky zisťuje priemer autokorelačných koeficientov Rj pomocou nivelizačného zariadenia 110, ktoré vytvára vážený súčet Rj1 súčasných koeficientov a koeficientov z predchádzajúcich snímok, uložených v pamäti 111. Prostriedky 112 na aktualizáciu uloženého modelu šumu, tvorené ďalším autokorelátorom, vytvárajú autokorelačné koeficienty Bj týchto LPC koeficientov aj, ktoré prechádzajú do pamäte, ktorá tvorí prostriedky 113 na uchovávanie modelu šumovej zložky. Obsah tejto pamäte je aktualizovaný iba v priebehu úsekov vstupného signálu, o ktorých pomocný detektor, ktoiý bude opísaný ďalej, predpokladá, že obsahujú iba šum. Obsah pamäte Bj potom predstavuje odhad šumového spektra vstupného signálu.
Násobná/súčtová jednotka 114, ktorá je súčasťou prostriedkov na zistenie spektrálnej podobnosti vstupného signálu s uloženým modelom šumu, potom vytvára mieru M spektrálnej podobnosti medzi vstupným signálom a šumovým modelom, ktorá je definovaná ako
Nulový spodný index značí počiatočný autokorelačný koeficient a n je počet vzoriek vo zvukovej snímke.
Miera M spektrálnej podobnosti sa potom v komparátore 115, ktorý je súčasťou prostriedkov na zistenie spektrálnej podobnosti vstupného signálu s uloženým modelom šumu, porovnáva s prahovou hodnotou a na výstupe 116 sa vytvára signál indikujúci prítomnosť alebo neprítomnosť reči vo vstupnom signáli. Prahová hodnota môže byť prispôsobiteľne nastavená prvkom 117 podľa aktuálnej úrovne šumu.
Aktualizácia modelu šumu uloženého v pamäti prostriedkov 113 na uchovávanie modelu šumovej zložky nie je ovládaná výstupom 116 práve opísaného detektora, lebo chyba v rozpoznaní reči by mala za následok aktualizáciu pamäte informáciou o reči a následné ďalšie chyby v rozpoznávaní. Z tohto dôvodu je aktualizácia riadená pomocným detektorom 200. Aby bolo možné odlíšiť šum a nehlasový zvuk je vytváraný v bloku 201 súčet (nespriemerovaných) autokorelačných koeficientov Bj LPC koeficientov. Odčítač 202 porovnáva tento súčet so zodpovedajúcim súčtom predchádzajúcej zvukovej snímky uloženej v pamäti 203. Tento rozdiel, predstavujúci spektrálnu podobnosť medzi po sebe nasledujúcimi snímkami vstupného signálu, je kvôli vytvoreniu rozhodovacieho signálu porovnaný s prahovou hodnotou v porovnávacej jednotke 204.
Na rozpoznanie hlasového zvuku sa detektorom 205 hlasových zvukov meria oneskorenie d. Výstup detektora 205 hlasových zvukov je v súčtovom hradle 206 zlúčený s výstupom porovnávacej jednotky 204. Pomocný detektor 200 indikuje prítomnosť hlasu vo vstupnom signáli, ak každá z jednotiek 204 a 205 vytvára výstupný signál indikujúci prítomnosti hlasu. Ako bolo diskutované už v úvode, ak má systém prepúšťať signálne tóny, musí tieto rozpoznávať skôr ako reč než ako šum. Práve opísaný pomocný detektor však nie je na dosiahnutie tohto cieľa príliš efektívny. Hoci rozpoznáva určité signálne tóny, iné (všeobecne tie, ktoré majú relatívne chudobný spektrálny obsah) nie sú rozpoznané. Keď dôjde k chybe pomocného detektora 200, dôjde taktiež k chybe hlavného detektora, lebo model šumu v pamäti je potom adaptovaný podľa signálneho tónu.
Na zisťovanie signálnych tónov vo vstupnom signáli je preto vytvorený ďalší pomocný detektor. Výhodne je využívané zistenie, že signálne tóny, ktoré sú umelo generované, obsahujú malý počet kmitočtových zložiek (ktoré môžu byť modulované). Pre také signály je použitím rozlíšenia medzi tónovo založenými signálmi (vrátane viactónových signálov) a pozadím alebo šumovými signálmi okolia výkon LPC predurčovača obzvlášť vysoký.
LPC predurčený zisk Gp je definovaný ako pomer výkonu vstupného signálu a výkonu výstupného signálu pri hlasovej snímke
n-1
Σ v2(i) i- o kde X; je vstup filtra a y je výstup inverzného filtra:
m y(i) - x(i) < Σ y(t - i) >i( i=i kde m je počet koeficientov filtra, ktorý býva obvykle 8 alebo 10. Signály x(i) a y(i) sa získavajú z LPC hlasového kodéra 100, na výstupoch analógovo-digitálneho prevodníka 102, resp. analýzového filtra 106. Tieto hodnoty sú u mocnené v umocňovacích jednotkách 301 a 302 a predurčený zisk sa stanoví v prostriedkoch 303 na výpočet parametra predurčeného zisku vstupného signálu, ktoré sú tvorené aritmetickou jednotkou, ktorá vypočítava Gp podľa uvedenej rovnice. Výstup tejto jednotky je v komparátore, ktorý tvoria modifikačné prostriedky 304, porovnaný s pevnou prahovou hodnotou T. Ak predurčený zisk presahuje túto prahovú hodnotu (obvykle T = 63 dB alebo T = = 18 dB), je tón pokladaný za rozpoznaný. Existuje niekoľko možných reakcií na rozpoznanie tónu:
a) nahradiť výstup hlavného detektora prostriedkami 303 na výpočet parametra predurčeného zisku vstupného signálu;
b) nahradiť pomocný detektor prostriedkami tretieho vstupu do súčtového hradia 206;
c) obe predchádzajúce možnosti.
Samozrejme namiesto výpočtu podielu môže byť výraz Σχ2 porovnávaný s výrazom Zy2, vynásobeným prahovou hodnotou. Na obr. 3 sú zobrazené histogramy predurčených ziskov v dB, ktoré boli získané zo šumu pozadia, z reči, zo šumu pozadia v signálnych tónoch a zo samotných signálnych tónov. Na obr. 4 sú potom zobrazené diagramy predurčeného zisku v závislosti od času pri rôznych signálnych tónoch používaných vo Veľkej Británii, konkrétne pri:
- obsadzovacom tóne,
- oznamovacom tóne,
- vyzváňacom tóne,
- tóne „volané číslo neexistuje“, a
- tóne „zariadenie obsadené“.
V praxi sú obsadzovací tón, oznamovací tón a tón „volané číslo neexistuje“ úspešne rozpoznávané ďalším detektorom, rovnako ako multifrekvenčné tóny. VyzváÄací tón a tón „zariadenie obsadené“ sú rozpoznávané detektorom 205 hlasových zvukov.
Ďalší detektor 300 je možné považovať za detektor určitých druhov tónov, alternatívne (pri uskutočnení z obr. 2) môže byť považovaný za detektor situácie, keď zvyškový signál y; je taký malý, že funkcia jednotky 107 dlhodobého predurčenia (a tým detektora 205 hlasových zvukov) nie je silná.
Alternatívnou možnosťou zisťovania hlasového zvuku je nahradiť detektor 205 hlasových zvukov jednotkami analogickými k jednotkám 301, 302, 303 a 304 a založiť vytváranie predurčeného zisku na analýze dlhodobého predurčenia v jednotke 107 dlhodobého predurčenia.
Ďalej budú s odkazom na obr. 5 opísané dve modifikácie zariadenia z obr. 2. Vypočítavaný zisk je v uskutočnení z obr. 2 ziskom LPC analýzy hlasového kodéra 100, ktorá by mohla obvykle používať predurčovač ôsmeho alebo desiateho rádu. Vo vedomí toho, že základom tejto časti analýzy je, že informačné tóny rezultujú vo väčších predurčených ziskoch než šum prostredia a že čím vyšší je rád analýzy, tým vyššia je schopnosť predurčovača modelovať šum prostredia, bolo zistené, že obmedzením výpočtu zisku na analýzu štvrtého rádu dávajú informačné signály, pozostávajúce z jedného alebo dvoch tónov, vysoký predurčený zisk, zatiaľ čo predurčený zisk pri šume prostredia môže byť znížený.
Principiálne by toto bolo možné dosiahnuť použitím analýzy štvrtého rádu a použitím filtra vedľa jednotiek 105, 106 na zásobovanie pomocného detektora signálom, ale ľahšie je vypočítať predurčený zisk z reflexných koeficientov (niekedy uvádzaných ako Parcor koeficienty). Na obr. 5 sú tieto reflexné koeficienty vypočítavané známym spôsobom z autokorelačných koeficientov R; kalkulátorom 400 reflexných koeficientov (hoci v závislosti od uskutočnenia zvukového kodéra by mohlo byť možné snímať ich z medziľahlého bodu jednotky 105 LPC analýzy). Mieru predurčeného zisku, chybu predurčenia Pe, možno získať výpočtom z prvých štyroch reflexných koeficientov Rq podľa vzorca:
Pe-Π (1-Rcj2). i=l
Tento výpočet sa uskutočňuje v jednotke 401. Veľká chyba predurčenia Pe zodpovedá nízkemu predurčenému zisku a naopak. Signálny tón sa preto považuje za prítomný vo vstupnom signáli, ak hodnota Pe je menšia než prahová hodnota Pth. Toto porovnanie v komparátore 403 nahradilo porovnávanie v modifikačných prostriedkoch 304 z obr. 2.
Šum okolitého prostredia mobilného telefónu obsahuje veľmi silné rezonancie na nízkych frekvenciách. Na zistenie, či je „tón“ pod prahovou frekvenciou, sa uskutočňuje ďalší test. Voľba prahovej hodnoty v sebe zahrnuje určitý stupeň kompromisu, ale odporúčaná je hodnota 385 Hz, lebo väčšina signálnych tónov leží pod 400 Hz.
Tento ďalší test pracuje tak, že sú stanovené pólové frekvencie LPC filtra. Na zmenšenie komplexnosti analýzy je výhodný filter nízkeho rádu. Následne by mohla byť uskutočnená ďalšia LPC analýza, ale jednoduchšie je pokračovať, ako pri uskutočnení na obr. 5, výpočtom LPC koeficientov z reflexných koeficientov. Za predpokladu, že sa použijú iba prvé dva reflexné koeficienty z kalkulátora 400 reflexných koeficientov, sú LPC koeficienty a; vypočítané bežným spôsobom prvkom 404, ktorý je definovaný tak, aby citlivosť syntézneho filtra bola:
H(z) = 1/ (ag t aj z’1 + a2 z-2)
Potom sú polohy pólov v rovine z dané riešením kvadratickej rovnice ao z2 + a| z + a2 = 0 ao = 1
-at / 4a2 - a|2 z = —. ± j y -------.
4
Ak výraz pod druhou odmocninou je záporný, potom póly ležia na reálnej osi a vstupný signál nie je signálnym tónom. Ak je tento výraz kladný, ale reálna časť polohy pólu je záporná (t. j. a( < 0), potom je pól v ľavej polovici roviny z. To nevyhnutne znamená, že frekvencia je viac než 25 % hodnoty vzorkovacej frekvencie, t. j. viac než 2000 Hz pre vzorkovaciu frekvenciu fs = 8 kHz. V takomto prípade je výpočet zbytočný a signál „>385“ môže byť ihneď generovaný.
Pólová frekvencia je daná rovnicou:
- Váa2 - a;2 fs ľ * arctan (------) x · a ]2 π
Podmienku, že f < 385 Hz možno zapísať (vylúčením druhých odmocnín) ako:
2tc x 385 (4a2 - a | 2) / a |2 < tan2 () alebo ako:
(4a2 a)2) / a|2 <r 0,0973 pri fs = 8kHz .
Tento výpočet sa uskutočňuje v jednotke prostriedkov 405 na zisťovanie jednej alebo viacerých primárnych frekvenčných zložiek vstupného signálu. Jej výstup je zlúčený v AND hradle 406 s výstupom komparátora 403, takže roz
SK 281796 Β6 hodnutie o tom, že ide o signálny tón vznikne iba vtedy, keď predurčený zisk je veľký a zároveň, keď je pólová frekvencia väčšia než 385 Hz.
Ak je to požadované, môže byť pólová frekvencia vyššia než 2000 Hz (alebo vyššia než nejaký iný horný limit) tiež odlúčená, aby vysoké frekvencie nad predpokladaným rozsahom signálnych tónov nemohli byť rozpoznané ako signálne tóny.
Ak sa pri riešení kvadratickej rovnice použije zvláštny výpočet, je možné použiť tiež tretí a štvrtý reflexný koeficient. V tomto prípade by mohli byť zistené dva združené komplexné páry pólov s dvoma frekvenciami. Je zrejmé, že v takomto prípade by signálny tón nebol pokladaný za prítomný vo vstupnom signáli, keby obe frekvencie boli pod prahovou hodnotou.
Bolo už uvedené, že uskutočnenia vynálezu podľa obr. 2 a obr. 5 používajú pred autokorelačným výpočtom v jednotke 103 rozdelenie zvukových vzoriek do snímok (ako je bežné pri LPC analýze založenej na autokorelácii). Ak sa pri hlasovom kodéri nepožaduje uskutočňovať túto činnosť, je možnou alternatívou prípadu z obr. 5 vypustiť jednotku 103 a nahradiť výpočet reflexného koeficienta konverziou autokorelačných hodnôt na kovariantné hodnoty, jednotky 401, 404 modifikovať na využitie týchto kovariantných hodnôt oproti využitiu reflexných koeficientov. Alternatívne, ako ukazuje obr. 6 (kde sú zobrazené iba tie časti, ktoré boli oproti obr. 5 zmenené), môže byť počiatočné spracovanie uskutočnené jednotkou 109 kovariantnej analýzy, ktorých výstup je privádzaný do kalkulátora 400' reflexného koeficienta a do autokorelačnej jednotky 104' modifikácie autokorelačného koeficienta. Jednotka 105 LPC analýzy môže byť spojená, ako predtým s autokorelačnou jednotkou 104', alebo, ako je zobrazené, priamo s jednotkou 109 kovariantnej analýzy.
Opísané uskutočnenia na detekciu signálnych tónov majú dobré výsledky, ale môžu zlyhať pri mechanicky generovaných tónoch, ktoré sa používajú v určitých teritóriách. Tieto mechanicky generované tóny majú vyššiu harmonickú zložku rezultujúcu v malom predurčenom zisku. Prosté odfiltrovanie vyšších harmonických zložiek nie je riešením, lebo vloženie filtra vedie k zvýšeniu autokorelácie všetkých signálov a tým k väčším predurčeným ziskom taktiež pri ostatných signáloch. Bolo zistené, že predurčovač má snahu skôr upravovať póly filtra než charakteristiky vstupného signálu. Jednako však bolo tiež zistené, že dobré výsledky je možné získať filtráciou, ak analýza predurčeného zisku je obmedzená na stanovenie predurčenia signálu len vo frekvenčnom rozsahu zodpovedajúcom pásmu priepustnosti harmonického filtra. Toto sa dosiahne vzorkovaním signálu frekvenciou dvojnásobnou oproti šírke pásma filtra pred analýzou predurčeného zisku.
Uskutočnenie vynálezu zobrazené na obr. 7, ktoré je podobné uskutočneniu z obr. 5, preto používa filter 450, ktorým je nízkopriepustný FIR filter, majúci pásmo priepustnosti do 600 (3 dB) a majúci zoslabenie potlačovaného pásma 20 dB pri 1200 Hz. Výhodné je, keď zoslabenie potlačovaného pásma nie je príliš veľké. Výstup filtra 450 je vzorkovaný pri 1200 Hz vo vzorkovacej jednotke 451.
Pri tomto filtrovaní sú veľmi redukované možnosti tónovej detekcie spoločne využívať komponenty s hlasovým kodérom 100. Do filtra 450 je teda digitalizovaný vstupný signál privádzaný priamo z analógovo-digitálneho prevodníka 102 a jeho výstup smeruje do kalkulátora 400' reflexných koeficientov alebo do jednotky kovariantnej alebo autokorelačnej analýzy tak, ako bolo opísané predtým.
Ďalšie uskutočnenie vynálezu zmierňuje problém harmonických zložiek bez nadmerného obmedzovania frek venčného pásma analýzy predurčovaného zisku. Toto sa dosiahne použitím filtrov rozdeľujúcich vstupný signál na dve alebo viac frekvenčných pásiem, kde každé toto pásmo je dostatočne úzke na to, aby nemohlo obsahovať základnú a tretiu harmonickú zložku signálneho tónu. Každý kanál je potom vzorkovaný a podrobený oddelenej analýze predurčeného zisku.
V uskutočnení podľa obr. 8 je signál rozdelený filtrami 450a a 450b na dve frekvenčné pásma 400 až 1200 Hz a 1200 až 2000 Hz a vzorkovaný pri 1,6 kHz v prostriedkoch 451a, 451b na vzorkovanie. Výpočet reflexného koeficientu 400'a a 400'b, analýza chyby predurčenia 401a, 401b a prahovanie sú uskutočňované oddelene pre obe pásma. Dva výstupy z komparátorov, ktoré tvoria prostriedky 403a a 403b na potlačenie aktualizácie, sú vedené na oddelené vstupy súčtového hradia 206 tak, aby vysoký predurčený zisk v oboch kanáloch bol pokladaný za indikáciu prítomnosti signálneho tónu. Ostatné prvky 100 až 303 z obr. 7 nie sú na obr. 8 zobrazené, lebo sú pri oboch uskutočneniach rovnaké.

Claims (8)

  1. PATENTOVÉ NÁROKY
    1. Detektor hlasu na zisťovanie prítomnosti reči vo vstupnom signáli, ktorý má šumovú zložku, pozostávajúci z prostriedkov (113) na uchovanie modelu šumovej zložky vstupného signálu, z prostriedkov (114, 115) na zistenie spektrálnej podobnosti vstupného signálu s uloženým modelom šumu na vytváranie výstupného rozhodovacieho signálu, z prostriedkov (112) na aktualizáciu uloženého modelu šumu a z pomocného detektora (200) na riadenie prostriedkov (112) na aktualizáciu tak, aby k aktualizácii došlo iba v čase, keď pomocný detektor (200) udáva, že vstupný signál neobsahuje reč, vyznačujúci sa t ý m , že ďalej zahrnuje prostriedky (303) na výpočet parametra predurčeného zisku vstupného signálu a modifikačné prostriedky (304) na potlačenie aktualizácie v prípade, že predurčený zisk prekročí prahovú hodnotu.
  2. 2. Detektor hlasu podľa nároku 1,vyznačujúci sa t ý m , že pomocný detektor (200) zahrnuje detektor (205) hlasových zvukov reagujúci na signály odvodené z kódovania s lineárnou predikciou zvyškového signálu.
  3. 3. Detektor hlasu podľa nároku 1 alebo 2, v y zničujúci sa tým,že prostriedky (303) na výpočet parametra predurčeného zisku sú upravené na výpočet predurčeného zisku kódovania s lineárnou predikciou predurčenia šiesteho alebo nižšieho rádu.
  4. 4. Detektor hlasu podľa nároku 3, vyznačujúci sa t ý m , že prostriedky (303) na výpočet parametra predurčeného zisku sú upravené na výpočet predurčeného zisku kódovania s lineárnou predikciou predurčenia štvrtého alebo nižšieho rádu.
  5. 5. Detektor hlasu podľa ktoréhokoľvek z predchádzajúcich nárokov, vyznačujúci sa tým, že ďalej zahrnuje prostriedky (405) na zisťovanie jednej alebo viacerých primárnych frekvenčných zložiek vstupného signálu a na porovnanie frekvencie s vopred stanovenou prahovou hodnotou a na umožnenie potlačenia aktualizácie iba v prípade, že uvedená primárna zložka prekračuje prahovú hodnotu.
  6. 6. Detektor hlasu podľa ktoréhokoľvek z predchádzajúcich nárokov, vyznačujúci sa tým, že pred prostriedky (303) na výpočet parametra predurčeného zisku je predradený filter (450) na odstránenie hornej časti frekvenčného rozsahu vstupného signálu, pričom prostriedky (303) na výpočet parametra predurčeného zisku sú upravené na výpočet parametra predurčeného zisku iba pre frekvenčné zložky ležiace v pásme priepustnosti filtra.
  7. 7. Detektor hlasu podľa nároku 6, vyznačujúci sa t ý m , že má dva filtre (450a, 450b) s príslušnými pásmami priepustnosti a príslušné prostriedky na výpočet parametrov predurčeného zisku pri príslušných pásmach priepustnosti a modifikačné prostriedky (403a, 403b) na potlačenie aktualizácie v prípade, že predurčený zisk presahuje v oboch pásmach priepustnosti prahovú hodnotu.
  8. 8. Detektor hlasu podľa nároku 6 alebo 7, v y z n a čujúci sa tým, že zahrnuje prostriedky (451a, 451b) na vzorkovanie filtrovaného signálu/signálov.
SK318-96A 1993-09-14 1994-09-14 Detektor hlasu SK281796B6 (sk)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
EP93307211 1993-09-14
GB939324967A GB9324967D0 (en) 1993-12-06 1993-12-06 Voice activity detector
GB9412451A GB9412451D0 (en) 1994-06-21 1994-06-21 Voice activity detector
PCT/GB1994/001999 WO1995008170A1 (en) 1993-09-14 1994-09-14 Voice activity detector

Publications (2)

Publication Number Publication Date
SK31896A3 SK31896A3 (en) 1997-03-05
SK281796B6 true SK281796B6 (sk) 2001-08-06

Family

ID=27235491

Family Applications (1)

Application Number Title Priority Date Filing Date
SK318-96A SK281796B6 (sk) 1993-09-14 1994-09-14 Detektor hlasu

Country Status (23)

Country Link
US (2) US5749067A (sk)
EP (1) EP0719439B1 (sk)
JP (1) JP3224132B2 (sk)
KR (1) KR100363309B1 (sk)
CN (1) CN1064772C (sk)
AT (1) ATE182420T1 (sk)
BR (1) BR9407535A (sk)
CA (1) CA2169745C (sk)
CZ (1) CZ286743B6 (sk)
DE (1) DE69419615T2 (sk)
DK (1) DK0719439T3 (sk)
ES (1) ES2136204T3 (sk)
FI (1) FI118195B (sk)
GR (1) GR3031515T3 (sk)
HK (1) HK1014392A1 (sk)
HU (1) HU219994B (sk)
IN (1) IN184794B (sk)
MY (1) MY111134A (sk)
NO (1) NO307979B1 (sk)
NZ (1) NZ273045A (sk)
SG (1) SG48935A1 (sk)
SK (1) SK281796B6 (sk)
WO (1) WO1995008170A1 (sk)

Families Citing this family (96)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IN184794B (sk) * 1993-09-14 2000-09-30 British Telecomm
JP3522012B2 (ja) * 1995-08-23 2004-04-26 沖電気工業株式会社 コード励振線形予測符号化装置
FI100840B (fi) * 1995-12-12 1998-02-27 Nokia Mobile Phones Ltd Kohinanvaimennin ja menetelmä taustakohinan vaimentamiseksi kohinaises ta puheesta sekä matkaviestin
KR20000022285A (ko) * 1996-07-03 2000-04-25 내쉬 로저 윌리엄 음성 액티비티 검출기 및 검출 방법
US6708146B1 (en) * 1997-01-03 2004-03-16 Telecommunications Research Laboratories Voiceband signal classifier
JPH10247098A (ja) * 1997-03-04 1998-09-14 Mitsubishi Electric Corp 可変レート音声符号化方法、可変レート音声復号化方法
US6531982B1 (en) 1997-09-30 2003-03-11 Sirf Technology, Inc. Field unit for use in a GPS system
US5970446A (en) 1997-11-25 1999-10-19 At&T Corp Selective noise/channel/coding models and recognizers for automatic speech recognition
US6385548B2 (en) * 1997-12-12 2002-05-07 Motorola, Inc. Apparatus and method for detecting and characterizing signals in a communication system
US6327471B1 (en) 1998-02-19 2001-12-04 Conexant Systems, Inc. Method and an apparatus for positioning system assisted cellular radiotelephone handoff and dropoff
US5991718A (en) * 1998-02-27 1999-11-23 At&T Corp. System and method for noise threshold adaptation for voice activity detection in nonstationary noise environments
US6182035B1 (en) 1998-03-26 2001-01-30 Telefonaktiebolaget Lm Ericsson (Publ) Method and apparatus for detecting voice activity
US6348744B1 (en) 1998-04-14 2002-02-19 Conexant Systems, Inc. Integrated power management module
US6453289B1 (en) 1998-07-24 2002-09-17 Hughes Electronics Corporation Method of noise reduction for speech codecs
US7711038B1 (en) 1998-09-01 2010-05-04 Sirf Technology, Inc. System and method for despreading in a spread spectrum matched filter
US7545854B1 (en) * 1998-09-01 2009-06-09 Sirf Technology, Inc. Doppler corrected spread spectrum matched filter
US6693953B2 (en) 1998-09-30 2004-02-17 Skyworks Solutions, Inc. Adaptive wireless communication receiver
US6448925B1 (en) 1999-02-04 2002-09-10 Conexant Systems, Inc. Jamming detection and blanking for GPS receivers
US6606349B1 (en) 1999-02-04 2003-08-12 Sirf Technology, Inc. Spread spectrum receiver performance improvement
US6556967B1 (en) 1999-03-12 2003-04-29 The United States Of America As Represented By The National Security Agency Voice activity detector
US6304216B1 (en) 1999-03-30 2001-10-16 Conexant Systems, Inc. Signal detector employing correlation analysis of non-uniform and disjoint sample segments
US6577271B1 (en) 1999-03-30 2003-06-10 Sirf Technology, Inc Signal detector employing coherent integration
US6618701B2 (en) * 1999-04-19 2003-09-09 Motorola, Inc. Method and system for noise suppression using external voice activity detection
US6381568B1 (en) 1999-05-05 2002-04-30 The United States Of America As Represented By The National Security Agency Method of transmitting speech using discontinuous transmission and comfort noise
US6351486B1 (en) 1999-05-25 2002-02-26 Conexant Systems, Inc. Accelerated selection of a base station in a wireless communication system
JP3929686B2 (ja) * 2000-08-14 2007-06-13 松下電器産業株式会社 音声スイッチング装置およびその方法
US6788655B1 (en) 2000-04-18 2004-09-07 Sirf Technology, Inc. Personal communications device with ratio counter
US6931055B1 (en) 2000-04-18 2005-08-16 Sirf Technology, Inc. Signal detector employing a doppler phase correction system
US6714158B1 (en) * 2000-04-18 2004-03-30 Sirf Technology, Inc. Method and system for data detection in a global positioning system satellite receiver
US6952440B1 (en) 2000-04-18 2005-10-04 Sirf Technology, Inc. Signal detector employing a Doppler phase correction system
FR2808391B1 (fr) * 2000-04-28 2002-06-07 France Telecom Systeme de reception pour antenne multicapteur
US7885314B1 (en) 2000-05-02 2011-02-08 Kenneth Scott Walley Cancellation system and method for a wireless positioning system
US6778136B2 (en) 2001-12-13 2004-08-17 Sirf Technology, Inc. Fast acquisition of GPS signal
JP4201470B2 (ja) * 2000-09-12 2008-12-24 パイオニア株式会社 音声認識システム
JP4201471B2 (ja) * 2000-09-12 2008-12-24 パイオニア株式会社 音声認識システム
US7472059B2 (en) * 2000-12-08 2008-12-30 Qualcomm Incorporated Method and apparatus for robust speech classification
WO2002052546A1 (en) * 2000-12-27 2002-07-04 Intel Corporation Voice barge-in in telephony speech recognition
US6707869B1 (en) * 2000-12-28 2004-03-16 Nortel Networks Limited Signal-processing apparatus with a filter of flexible window design
DE10121532A1 (de) * 2001-05-03 2002-11-07 Siemens Ag Verfahren und Vorrichtung zur automatischen Differenzierung und/oder Detektion akustischer Signale
JP3859462B2 (ja) * 2001-05-18 2006-12-20 株式会社東芝 予測パラメータ分析装置および予測パラメータ分析方法
KR100399057B1 (ko) * 2001-08-07 2003-09-26 한국전자통신연구원 이동통신 시스템의 음성 활성도 측정 장치 및 그 방법
US20030110029A1 (en) * 2001-12-07 2003-06-12 Masoud Ahmadi Noise detection and cancellation in communications systems
US7689406B2 (en) * 2002-03-08 2010-03-30 Koninklijke Kpn. N.V. Method and system for measuring a system's transmission quality
US7454331B2 (en) * 2002-08-30 2008-11-18 Dolby Laboratories Licensing Corporation Controlling loudness of speech in signals that contain speech and other types of audio material
US20040064314A1 (en) * 2002-09-27 2004-04-01 Aubert Nicolas De Saint Methods and apparatus for speech end-point detection
US7146316B2 (en) * 2002-10-17 2006-12-05 Clarity Technologies, Inc. Noise reduction in subbanded speech signals
US7230955B1 (en) * 2002-12-27 2007-06-12 At & T Corp. System and method for improved use of voice activity detection
US7272552B1 (en) * 2002-12-27 2007-09-18 At&T Corp. Voice activity detection and silence suppression in a packet network
JP2004341339A (ja) * 2003-05-16 2004-12-02 Mitsubishi Electric Corp 雑音抑圧装置
ES2290764T3 (es) * 2003-05-28 2008-02-16 Dolby Laboratories Licensing Corporation Metodo, aparato y programa de ordenador para calcular y ajustar la sonoridad percibida de una señal de audio.
WO2005007707A1 (ja) 2003-07-16 2005-01-27 Daikin Industries, Ltd. 含フッ素重合体の製造方法、含フッ素重合体水性分散液、2−アシルオキシカルボン酸誘導体及び界面活性剤
SG119199A1 (en) * 2003-09-30 2006-02-28 Stmicroelectronics Asia Pacfic Voice activity detector
JP4497911B2 (ja) * 2003-12-16 2010-07-07 キヤノン株式会社 信号検出装置および方法、ならびにプログラム
US20050209762A1 (en) * 2004-03-18 2005-09-22 Ford Global Technologies, Llc Method and apparatus for controlling a vehicle using an object detection system and brake-steer
FI20045315A (fi) * 2004-08-30 2006-03-01 Nokia Corp Ääniaktiivisuuden havaitseminen äänisignaalissa
WO2006047600A1 (en) 2004-10-26 2006-05-04 Dolby Laboratories Licensing Corporation Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
US8199933B2 (en) 2004-10-26 2012-06-12 Dolby Laboratories Licensing Corporation Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
JP4729927B2 (ja) * 2005-01-11 2011-07-20 ソニー株式会社 音声検出装置、自動撮像装置、および音声検出方法
EA026063B1 (ru) * 2005-04-18 2017-02-28 Басф Се Сополимер, синтезированный из по меньшей мере трех различных моноэтиленненасыщенных мономеров
US7826945B2 (en) * 2005-07-01 2010-11-02 You Zhang Automobile speech-recognition interface
DE102006032967B4 (de) * 2005-07-28 2012-04-19 S. Siedle & Söhne Telefon- und Telegrafenwerke OHG Hausanlage und Verfahren zum Betreiben einer Hausanlage
GB2430129B (en) * 2005-09-08 2007-10-31 Motorola Inc Voice activity detector and method of operation therein
CN101322182B (zh) * 2005-12-05 2011-11-23 高通股份有限公司 用于检测音调分量的系统、方法和设备
US8417185B2 (en) * 2005-12-16 2013-04-09 Vocollect, Inc. Wireless headset and method for robust voice data communication
US7885419B2 (en) 2006-02-06 2011-02-08 Vocollect, Inc. Headset terminal with speech functionality
US7773767B2 (en) 2006-02-06 2010-08-10 Vocollect, Inc. Headset terminal with rear stability strap
ES2525427T3 (es) 2006-02-10 2014-12-22 Telefonaktiebolaget L M Ericsson (Publ) Un detector de voz y un método para suprimir sub-bandas en un detector de voz
US8920343B2 (en) 2006-03-23 2014-12-30 Michael Edward Sabatino Apparatus for acquiring and processing of physiological auditory signals
CN101410892B (zh) * 2006-04-04 2012-08-08 杜比实验室特许公司 改进的离散余弦变换域中的音频信号响度测量及修改
TWI517562B (zh) 2006-04-04 2016-01-11 杜比實驗室特許公司 用於將多聲道音訊信號之全面感知響度縮放一期望量的方法、裝置及電腦程式
CN102684628B (zh) 2006-04-27 2014-11-26 杜比实验室特许公司 修正音频动态处理器的参数的方法以及执行该方法的设备
CN101149921B (zh) * 2006-09-21 2011-08-10 展讯通信(上海)有限公司 一种静音检测方法和装置
KR101137715B1 (ko) 2006-10-20 2012-04-25 돌비 레버러토리즈 라이쎈싱 코오포레이션 리셋을 사용하는 오디오 다이내믹스 프로세싱
US8521314B2 (en) * 2006-11-01 2013-08-27 Dolby Laboratories Licensing Corporation Hierarchical control path with constraints for audio dynamics processing
US20080147389A1 (en) * 2006-12-15 2008-06-19 Motorola, Inc. Method and Apparatus for Robust Speech Activity Detection
CN101681619B (zh) * 2007-05-22 2012-07-04 Lm爱立信电话有限公司 改进的话音活动性检测器
US8396574B2 (en) * 2007-07-13 2013-03-12 Dolby Laboratories Licensing Corporation Audio processing using auditory scene analysis and spectral skewness
US20090043577A1 (en) * 2007-08-10 2009-02-12 Ditech Networks, Inc. Signal presence detection using bi-directional communication data
US8190440B2 (en) * 2008-02-29 2012-05-29 Broadcom Corporation Sub-band codec with native voice activity detection
EP2107553B1 (en) * 2008-03-31 2011-05-18 Harman Becker Automotive Systems GmbH Method for determining barge-in
US8611556B2 (en) * 2008-04-25 2013-12-17 Nokia Corporation Calibrating multiple microphones
US8244528B2 (en) 2008-04-25 2012-08-14 Nokia Corporation Method and apparatus for voice activity determination
US8275136B2 (en) * 2008-04-25 2012-09-25 Nokia Corporation Electronic device speech enhancement
CN101572090B (zh) * 2008-04-30 2013-03-20 向为 一种自适应多速率窄带编码方法及编码器
USD605629S1 (en) 2008-09-29 2009-12-08 Vocollect, Inc. Headset
KR101547344B1 (ko) 2008-10-31 2015-08-27 삼성전자 주식회사 음성복원장치 및 그 방법
TWI384423B (zh) * 2008-11-26 2013-02-01 Ind Tech Res Inst 以聲音事件為基礎之緊急通報方法與系統以及行為軌跡建立方法
CN101609678B (zh) 2008-12-30 2011-07-27 华为技术有限公司 信号压缩方法及其压缩装置
US8160287B2 (en) 2009-05-22 2012-04-17 Vocollect, Inc. Headset with adjustable headband
JP5793500B2 (ja) 2009-10-19 2015-10-14 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 音声区間検出器及び方法
US8438659B2 (en) 2009-11-05 2013-05-07 Vocollect, Inc. Portable computing device and headset interface
FR2956539B1 (fr) * 2010-02-16 2012-03-16 Dominique Retali Procede de detection du fonctionnement d'un dispositif de transmission sans fil de signaux de voix.
US20120143604A1 (en) * 2010-12-07 2012-06-07 Rita Singh Method for Restoring Spectral Components in Denoised Speech Signals
US8954322B2 (en) * 2011-07-25 2015-02-10 Via Telecom Co., Ltd. Acoustic shock protection device and method thereof
US9363603B1 (en) 2013-02-26 2016-06-07 Xfrm Incorporated Surround audio dialog balance assessment
CN111261197B (zh) * 2020-01-13 2022-11-25 中航华东光电(上海)有限公司 一种复杂噪声场景下的实时语音段落追踪方法

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4358738A (en) * 1976-06-07 1982-11-09 Kahn Leonard R Signal presence determination method for use in a contaminated medium
JPS53105303A (en) * 1977-02-25 1978-09-13 Hitachi Ltd Preprocessing system for audio recognition
JPS5850360B2 (ja) * 1978-05-12 1983-11-10 株式会社日立製作所 音声認識装置における前処理方法
JPS59115625A (ja) * 1982-12-22 1984-07-04 Nec Corp 音声検出器
US4731846A (en) * 1983-04-13 1988-03-15 Texas Instruments Incorporated Voice messaging system with pitch tracking based on adaptively filtered LPC residual signal
DE3370423D1 (en) * 1983-06-07 1987-04-23 Ibm Process for activity detection in a voice transmission system
US4700392A (en) * 1983-08-26 1987-10-13 Nec Corporation Speech signal detector having adaptive threshold values
US4696039A (en) * 1983-10-13 1987-09-22 Texas Instruments Incorporated Speech analysis/synthesis system with silence suppression
JPH0748695B2 (ja) * 1986-05-23 1995-05-24 株式会社日立製作所 音声符号化方式
DE68929442T2 (de) * 1988-03-11 2003-10-02 British Telecomm Vorrichtung zur Erfassung von Sprachlauten
US5276765A (en) * 1988-03-11 1994-01-04 British Telecommunications Public Limited Company Voice activity detection
JP2573352B2 (ja) * 1989-04-10 1997-01-22 富士通株式会社 音声検出装置
US5680508A (en) * 1991-05-03 1997-10-21 Itt Corporation Enhancement of speech coding in background noise for low-rate speech coder
IN184794B (sk) * 1993-09-14 2000-09-30 British Telecomm
US5659622A (en) * 1995-11-13 1997-08-19 Motorola, Inc. Method and apparatus for suppressing noise in a communication system

Also Published As

Publication number Publication date
KR100363309B1 (ko) 2003-02-17
JP3224132B2 (ja) 2001-10-29
GR3031515T3 (en) 2000-01-31
DK0719439T3 (da) 2000-02-07
CN1064772C (zh) 2001-04-18
NO307979B1 (no) 2000-06-26
FI118195B (fi) 2007-08-15
EP0719439B1 (en) 1999-07-21
SK31896A3 (en) 1997-03-05
HK1014392A1 (en) 1999-09-24
SG48935A1 (en) 1998-05-18
CZ67896A3 (en) 1996-07-17
CA2169745A1 (en) 1995-03-23
CZ286743B6 (en) 2000-06-14
MY111134A (en) 1999-08-30
FI961158A0 (fi) 1996-03-13
US5749067A (en) 1998-05-05
NO961032D0 (no) 1996-03-13
FI961158A (fi) 1996-03-13
NZ273045A (en) 1996-11-26
EP0719439A1 (en) 1996-07-03
AU673776B2 (en) 1996-11-21
NO961032L (no) 1996-03-13
HU219994B (hu) 2001-10-28
KR960705303A (ko) 1996-10-09
JPH09502814A (ja) 1997-03-18
WO1995008170A1 (en) 1995-03-23
IN184794B (sk) 2000-09-30
DE69419615T2 (de) 2000-05-25
CA2169745C (en) 2000-05-16
BR9407535A (pt) 1997-08-26
DE69419615D1 (de) 1999-08-26
AU7619894A (en) 1995-04-03
US6061647A (en) 2000-05-09
CN1130952A (zh) 1996-09-11
HU9600641D0 (en) 1996-05-28
HUT73986A (en) 1996-10-28
ES2136204T3 (es) 1999-11-16
ATE182420T1 (de) 1999-08-15

Similar Documents

Publication Publication Date Title
SK281796B6 (sk) Detektor hlasu
EP0770988B1 (en) Speech decoding method and portable terminal apparatus
US6023674A (en) Non-parametric voice activity detection
US5642464A (en) Methods and apparatus for noise conditioning in digital speech compression systems using linear predictive coding
JP4307557B2 (ja) 音声活性度検出器
EP1875466B1 (en) Systems and methods for reducing audio noise
CN1985304B (zh) 用于增强型人工带宽扩展的系统和方法
US5970441A (en) Detection of periodicity information from an audio signal
WO2001035395A1 (en) Wide band speech synthesis by means of a mapping matrix
WO1995015550A1 (en) Transmitted noise reduction in communications systems
EP1093112B1 (en) A method for generating speech feature signals and an apparatus for carrying through this method
US6915257B2 (en) Method and apparatus for speech coding with voiced/unvoiced determination
WO2005119649A1 (en) System and method for babble noise detection
JPH0844395A (ja) 音声ピッチ検出装置
Puder Kalman‐filters in subbands for noise reduction with enhanced pitch‐adaptive speech model estimation
AU673776C (en) Voice activity detector
Lin et al. Speech enhancement based on a perceptual modification of Wiener filtering
Tchorz et al. Automatic classification of the acoustical situation using amplitude modulation spectrograms

Legal Events

Date Code Title Description
MK4A Patent expired

Expiry date: 20140914