CZ67896A3 - Voice detector - Google Patents
Voice detector Download PDFInfo
- Publication number
- CZ67896A3 CZ67896A3 CZ96678A CZ67896A CZ67896A3 CZ 67896 A3 CZ67896 A3 CZ 67896A3 CZ 96678 A CZ96678 A CZ 96678A CZ 67896 A CZ67896 A CZ 67896A CZ 67896 A3 CZ67896 A3 CZ 67896A3
- Authority
- CZ
- Czechia
- Prior art keywords
- input signal
- signal
- gain
- detector
- voice
- Prior art date
Links
- 230000003595 spectral effect Effects 0.000 claims abstract description 7
- 238000004364 calculation method Methods 0.000 claims description 9
- 238000005070 sampling Methods 0.000 claims description 5
- 230000001629 suppression Effects 0.000 claims 1
- 238000011144 upstream manufacturing Methods 0.000 claims 1
- 238000001228 spectrum Methods 0.000 abstract description 6
- 238000001914 filtration Methods 0.000 abstract description 4
- 230000004044 response Effects 0.000 abstract description 3
- 230000011664 signaling Effects 0.000 abstract description 2
- 230000000295 complement effect Effects 0.000 abstract 1
- 238000004458 analytical method Methods 0.000 description 20
- 238000001514 detection method Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000007774 longterm Effects 0.000 description 4
- 230000007613 environmental effect Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000003750 conditioning effect Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 239000010261 arctane Substances 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 238000005311 autocorrelation function Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000005352 clarification Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 230000001605 fetal effect Effects 0.000 description 1
- 238000000034 method Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000008054 signal transmission Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L25/84—Detection of presence or absence of voice signals for discriminating voice from noise
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04Q—SELECTING
- H04Q1/00—Details of selecting apparatus or arrangements
- H04Q1/18—Electrical details
- H04Q1/30—Signalling arrangements; Manipulation of signalling currents
- H04Q1/44—Signalling arrangements; Manipulation of signalling currents using alternate current
- H04Q1/444—Signalling arrangements; Manipulation of signalling currents using alternate current with voice-band signalling frequencies
- H04Q1/46—Signalling arrangements; Manipulation of signalling currents using alternate current with voice-band signalling frequencies comprising means for distinguishing between a signalling current of predetermined frequency and a complex current containing that frequency, e.g. speech current
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L2025/783—Detection of presence or absence of voice signals based on threshold decision
- G10L2025/786—Adaptive threshold
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M19/00—Current supply arrangements for telephone systems
- H04M19/08—Current supply arrangements for telephone systems with current supply sources at the substations
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computer Networks & Wireless Communication (AREA)
- Geophysics And Detection Of Objects (AREA)
- Measuring Pulse, Heart Rate, Blood Pressure Or Blood Flow (AREA)
- Electrophonic Musical Instruments (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Telephone Function (AREA)
- Control Of Amplification And Gain Control (AREA)
- Investigating Or Analyzing Materials By The Use Of Electric Means (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
- Digital Transmission Methods That Use Modulated Carrier Waves (AREA)
- Radio Relay Systems (AREA)
- Investigating Or Analysing Materials By The Use Of Chemical Reactions (AREA)
- Electromechanical Clocks (AREA)
- Cosmetics (AREA)
- Measuring Fluid Pressure (AREA)
- Burglar Alarm Systems (AREA)
- Circuit For Audible Band Transducer (AREA)
Description
Oblast techniky
Vynález se týká detektoru přítomnosti řeči ve vstupním signálu.
hlasu pro zjišťování
Dosavadní stav techniky
Detektor hlasu je zařízení, do něhož je přiváděn vstupní signál s cílem stanovit úseky tohoto signálu obsahující řeč nebo úseky obsahující pouze šum. Jedním zvláště významným použitím takových detektorů hlasu, na něž však tento vynález není omezen, jsou mobilní radiové telefonní systémy, kde údaje o přítomnosti či nepřítomnosti řeči v signálu mohou být využívány pro snížení spotřeby energie a pro snížení interference způsobené vypínáním telefonu v úsecích ticha. U těchto mobilních systémů je v důsledku umístění jednotek ve vozidlech obvykle vysoká úroveň šumu. Další možností je použití u radiových systémů pro zlepšení využití radiového spektra.
Na Obr.l je zobrazen známý detektor hlasu tak, jak je popsán v PCT patentové přihlášce č. W089/08910.
Na jeho vstupu 1 jsou přijímány signály. Pamšt 2 pak obsahuje údaje definující předpoklad nebo model frekvenčního spektra šumu. Tyto údaje jsou následně porovnávány 3. se spektrem přicházejícího signálu a získá se míra jejich podobnosti, která se dále porovnává 4 s prahovou hodnotou. Pro sledování změn v šumové složce je model šumu aktualizován ze vstupu a to pouze v době nepřítomnosti řeči ve vstupním signálu. Rovněž uvedená prahová hodnota může být upravována (adaptérem .
S cílem zaručit, že k úpravám modelu šumu dojde jenom v obdobích, kdy vstupní signál obsahuje, pouze______šum, __ ^ez nebezpečí postupné nesprávné aktualizace, která by následovala po špatném rozhodnutí, je jeho úprava prováděna za řízení pomocným detektorem 7., který zahrnuje detektor nehlasových zvuků 8. a detektor hlasových zvuků 2. Pomocný detektor ]_ považuje řeč za přítomnou ve vstupním signálu, jestliže oba detektory 8. a 9. zjistí zvuk. Po tomto zjištění je následně umožněna aktualizace šumového modelu i úprava prahové hodnoty hlavního detektoru. Detektor nehlasových zvuků .§. získává sadu LPC koeficientů signálu a porovnává autokorelační funkci těchto koeficientů mezi po sobě následujícími snímky, zatímco'detektor hlasových zvuků £ zkoumá změny autokorelace LPC zbytkového signálu.
Toto uspořádání je velmi úspěšné pro rozlišování úseků řeči a úseků v nichž je přijímán pouze šum. Problém je však v tom, že pomocný detektor 7 považuje za běžný šum i signální tóny (tj . pomocný detektor 7 v nich nerozpozná řeč) tak, že hlavní detektor aktualizuje model šumu podle těchto tónu, jako kdyby byly šumem, a dále v tom, že dojde k zabránění přenosu signálních tónů, nebo alespoň k předčasnému přerušení jejich přenosu.
Tento problém by bylo možno překonat přidáním tónových detektoru, přičemž každý by byl naladěn na frekvenci konkrétního signálního tónu. Rozmanitost jednotlivých signálních tónů ve světě je však značná, takže by bylo potřeba velkého množství jednotlivých detektorů, aby například uživatel mobilního telefonu uskutečňující mezinárodní hovor mohl slyšet obsazovací tón nezávisle na zemi v které vznikl.
Podstata vynálezu
Detektoru hlasu pro zjištování přítomnosti řeči ve vstupním signálu zahrnuje:
a) prostředky pro uchování modelu šumové složky vstupního signálu;
b) prostředky zjištující spektrální podobnost vstupního signálu s uloženým modelem šumu pro vytváření výstupního rozhodovacího signálu;
c) prostředky pro aktualizaci uloženého modelu šumu;
d) pomocný detektor uspořádaný pro ovládání aktualizačních prostředků tak, aby k aktualizaci došlo pouze v době, kdy pomocný detektor udává, že vstupní signál neobsahuje řeč.
Podstata řešení podle tohoto vynálezu pak spočívá v tom, že detektor hlasu zahrnuje prostředky pro výpočet parametru předurčeného zisku vstupního signálu a dále modifikační prostředky uspořádané pro znemožnění aktualizace uloženého modelu šumu v případě, že předurčený zisk překročí prahovou hodnotu.
Objasnění obrázků na výkresech
Následně budou popsána některá provedení tohoto vynálezu s odkazem na přiložené výkresy, kde;
Obr.l zobrazuje blokové schéma známého detektoru hlasu podle PCT přihlášky vynálezu č.W089/08910;
Obr.2 představuje blokové schéma zvukového kodéru s detektorem hlasu podle tohoto vynálezu;
Obr. 3 a Obr.4 ukazují graficky hodnoty předurčeného zisku u různých vstupních signálů;
Obr.5, Obr.6 a Obr.7 představují bloková schémata dalších provedení tohoto vynálezu.
Příklady uskutečnění vynálezu
Běžný zvukový kodér 1.00 na Obr . 2 má zvukový vstup 101. Zvukový signál· je zde vzorkován při 8 kHz a převáděn do digitální formy analogově-digitálním převodníkem 102. Jednotka 103 rozděluje zvukové vzorky do snímků s (například) 160 vzorky (tj . do 20ms vzorků) a multipluje je funkcí, která snižuje podíl vzorků na začátku a na konci snímku. Korelátor 104 přijímá digitalizované zvukové vzorky a vytváří pro každý snímek autokorelační koeficienty Rj_. Jednotka LPC analýzy 105 vypočítává za použití známé metody, např. Levinson-Durbinovým nebo Schurrovým algoritmem, koeficienty a-j. filtru (někdy označovaného jako syntézní filtr), majícího frekvenční charakteristiku, která odpovídá frekvenčnímu spektru vstupního zvukového signálu.
Digitalizovaný vstupní signál prochází rovněž inverzním filtrem (nebo anaiýzním filtrem) 106, ovládaným koeficienty, pro vytvoření zbytkového signálu, který je dále analyzován jednotkou 107 dlouhodobé předpovědi, která vypočítává optimální zpoždění pro předurčení LPC zbytkového signálu z jeho předchozích hodnot a odpovídající hodnotu zisku pro předurčení. Analyzní jednotka 106 vytváří také druhý zbytkový signál (tj . rozdíl mezi současným LPC zbytkovým signálem a LPC zbytkovým signálem po zpoždění a vyvážení získanými parametry). Budící jednotka 10S získává parametry pro přenos do dekodéru ze zbytkového signálu dlouhodobého předurčení (LTP), nebo jinými známými prostředky.
LPC koeficienty a^, zpoždění d, zisk g a budící parametry e jsou přenášeny do dekodéru.
Hlavní detektor hlasu podle dříve zmíněné patentové přihlášky zjištuje průměr autokorelačních koeficientů Rj_ pomocí nivelizačního zařízení 110, které vytváří vážený součet Rg' současných koeficientů a koeficientů z předchozích snímků, uložených v paměti 111. Další autokorelátor 112 vytváří autokorelační koeficienty Bj_ těchto LPC koeficientů , které přecházejí do paměti 113. Obsah paměti je aktualizován pouze v průběhu úseků vstupního signálu, o nichž pomocný detektor, který bude popsán níže, předpokládá, že obsahují pouze šum. Obsah paměti 113 Bj_ pak představuje odhad gumového spektra vstupního signálu. Násobná/součtová jednotka 114 pak vytváří míru M spektrální podobnosti mezi vstupním signálem a šumovým modelem, která je definována jako
Ri' Bi' n
M = Bo' + 2^3 1-1 R ' Ko
Nulový spodní index značí počáteční autokorelační koeficient a n je počet vzorků ve zvukovém snímku.
Míra M spektrální podobnosti se pak v komparátoru 115 porovnává s prahovou hodnotou a na výstupu 116 se vytváří signál indikující přítomnost nebo nepřítomnost řeči ve vstupním signálu. Prahová hodnota může být přizpůsobitelné nastavena (117) podle aktuální úrovně šumu.
Aktualizace modelu šumu uloženého v paměti 113 není ovládána výstupem 116 právě popsaného detektoru, nebot chyba v rozpoznání řeči by měla za následek aktualizaci paměti informací o řeči a následné další chyby v rozpoznávání. Z tohoto důvodu je aktualizace řízena pomocným detektorem 200. Aby bylo možno odlišit šum a nehlasový zvuk je vytvářen (201) součet (nezprůměrovaných) autokorelačních koeficientů Bi LPC koeficientů. Odčítač 202 porovnává tento součet s odpovídajícím součtem u předcházejícího zvukového snímku uloženého v paměti 203. Tento rozdíl, představující spektrální podobnost mezi po sobě následujícími snímky vstupního signálu, je pro vytvoření rozhodovacího signálu porovnán s prahovou hodnotou (204).
Pro rozpoznání hlasového zvuku se jednotkou 205 analýzy výšek měří zpoždění d. Výstup této jednotky je v součtovém hradlu 206 sloučen s výstupem prahujícího stupně 204. Pomocný detektor 200 indikuje přítomnost hlasu ve vstupním signálu, jestliže každá z jednotek 204 a 205 vytváří výstupní signál indikující přítomnost hlasu. Jak bylo diskutováno již v úvodu, má-li systém propouštět signální tóny, musí tyto rozpoznávat spíše jako řeč než jako šum. Právě popsaný pomocný detektor však není pro dosažení tohoto cíle příliš efektivní. Ačkoliv rozpoznává určité signální tóny, jiné (obecně ty, které mají relativně chudý spektrální obsah) nejsou rozpoznány. Když dojde k chybě pomocného detektoru 200, dojde rovněž k chybě hlavního detektoru, nebot model šumu v paměti 113 je pak adaptován podle signálního tónu.
Pro zjištování signálních tónů ve vstupním signálu je proto vytvořen další pomocný detektor. Výhodně je využíváno zjištění, že signální tóny, které jsou uměle generovány, obsahují malý počet' kmitočtových složek (které mohou být modulovány). Pro takové signály je použitím rozlišení mezi tónově založenými signály (včetně vícetónových signálů) a pozadím nebo šumovými signály okolí výkon LPC předurčovače zvláště vysoký.
. LPC předurčený zisk Gp je definován jako poměr výkonu vstupního signálu a výkonu výstupního signálu u hlasového snímku x2(i) ía0
Gp = , n·1
Vj y2 (i) i«o kde Xj_ je vstup filtru a y-j_ je výstup inverzního filtru:
m y(t) = x(t) + ^y(t - i) i-i kde m je počet koeficientů filtru, který bývá obvykle 3 nebo
10. Signály x(i) a y (i) se získávají z LPC kodéru 100, na výstupech převodníku 102 resp. filtru 106 . Tyto hodnoty jsou umocněny (301. 302) a předurčený zisk se stanoví v aritmetické jednotce 303, která vypočítává Gp podle shora uvedené rovnice. Výstup této jednotky 303 jev komparátóru 304 porovnán s pevnou prahovou hodnotou T. Jestliže předurčený zisk přesahuje tuto prahovou hodnotu (obvykle T =63 dB nebo T = 18 dB) , je tón pokládán za rozpoznaný. Existuje několik možných reakcí na rozpoznání tónu:
a) nahradit výstup hlavního detektoru prostředky součtového hradla 303;
b) nahradit pomocný detektor prostředky třetího vstupu do součtového hradla 206;
c) obě předešlé možnosti.
Samozřejmě místo výpočtu podílu může být výraz TS x2 porovnáván s výrazem Σ y2' vynásobeným prahovou hodnotou. Na Obr.3 jsou zobrazeny histogramy předurčených zisků v dB, které byly získány ze šumu pozadí, z řeči, ze šumu pozadí v signálních tónech a ze samotných signálních tónů. Na Obr.4 jsou pak zobrazeny diagramy předurčeného zisku v závislosti na čase u různých signálních tónů používaných ve Velké Británii, konkrétné u:
obsazovacího tónu, oznamovacího tónu, vyzváněcího tónu, tónu volané číslo neexistuje, a tónu zařízení obsazeno.
V praxi jsou obsazovací tón, oznamovací tón a tón volané číslo neexistuje úspěšné rozpoznávány dalším detektorem, stejně jako multifrekvenční tóny. Vyzváněcí tón a tón zařízení obsazeno jsou rozpoznávány jednotkou 205 analýzy výšek.
Další detektor 300 lze považovat za detektor určitých druhů tónů, alternativně (u provedení z Obr.2) může být považován za detektor situace, kdy zbytkový signál yj_ je tak malý, že funkce jednotky 107 dlouhodobého předurčení (a tím jednotky 205 analýzy výšek) není silná.
Alternativní možností zjištování hlasového zvuku je nahradit detektor výšek 205 jednotkami analogickými k jednotkám 301, 302, 303 a 304 a založit vytváření předurčeného zisku na analýze dlouhodobého předurčení 107.
Dále budou s odkazem na Obr.5 popsány dvě modifikace zařízení z Obr.2. Vypočítávaný zisk je u provedení z Obr . 2 ziskem LPC analýzy zvukového kodéru 100, která by mohla obvykle používat předurčovač osmého nebo desátého řádu. Při vědomí toho, že základem této části analýzy je, že informační tóny rezultují ve větších předurčených ziscích než šum prostředí a že čím vyšší je řád analýzy, tím vyšší je schopnost předurčovače modelovat šum prostředí, bylo zjištěno, že omezením výpočtu zisku na analýzu čtvrtého řádu dávají informační signály, sestávající z jednoho nebo dvou tónu, vysoký předurčený zisk, zatímco předurčený zisk u šumu prostředí může být snížen.
Principiálně by toto bylo možno dosáhnout použitím analýzy čtvrtého řádu a použitím filtru vedle jednotek 105, 106 pro zásobování pomocného detektoru signálem, avšak snazší je vypočítat předurčený zisk z reflexních koeficientů (někdy uváděných jako Parcor koeficienty). Na Obr.5 jsou tyto reflexní koeficienty vypočítávány známým způsobem z autokorelačních koeficientů Rj_ jednotkou 400 (ačkoliv v závislosti na provedení zvukového kodéru by mohlo být možno snímat je z mezilehlého bodu jednotky 105 LPC analýzy). Míru předurčeného zisku, chybu předurčeni Pe, lze získat výpočtem z prvních čtyř reflexních koeficientů Rc-[ podle vzorce:
Pe = ^-nci2)
1-1
Tento výpočet se provádí v jednotce 401. Velká chyba předurčení Pe odpovídá nízkému předurčenému zisku a naopak. Signální tón se proto považuje za přítomný ve vstupním signálu, jestliže hodnota Pe je menší než prahová hodnota Pth. Toto srovnání 403 nahradilo srovnávání 304 z Obr.2.
Šum okolního prostředí mobilního telefonu obsahuje velmi silné rezonance na nízkých frekvencích. Pro zjištění, zda je tón pod prahovou frekvencí se provádí další test. Volba prahové hodnoty v sobě zahrnuje určitý stupeň kompromisu, avšak doporučována je hodnota 385 Hz, nebot většina signálních tónů leží pod 400Hz.
Tento další test pracuje tak, že jsou stanoveny pólové frekvence LPC filtru. Pro zmenšení komplexnosti analýzy je výhodný filtr nízkého řádu. Následně by mohla být provedena další LPC analýza, ale jednodušší je pokračovat, jako u provedení na Obr.5, výpočtem LPC koeficientů z reflexních koeficientů. 'Za předpokladu, že se použijí pouze první dva reflexní koeficienty z jednotky 400. jsou LPC koeficienty ax vypočítány běžným způsobem jednotkou 404, která je definována tak, aby citlivost syntézního filtru byla:
H(z) = 1/ (a0 + ax z’1 + a2 z’2)
Pak jsou polohy kvadratické rovnice pólů v rovině z dány řešením a0 z2 + ax z + a2 = 0 a0 - 1
4aai2
Jestliže výraz pod druhou odmocninou je záporný, pak póly leží na reálné ose a vstupní signál není signálním tónem. Jestliže je tento výraz kladný, ale reálná část polohy pólu je záporná (tj. ax < 0), pak je pól v levé polovině roviny z. To nezbytně znamená, že frekvence je více než 25% hodnoty vzorkovací frekvence, tj . více než 2000 Hz pro vzorkovací frekvenci fs = 8 kHz. V takovém případě je výpočet zbytečný a signál > 385 může být ihned generován.
Pólová frekvence je dána rovnicí:
f = arctan '\4az V
2rr x
j ednotky
Podmínku, že f < 385 Hz lze zapsat (vyloučením druhých odmocnin jako:
f 2rr x 385 (4a2 - a^) / ax 2 < tan2 Xi fs J nebo jako:
(4a2 - aj.2) / ax2) < 0,0973 při fs = 8kHz
Tento výpočet se provádí v jednotce 405. Její výstup je sloučen v AND hradle 406 s výstupem komparátoru 403, takže rozhodnutí o tom, že se jedná o signální tón vznikne pouze, když předurčený zisk je velký a zároveň když je pólová frekvence větší než 385 Hz.
Jestliže je to požadováno, může být pólová frekvence vyšší než 2000 Hz (nebo vyšší než nějaký jiný horní limit) také odloučena, aby vysoké frekvence nad předpokládaným, rozsahem signálních tónů nemohly být rozpoznány jako signální tóny.
Jestliže se při řešení kvadratické rovnice použije zvláštního výpočtu, je možné použít také třetí a čtvrtý reflexní koeficient. V tomto případě by mohly být zjištěny dva sdružené komplexní páry pólů s dvěma frekvencemi. Je zřejmé, že v takovém případě by signální tón nebyl pokládán za přítomný ve vstupním signálu, kdyby obě frekvence byly pod prahovou hodnotou.
Bylo již uvedeno, že provedení vynálezu z Obr.2 a Obr.5 používají před autokorelačním výpočtem 103 rozdělení zvukových vzorků do snímků (jak je běžné u LPC analýzy založené na autokoreiaci). Jestliže se u hlasového kodéru nepožaduje provádět tuto činnost, je možnou alternativou případu z Obr.5 vypustit jednotku 103 a nahradit výpočet reflexního koeficientu 400 konverzí autokorelačních hodnot na kovariantní hodnoty, 401, 404 modifikovat pro využití těchto kovariančních hodnot oproti využití reflexních koeficientů. Alternativně, jak ukazuje Obr.6 (kde jsou zobrazeny pouze ty části, které byly oproti Obr.5 změněny), může být počáteční zpracování provedeno prostředky kovariantní analýzy 109. jejichž výstup je přiváděn do kalkulátoru 400' reflexního koeficientu a do jednotky 104' modifikace autokorelačního koeficientu. Jednotka 105 LPC analýzy může být spojena, jako předtím s autokorelační jednotkou 104z, nebo, jak je zobrazeno, přímo s jednotkou 109 kovariantní analýzy.
Výše popsaná provedení pro detekci signálních tónů mají dobré výsledky, avšak mohou selhat u mechanicky generovaných tónů, které se používají v určitých teritoriích. Tyto mechanicky generované tóny mají vyšší harmonickou složku rezultující v malém předurčeném zisku. Prosté odfiltrování vyšších harmonických není řešením, nebot vložení filtru vede ke zvýšení autokorelace všech signálů a tím k větším předurčeným ziskům rovněž u ostatních signálů. Bylo zjištěno, že předurčovač má snahu spíše upravovat póly filtru než charakteristiky vstupního signálu. Nicméně bylo také zjištěno, že dobré výsledky je možno získat filtrací, jestliže analýza předurčeného zisku je omezena na stanovení předurčení signálu pouze ve frekvenčním rozsahu odpovídajícím pásmu propustnosti harmonického filtru. Toho se dosáhne vzorkováním signálu frekvencí dvojnásobnou oproti šířce pásma filtru před analýzou předurčeného zisku.
Provedení vynálezu zobrazené na Obr.7, které je v jiných ohledech podobné provedení z Obr.5, proto používá filtr 450 , kterým je nízkopropustný FIR filtr, mající pásmo propustnosti do 600 (3 dB) a mající zeslabení potlačovaného pásma 20 dB při 1200 Hz. Výhodné je,, když zeslabení potlačovaného pásma není příliš velké. V/étup filtru 450 je vzorkován při 1200 Hz ve vzorkovací jednotce 451.
U tohoto filtrování jsou velmi redukovány možnosti tónové detekce sdílet komponenty s hlasovým kodérem 1.00; do filtru 450 je tudíž digitalizovaný vstupní signál přiváděn přímo z analogově - digi tálního převodníku 102 a jeho výstup směřuje do jednotky 400z z analýzy reflexních koeficientů nebo do jednotky kovariantní nebo autokorelační analýzy tak, jak bylo popsáno dříve.
Další provedení vynálezu zmírňuje problém harmonických složek bez nadměrného omezování frekvenčního pásma analýzy předurčovaného zisku. Toho je dosaženo použitím filtrů rozdělujících vstupní signál na dvě nebo více frekvenčních pásem, kde každé' toto pásmo je dostatečně úzké na to, aby nemohlo obsahovat základní a třetí harmonickou signálního tónu. Každý kanál je pak vzorkován a podroben oddělené analýze předurčeného zisku.
U provedení podle Obr.8 je signál filtry 450a a 450b rozdělen na dvě frekvenční pásma 400 až 1200 Hz a 1200 až 2000 Hz a vzorkován při 1,6 kHz (45ia, 451b) . Výpočet reflexního koeficientu 4 0 0 z a a 400 zb, analýza chyby předurčení , 401a, 40lb a pracování 403a, 403b jsou prováděny odděleně pro obě pásma. Dva výstupy z komparátoru 403a a 403b jsou vedeny na oddělené vstupy součtového hradla 206 tak, aby vysoký předurčený zisk v obou kanálech byl pokládán za indikaci přítomnosti signálního tónu. Ostatní prvky 100 až 303 z Obr.7 nejsou u na Obr.3 zobrazeny, nebot jsou u obou provedení stej né.
JAít NIS VIA 0H3AG S.VAi ydd avy o
Claims (8)
1. Detektor hlasu pro zjišťování přítoi vstupním signálu zahrnující:
a) prostředky pro uchování modelu šumové složky vstupního signálu;
b) prostředky zjišťující spektrální podobnost vstupního signálu s uloženým modelem šumu pro vytváření výstupního rozhodovacího signálu;
c) prostředky pro aktualizaci uloženého modelu šumu
d) pomocný detektor uspořádaný pro řízení aktualizačních prostředků tak, aby k aktualizaci došlo pouze v době, kdy pomocný detektor udává, že vstupní signál neobsahuje řeč;
vyznačující se tím, že zahrnuje prostředky pro výpočet parametru předurčeného zisku vstupního signálu a modifikační prostředky uspořádané pro znemožnění aktualizace v případě, že předurčený zisk překročí prahovou hodnotu.
2. Detektor hlasu podle nároku l, vyznačující se tím, že pomocný detektor zahrnuje detektor hlasových zvuků reagující na signály odvozené z LPC zbytkového signálu.
3. Detektor hlasu podle nároku 1 nebo 2, vyznačující se tím, že parametr zisku představuje předurčený zisk LPC předurčení šestého nebo nižšího řádu.
4. Detektor hlasu podle nároku 3, vyznačující se tím, že parametr zisku představuje předurčený zisk LPC předurčení čtvrtého nebo nižšího řádu.
0130Q . v , i ι: Β 9 i * iosti řeči | ve •r-o
5. Detektor hlasu podle kteréhokoliv z předchozích nároků, vyznačující se tím, že dále zahrnuje prostředky pro zjištování jedné nebo více primárních frekvenčních složek vstupního signálu a prostředky schopné porovnat frekvence s předem stanovenou prahovou hodnotou a umožnit potlačení aktualizace pouze v případě, že uvedená primární složka překračuje prahovou hodnotu.
6 . Detektor hlasu podle kteréhokoliv z předchozích nároků, vyznačující se tím, že před prostředky pro výpočet zisku je předřazen filtr pro odstranění horní části frekvenčního rozsahu vstupního signálu, přičemž výpočet zisku je prováděn pouze pro frekvenční složky ležící v pásmu propustnosti filtru.
7. Detektor hlasu podle nároku 6, vyznačující se tím, že má dva filtry s příslušnými pásmy propustnosti a příslušné výpočtové prostředky pro výpočet parametrů zisku u příslušných pásem propustnosti, modifikační prostředky uspořádané pro potlačení aktualizace v případě, že předurčený zisk přesahuje v obou pásmech propustnosti prahovou hodnotu.
8. Detektor hlasu podle nároku 6 nebo 7, vyznačující se tím, že zahrnuje prostředky pro vzorkování filtrovaného signálu (signálů).
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP93307211 | 1993-09-14 | ||
GB939324967A GB9324967D0 (en) | 1993-12-06 | 1993-12-06 | Voice activity detector |
GB9412451A GB9412451D0 (en) | 1994-06-21 | 1994-06-21 | Voice activity detector |
Publications (2)
Publication Number | Publication Date |
---|---|
CZ67896A3 true CZ67896A3 (en) | 1996-07-17 |
CZ286743B6 CZ286743B6 (en) | 2000-06-14 |
Family
ID=27235491
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CZ1996678A CZ286743B6 (en) | 1993-09-14 | 1994-09-14 | Voice detector |
Country Status (23)
Country | Link |
---|---|
US (2) | US5749067A (cs) |
EP (1) | EP0719439B1 (cs) |
JP (1) | JP3224132B2 (cs) |
KR (1) | KR100363309B1 (cs) |
CN (1) | CN1064772C (cs) |
AT (1) | ATE182420T1 (cs) |
BR (1) | BR9407535A (cs) |
CA (1) | CA2169745C (cs) |
CZ (1) | CZ286743B6 (cs) |
DE (1) | DE69419615T2 (cs) |
DK (1) | DK0719439T3 (cs) |
ES (1) | ES2136204T3 (cs) |
FI (1) | FI118195B (cs) |
GR (1) | GR3031515T3 (cs) |
HK (1) | HK1014392A1 (cs) |
HU (1) | HU219994B (cs) |
IN (1) | IN184794B (cs) |
MY (1) | MY111134A (cs) |
NO (1) | NO307979B1 (cs) |
NZ (1) | NZ273045A (cs) |
SG (1) | SG48935A1 (cs) |
SK (1) | SK281796B6 (cs) |
WO (1) | WO1995008170A1 (cs) |
Families Citing this family (96)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
IN184794B (cs) * | 1993-09-14 | 2000-09-30 | British Telecomm | |
JP3522012B2 (ja) * | 1995-08-23 | 2004-04-26 | 沖電気工業株式会社 | コード励振線形予測符号化装置 |
FI100840B (fi) | 1995-12-12 | 1998-02-27 | Nokia Mobile Phones Ltd | Kohinanvaimennin ja menetelmä taustakohinan vaimentamiseksi kohinaises ta puheesta sekä matkaviestin |
US6427134B1 (en) * | 1996-07-03 | 2002-07-30 | British Telecommunications Public Limited Company | Voice activity detector for calculating spectral irregularity measure on the basis of spectral difference measurements |
US6708146B1 (en) * | 1997-01-03 | 2004-03-16 | Telecommunications Research Laboratories | Voiceband signal classifier |
JPH10247098A (ja) * | 1997-03-04 | 1998-09-14 | Mitsubishi Electric Corp | 可変レート音声符号化方法、可変レート音声復号化方法 |
US6531982B1 (en) | 1997-09-30 | 2003-03-11 | Sirf Technology, Inc. | Field unit for use in a GPS system |
US5970446A (en) | 1997-11-25 | 1999-10-19 | At&T Corp | Selective noise/channel/coding models and recognizers for automatic speech recognition |
US6385548B2 (en) * | 1997-12-12 | 2002-05-07 | Motorola, Inc. | Apparatus and method for detecting and characterizing signals in a communication system |
US6327471B1 (en) | 1998-02-19 | 2001-12-04 | Conexant Systems, Inc. | Method and an apparatus for positioning system assisted cellular radiotelephone handoff and dropoff |
US5991718A (en) * | 1998-02-27 | 1999-11-23 | At&T Corp. | System and method for noise threshold adaptation for voice activity detection in nonstationary noise environments |
US6182035B1 (en) | 1998-03-26 | 2001-01-30 | Telefonaktiebolaget Lm Ericsson (Publ) | Method and apparatus for detecting voice activity |
US6348744B1 (en) | 1998-04-14 | 2002-02-19 | Conexant Systems, Inc. | Integrated power management module |
US6453289B1 (en) | 1998-07-24 | 2002-09-17 | Hughes Electronics Corporation | Method of noise reduction for speech codecs |
US7711038B1 (en) | 1998-09-01 | 2010-05-04 | Sirf Technology, Inc. | System and method for despreading in a spread spectrum matched filter |
US7545854B1 (en) | 1998-09-01 | 2009-06-09 | Sirf Technology, Inc. | Doppler corrected spread spectrum matched filter |
US6693953B2 (en) | 1998-09-30 | 2004-02-17 | Skyworks Solutions, Inc. | Adaptive wireless communication receiver |
US6448925B1 (en) | 1999-02-04 | 2002-09-10 | Conexant Systems, Inc. | Jamming detection and blanking for GPS receivers |
US6606349B1 (en) | 1999-02-04 | 2003-08-12 | Sirf Technology, Inc. | Spread spectrum receiver performance improvement |
US6556967B1 (en) | 1999-03-12 | 2003-04-29 | The United States Of America As Represented By The National Security Agency | Voice activity detector |
US6304216B1 (en) | 1999-03-30 | 2001-10-16 | Conexant Systems, Inc. | Signal detector employing correlation analysis of non-uniform and disjoint sample segments |
US6577271B1 (en) | 1999-03-30 | 2003-06-10 | Sirf Technology, Inc | Signal detector employing coherent integration |
US6618701B2 (en) * | 1999-04-19 | 2003-09-09 | Motorola, Inc. | Method and system for noise suppression using external voice activity detection |
US6381568B1 (en) | 1999-05-05 | 2002-04-30 | The United States Of America As Represented By The National Security Agency | Method of transmitting speech using discontinuous transmission and comfort noise |
US6351486B1 (en) | 1999-05-25 | 2002-02-26 | Conexant Systems, Inc. | Accelerated selection of a base station in a wireless communication system |
JP3929686B2 (ja) * | 2000-08-14 | 2007-06-13 | 松下電器産業株式会社 | 音声スイッチング装置およびその方法 |
US6788655B1 (en) | 2000-04-18 | 2004-09-07 | Sirf Technology, Inc. | Personal communications device with ratio counter |
US6931055B1 (en) | 2000-04-18 | 2005-08-16 | Sirf Technology, Inc. | Signal detector employing a doppler phase correction system |
US6714158B1 (en) * | 2000-04-18 | 2004-03-30 | Sirf Technology, Inc. | Method and system for data detection in a global positioning system satellite receiver |
US6952440B1 (en) | 2000-04-18 | 2005-10-04 | Sirf Technology, Inc. | Signal detector employing a Doppler phase correction system |
FR2808391B1 (fr) * | 2000-04-28 | 2002-06-07 | France Telecom | Systeme de reception pour antenne multicapteur |
US7885314B1 (en) | 2000-05-02 | 2011-02-08 | Kenneth Scott Walley | Cancellation system and method for a wireless positioning system |
US6778136B2 (en) | 2001-12-13 | 2004-08-17 | Sirf Technology, Inc. | Fast acquisition of GPS signal |
JP4201471B2 (ja) * | 2000-09-12 | 2008-12-24 | パイオニア株式会社 | 音声認識システム |
JP4201470B2 (ja) * | 2000-09-12 | 2008-12-24 | パイオニア株式会社 | 音声認識システム |
US7472059B2 (en) * | 2000-12-08 | 2008-12-30 | Qualcomm Incorporated | Method and apparatus for robust speech classification |
US7437286B2 (en) * | 2000-12-27 | 2008-10-14 | Intel Corporation | Voice barge-in in telephony speech recognition |
US6707869B1 (en) * | 2000-12-28 | 2004-03-16 | Nortel Networks Limited | Signal-processing apparatus with a filter of flexible window design |
DE10121532A1 (de) * | 2001-05-03 | 2002-11-07 | Siemens Ag | Verfahren und Vorrichtung zur automatischen Differenzierung und/oder Detektion akustischer Signale |
JP3859462B2 (ja) * | 2001-05-18 | 2006-12-20 | 株式会社東芝 | 予測パラメータ分析装置および予測パラメータ分析方法 |
KR100399057B1 (ko) * | 2001-08-07 | 2003-09-26 | 한국전자통신연구원 | 이동통신 시스템의 음성 활성도 측정 장치 및 그 방법 |
US20030110029A1 (en) * | 2001-12-07 | 2003-06-12 | Masoud Ahmadi | Noise detection and cancellation in communications systems |
AU2003212285A1 (en) * | 2002-03-08 | 2003-09-22 | Koninklijke Kpn N.V. | Method and system for measuring a system's transmission quality |
US7454331B2 (en) | 2002-08-30 | 2008-11-18 | Dolby Laboratories Licensing Corporation | Controlling loudness of speech in signals that contain speech and other types of audio material |
US20040064314A1 (en) * | 2002-09-27 | 2004-04-01 | Aubert Nicolas De Saint | Methods and apparatus for speech end-point detection |
US7146316B2 (en) * | 2002-10-17 | 2006-12-05 | Clarity Technologies, Inc. | Noise reduction in subbanded speech signals |
US7272552B1 (en) * | 2002-12-27 | 2007-09-18 | At&T Corp. | Voice activity detection and silence suppression in a packet network |
US7230955B1 (en) | 2002-12-27 | 2007-06-12 | At & T Corp. | System and method for improved use of voice activity detection |
JP2004341339A (ja) * | 2003-05-16 | 2004-12-02 | Mitsubishi Electric Corp | 雑音抑圧装置 |
KR101164937B1 (ko) * | 2003-05-28 | 2012-07-12 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 오디오 신호의 인식된 라우드니스를 계산 및 조정하는방법, 장치 및 컴퓨터 프로그램 |
EP1661916A4 (en) | 2003-07-16 | 2008-10-01 | Daikin Ind Ltd | PROCESS FOR PREPARING FLUOROUS POLYMER, AQUEOUS DISPERSION OF FLUOROUS POLYMER, 2-ACYLOXYCARBOXYLENE DERIVATIVE AND TENSID |
SG119199A1 (en) * | 2003-09-30 | 2006-02-28 | Stmicroelectronics Asia Pacfic | Voice activity detector |
JP4497911B2 (ja) * | 2003-12-16 | 2010-07-07 | キヤノン株式会社 | 信号検出装置および方法、ならびにプログラム |
US20050209762A1 (en) * | 2004-03-18 | 2005-09-22 | Ford Global Technologies, Llc | Method and apparatus for controlling a vehicle using an object detection system and brake-steer |
FI20045315A (fi) * | 2004-08-30 | 2006-03-01 | Nokia Corp | Ääniaktiivisuuden havaitseminen äänisignaalissa |
US8199933B2 (en) | 2004-10-26 | 2012-06-12 | Dolby Laboratories Licensing Corporation | Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal |
AU2005299410B2 (en) | 2004-10-26 | 2011-04-07 | Dolby Laboratories Licensing Corporation | Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal |
JP4729927B2 (ja) * | 2005-01-11 | 2011-07-20 | ソニー株式会社 | 音声検出装置、自動撮像装置、および音声検出方法 |
PL1931197T3 (pl) * | 2005-04-18 | 2015-09-30 | Basf Se | Preparat zawierający co najmniej jeden fungicyd konazolowy, inny fungicyd i jeden kopolimer stabilizujący |
US7826945B2 (en) * | 2005-07-01 | 2010-11-02 | You Zhang | Automobile speech-recognition interface |
DE102006032967B4 (de) * | 2005-07-28 | 2012-04-19 | S. Siedle & Söhne Telefon- und Telegrafenwerke OHG | Hausanlage und Verfahren zum Betreiben einer Hausanlage |
GB2430129B (en) * | 2005-09-08 | 2007-10-31 | Motorola Inc | Voice activity detector and method of operation therein |
TWI330355B (en) * | 2005-12-05 | 2010-09-11 | Qualcomm Inc | Systems, methods, and apparatus for detection of tonal components |
US8417185B2 (en) * | 2005-12-16 | 2013-04-09 | Vocollect, Inc. | Wireless headset and method for robust voice data communication |
US7773767B2 (en) | 2006-02-06 | 2010-08-10 | Vocollect, Inc. | Headset terminal with rear stability strap |
US7885419B2 (en) * | 2006-02-06 | 2011-02-08 | Vocollect, Inc. | Headset terminal with speech functionality |
EP1982324B1 (en) | 2006-02-10 | 2014-09-24 | Telefonaktiebolaget LM Ericsson (publ) | A voice detector and a method for suppressing sub-bands in a voice detector |
US8920343B2 (en) | 2006-03-23 | 2014-12-30 | Michael Edward Sabatino | Apparatus for acquiring and processing of physiological auditory signals |
CN101410892B (zh) * | 2006-04-04 | 2012-08-08 | 杜比实验室特许公司 | 改进的离散余弦变换域中的音频信号响度测量及修改 |
TWI517562B (zh) | 2006-04-04 | 2016-01-11 | 杜比實驗室特許公司 | 用於將多聲道音訊信號之全面感知響度縮放一期望量的方法、裝置及電腦程式 |
DE602007011594D1 (de) | 2006-04-27 | 2011-02-10 | Dolby Lab Licensing Corp | Tonverstärkungsregelung mit erfassung von publikumsereignissen auf der basis von spezifischer lautstärke |
CN101149921B (zh) * | 2006-09-21 | 2011-08-10 | 展讯通信(上海)有限公司 | 一种静音检测方法和装置 |
JP4940308B2 (ja) | 2006-10-20 | 2012-05-30 | ドルビー ラボラトリーズ ライセンシング コーポレイション | リセットを用いるオーディオダイナミクス処理 |
US8521314B2 (en) * | 2006-11-01 | 2013-08-27 | Dolby Laboratories Licensing Corporation | Hierarchical control path with constraints for audio dynamics processing |
US20080147389A1 (en) * | 2006-12-15 | 2008-06-19 | Motorola, Inc. | Method and Apparatus for Robust Speech Activity Detection |
CN101681619B (zh) * | 2007-05-22 | 2012-07-04 | Lm爱立信电话有限公司 | 改进的话音活动性检测器 |
US8396574B2 (en) * | 2007-07-13 | 2013-03-12 | Dolby Laboratories Licensing Corporation | Audio processing using auditory scene analysis and spectral skewness |
US20090043577A1 (en) * | 2007-08-10 | 2009-02-12 | Ditech Networks, Inc. | Signal presence detection using bi-directional communication data |
US8190440B2 (en) * | 2008-02-29 | 2012-05-29 | Broadcom Corporation | Sub-band codec with native voice activity detection |
EP2107553B1 (en) * | 2008-03-31 | 2011-05-18 | Harman Becker Automotive Systems GmbH | Method for determining barge-in |
US8244528B2 (en) * | 2008-04-25 | 2012-08-14 | Nokia Corporation | Method and apparatus for voice activity determination |
US8275136B2 (en) * | 2008-04-25 | 2012-09-25 | Nokia Corporation | Electronic device speech enhancement |
US8611556B2 (en) * | 2008-04-25 | 2013-12-17 | Nokia Corporation | Calibrating multiple microphones |
CN101572090B (zh) * | 2008-04-30 | 2013-03-20 | 向为 | 一种自适应多速率窄带编码方法及编码器 |
USD605629S1 (en) | 2008-09-29 | 2009-12-08 | Vocollect, Inc. | Headset |
KR101547344B1 (ko) | 2008-10-31 | 2015-08-27 | 삼성전자 주식회사 | 음성복원장치 및 그 방법 |
TWI384423B (zh) * | 2008-11-26 | 2013-02-01 | Ind Tech Res Inst | 以聲音事件為基礎之緊急通報方法與系統以及行為軌跡建立方法 |
CN101609678B (zh) * | 2008-12-30 | 2011-07-27 | 华为技术有限公司 | 信号压缩方法及其压缩装置 |
US8160287B2 (en) | 2009-05-22 | 2012-04-17 | Vocollect, Inc. | Headset with adjustable headband |
EP2491549A4 (en) | 2009-10-19 | 2013-10-30 | Ericsson Telefon Ab L M | DETECTOR AND METHOD FOR DETECTING VOICE ACTIVITY |
US8438659B2 (en) | 2009-11-05 | 2013-05-07 | Vocollect, Inc. | Portable computing device and headset interface |
FR2956539B1 (fr) * | 2010-02-16 | 2012-03-16 | Dominique Retali | Procede de detection du fonctionnement d'un dispositif de transmission sans fil de signaux de voix. |
US20120143604A1 (en) * | 2010-12-07 | 2012-06-07 | Rita Singh | Method for Restoring Spectral Components in Denoised Speech Signals |
US8954322B2 (en) * | 2011-07-25 | 2015-02-10 | Via Telecom Co., Ltd. | Acoustic shock protection device and method thereof |
US9363603B1 (en) | 2013-02-26 | 2016-06-07 | Xfrm Incorporated | Surround audio dialog balance assessment |
CN111261197B (zh) * | 2020-01-13 | 2022-11-25 | 中航华东光电(上海)有限公司 | 一种复杂噪声场景下的实时语音段落追踪方法 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4358738A (en) * | 1976-06-07 | 1982-11-09 | Kahn Leonard R | Signal presence determination method for use in a contaminated medium |
JPS53105303A (en) * | 1977-02-25 | 1978-09-13 | Hitachi Ltd | Preprocessing system for audio recognition |
JPS5850360B2 (ja) * | 1978-05-12 | 1983-11-10 | 株式会社日立製作所 | 音声認識装置における前処理方法 |
JPS59115625A (ja) * | 1982-12-22 | 1984-07-04 | Nec Corp | 音声検出器 |
US4731846A (en) * | 1983-04-13 | 1988-03-15 | Texas Instruments Incorporated | Voice messaging system with pitch tracking based on adaptively filtered LPC residual signal |
DE3370423D1 (en) * | 1983-06-07 | 1987-04-23 | Ibm | Process for activity detection in a voice transmission system |
US4700392A (en) * | 1983-08-26 | 1987-10-13 | Nec Corporation | Speech signal detector having adaptive threshold values |
US4696039A (en) * | 1983-10-13 | 1987-09-22 | Texas Instruments Incorporated | Speech analysis/synthesis system with silence suppression |
JPH0748695B2 (ja) * | 1986-05-23 | 1995-05-24 | 株式会社日立製作所 | 音声符号化方式 |
EP0548054B1 (en) * | 1988-03-11 | 2002-12-11 | BRITISH TELECOMMUNICATIONS public limited company | Voice activity detector |
US5276765A (en) * | 1988-03-11 | 1994-01-04 | British Telecommunications Public Limited Company | Voice activity detection |
JP2573352B2 (ja) * | 1989-04-10 | 1997-01-22 | 富士通株式会社 | 音声検出装置 |
US5680508A (en) * | 1991-05-03 | 1997-10-21 | Itt Corporation | Enhancement of speech coding in background noise for low-rate speech coder |
IN184794B (cs) * | 1993-09-14 | 2000-09-30 | British Telecomm | |
US5659622A (en) * | 1995-11-13 | 1997-08-19 | Motorola, Inc. | Method and apparatus for suppressing noise in a communication system |
-
1994
- 1994-09-13 IN IN890MA1994 patent/IN184794B/en unknown
- 1994-09-14 DE DE69419615T patent/DE69419615T2/de not_active Expired - Lifetime
- 1994-09-14 WO PCT/GB1994/001999 patent/WO1995008170A1/en active IP Right Grant
- 1994-09-14 ES ES94926317T patent/ES2136204T3/es not_active Expired - Lifetime
- 1994-09-14 NZ NZ273045A patent/NZ273045A/en not_active IP Right Cessation
- 1994-09-14 CZ CZ1996678A patent/CZ286743B6/cs not_active IP Right Cessation
- 1994-09-14 KR KR1019960701186A patent/KR100363309B1/ko not_active IP Right Cessation
- 1994-09-14 MY MYPI94002448A patent/MY111134A/en unknown
- 1994-09-14 BR BR9407535A patent/BR9407535A/pt not_active IP Right Cessation
- 1994-09-14 CA CA002169745A patent/CA2169745C/en not_active Expired - Lifetime
- 1994-09-14 JP JP50905595A patent/JP3224132B2/ja not_active Expired - Lifetime
- 1994-09-14 AT AT94926317T patent/ATE182420T1/de active
- 1994-09-14 EP EP94926317A patent/EP0719439B1/en not_active Expired - Lifetime
- 1994-09-14 SK SK318-96A patent/SK281796B6/sk not_active IP Right Cessation
- 1994-09-14 SG SG1996003866A patent/SG48935A1/en unknown
- 1994-09-14 CN CN94193383A patent/CN1064772C/zh not_active Expired - Lifetime
- 1994-09-14 HU HU9600641A patent/HU219994B/hu unknown
- 1994-09-14 DK DK94926317T patent/DK0719439T3/da active
-
1996
- 1996-03-08 US US08/596,357 patent/US5749067A/en not_active Expired - Lifetime
- 1996-03-13 FI FI961158A patent/FI118195B/fi not_active IP Right Cessation
- 1996-03-13 NO NO961032A patent/NO307979B1/no not_active IP Right Cessation
-
1998
- 1998-04-30 US US09/070,151 patent/US6061647A/en not_active Expired - Lifetime
- 1998-12-24 HK HK98115669A patent/HK1014392A1/xx not_active IP Right Cessation
-
1999
- 1999-10-13 GR GR990402610T patent/GR3031515T3/el unknown
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CZ67896A3 (en) | Voice detector | |
JP2995737B2 (ja) | 改良されたノイズ抑圧システム | |
US8204754B2 (en) | System and method for an improved voice detector | |
EP0548054B1 (en) | Voice activity detector | |
EP1875466B1 (en) | Systems and methods for reducing audio noise | |
JP2000515987A (ja) | 音声活性度検出器 | |
EP1147515A1 (en) | Wide band speech synthesis by means of a mapping matrix | |
CA2192397C (en) | Method and system for performing speech recognition | |
US5430826A (en) | Voice-activated switch | |
WO2005119649A1 (en) | System and method for babble noise detection | |
JP3418005B2 (ja) | 音声ピッチ検出装置 | |
JP3195700B2 (ja) | 音声分析装置 | |
AU673776C (en) | Voice activity detector | |
Gajic | Auditory based methods for robust speech feature extraction | |
Barrett | Information tone handling in the half-rate GSM voice activity detector | |
KR100881355B1 (ko) | 다중 누화 잡음 검출 시스템 및 방법 | |
Tchorz et al. | Using amplitude modulation information for sound classification |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
IF00 | In force as of 2000-06-30 in czech republic | ||
MK4A | Patent expired |
Effective date: 20140914 |