DE69511508T2 - Sprachaktivitätsdetektion - Google Patents
SprachaktivitätsdetektionInfo
- Publication number
- DE69511508T2 DE69511508T2 DE69511508T DE69511508T DE69511508T2 DE 69511508 T2 DE69511508 T2 DE 69511508T2 DE 69511508 T DE69511508 T DE 69511508T DE 69511508 T DE69511508 T DE 69511508T DE 69511508 T2 DE69511508 T2 DE 69511508T2
- Authority
- DE
- Germany
- Prior art keywords
- vector
- autocorrelation
- norm
- signal
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000000694 effects Effects 0.000 title claims description 16
- 238000001514 detection method Methods 0.000 title claims description 15
- 239000013598 vector Substances 0.000 claims abstract description 51
- 230000005236 sound signal Effects 0.000 claims abstract description 26
- 230000009467 reduction Effects 0.000 claims abstract description 12
- 230000001755 vocal effect Effects 0.000 claims description 24
- 230000004069 differentiation Effects 0.000 claims description 18
- 238000000034 method Methods 0.000 claims description 11
- 238000009499 grossing Methods 0.000 claims description 3
- 230000008901 benefit Effects 0.000 description 3
- 238000005070 sampling Methods 0.000 description 2
- 238000007792 addition Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/93—Discriminating between voiced and unvoiced parts of speech signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
- Complex Calculations (AREA)
- Measuring Pulse, Heart Rate, Blood Pressure Or Blood Flow (AREA)
- Geophysics And Detection Of Objects (AREA)
- Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
- Cosmetics (AREA)
- Time-Division Multiplex Systems (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Electrophonic Musical Instruments (AREA)
Description
- Das Gebiet der Erfindung ist das der Erfassung der Stimmaktivität in einem Tonsignal.
- Bei Vorhandensein eines Tonsignals, das oft von einem Mikrophon stammt, ist es manchmal nötig zu wissen, ob dieses Signal Sprache enthält oder auch ob es nur Rauschen umfaßt.
- Tatsächlich beeinflußt die Erfassung einer Stimmaktivität einige Verarbeitungen, die das Tonsignal erfahren kann. In der Menge der typischen Anwendungen, die bei Vorhandensein eines Sprachsignals zu aktivieren angebracht sind, können die Erkennung der Sprache, die Aufhebung des Echos oder auch die Aufzeichnungs- bzw. Registrierungsfunktion identifiziert werden.
- Wenn dagegen ein Telefoniesignal betrachtet wird, bei dem nur die Sprache nützliche Information darstellt, ist es auf dem Gebiet der Funkkommunikationen gegenwärtig üblich, dieses Signal nicht zu übertragen, wenn jenes nur Rauschen umfaßt, dies ist das, was gewöhnlich diskontinuierliche Übertragung genannt wird.
- So wurden für den Versuch, die Stimmaktivität in einem Audiosignal zu erfassen, bereits Lösungen vorgeschlagen.
- Eine erste Lösung besteht darin, die Entwicklung der Energie des Signals zu verfolgen. Wenn sich diese schnell erhöht, kann dies dem Auftreten einer Stimmaktivität entsprechen, aber es kann auch einer Veränderung des Umgebungsrauschens entsprechen. Es ergibt sich, daß dieses Verfahren, obwohl es sehr einfach durchzuführen ist, sich in relativ geräuschvollen Umgebungen nicht als sehr zuverlässig zeigt, wie es beispielsweise in einem Kraftfahrzeug der Fall ist.
- Es sind ebenfalls zahlreiche weitere Lösungen bekannt, die entwickelt wurden, um den Mangel an Zuverlässigkeit der vor hergehenden zu lindern. Dies ist insbesondere für diejenigen der Fall, die eine Fourier-Transformierte des Tonsignals einsetzen, um den spektralen Abstand zu messen, der es von einem mittleren Rauschsignal trennt, das bei Nichtvorhandensein jeglicher Stimmaktivität aktualisiert wird. Dies ist ebenfalls für Verfahren der Fall, die eine Analyse des Signals in Unterbändern verwenden, Verfahren, die nahe bei denjenigen liegen, die auf eine Fourier-Transformierte zurückgreifen. Dies ist noch für Verfahren der Fall, die auf eine Cepstralanalyse zurückgreifen.
- Es handelt sich dort um viel komplexere Techniken, die jedoch, wenn sie schon einen Gewinn in der Höhe der Zuverlässigkeit bringen, keine vollständige Zufriedenheit in diesem Punkt geben.
- Es sind auch Lösungen bekannt, die sich eine gewisse Periodizität der Sprache zunutze machen, in deren Zahl auch diejenige vorkommt, die in der Patentanmeldung EP 0 123 349 beschrieben ist. Tatsächlich weisen die mit der Stimme hervorgerufenen Laute alle eine bestimmte Periodizität auf, während das Rauschen normalerweise aperiodisch ist oder aber eine von derjenigen der Sprache unterschiedliche Periodizität aufweist.
- Es kann somit der Wert dieser bestimmten Periodizität (oder in Englisch "pitch") ermittelt werden, um das Vorhandensein von mit der Stimme hervorgerufenen Lauten zu erkennen. Um dies auszuführen, werden im allgemeinen die Autokorrelationskoeffizienten des Tonsignals berechnet, um das zweite Maximum dieser Koeffizienten zu ermitteln, wobei das erste Maximum die Energie darstellt. Es handelt sich dort noch um eine relativ komplexe Technik, die keine völlige Zufriedenheit über die Ebene der Zuverlässigkeit gibt.
- Die Patentanmeldung EP 0 335 521 beschreibt eine Vorrichtung zur Erfassung der Stimmaktivität, die Autokorrelationskoeffizienten eines Signals verwendet, die gewichtet und kombiniert sind, um eine Größe zu erhalten, die von der Energie in dem Teil des Spektrums abhängt, der kein Rauschen enthält, wobei diese Größe mit einer variablen Schwelle verglichen wird, um einen Hinweis auf eine Stimmaktivität zu geben.
- Die vorliegende Erfindung schlägt somit eine Lösung zur Erfassung der Stimmaktivität vor, die für eine verringerte Komplexität eine annehmbare Zuverlässigkeit gewährt.
- Erfindungsgemäß umfaßt eine Vorrichtung zur Erfassung der Stimmaktivität in einem Tonsignal:
- - Mittel zum Berechnen der Autokorrelationskoeffizienten dieses Signals,
- - Mittel zum Identifizieren eines ersten Autokorrelationsvektors mit einer ersten Folge von Autokorrelationskoeffizienten als Komponenten,
- - Mittel zum Identifizieren eines zweiten Autokorrelationsvektors mit einer zweiten Folge von Autokorrelationskoeffizienten als Komponenten, die in bezug auf die erste Folge um einen vorbestimmten Verschiebungswert verschoben ist,
- - Mittel zum Subtrahieren des ersten Autokorrelationsvektors vom zweiten Autokorrelationsvektor, um einen Differentiationsvektor zu erhalten,
- - Mittel zum Berechnen einer Norm des Differentiationsvektors, wobei diese Norm einen ersten Indikator für die Stimmaktivität darstellt.
- Außerdem umfaßt die Vorrichtung Reduktionsmittel, um eine reduzierte Norm aufzustellen, indem die Norm des Differentiationsvektors durch einen Reduktionswert dividiert wird, wobei diese reduzierte Norm einen zweiten Indikator für die Stimmaktivität darstellt.
- Als Beispiel ist der Reduktionswert gleich der Energie des Signals oder aber er ist gleich der Summe der Energie des Signals und einer Kompressionskonstanten.
- Nach einem zusätzlichen Merkmal der Vorrichtung umfaßt diese Glättungsmittel für den einen der Indikatoren für die Stimmaktivität, um eine Linearkombination des gegenwärtigen Wertes dieses Indikators und seines vorhergehenden Wertes zu erzeugen, wobei diese Linearkombination einen dritten Indikator für die Stimmaktivität darstellt.
- Außerdem umfaßt die Vorrichtung Entscheidungsmittel, um ein Signal der Stimmaktivität zu erzeugen, wenn einer dieser Indikatoren eine Erfassungsschwelle übersteigt.
- Es ist ein Nutzen darin zu finden, diese Erfassungsschwelle ausgehend von der Energie des Tonsignals bei Nichtvorhandensein eines Signals der Stimmaktivität aufzustellen.
- Außerdem besteht eine vorteilhafte Lösung darin, die Summe der Absolutwerte der Komponenten des Differentiationsvektors als Norm dieses Vektors zu wählen.
- Die Erfindung betrifft auch ein Verfahren zur Erfassung einer Stimmaktivität in einem Tonsignal, das die folgenden Vorgänge umfaßt:
- - Berechnung der Autokorrelationskoeffizienten dieses Signals,
- - Identifizierung eines erstes Autokorrelationsvektors mit einer ersten Folge von Autokorrelationskoeffizienten als Komponenten,
- - Identifizierung eines zweiten Autokorrelationsvektors mit einer zweiten Folge von Autokorrelationskoeffizienten als Komponenten, die in bezug auf die erste Folge um einen vorbestimmten Verschiebungswert verschoben ist,
- - Subtraktion des ersten Autokorrelationsvektors vom zweiten Autokorrelationsvektor, um einen Differentiationsvektor zu erhalten,
- - Berechnung einer Norm des Differentiationsvektors, wobei diese Norm einen ersten Indikator für die Stimmaktivität darstellt.
- Die vorliegende Erfindung zeigt sich nun deutlicher im Rahmen eines Ausführungsbeispiels, das als Veranschaulichung gegeben ist, indem auf die beigefügte Figur Bezug genommen wird, die den Ablauf der von der Vorrichtung zur Erfassung der Stimmaktivität ausgeführten Vorgänge darstellt.
- Man versetzt sich nun in den Fall, in dem ein Tonsignal eine digitale Beschaffenheit hat, das heißt, daß es sich in Form einer Folge von Abtastwerten zeigt, die dem Wert des Signals zu aufeinander folgenden Zeitpunkten entsprechen, die sich im Takt einer Abtastfrequenz wiederholen.
- Wenn das zu analysierende Signal eine analoge Beschaffenheit hat, beispielsweise wenn es von einem Mikrophon stammt, wird es zuerst einem Analog/Digital-Wandler vorgelegt, der beim Takt dieser Abtastfrequenz arbeitet, um das Tonsignal zu erzeugen.
- Wenn das Tonsignal digital ist, erscheint es natürlich, die Vorrichtung zur Erfassung der Stimmaktivität mittels eines Digitalsignalprozessors auszuführen. Dieser Prozessor kann selbstverständlich für weiter Zwecke verwendet werden.
- Es wird somit verstanden, daß diese Erfassungsvorrichtung in ihrer Struktur nicht beschrieben wird, weil sie dem Fachmann wohlbekannte, elementare Vorgänge ausführt, wie Additionen, Multiplikationen, Vergleiche. Es wird somit eine Funktionsbeschreibung beibehalten, weil sie bei weitem vorzuziehen zu sein scheint, um die Ausführung der Erfindung mit der größten Deutlichkeit zu erläutern.
- Unter Bezugnahme auf die einzige Figur empfängt somit die Vorrichtung das Tonsignal und es wird eine Folge 5(i) von Abtastwerten betrachtet, wobei i von 0 bis N variiert.
- Der erste Vorgang, den die Vorrichtung ausführt, ist die Berechnung der Autokorrelationskoeffizienten R(k) des Signals für alle Werte von k, die zwischen 0 und N liegen:
- Ausgehend von diesen Autokorrelationskoeffizienten R(k) kann ein erster R&sub0; und ein zweiter Rq Autokorrelationsvektor definiert werden, wobei darüber hinaus ein Verschiebungswert q betrachtet wird, der eine streng positive ganze Zahl ist. Der erste Autokorrelationsvektor R&sub0; hat als Komponenten die (N-q+1) ersten Autokorrelationskoeffizienten R(k):
- R0 = (R(0), R(1), ..., R(N - q))
- Der zweite Autokorrelationsvektor Rq hat als Komponenten die (N-q+1) letzten Autokorrelationskoeffizienten R(k):
- Rq = (R (q), R (q + 1), ..., R (N))
- Die Erfassungsvorrichtung berechnet dann einen Differentiationsvektor ΔR indem sie den ersten Autokorrelationsvektor R0 vom zweiten Autokorrelationsvektor Rq subtrahiert:
- ΔR = Rq - R&sub0;
- Wenn mit ΔR(k) die (k+1)-te dieses Differentiationsvektors bezeichnet wird, hat diese dann für jedes zwischen 0 und N-q liegende k den Wert:
- ΔR(k) = R (k + q) - R (k)
- Es wird bemerkt, daß die ersten R&sub0; und zweiten Rq Autokorrelationsvektoren selbst keinen Nutzen haben. Sie wurden in der einfachen Absicht eingeführt, die Darlegung zu verdeut lichen. Der wichtige Punkt ist die Berechnung des Differentiationsvektors. So wird dieser Vektor durch den Wert dieser Komponenten wie oben beschrieben definiert.
- Von da aus berechnet die Erfassungsvorrichtung eine Norm ΔR des Differentiationsvektors ΔR. Vorteilhafterweise ist diese Norm gleich der Summe der Absolutwerte der Komponenten des Vektors:
- Es versteht sich, daß sich die Erfindung auch anwenden läßt, wenn die Beibehaltung einer anderen Norm, wie insbesondere die euklidische Norm oder der Höchstwert der Absolutwerte jeder der Komponenten, gewählt wird.
- Diese Norm, welche sie auch immer sein mag, bildet einen ersten Indikator für die Stimmaktivität.
- Eine erste Option besteht im Vergleichen dieses Indikators mit einer Schwelle, um festzulegen, daß es ein Vorhandensein einer Stimmaktivität im Tonsignal gibt, wenn der Indikator höher als die Schwelle ist.
- Gemäß einer zweiten Option berechnet die Erfassungsvorrichtung eine reduzierte Norm P, indem sie die Norm ΔR des Differentiationsvektors durch einen Reduktionswert teilt. Als Beispiel kann dieser Reduktionswert gleich der Energie R(0) des Tonsignals gewählt werden, was darauf abzielt die Dynamik der Norm ΔR zu komprimieren. Eine weitere Lösung, die ihre eigenen Vorteile bewirkt, besteht darin, diesem Reduktionswert die Summe der Energie R(0) des Tonsignals und einer Konstante zuzuweisen, die Deckwert C genannt wird.
- Diese reduzierte Norm P bildet in jedem Fall einen zweiten Indikator für die Stimmaktivität, der ebenfalls mit einer Schwelle verglichen werden kann, um das Nichtvorhandensein oder das Vorhandensein einer Stimmaktivität in diesem Signal festzulegen.
- Gemäß einer dritten Option nimmt die Erfassungsvorrichtung eine Glättung dieser reduzierten Norm vor. So entspricht, wenn mehrere aufeinanderfolgende Folgen von N Abtastwerten des Audiosignals betrachtet werden, eine reduzierte Pi der i-ten Folge. Der geglättete Wert Pi dieser reduzierten Norm ist eine Linearkombination des geglätteten Wertes Pi-1 der zu vorhergehenden Folge gehörigen reduzierten Norm Pi-1 und dieser reduzierten Pi:
- Pi = αPi-1 + βPi
- α und β können derart gewählt werden, daß ihre Summe gleich Eins ist.
- Es ist außerdem ratsam, P&sub0; mit Hilfe irgendeiner Konstanten, beispielsweise 0, zu initialisieren.
- Dieser geglättete Wert Pi bildet einen dritten Indikator für die Stimmaktivität, der auch mit einer Schwelle verglichen werden kann, um festzulegen, ob das Audiosignal eine Stimmaktivität aufweist oder nicht.
- Welches auch immer der festgelegte Indikator für die Stimmaktivität ist, die Erfassungsvorrichtung vergleicht ihn somit mit einer Erfassungsschwelle T. Die einfachste Lösung besteht darin, dieser Erfassungsschwelle einen konstanten Wert zuzuweisen.
- Eine vorteilhafte Lösung besteht jedoch darin, diese Schwelle der Höhe der reduzierten Norm P anzupassen, wenn das Audiosignal von Stimmaktivität frei ist.
- Es kann somit der Mittelwert der reduzierten Norm über mehrere aufeinanderfolgende Folgen von. Abtastwerten des Tonsignals, für welche keine Stimmaktivität erfaßt wurde, berech net und dieser Mittelwert mit einem konstanten Koeffizienten multipliziert werden, um die Erfassungsschwelle T zu erhalten. Es handelt sich da um eine Technik die zu derjenigen der Glättung analog ist, die den Fachmann wohlbekannt ist, und sie wird somit nicht ausführlicher dargelegt.
- Außer der eigentlichen Erfassungsvorrichtung betrifft die Erfindung natürlich das Verfahren zur Erfassung der Stimmaktivität, das von dieser Vorrichtung durchgeführt wird.
- Als digitale Anwendung und um einen konkreten Fall der Erfindung darzustellen, wird zur Veranschaulichung das paneuropäische, digitale, zellulare Funkkommunikationssystem gewählt, das GSM-System genannt wird. Bei diesem System wird das zu verarbeitende analoge Signal mit der Frequenz von 8 kHz abgetastet. Die so erhaltenen Abtastwerte werden zu Folgen von 160 neu gruppiert, die somit jeweils 20 ms entsprechen.
- So beträgt N die Anzahl von Abtastwerten, 160, und es wird vorteilhafterweise der Verschiebungswert q gleich Eins gewählt.
- Die Komponenten des Differentiationsvektors werden dann für jedes k zwischen 1 und 160 geschrieben als:
- ΔR(k) = R (k + 1) - R (k)
- Die Norm dieses Vektors kann somit geschrieben werden als:
Claims (9)
1. Vorrichtung zur Erfassung der Stimmaktivität in einem
Tonsignal, welche umfasst:
- Mittel zum Berechnen der
Autokorrelationskoeffizienten (R(k)) dieses
Signals,
- Mittel zum Identifizieren eines ersten
Autokorrelationsvektors (R&sub0;) mit einer ersten
Folge (k = 0, ...,N - q) von
Autokorrelationskoeffizienten (R(k)) als
Komponenten,
- Mittel zum Identifizieren eines zweiten
Autokorrelationsvektors (Rq) mit einer zweiten
Folge (k = q, ...,N) von
Autokorrelationskoeffizienten (R(k)) als
Komponenten, die in bezug auf die erste Folge um
einen vorbestimmten Verschiebungswert (q)
verschoben ist,
- Mittel zum Subtrahieren des ersten
Autokorrelationsvektors (R&sub0;) vom zweiten
Autokorrelationsvektor (Rq), um einen
Differentiationsvektor (ΔR) zu erhalten,
- Mittel zum Berechnen einer Norm ( ΔR ) des
Differentiationsvektors, wobei diese Norm einen
ersten Indikator für die Stimmaktivität
darstellt.
2. Vorrichtung nach Anspruch 1, dadurch gekennzeichnet,
dass sie außerdem Reduktionsmittel umfasst, um eine
reduzierte Norm aufzustellen, indem die Norm ( ΔR )
des Differentiationsvektors durch einen Reduktionswert
dividiert wird, wobei diese reduzierte Norm einen
zweiten Indikator für die Stimmaktiviät darstellt.
3. Vorrichtung nach Anspruch 2, dadurch gekennzeichnet,
dass der Reduktionswert gleich der Energie des
Tonsignals ist.
4. Vorrichtung nach Anspruch 2, dadurch gekennzeichnet,
dass der Reduktionswert gleich der Summe der Energie
des Tonsignals und eines Deckwertes (C) ist.
5. Vorrichtung nach einem der Ansprüche 1 bis 4, dadurch
gekennzeichnet, dass sie Glättungsmittel für den einen
der Indikatoren für die Stimmaktivität aufweist, um
eine Linearkombination des gegenwärtigen Wertes des
Indikators und seines vorhergehenden Wertes zu
erzeugen, wobei die Linearkombination einen dritten
Indikator für die Stimmaktivität darstellt.
6. Vorrichtung nach einem der Ansprüche 1 bis 5, dadurch
gekennzeichnet, dass sie Entscheidungsmittel umfasst,
um ein Signal der Stimmaktivität zu erzeugen, wenn
einer der Indikatoren eine Erfassungsschwelle
übersteigt.
7. Vorrichtung nach Anspruch 6, dadurch gekennzeichnet,
dass die Erfassungsschwelle ausgehend vom Wert der
reduzierten Norm des Tonsignals in Abwesenheit des
Signals der Stimmaktivität aufgestellt wird.
8. Vorrichtung nach einem der Ansprüche 1 bis 7, dadurch
gekennzeichnet, dass die Norm ( ΔR ) des
Differentiationsvektors gleich der Summe der
Absolutwerte der Komponenten dieses Vektors ist.
9. Verfahren zur Erfassung einer Stimmaktivität in einem
Tonsignal, das die folgenden Vorgänge umfasst:
- Berechnung der Autokorrelationskoeffizienten
(R(k)) dieses Signals,
- Identifizierung eines erstes
Autokorrelationsvektors (R&sub0;) mit einer ersten
Folge (k = 0, ...,N - q) von
Autokorrelationskoeffizienten (R(k)) als
Komponenten,
- Identifizierung eines zweiten
Autokorrelationsvektors (Rq) mit einer zweiten
Folge (k = q, ..., N) von
Autokorrelationskoeffizienten (R(k)) als
Komponenten, die in bezug auf die erste Folge um
einen vorbestimmten Verschiebungswert (q)
verschoben ist,
- Subtraktion des ersten Autokorrelationsvektors
(R&sub0;) vom zweiten Autokorrelationsvektor (Rq), um
einen Differentiationsvektor (ΔR) zu erhalten,
- Berechnung einer Norm ( ΔR ) des
Differentiationsvektors, wobei diese Norm einen
ersten Indikator für die Stimmaktivität
darstellt.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR9413962A FR2727236B1 (fr) | 1994-11-22 | 1994-11-22 | Detection d'activite vocale |
Publications (2)
Publication Number | Publication Date |
---|---|
DE69511508D1 DE69511508D1 (de) | 1999-09-23 |
DE69511508T2 true DE69511508T2 (de) | 2000-07-06 |
Family
ID=9469024
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE69511508T Expired - Fee Related DE69511508T2 (de) | 1994-11-22 | 1995-11-17 | Sprachaktivitätsdetektion |
Country Status (10)
Country | Link |
---|---|
US (1) | US5732141A (de) |
EP (1) | EP0714088B1 (de) |
JP (1) | JPH08221097A (de) |
AT (1) | ATE183598T1 (de) |
AU (1) | AU698712B2 (de) |
CA (1) | CA2163295A1 (de) |
DE (1) | DE69511508T2 (de) |
ES (1) | ES2136815T3 (de) |
FI (1) | FI955584A (de) |
FR (1) | FR2727236B1 (de) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE19716862A1 (de) | 1997-04-22 | 1998-10-29 | Deutsche Telekom Ag | Sprachaktivitätserkennung |
US6556967B1 (en) | 1999-03-12 | 2003-04-29 | The United States Of America As Represented By The National Security Agency | Voice activity detector |
US6381568B1 (en) | 1999-05-05 | 2002-04-30 | The United States Of America As Represented By The National Security Agency | Method of transmitting speech using discontinuous transmission and comfort noise |
EP1304682A1 (de) * | 2000-07-05 | 2003-04-23 | Alcatel | Verteiltes Spracherkennungssystem |
EP1170728A1 (de) * | 2000-07-05 | 2002-01-09 | Alcatel | System zur angepassten Reduktion von Geräuschen bei Sprachsignalen |
EP1175058A1 (de) * | 2000-07-21 | 2002-01-23 | Alcatel | Prozessorsystem und Terminal, und Netzeinheit und Verfahren |
US7305099B2 (en) * | 2003-08-12 | 2007-12-04 | Sony Ericsson Mobile Communications Ab | Electronic devices, methods, and computer program products for detecting noise in a signal based on autocorrelation coefficient gradients |
EP1729410A1 (de) * | 2005-06-02 | 2006-12-06 | Sony Ericsson Mobile Communications AB | Vorrichtung und Verfahren zur Verstärkungsregelung eines Audiosignals |
JP4516157B2 (ja) * | 2008-09-16 | 2010-08-04 | パナソニック株式会社 | 音声分析装置、音声分析合成装置、補正規則情報生成装置、音声分析システム、音声分析方法、補正規則情報生成方法、およびプログラム |
US9002030B2 (en) | 2012-05-01 | 2015-04-07 | Audyssey Laboratories, Inc. | System and method for performing voice activity detection |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3919479A (en) * | 1972-09-21 | 1975-11-11 | First National Bank Of Boston | Broadcast signal identification system |
JPS597120B2 (ja) * | 1978-11-24 | 1984-02-16 | 日本電気株式会社 | 音声分析装置 |
JPS5672499A (en) * | 1979-11-19 | 1981-06-16 | Hitachi Ltd | Pretreatment for voice identifier |
GB2139052A (en) * | 1983-04-20 | 1984-10-31 | Philips Electronic Associated | Apparatus for distinguishing between speech and certain other signals |
US4720802A (en) * | 1983-07-26 | 1988-01-19 | Lear Siegler | Noise compensation arrangement |
JPS62204652A (ja) * | 1986-03-04 | 1987-09-09 | Nec Corp | 可聴周波信号識別方式 |
US4815137A (en) * | 1986-11-06 | 1989-03-21 | American Telephone And Telegraph Company | Voiceband signal classification |
FR2623382B1 (fr) * | 1987-11-24 | 1991-05-03 | Peugeot Cycles | Dispositif de fixation d'un revetement notamment un revetement de siege |
US5276765A (en) * | 1988-03-11 | 1994-01-04 | British Telecommunications Public Limited Company | Voice activity detection |
EP0548054B1 (de) * | 1988-03-11 | 2002-12-11 | BRITISH TELECOMMUNICATIONS public limited company | Anordnung zur Feststellung der Anwesenheit von Sprachlauten |
US5410632A (en) * | 1991-12-23 | 1995-04-25 | Motorola, Inc. | Variable hangover time in a voice activity detector |
-
1994
- 1994-11-22 FR FR9413962A patent/FR2727236B1/fr not_active Expired - Fee Related
-
1995
- 1995-11-17 AT AT95402589T patent/ATE183598T1/de not_active IP Right Cessation
- 1995-11-17 EP EP95402589A patent/EP0714088B1/de not_active Expired - Lifetime
- 1995-11-17 DE DE69511508T patent/DE69511508T2/de not_active Expired - Fee Related
- 1995-11-17 ES ES95402589T patent/ES2136815T3/es not_active Expired - Lifetime
- 1995-11-20 CA CA002163295A patent/CA2163295A1/fr not_active Abandoned
- 1995-11-20 AU AU37937/95A patent/AU698712B2/en not_active Ceased
- 1995-11-20 FI FI955584A patent/FI955584A/fi unknown
- 1995-11-20 US US08/560,645 patent/US5732141A/en not_active Expired - Fee Related
- 1995-11-22 JP JP7304462A patent/JPH08221097A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
FR2727236A1 (fr) | 1996-05-24 |
DE69511508D1 (de) | 1999-09-23 |
AU3793795A (en) | 1996-05-30 |
JPH08221097A (ja) | 1996-08-30 |
AU698712B2 (en) | 1998-11-05 |
FI955584A0 (fi) | 1995-11-20 |
ATE183598T1 (de) | 1999-09-15 |
FR2727236B1 (fr) | 1996-12-27 |
CA2163295A1 (fr) | 1996-05-23 |
US5732141A (en) | 1998-03-24 |
EP0714088A1 (de) | 1996-05-29 |
FI955584A (fi) | 1996-05-23 |
EP0714088B1 (de) | 1999-08-18 |
ES2136815T3 (es) | 1999-12-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE69300413T2 (de) | Verfahren zum Identifizieren von Sprach- und Rufverlaufsignalen. | |
DE68929442T2 (de) | Vorrichtung zur Erfassung von Sprachlauten | |
DE3878001T2 (de) | Spracherkennungseinrichtung unter anwendung von phonemermittlung. | |
DE69131739T2 (de) | Einrichtung zur Sprachsignalverarbeitung für die Bestimmung eines Sprachsignals in einem verrauschten Sprachsignal | |
DE69127961T2 (de) | Verfahren zur Spracherkennung | |
DE69614989T2 (de) | Verfahren und Vorrichtung zur Feststellung der Sprachaktivität in einem Sprachsignal und eine Kommunikationsvorrichtung | |
DE69901606T2 (de) | Breitbandsprachsynthese von schmalbandigen sprachsignalen | |
DE69419615T2 (de) | Sprachaktivitaetsdetektor | |
DE69326044T2 (de) | Verfahren zur Erkennung von Sprachsignalen | |
DE69926851T2 (de) | Verfahren und Vorrichtung zur Sprachaktivitätsdetektion | |
DE69321656T2 (de) | Verfahren zur Spracherkennung | |
DE69420400T2 (de) | Verfahren und gerät zur sprechererkennung | |
DE3687677T2 (de) | Geraeuschkompensation in einer spracherkennungseinrichtung. | |
DE69432943T2 (de) | Verfahren und Vorrichtung zur Sprachdetektion | |
DE69535452T2 (de) | Verfahren und Vorrichtung zur Auswahl der Kodierrate in einem Vocoder mit Variabler Rate | |
DE4126902C2 (de) | Sprachintervall - Feststelleinheit | |
DE3750314T2 (de) | Sprachprozessor. | |
DE2659096C2 (de) | ||
DE69331732T2 (de) | Anordnung und Verfahren zur Feststellung der Anwesenheit eines Sprechsignals | |
DE69519453T2 (de) | Spracherkennung mit Sprecheradaptierung mittels Berechnung von Mittelwerten akustischer Kategorien | |
EP0793980A3 (de) | Vorrichtung zur Speicherung von Signalen in einem implantierbaren medizinischen Gerät | |
DE69930961T2 (de) | Vorrichtung und verfahren zur sprachsegmentierung | |
DE69720134T2 (de) | Spracherkenner unter Verwendung von Grundfrequenzintensitätsdaten | |
DE2919085A1 (de) | Vorverarbeitungsverfahren und -vorrichtung fuer eine spracherkennungsvorrichtung | |
DE69511508T2 (de) | Sprachaktivitätsdetektion |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8364 | No opposition during term of opposition | ||
8327 | Change in the person/name/address of the patent owner |
Owner name: ALCATEL LUCENT, PARIS, FR |
|
8339 | Ceased/non-payment of the annual fee |