DE69636985T2 - Sprachanwesenheitdetektor für halbduplex-audiokommunikationssystem - Google Patents

Sprachanwesenheitdetektor für halbduplex-audiokommunikationssystem Download PDF

Info

Publication number
DE69636985T2
DE69636985T2 DE69636985T DE69636985T DE69636985T2 DE 69636985 T2 DE69636985 T2 DE 69636985T2 DE 69636985 T DE69636985 T DE 69636985T DE 69636985 T DE69636985 T DE 69636985T DE 69636985 T2 DE69636985 T2 DE 69636985T2
Authority
DE
Germany
Prior art keywords
standard deviation
noise
signal
audio signal
logic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE69636985T
Other languages
English (en)
Other versions
DE69636985D1 (de
Inventor
David L. Vancouver GRAUMANN
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Intel Corp
Original Assignee
Intel Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Intel Corp filed Critical Intel Corp
Application granted granted Critical
Publication of DE69636985D1 publication Critical patent/DE69636985D1/de
Publication of DE69636985T2 publication Critical patent/DE69636985T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M9/00Arrangements for interconnection not involving centralised switching
    • H04M9/08Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B1/00Instruments for performing medical examinations of the interior of cavities or tubes of the body by visual or photographical inspection, e.g. endoscopes; Illuminating arrangements therefor
    • A61B1/267Instruments for performing medical examinations of the interior of cavities or tubes of the body by visual or photographical inspection, e.g. endoscopes; Illuminating arrangements therefor for the respiratory tract, e.g. laryngoscopes, bronchoscopes
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B1/00Instruments for performing medical examinations of the interior of cavities or tubes of the body by visual or photographical inspection, e.g. endoscopes; Illuminating arrangements therefor
    • A61B1/00002Operational features of endoscopes
    • A61B1/00011Operational features of endoscopes characterised by signal transmission
    • A61B1/00016Operational features of endoscopes characterised by signal transmission using wireless means
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B1/00Instruments for performing medical examinations of the interior of cavities or tubes of the body by visual or photographical inspection, e.g. endoscopes; Illuminating arrangements therefor
    • A61B1/00002Operational features of endoscopes
    • A61B1/00043Operational features of endoscopes provided with output arrangements
    • A61B1/00045Display arrangement
    • A61B1/00052Display arrangement positioned at proximal end of the endoscope body
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B1/00Instruments for performing medical examinations of the interior of cavities or tubes of the body by visual or photographical inspection, e.g. endoscopes; Illuminating arrangements therefor
    • A61B1/00064Constructional details of the endoscope body
    • A61B1/00108Constructional details of the endoscope body characterised by self-sufficient functionality for stand-alone use
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M9/00Arrangements for interconnection not involving centralised switching
    • H04M9/08Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
    • H04M9/10Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic with switching of direction of transmission by voice frequency
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Surgery (AREA)
  • Engineering & Computer Science (AREA)
  • Radiology & Medical Imaging (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Physics & Mathematics (AREA)
  • Veterinary Medicine (AREA)
  • Biophysics (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Optics & Photonics (AREA)
  • Pathology (AREA)
  • Public Health (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Medical Informatics (AREA)
  • Molecular Biology (AREA)
  • Signal Processing (AREA)
  • Pulmonology (AREA)
  • Otolaryngology (AREA)
  • Physiology (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Telephone Function (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Noise Elimination (AREA)

Description

  • ERFINDUNGSGEBIET
  • Die vorliegende Erfindung betrifft das Gebiet der Telekommunikation. Insbesondere betrifft die vorliegende Erfindung das Bestimmen eines Grundrauschens und Detektieren von Sprachaktivität in einem Audiosignal.
  • ALLGEMEINER STAND DER TECHNIK
  • Fortschritte in der Telekommunikationstechnologie verbessern ständig die Art und Weise, auf die Menschen geschäftliche und persönliche Kommunikationen ausführen. Zu solchen Fortschritten gehören Verbesserungen bei Videokonferenzen, eine erhöhte Verfügbarkeit von ISDN-Verbindungen und Computernetzwerken und Verbesserungen des normalen Telefondiensts. Diese technologischen Fortschritte stellen hinsichtlich des Aufbaus viele Herausforderungen. Viele Telekommunikationssysteme erfordern beispielsweise eine Lösung zur Unterscheidung zwischen Sprache und Rauschen in einem Audiosignal; eine Einrichtung, die diese Funktion ausführt, wurde als Stimmaktivitätsdetektor (VAD) bezeichnet.
  • Eine Anwendung für ein VAD besteht in einem Halbduplex-Audiokommunikationssystem, welches bei „offener Audio"-Telekonferenz oder Telekonferenz mit Freisprechen verwendet wird. Halbduplex-Übertragung ist eine Übertragung, die zu einem gegebenen Zeitpunkt nur in einer Richtung erfolgt. Daher ist es in solchen Systemen übliche Praxis, das Mikrofon an einer gegebenen Einrichtung vorübergehend zu deaktivieren, während diese Einrichtung eine Übertragung empfängt, und den Lautsprecher an einer Einrichtung stummzuschalten, um Audiofeedback zu entfernen, welches von der entfernten Einrichtung empfangen wird. Zur Implementation dieser Funktionen kann daher ein VAD notwendig sein, um das Vorhandensein von Sprache sowohl in dem von einer entfernten Stelle empfangenen Audiosignal, als auch in dem an die entfernte Einrichtung zu sendenden Audiosignal zu detektieren. Ein VAD kann auch verwendet werden, um einen Echo-Unterdrückungs-Algorithmus zu signalisieren und zwischen „stimmhafter" Sprache und „nicht stimmhafter" Sprache zu unterscheiden, sowie in vielen anderen Aspekten der Audiokommunikation.
  • Einige bestehende VAD verwenden die Kommunikationsstrecke selbst, um Sprachaktivität zu detektieren. Bestimmte Daten können beispielsweise einem VAD an einem Ende der Strecke bereitgestellt werden, indem sie per „Huckepackverfahren" auf anderen Audiodaten, die von dem anderen Ende gesendet werden, transportiert werden. Ein VAD, der beim Detektieren von Sprache von einer entfernten Stelle abhängt, ist jedoch aus verschiedenen Gründen nicht wünschenswert. Außerdem weisen einige bestehende VAD ein unerwünscht langsames Ansprechverhalten auf, klassifizieren Sprache häufig falsch oder erfordern übermäßige Verarbeitungszeit.
  • Ein weiteres Problem hinsichtlich des Aufbaus bezieht sich auf die Verwendung von Headsets zur Implementation geschlossener Audiomikrofone und Lautsprecher bei Videokonferenzen. Es sind Videokonferenzsoftwareanwendungen verfügbar, welche allgemein sowohl Audio- als auch visuelle Kommunikation zwischen dem Nutzer eines Personal Computers und dem Nutzer eines anderen Personal Computers über ISDN-Leitungen, LAN oder andere Kanäle gestatten. Eine solche Anwendung ist das ProShareTM Personal Conferencing Video System, das von der Firma Intel, Santa Clara, Kalifornien, USA, entwickelt wurde. Einige Videokonferenzanwendungen werden derart vorkalibriert verkauft, dass sie ein oder mehrere bestimmte Headsetmodelle unterstützen. Diese Vorkalibrierung kann dadurch erfolgen, dass auf die entsprechenden Hardwareeinstellungen bezogene Daten, beispielsweise die Verstärkung der Mikrofoneingabe, in den Softwarecode aufgenommen werden. Wünscht der Nutzer jedoch die Verwendung eines nicht unterstützten Headsets, muß er oder sie im Allgemeinen die Videokonferenzanwendung verlassen und in das Betriebssystem gehen, um die Hardwareeinstellungen anzupassen. Dabei muß der Nutzer die optimalen Hardwareeintellungen im Wesentlichen erraten und die Einstellungen oftmals per Versuch-und-Irrtum neu anpassen, um die optimalen Einstellun gen zu erzielen. Bestehende Lösungen zur Hardwarekalibration bieten daher mit Blick auf die Fähigkeit, verschiedene Headsets zu unterstützen, wenig Flexibilität.
  • In Anbetracht dieser und anderer Probleme hinsichtlich des Aufbaus ist daher ein VAD wünschenswert, der unabhängig von der entfernten Stelle betrieben wird. Es ist ferner wünschenswert, dass ein solcher VAD eine hohe Genauigkeit (seltene Fehlklassifizierungen), schnelle Ansprechzeit, Anpassung an das fluktuierende Signal-zu-Rausch-Verhältnis der entfernten Stelle und gleichmäßige Halbduplex-Leistung, wenn der entfernte Nutzer zwischen offenen und geschlossenen Audiomoden übergeht, aufweist. Außerdem ist es wünschenswert, einen VAD bereitzustellen, der direkt von einer Hardwarekalibrationslösung verwendet werden kann. Schließlich ist eine Hardwarekalibrationslösung wünschenswert, die die Hardwareeinstellung automatisch so anpaßt, dass sie für jedes Headset, welches ein Nutzer zu verwenden wünscht, geeignet ist.
  • Weitere Beispiele von Anordnungen aus dem Stand der Technik werden beschrieben in US 5,239,574 , US 4,630,304 und IBM Technical Disclosure Bulletin, Bd. 22, Nr. 7, JOHNSON, R. J. et al. „Speech Detector", Seiten 2624 bis 2625, XP 002047894.
  • KURZE DARSTELLUNG DER ERFINDUNG
  • Gemäß der vorliegenden Erfindung wird ein Verfahren zum Auffinden eines Grundrauschens zum Qualifizieren eines Signals, wie in Anspruch 1 dargelegt, bereitgestellt.
  • Gemäß der vorliegenden Erfindung wird auch eine Einrichtung zum Bestimmen, ob in einem Audiosignal Stimme vorhanden ist, wie in Anspruch 5 dargelegt, bereitgestellt.
  • Ferner wird gemäß der vorliegenden Erfindung ein Computersystem bereitgestellt, welches die Fähigkeit für die Duplex-Audiokommunikation mit einer entfernten Einrichtung aufweist, wie in Anspruch 9 dargelegt.
  • Weitere Merkmale der vorliegenden Erfindung werden aus den beigefügten Zeichnungen und der folgenden ausführlichen Beschreibung ersichtlich.
  • KURZE BESCHREIBUNG DER ZEICHNUNGEN
  • Die vorliegende Erfindung wird beispielhaft und nicht einschränkend in den Figuren der beigefügten Zeichnungen veranschaulicht, in denen ähnliche Bezugszahlen ähnliche Elemente anzeigen und in denen:
  • 1 ein Computersystem zeigt, in dem die vorliegende Erfindung implementiert werden kann.
  • 2 den Datenstrom zeigt, der mit der Sprachdetektion und der automatischen Kalibration eines Mikrofons in einem Computersystem, welches Halbduplex-Audiokommunikation verwendet.
  • 3 eine Wellenform eines Audiosignals mit Sprachaktivität zeigt.
  • 4A und 4B die Funktion eines Stimmaktivitätsdetektors (VAD) zeigen.
  • 4C ein Blockdiagramm eines Stimmaktivitätsdetektors ist.
  • 5 ein Ablaufdiagramm ist, das die Gesamtfunktionsweise eines Stimmaktivitätsdetektors zeigt.
  • 6 eine Rausch-Leistungsdichte-Funktion zeigt.
  • 7 ein Ablaufdiagramm ist, das einen Prozeß zum Bestimmen und Aktualisieren eines Grundrauschens veranschaulicht.
  • 8 einen Ansatz aus dem Stand der Technik zum Berechnen der Standardabweichung der Energie eines Eingabeaudiosignals zeigt.
  • 9A einen Ansatz zum Berechnen der Standardabweichung eines Audiosignals gemäß der vorliegenden Erfindung zeigt.
  • 9B eine Kurve der Standardabweichung eines Eingabesignals über die Zeit zeigt.
  • 10 eine Wellenform eines Eingabeaudiosignals und eine Kurve der mittleren Spitze des Eingabeaudiosignals zeigt.
  • 11 ein Ablaufdiagramm ist, das den Prozeß der Berechnung eines mittleren Spitzenwerts eines Eingabeaudiosignals zeigt.
  • 12 ein Ablaufdiagramm ist, das den Prozeß zum Bestimmen, ob ein Eingabesignal nur Rauschen enthält, und zum Aktualisieren einer Rausch-Leistungsdichte-Funktion, veranschaulicht.
  • 13 eine Wellenform eines Eingabeaudiosignals zeigt, welche einen Vergleich des beim Berechnen der mittleren Energie, der Standardabweichung und eines mittleren Spitzenwerts des Eingabeaudiosignals zeigt.
  • 14 ein Ablaufdiagramm ist, das einen Prozeß zum Bestimmen, ob Sprache in einem Eingabeaudiosignal vorhanden ist, zeigt.
  • 15 eine Leistungsdichte-Funktion eines Eingabeaudiosignals zeigt, welches Rauschenergie und Sprachenergie enthält.
  • 16 ein Ablaufdiagramm ist, das einen Prozeß zum automatischen Kalibrieren eines Mikrofons eines Headsets zeigt.
  • 17 ein Ablaufdiagramm ist, das einen Prozeß zum Entfernen fehlerhafter Daten während der automatischen Kalibrierung eines Mikrofons zeigt.
  • 18A und 18B Prozesse zum Anpassen von Hardwareeinstellungen während der automatischen Kalibrierung eines Mikrofons zeigen.
  • AUSFÜHRLICHE BESCHREIBUNG
  • Es werden ein Verfahren und eine Einrichtung zum Bestimmen eines Grundrauschens und zum Detektieren von Sprachaktivität in einem Audiosignal beschrieben. In der folgenden Beschreibung werden zu Erläuterungszwecken zahlreiche spezifische Einzelheiten dargelegt, um ein umfassendes Verständnis der Erfindung bereitzustellen. Einem Fachmann wird jedoch klar sein, dass die vorliegende Erfindung ohne die spezifischen Einzelheiten ausgeführt werden kann. In anderen Fällen werden wohlbekannte Strukturen und Vorrichtungen im Blockdiagramm gezeigt, um zu vermeiden, das Verständnis der Erfindung unnötig zu erschweren.
  • Die vorliegende Erfindung wird in einem Computersystem 1 implementiert, welches sich über einen Audiokanal 95, wie in 1 gezeigt, mit mindestens einem anderen Computersystem in Halbduplex-Audiokommunikation befindet. Bei dem Audiokanal 95 kann es sich um eine ISDN-(Integrated Services Digital Network)-Verbindung oder ein lokales Netzwerk (LAN) eines Standardcomputers oder ein analoges Telefonsystem handeln. Das Computersystem 1 enthält eine zentrale Verarbeitungseinheit 10, eine Diskettenspeichereinrichtung 20, eine Tastatur 30, einen Speicher 40, ein Audio-Eingabe/Ausgabe-(E/A)-Subsystem 50, eine Cursorsteuereinrichtung 60, eine Anzeige 70, ein Video-E/A-Subsystem 80, das Eingaben von einer Videokamera 85 empfängt, und eine Schnittstelleneinrichtung 90, wie beispielsweise ein Modem, das eine Schnittstelle zwischen einem Computersystem 1 und dem Audiokanal 95 bereitstellt. In der offenen Audiokommunikation ist das Audio-E/A-Subsystem 50 mit einem Lautsprecher 52 und einem Mikrofon 53 und in der geschlossenen Audiokommunikation mit einem Headset 51 mit einem Lautsprecher und einem Mikrofon gekoppelt. Bei der Cursor-Steuereinrichtung 60 kann es sich um eine Maus, einen Trackball, einen Lichtstift, eine Stift-/Grafiktabelle oder eine andere ähnliche Einrichtung handeln. Die Diskettenspeichereinrichtung 20 kann eine magnetische Diskette, CD-ROM oder eine andere alternative Datenspeichereinrichtung sein.
  • 2 zeigt den mit dem Betrieb der vorliegenden Erfindung assoziierten Datenstrom. Die vorliegende Erfindung ist einem Stimmaktivitätsdetektor-(VAD)-Empfangskanal 210, einem VAD-Sendekanal 211 und einem Autokalibrator 230 implementiert, die jeweils in Software, die im Speicher 40 oder auf der Diskettenspeichervorrichtung 20 oder in einem äquivalenten Speicher gespeichert ist, implementiert sein können. In 2 werden komprimierte Audiodaten von dem Computersystem 1 von dem Audiokanal 95 empfangen und in die Dekomprimierungseinheit 220 eingegeben. Das Signal AUDIO RX, welches dekomprimierte Audiodaten enthält, wird dann von der Dekomprimierungseinheit 220 an den Halbduplex-Empfangskanal 200 und den VAD-Empfangskanal 210 ausgegeben. Die Energie E des Signals AUDIO RX weist eine Wellenform auf, die ähnlich der in 3 dargestellten ist. In 3 wird der Abschnitt 301 der Wellenform, welcher ein Grundrauschen NF übersteigt, als Sprachenergie betrachtet, wohingegen der Abschnitt 302 der Wellenform, welcher das Grundrauschen NF nicht übersteigt, nur als Rauschenergie betrachtet wird. Der VAD-Empfangskanal 210 empfängt Signal AUDIO RX als Eingabe und erzeugt eine Ausgabe RXO an den Halbduplex-Empfangskanal 200, welche anzeigt, ob das Signal AUDIO RX zu einem beliebigen gegebenen Zeitpunkt Sprache enthält oder nicht.
  • Der Halbduplex-Empfangskanal 200 leitet das Signal AUDIO RX abhängig von der Ausgabe RXO des VAD-Empfangskanals 210 selektiv an die Audio-Frontende-Ausgabeschaltung 252 weiter. An die Audio-Frontende-Ausgabeschaltung 252 weitergeleitete Audiodaten werden verarbeitet und an den Lautsprecher 52 gesendet. Unter Bezugnahme nun auf 4A, zeigt der VAD-Empfangskanal 210 dem Halbduplex-Empfangskanal 200 in Schritt 401 an, dass Sprache in dem Signal AUDIO RX vorhanden ist, dann kommuniziert der Halbduplex-Empfangskanal 200 mit dem Halbduplex-Sendekanal 201, um zu bewirken, dass das Mikrofon 53 in Schritt 402 stummgeschaltet wird. Das Mikrofon 53 bleibt stummgeschaltet, bis in dem Signal AUDIO RX nicht länger Sprache detektiert wird.
  • Unter Bezugnahme wiederum auf 2 wird über den Audiokanal 95 zu sendender Ton entweder über das Mikrofon des Headsets 51 oder über das offene Audiomikrofon 53 von einem Nutzer in die Audio-Frontende-Eingabeschaltung 253 eingegeben, welche das Signal AUDIO TX ausgibt. Die Energie E des Signals AUDIO TX weist wie beim Signal AUDIO RX eine Form auf, die ähnlich der in 3 dargestellten ist. Das Signal AUDIO TX wird dem VAD-Sendekanal 211 und dem Halbduplex-Sendekanal 201 bereitgestellt. Der Halbduplexkanal 201 leitet das Signal AUDIO TX abhängig von einer von dem VAD-Sendekanal 211 empfangenen Eingabe TXO, die anzeigt, ob in dem Signal AUDIO TX Sprache vorhanden ist oder nicht, selektiv an die Kompressionseinheit 222 zur Sendung über den Audiokanal 95 weiter. Wenn Halbduplex-Sendekanal 201 in Schritt 404 eine Eingabe TXO von VAD-Sendekanal 211 empfängt, welche anzeigt, dass in dem Signal AUDIO TX Sprache vorhanden ist, dann kommuniziert der Halbduplex-Sendekanal 201 mit dem Halbduplex-Empfangskanal 200, um zu bewirken, dass der Halbduplex-Empfangskanal 200 in Schritt 405 den Lautsprecher 52 stummschaltet, wie in 4B gezeigt. Der Lautsprecher 52 bleibt stummgeschaltet, bis in dem Signal AUDIO TX nicht länger Sprache detektiert wird.
  • In Reaktion auf eine Nutzereingabe, die auf eine nicht von der besonderen Marke oder dem Modell des Headsets 51 abhängende Weise über eine klassische Nutzerschnittstelle (GUI) 240 eingegeben wird, kalibriert der Autokalibrator 230 das Headset 51 automatisch, wie in 2 gezeigt. Der Autokalibrator 230 empfängt eine Nutzereingabe UI von der GUI 240 und das Signal TXO von dem VAD-Sendekanal 211. Der Autokalibrator 230 gibt ein erstes Kalibrationssignal CAL1 an die Audio-Frontend-Eingabeschaltung 253 und ein zweites Kalibrationssignal CAL2 an den Speicher 40 und die Diskettenspeichereinrichtung 20 aus. Das Signal CAL1 wird verwendet, um die Audiofrontendeingabeschaltung 253 zu kalibrieren, und das Signal CAL2 wird verwendet, um die geeigneten Hardwareeinstellungen auf die Diskettenspeichervorrichtung 20 oder in den Speicher 40 zu speichern.
  • Obwohl der VAD-Empfangskanal 210 und der VAD-Sendekanal 211 bisher getrennt veranschaulicht und beschrieben worden sind, führen sie im Wesentlichen identische Funktionen aus und werden im Folgenden durch den in 4C gezeigten VAD 410 austauschbar veranschaulicht. Der VAD 410 empfängt ein Eingabeaudiosignal AUDIN, welches entweder Signal AUDIO RX oder Signal AUDIO TX wiedergibt, und gibt ein Signal VADOUT aus, welches entweder Signal RXO oder Signal TXO wiedergibt und welches anzeigt, ob in dem Eingabesignal AUDIN Sprache vorhanden ist. Unter Bezugnahme nun auf 5 wird ein Ablaufdiagramm gezeigt, das die Gesamtfunktion des VAD 410 zeigt. Die Funktion des VAD 410 besteht allgemein aus zwei Schritten. In Schritt 501 wird ein Grundrauschen NF bestimmt. Als nächstes bestimmt in Schritt 502 der VRD 410, basierend auf der Beziehung des Eingabesignals AUDIN zu dem Grundrauschen NF, ob Sprache in dem Eingabesignal AUDIN vorhanden ist. In der bevorzugten Ausführungsform werden die Schritte 501 und 502 jeweils einmal alle 20 Millisekunden (ms) wiederholt.
  • Der VAD 410 berechnet das Grundrauschen NF beim Bestimmen, ob Sprache in dem Eingabesignal vorhanden ist, kontinuierlich neu, wie später ausführlicher beschrieben werden wird. Das Grundrauschen wird basierend auf einer Rausch-Leistungsdichte-Funktion NPDF generiert, welche durch den VAD 410 erzeugt und aktualisiert wird. Der Energiepegel des Grundrauschens basiert auf einem aktuellen Zustand der NPDF zu einem gegebenen Zeitpunkt. Ein Beispiel einer NPDF wird in 6 dargestellt. Das Grundrauschen NF wird als der Mittelenergiewert der NPDF genommen, das heißt der Mittelrauschenergiepegel (MNEL) zuzüglich eines Grenzwerts MV. In der bevorzugten Ausführungsform wird das Eingabesignal AUDIN bei einer Rate von 8 kHz von dem VAD 410 abgetastet und die NPDF wird alle 20 ms aktualisiert. Folglich wird das Eingabesignal AUDIN in einem Zeitintervall von 200 ms 160 Mal abgetastet.
  • Zur Aktualisierung der NPDF verwendet der VAD 410 sowohl die Standardabweichung der Energie des Eingabesignals über eine Zeitperiode als auch den aktuellen Energiepegel des Eingabesignals an einem bestimmten Zeitpunkt. Zur Erzeugung jedes neuen Werts der Standardabweichung wird beim Sammeln von Abtastwerten der Energie des Eingabesignals wird ein „gleitendes Zeitfenster" verwendet. Das heißt, jeder berechnete Wert der Standardabweichung SD basiert auf einer Abtastperiode, welche mindestens eine vorherige Abtastperiode überlappt, wie in 9A gezeigt und im Folgenden weiter erörtert wird. In der bevorzugten Ausführungsform wird zur Erzeugung jedes Standardabweichungswerts SD eine Abtastperiode von 500 ms verwendet. Diese Periode von 500 ms wird alle 20 ms aktualisiert, um eine schnelle Ansprechzeit des VAD 410 zu erzielen. Da solche kurzen Zeitperioden verwendet werden, wird der aktuelle Energiepegel E im Vergleich zu einer Einhüllenden des Eingabesignals AUDIN untersucht, als ein Mittel, die Genauigkeit beim Aktualisieren des Grundrauschens NF zu erhöhen, das heißt, die Anzahl von Vorkommen zu verringern, wenn eine geringe Standardabweichung von Sprache inkorrekt als Rauschen interpretiert wird. In der bevorzugten Ausführungsform ist die einhüllende des Eingabesignals ein mittlerer Spitzenwert AP des Eingabesignals AUDIN über ein Zeitfenster von zwei Sekunden.
  • Unter Bezugnahme nun auf 7 wird der Prozeß des Bestimmens und Aktualisierens des Grundrauschens NF (Schritt 501) ausführlicher dargestellt. Der Prozeß besteht aus Schritten 701 bis 705. Wie oben erwähnt ist die Gesamtfunktion des VAD 410 ein Prozeß, der alle 20 ms wiederholt wird. In der Folge wird jeder der Schritte 701 bis 705 alle 20 ms einmal ausgeführt. Der VAD 410 tastet das Eingabesignal AUDIN bei einer Rate von 8 kHz oder 160 Abtastwerten für jede Wiederholung von 20 Sekunden ab. Für jeden Abtastwert wird der Energiepegel jedes Eingabesignals AUDIN bestimmt. In Schritt 701 wird die mittlere Energie EAVG aller Abtastwerte, die während der letzten 20 ms auftreten, berechnet. In Schritt 702 wird die Standardabweichung SD für alle Werte der mittleren Energie EAVG, die während der letzten 500 ms berechnet wurden, berechnet. In Schritt 703 wird mittlere Spitzenwert AP des Eingabesignals AUDIN berechnet. In Schritt 704 trifft der VAD eine vorläufige Entscheidung, ob das Eingabesignal nur Rauschen oder Sprache enthält. Diese vorläufige Entscheidung erfolgt jedoch nur für die Zwecke des Aktualisierens des Grundrauschens NF und nicht für den Zweck, eine endgültige Bestimmung darüber zu treffen, ob in dem Eingabesignals AUDIN Sprache vorhanden ist. In Schritt 705 wird die NPDF aktualisiert, wenn das Ergebnis der vorläufigen Bestimmung war, dass in dem Eingabesignal nur Rauschen vorhanden ist (Schritt 704). Wenn bestimmt wird, dass nicht nur Rauschen vorhanden ist, wird die NPDF nicht aktualisiert. In Schritt 704 wird eine Zeitabklingfunktion an die NPDF angelegt, um nicht signifikante Datenpunkte zu eliminieren. Dieser Schritt besteht aus dem Multiplizieren der gesamten NPDF-Kurve mit einem Wert von 0,99990, was zu ungefähr einem halben Prozent pro Sekunde Abklingen in einer Stelle (Energiewert) der NPDF führt. Der Effekt dieses zeitlichen Abklingens ist, dass weniger häufig auftretende Energiewerte schließlich aus der NPDF verschwinden werden oder die NPDF weniger beeinflussen als jene, die häufiger auftreten. In Schritt 707 wird das Grundrauschen NF als der mittlere Ener giepegel der NF zuzüglich eines Grenzwerts NF berechnet, das heißt, das Grundrauschen NF ist gleich dem mittleren Rauschenergiepegel (MNEL) zuzüglich des Grenzwerts MV (siehe 6). In der bevorzugten Ausführungsform beträgt der Grenzwert MV 6 dB, dieser Wert kann jedoch angepaßt werden, um erwünschte Leistungsmerkmale zu erzielen.
  • Wie oben erwähnt, wird das Grundrauschen NF basierend teilweise auf der Standardabweichung SD von Abtastwerten der mittleren Energie EAVG des Eingabesignals AUDIN aktualisiert. Insbesondere zeigt während eines gegebenen Zeitintervalls eine geringe Standardabweichung SD in der Regel ein Mangel an Sprachaktivität (nur Rauschen in dem Eingabesignal AUDIN) an, wobei angenommen wird, dass die Dauer des Abtastfensters lang genug ist. Im Gegensatz dazu zeigt eine hohe Standardabweichung in der Signalenergie an, dass Sprachaktivität in dem Eingabesignal vorhanden ist. Die Standardabweichung SD wird nach der folgenden Formel berechnet:
    Figure 00110001
    wobei Ei Werte der mittleren Energie EAVG darstellt.
  • Alle 20 ms wird für den Zweck des Aktualisierens der NPDF ein neuer Standardabweichungswert SD berechnet. Die Standardabweichung SD wird für alle innerhalb der letzten 0,5 Sekunden auftretenden Werte der mittleren Energie EAVG berechnet. Unter Bezugnahme auf 9A sind die überlappenden Zeitintervalle T1 bis T4 Beispiele für vier Abtastfenster, die zur Erzeugung von aufeinanderfolgenden Standardabweichungswerten SD1 bis SD4 verwendet werden. Da zur Aktualisierung des Grundrauschens NF alle 20 ms ein neuer Wert der Standardabweichung SD berechnet wird, werden die Zeitintervalle T1 bis T4 um Inkremente von 20 ms versetzt. Dieses Verfahren zur Berechnung der Standardabweichung SD weicht von einem in 8 gezeigten Verfahren nach dem Stand der Technik ab, in dem nicht überlap pende Zeitintervalle TA bis TD verwendet werden, um Standardabweichungswerte SDA bis SDD zu erzeugen.
  • Wie oben erwähnt ist das in der vorliegenden Erfindung zum Berechnen der Standardabweichung SD verwendete Zeitintervall von 500 ms angesichts der dynamischen Merkmale der typischen menschlichen Sprache verhältnismäßig kurz. Das heißt, während einer gegebenen Zeitperiode von 500 ms Dauer von kontinuierlicher menschlicher Sprache kann die Standardabweichung SD der Signalenergie relativ gering sein, möglicherweise unterhalb eines als Schwellwert eingesetzten Werts. Da die Dauer des Abtastfensters zum Berechnen der Standardabweichung reduziert ist, erhöht sich die Wahrscheinlichkeit der Fehlklassifizierung von Sprache als Rauschen tendenziell. Dieser Grundsatz wird in 9B dargestellt, welche eine Kurve der Standardabweichung SD über die Zeit für die in 9A gezeigte Wellenform zeigt. In der bevorzugten Ausführungsform wird ein Standardabweichungs-SD-Wert von 3,2 als Schwellwert beim Unterscheiden zwischen Sprache und Rauschen für den Zweck des Aktualisierens der NPDF verwendet. In 9A und 9B ist ersichtlich, dass die während des Zeitintervalls T5 auftretende Sprache möglicherweise als Rauschen fehlklassifiziert wird, wenn man sich nur auf die Standardabweichung SD verlassen würde, da dieser Wert während des Zeitintervalls T5 unterhalb von 3,2 fällt. Folglich stützt sich die vorliegende Erfindung beim Klassifizieren des Eingabeaudiosignals nicht nur auf die Standardabweichung SD des Eingangssignals; statt dessen berechnet die vorliegende Erfindung auch eine Einhüllende des Eingabesignals AUDIN während jeder 20 ms-Wiederholung als einen zusätzlichen Faktor beim Aktualisieren der NPDF. Diese Einhüllende wird durch den mittleren Spitzenwert AP der Energie des Eingabesignals AUDIN wie in 10 gezeigt dargestellt.
  • 11 veranschaulicht ein Ablaufdiagramm, welches zeigt, wie der mittlere Spitzenwert AP berechnet wird. In Schritt 1101 werden die letzten fünf aufeinanderfolgenden mittleren Energiewerte EAVG (entsprechend den letzten 100 ms) gesichert. Diese fünf EAVG-Werte werden dann in Schritt 1102 gemittelt, um einen Wert AFG5 zu erzeugen. In Schritt 1103 werden die höchsten fünf Werte von während den letzten zwei Sekunden berechneten AFVG5 identifiziert. In Schritt 1105 wird der mittlere Spitzenwert AP als das Mittel dieser höchsten fünf AP-Werte berechnet. Unter Bezugnahme wieder auf 7 wird in Schritt 704 eine vorläufige Bestimmung darüber, ob das Eingabesignal Sprache enthält oder nicht, für den beschränkten Zweck des Aktualisierens der NPDF (Schritt 705) zum Aktualisieren des Grundrauschens NF (Schritt 707) getroffen. Wie bereits erwähnt, wird der mittlere Spitzenwert AP zum Teil verwendet, um während Zeitperioden, in denen der Standardabweichungswert EAVG unterhalb von 3,2 fällt, obwohl Sprache auftritt, die Genauigkeit zu erhöhen. Insbesondere wird das Eingangssignal AUDIN nur dann als nur Rauschen enthaltend, wenn der aktuelle Wert der mittleren Energie EAVG unter den Pegel des aktuellen mittleren Spitzenwerts AP minus 9 dB fällt. Somit ist es unwahrscheinlich, dass ein Eingangssignal, welches eine geringe Standardabweichung SD, aber einen hohe aktuelle mittlere Energie EAVG hat, für den Zweck des Aktualisierens der NPDF als Rauschen fehlklassifiziert wird. Außerdem setzt die vorliegende Erfindung auch einen Nulldurchgang-Algorithmus ein, um die Genauigkeit des Grundrauchens weiter zu erhöhen, wie unten erläutert.
  • 12 ist ein Ablaufdiagramm, das die Schritte des Bestimmens, ob ein Eingangssignal nur Rauschen (Schritt 704) enthält, und des Aktualisieren der NPDF (Schritt 705), in Einzelheiten zeigt. Wenn der aktuelle EAVG in Schritt 1201 nicht unterhalb des Pegels (AP-9 dB) fällt, wird in Schritt 1205 bestimmt, dass das Eingangssignals AUDIN für die Zwecke der Aktualisierung der NPDF nicht Rauschen ist. In diesem Fall wird keine Stelle der NPDF erhöht. Wenn in Schritt 1201 dagegen bestimmt wird, dass der aktuelle mittlere Energiewert EAVG unterhalb von (AP-9 dB) fällt, wird in Schritt 1202 eine Bestimmung getroffen, ob alle der Standardabweichungswerte SD, die während der letzten 120 ms berechnet wurden, unterhalb von 3,2 gefallen sind. Wenn das Ergebnis von Schritt 1202 „NEIN" ist, dann wird in Schritt 1205 bestimmt, dass das Eingangsignal AUDIN für die Zwecke der Aktualisierung der NPDF nicht Rauschen ist, und es wird keine Stelle der NPDF erhöht. Wenn alle der Standardabweichungswerte SD für mindestes die letzten 120 ms unterhalb von 3,2 gefallen sind, wird in Schritt 1203 eine Bestimmung getroffen, ob alle der Standardabweichungswerte SD für mindestens die letzten 1,5 Sekunden unterhalb von 3,2 gefallen sind. Wenn das Ergebnis von Schritt 1203 „NEIN" ist, dann besteht „geringes Vertrauen", dass das Eingangssignal AUDIN nur Rauschen beinhaltet. Folglich wird in Schritt 1206 die geeignete Stelle in der NPDF aktualisiert, indem diese Stelle durch einen geringen Vertrauenswert von 0,01 erhöht wird. Wenn dagegen in Schritt 1203 bestimmt wird, dass die Standardabweichung für mindestens 1,5 Sekunden unterhalb von 3,2 gefallen ist (und das Ergebnis der Schritte 1201 und 1202 „JA" war), dann besteht ein hohes Vertrauen, dass das Eingangssignal AUDIN nur Rauschen ist. In diesem Fall wird die geeignete Stelle in der NPDF in Schritt 1204 um einen hohen Vertrauenswert von 0,1 erhöht. Es sei darauf hingewiesen, dass es zur Ausführung der vorliegenden Erfindung nicht notwendig ist, die exakten Werte von 0,01 als den geringen Vertrauenswert und 0,1 als den hohen Vertrauenswert. Der wichtige Aspekt dieser Zahlen ist, dass das Verhältnis des hohen Vertrauenswerts zu dem geringen Vertrauenswert deutlich größer als eins ist. Somit wird die NPDF basierend sowohl auf der Beziehung zwischen dem aktuellen mittleren Energiewert EAVG des Eingangssignals und dem aktuellen mittleren Spitzenwert AP als auch auf der Standardabweichung SD der Eingabesignalenergie über eine gegeben Zeitperiode aktualisiert. Jedes Mal, wenn eine bestimmt Stelle der NPDF erhöht wird, wird sie entweder um einen hohen Vertrauenswert oder einen niedrigen Vertrauenswert erhöht, um den Grad an Vertrauen, dass das Eingangssignal AUDIN aktuell nur Rauschen enthält, wiederzugeben.
  • 13 zeigt ein Beispiel einer Wellenform des Audioeingabesignals AUDIN und die Beziehungen zwischen den beim Berechnen der mittleren Energie EAVG, der Standardabweichung SD und des mittleren Spitzenwerts AP verwendeten Abtastfenster. In 13 wird ein mittlerer Energiewert EAVG für Abtastwerte der aktuellen Energie E, die innerhalb eines Abtastfensters SMMPW von 20 ms Dauer auftreten, berechnet. Auf der Basis der EAVG-Werte, die während des Standardabweichungsfensters SDW von 0,5 Sekunden Dauer berechnet werden, wird auch ein Standardabweichungs-SD-wert berechnet. Außerdem wird ein neuer Wert der mittleren Spitze AP basierend auf während des Abtastfensters APW von zwei Sekunden Dauer auftretenden EAVG-Werten berechnet. Dieser Prozeß wird alle 20 ms wiederholt, wobei die Abtastfenster SMPW, SDW und AP bei jeder Wiederholung um 20 ms vorgeschoben werden.
  • Die durch den VAD 410 letztlich getroffene Entscheidung, ob das Eingabesignal AUDIN Sprache enthält oder nicht, wird in dem Ausgabesignal VADOUT angezeigt, welches verwendet werden kann, um während offener Audiokommunikation den Lautsprecher 52 oder das Mikrofon 53 basierend auf der aktuellen momentanen Energie E des Eingabesignals relativ zu dem Grundrauschen NF selektiv stummzuschalten. Dieser Entscheidungsfindungsprozeß wird in 14 dargestellt. In Schritt 1401 wird eine Bestimmung getroffen, ob die momentane Energie E des Eingangssignals AUDIN das Grundrauschen übersteigt. Wenn nicht, dann trifft der VAD 410 in Schritt 1407 die vorläufige Entscheidung, dass in dem Eingangssignal AUDIN keine Sprache detektiert wird. Wenn die momentane Energie E das Grundrauschen NF übersteigt, dann trifft der VAD 410 die vorläufige Entscheidung in Schritt 1402, dass in dem Eingabesignal AUDIN Sprache detektiert wird. Wenn in Schritt 1402 Sprache detektiert wird, wird in Schritt 1403 ein „Nulldurchgangstest" angelegt, um zu bestimmen, ob es sich bei der Sprache um „stimmhafte" oder „nicht stimmhafte" Sprache handelt. Stimmhafte Sprache ist Sprache, die durch eine Stimmbandbewegung erzeugt wird (z.B. der Ton „Aaaah"), während „nicht stimmhafte Sprache" Sprache ist, die ohne Stimmbandbewegung erzeugt wird (z.B. der Ton „Shhhh"). Das Ergebnis des Nulldurchgangstest (Schritt 1403) wird von dem Autokalibrator 230 verwendet, wie weiter unten ausführlicher beschrieben. Die von dem VAD getroffene endgültige Entscheidung, wird durch 60 ms „geglättet". Damit der VAD 410 eine Ausgabe VADOUT erzeugt, die anzeigt, dass in dem Ein gabesignal AUDIN Sprache vorhanden ist (Schritte 1405 und 1406), müssen somit drei aufeinanderfolgende Detektionen von Sprache entsprechend den drei aufeinanderfolgenden Zeitintervallen von 20 ms in den Schritten 1402 bis 1940 auftreten.
  • Ein Nulldurchgangstest ist auf dem Gebiet des Aufbaus von Audiosystemen wohlbekannt. Der Nulldurchgangstest aus Schritt 1403 ist eine Bestimmung, ob der unverarbeitete Signalwert des Signals AUDIN über mehr als 30 Prozent der Zeit während der letzten 10 ms das Vorzeichen geändert hat. Anders ausgedrückt kann es zwischen zwei aufeinanderfolgenden Abtastwerten des Signals AUDIN eine Änderung des Vorzeichens geben oder nicht; der Test aus Schritt 1403 bestimmt, ob mehr als 30 Prozent aller Paare aufeinanderfolgender Abtastwerte des Signals AUDIN, die während der letzten 10 ms aufgetreten sind, eine Vorzeichenänderung mit sich brachten. Wenn das Signal AUDIN während der letzten 10 ms für mehr als 30 Prozent der Zeit das Vorzeichen geändert hat, dann wird in Schritt 1403 bestimmt, dass die erfaßte Sprache „nicht stimmhafte Sprache" ist. Andernfalls wird in Schritt 1404 bestimmt, dass die detektierte Sprache „stimmhafte" Sprache ist.
  • Zusätzlich zu der Steuerung des Stummschaltens von Lautsprecher 52 und Mikrofon 53 kann die Ausgabe des VAD 410 auch in einem Merkmal verwendet werden, welches die korrekten Hardwareeinstellungen für jedes Headset, den ein Nutzer zu verwenden wünscht, einrichtet und implementiert. Unter Bezugnahme wiederum auf 2 empfängt der Autokalibrator 230 die Ausgabe TXO des VAD-Sendekanals 211 sowie eine Eingabe UI von der GUI 240. Der Nutzer des Headsets 52 klickt auf ein Icon, welches durch die GUI 240 dargestellt wird, unter Verwendung der Cursorsteuereinrichtung, wodurch bewirkt wird, dass die GUI den Nutzer dazu auffordert, in das Mikrofon des Headsets 52 für eine vorbestimmte Zeitperiode zu sprechen. Der Autokalibrator 230 paßt dann die geeigneten Hardwareeinstellungen an, einschließlich der Verstärkung der Mikrofoneingabe, und speichert die Einstellungen in dem Speicher 40 der Diskettenspeichereinrichtung 20 oder in beiden.
  • Wie in 15 gezeigt, kann das Eingangssignal AUDIN an den VAD 410 als doppelbogige Leistungsdichte-Kurve der Energie, die sowohl Rauschen als auch Sprache darstellt, dargestellt werden. Rauschenergie ist um ein MNEL konzentriert und Sprachenergie ist um einen mittleren Sprachenergiepegel MVEL konzentrieren. Für ein gegebenes Headset muß die Verstärkung der Mikrofoneingabe erhöht werden, so dass ein Nutzer an dem Empfangsende die Sprache des Nutzers an dem Sendeende bequem hören kann. Somit wird in der bevorzugten Ausführungsform die Verstärkung der Mikrofoneingabe durch einen Autokalibrator 130 in Reaktion auf die Stimme des Nutzers erhöht, so dass im Allgemeinen der MVEL des Eingabesignals auf einen vorbestimmten Stimmbezugspegel VRL erhöht wird. Das Erhöhen der Verstärkung der Mikrofoneingabe führt jedoch zu der Verstärkung von sowohl Rauschenergie als auch Sprachenergie. Eine solche Verstärkung kann den unerwünschten Effekt der Verstärkung des Rauschenergiepegels auf einen unangenehmen Pegel aufweisen. Folglich wird ein Rauschbezugspegel NRL eingerichtet und die Verstärkung der Mikrofoneingabe wird so beschränkt, dass das Grundrauschen NF den Rauschbezugspegel NRL nicht übersteigt. In der bevorzugten Ausführungsform, welche einen dynamischen Gesamtbereich von 95 dB aufweist, wird der Stimmbezugspegel VRL so gewählt, dass er 47 dB beträgt, während der Rauschbezugspegel so gewählt wird, dass er 32 dB beträgt.
  • 16 ist ein Ablaufdiagramm des von dem Autokalibrator 230 zum Kalibrieren des Mikrofons des Headsets 51 verwendeten Prozesses. Der Autokalibrator 230 verwendet die Ausgabe TXO des VAD-Sendekanals 211, um verschiedene Stimmen-Leistungsdichte-Funktionen (VPDF) zu erzeugen und zu führen. In Schritt 1602 bestimmt der Autokalibrator 230, ob das Eingabesignal AUDIN aktuell entweder stimmhafte oder nicht stimmhafte Sprache enthält, basierend auf dem Ergebnis des Nulldurchgangstests (siehe 14). In Schritt 1603 werden Vorkommen von stimmhafter Sprache in eine VPDF basierend auf der Ausgabe des VAD-Sendekanals 211 eingegeben. Der Autokalibrator 230 fährt mit der Eingabe von Vorkommen von stimmhafter Sprache in die VPDF fort, bis eine gut verteilte (nützliche) VPDF erzeugt ist. Die gut verteilte VPDF besteht aus 18 Vorkommen stimmhafter Sprache, die in Intervallen von 20 ms detektiert wurden, d.h. 360 ms detektierte stimmhafte Sprache (Schritt 1604). Sobald die VPDF erzeugt ist, wird der mittlere Stimmenergiepegel MVEL dieser VPDF in Schritt 1605 gesichert. In Schritt 1606 werden die Hardwareeinstellungen basierend auf dem MVEL der VPDEF auf die oben beschriebene Weise angepaßt. Dieser Prozeß wird wiederholt, bis fünf separate VPDF erzeugt worden sind, um fünf separate MVEL (MVEL1, MVEL2, ..., MVEL5) zu erzeugen, welche jeweils aus 18 aufeinanderfolgenden Stimmdetektionen basieren. Nach dem Erzeugen fünf separater VPDF und dem Anpassen der Hardwareeinstellungen, wird in Schritt 1608 eine Korrektur vorgenommen, um bestimmte Datenpunkte aus der VPDF, welche wahrscheinlich fehlerhaft sind, zu entfernen. Nach dem Entfernen fehlerhafter Daten werden die Hardwareeinstellungen in Schritt 1609 ein letztes Mal angepaßt, um den automatischen Kalibrationsprozeß abzuschließen.
  • 17 zeigt eingehender den Schritt (1608) des Entfernens fehlerhafter Daten. In Schritt 1701 werden von den fünf VPDF, die gesichert worden sind, die VPDF mit dem höchsten MVEL und die VPDF mit dem geringsten MVEL verworfen. Die MVEL der drei verbleibenden VPDF werden dann in Schritt 1702 gemittelt, um einen Wert AVG_MVEL zu erzeugen. Der Wert AVG_MVEL wird für die letzte Anpassung der Hardwareeinstellungen verwendet.
  • 18A und 18B zeigen die Schritte 1606 und 1609 des Anpassens der Hardwareeinstellungen ausführlicher. Unter Bezugnahme auf 18A wird in Schritt 1801 eine Bestimmung darüber getroffen, ob die Differenz zwischen dem Stimmbezugspegel VRL und dem MVEL der zuletzt erzeugten VPDF die Differenz zwischen dem Rauschbezugspegel NRL und dem Grundrauschen NF übersteigt, d.h. ob (VRL-MVELN)>(NRL-NF). Wenn diese Bedingung erfüllt ist, dann wird in Schritt 1802 die Verstärkung erhöht, bis das Grundrauschen NF gleich dem Rauschbezugspegel NRL ist. Wenn die Bedingung nicht erfüllt ist, wird die Verstärkung erhöht, bis der MVEL der zuletzt erzeugten VPDF gleich dem Rauschbezugspegel VRL (d.h. bis MVELN=VRL).
  • Die in Schritt 1609 erfolgte Anpassung der Hardwareeinstellungen weicht etwas von der in Schritt 1606 ausgeführten ab. Unter Bezugnahme auf 18B wird in Schritt 1810 eine Bestimmung darüber getroffen, ob die Differenz zwischen dem Stimmbezugspegel VRL und dem Wert AVG_MVEL die Differenz zwischen dem Rauschbezugspegel NRL und dem Grundrauschen NF übersteigt, d.h. ob (VRL-AVG_MVEL)>(NRL-NF). Wenn diese Bedingung erfüllt ist, dann wird in Schritt 1811 die Verstärkung erhöht, bis das Grundrauschen NF gleich dem Rauschbezugspegel NRL ist. Wenn nicht, wird in Schritt 1812 die Verstärkung erhöht, bis der Wert AVG_MVL gleich dem Stimmbezugspegel VRL ist. Somit paßt der Autokalibrator 230 die Hardwareeinstellungen, die für das bestimmte verwendete Headset 51 geeignet sind, automatisch an.
  • Beschrieben wurde somit ein VAD, der unabhängig von einer entfernten Einrichtung wirkt. Der VAD stellt große Genauigkeit, schnelle Ansprechzeit, die Fähigkeit, sich an das Signal-zu-Rausch-Verhältnis der entfernten Einrichtung anzupassen, sowie eine gleichmäßige Halbduplex-Leistung bereit, wenn der entfernte Nutzer zwischen offenen und geschlossenen Audiomoden übergeht. Es wurde auch eine Hardwarekalibrationslösung beschrieben, die die Hardwareeinstellungen automatisch so anpaßt, dass sie für jedes Headset geeignet sind.
  • Obwohl die vorliegende Erfindung unter Bezugnahme auf spezifische beispielhafte Ausführungsformen beschrieben worden sind, wird offensichtlich sein, dass verschiedene Modifikationen und Änderungen an diesen Ausführungsformen vorgenommen werden können, ohne von dem Umfang der Erfindung, wie er in den Ansprüchen dargelegt ist, abzuweichen. Dementsprechend sollen die Beschreibung und die Zeichnungen in einem veranschaulichenden anstelle eines einschränkenden Sinnes betrachtet werden.

Claims (10)

  1. Ein Verfahren zum Auffinden eines Grundrauschens zum Qualifizieren eines Signals, aufweisend Schritte, die gekennzeichnet sind durch: Bestimmen einer Rausch-Leistungsdichte-Funktion, basierend auf einer Beziehung zwischen einem mittleren Spitzenpegel (703) des Signals und eines aktuellen Signalpegels, und einer Mehrzahl von Standardabweichungswerten (702) des Signals, wobei jeder der Standardabweichungswerte einem von einer Mehrzahl von Zeitintervallen zugehört; wiederholtes Aktualisieren (705) der Rausch-Leistungsdichte-Funktion, um einen aktuellen Zustand einer Rausch-Leistungsdichte-Funktion zu erstellen; und Verwenden des aktuellen Zustands der Rausch-Leistungsdichte-Funktion zum Auffinden (707) des Grundrauschens.
  2. Das Verfahren gemäß Anspruch 1, wobei jedes der Zeitintervalle mit wenigstens einem anderen Zeitintervall überlappt.
  3. Das Verfahren gemäß Anspruch 1, wobei der Schritt des wiederholten Aktualisierens (705) die Schritte aufweist: Bestimmen (1201) ob der mittlere Spitzenpegel des Signals den aktuellen Pegel des Signals um einen vorgegebenen Betrag übersteigt; Bestimmen (1202) ob alle der Standardabweichungswerte, welche während einer ersten Zeitperiode berechnet wurden, unterhalb eines Schwellwerts liegen; und Identifizieren (1204) eines Rauschvorkommens wenn: der mittlere Spitzenpegel des Signals den aktuellen Pegel des Signals um einen vorgegebenen Betrag übersteigt, und alle der Standardabweichungswerte, welche während der ersten Zeitperiode berechnet wurden, unterhalb des Schwellwerts liegen.
  4. Das Verfahren gemäß Anspruch 1, wobei der mittlere Spitzenpegel einer Einhüllenden des Signals entspricht.
  5. Eine Einrichtung zum Bestimmen, ob in einem Audiosignal eine Stimme vorhanden ist, aufweisend einen Stimmaktivitätsdetektor (410), wobei der Stimmaktivitätsdetektor (410) gekennzeichnet ist durch: einen Spitzen-Berechner(703) zum Bestimmen einer Spitze des Audiosignals; einen Standardabweichungs-Generator (702) zum Bestimmen einer Mehrzahl von Standardabweichungswerten des Audiosignals, wobei jeder der Standardabweichungswerte einem von einer Mehrzahl von Zeitintervallen zugeordnet ist; einer Aktualisierungslogik (705), welche zum Empfangen des Spitzenwerts und der Standardabweichungswerte gekoppelt ist, wobei die Aktualisierungslogik (705) eine Leistungsdichte-Funktion aktualisiert, um einen aktuellen Zustand der Leistungsdichte-Funktion gemäß einer Beziehung zwischen dem Spitzenwert und einem aktuellen Pegel des Audiosignals und basierend auf den Standardabweichungswerten zu bestimmen; einen Grundrauschen-Lokalisierer (707), welcher zum Empfangen des aktuellen Zustands der Leistungsdichte-Funktion gekoppelt ist, wobei der Grundrauschen-Lokalisierer (707) ein Grundrauschen auf Grundlage des aktuellen Zustands der Leistungsdichte-Funktion auffindet; Entscheidungslogik (502), die zum Empfangen des Grundrauschens und des Audiosignals gekoppelt ist, wobei die Entscheidungslogik (502) bestimmt, dass eine Stimme in dem Audiosignal wiedergegeben ist, wenn eine vorgegebene Beziehung zwischen dem aktuellen Pegel des Audiosignals und dem Grundrauschen besteht.
  6. Die Einrichtung gemäß Anspruch 5, wobei jedes der Zeitintervalle mit wenigstens einem anderen Zeitintervall überlappt.
  7. Die Einrichtung gemäß Anspruch 6, wobei die Leistungsdichte-Funktion eine Mehrzahl von Rausch-Vorkommen darstellt.
  8. Die Einrichtung gemäß Anspruch 7, wobei die Aktualisierungslogik (705) aufweist: eine erste Vergleichslogik (1201) zum Bestimmen, ob der Spitzenwert des Audiosignals den aktuellen Pegel des Audiosignals um einen vorgegebenen Betrag übersteigt; einer zweiten Vergleichslogik (1202) zum Bestimmen, ob alle der Standardabweichungswerte, welche während einer ersten Zeitperiode berechnet wurden, unterhalb eines Schwellwerts liegen; und einer Rausch-Logik (1204), welche mit der ersten Vergleichslogik (1201) und der zweiten Vergleichslogik (1202) gekoppelt ist, wobei die Rausch-Logik (1204) ein Rausch-Vorkommen identifiziert, wenn: der Spitzenwert des Audiosignals den aktuellen Pegel des Audiosignals um einen vorgegebenen Betrag übersteigt, und alle der Standardabweichungswerte, die während der ersten Zeitperiode berechnet wurden, unterhalb eines Schwellwerts liegen.
  9. Ein Computersystem (1) mit der Fähigkeit für eine Duplex-Audiokommunikation mit einer entfernten Einrichtung, wobei das System (1) einen Prozessor (10) zum Steuern des Computersystems (1), eine Eingabeeinrichtung (53), welche mit dem Prozessor (10) gekoppelt ist und zur Eingabe von Audioinformationen zur Übertragung an die entfernte Einrichtung gekoppelt ist, eine Ausgabeeinrichtung (52), welche mit dem Prozessor (10) gekoppelt ist und zur Ausgabe von Audioinformationen, welche von dem der entfernten Einrichtung empfangen wurden, gekoppelt ist und einen Stimmaktivitätsdetektor (410), der mit der Eingabeeinrichtung (53) und der Ausgabeeinrichtung (52) gekoppelt ist, enthält, wobei der Stimmaktivitätsdetektor (410) in einem durch das Computersystem (1) empfangenen oder in durch das Computersystem (1) zu übertragenden Audiosignals wiedergegebene Sprache detektiert, wobei der Stimmaktivitätsdetektor (410) gekennzeichnet ist durch: eine Spitzenwert-Logik (703) zum Bestimmen eines mittleren Spitzenwerts des Audiosignals; einem Standardabweichungsgenerator (702) zum Bestimmen einer Mehrzahl von Standardabweichungswerten des Audiosignals, wobei jeder der Standardabweichungswerte einem von einer Mehrzahl von Zeitintervallen zugeordnet ist; einer Aktualisierungslogik (705), die zum Empfangen der Standardabweichungswerte und der mittleren Spitzenwerte gekoppelt ist, wobei die Aktualisierungslogik (705) eine Leistungsdichte-Funktion aktualisiert, um einen aktuellen Zustand der Leistungsdichte-Funktion gemäß einer Beziehung zwischen dem mittleren Spitzenwert und einem aktuellen Pegel des Audiosignals und auf Grundlage der Standardabweichungswerte zu bestimmen; Rauschlogik (707) zum Bestimmen eines Grundrauschens auf Grundlage des aktuellen Zustands der Leistungsdichte-Funktion; und Entscheidungslogik (502) zum Bestimmen, dass Sprache in dem Audiosignal wiedergegeben ist, wenn eine vorgegebene Beziehung zwischen dem aktuellen Pegel des Audiosignals und dem Grundrauschen besteht.
  10. Das Computersystem gemäß Anspruch 9, wobei jedes der Zeitintervalle mit wenigstens einem anderen Zeitintervall überlappt.
DE69636985T 1995-08-28 1996-07-22 Sprachanwesenheitdetektor für halbduplex-audiokommunikationssystem Expired - Lifetime DE69636985T2 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US520305 1995-08-28
US08/520,305 US5598466A (en) 1995-08-28 1995-08-28 Voice activity detector for half-duplex audio communication system
PCT/US1996/012028 WO1997008882A1 (en) 1995-08-28 1996-07-22 Voice activity detector for half-duplex audio communication system

Publications (2)

Publication Number Publication Date
DE69636985D1 DE69636985D1 (de) 2007-05-03
DE69636985T2 true DE69636985T2 (de) 2007-11-29

Family

ID=47721826

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69636985T Expired - Lifetime DE69636985T2 (de) 1995-08-28 1996-07-22 Sprachanwesenheitdetektor für halbduplex-audiokommunikationssystem

Country Status (6)

Country Link
US (2) US5598466A (de)
EP (1) EP0847645B1 (de)
AU (1) AU6505196A (de)
DE (1) DE69636985T2 (de)
HK (1) HK1012523A1 (de)
WO (1) WO1997008882A1 (de)

Families Citing this family (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6707484B1 (en) * 1994-07-28 2004-03-16 Semiconductor Energy Laboratory Co., Ltd. Information processing system
GB2303471B (en) * 1995-07-19 2000-03-22 Olympus Optical Co Voice activated recording apparatus
US6175634B1 (en) 1995-08-28 2001-01-16 Intel Corporation Adaptive noise reduction technique for multi-point communication system
GB9603582D0 (en) 1996-02-20 1996-04-17 Hewlett Packard Co Method of accessing service resource items that are for use in a telecommunications system
US6332153B1 (en) * 1996-07-31 2001-12-18 Vocaltec Communications Ltd. Apparatus and method for multi-station conferencing
JP3255584B2 (ja) * 1997-01-20 2002-02-12 ロジック株式会社 有音検知装置および方法
US5867574A (en) * 1997-05-19 1999-02-02 Lucent Technologies Inc. Voice activity detection system and method
DE19730816A1 (de) * 1997-07-18 1999-01-21 Ise Interactive Systems Entwic Freisprecheinrichtung
US6044150A (en) * 1997-08-21 2000-03-28 3Com Corporation Method and apparatus for a host-based personal computer speakerphone
US6134524A (en) * 1997-10-24 2000-10-17 Nortel Networks Corporation Method and apparatus to detect and delimit foreground speech
US6023674A (en) * 1998-01-23 2000-02-08 Telefonaktiebolaget L M Ericsson Non-parametric voice activity detection
US6157712A (en) * 1998-02-03 2000-12-05 Telefonaktiebolaget Lm Ericsson Speech immunity enhancement in linear prediction based DTMF detector
US6138040A (en) * 1998-07-31 2000-10-24 Motorola, Inc. Method for suppressing speaker activation in a portable communication device operated in a speakerphone mode
US6223154B1 (en) * 1998-07-31 2001-04-24 Motorola, Inc. Using vocoded parameters in a staggered average to provide speakerphone operation based on enhanced speech activity thresholds
US6188981B1 (en) * 1998-09-18 2001-02-13 Conexant Systems, Inc. Method and apparatus for detecting voice activity in a speech signal
WO2000046789A1 (fr) * 1999-02-05 2000-08-10 Fujitsu Limited Detecteur de la presence d'un son et procede de detection de la presence et/ou de l'absence d'un son
US6249757B1 (en) 1999-02-16 2001-06-19 3Com Corporation System for detecting voice activity
US6556967B1 (en) 1999-03-12 2003-04-29 The United States Of America As Represented By The National Security Agency Voice activity detector
US6381568B1 (en) 1999-05-05 2002-04-30 The United States Of America As Represented By The National Security Agency Method of transmitting speech using discontinuous transmission and comfort noise
SE9903223L (sv) * 1999-09-09 2001-05-08 Ericsson Telefon Ab L M Förfarande och anordning i telekommunikationssystem
US7263074B2 (en) * 1999-12-09 2007-08-28 Broadcom Corporation Voice activity detection based on far-end and near-end statistics
US6804640B1 (en) 2000-02-29 2004-10-12 Nuance Communications Signal noise reduction using magnitude-domain spectral subtraction
US7058190B1 (en) * 2000-05-22 2006-06-06 Harman Becker Automotive Systems-Wavemakers, Inc. Acoustic signal enhancement system
US7003093B2 (en) 2000-09-08 2006-02-21 Intel Corporation Tone detection for integrated telecommunications processing
US20020116186A1 (en) * 2000-09-09 2002-08-22 Adam Strauss Voice activity detector for integrated telecommunications processing
US6738358B2 (en) 2000-09-09 2004-05-18 Intel Corporation Network echo canceller for integrated telecommunications processing
US7046792B2 (en) * 2001-03-09 2006-05-16 Acoustic Technologies, Inc. Transmit/receive arbitrator
DE10120168A1 (de) * 2001-04-18 2002-10-24 Deutsche Telekom Ag Verfahren zur Bestimmung von Intensitätskennwerten von Hintergrundgeräuschen in Sprachpausen von Sprachsignalen
FR2833103B1 (fr) * 2001-12-05 2004-07-09 France Telecom Systeme de detection de parole dans le bruit
US7295976B2 (en) 2002-01-25 2007-11-13 Acoustic Technologies, Inc. Voice activity detector for telephone
US6754337B2 (en) 2002-01-25 2004-06-22 Acoustic Technologies, Inc. Telephone having four VAD circuits
US6847930B2 (en) * 2002-01-25 2005-01-25 Acoustic Technologies, Inc. Analog voice activity detector for telephone
US7145883B2 (en) * 2002-02-25 2006-12-05 Sonexis, Inc. System and method for gain control of audio sample packets
US20030219113A1 (en) * 2002-05-21 2003-11-27 Bershad Neil J. Echo canceller with double-talk and channel impulse response adaptation
US6693663B1 (en) 2002-06-14 2004-02-17 Scott C. Harris Videoconferencing systems with recognition ability
EP1463246A1 (de) * 2003-03-27 2004-09-29 Motorola Inc. Übertragung von Konversationsdaten zwischen Endgeräten über eine Funkverbindung
US20050213745A1 (en) * 2004-02-27 2005-09-29 Acoustic Technologies, Inc. Voice activity detector for low S/N
TWI238632B (en) * 2004-05-05 2005-08-21 Winbond Electronics Corp Half duplex apparatus and signal processing method used in the apparatus
US7643804B2 (en) * 2004-09-09 2010-01-05 Broadcom Corporation Apparatus and method for transmitting a signal at less than a standard transmit power in a network
US20070274297A1 (en) * 2006-05-10 2007-11-29 Cross Charles W Jr Streaming audio from a full-duplex network through a half-duplex device
CN101453532B (zh) * 2007-11-30 2013-03-20 博通集成电路(上海)有限公司 用于扬声器开关中的声音处理装置
US8238538B2 (en) 2009-05-28 2012-08-07 Comcast Cable Communications, Llc Stateful home phone service
JP5834088B2 (ja) * 2010-11-29 2015-12-16 ニュアンス コミュニケーションズ インコーポレイテッドNuance Communications,Inc. 動的マイクロフォン信号ミキサ
US8781821B2 (en) * 2012-04-30 2014-07-15 Zanavox Voiced interval command interpretation
KR101983659B1 (ko) * 2013-04-16 2019-05-30 삼성전자주식회사 무선 양이 청각 기기의 저전력 운용 방법 및 장치
EP3053356B8 (de) 2013-10-30 2020-06-17 Cerence Operating Company Verfahren und vorrichtung zur selektiven mikrofonsignalkombination
KR20150105847A (ko) * 2014-03-10 2015-09-18 삼성전기주식회사 음성구간 검출 방법 및 장치
CN111125423A (zh) * 2019-11-29 2020-05-08 维沃移动通信有限公司 一种去噪方法及移动终端

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4028496A (en) * 1976-08-17 1977-06-07 Bell Telephone Laboratories, Incorporated Digital speech detector
US4147892A (en) * 1978-01-30 1979-04-03 Tridar Speakerphone with dynamic level discriminator
FR2485839B1 (fr) * 1980-06-27 1985-09-06 Cit Alcatel Procede de detection de parole dans un signal de circuit telephonique et detecteur de parole le mettant en oeuvre
DE3166082D1 (en) * 1980-12-09 1984-10-18 Secretary Industry Brit Speech recognition systems
EP0127718B1 (de) * 1983-06-07 1987-03-18 International Business Machines Corporation Verfahren zur Aktivitätsdetektion in einem Sprachübertragungssystem
CA1233925A (en) * 1985-05-10 1988-03-08 Gordon J. Reesor Digital loudspeaking telephone
US4630304A (en) * 1985-07-01 1986-12-16 Motorola, Inc. Automatic background noise estimator for a noise suppression system
US4715063A (en) * 1985-08-20 1987-12-22 Motorola, Inc. Speakerphone for radio and landline telephones
US4959857A (en) * 1988-12-28 1990-09-25 At&T Bell Laboratories Acoustic calibration arrangement for a voice switched speakerphone
US4887288A (en) * 1988-12-28 1989-12-12 American Telephone And Telegraph Company Self calibration arrangement for a voice switched speakerphone
US4979214A (en) * 1989-05-15 1990-12-18 Dialogic Corporation Method and apparatus for identifying speech in telephone signals
CA2040025A1 (en) * 1990-04-09 1991-10-10 Hideki Satoh Speech detection apparatus with influence of input level and noise reduced
US5239574A (en) * 1990-12-11 1993-08-24 Octel Communications Corporation Methods and apparatus for detecting voice information in telephone-type signals
CA2052351C (en) * 1991-09-27 2000-05-23 Gordon J. Reesor Telephone handsfree algorithm
EP0538536A1 (de) * 1991-10-25 1993-04-28 International Business Machines Corporation Detektion für die Anwesenheit eines Sprachsignals
US5297198A (en) * 1991-12-27 1994-03-22 At&T Bell Laboratories Two-way voice communication methods and apparatus
US5323337A (en) * 1992-08-04 1994-06-21 Loral Aerospace Corp. Signal detector employing mean energy and variance of energy content comparison for noise detection
US5357567A (en) * 1992-08-14 1994-10-18 Motorola, Inc. Method and apparatus for volume switched gain control
US5617508A (en) * 1992-10-05 1997-04-01 Panasonic Technologies Inc. Speech detection device for the detection of speech end points based on variance of frequency band limited energy
US5548638A (en) * 1992-12-21 1996-08-20 Iwatsu Electric Co., Ltd. Audio teleconferencing apparatus
US5459814A (en) * 1993-03-26 1995-10-17 Hughes Aircraft Company Voice activity detector for speech signals in variable background noise
EP0622964B1 (de) * 1993-04-29 2002-03-20 International Business Machines Corporation Anordnung und Verfahren zur Feststellung der Anwesenheit eines Sprechsignals
US5579389A (en) * 1993-11-24 1996-11-26 Intel Corporation Histogram-based processing of audio signals

Also Published As

Publication number Publication date
EP0847645B1 (de) 2007-03-21
AU6505196A (en) 1997-03-19
US5598466A (en) 1997-01-28
EP0847645A1 (de) 1998-06-17
US5737407A (en) 1998-04-07
WO1997008882A1 (en) 1997-03-06
EP0847645A4 (de) 2004-03-03
DE69636985D1 (de) 2007-05-03
HK1012523A1 (en) 1999-08-06

Similar Documents

Publication Publication Date Title
DE69636985T2 (de) Sprachanwesenheitdetektor für halbduplex-audiokommunikationssystem
DE60108401T2 (de) System zur erhöhung der sprachqualität
EP0742664B1 (de) Freisprechverfahren für ein mehrkanaliges Übertragungssystem
DE602004003443T2 (de) Sprachperiodenerkennung basierend auf Elektromyographie
DE69637203T2 (de) Mikrofonauswahlverfahren zur Anwendung in einem sprachgesteuerten Mehrmikrofonvermittlungssystem
DE112009002617B4 (de) Wahlweises Schalten zwischen mehreren Mikrofonen
DE69635500T2 (de) Verfahren und Vorrichtung zur Erkennung eines nahen Sprachsignals
DE2640006C2 (de) Signalsteuersystem für Mehrkanalsysteme
DE69730721T2 (de) Verfahren und vorrichtungen zur geräuschkonditionierung von signalen welche audioinformationen darstellen in komprimierter und digitalisierter form
DE69634841T2 (de) Verfahren und Vorrichtung zur Echokompensation
DE69937613T2 (de) Verfahren und vorrichtung zur adaptiven signalverstärkungssteuerung in kommunikationssystemen
DE112017007005B4 (de) Akustiksignal-verarbeitungsvorrichtung, akustiksignalverarbeitungsverfahren und freisprech-kommunikationsvorrichtung
DE10359198A1 (de) System und Verfahren mit Lauthörtelefon
WO2002043049A1 (de) Verfahren zur steuerung eines eine akustische ausgabeeinrichtung aufweisenden geräts
EP1077448B1 (de) Spracherkennung unter Berücksichtigung der Lautstärkeschwankungen
DE69635141T2 (de) Verfahren zur Erzeugung von Sprachmerkmalsignalen und Vorrichtung zu seiner Durchführung
EP1103956B1 (de) Exponentielle Echo- und Geräuschabsenkung in Sprachpausen
EP2077059B1 (de) Verfahren zum betreiben einer hörhilfe, sowie hörhilfe
DE69233473T2 (de) Rauschunterdrückungsschaltung
DE60029541T2 (de) Konfigurierbares Rückhören für Rechner-Telefonie
DE3329779C2 (de) Verfahren und Schaltungsanordnung zur Herstellung von Konferenzverbindungen in einem Vermittlungssystem
DE69433659T2 (de) Vorrichtung und Verfahren zur Echo-Dämpfung
DE69930109T2 (de) Sprachgesteuerter schalter zur verwendung bei hohem umgebungsgeräusch
EP1109379A1 (de) Verfahren zur Optimierung eines Nutzsignals in einem Sprachendgerät sowie Sprachendgerät
EP0592787A1 (de) Verfahren zum Verbessern der akustischen Rückhördämpfung von elektroakustischen Anlagen

Legal Events

Date Code Title Description
8364 No opposition during term of opposition