DE112012005855T5 - Störungsunterdrückungsvorrichtung - Google Patents

Störungsunterdrückungsvorrichtung Download PDF

Info

Publication number
DE112012005855T5
DE112012005855T5 DE112012005855.0T DE112012005855T DE112012005855T5 DE 112012005855 T5 DE112012005855 T5 DE 112012005855T5 DE 112012005855 T DE112012005855 T DE 112012005855T DE 112012005855 T5 DE112012005855 T5 DE 112012005855T5
Authority
DE
Germany
Prior art keywords
ratio
input signal
probability density
density function
spectrum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
DE112012005855.0T
Other languages
English (en)
Other versions
DE112012005855B4 (de
Inventor
c/o MITSUBISHI ELECTRIC CORPORAT Furuta Satoru
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Publication of DE112012005855T5 publication Critical patent/DE112012005855T5/de
Application granted granted Critical
Publication of DE112012005855B4 publication Critical patent/DE112012005855B4/de
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L25/84Detection of presence or absence of voice signals for discriminating voice from noise

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Noise Elimination (AREA)

Abstract

Eine Wahrscheinlichkeitsdichtefunktions-Steuervorrichtung (7) bestimmt eine Wahrscheinlichkeitsdichtefunktion in Abhängigkeit davon, ob ein Eingangssignal ein Ton oder eine Störung zu sein scheint, d. h. eine Wahrscheinlichkeitsdichtefunktion, die einem Verteilungszustand eines Tonsignals in einem Tonabschnitt und dem in einem Störungsabschnitt angepasst ist, und eine Unterdrückungsbetrags-Berechnungsvorrichtung (8) berechnet einen Spektrumunterdrückungsbetag durch Verwendung der Wahrscheinlichkeitsdichtefunktion.

Description

  • GEBIET DER ERFINDUNG
  • Die vorliegende Erfindung bezieht sich auf eine Störungsunterdrückungsvorrichtung, die einem Eingangssignal überlagerte Hintergrundstörungen unterdrückt.
  • HINTERGRUND DER ERFINDUNG
  • Im Außenbereich durchgeführte Telefonanrufe unter Verwendung von Mobiltelefonen, in Fahrzeugen durchgeführte Freisprechanrufe und Freisprechoperationen unter Verwendung von Spracherkennung sind stark verbreitet, da die digitale Signalverarbeitungstechnologie in den letzten Jahren starke Fortschritte gemacht hat. Da eine Vorrichtung, die diese Funktionen realisiert, in vielen Fällen in stark gestörten Umgebungen verwendet wird, können auch Hintergrundstörungen zusammen mit einem Ton in ein Mikrofon eingegeben werden, und dies bewirkt eine Verschlechterung der übermittelten Sprache, Herabsetzung der Spracherkennungsrate usw. Daher wird, um einen bequemen Anruf und eine hochgenaue Spracherkennung zu realisieren, eine Störungsunterdrückungsvorrichtung, die in ein Eingangssignal gemischte Hintergrundstörungen unterdrückt, benötigt.
  • Als eine herkömmliche Störungsunterdrückungsvorrichtung gibt es beispielsweise ein Verfahren zum Umwandeln eines Eingangssignals in der Zeitdomäne in ein Energiespektrum, das ein Signal in der Frequenzdomäne ist, Verwenden eines Energiespektrums des Eingangssignals und eines geschätzten Störungsspektrums, das getrennt von dem Eingangssignal geschätzt wurde, und Annehmen, dass das Tonspektrum einer gaußschen Superverteilung folgt und das Störungsspektrum einer gaußschen Verteilung folgt, um einen Unterdrückungsbetrag für die Störungsunterdrückung durch Verwendung eines MAP(A-posteriori-Wahrscheinlichkeitsmaximierungs)-Schätzverfahrens zu berechnen, Durchführen einer Amplitudenunterdrückung bei dem Energiespektrum des Eingangssignals durch Verwendung des erworbenen Unterdrückungsbetrags, und Umwandeln des Energiespektrums, bei dem die Amplitudenunterdrückung durchgeführt wurde, und des Phasenspektrums des Eingangssignals in ein Signal in der Zeitdomäne, um ein störungsunterdrücktes Signal zu erhalten (siehe beispielsweise Nichtpatentdokument 1).
  • Zusätzlich wird als Stand der Technik beispielsweise das Patentdokument 1 offenbart. Diese herkömmliche Störungsunterdrückungsvorrichtung führt eine Teildifferenzierung bei einer geschätzten Gleichung für ein in einem Frequenzspektrum enthaltenes Tonspektrum durch, wobei die Gleichung durch Annähern der Wahrscheinlichkeit des Auftretens für jeweils den reellen und den imaginären Teil des Tonspektrums abgeleitet ist durch Verwendung eines statistischen Verteilungsmodells, und setzt die Ergebnisse der Teildifferenzierung gleich null und berechnet einen Störungsunterdrückungsbetrag gemäß einer Berechnungsgleichung, die angenähert ist durch Setzen von |cosΦ| + |sinΦ| als eine Konstante, wobei das Phasenspektrum durch Φ ausgedrückt wird, wodurch eine Störungsunterdrückung hoher Qualität realisiert wird.
  • Weiterhin gibt es als einen anderen Stand der Technik beispielsweise ein Verfahren zum Annähern der Wahrscheinlichkeit des Auftretens eines Tonspektrums und derjenigen eines Störungsspektrums durch Verwendung eines gemischten Verteilungsmodells, das eine Kombination mehrerer Wahrscheinlichkeitsdichtefunktionen ist, um eine Störungsunterdrückung hoher Genauigkeit durchzuführen (siehe beispielsweise Nichtpatentdokument 2).
  • DOKUMENTE DES STANDES DER TECHNIK
  • PATENTDOKUMENT
    • Patentdokument 1: Veröffentlichung Nr. 2005-202222 einer ungeprüften japanischen Patentanmeldung (Seiten 6–11, 1)
  • NICHTPATENTDOKUMENTE
    • Nichtpatentdokument 1: T. Lotter, P. Vary, ”Speech Enhancement by MAP Spectral Amplitude Estimation Using a Super-Gaussian Speech Model”, EURASIP Journal an Applied Signal Processing, Seiten 1110–1126, Nr. 7, 2005
    • Nichtpatentdokument 2: Fujimoto und Ariki, ”Additive and Channel Noise Suppression Method Based an GMM and EM Algorithm”, the Institute of Electronics, Information and Communication Engineers Technical Report, SP2003-117, Seiten 25–30, Dezember 2003
  • ZUSAMMENFASSUNG DER ERFINDUNG
  • DURCH DIE ERFINDUNG ZU LÖSENDE PROBLEME
  • Die vorgenannten herkömmlichen Verfahren haben Probleme, die nachfolgend diskutiert werden.
  • Ein Problem bei der herkömmlichen Störungsunterdrückungsvorrichtung, die durch das vorgenannte Nichtpatentdokument 1 offenbart ist, besteht darin, dass, da die Anzahl von Parametern zum Bestimmen der Verteilungsform der Wahrscheinlichkeitsdichtefunktion gleich eins ist und der Parameter ungeachtet des Zustands des Eingangssignals fest ist, die Schätzgenauigkeit für den Betrag der Störungsunterdrückung für verschiedene Eingangssignale gering ist.
  • Weiterhin muss, da die im vorgenannten Patentdokument 1 offenbarte herkömmliche Störungsunterdrückungsvorrichtung das Phasenspektrum des Eingangssignals verwendet, um die Verteilungsform der Wahrscheinlichkeitsdichtefunktion zu bestimmen, die herkömmliche Störungsunterdrückungsvorrichtung das Phasenspektrum des Tonsignals mit hoher Genauigkeit analysieren, um eine Störungsunterdrückung hoher Qualität durchzuführen. Ein weiteres Problem besteht darin, dass, da der die Verteilungsform (in dem Dokument als eine Einstellung λ für die Annäherung bezeichnet) definierende Parameter nicht gemäß dem Zustand des Eingangssignals geändert wird, sondern fest ist, der Schätzung des Betrags der Störungsunterdrückung nicht gefolgt werden kann, wenn eine unerwartete schnelle Veränderung, wie eine Veränderung, die die Einstellung für die Annäherung überschreitet, in dem Ton und den Störungen, die das Eingangssignal bilden, auftritt.
  • Weiterhin besteht ein Problem bei der in dem vorgenannten Nichtpatentdokument 2 offenbarten herkömmlichen Störungsunterdrückungsvorrichtung dahingehend, dass, während eine Störungsunterdrückung mit hoher Genauigkeit durch Verwendung eines gemischten Verteilungsmodells, das eine Kombination aus mehreren Wahrscheinlichkeitsdichtefunktionen ist, durchgeführt werden kann, die Verarbeitung einer sehr großen Informationsmenge erforderlich ist.
  • Die vorliegende Erfindung wurde gemacht, um diese Probleme zu lösen, und es ist daher eine Aufgabe der vorliegenden Erfindung, eine Störungsunterdrückungsvorrichtung vorzusehen, die eine Störungsunterdrückung hoher Qualität erzielt, indem ein einfacher Prozess durchgeführt wird.
  • MITTEL ZUM LÖSEN DES PROBLEMS
  • Gemäß der vorliegenden Erfindung ist eine Störungsunterdrückungsvorrichtung vorgesehen, die eine Wahrscheinlichkeitsdichtefunktions-Steuervorrichtung enthält, die ein Eingangssignal analysiert, um einen ersten Index, der zeigt, ob das Eingangssignal ein Ton oder eine Störung zu sein scheint, zu berechnen, und die eine Wahrscheinlichkeitsdichtefunktion steuert, die einen Verteilungszustand eines Tons auf der Grundlage des vorgenannten ersten Indexes definiert, und einen Unterdrückungsbetrag berechnet durch Verwendung der Wahrscheinlichkeitsdichtefunktion zusätzlich zu einem Energiespektrum und einem Störungsschätzspektrum.
  • VORTEILE DER ERFINDUNG
  • Gemäß der vorliegenden Erfindung kann durch Berechnen des Unterdrückungsbetrags für eine Störungsunterdrückung durch Verwendung der Wahrscheinlichkeitsdichtefunktion, die auf der Grundlage des ersten Indexes, der zeigt, ob das Eingangssignal ein Ton oder eine Störung zu sein scheint, gesteuert wird, eine Störungsunterdrückung hoher Qualität, die kein Gefühl, dass etwas in einem Störungsabschnitt anomal ist, liefert und kleine Verzerrung in dem Ton hat, durch den einfachen Prozess durchgeführt werden.
  • KURZBESCHREIBUNG DER FIGUREN
  • 1 ist ein Blockschaltbild, das die Struktur einer Störungsunterdrückungsvorrichtung gemäß dem Ausführungsbeispiel 1 der vorliegenden Erfindung zeigt;
  • 2 ist ein Blockschaltbild, das die innere Struktur einer Wahrscheinlichkeitsfunktions-Steuervorrichtung bei dem Ausführungsbeispiel 1 zeigt;
  • 3 ist ein Diagramm, das eine Änderung einer Wahrscheinlichkeitsdichtefunktion bei dem Ausführungsbeispiel 1 erläutert;
  • 4 ist ein Blockschaltbild, das die Struktur einer Störungsunterdrückungsvorrichtung gemäß dem Ausführungsbeispiel 2 der vorliegenden Erfindung zeigt;
  • 5 ist ein Blockschaltbild, das die innere Struktur einer Wahrscheinlichkeitsdichtefunktions-Steuervorrichtung bei dem Ausführungsbeispiel 2 zeigt;
  • 6 ist ein Diagramm, das schematisch ein Verfahren zum Erfassen der harmonischen Struktur eines Tons, den eine Periodenkomponenten-Schätzvorrichtung verwendet, bei dem Ausführungsbeispiel 2 zeigt;
  • 7 ist ein Diagramm, das schematisch ein Verfahren zum Korrigieren der harmonischen Struktur eines Tons, den die Periodenkomponenten-Schätzvorrichtung bei dem Ausführungsbeispiel 2 verwendet, zeigt;
  • 8 ist ein Diagramm, das eine nichtlineare Funktion, die eine Berechnungsvorrichtung für ein gewichtetes SN-Verhältnis zu der Zeit der Berechnung eines ersten gewichteten, späteren SN-Verhältnisses bei dem Ausführungsbeispiel 2 verwendet, zeigt;
  • 9 zeigt ein Beispiel für ein Ausgangsergebnis der Störungsunterdrückungsvorrichtung gemäß dem Ausführungsbeispiel 2 und einen Fall, in welchem das Gewichten eines späteren SN-Verhältnisses nicht durchgeführt wird;
  • 10 zeigt ein Beispiel für das Ausgangsergebnis der Störungsunterdrückungsvorrichtung gemäß dem Ausführungsbeispiel 2 und einen Fall, in welchem das Gewichten eines späteren SN-Verhältnisses durchgeführt wird, und
  • 11 ist ein Blockschaltbild, das die Struktur einer Störungsunterdrückungsvorrichtung gemäß dem Ausführungsbeispiel 4 der vorliegenden Erfindung zeigt.
  • AUSFÜHRUNGSBEISPIELE DER ERFINDUNG
  • Nachfolgend werden, um diese Erfindung im Einzelnen zu erläutern, die bevorzugten Ausführungsbeispiele der vorliegenden Erfindung mit Bezug auf die begleitenden Zeichnungen beschrieben.
  • Ausführungsbeispiel 1
  • 1 ist ein Blockschaltbild, das die gesamte Struktur einer Störungsunterdrückungsvorrichtung gemäß diesem Ausführungsbeispiel 1 zeigt. Die Störungsunterdrückungsvorrichtung gemäß diesem Ausführungsbeispiel 1 besteht aus einem Eingangsanschluss 1, einer Fourier-Transformationsvorrichtung 2, einer Energiespektrum-Berechnungsvorrichtung 3, einer Ton- und Störungsabschnitts-Bestimmungsvorrichtung 4, einer Störungsspektrum-Schätzvorrichtung 5, einer SN(Störabstands)-Verhältnis-Berechnungsvorrichtung 6, einer Wahrscheinlichkeitsdichtefunktions-Steuervorrichtung 7, einer Unterdrückungsbetrags-Berechnungsvorrichtung 8, einer Spektrumunterdrückungsvorrichtung 9, einer Vorrichtung für inverse Fourier-Transformation 10 und einem Ausgangsanschluss 11.
  • Nachfolgend wird das Prinzip der Arbeitsweise dieser Störungsunterdrückungvorrichtung mit Bezug auf die Zeichnungen erläutert.
  • Zuerst werden, nachdem ein Ton, Musik oder dergleichen, die über ein Mikrofon (nicht gezeigt) oder dergleichen aufgenommen wurden, einer A/D(Analog/Digital)-Umwandlung unterzogen wurden, der Ton, die Musik oder dergleichen mit einer vorbestimmten Abtastfrequenz (z. B. einer Frequenz von 8 kHz) abgetastet und auch in Datenblöcke (z. B. Einheiten von 10 ms) geteilt, und diese Datenblöcke werden über den Eingangsanschluss 1 in die Störungsunterdrückungsvorrichtung nach diesem Ausführungsbeispiel 1 eingegeben.
  • Nach dem Anwenden beispielsweise eines Hanning-Fensters auf das Eingangssignal führt die Fourier-Transformationsvorrichtung 2 eine schnelle 256-Punkt-Fourier-Transformation, wie beispielsweise in der folgenden Gleichung (1) gezeigt, durch und wandelt das Signal in der Zeitdomäne x(t) in Spektralkomponenten X(λ, k) um, die jeweils ein Signal in der Frequenzdomäne sind. X(λ, k) = FT (1) worin t eine Abtastzeit zeigt, λ eine Datenblocknummer zeigt, wenn das Eingangssignal in Datenblöcke geteilt ist, k eine Nummer (im Folgenden als eine Spektrumnummer bezeichnet) zeigt, die eine Frequenzkomponente in dem Frequenzband des Spektrums bestimmt, und FT[·] den Fourier-Transformationsvorgang zeigt.
  • Die Energiespektrum-Berechnungsvorrichtung 3 erwirbt ein Energiespektrum Y(λ, k) aus den Spektralkomponenten X(λ, k) des Eingangssignals durch Verwendung der folgenden Gleichung (2).
    Figure DE112012005855T5_0002
    worin Re{X(λ, k)} und Im{X(λ, k)} den reellen bzw. imaginären Teil des Fouriertransformierten Eingangssignalspektrums zeigen.
  • Die Ton- und Störungsabschnitts-Bestimmungsvorrichtung 4 bestimmt, ob das Eingangssignal des gegenwärtigen Datenblocks ein Ton oder Störungen sind. Zuerst bestimmt die Ton- und Störungsabschnitts-Bestimmungsvorrichtung eine normierte Autokorrelationsfunktion ρN(λ, τ) aus dem Energiespektrum Y(λ, k) durch Verwendung der folgenden Gleichung (3).
    Figure DE112012005855T5_0003
    worin τ eine Verzögerungszeit ist und FT[·] einen Fourier-Transformationsprozess zeigt. Was erforderlich ist, ist beispielsweise die Durchführung einer schnellen Fourier-Transformation mit derselben Punktzahl 256 wie der in der vorstehenden Gleichung (1) gezeigten. Da die Gleichung (3) auf dem Wiener-Chintschin-Theorem beruht, wird die Erläuterung der Gleichung nachfolgend weggelassen.
  • Die Ton- und Störungsabschnitts-Bestimmungsvorrichtung 4 berechnet dann ein Maximum ρmax(λ) der normierten Autokorrelationsfunktion durch Verwendung der folgenden Gleichung (4). Die Gleichung (4) bedeutet, dass die Ton- und Störungsabschnitts-Bestimmungsvorrichtung nach einem Maximum von ρ(λ, τ) in dem Bereich von 16 ≤ τ ≤ 96 sucht. ρmax(λ) = max[ρ(λ, τ)], 16 ≤ τ ≤ 96 (4)
  • Als Nächstes empfängt die Ton- und Störungsabschnitts-Bestimmungsvorrichtung 4 das von der Energiespektrum-Berechnungsvorrichtung 3 ausgegebene Energiespektrum Y(λ, k), das durch den vorbeschriebenen Prozess erworbene Maximum ρmax(λ) der normierten Autokorrelationsfunktion und ein von der Störungsspektrum-Schätzvorrichtung 5, die nachfolgend beschrieben wird, ausgegebenes geschätztes Störungsspektrum N(λ, k) und bestimmt, ob das Eingangssignal des gegenwärtigen Datenblocks ein Ton oder eine Störung ist, und gibt das Ergebnis der Bestimmung als ein Bestimmungskennzeichen aus. Als ein Verfahren des Bestimmens eines Tonabschnitts oder eines Störungsabschnitts wird, wenn beispielsweise einer durch die folgende Gleichung (5) gezeigten Bedingung genügt ist, bestimmt, dass das Eingangssignal ein Ton ist, und ein Bestimmungskennzeichen Vflag wird auf ”1 (Ton)” gesetzt; anderenfalls wird bestimmt, dass das Eingangssignal eine Störung ist, und das Bestimmungskennzeichen Vflag wird auf ”0 (Störung)” gesetzt, und das Bestimmungskennzeichen wird dann ausgegeben.
    Figure DE112012005855T5_0004
  • In der Gleichung (5) ist N(λ, k) das geschätzte Störungsspektrum, und Spow und Npow zeigen die Gesamtsumme der Energiespektren des Eingangssignals bzw. die Gesamtsumme der geschätzten Störungsspektren des Eingangssignals. Weiterhin zeigen THFR_SN und THACF vorbestimmte konstante Schwellenwerte für die Bestimmung. Obgleich als ein geeignetes Beispiel der Fall vorliegt, dass THFR_SN = 3,0 und THACF = 0,3 sind, können diese Schwellenwerte auch gemäß dem Zustand und dem Störungspegel des Eingangssignals angemessen geändert werden. Obgleich bei diesem Ausführungsbeispiel 1 das Autokorrelationsfunktionsverfahren und das durchschnittliche SN-Verhältnis des Eingangssignals als das Verfahren zum Bestimmen eines Tonabschnitts oder eines Störungsabschnitts verwendet werden, ist das Verfahren nicht auf dieses Beispiel beschränkt. Ein bekanntes Verfahren, wie eine Cepstrum-Analyse, kann alternativ verwendet werden. Weiterhin ermöglicht eine Kombination von einigen von verschiedenen bekannten Verfahren nach dem Ermessen eines Fachmanns, die Genauigkeit der Bestimmung zu verbessern.
  • Die Störungsspektrum-Schätzvorrichtung 5 empfängt das von der Energiespektrum-Berechnungsvorrichtung 3 ausgegebene Energiespektrum Y(λ, k) und das von der Ton- und Störungsabschnitts-Bestimmungsvorrichtung 4 ausgegebene Bestimmungskennzeichnen Vflag, führt eine Schätzung und eine Aktualisierung eines Störungsspektrums gemäß der folgenden Gleichung (6) und dem Bestimmungskennzeichen Vflag durch und gibt das geschätzte Störungsspektrum N(λ, k) aus.
    Figure DE112012005855T5_0005
    wobei N(λ – 1, k) das geschätzte Störungsspektrum des vorhergehenden Datenblocks ist. Dieses geschätzte Störungsspektrum wird in einem Speicher (nicht gezeigt) in der Störungsspektrum-Schätzvorrichtung 5 gehalten, wie einem RAM (Speicher mit wahlweisem Zugriff). α ist ein Aktualisierungskoeffizient und ist eine vorbestimmte Konstante in einem Bereich von 0 ≤ α ≤ 1. Obgleich der Aktualisierungskoeffizient α als ein geeignetes Beispiel gleich 0,95 ist, kann der Aktualisierungskoeffizient auch gemäß dem Zustand und dem Störungspegel des Eingangssignals angemessen geändert werden.
  • Da das Eingangssignal des gegenwärtigen Datenblocks als Störung bestimmt wird, wenn das Bestimmungskennzeichen Vflag in der vorstehenden Gleichung (6) gleich 0 ist, wird das geschätzte Störungsspektrum N(λ – 1, k) des vorhergehenden Datenblocks aktualisiert durch Verwendung des Energiespektrums Y(λ, k) des Eingangssignals und des Aktualisierungskoeffizienten α. Demgegenüber ist, wenn das Bestimmungskennzeichen Vflag gleich 1 ist, das Eingangssignal des gegenwärtigen Datenblocks ein Ton, und das geschätzte Störungsspektrum N(λ – 1, k) des vorhergehenden Datenblocks wird als das geschätzte Störungsspektrum N(λ, k) des gegenwärtigen Datenblocks so, wie es ist, ausgegeben.
  • Die SN-Verhältnis-Berechnungsvorrichtung 6 berechnet ein späteres (A-posteriori-)SN-Verhältnis (A-posteriori-Signal-zu-Störung-Verhältnis) und ein früheres (A-priori-)SN-Verhältnis (A-priori-Signal-zu-Störung-Verhältnis) für jede Spektralkomponente durch Verwendung des von der Energiespektrum-Berechnungsvorrichtung 3 ausgegebenen Energiespektrums Y(λ, k), des von der Störungsspektrum-Schätzvorrichtung 5 ausgegebenen geschätzten Störungsspektrums N(λ, k) und eines Spektrumunterdrückungsbetrags G(λ – 1, k) des vorhergehenden Datenblocks, der von der Unterdrückungsbetrags-Berechnungsvorrichtung 8, die nachfolgend beschrieben wird, ausgegeben wird. Die SN-Verhältnis-Berechnungsvorrichtung bestimmt das spätere SN-Verhältnis γ(λ, k) durch Verwendung des Energiespektrums Y(λ, k) und des geschätzten Störungsspektrums N(λ, k) gemäß der folgenden Gleichung (7). Die SN-Verhältnis-Berechnungsvorrichtung bestimmt auch ein früheres SN-Verhältnis ξ(λ, k) durch Verwendung des Spektrumunterdrückungsbetrags G(λ – 1, k) des vorhergehenden Datenblocks und das spätere SN-Verhältnis γ(λ, k) des vorhergehenden Datenblocks gemäß der folgenden Gleichung (8).
    Figure DE112012005855T5_0006
    Figure DE112012005855T5_0007
    worin δ eine vorbestimmte Konstante im Bereich 0 ≤ δ ≤ 1 ist und δ = 0,98 bei diesem Ausführungsbeispiel bevorzugt ist. Weiterhin bedeutet F[·] eine Halbwellen-Gleichrichtung, und setzt, wenn das spätere SN-Verhältnis γ(λ, k) in Dezibel negativ ist, das spätere SN-Verhältnis auf null.
  • Danach werden das erworbene spätere SN-Verhältnis γ(λ, k) und das erworbene frühere SN-Verhältnis ξ(λ, k) von der SN-Verhältnis-Berechnungsvorrichtung 6 zu der Spektrumunterdrückungsvorrichtung 9 ausgegeben.
  • Die Wahrscheinlichkeitsdichtefunktions-Steuervorrichtung 7 bestimmt die Form (Verteilungszustand) einer Wahrscheinlichkeitsdichtefunktion in Abhängigkeit von dem Zustand des Eingangssignals des gegenwärtigen Datenblocks durch Verwendung des von der Energiespektrum-Berechnungsvorrichtung 3 ausgegebenen Energiespektrums Y(λ, k) und des von der Störungsspektrum-Schätzvorrichtung 5 ausgegebenen geschätzten Störungsspektrums N(λ, k) und gibt einen ersten Steuerkoeffizienten v(λ, k) und einen zweiten Steuerkoeffizienten μ(λ, k) zu der Unterdrückungsbetrags-Berechnungsvorrichtung 8 aus. Die detaillierte Arbeitsweise dieser Wahrscheinlichkeitsdichtefunktions-Steuervorrichtung 7 wird nachfolgend beschrieben.
  • Die Unterdrückungsbetrags-Berechnungsvorrichtung 8 empfängt das frühere SN-Verhältnis ξ(λ, k) und das spätere SN-Verhältnis γ(λ, k), die von der SN-Verhältnis-Berechnungsvorrichtung 6 ausgegeben wurden, und den ersten Steuerkoeffizienten v(λ, k) und den zweiten Steuerkoeffizienten μ(λ, k), die von der Wahrscheinlichkeitsdichtefunktions-Steuervorrichtung 7 ausgegeben wurden, berechnet einen Spektrumunterdrückungsbetrag G(λ, k), der ein Betrag der Störungsunterdrückung für jedes Spektrum ist, und gibt diesen Spektrumunterdrückungsbetrag zu der Spektrumunterdrückungsvorrichtung 9 aus.
  • Als ein Verfahren zum Berechnen des Spektrumunterdrückungsbetrags G(λ, k) kann beispielsweise ein MAP-Verbundverfahren angewendet werden. Das MAP-Verbundverfahren schätzt den Spektrumunterdrückungsbetrag G(λ, k) durch Annehmen, dass ein Störungssignal und ein Tonsignal eine gaußsche Verteilung haben, Bestimmen eines Amplitudenspektrums und eines Phasenspektrums, die eine bedingte Wahrscheinlichkeitsdichtefunktion maximieren, durch Verwendung des früheren SN-Verhältnisses ξ(λ, k) und des späteren SN-Verhältnisses γ(λ, k) und Verwenden des Wertes als einen geschätzten Wert. Der Spektrumunterdrückungsbetrag G(λ, k) kann durch die folgenden Gleichungen (9) und (10) ausgedrückt werden, wobei der erste Steuerkoeffizient v(λ, k) und der zweite Steuerkoeffizient μ(λ, k), die die Form der Wahrscheinlichkeitsdichtefunktion bestimmen, als Parameter gesetzt werden. Hinsichtlich der Einzelheiten des Verfahrens zum Ableiten des Spektrumunterdrückungsbetrags in dem MAP-Verbundverfahren kann auf das Nichtpatentdokument 1 Bezug genommen werden. Eine Erläuterung der Einzelheiten des Verfahrens wird nachfolgend weggelassen.
    Figure DE112012005855T5_0008
  • Die Spektrumunterdrückungsvorrichtung 9 führt eine Unterdrückung um den Spektrumunterdrückungsbetrag G(λ, k) für jedes Spektrum des eingegebenen Signals gemäß der folgenden Gleichung (11) durch, bestimmt ein Tonsignalspektrum S(λ, k), bei dem die Störungsunterdrückung durchgeführt ist, und gibt dieses Tonsignalspektrum zu der Vorrichtung für inverse Fourier-Transformation 10 aus. S(λ, k) = G(λ, k)·Y(λ, k) (11)
  • Dann wird, nachdem eine inverse Fourier-Transformation bei dem erworbenen Tonspektrum S(λ, k) durch die Vorrichtung für inverse Fourier-Transformation 10 durchgeführt wurde und das Ergebnis dem Ausgangssignal des vorhergehenden Datenblocks überlagert wurde, ein Tonsignal s(t), bei dem die Störungsunterdrückung durchgeführt wurden, von dem Ausgangsanschluss 11 ausgegeben.
  • Als Nächstes wird die Arbeitsweise der Wahrscheinlichkeitsdichtefunktions-Steuervorrichtung 7, die ein Hauptteil der vorliegenden Erfindung ist, erläutert. Die innere Struktur der Wahrscheinlichkeitsdichtefunktions-Steuervorrichtung 7 ist in 2 gezeigt. Diese Wahrscheinlichkeitsdichtefunktions-Steuervorrichtung 7 bestimmt die Form einer Wahrscheinlichkeitsdichtefunktion in Abhängigkeit von dem Zustand des Eingangssignals durch Verwendung des von der Energiespektrum-Berechnungsvorrichtung 3 ausgegebenen Energiespektrums Y(λ, k) und des von der Störungsspektrum-Schätzvorrichtung 5 ausgegebenen geschätzten Störungsspektrums N(λ, k) und gibt auch den ersten Steuerkoeffizienten v(λ, k) und den zweiten Steuerkoeffizienten μ(λ, k), die für die Unterdrückungsbetrags-Berechnungsvorrichtung 8 benötigt werden, aus, um den Spektrumunterdrückungsbetrag G(λ, k) zu berechnen.
  • Zuerst ist, um die Beschreibung dieses Prozesses zu erläutern, die Wahrscheinlichkeitsdichtefunktion p(|X|) der Amplitude |X| des Tonspektrums, das unter Verwendung des MAP-Verbundverfahrens erworben wurde, die Wahrscheinlichkeitsdichtefunktion, die die vorgenannten Gleichungen (9) und (10) definiert, in Gleichung (12) gezeigt.
    Figure DE112012005855T5_0009
    worin Γ(·) eine Gammafunktion ist und σx die Varianz des Tonspektrums ist. Weiterhin sind μ und v konstante Koeffizienten, die die Steilheit der Verteilung der Wahrscheinlichkeitsdichtefunktion bzw. die Verbreiterung der Verteilung bestimmen, und die Form der Wahrscheinlichkeitsdichtefunktion kann gesteuert werden durch Ändern dieser beiden Koeffizienten. Daher kann eine Wahrscheinlichkeitsdichtefunktion, die von dem Zustand des Eingangssignals abhängig ist, erworben werden durch Ändern von μ und v gemäß dem Zustand des Eingangssignals. Um die Wahrscheinlichkeitsdichtefunktion gemäß dem Zustand des Eingangssignals zu steuern, kann beispielsweise das spätere SN-Verhältnis γ(λ, k), das durch die obige Gleichung (7) gegeben ist, verwendet werden.
  • Die Berechnungsvorrichtung 71 für das zweite SN-Verhältnis berechnet den Logarithmus durch Verwendung des Energiespektrums Y(λ, k) und des geschätzten Störungsspektrums N(λ, k) und berechnet ein zweites späteres SN-Verhältnis γp(λ, k), das in Dezibel ausgedrückt wird, wie in der folgenden Gleichung (13) gezeigt ist.
    Figure DE112012005855T5_0010
  • Die Steuerkoeffizienten-Berechnungsvorrichtung 72 berechnet den ersten Steuerkoeffizienten v(λ, k) und den zweiten Steuerkoeffizienten μ(λ, k), wie in den folgenden Gleichungen (14) bis (16) gezeigt ist, durch Verwendung des zweiten späteren SN-Verhältnisses γp(λ, k), das durch die Berechnungsvorrichtung 71 für das zweite SN-Verhältnis erworben wurde, und gibt jeden der Steuerkoeffizienten zu der Unterdrückungsbetrags-Berechnungsvorrichtung 8 aus.
  • Figure DE112012005855T5_0011
  • In den vorstehenden Gleichungen sind vMAX und vMIN vorbestimmte Konstanten zum Bestimmen einer oberen Grenze bzw. einer unteren Grenze für den ersten Steuerkoeffizienten v(λ, k), und μMAX und μMIN sind vorbestimmte Konstanten zum Bestimmen einer oberen Grenze bzw. einer unteren Grenze für den zweiten Steuerkoeffizienten μ(λ, k). Obgleich in diesem Ausführungsbeispiel als ein geeignetes Beispiel ein Fall gegeben ist, in welchem VMAX = 2,0, VMIN = 0,0, μMAX = 10,0 und μMIN = 1,0 sind, können diese Werte angemessen entsprechend dem Zustand eines Tons und demjenigen von Störungen in dem Eingangssignal geändert werden. Weiterhin sind Kv(k) und Kμ(k) in der vorstehenden Gleichung (16) Funktionen, die das zweite spätere SN-Verhältnis mit den Steuerkoeffizienten assoziieren, und die Störungsunterdrückungsvorrichtung arbeitet in einer solchen Weise, dass der erste Steuerkoeffizient v(λ, k) oder der zweite Steuerkoeffizient μ(λ, k) sich stärker mit Bezug auf den Wert des zweiten späteren SN-Verhältnisses γp(λ, k) ändern, wenn die Frequenz zunimmt. Indem auf diese Weise verfahren wird, wird beispielsweise der Vorteil erhalten, dass verhindert wird, dass ein Ton mit einer kleinen Amplitude, wie ein Konsonant mit einer hohen Frequenz, fehlerhaft als Störung angenommen und unterdrückt wird. Weiterhin sind Cv und Cμ vorbestimmten Konstanten, die experimentell erhalten wurden. Obgleich hier der Fall vorliegt, dass Cv = 0,1 und Cμ = –10 als ein geeignetes Beispiel bei diesem Ausführungsbeispiel verwendet werden, können diese Werte auch angemessen entsprechend dem Zustand eines Tons und demjenigen von Störungen in dem Eingangssignal geändert werden.
  • Gemäß den vorgenannten Gleichungen (14) bis (16) nimmt, wenn das zweite spätere SN-Verhältnis γp(λ, k) zunimmt, der erste Steuerkoeffizient v(λ, k) zu. Genauer gesagt, während der Grad der Varianz zunimmt, nimmt der zweite Steuerkoeffizient μ(λ, k) ab, und die Schärfe der Verteilung nimmt ab. Als eine Folge hat die Form der Verteilung der Wahrscheinlichkeitsdichtefunktion p(|X|) eine sanfte Neigung und nähert sich dem Verteilungszustand des Tonsignals in dem Tonabschnitt an. Demgegenüber nimmt, wenn das zweite spätere SN-Verhältnis μp(λ, k) abnimmt, während der erste Steuerkoeffizient v(λ, k) abnimmt und der Grad der Varianz abnimmt, der zweite Steuerkoeffizient μ(λ, k) zu, und die Schärfe der Verteilung nimmt zu. Als eine Folge hat die Form der Verteilung der Wahrscheinlichkeitsdichtefunktion p(|X|) eine steile Neigung und nähert sich dem Verteilungszustand des Tonsignals in dem Störungsabschnitt an (ein Zustand, in welchem kein Ton oder ein Ton mit einer kleinen Amplitude existiert).
  • 3 zeigt ein Beispiel für den Verteilungszustand der Wahrscheinlichkeitsdichtefunktion p(|X|), wenn der zweite Steuerkoeffizient μ(λ, k) fest ist und der erste Steuerkoeffizient v(λ, k) geändert wird. In 3 zeigt die horizontale Achse die Amplitude |X| des Tonspektrums, und die vertikale Achse zeigt den Wert der Wahrscheinlichkeitsdichtefunktion p(|X|). Es ist aus 3 ersichtlich, dass, wenn der erste Steuerkoeffizient v(λ, k) abnimmt, die Form der Wahrscheinlichkeitsdichtefunktion p(|X|) schmal und scharf wird und sich von dem Verteilungszustand des Tonsignals zu dem Verteilungszustand des Tonsignals zu einer Zeit, wenn ein Störungssignal zugemischt wird, ändert. Durch Anwenden des ersten Steuerkoeffizienten v(λ, k) und des zweiten Steuerkoeffizienten μ(λ, k), die wie vorstehend durch die obigen Gleichungen (12) und (13) erworben wurden, kann ein hochgenauer Spektrumunterdrückungsbetrag G(λ, k), der von dem Zustand des Eingangssignals abhängig ist, berechnet werden, und eine Störungsunterdrückung hoher Qualität kann realisiert werden.
  • Wie vorstehend beschrieben ist, enthält die Störungsunterdrückungsvorrichtung nach diesem Ausführungsbeispiel 1 den Eingangsanschluss 1, der ein Eingangssignal empfängt, die Fourier-Transformationsvorrichtung 2, die das Eingangssignal in der Zeitdomäne in ein Signal in der Frequenzdomäne umwandelt, die Energiespektrum-Berechnungsvorrichtung 3, die ein Energiespektrum aus dem Signal in der Frequenzdomäne berechnet, die Ton- und Störungsabschnitts-Bestimmungsvorrichtung 4, die einen Tonabschnitt oder einen Störungsabschnitt auf der Grundlage des Energiespektrums des Eingangssignals bestimmt, die Störungsspektrum-Schätzvorrichtung 5, die ein geschätztes Störungsspektrum aus dem Energiespektrum und dem Ergebnis der Bestimmung schätzt, die SN-Verhältnis-Berechnungsvorrichtung 6, die ein SN-Verhältnis aus dem Energiespektrum und dem geschätzten Störungsspektrum berechnet, die Wahrscheinlichkeitsdichtefunktions-Steuervorrichtung 7, die eine Wahrscheinlichkeitsdichtefunktion steuert, die den Verteilungszustand eines Tons auf der Grundlage eines ersten Indexes, der zeigt, ob das Eingangssignal ein Ton oder eine Störung zu sein scheint, definiert, die Unterdrückungsbetrags-Berechnungsvorrichtung 8, die einen Unterdrückungsbetrag für die Störungsunterdrückung aus dem SN-Verhältnis und der Wahrscheinlichkeitsdichtefunktion berechnet, die Spektrumunterdrückungsvorrichtung 9, die eine Amplitudenunterdrückung bei dem Energiespektrum gemäß dem Unterdrückungsbetrag durchführt, die Vorrichtung für inverse Fourier-Transformation 10, die das Energiespektrum, bei dem die Amplitudenunterdrückung durchgeführt wurde, in ein Signal in der Zeitdomäne umwandelt, um ein störungsunterdrücktes Signal zu erhalten, und den Ausgangsanschluss 11, der das störungsunterdrückte Signal ausgibt, und die Wahrscheinlichkeitsdichtefunktions-Steuervorrichtung 7 ist in einer solchen Weise ausgestaltet, dass sie die Berechnungsvorrichtung 71 für das zweite SN-Verhältnis, die ein SN-Verhältnis (zweites späteres SN-Verhältnis) für jede Frequenz des Eingangssignals schätzt, und die Steuerkoeffizienten-Berechnungsvorrichtung 72, die als den ersten Index das von der Berechnungsvorrichtung 71 für das zweite SN-Verhältnis geschätzte SN-Verhältnis verwendet, um die Wahrscheinlichkeitsdichtefunktion zu steuern, enthält. Daher kann, da die von dem Zustand des Eingangssignals abhängige Wahrscheinlichkeitsdichtefunktion, d. h. die Wahrscheinlichkeitsdichtefunktion, die an den Verteilungszustand des Tonsignals in dem Tonabschnitt und demjenigen in dem Störungsabschnitt angepasst ist, zu der Zeit des Berechnens des Spektrumunterdrückungsbetrags angewendet werden kann, eine Störungsunterdrückung hoher Qualität, die kein Gefühl eines ungewöhnlichen Tons in dem Störungsabschnitt liefert und die eine geringe Verzerrung in dem Ton vorsieht, durch den einfachen Prozess durchgeführt werden.
  • Obgleich bei dem Ausführungsbeispiel 1 die von dem Zustand des Eingangssignals abhängige Steuerung sowohl bei dem ersten Steuerkoeffizienten v(λ, k) als auch bei dem zweiten Steuerkoeffizienten μ(λ, k) durchgeführt wird, kann die Steuerung alternativ bei zumindest einem der Steuerkoeffizienten durchgeführt werden. Derselbe Vorteil wird erhalten, selbst wenn die Steuerung einzeln bei einem von ihnen durchgeführt wird.
  • Ausführungsbeispiel 2
  • Obgleich bei dem vorbeschriebenen Ausführungsbeispiel 1 die Steuerung der Wahrscheinlichkeitsdichtefunktion in Abhängigkeit von dem Zustand des Eingangssignals durch Verwendung des späteren SN-Verhältnisses durchgeführt wird, kann beispielsweise eine Gewichtung bei diesem späteren SN-Verhältnis durchgeführt werden. Dieses Beispiel hat das Ziel, wenn das SN-Verhältnis niedrig ist, obgleich ein Ton existiert, so, als ob ein Tonsignal in Störungen vergraben ist, zu verhindern, dass das in den Störungen vergrabenen Tonsignal irrtümlicherweise unterdrückt wird, indem eine Gewichtungskorrektur bei einem Frequenzband durchgeführt wird, bei dem eine Möglichkeit besteht, dass ein Ton in einer solchen Weise existiert, dass das spätere SN-Verhältnis zunimmt.
  • 4 ist ein Blockschaltbild, das die gesamte Struktur einer Störungsunterdrückungsvorrichtung gemäß diesem Ausführungsbeispiel 2 zeigt, und 5 ist ein Blockschaltbild, das die innere Struktur einer Wahrscheinlichkeitsdichtefunktions-Steuervorrichtung 7a in der Störungsunterdrückungsvorrichtung zeigt. Die in 4 gezeigte Wahrscheinlichkeitsdichtefunktions-Steuervorrichtung 7a verwendet ein Energiespektrum Y(λ, k) von einer Energiespektrum-Berechnungsvorrichtung 3, ein Bestimmungskennzeichen Vflag von einer Ton- und Störungsabschnitts-Bestimmungsvorrichtung 4, ein geschätztes Störungsspektrum N(λ, k) von einer Störungsspektrum-Schätzvorrichtung 5 und ein früheres SN-Verhältnis ξ(λ, k) von einer SN-Verhältnis-Berechnungsvorrichtung 6 als Eingangssignale. Die anderen strukturellen Komponenten sind dieselben wie in die in 1 gezeigten. In der in 5 gezeigten Wahrscheinlichkeitsdichtefunktions-Steuervorrichtung 7a befinden sich eine Periodenkomponenten-Schätzvorrichtung 73, eine Gewichtungsfaktor-Berechnungsvorrichtung 74 und eine Berechnungsvorrichtung 75 für ein gewichtetes SN-Verhältnis als strukturelle Komponenten, die unterschiedlich von denjenigen der in 2 gezeigten Wahrscheinlichkeitsdichtefunktions-Steuervorrichtung 7 sind. Die anderen strukturellen Komponenten sind dieselben wie die in 2 gezeigten.
  • Die Periodenkomponenten-Schätzvorrichtung 73 empfängt das von der Energiespektrum-Berechnungsvorrichtung 3 ausgegebene Energiespektrum Y(λ, k) und analysiert die harmonische Struktur des Eingangssignalspektrums. Wie in 6 gezeigt ist, führt die Periodenkomponenten-Schätzvorrichtung eine Analyse der harmonischen Struktur durch Erfassen von Spitzen der harmonischen Struktur, die das Energiespektrum bildet (nachfolgend als Spektralspitzen bezeichnet) durch. Genauer gesagt, um sehr kleine Spitzenkomponenten zu entfernen, die nicht auf die harmonische Struktur bezogen sind, werden beispielsweise etwa 20% des Maximums des Energiespektrums von jeder Energiespektrumkomponente subtrahiert, und danach werden maximale Werte der Spektralumhüllung des Energiespektrums verfolgt und in der Reihenfolge der zunehmenden Frequenz erhalten. Obgleich aus Gründen der Einfachheit das Beispiel für das Energiespektrum in 6 beschrieben wird durch die Annahme, dass das Tonspektrum und das Störungsspektrum unterschiedliche Komponenten sind, wird ein Störungsspektrum in einem tatsächlichen Eingangssignal einem Tonspektrum überlagert (zu diesem addiert), und eine Spitze des Tonspektrums mit einer Energie, die kleiner als die des Störungsspektrums ist, kann nicht beobachtet werden. Nach der Suche nach Spektralspitzen setzt, wenn ein gefundener Punkt ein maximaler Wert des Energiespektrums (eine Spektralspitze) ist, die Periodenkomponenten-Schätzvorrichtung 73 Periodizitätsinformationen p(λ, k) auf 1; andernfalls setzt sie die Periodizitätsinformationen p(λ, k) auf null, so dass die Periodenkomponenten-Schätzvorrichtung den Wert für jede Spektrumnummer k setzt. Obgleich in dem in 6 gezeigten Beispiel alle Spektralspitzen herausgezogen sind, kann die Extraktion alternativ nur bei einem spezifischen Frequenzband, wie einem Band mit einem guten SN-Verhältnis, durchgeführt werden.
  • Die Periodenkomponenten-Schätzvorrichtung 73 schätzt dann eine Spitze des in dem Störungsspektrum vergrabenen Tonspektrums auf der Grundlage der harmonischen Perioden der beobachteten Spektralspitzen. Genauer gesagt, die Periodenkomponenten-Schätzvorrichtung nimmt an, dass Spektralspitzen bei den harmonischen Perioden (Spitzenintervalle) der beobachteten Spektralspitzen in Abschnitten existieren, in denen keine Spektralspitze beobachtet wird (ein Niedrigfrequenzbereich und ein Hochfrequenzbereich, die in Störungen vergraben sind), wie beispielsweise in 7 gezeigt ist, und setzt die Periodizitätsinformationen p(λ, k) = 1 für ihre Spektrumnummern. Weil es einen seltenen Fall gibt, in welchem eine Tonkomponente in einem sehr niedrigen Frequenzband (z. B. 120 Hz oder weniger) existiert, braucht die Periodenkomponenten-Schätzvorrichtung die Periodizitätsinformationen p(λ, k) für das Band nicht auf ”1” zu setzen. Die Periodenkomponenten-Schätzvorrichtung kann denselben Prozess auch für ein sehr hohes Frequenzband durchführen. Indem der vorbeschriebene Prozess durchgeführt wird, gibt die Störungsunterdrückungsvorrichtung die Periodizitätsinformationen p(λ, k) von der Periodenkomponenten-Schätzvorrichtung 73 zu der Gewichtungsfaktor-Berechnungsvorrichtung 74 aus.
  • Die Gewichtungsfaktor-Berechnungsvorrichtung 74 empfängt die von der Periodenkomponenten-Schätzvorrichtung 73 ausgegebenen Periodizitätsinformationen p(λ, k), das von der Störungsspektrum-Schätzvorrichtung 5 ausgegebene Bestimmungskennzeichen Vflag und das von der SN-Verhältnis-Berechnungsvorrichtung 6 ausgegebene frühere SN-Verhältnis ξ(λ, k) und berechnet einen Gewichtungsfaktor Wh(λ, k) für die harmonische Struktur, der zum Durchführen einer Gewichtung für jede Spektralkomponente für ein späteres SN-Verhältnis verwendet wird, das durch die Berechnungsvorrichtung 75 für ein gewichtetes SN-Verhältnis, die nachfolgend beschrieben wird, berechnet wurde.
    Figure DE112012005855T5_0012
    worin Wh(λ – 1, k) der Gewichtungsfaktor für die harmonische Struktur eines vorhergehenden Datenblocks ist und β eine vorbestimmte Konstante zum Glätten ist. Beispielsweise ist β = 0,8 bevorzugt. Weiterhin ist wp(k) eine Gewichtungskonstante, wenn die Periodizitätsinformationen p(λ, k) = 1 sind. Beispielsweise wird die Gewichtungskonstante aus dem Bestimmungskennzeichen Vflag und dem früheren SN-Verhältnis ξ(λ, k) bestimmt, wie in der folgenden Gleichung (18) gezeigt ist, und wird geglättet durch Verwendung des Werts bei dieser Spektrumnummer und des Werts bei einer benachbarten Spektrumnummer. Durch Glätten der Gewichtungskonstanten mit der benachbarten Spektralkomponente wird der Vorteil erhalten, dass verhindert wird, dass der Gewichtungsfaktor steiler wird, und dass bei der Spektralspitzenanalyse auftretende Fehler absorbiert werden. Obgleich die Gewichtungskonstante wz(k) zu der Zeit der Periodizitätsinformationen p(λ, k) = 0 üblicherweise als 1,0 gehalten werden kann, das heißt, dass der Prozess zu dieser Zeit ohne Gewichtung durchgeführt werden kann, kann die Gewichtungskonstante alternativ gesteuert werden durch Verwendung des Bestimmungskennzeichens Vflag und des früheren SN-Verhältnisses ξ(λ, k) wie erforderlich, wie in dem Fall der Verwendung von wp(k), die durch die folgende Gleichung (18) gegeben ist.
    Figure DE112012005855T5_0013
  • Wenn die Periodizitätsinformationen p(λ, k) = 1 und das Bestimmungskennzeichen Vflag = 1 (Ton) sind,
    Figure DE112012005855T5_0014
  • Wenn die Periodizitätsinformationen p(λ, k) = 1 und das Bestimmungskennzeichen Vflag = 0 (Störung) sind,
    Figure DE112012005855T5_0015
  • In der vorstehenden Gleichung zeigt THSB_SNR einen vorbestimmten konstanten Schwellenwert. Durch Steuern der Gewichtungskonstanten wp(k) durch Verwendung des Bestimmungskennzeichens und des früheren SN-Verhältnisses kann, wie in der vorstehenden Gleichung (18) gezeigt ist, wenn das Eingangssignal durch die Ton- und Störungsabschnitts-Bestimmungsvorrichtung 4 als ein Ton bestimmt ist, eine große Gewichtung bei einer Spektralspitze in einem Band, in welchem ein Ton in Störungen vergraben ist (eine Spitze der harmonischen Struktur des Spektrums), durchgeführt werden, während die Durchführung einer übermäßigen Gewichtung bei einer Spektralkomponente in einem Band, in welchem das SN-Verhältnis von Anfang an hoch ist, verhindert werden kann. Demgegenüber kann, wenn das Eingangssignal von der Ton- und Störungsabschnitts-Bestimmungsvorrichtung 4 als Störung bestimmt ist, indem verhindert wird, dass die Gewichtung durchgeführt wird (Setzen der Gewichtungskonstanten wp(k) auf 1,0), und auch die Gewichtung bei einer Spektralkomponente durchgeführt wird, die als ein hohes SN-Verhältnis aufweisend geschätzt ist, die Gewichtung auch in einem Fall durchgeführt werden, in welchem beispielsweise das Bestimmungskennzeichen irrtümlicherweise als Störung gesetzt ist, obgleich der gegenwärtige Datenblock ein Ton ist. Der Schwellenwert THSB_SNR kann auch angemessen entsprechend dem Zustand und dem Störungspegel des Eingangssignals geändert werden.
  • Die Berechnungsvorrichtung 75 für ein gewichtetes SN-Verhältnis bestimmt ein gewichtetes späteres SN-Verhältnis, das für die Steuerkoeffizienten-Berechnungsvorrichtung 72 erforderlich ist, um einen ersten Steuerkoeffizienten v(λ, k) und einen zweiten Steuerkoeffizienten μ(λ, k) zu berechnen. Zuerst bestimmt die Berechnungsvorrichtung für ein gewichtetes SN-Verhältnis ein vorübergehendes späteres SN-Verhältnis γt(λ, k) aus dem Energiespektrum Y(λ, k) und dem geschätzten Störungsspektrum N(λ, k) des Eingangssignals durch Verwendung der folgenden Gleichung (19).
    Figure DE112012005855T5_0016
  • Als Nächstes bezieht sich die Berechnungsvorrichtung 75 für ein gewichtetes SN-Verhältnis auf eine in 8 gezeigte nichtlineare Funktion, um einen Gewichtungsfaktor W(λ, k) entsprechend dem vorübergehenden späteren SN-Verhältnis γt(λ, k) zu berechnen. Wie in 8 gezeigt ist, nimmt der Gewichtungsfaktor W(λ, k) eine Funktion an, die ein mit der Abnahme des vorübergehenden späteren SN-Verhältnisses γt(λ, k) zunehmendes Gewicht vorsieht, während ein festes Gewicht vorgesehen ist, wenn das vorübergehende spätere SN-Verhältnis γt(λ, k) in einem gewissen Ausmaß groß (oder klein) ist. Weiterhin ist das in 8 gezeigte WMIN eine vorbestimmte Konstante zum Bestimmen einer unteren Grenze des Gewichtungsfaktors W(λ, k), und γ0 Dach γ1 Dach (”^” über dem griechischen Buchstaben wird durch ”Dach” ausgedrückt, da diese Anmeldung eine elektronische ist) sind vorbestimmte Konstanten. Obgleich ein Fall von WMIN = 0,25, γ0 Dach = 3 (dB) und γ1 Dach = 12 (dB) als ein geeignetes Beispiel bei diesem Ausführungsbeispiel vorliegt, können diese Werte gemäß dem Zustand eines Tons und demjenigen von Störungen in dem Eingangssignal angemessen geändert werden. Danach führt die Berechnungsvorrichtung für ein gewichtetes SN-Verhältnis eine Gewichtung bei dem geschätzten Störungsspektrum N(λ, k) durch, indem der erworbene Gewichtungsfaktor W(λ, k) verwendet wird, um ein erstes gewichtetes späteres SN-Verhältnis γw1(λ, k) zu berechnen, wie in der folgenden Gleichung (20) gezeigt ist.
    Figure DE112012005855T5_0017
  • Da, indem der durch die vorstehende Gleichung (20) gezeigte Gewichtungsprozess durchgeführt wird, die Störungsunterdrückungsvorrichtung die Wahrscheinlichkeitsdichtefunktion steuern kann, nachdem die Korrektur in einer solchen Weise durchgeführt wurde, dass das spätere SN-Verhältnis in einem Band, in welchem das SN-Verhältnis niedrig ist, als ein höherer Wert geschätzt wird, kann die Störungsunterdrückungsvorrichtung verhindern, dass der Ton übermäßig unterdrückt wird, und kann eine Störungsunterdrückung hoher Qualität durchführen.
  • Als Nächstes verwendet die Berechnungsvorrichtung 75 für ein gewichtetes SN-Verhältnis den Gewichtungsfaktor Wh(λ, k) für eine harmonische Struktur, um eine Korrektur bei einem Band durchzuführen, in welchem eine hohe Möglichkeit besteht, dass eine Hochfrequenzkomponente eines Tons in einer solchen Weise existiert, dass das erste gewichtete spätere SN-Verhältnis γw1(λ, k), das durch Verwendung der vorstehenden Gleichung (20) erhalten wurde, als ein hoher Wert geschätzt wird und ein zweites gewichtetes späteres SN-Verhältnis γw2(λ, k) wie in der folgenden Gleichung (21) gezeigt berechnet wird. γw2(λ, k) = Wh(λ, k)·γw1(λ, k) (21)
  • Da, indem der durch die vorstehende Gleichung (21) gezeigte Gewichtungsprozess durchgeführt wird, die Störungsunterdrückungsvorrichtung die Wahrscheinlichkeitsdichtefunktion steuern kann, nachdem die Korrektur in einer solchen Weise durchgeführt wurde, dass das spätere SN-Verhältnis in einem Band, in welchem eine hohe Möglichkeit besteht, dass eine Hochfrequenzkomponente eines Tons existiert, auf einen höheren Wert geschätzt wird, kann die Störungsunterdrückungsvorrichtung verhindern, dass der Ton übermäßig unterdrückt wird, und kann eine Störungsunterdrückung hoher Qualität durchführen.
  • Danach gibt die Störungsunterdrückungsvorrichtung das erworbene zweite gewichtete spätere SN-Verhältnis γw2(λ, k) von der Berechnungsvorrichtung 75 für ein gewichtetes SN-Verhältnis zu der Steuerkoeffizienten-Berechnungsvorrichtung 72 aus.
  • Die 9 und 10 sind Diagramme, die jeweils schematisch ein Spektrum eines Ausgangssignals in einem Tonabschnitt und ein entsprechendes späteres SN-Verhältnis als ein Beispiel für das Ausgangssignal der Störungsunterdrückungsvorrichtung gemäß diesem Ausführungsbeispiel 2 zeigen. 9(a) zeigt das spätere SN-Verhältnis, bei dem keine Gewichtung durchgeführt wird, wenn das in 6 gezeigte Spektrum als das Eingangssignal vorgesehen ist, und das Spektrum des Ausgangssignals, das das der Störungsunterdrückung unterzogene Ergebnis in diesem Fall ist, ist in 9(b) gezeigt. Andererseits zeigt 10(a) das spätere SN-Verhältnis, bei dem die durch die vorstehenden Gleichungen (20) und (21) gezeigte Gewichtung durchgeführt ist, und das Spektrum des Ausgangssignals, das das Ergebnis der Störungsunterdrückung in diesem Fall ist, ist in 10(b) gezeigt. In den 9(a) und 10(a) wird das spätere SN-Verhältnis in Dezibel ausgedrückt, und wenn der Dezibelwert des späteren SN-Verhältnisses negativ ist, wird die Anzeige des Wertes weggelassen, und der Wert wird auf null gesetzt.
  • Gemäß den 9(a) und 9(b) ist die Energie eines Tons, der in Störungen vergraben ist oder innerhalb eines Bands liegt, in welchem das SN-Verhältnis niedrig ist, herabgesetzt. Demgegenüber ist aus den 10(a) und 10(b) ersichtlich, da die Korrektur in einer solchen Weise durchgeführt wird, dass das spätere SN-Verhältnis eines Tons, der in Störungen vergraben ist oder in einem Band liegt, in welchem das SN-Verhältnis niedrig ist, als ein hoher Wert geschätzt wird, dass die Tonenergie des Bandes wiedergewonnen wird und eine weitere erhöhte Störungsunterdrückung realisiert werden kann.
  • Wie vorstehend beschrieben ist, schätzt gemäß diesem Ausführungsbeispiel 2 die Wahrscheinlichkeitsdichtefunktions-Steuervorrichtung 7a der Störungsunterdrückungsvorrichtung ein SN-Verhältnis (vorübergehendes späteres SN-Verhältnis) für jede Frequenz des Eingangssignals und enthält die Berechnungsvorrichtung 75 für ein gewichtetes SN-Verhältnis, die eine Gewichtung bei dem vorgenannten, für jede Frequenz geschätzten SN-Verhältnisses durchführt auf der Grundlage eines zweiten Indexes, der zeigt, ob das Eingangssignal als ein Ton oder als Störung erscheint, und die Steuerkoeffizienten-Berechnungsvorrichtung 72 ist in einer solchen Weise ausgestaltet, dass die Wahrscheinlichkeitsdichtefunktion gesteuert wird durch Verwendung des gewichteten SN-Verhältnisses (zweites gewichtetes späteres SN-Verhältnis), das durch die Berechnungsvorrichtung 75 für ein gewichtetes SN-Verhältnis berechnet wurde, als ein erster Index. Daher kann die Störungsunterdrückungsvorrichtung verhindern, dass der Ton übermäßig unterdrückt wird, und kann eine Störungsunterdrückung hoher Qualität durchführen.
  • Obgleich bei diesem Ausführungsbeispiel 2 die Berechnungsvorrichtung 75 für ein gewichtetes SN-Verhältnis in einer solchen Weise ausgestaltet ist, dass ein SN-Verhältnis für jede Frequenz des Eingangssignals geschätzt und eine Gewichtung dieses SN-Verhältnisses durchgeführt wird, ist das Ausführungsbeispiel 2 nicht auf dieses Beispiel beschränkt. Die Funktion des Schätzens des SN-Verhältnisses kann von der Berechnungsvorrichtung 75 für ein gewichtetes SN-Verhältnis getrennt werden, und eine SN-Verhältnis-Berechnungsvorrichtung entsprechend der Berechnungsvorrichtung 71 für ein zweites SN-Verhältnis gemäß dem vorbeschriebenen Ausführungsbeispiel 1 kann separat ausgebildet sein. Bei dieser Struktur führt die Berechnungsvorrichtung 75 für ein gewichtetes SN-Verhältnis eine Gewichtung bei dem für jede Frequenz geschätzten SN-Verhältnis auf der Grundlage des zweiten Indexes durch, der zeigt, ob das Eingangssignal als ein Ton oder als Störung erscheint.
  • Weiterhin kann gemäß dem Ausführungsbeispiel 2 der vorliegenden Erfindung, da die Störungsunterdrückungsvorrichtung als den zweiten Index das vorübergehende spätere SN-Verhältnis verwendet, das die Berechnungsvorrichtung 75 für ein gewichtetes SN-Verhältnis durch Verwendung des Energiespektrums und des geschätzten Störungsspektrums des Eingangssignals berechnet, um die Wahrscheinlichkeitsdichtefunktion nach der Korrektur des späteren SN-Verhältnisses in einer solchen Weise, dass ein Ton auch in einem Band gehalten wird, in welchem der Ton in Störungen vergraben ist und das SN-Verhältnis negativ ist, zu steuern, die Störungsunterdrückungsvorrichtung verhindern, dass der Ton übermäßig unterdrückt wird, und kann eine Störungsunterdrückung hoher Qualität durchführen.
  • Weiterhin wird gemäß diesem Ausführungsbeispiel 2, da die Störungsunterdrückungsvorrichtung als den zweiten Index das frühere SN-Verhältnis verwendet, das die SN-Verhältnis-Berechnungsvorrichtung 6 durch Verwendung des Energiespektrums und des geschätzten Störungsspektrums des Eingangssignals berechnet, sowie das Ergebnis der Bestimmung eines Tonabschnitts oder eines Störungsabschnitts, die die Ton- und Störungsabschnitts-Bestimmungsvorrichtung 4 auf der Grundlage des Energiespektrums des Eingangssignals durchführt, um eine Gewichtungssteuerung bei dem späteren SN-Verhältnis durchzuführen, ein Vorteil dahingehend erhalten, dass es möglich ist, die Durchführung einer unnötigen Gewichtung bei einem Störungsabschnitt und einem Band, in welchem das SN-Verhältnis hoch ist, zu verhindern, wodurch eine Störungsunterdrückung höherer Qualität durchgeführt werden kann.
  • Weiterhin enthält gemäß diesem Ausführungsbeispiel 2 die Wahrscheinlichkeitsdichtefunktions-Steuervorrichtung 7a die Periodenkomponenten-Schätzvorrichtung 73, die die harmonische Struktur des Tons in dem Eingangssignal analysiert, und die Berechnungsvorrichtung 75 für das gewichtete SN-Verhältnis ist derart ausgestaltet, dass das Ergebnis der Analyse durch die Periodenkomponenten-Schätzvorrichtung 73 als der zweite Index verwendet wird, um die Gewichtung in einer solchen Weise durchzuführen, dass das SN-Verhältnis einer Spitze des Energiespektrums des Eingangssignals erhöht wird. Daher kann die Störungsunterdrückungsvorrichtung das spätere SN-Verhältnis auch in einem Band, in welchem ein Ton in Störungen vergraben ist, derart korrigieren, dass der Ton gehalten wird, wodurch es möglich ist, eine Störungsunterdrückung höherer Qualität durchzuführen.
  • Obgleich bei diesem Ausführungsbeispiel 2 die Störungsunterdrückungsvorrichtung die späteren SN-Verhältnisse in allen Bändern korrigiert, ist das Ausführungsbeispiel 2 nicht auf dieses Beispiel beschränkt. Die Störungsunterdrückungsvorrichtung kann alternativ die Korrektur nur bei einem Niedrigfrequenzbereich oder einem Hochfrequenzbereich wie benötigt durchführen, oder nur bei einem spezifischen Frequenzband, wie einem Frequenzband nahe einem Frequenzband von 500 bis 800 Hz. Die Korrektur bei einem derartigen Frequenzband ist effektiv beispielsweise für die Korrektur eines in einer Schmalbandstörung vergrabenen Tons, wie eines Windgeräuschs oder des Geräuschs einer Automobilmaschine.
  • Weiterhin ist, obgleich sowohl der Gewichtungsprozess, wie er in der Gleichung (20) gezeigt ist, für ein Band, in welchem das SN-Verhältnis niedrig ist, und der Gewichtungsprozess, wie er in der Gleichung (21) gezeigt ist, auf der Grundlage der harmonischen Struktur eines Tons bei diesem Ausführungsbeispiel 2 durchgeführt werden, ist das Ausführungsbeispiel 2 nicht auf dieses Beispiel beschränkt. Nur jeweils einer der Gewichtungsprozesse kann durchgeführt werden, und einer der Vorteile, die in den Gewichtungsprozessen beschrieben sind, kann jeweils erhalten werden.
  • Ausführungsbeispiel 3
  • Obgleich die Werte der Gewichtung (die Gewichtungskonstanten wp(k) und wz(k)) in der bei dem vorbeschriebenen Ausführungsbeispiel 2 gezeigten Gleichung (18) mit Bezug auf die Frequenzrichtung festgelegt sind, können die Werte alternativ unterschiedlich gemäß der Frequenz sein. Beispielsweise kann die Gewichtungsfaktor-Berechnungsvorrichtung 74 die Gewichtung für Komponenten niedrigerer Frequenzen erhöhen, da die Komponenten niedrigerer Frequenzen eine klare harmonische Struktur als typische Toncharakteristiken haben (es besteht eine große Differenz zwischen Spitzen und Tälern in dem Spektrum), und die Gewichtung verringern, wenn die Frequenz zunimmt.
  • Gemäß diesem Ausführungsbeispiel 3 kann, da die Gewichtungsfaktor-Berechnungsvorrichtung 74 derart ausgestaltet ist, dass die Intensität der Gewichtung durch die Berechnungsvorrichtung 75 für das gewichtete SN-Verhältnis gemäß der Frequenz gesteuert wird, die Gewichtungsfaktor-Berechnungsvorrichtung die Gewichtung geeignet für die Frequenzcharakteristiken eines Tons durchführen und kann eine Störungsunterdrückung höherer Qualität durchführen.
  • Ausführungsbeispiel 4
  • Weiterhin kann, obgleich die Werte der Gewichtung (die Gewichtungskonstanten wp(k) und wz(k)) als vorbestimmte Konstanten in der bei dem vorbeschriebenen Ausführungsbeispiel 2 gezeigten Gleichung (18) gesetzt sind, eine Umschaltung unter mehreren Gewichtungskonstanten alternativ durchgeführt werden gemäß einem Index, der die Tonähnlichkeit des Eingangssignals zeigt, um eine der Gewichtungskonstanten zu verwenden, oder die Werte der Gewichtung können alternativ gesteuert werden durch Verwendung einer vorbestimmten Funktion. 11 ist ein Blockschaltbild, das die gesamte Struktur einer Störungsunterdrückungsvorrichtung gemäß diesem Ausführungsbeispiel 4 zeigt. Eine in 11 gezeigte Wahrscheinlichkeitsdichtefunktions-Steuervorrichtung 7b verwendet ein Energiespektrum Y(λ, k) von einer Energiespektrum-Berechnungsvorrichtung 3, ein Bestimmungskennzeichnen Vflag und ein Maximum ρmax(λ) einer normierten Autokorrelationsfunktion von einer Ton- und Störungsabschnitts-Bestimmungsvorrichtung 4, ein geschätztes Störungsspektrum N(λ, k) von einer Störungsspektrum-Schätzvorrichtung 5 und ein früheres SN-Verhältnis ξ(λ, k) von einer SN-Verhältnis-Berechnungsvorrichtung 6 als Eingangssignale. Die anderen strukturellen Komponenten sind dieselben wie die in 4 gezeigten. Weiterhin hat die Wahrscheinlichkeitsdichtefunktions-Steuervorrichtung 7b dieselbe innere Struktur wie die in 5 gezeigte.
  • Die Störungsunterdrückungsvorrichtung gemäß diesem Ausführungsbeispiel 4 gibt beispielsweise das Maximum ρmax(λ) der normierten Autokorrelationsfunktion, die von der Ton- und Störungsabschnitts-Bestimmungsvorrichtung 4 ausgegeben wurde, in eine Gewichtungsfaktor-Berechnungsvorrichtung 74 (gezeigt in 5) der Wahrscheinlichkeitsdichtefunktions-Steuervorrichtung 7b als den Index, der die Tonähnlichkeit des Eingangssignals zeigt, ein, d. h. einen Steuerfaktor für den Zustand des Eingangssignals. Wenn das Maximum ρmax(λ) der normierten Autokorrelationsfunktion in der vorstehenden Gleichung (4) hoch ist, d. h., wenn das Eingangssignal eine klare periodische Struktur hat (es besteht eine hohe Möglichkeit, dass das Eingangssignal ein Ton ist), kann diese Gewichtungsfaktor-Berechnungsvorrichtung 74 die Gewichte erhöhen; andernfalls kann die Gewichtungsfaktor-Berechnungsvorrichtung die Gewichte verringern. Weiterhin kann die Gewichtungsfaktor-Berechnungsvorrichtung das Maximum ρmax(λ) der normierten Autokorrelationsfunktion und das Bestimmungskennzeichen Vflag für die Bestimmung eines Tonabschnitts oder eines Störungsabschnitts zusammen verwenden. Zusätzlich kann dieses Ausführungsbeispiel mit dem vorbeschriebenen Ausführungsbeispiel 3 kombiniert werden.
  • Wie vorstehend beschrieben ist, kann gemäß diesem Ausführungsbeispiel 4, da die Gewichtungsfaktor-Berechnungsvorrichtung 74 in einer solchen Weise ausgestaltet ist, dass die Intensität der Gewichtung durch die Berechnungsvorrichtung 75 für das gewichtete SN-Verhältnis entsprechend dem Zustand des Eingangssignals gesteuert wird, die Störungsunterdrückungsvorrichtung die Gewichtung derart durchführen, dass die periodische Struktur eines Tons auffällig gemacht wird, wenn eine hohe Möglichkeit gegeben ist, dass das Eingangssignal ein Ton ist, wodurch sie in der Lage ist, die Verschlechterung des Tons zu verringern und eine Störungsunterdrückung höherer Qualität durchzuführen.
  • Ausführungsbeispiel 5
  • Da eine Störungsunterdrückungsvorrichtung gemäß diesem Ausführungsbeispiel 5 dieselbe Struktur wie die in den 4 und 5 gezeigte Störungsunterdrückungsvorrichtung nach dem vorbeschriebenen Ausführungsbeispiel 2 unter einem grafischen Gesichtspunkt hat, wird die Störungsunterdrückungsvorrichtung nach diesem Ausführungsbeispiel unter Verwendung der 4 und 5 erläutert. Wie mit Bezug auf 6 bei dem vorbeschriebenen Ausführungsbeispiel 2 erläutert ist, werden alle Spektralspitzen für die Schätzung von Periodenkomponenten erfasst. Als eine Alternative kann beispielsweise das von der SN-Verhältnis-Berechnungsvorrichtung 6 ausgegebene frühere SN-Verhältnis ξ(λ, k) in die Periodenkomponenten-Schätzvorrichtung 73 eingegeben werden, und die Erfassung von Spektralspitzen nur in einem Band, in welchem das SN-Verhältnis höher als ein vorbestimmter Schwellenwert ist, kann durchgeführt werden durch Verwendung eines früheren SN-Verhältnisses ξ(λ, k). In gleicher Weise kann auch bei der Berechnung der normierten Autokorrelationsfunktion ρN(λ, k) durch die Ton- und Störungsabschnitts-Bestimmungsvorrichtung 4 die normierte Autokorrelationsfunktion auch nur für ein Band berechnet werden, in welchem das SN-Verhältnis höher als der vorbestimmte Schwellenwert ist.
  • Wie vorstehend beschrieben ist, ist gemäß diesem Ausführungsbeispiel 5 die Störungsunterdrückungsvorrichtung in einer solchen Weise ausgestaltet, dass der zweite Index verwendet wird, der unter Verwendung einer Signalkomponente des Eingangssignals in einem Frequenzband, in welchem das SN-Verhältnis höher als der vorbestimmte Schwellenwert ist, berechnet wurde. Daher werden die Erfassung der Spektralspitzen und die Berechnung der normierten Autokorrelationsfunktion nur für ein Band durchgeführt, in welchem das SN-Verhältnis hoch ist, und daher können die Genauigkeit der Erfassung von Spektralspitzen und die Genauigkeit der Bestimmung eines Ton- oder Störungsabschnitts verbessert werden, und eine Störungsunterdrückung höherer Qualität kann durchgeführt werden.
  • Ausführungsbeispiel 6
  • Da eine Störungsunterdrückungsvorrichtung nach diesem Ausführungsbeispiel 6 dieselbe Struktur wie die in den 4 und 5 gezeigte Störungsunterdrückungsvorrichtung gemäß dem vorbeschriebenen Ausführungsbeispiel 2 oder die in 11 gezeigte Störungsunterdrückungsvorrichtung gemäß dem vorbeschriebenen Ausführungsbeispiel 4 unter einem grafischen Gesichtspunkt hat, wird die Störungsunterdrückungsvorrichtung nach diesem Ausführungsbeispiel unter Verwendung der 4, 5 und 11 erläutert. Obgleich in den vorbeschriebenen Ausführungsbeispielen 2 bis 5 die Gewichtung des SN-Verhältnisses derart durchgeführt wird, dass jede der Wahrscheinlichkeitsdichtefunktions-Steuervorrichtungen 7a und 7b die Spektralspitzen erhöht, kann die Gewichtung alternativ derart durchgeführt werden, dass in umgekehrter Weise die Täler des Spektrums erhöht werden, d. h. in einer solchen Weise, dass das SN-Verhältnis in den Tälern des Spektrums verringert wird. Als ein Verfahren zum Erfassen der Täler des Spektrums durch die Periodenkomponenten-Schätzvorrichtung 73 kann beispielsweise der mittlere Wert zwischen den Spektrumnummern von Spektralspitzen als ein Tal des Spektrums definiert werden.
  • Wie vorstehend beschrieben ist, hat gemäß diesem Ausführungsbeispiel 6 jede der Wahrscheinlichkeitsdichtefunktions-Steuervorrichtungen 7a und 7b die Periodenkomponenten-Schätzvorrichtung 73, die die harmonische Struktur eines Tons in dem Eingangssignal analysiert, und die Berechnungsvorrichtung 75 für ein gewichtetes SN-Verhältnis ist derart ausgestaltet, dass das Ergebnis der Analyse durch die Periodenkomponenten-Schätzvorrichtung 73 als der zweite Index zum Durchführen der Gewichtung des SN-Verhältnisses eines anderen Teils des Energiespektrums des Eingangssignals verwendet wird. Daher kann die Störungsunterdrückungsvorrichtung die periodische Struktur eines Tons auffällig machen und kann eine Störungsunterdrückung höherer Qualität durchführen.
  • Ausführungsbeispiel 7
  • Da eine Störungsunterdrückungsvorrichtung nach diesem Ausführungsbeispiel 7 unter einem grafischen Gesichtspunkt dieselbe Struktur wie die in 1 gezeigte Störungsunterdrückungsvorrichtung gemäß dem vorbeschriebenen Ausführungsbeispiel 1, die in 4 gezeigte Störungsunterdrückungsvorrichtung gemäß dem Ausführungsbeispiel 2 oder die in 11 gezeigte Störungsunterdrückungsvorrichtung gemäß dem vorbeschriebenen Ausführungsbeispiel 4 hat, wird die Störungsunterdrückungsvorrichtung nach diesem Ausführungsbeispiel unter Verwendung der 1, 4 und 11 erläutert. Obgleich bei den vorbeschriebenen Ausführungsbeispielen 1 bis 6 jede der Wahrscheinlichkeitsdichtefunktions-Steuervorrichtungen 7, 7a und 7b die Wahrscheinlichkeitsdichtefunktion für jede Spektralkomponente bezüglich eines Hochfrequenzbereichs, z. B. eines Hochfrequenzbereichs von 3 kHz bis 4 kHz, steuert, kann jede der Wahrscheinlichkeitsdichtefunktions-Steuervorrichtungen eine kollektive Steuerung auf der Grundlage des Durchschnitts der späteren SN-Verhältnisse in dem Band durchführen, anstelle der Steuerung unter Verwendung des späteren SN-Verhältnisses für jede Spektralkomponente.
  • Wie vorstehend beschrieben ist, kann gemäß diesem Ausführungsbeispiel 7, da die Steuerkoeffizienten-Berechnungsvorrichtung 72 jeder der Wahrscheinlichkeitsdichtefunktions-Steuervorrichtungen 7, 7a und 7b derart ausgestaltet ist, dass das durchschnittliche SN-Verhältnis in einem vorbestimmten Frequenzband verwendet wird, um die Wahrscheinlichkeitsdichtefunktion kollektiv für das Frequenzband zu steuern, eine Störungsunterdrückung höherer Qualität realisiert werden, und eine Verringerung der verarbeiteten Informationsmenge kann auch erzielt werden.
  • Ausführungsbeispiel 8
  • Da eine Störungsunterdrückungsvorrichtung nach diesem Ausführungsbeispiel 8 unter einem grafischen Gesichtspunkt dieselbe Struktur wie die in 1 gezeigte Störungsunterdrückungsvorrichtung gemäß dem vorbeschriebenen Ausführungsbeispiel 1, die in 4 gezeigte Störungsunterdrückungsvorrichtung gemäß dem vorbeschriebenen Ausführungsbeispiel 2 oder die in 11 gezeigte Störungsunterdrückungsvorrichtung gemäß dem vorbeschriebenen Ausführungsbeispiel 4 hat, wird die Störungsunterdrückungsvorrichtung nach diesem Ausführungsbeispiel unter Verwendung der 1, 4 und 11 erläutert. Obgleich bei den vorbeschriebenen Ausführungsbeispielen 1 bis 7 jede der Wahrscheinlichkeitsdichtefunktions-Steuervorrichtung 7, 7a und 7b das spätere SN-Verhältnis des Eingangssignals als den ersten Index zum Steuern der Wahrscheinlichkeitsdichtefunktion verwendet, ist die vorliegende Erfindung nicht auf dieses Beispiel beschränkt, und jede der Wahrscheinlichkeitsdichtefunktions-Steuervorrichtungen kann einen anderen Index, der zeigt, ob das Eingangssignal als ein Ton oder eine Störung erscheint, verwenden. Beispielsweise kann einer von Indizes, die durch Verwendung bekannter Analysiermittel erworben wurden, wie eine Varianz eines Eingangssignalspektrums, die Spektrumentropie des Eingangssignalspektrums, eine Autokorrelationsfunktion und die Anzahl von Nulldurchgangen, einzeln verwendet werden, oder eine Kombination von zwei oder mehr der Indizes kann verwendet werden.
  • Beispielsweise führt in einem Fall, in welchem die Varianz des Eingangssignalspektrums für den ersten Index verwendet wird, da eine hohe Möglichkeit besteht, dass das Eingangssignal ein Ton ist, wenn die Varianz groß ist, jede der Wahrscheinlichkeitsdichtefunktions-Steuervorrichtungen 7, 7a und 7b die Steuerung in einer solchen Weise durch, dass der erste Steuerkoeffizient v(λ, k) erhöht wird, während der zweite Steuerkoeffizient μ(λ, k) verringert wird. Wenn die Varianz klein ist, kann jede der Wahrscheinlichkeitsdichtefunktions-Steuervorrichtungen die Steuerung derart durchführen, dass umgekehrt der erste Steuerkoeffizient v(λ, k) verringert wird, während der zweite Steuerkoeffizient μ(λ, k) erhöht wird. Weiterhin kann eine Funktion, die die Varianz des Eingangssignalspektrums, die ein Index ist, in Entsprechung zu den Steuerkoeffizienten bringt, experimentell bestimmt werden durch Beobachten des Zustands der Entsprechung zwischen dem Index und den Steuerkoeffizienten.
  • Wie vorstehend beschrieben ist, kann gemäß diesem Ausführungsbeispiel 8, da die Wahrscheinlichkeitsdichtefunktion, die dem Verteilungszustand eines Tonsignals in einem Tonabschnitt angepasst ist und die in einem Störungsabschnitt selbst dann angewendet werden kann, wenn ein anderer Index als das spätere SN-Verhältnis als der erste Index, der den Zustand des Eingangssignals zeigt, verwendet wird, eine Störungsunterdrückung hoher Qualität, die kein Gefühl eines ungewöhnlichen Tons in dem Störungsabschnitt liefert und die eine geringe Verzerrung in dem Ton liefert, durch den einfachen Prozess durchgeführt werden. Weiterhin kann die Genauigkeit der Steuerung der Wahrscheinlichkeitsdichtefunktion verbessert werden durch Kombinieren mehrerer Indizes, und eine Störungsunterdrückung höherer Qualität kann durchgeführt werden.
  • Ausführungsbeispiel 9
  • Da eine Störungsunterdrückungsvorrichtung nach diesem Ausführungsbeispiel 9 unter einem grafischen Gesichtspunkt dieselbe Struktur wie in den 4 und 5 gezeigte Störungsunterdrückungsvorrichtung gemäß dem vorbeschriebenen Ausführungsbeispiel 2 oder die in 11 gezeigte Störungsunterdrückungsvorrichtung gemäß dem vorbeschriebenen Ausführungsbeispiel 4 hat, wird die Störungsunterdrückungsvorrichtung gemäß diesem Ausführungsbeispiel unter Verwendung der 4 und 5 erläutert. Obgleich bei dem vorbeschriebenen Ausführungsbeispiel 2 die Gewichtungsfaktor-Berechnungsvorrichtung 74 den Gewichtungsfaktor für die harmonische Struktur anhand des Ergebnisses der Analyse der harmonischen Struktur eines Tons berechnet, führt die Berechnungsvorrichtung 75 für ein gewichtetes SN-Verhältnis die Gewichtung bei dem späteren SN-Verhältnis mit dem Gewichtungsfaktor Wh(λ, k) für die harmonische Struktur durch, und die Steuerkoeffizienten-Berechnungsvorrichtung 72 steuert die Wahrscheinlichkeitsdichtefunktion durch Verwendung des späteren SN-Verhältnisses, bei dem die Gewichtung durchgeführt wurde, und die Wahrscheinlichkeitsdichtefunktion kann direkt anhand des Ergebnisses der Analyse beispielsweise der harmonischen Struktur eines Tons gesteuert werden.
  • Konkret werden die Periodizitätsinformationen p(λ, k), die von der Periodenkomponenten-Schätzvorrichtung 73 ausgegeben wurden, direkt in die Steuerkoeffizienten-Berechnungsvorrichtung 72 eingegeben. Wenn die Periodizitätsinformationen p(λ, k) = 1 sind, führt, da eine hohe Möglichkeit besteht, dass die Komponente, die innerhalb des Bands liegt, ein Ton ist, die Steuerkoeffizienten-Berechnungsvorrichtung 72 eine Steuerung durch, die den ersten Steuerkoeffizienten v(λ, k) erhöht, während der zweite Steuerkoeffizient μ(λ, k) verringert wird. Demgegenüber führt, wenn die Periodizitätsinformationen p(λ, k) = 0 sind, da eine hohe Möglichkeit besteht, dass die innerhalb des Bands liegende Komponente eine Störung ist, die Steuerkoeffizienten-Berechnungsvorrichtung eine Steuerung durch, bei der der erste Steuerkoeffizient v(λ, k) verringert wird, während der zweite Steuerkoeffizient μ(λ, k) erhöht wird. Eine Funktion, die die Periodizitätsinformationen, die ein Steuerfaktor sind, in Entsprechung mit den Steuerkoeffizienten bringt, kann experimentell bestimmt werden durch Beobachten des Zustands der Entsprechung zwischen dem Steuerfaktor und den Steuerkoeffizienten. Bei dieser Struktur können die Gewichtungsfaktor-Berechnungsvorrichtung 74 und die Berechnungsvorrichtung 75 für ein gewichtetes SN-Verhältnis, die in der in 5 gezeigten Wahrscheinlichkeitsdichtefunktions-Steuervorrichtung 7a enthalten sind, weggelassen werden.
  • Wie vorstehend beschrieben ist, ist gemäß diesem Ausführungsbeispiel 9 jede der Wahrscheinlichkeitsdichtefunktions-Steuervorrichtungen 7a und 7b derart gestaltet, dass sie die Periodenkomponenten-Schätzvorrichtung 73, die die harmonische Struktur eines Tons in dem Eingangssignal analysiert, und die Steuerkoeffizienten-Berechnungsvorrichtung 72, die das Ergebnis der Analyse durch die Periodenkomponenten-Schätzvorrichtung 73 als den ersten Index verwendet, um die Wahrscheinlichkeitsdichtefunktion zu steuern, enthält. Daher kann, da die Wahrscheinlichkeitsdichtefunktion, die dem Verteilungszustand eines Tonsignals in einem Tonabschnitt angepasst ist und die in einem Störungsabschnitt angewendet werden kann, eine Störungsunterdrückung hoher Qualität, die kein Gefühl eines ungewöhnlichen Tons in dem Störungsabschnitt liefert und die eine niedrige Verzerrung in dem Ton liefert, durch den einfachen Prozess durchgeführt werden. Weiterhin wird, da die Prozesse, die die Berechnung des späteren SN-Verhältnisses enthalten, weggelassen werden können, ein Vorteil der Verringerung der verarbeiteten Informationsmenge erhalten.
  • Obgleich bei allen vorbeschriebenen Ausführungsbeispielen 1 bis 9 die Erläuterung durch Verwendung des Maximum-A-posteriori-Verfahrens (MAP-Verbundverfahren) als das Störungsunterdrückungsverfahren erfolgte, können die Ausführungsbeispiele auch auf ein anderes Verfahren angewendet werden (z. B. eine Kurzzeit-Spektralamplituden-Schätzvorrichtung für minimalen statistischen Gesamtfehler). Da die Kurzzeit-Spektralamplituden-Schätzvorrichtung für minimalen statistischen Gesamtfehler im Einzelnen beispielsweise in ”Speech Enhancement Using a Minimum Mean-Square Error Short-Time Spectral Amplitude Estimator” (Y. Ephraim, D. Malah, IEEE Trans. ASSP, Band ASSP-32, Nr. 6, Dez. 1984) beschrieben ist, wird die Erläuterung des Verfahrens nachfolgend weggelassen.
  • Weiterhin ist, obgleich in allen vorbeschriebenen Ausführungsbeispielen 1 bis 9 der Fall eines Schmalband-Telefongesprächs (0 bis 4000 Hz) erläutert wird, die vorliegende Erfindung nicht auf Schmalband-Telefongespräche beschränkt. Beispielsweise kann die vorliegende Erfindung auch auf akustische Signale wie Breitband-Telefongespräche, wie Telefongespräche, die innerhalb eines Bereichs von 0 bis 8000 Hz liegen, und Musikstücke angewendet werden.
  • Weiterhin wird bei allen vorbeschriebenen Ausführungsbeispielen 1 bis 9 das Ausgangssignal, bei dem die Störungsunterdrückung durchgeführt wird, in einer Form digitaler Daten zu einem von verschiedenen Prozessoren für akustischen Ton gesendet, wie einer Tonkodiervorrichtung, einer Spracherkennungsvorrichtung, einer Tonspeichervorrichtung und einer Freisprechvorrichtung. Die Störungsunterdrückungsvorrichtung gemäß einem der Ausführungsbeispiele 1 bis 9 der vorliegenden Erfindung kann einzeln oder über einen DSP (digitalen Signalprozessor) zusammen mit einer der vorgenannten anderen Vorrichtungen realisiert werden oder kann durch Durchführen der Verarbeitung als ein Softwareprogramm realisiert werden. Das Programm kann in einer Speichervorrichtung eines Computers gespeichert werden, der das Softwareprogramm ausführt, oder es kann eine Form haben, in der das Programm über ein Speichermedium, wie eine CD-ROM, verteilt wird. Weiterhin kann das Programm über ein Netzwerk geliefert werden. Zusätzlich zum Senden des Ausgangssignals zu einem von verschiedenen Prozessoren für akustischen Ton kann das Ausgangssignal durch eine Verstärkungsvorrichtung verstärkt werden, nachdem es einer D/A(Digital/Analog)-Umwandlung unterzogen wurde, und kann als ein Tonsignal direkt von einem Lautsprecher oder dergleichen ausgegeben werden.
  • Während die Erfindung anhand ihrer bevorzugten Ausführungsbeispiele beschrieben wurde, ist darauf hinzuweisen, dass zusätzlich zu den vorbeschriebenen Ausführungsbeispielen eine beliebige Kombination von zwei oder mehr Ausführungsbeispielen erfolgen kann, verschiedene Änderungen an einer beliebigen Komponente gemäß irgendeinem der Ausführungsbeispiele vorgenommen werden können und eine beliebige Komponente gemäß irgendeinem der Ausführungsbeispiele innerhalb des Bereichs der Erfindung weggelassen werden kann.
  • GEWERBLICHE ANWENDBARKEIT
  • Wie vorstehend beschrieben ist, ist, da die Störungsunterdrückungsvorrichtung gemäß der vorliegenden Erfindung eine Störungsunterdrückung hoher Qualität durchführen kann, die Störungsunterdrückungsvorrichtung geeignet für eine Verbesserung der Tonqualität eines Sprachkommunikationssystems, wie einer Fahrzeugnavigation, eines Mobiltelefons oder eines Haustelefons, einer Freisprecheinrichtung, eines TV-Konferenzsystems, eines Überwachungssystems und so weiter, in die jeweils Sprachkommunikation, ein Sprachspeicher und ein Spracherkennungssystem eingeführt sind, und eine Verbesserung der Erkennungsrate des Spracherkennungssystems.
  • ERLÄUTERUNGEN DER BEZUGSZAHLEN
  • 1 Eingangsanschluss, 2 Fourier-Transformationsvorrichtung, 3 Energiespektrum-Berechnungsvorrichtung, 4 Sprach- und Störungsabschnitts-Bestimmungsvorrichtung, 5 Störungsspektrum-Schätzvorrichtung, 6 SN-Verhältnis-Berechnungsvorrichtung, 7, 7a und 7b Wahrscheinlichkeitsdichtefunktions-Steuervorrichtung, 8 Unterdrückungsbetrags-Berechnungsvorrichtung, 9 Spektrumunterdrückungsvorrichtung, 10 Vorrichtung für inverse Fourier-Transformation, 11 Ausgangsanschluss, 71 Berechnungsvorrichtung für zweites SN-Verhältnis, 72 Steuerkoeffizienten-Berechnungsvorrichtung, 73 Periodenkomponenten-Schätzvorrichtung, 74 Gewichtungsfaktor-Berechnungsvorrichtung, 75 Berechnungsvorrichtung für gewichtetes SN-Verhältnis.

Claims (10)

  1. Störungsunterdrückungsvorrichtung, die ein Eingangssignal in der Zeitdomäne in ein Energiespektrum, das ein Signal in der Frequenzdomäne ist, umwandelt, einen Unterdrückungsbetrag für eine Störungsunterdrückung durch Verwendung des Energiespektrums und eines geschätzten Störungsspektrums, das getrennt von dem Eingangssignal geschätzt wurde, berechnet, eine Amplitudenunterdrückung bei dem Energiespektrum entsprechend dem Unterdrückungsbetrag durchführt und das Energiespektrum, bei dem die Amplitudenunterdrückung durchgeführt wurde, in ein Signal in der Zeitdomäne umwandelt, um ein störungsunterdrücktes Signal zu erhalten, wobei die Störungsunterdrückungsvorrichtung eine Wahrscheinlichkeitsdichtefunktions-Steuervorrichtung aufweist, die das Eingangssignal analysiert, um einen ersten Index, der zeigt, ob das Eingangssignal eine Sprache oder eine Störung zu sein scheint, zu berechnen, und die eine Wahrscheinlichkeitsdichtefunktion, die einen Verteilungszustand eines Tons definiert, auf einer Grundlage des ersten Indexes steuert und den Unterdrückungsbetrag durch Verwendung der Wahrscheinlichkeitsdichtefunktion zusätzlich zu dem Energiespektrum und dem geschätzten Störungsspektrum berechnet.
  2. Störungsunterdrückungsvorrichtung nach Anspruch 1, bei der die Wahrscheinlichkeitsdichtefunktions-Steuervorrichtung eine SN-Verhältnis-Berechnungsvorrichtung, die ein SN-Verhältnis für jede Frequenz des Eingangssignals schätzt, und eine Steuerkoeffizienten-Berechnungsvorrichtung, die die Wahrscheinlichkeitsdichtefunktion durch Verwendung des von der SN-Verhältnis-Berechnungsvorrichtung geschätzten SN-Verhältnisses als den ersten Index steuert, enthält.
  3. Störungsunterdrückungsvorrichtung nach Anspruch 2, bei der die Wahrscheinlichkeitsdichtefunktions-Steuervorrichtung eine Berechnungsvorrichtung für ein gewichtetes SN-Verhältnis, die eine Gewichtung des für jede Frequenz geschätzten SN-Verhältnisses auf einer Grundlage eines zweiten Indexes, der zeigt, ob das Eingangssignal eine Sprache oder eine Störung zu sein scheint, durchführt, enthält und die Steuerkoeffizienten-Berechnungsvorrichtung die Wahrscheinlichkeitsdichtefunktion durch Verwendung des von der Berechnungsvorrichtung für ein gewichtetes SN-Verhältnis berechneten, gewichteten SN-Verhältnisses als den ersten Index steuert.
  4. Störungsunterdrückungsvorrichtung nach Anspruch 3, bei der der zweite Index zumindest eines von einem SN-Verhältnis, das durch Verwendung des Energiespektrums und des geschätzten Störungsspektrums des Eingangssignals berechnet wurde, einem Ergebnis der Bestimmung eines Tonabschnitts oder eines Störungsabschnitts, die auf einer Grundlage des Energiespektrums des Eingangssignals durchgeführt wurde, und einem Analyseergebnis des Analysierens einer harmonischen Struktur eines Tons in dem Eingangssignal ist.
  5. Störungsunterdrückungsvorrichtung nach Anspruch 3, bei der die Wahrscheinlichkeitsdichtefunktions-Steuervorrichtung eine Gewichtungsfaktor-Berechnungsvorrichtung hat, die die Intensität der Gewichtung durch die Berechnungsvorrichtung für ein gewichtetes SN-Verhältnis gemäß einem Zustand des Eingangssignals steuert.
  6. Störungsunterdrückungsvorrichtung nach Anspruch 3, bei der die Wahrscheinlichkeitsdichtefunktions-Steuervorrichtung eine Gewichtungsfaktor-Berechnungsvorrichtung enthält, die die Intensität der Gewichtung durch die Berechnungsvorrichtung für ein gewichtetes SN-Verhältnis gemäß einer Frequenz steuert.
  7. Störungsunterdrückungsvorrichtung nach Anspruch 1, bei der die Wahrscheinlichkeitsdichtefunktions-Steuervorrichtung eine Periodenkomponenten-Schätzvorrichtung, die eine harmonische Struktur eines Tons in dem Eingangssignal analysiert, und eine Steuerkoeffizienten-Berechnungsvorrichtung, die die Wahrscheinlichkeitsdichtefunktion durch Verwendung eines Ergebnisses der Analyse durch die Periodenkomponenten-Schätzvorrichtung als den ersten Index steuert, enthält.
  8. Störungsunterdrückungsvorrichtung nach Anspruch 4, bei der der zweite Index durch Verwendung einer Signalkomponente, die in dem Eingangssignal enthalten ist, in einem Frequenzband, in welchem das SN-Verhältnis höher als ein vorbestimmter Schwellenwert ist, berechnet wird.
  9. Störungsunterdrückungsvorrichtung nach Anspruch 3, bei der die Wahrscheinlichkeitsdichtefunktions-Steuervorrichtung eine Periodenkomponenten-Schätzvorrichtung, die eine harmonische Struktur eines Tons in dem Eingangssignal analysiert, enthält und die Berechnungsvorrichtung für ein gewichtetes SN-Verhältnis ein Ergebnis der Analyse durch die Periodenkomponenten-Schätzvorrichtung als den zweiten Index verwendet, um zumindest eine von einer Gewichtung, die derart erfolgt, dass ein SN-Verhältnis einer Spitze des Energiespektrums des Eingangssignals erhöht wird, und einer Gewichtung, die derart erfolgt, dass ein SN-Verhältnis eines Tals des Energiespektrums verringert wird, durchzuführen.
  10. Störungsunterdrückungsvorrichtung nach Anspruch 2, bei der die Steuerkoeffizienten-Berechnungsvorrichtung ein durchschnittliches SN-Verhältnis in einem vorbestimmten Frequenzband verwendet, um die Wahrscheinlichkeitsdichtefunktion kollektiv für das Frequenzband zu steuern.
DE112012005855.0T 2012-02-10 2012-02-10 Störungsunterdrückungsvorrichtung Active DE112012005855B4 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2012/000914 WO2013118192A1 (ja) 2012-02-10 2012-02-10 雑音抑圧装置

Publications (2)

Publication Number Publication Date
DE112012005855T5 true DE112012005855T5 (de) 2014-10-30
DE112012005855B4 DE112012005855B4 (de) 2021-07-08

Family

ID=48947005

Family Applications (1)

Application Number Title Priority Date Filing Date
DE112012005855.0T Active DE112012005855B4 (de) 2012-02-10 2012-02-10 Störungsunterdrückungsvorrichtung

Country Status (5)

Country Link
US (1) US20140316775A1 (de)
JP (1) JP5875609B2 (de)
CN (1) CN104067339B (de)
DE (1) DE112012005855B4 (de)
WO (1) WO2013118192A1 (de)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6339896B2 (ja) * 2013-12-27 2018-06-06 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 雑音抑圧装置および雑音抑圧方法
CN104916292B (zh) 2014-03-12 2017-05-24 华为技术有限公司 检测音频信号的方法和装置
CN105336344B (zh) * 2014-07-10 2019-08-20 华为技术有限公司 杂音检测方法和装置
JP6261749B2 (ja) * 2014-09-10 2018-01-17 三菱電機株式会社 雑音抑圧装置、雑音抑圧方法および雑音抑圧プログラム
JPWO2016092837A1 (ja) * 2014-12-10 2017-09-28 日本電気株式会社 音声処理装置、雑音抑圧装置、音声処理方法およびプログラム
JP6602406B2 (ja) 2015-06-30 2019-11-06 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン データベースを生成するための方法および装置
CN105989850B (zh) * 2016-06-29 2019-06-11 北京捷通华声科技股份有限公司 一种回声对消方法及装置
US10771631B2 (en) * 2016-08-03 2020-09-08 Dolby Laboratories Licensing Corporation State-based endpoint conference interaction
JP7000773B2 (ja) 2017-09-27 2022-01-19 富士通株式会社 音声処理プログラム、音声処理方法および音声処理装置
US10043530B1 (en) 2018-02-08 2018-08-07 Omnivision Technologies, Inc. Method and audio noise suppressor using nonlinear gain smoothing for reduced musical artifacts
US10043531B1 (en) * 2018-02-08 2018-08-07 Omnivision Technologies, Inc. Method and audio noise suppressor using MinMax follower to estimate noise
US10785085B2 (en) * 2019-01-15 2020-09-22 Nokia Technologies Oy Probabilistic shaping for physical layer design
US11270720B2 (en) * 2019-12-30 2022-03-08 Texas Instruments Incorporated Background noise estimation and voice activity detection system
CN111986691B (zh) * 2020-09-04 2024-02-02 腾讯科技(深圳)有限公司 音频处理方法、装置、计算机设备及存储介质
CN112309418B (zh) * 2020-10-30 2023-06-27 出门问问(苏州)信息科技有限公司 一种抑制风噪声的方法及装置
CN114385977B (zh) * 2021-12-13 2024-05-28 广州方硅信息技术有限公司 信号的有效频率检测方法、终端设备及存储介质
CN116756597B (zh) * 2023-08-16 2023-11-14 山东泰开电力电子有限公司 基于人工智能的风电机组谐波数据实时监测方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002149200A (ja) * 2000-08-31 2002-05-24 Matsushita Electric Ind Co Ltd 音声処理装置及び音声処理方法
JP4542790B2 (ja) * 2004-01-16 2010-09-15 株式会社東芝 ノイズサプレッサ及びノイズサプレッサを備えた音声通信装置
US7649988B2 (en) * 2004-06-15 2010-01-19 Acoustic Technologies, Inc. Comfort noise generator using modified Doblinger noise estimate
JP4617497B2 (ja) * 2005-07-01 2011-01-26 株式会社国際電気通信基礎技術研究所 雑音抑圧装置、コンピュータプログラム、及び音声認識システム
JP5152799B2 (ja) * 2008-07-09 2013-02-27 国立大学法人 奈良先端科学技術大学院大学 雑音抑圧装置およびプログラム
EP2144233A3 (de) * 2008-07-09 2013-09-11 Yamaha Corporation Rauschunterdrückungsschätzungsvorrichtung und Rauschunterdrückungsvorrichtung
CN101814290A (zh) * 2009-02-25 2010-08-25 三星电子株式会社 增强语音识别系统稳健性的方法
JP5713818B2 (ja) * 2011-06-27 2015-05-07 日本電信電話株式会社 雑音抑圧装置、方法及びプログラム
JP5942388B2 (ja) * 2011-09-07 2016-06-29 ヤマハ株式会社 雑音抑圧用係数設定装置、雑音抑圧装置および雑音抑圧用係数設定方法

Also Published As

Publication number Publication date
US20140316775A1 (en) 2014-10-23
CN104067339A (zh) 2014-09-24
DE112012005855B4 (de) 2021-07-08
JP5875609B2 (ja) 2016-03-02
WO2013118192A1 (ja) 2013-08-15
JPWO2013118192A1 (ja) 2015-05-11
CN104067339B (zh) 2016-05-25

Similar Documents

Publication Publication Date Title
DE112012005855B4 (de) Störungsunterdrückungsvorrichtung
DE112010005895B4 (de) Störungsunterdrückungsvorrichtung
DE112011105791B4 (de) Störungsunterdrückungsvorrichtung
DE112011104737B4 (de) Geräuschunterdrückungsvorrichtung
DE112012000052B4 (de) Verfahren und Vorrichtung zum Ausblenden von Windgeräuschen
DE102014100407B4 (de) Geräuschminderungsvorrichtungen und Geräuschminderungsverfahren
DE112009000805B4 (de) Rauschreduktion
DE602005000539T2 (de) Verstärkungsgesteuerte Geräuschunterdrückung
DE112012006876B4 (de) Verfahren und Sprachsignal-Verarbeitungssystem zur formantabhängigen Sprachsignalverstärkung
DE60009206T2 (de) Rauschunterdrückung mittels spektraler Subtraktion
DE60131639T2 (de) Vorrichtungen und Verfahren zur Bestimmung von Leistungswerten für die Geräuschunterdrückung für ein Sprachkommunikationssystem
DE112016006218B4 (de) Schallsignal-Verbesserungsvorrichtung
DE112016004161T5 (de) Mikrofonsignalzusammenführung
DE69627580T2 (de) Verfahren zur Rauschverminderung in einem Sprachsignal
DE112017004548T5 (de) Robuste Geräuschschätzung für Sprachverbesserung in variablen Geräuschbedingungen
DE112017007005B4 (de) Akustiksignal-verarbeitungsvorrichtung, akustiksignalverarbeitungsverfahren und freisprech-kommunikationsvorrichtung
DE112014000945B4 (de) Sprachbetonungsgerät
DE102013111784B4 (de) Audioverarbeitungsvorrichtungen und audioverarbeitungsverfahren
WO1998003965A1 (de) Verfahren zur verringerung von störungen eines sprachsignals
DE112011105908B4 (de) Verfahren und Gerät zur adaptiven Regelung des Toneffekts
DE112011106045B4 (de) Audiosignal-Wiederherstellungsvorrichtung und Audiosignal-Wiederherstellungsverfahren
DE102014221528B4 (de) Akkurate Vorwärts-SNR-Schätzung basierend auf MMSE-Sprachpräsenzwahrscheinlichkeit
DE112014006281T5 (de) Tonsammelvorrichtung, Korrekturverfahren für Eingangssignal von Tonsammelvorrichtung und Mobilgeräte-Informationssystem
DE10137348A1 (de) Verfahren und Schaltungsanordnung zur Geräuschreduktion bei der Sprachübertragung in Kommunikationssystemen
DE3230391C2 (de)

Legal Events

Date Code Title Description
R012 Request for examination validly filed
R084 Declaration of willingness to licence
R016 Response to examination communication
R016 Response to examination communication
R018 Grant decision by examination section/examining division
R020 Patent grant now final