DE112011105791B4 - Störungsunterdrückungsvorrichtung - Google Patents

Störungsunterdrückungsvorrichtung Download PDF

Info

Publication number
DE112011105791B4
DE112011105791B4 DE112011105791.1T DE112011105791T DE112011105791B4 DE 112011105791 B4 DE112011105791 B4 DE 112011105791B4 DE 112011105791 T DE112011105791 T DE 112011105791T DE 112011105791 B4 DE112011105791 B4 DE 112011105791B4
Authority
DE
Germany
Prior art keywords
energy spectrum
spectrum
noise
energy
composite
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
DE112011105791.1T
Other languages
English (en)
Other versions
DE112011105791T5 (de
Inventor
c/o MITSUBISHI ELECTRIC CORPORAT Furuta Satoru
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Publication of DE112011105791T5 publication Critical patent/DE112011105791T5/de
Application granted granted Critical
Publication of DE112011105791B4 publication Critical patent/DE112011105791B4/de
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/16Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

Störungsunterdrückungsvorrichtung, welche aufweist:
eine Fourier-Transformationsvorrichtung (3, 4), die mehrere in diese eingegebene Eingangssignale in einer Zeitdomäne in Spektralkomponenten, die Signale in einer Frequenzdomäne sind, transformiert;
eine Energiespektrum-Berechnungsvorrichtung (5, 6), die Energiespektren aus den Spektralkomponenten, die durch die Fourier-Transformationsvorrichtung (3, 4) transformiert wurden, berechnet;
eine Eingangssignal-Analysiervorrichtung (8), die eine harmonische Struktur und Periodizität der Eingangssignale auf Grundlage der von der Energiespektrum-Berechnungsvorrichtung (5, 6) berechneten Energiespektren analysiert;
einen Energiespektrumsynthetisierer (9), der eine Synthese anhand der Energiespektren der mehreren Eingangssignale gemäß einem Ergebnis der Analyse durch die Eingangssignal-Analysiervorrichtung (8) durchführt, um ein zusammengesetztes Energiespektrum zu erzeugen;
eine Störungsunterdrückungsbetrags-Berechnungsvorrichtung (10), die einen Betrag der Störungsunterdrückung auf Grundlage des von dem Energiespektrumsynthetisierer (9) erzeugten zusammengesetzten Energiespektrums und eines anhand der Eingangssignale geschätzten Störungsspektrums berechnet;
eine Energiespektrum-Unterdrückungsvorrichtung (11), die eine Störungsunterdrückung bei dem von dem Energiespektrumsynthetisierer (9) erzeugten zusammengesetzten Energiespektrum durchführt durch Verwendung des von der Störungsunterdrückungsbetrags-Berechnungsvorrichtung (10) berechneten Betrags der Störungsunterdrückung; und
eine inverse Fourier-Transformationsvorrichtung (12), die das zusammengesetzte Energiespektrum, bei dem die Störungsunterdrückung von der Energiespektrum-Unterdrückungsvorrichtung (11) durchgeführt wurde, in ein Signal in einer Zeitdomäne transformiert und dieses Signal als ein Tonsignal ausgibt.

Description

  • GEBIET DER ERFINDUNG
  • Die vorliegende Erfindung bezieht sich auf eine Störungsunterdrückungsvorrichtung, die in ein Eingangssignal gemischte Hintergrundstörungen unterdrückt und die für eine Verbesserung der Tonqualität eines Sprachkommunikationssystems verwendet wird, wie eine Fahrzeugnavigation, ein Mobiltelefon, ein Fernsehtelefon oder ein Interphon, ein Freisprechsystem, ein TV-Konferenzsystem, ein Überwachungssystem usw., in das beispielsweise Sprachkommunikationen, eine Sprachspeicherung und ein Spracherkennungssystem eingeführt sind, sowie eine Verbesserung der Erkennungsrate eines Sp racherken n u ngssystems.
  • HINTERGRUND DER ERFINDUNG
  • Da eine digitale Signalverarbeitungstechnologie in den letzten Jahren Fortschritte gemacht hat, wurden eine Operation des Durchführens eines externen Anrufs unter Verwendung eines Mobiltelefons, eine Operation des Durchführens eines Freisprechanrufs in einem Fahrzeug und eine Freisprechoperation unter Verwendung einer Spracherkennung sehr verbreitet. Da diese Vorrichtungen in vielen Fällen in einem Umfeld mit einem hohen Störpegel verwendet werden, werden auch Hintergrundstörungen zusammen mit einer Sprache in ein Mikrofon eingegeben, und dieses bewirkt eine Verschlechterung der Sprache, eine Herabsetzung der Spracherkennungsrate und so weiter. Daher wird, um eine bequeme Sprachkommunikation und eine Spracherkennung hoher Genauigkeit zu realisieren, eine Störungsunterdrückungsvorrichtung, die in ein Eingangssignal gemischte Hintergrundstörungen unterdrückt, benötigt.
  • Als ein herkömmliches Störungsunterdrückungsverfahren gibt es beispielsweise ein Verfahren des Transformierens eines Eingangssignals in einer Zeitdomäne in ein Energiespektrum, das ein Signal in einer Frequenzdomäne ist, des Berechnens eines Unterdrückungsbetrags für eine Störungsunterdrückung durch Verwendung des Energiespektrums des Eingangssignals und eines geschätzten Störungsspektrums, das getrennt von dem Eingangssignal geschätzt wird, des Durchführens einer Amplitudenunterdrückung bei dem Energiespektrum des Eingangssignals durch Verwendung des erhaltenen Unterdrückungsbetrags und des Transformierens des Energiespektrums, bei dem die Amplitudenunterdrückung durchgeführt wurde, und eines Phasenspektrums des Eingangssignals in Signale in einer Zeitdomäne, um ein Störungsunterdrückungssignal zu erhalten (siehe Nichtpatentdokument 1).
  • Während der Unterdrückungsbetrag auf der Grundlage des Verhältnisses (nachfolgend als SN-Verhältnis (Störungsabstand) bezeichnet) zwischen dem Energiespektrum der Sprache und dem geschätzten Störungsenergiespektrum gemäß diesem herkömmlichen Störungsunterdrückungsverfahren berechnet wird, kann der Unterdrückungsbetrag nicht korrekt berechnet werden, wenn der Wert des Verhältnisses negativ ist (ausgedrückt in Dezibel). Beispielsweise wird in einem Sprachsignal, dem Störungen mit großer Energie in einem Niedrigfrequenzbereich hiervon und die auftreten, wenn ein Fahrzeug fährt, überlagert werden, eine Niedrigfrequenzkomponente der Sprache in den Störungen vergraben, und daher wird das SN-Verhältnis negativ. Ein Problem besteht darin, dass dies zu einer übermäßigen Unterdrückung der Niedrigfrequenzkomponente des Sprachsignals führt, und daher zu einer Verschlechterung der Sprachqualität.
  • Um das vorbeschriebene Problem zu lösen, offenbart als ein Verfahren zum effizienten Herausziehen eines Sprachsignals, das ein Objektsignal ist, durch Verwendung mehrerer Mikrofone (Mikrofonfeld), wodurch eine Störungsunterdrückung hoher Qualität selbst unter Bedingungen mit hohem Störungspegel realisiert wird, beispielsweise das Nichtpatentdokument 2 ein Strahlenbündelungsverfahren, und das Patentdokument 1 offenbart eine Sprachsammelvorrichtung mit einer Funktion des Herausziehens eines Objektsignals.
  • Gemäß dem Nichtpatentdokument 2 verwendet eine Vorrichtung zum Unterdrücken von Störungen mit hoher Qualität Rauminformationen wie eine Phasendifferenz, die auftritt, wenn ein Objektsignal von einer Tonquelle jedes von Mikrofonen erreicht, um Signale von den Mikrofonen zusammenzusetzen und das Objektsignal zu vergrößern, wodurch das SN-Verhältnis zwischen dem Sprachsignal, das das Objektsignal ist, und Störungen verbessert wird.
  • Weiterhin offenbart das Patentdokument 1 als eine Technologie zum Herausziehen eines Objektsignals in einem Störungsumfeld ein Verfahren des Verwendens einer Differenz in einer Tonfeldverteilung zwischen einem Objektsignal und Störungen, um eine Frequenzkomponente herauszuziehen, in der das Objektsignal auf einer Frequenzachse dominant ist. Das durch dieses Patentdokument 1 offenbarte Verfahren ist der Bedingung unterworfen, dass ein Haupteingangsmikrofon sich nahe der Tonquelle des Objektsignals befindet, und ein Hilfseingangsmikrofon sich an einer von der vorgenannten Tonquelle entfernteren Position als das Haupteingangsmikrofon befindet, und die Extraktion der Frequenzkomponente, in der das Objektsignal dominant ist, wird realisiert, während der Umstand beachtet wird, dass die Charakteristiken einer Pegeldifferenz, die zwischen diesen beiden Mikrofonen auftritt, zwischen den Störungen und dem Objektsignal unterschiedlich sind, wodurch eine Verbesserung der Tonqualität erzielt wird.
  • Die EP 2 546 831 A1 offenbart eine Störungsunterdrückungsvorrichtung, in der die harmonische Struktur eines Eingangssignals bestimmt wird, beispielsweise durch die Bestimmung der Autokorrelation der Energiespektren des Eingangssignals.
  • Aus der US 2011 / 0 103 615 A1 ist eine Störungsunterdrückungsvorrichtung bekannt, in der die harmonische Struktur bzw. Periodizität eines Eingangssignals analysiert und für die Unterscheidung von Sprachsignalen und Störungen verwendet wird.
  • Dokumente des Standes der Technik
  • Patentdokument
  • Patentdokument 1: Veröffentlichung Nr. JP H11 - 259 090 A einer ungeprüften japanischen Patentanmeldung (Seiten 3 - 5 und 1)
  • Nichtpatentdokumente
    • Nichtpatentdokument 1: Y. Ephraim, D. Malah „Speech Enhancement Using a Minimum Mean Square Error Short-Time Spectral Amplitude Estimator", IEEE Trans. ASSP, Band ASSP-32, Nr. 6, Dezember 1984
    • Nichtpatentdokument 2: Y. Kaneda, J. Ohga „Adaptive Microphone-Array System for Noise Reduction", IEEE Trans. ASSP, Band ASSP-34, Nr. 6, Dezember 1986
  • ZUSAMMENFASSUNG DER ERFINDUNG
  • DURCH DIE ERFINDUNG ZU LÖSENDE PROBLEME
  • Ein Problem der herkömmlichen Technologie, die durch das Nichtpatentdokument 2 offenbart ist, besteht darin, dass die herkömmliche Technologie auf der Voraussetzung beruht, dass die Tonquelle (Objektsignal), die erhöht wird, sich an einer Position befindet, die verschieden von der der anderen Tonquelle (Störungen) ist, und wenn das Objektsignal und die Störungen in derselben Richtung existieren, kann das Objektsignal nicht vergrößert werden und daher wird die Wirkung schlechter. Weiterhin besteht ein Problem bei der durch das Patentdokument offenbarten, herkömmlichen Technologie darin, dass, wenn das Objektsignal sowohl in das Hauptmikrofon als auch das Hilfsmikrofon eingegeben wird, wie in dem Fall, dass das Hauptmikrofon und das Hilfsmikrofon nahe beieinander angeordnet sind, es schwierig ist, die Pegeldifferenz zwischen dem Objektsignal und den Störungen zu erfassen, und daher kann keine Verbesserung der Tonqualität erreicht werden.
  • Die vorliegende Erfindung wurde gemacht, um die vorgenannten Probleme zu lösen, und es ist daher eine Aufgabe der vorliegenden Erfindung, eine Störungsunterdrückungsvorrichtung zu schaffen, die eine Störungsunterdrückung hoher Qualität selbst in einem Umfeld mit hohem Störungspegel realisiert.
  • MITTEL ZUM LÖSEN DES PROBLEMS
  • Erfindungsgemäß ist eine Störungsunterdrückungsvorrichtung vorgesehen, die enthält: eine Fourier-Transformationsvorrichtung, die mehrere in diese eingegebene Eingangssignale aus Signalen in einer Zeitdomäne in Spektralkomponenten, die Signale in einer Frequenzdomäne sind, transformiert; eine Energiespektrum-Berechnungsvorrichtung, die Energiespektren aus den Spektralkomponenten, die durch die Fourier-Transformationsvorrichtung transformiert wurden, berechnet; eine Eingangssignal-Analysiervorrichtung, die die harmonische Struktur und die Periodizität der Eingangssignale auf der Grundlage der von der Energiespektrum-Berechnungsvorrichtung berechneten Energiespektren analysiert; eine Energiespektrum-Synthesevorrichtung, die eine Synthese aus den Energiespektren der mehreren Eingangssignale gemäß dem Ergebnis der Analyse durch die Eingangssignal-Analysiervorrichtung durchführt, um ein zusammengesetztes Energiespektrum zu erzeugen; eine Störungsunterdrückungsbetrag-Berechnungsvorrichtung, die einen Betrag der Störungsunterdrückung auf der Grundlage des von der Energiespektrum-Synthesevorrichtung erzeugten zusammengesetzten Energiespektrums und eines aus den Eingangssignalen geschätzten Störungsspektrums berechnet; eine Energiespektrum-Unterdrückungsvorrichtung, die eine Störungsunterdrückung bei dem von der Energiespektrum-Synthesevorrichtung erzeugten, zusammengesetzten Energiespektrum unter Verwendung des von der Störungsunterdrückungsbetrag-Berechnungsvorrichtung berechneten Betrags der Störungsunterdrückung durchführt; und eine inverse Fourier-Transformationsvorrichtung, die das zusammengesetzte Energiespektrum, bei dem die Störungsunterdrückung durch die Energiespektrum-Unterdrückungsvorrichtung durchgeführt wurde, in ein Signal in einer Zeitdomäne transformiert und dieses Signal als ein Tonsignal ausgibt.
  • VORTEILE DER ERFINDUNG
  • Erfindungsgemäß die Störungsunterdrückungsvorrichtung verhindern, dass eine übermäßige Unterdrückung eines Tons durchgeführt wird, und kann eine Störungsunterdrückung hoher Qualität realisieren.
  • Figurenliste
    • 1 ist ein Blockschaltbild, das die Struktur einer Störungsunterdrückungsvorrichtung gemäß dem Ausführungsbeispiel 1 zeigt;
    • 2 ist ein Blockschaltbild, das die Struktur einer Störungsunterdrückungsbetrags-Berechnungsvorrichtung der Störungsunterdrückungsvorrichtung nach Ausführungsbeispiel zeigt;
    • 3 ist eine erläuternde Zeichnung, die eine Analyse einer harmonischen Struktur durch die Störungsunterdrückungsvorrichtung nach dem Ausführungsbeispiel 1 zeigt;
    • 4 ist eine erläuternde Zeichnung, die eine Schätzung einer spektralen Spitze durch die Störungsunterdrückungsvorrichtung nach Ausführungsbeispiel 1 zeigt;
    • 5 ist ein Diagramm, das schematisch einen Operationsfluss der Störungsunterdrückungsvorrichtung nach dem Ausführungsbeispiel 1 zeigt;
    • 6 ist eine erläuternde Zeichnung, die ein Beispiel für ein Ausgangsergebnis der Störungsunterdrückungsvorrichtung nach dem Ausführungsbeispiel 1 zeigt;
    • 7 ist eine erläuternde Zeichnung, die einen gewichteten Durchschnittsbildungsprozess durch eine Störungsunterdrückungsvorrichtung nach dem Ausführungsbeispiel 2 zeigt;
    • 8 ist ein Blockschaltbild, das die Struktur einer Störungsunterdrückungsvorrichtung nach dem Ausführungsbeispiel 4 zeigt;
    • 9 ist ein Blockschaltbild, das die Struktur einer Störungsunterdrückungsvorrichtung nach dem Ausführungsbeispiel 5 zeigt;
    • 10 ist ein Blockschaltbild, das die Struktur einer Störungsunterdrückungsvorrichtung nach dem Ausführungsbeispiel 6 zeigt;
    • 11 ist eine erläuternde Zeichnung, die ein Beispiel für eine Anwendung einer Störungsunterdrückungsvorrichtung nach dem Ausführungsbeispiel 6 zeigt; und
    • 12 ist ein Blockschaltbild, das die Struktur eines Störungsunterdrückungssystems nach dem Ausführungsbeispiel 9 zeigt.
  • AUSFÜHRUNGSBEISPIELE DER ERFINDUNG
  • Nachfolgend werden, um diese Erfindung im Einzelnen zu erläutern, die bevorzugten Ausführungsbeispiele der vorliegenden Erfindung mit Bezug auf die begleitenden Zeichnungen beschrieben.
  • Ausführungsbeispiel 1
  • 1 ist ein Blockschaltbild, das die Struktur einer Störungsunterdrückungsvorrichtung gemäß dem Ausführungsbeispiel 1 zeigt. Die Störungsunterdrückungsvorrichtung 100, mit der ein erstes Mikrofon 1 und ein zweites Mikrofon 2, die Eingangsendgeräte sind, verbunden sind, besteht aus einer ersten Fourier-Transformationsvorrichtung 3, einer zweiten Fourier-Transformationsvorrichtung 4, einer ersten Energiespektrum-Berechnungsvorrichtung 5, einer zweiten Energiespektrum-Berechnungsvorrichtung 6, einer Energiespektrum-Auswahlvorrichtung 7, einer Eingangssignal-Analysiervorrichtung 8, einem Energiespektrumsynthetisierer 9, einer Störungsunterdrückungsbetrags-Berechnungsvorrichtung 10, einer Energiespektrum-Unterdrückungsvorrichtung 11, und einer inversen Fourier-Transformationsvorrichtung 12. Ein Ausgangsendgerät 13 ist als eine nachfolgende Stufe mit der inversen Fourier-Transformationsvorrichtung 12 verbunden.
  • 2 ist ein Blockschaltbild, das die Struktur der Störungsunterdrückungsbetrags-Berechnungsvorrichtung der Störungsunterdrückungsvorrichtung gemäß dem Ausführungsbeispiel 1 zeigt. Wie in 2 gezeigt ist, besteht die Störungsunterdrückungsbetrags-Berechnungsvorrichtung 10 aus einer Ton-/Störungsabschnitts-Bestimmungsvorrichtung 20, einer Störungsspektrum-Schätzvorrichtung 21, einer SN-Verhältnis-Berechnungsvorrichtung 22 und einer Unterdrückungsbetrags-Berechnungsvorrichtung 23.
  • Als Nächstes wird das Prinzip hinter der Operation der Störungsunterdrückungsvorrichtung 100 mit Bezug auf die 1 und 2 erläutert. Bei diesem Ausführungsbeispiel 1 wird aus Gründen der Einfachheit ein Fall der Verwendung von zwei Mikrofonen als Eingangsendgeräten als ein Beispiel erläutert. Zuerst wird, nachdem ein Ton wie eine Sprache oder Musik, der durch das erste und das zweite Mikrofon 1 und 2 erfasst wird, einer A/D(Analog/Digital)-Umwandlung unterzogen wurde, der Ton mit einer vorbestimmten Abtastfrequenz (z.B. 8 kHz) abgetastet und in Teile pro Rahmen (z.B. Teile pro 10 ms) geteilt, und wird dann in die Störungsunterdrückungsvorrichtung 100 eingebeben. Bei diesem Ausführungsbeispiel ist das erste Mikrofon 1 mit der ersten Fourier-Transformationsvorrichtung 3 als ein Mikrofon (Hauptmikrofon), das der Tonquelle des Objektsignals am nächsten ist, verbunden, und gibt ein erstes Eingangssignal x1(t) als ein Hauptmikrofonsignal in die Störungsunterdrückungsvorrichtung ein. Weiterhin ist das zweite Mikrofon 2, als ein anderes Mikrofon (Submikrofon) mit der zweiten Fourier-Transformationsvorrichtung 4 verbunden und gibt ein zweites Eingangssignal x2(t) als ein Signal des Submikrofons in die Störungsunterdrückungsvorrichtung ein. In den Eingangssignalen zeigt t eine Abtastpunktnummer an.
  • Die erste Fourier-Transformationsvorrichtung 3 und die zweite Fourier-Transformationsvorrichtung 4 führen eine identische Operation durch. Nach der Anwendung beispielsweise eines Hanning-Fensters auf die von dem ersten oder dem zweiten Mikrofon 1 oder 2 eingegebenen Eingangssignale und nach dem Durchführen eines Nullfüllprozesses bei den Eingangssignalen, falls dies erforderlich ist, führen die erste und die zweite Fourier-Transformationsvorrichtung eine schnelle 256-Punkt-Fourier-Transformation bei den Signalen gemäß beispielsweise der folgenden Gleichungen (1) durch, um das erste Eingangssignal x1(t) und das zweite Eingangssignal x2(t), die Signale in einer Zeitdomäne sind, in eine erste Spektralkomponente X1(λ, k) und eine zweite Spektralkomponente X2(λ, k) zu transformieren, die jeweils Signale in einer Frequenzdomäne sind. Die erste Fourier-Transformationsvorrichtung gibt die hierdurch erhaltene erste Spektralkomponente X1(λ, k) zu der ersten Energiespektrum-Berechnungsvorrichtung 5 aus, und die zweite Fourier-Transformationsvorrichtung gibt die hierdurch erhaltene zweite Spektralkomponente X2(λ, k) zu der zweiten Energiespektrum-Berechnungsvorrichtung 6 aus. X M ( λ , k ) = FT [ x M ( t ) ] ;  M = 1,2
    Figure DE112011105791B4_0001
    worin X eine Rahmennummer zeigt, wenn das Eingangssignal in Teile pro Rahmen geteilt wird, k eine Nummer zeigt, die eine Frequenzkomponente in einem Frequenzband eines Spektrums spezifiziert (nachfolgend als Spektrumnummer bezeichnet), und M eine Nummer zeigt, die ein Mikrofon spezifiziert, und FT[ · ] den Fourier-Transformationsprozess zeigt. Da die Fourier-Transformation ein bekanntes Verfahren ist, wird die Erläuterung der Fourier-Transformation nachfolgend weggelassen.
  • Di erste Energiespektrum-Berechnungsvorrichtung 5 und die zweite Energiespektrum-Berechnungsvorrichtung 6 führen eine identische Operation durch. Die erste und die zweite Energiespektrum-Berechnungsvorrichtung erhalten ein erstes Energiespektrum Y1(λ, k) und ein zweites Energiespektrum Y2(λ, k) aus den Spektralkomponenten XM(λ, k) der Eingangssignale jeweils durch Verwendung der Gleichung (2), die nachfolgend gezeigt wird. Die erste Energiespektrum-Berechnungsvorrichtung gibt das hierdurch erhaltene erste Energiespektrum Y1(λ, k) zu der Energiespektrum-Auswahlvorrichtung 7, die Eingangssignal-Analysiervorrichtung 8 und den Energiespektrumsynthetisierer 9 aus. Die zweite Energiespektrum-Berechnungsvorrichtung gibt das zweite Energiespektrum Y2(λ, k) zu der Energiespektrum-Auswahlvorrichtung 7 und die Eingangssignal-Analysiervorrichtung 8 aus. Die erste Energiespektrum-Berechnungsvorrichtung 5 berechnet auch aus der ersten Spektralkomponente X1(λ, k) ein Phasenspektrum θ1(λ, k), das die Phasenkomponente der ersten Spektralkomponente ist, durch Verwendung der Gleichung (3), die nachfolgend gezeigt wird, und gibt das Phasenspektrum zu der inversen Fourier-Transformationsvorrichtung 12 aus, die nachfolgend erwähnt wird. Y M ( λ , k ) = Re { X M ( λ , k ) } 2 + Im { X M ( λ , k ) } 2 ; 0 k<128 ,M = 1,2
    Figure DE112011105791B4_0002
    θ 1 ( λ , k ) = tan 1 ( Im { X 1 ( λ , k ) } Re { X 1 ( λ , k ) } ) ; 0 k<128
    Figure DE112011105791B4_0003
    worin Re{XM(λ, k)} und Im {XM(λ, k)} den reellen Teil bzw. den imaginären Teil des Eingangssignalspektrums, bei dem die Fourier-Transformation durchgeführt wird, zeigen.
  • Die Energiespektrum-Auswahlvorrichtung 7 empfängt das erste Energiespektrum Y1(λ, k) und das zweite Energiespektrum Y2(λ, k), vergleicht die Größen des ersten Energiespektrums und des zweiten Energiespektrums miteinander für jede Spektrumnummer durch Verwendung der nächsten Gleichung (4), und wählt das größere von dem ersten und dem zweiten Energiespektrum aus und erzeugt einen Kandidaten für ein zusammengesetztes Energiespektrum Ycand(λ, k). Die Energiespektrum-Auswahlvorrichtung gibt den Kandidaten für das zusammengesetzte Energiespektrum Ycand(λ, k), der hierdurch erzeugt wurde, zu dem Energiespektrumsynthetisierer 9 aus. Y c a n d ( λ , k ) = { A Y 1 ( λ , k ) , wenn Y ˜ 2 ( λ , k ) A Y 1 ( λ , k ) Y ˜ 2 ( λ , k ) , wenn A Y 1 ( λ , k ) > Y ˜ 1 ( λ , k ) > Y 1 ( λ , k ) ; 0 k<128 Y 1 ( λ , k ) , anderenfalls
    Figure DE112011105791B4_0004
  • In dieser Gleichung ist A ein Koeffizient mit einem vorbestimmten positiven Wert und hat die Funktion als ein Begrenzer. Da eine hohe Wahrscheinlichkeit besteht, dass die zweite Energiespektrumkomponente aus Störungen besteht, die andere als das Objektsignal sind, wenn die zweite Energiespektrumkomponente sehr groß im Vergleich mit der ersten Energiespektrumkomponente ist, kann das Einfügen des Begrenzerprozesses wie in Gleichung (4) gezeigt verhindern, dass ein fehlerhafter Ersetzungsprozess durchgeführt wird, und kann daher eine Qualitätsverschlechterung verhindern. Obgleich A = 4,0 bei diesem Ausführungsbeispiel 1 erwünscht ist, kann A angemessen geändert werden entsprechen den Zuständen des Objektssignals und der Störungen.
  • 2(λ, k) in der Gleichung (4) ist in der Weise normiert, dass die Energie des zweiten Energiespektrums gleich der des ersten Energiespektrums wird, und wird gemäß der nachfolgend gezeigten Gleichung (5) berechnet. Y ˜ 2 ( λ , k ) = E ( Y 1 ( λ ) ) E ( Y 2 ( λ ) ) Y 2 ( λ , k )   ; 0 k<128
    Figure DE112011105791B4_0005
    worin E(Y1(λ)) und E(Y2(λ)) eine Energiekomponente des ersten Energiespektrums bzw. eine Energiekomponente des zweiten Energiespektrums sind.
  • Die Eingangssignal-Analysiervorrichtung 8 empfängt das von der ersten Energiespektrum-Berechnungsvorrichtung 5 ausgegebene Energiespektrum Y1(λ, k) und das von der zweiten Energiespektrum-Berechnungsvorrichtung 6 ausgegebene Energiespektrum Y2(λ, k) und berechnet Autokorrelationskoeffizienten als die harmonische Struktur von jedem der Energiespektren und einen Index, der den Grad der Periodizität von jedem der Eingangssignale des gegenwärtigen Rahmens zeigt.
  • Die Analyse der harmonischen Struktur kann durchgeführt werden durch Erfassen von Spitzen der harmonischen Struktur (nachfolgend als Spektralspitzen bezeichnet), die ein Energiespektrum wie beispielsweise in 3 gezeigt, bildet. Genauer gesagt, um eine sehr kleine Spitzenkomponente, die nicht auf die harmonische Struktur bezogen ist, zu entfernen, nachdem beispielsweise ein Wert gleich 20 Prozent des größten Werts des Energiespektrums von jeder Energiespektrumkomponente subtrahiert ist, wird jeder maximale Wert der spektralen Umhüllung des Energiespektrums bestimmt durch Verfolgen des Werts der spektralen Umhüllung, um von einem Niedrigfrequenzbereich aus zu starten. In dem Beispiel des in 3 gezeigten Energiespektrums wird, obgleich ein Tonspektrum und ein Störungsspektrum aus Gründen der Einfachheit unterschiedliche Komponenten sind, ein Störungsspektrum einem Tonspektrum in einem tatsächlichen Eingangssignal überlagert (oder diesem hinzugefügt), und eine Spitze des Tonspektrums mit einer Energie, die kleiner als die des Störungsspektrums ist, kann nicht beobachtet werden.
  • Nachdem eine Suche nach einer spektralen Spitze durchgeführt wurde, wird, wenn ein maximaler Wert des Energiespektrums (dieser Wert entspricht einer spektralen Spitze) für jede Spektrumnummer k gefunden ist, die Periodizitätsinformation pM(λ, k) für die Spektrumnummer auf 1 gesetzt; anderenfalls wird die Periodizitätsinformation pM(λ, k) für die Spektrumnummer auf null gesetzt. Obgleich alle spektralen Spitzen in dem Beispiel nach 3 herausgezogen sind, kann die Extraktion auf ein bestimmtes Frequenzband begrenzt werden, z.B. ein Band mit einem hohen SN-Verhältnis. Als Nächstes werden, wie in 4 gezeigt ist, auf der Grundlage der periodischen Struktur von spektralen Spitzen P1, P2, ..., und P6, die beobachtet werden, Spitzen PS1, PS2, PS3 und PS4 des Tonspektrums, die in dem Störungsspektrum vergraben sind, geschätzt. Genauer gesagt, der Durchschnitt (durchschnittliches Spitzenintervall) der Zyklusintervalle (Spitzenintervalle) der beobachteten spektralen Spitzen wird berechnet, wie beispielsweise in 4 gezeigt ist, und es wird angenommen, dass spektrale Spitzen mit den bestimmten durchschnittlichen Spitzenintervallen in einem Abschnitt existieren, in welchem keine spektrale Spitze beobachtet wird (ein Teil eines Niedrigfrequenzbereichs oder ein Teil eines Hochfrequenzbereichs, in denen der Ton in Störungen vergraben ist), und die Periodizitätsinformation pM(λ, k) der Spektrumnummer wird auf 1 gesetzt. Da es selten ist, dass eine Tonkomponente in einem sehr niedrigen Frequenzband (z.B. einem Band von 120 Hz oder weniger) existiert, ist es möglich, die Periodizitätsinformation pM(λ, k) für das Band nicht auf „1“ zu setzen. Derselbe Prozess kann auch für ein sehr hohes Frequenzband durchgeführt werden. Der vorbeschriebene Prozess wird bei jedem von dem ersten und dem zweiten Energiespektrum durchgeführt, um eine erste Periodizitätsinformation p1(λ, k) und eine zweite Periodizitätsinformation p2(λ, k) für das erste bzw. zweite Energiespektrum zu bestimmen.
  • Als Nächstes werden aus dem ersten Energiespektrum Y1(λ, k) und dem zweiten Energiespektrum Y2(λ, k) ihre jeweiligen normierten Autokorrelationskoeffizienten ρ̃M(λ, τ) bestimmt durch Verwendung der nachfolgend gezeigten Gleichung (6). ρ M ( λ , τ ) = F T [ Y M ( λ , k ) ] ; M = 1,2 ρ ˜ M ( λ , τ ) = ρ M ( λ , τ ) ρ M ( λ ,0 ) : M = 1,2
    Figure DE112011105791B4_0006
    worin τ eine Verzögerungszeit ist und FT[ · ] einen Fourier-Transformationsprozess zeigt. Was beispielsweise erforderlich ist, ist direkt eine schnelle Fourier-Transformation mit der Anzahl von Punkten = 256 durchzuführen, die dieselbe wie die in der vorgenannten Gleichung (1) ist. Da die vorgenannte Gleichung (6) auf dem Wiener-Khintchine-Theorem beruht, wird die Erläuterung der Gleichung nachfolgend weggelassen. Als Nächstes wird ein maximaler Wert ρ̃M_max(λ) des normierten Autokorrelationskoeffizienten berechnet durch Verwendung der nachfolgend gezeigten Gleichung (7). Die Gleichung (7) bedeutet, dass der maximale Wert von ρ̃M(λ, τ) aus dem Bereich 16≤τ≤96 abgerufen wird, und der abgerufene Bereich kann ordnungsgemäß den Typen und den Frequenzcharakteristiken des Objektsignals und der Störungen eingestellt werden. ρ M _ m a x ( λ ) = max [ ρ ˜ M ( λ , τ ) ] ,   16 τ 96,  M = 1,2
    Figure DE112011105791B4_0007
  • Die erste Periodizitätsinformation p1(λ, k) und die zweite Periodizitätsinformation p2(λ, k), die wie vorstehend erhalten werden, und ein maximaler Wert ρ1_max(λ) des ersten Autokorrelationskoeffizienten und ein maximaler Wert ρ2_max(λ) des zweiten Autokorrelationskoeffizienten werden als Eingangssignal-Analyseergebnisse zu dem Energiespektrumsynthetisierer 9 ausgegeben. Weiterhin wird der maximale Wert ρ1_max(λ) des ersten Autokorrelationskoeffizienten auch zu der Störungsunterdrückungsbetrags-Berechnungsvorrichtung 10 ausgegeben. Für die Analyse der harmonischen Struktur und der Periodizität können nicht nur die vorbeschriebene Energiespektrum-Spitzenanalyse und das Autokorrelations-Funktionsverfahren, sondern auch ein bekanntes Verfahren wie eine Cepstrum-Analyse verwendet werden.
  • Der Energiespektrumsynthetisierer 9 setzt ein Energiespektrum aus dem ersten Energiespektrum Y1(λ, k) und dem Kandidaten Ycand(λ, k) des zusammengesetzten Energiespektrums auf der Grundlage der von der Eingangssignal-Analysiervorrichtung 8 ausgegebenen Eingangssignal-Analyseergebnisse durch Verwendung der Gleichung (8) zusammen, wie nachfolgend gezeigt wird, und gibt das zusammengesetzte Energiespektrum (Ysyn(λ, k) aus. Y ˜ s y n ( λ , k ) = { { Y c a n d ( λ , k ) ,wenn  p 1 ( λ , k ) = 1  und  p 2 ( λ , k ) = 1 Y 1 ( λ , k ) , s n r a v e ( λ ) S N R T H ; 0 k < 128 Y 1 ( λ , k ) ,   s n r a v e ( λ ) < S N R T H                        
    Figure DE112011105791B4_0008
  • In dieser Gleichung snrave(λ) ein durchschnittliches SN-Verhältnis (Durchschnitt von Subband-SN-Verhältnissen) des gegenwärtigen Rahmens, das aus den Subband-SN-Verhältnissen snrab(λ), die von der nachfolgend beschriebenen Störungsunterbetrags-Berechnungsvorrichtung 10 ausgegeben wurden, berechnet ist, und kann gemäß der nachfolgend gezeigten Gleichung (9) berechnet werden. Weiterhin zeigt SNRTH einen vorbestimmten konstanten Schwellenwert. Wenn der Durchschnitt snrave(λ) der Subband-SN-Verhältnisse kleiner als SNRTH ist, besteht eine hohe Wahrscheinlichkeit, dass der gegenwärtige Rahmen ein Störungsabschnitt ist, und dies bedeutet, dass ein Synthetisiervorgang, der den Kandidaten Ycand(λ, k) des zusammengesetzten Energiespektrums verwendet, nicht durchgeführt wird. Genauer gesagt, für einen Störungsabschnitt wird kein Ersetzungsprozess unter Verwendung des Kandidaten für das zusammengesetzte Energiespektrum durchgeführt, und das erste Energiespektrum wird so wie es ist als ein zusammengesetztes Spektrum ausgegeben, wodurch es möglich ist, die Durchführung jeglichen unnötigen Energiespektrum-Synthetisierungsprozesses zu verhindern, und daher möglich ist, eine Qualitätsverschlechterung (z.B. eine Störungspegelerhöhung und Hinzufügung eines unnötigen Störungssignals) zu verhindern. Obgleich SNRTH = 6 (dB) bei diesem Ausführungsbeispiel 1 bevorzugt ist, kann SNRTH ordnungsgemäß geändert werden gemäß den Zuständen und den Frequenzcharakteristiken des Objektsignals und der Störungen. s n r a v e ( λ ) = 1 128 k = 0 127 s n r s h ( λ , k )
    Figure DE112011105791B4_0009
  • Weiterhin ist, obgleich der Prozess des Ersetzens einer Energiespektrumkomponente unter Verwendung sowohl der ersten Periodizitätsinformation p1(λ, k) als auch der zweiten Periodizitätsinformation p2(λ, k) zu der Zeit des Zusammensetzens der Energiespektren gemäß der vorstehenden Gleichung (8) durchgeführt wird, ist der Ersetzungsprozess nicht auf dieses Beispiel beschränkt. Beispielsweise kann nur die erste Periodizitätsinformation p1(λ, k) alternativ in dem Ersetzungsprozess verwendet werden, oder nur die zweite Periodizitätsinformation p2(λ, k) kann alternativ in dem Ersetzungsprozess verwendet werden. Dieses Beispiel ist besonders effektiv, wenn die Tonquelle des Objektsignals näher an einem der Mikrofone ist. Beispielsweise kann ein Prozess des Umschaltens zwischen den Stücken von Periodizitätsinformationen gemäß dem Abstand zwischen einem Mikrofon und dem Objektsignal, wie ein Prozess des Durchführens einer Energiespektrumsynthese durch Verwendung der ersten Periodizitätsinformation p1(λ, k), wenn die Tonquelle des Objektsignals näher an dem ersten Mikrofon ist, durchgeführt werden. Im Gegensatz hierzu kann ein Prozess des Umschaltens zwischen den Stücken von Periodizitätsinformationen auch gemäß dem Abstand zwischen einem Mikrofon und der Tonquelle von Störungen durchgeführt werden, und in diesem Fall kann ein Prozess, der umgekehrt zu dem in dem Fall des Umschaltens auf der Grundlage des Objektsignals ist, durchgeführt werden. Genauer gesagt, wenn die Tonquelle von Störungen sich dem ersten Mikrofon annähert, kann eine Energiespektrumsynthese durch Verwendung der zweiten Periodizitätsinformation p2(λ, k) durchgeführt werden. Als eine Alternative kann entweder die erste Periodizitätsinformation oder die zweite Periodizitätsinformation ordnungsgemäß für jede Frequenz gemäß den Frequenzcharakteristiken oder dergleichen des Objektsignals und der Störungen verwendet werden. Beispielsweise wird die erste Periodizitätsinformation für ein Niedrigfrequenzband von 500 Hz oder weniger verwendet, während die zweite Periodizitätsinformation für ein Frequenzband verwendet wird, das höher als das Niedrigfrequenzband ist. Wie vorstehend erwähnt ist, kann eine bessere Störungsunterdrückung durchgeführt werden, indem die Periodizitätsinformation verwendet wird, die das Ergebnis des Analysierens des Zustands des Objektsignals mit einem höheren Genauigkeitsgrad für die Energiespektrumsynthese ist.
  • 5 zeigt schematisch einen Fluss einer Reihe von Operationen, die von der ersten Energiespektrum-Berechnungsvorrichtung 5 und der zweiten Energiespektrum-Berechnungsvorrichtung 6, der Energiespektrum-Auswahlvorrichtung 7, der Eingangssignal-Analysiervorrichtung 8 und dem Energiespektrumsynthetisierer 9 durchgeführt werden, als eine ergänzende Erläuterung der Operation von jeder der vorgenannten strukturellen Komponenten.
  • Die Störungsunterdrückungsbetrags-Berechnungsvorrichtung 10 empfängt das zusammengesetzte Energiespektrum Ysyn(λ, k) und berechnet einen Betrag der Störungsunterdrückung und gibt diesen Betrag der Störungsunterdrückung zu der Energiespektrum-Unterdrückungsvorrichtung 11 aus. Nachfolgend wird die innere Struktur der Störungsunterdrückungsbetrags-Berechnungsvorrichtung 10 unter Verwendung von 2 erläutert.
  • Die Ton-/Störungsabschnitts-Bestimmungseinheit 20 empfängt das von dem Energiespektrumsynthetisierer 9 ausgegebene zusammengesetzte Energiespektrum Ysyn(λ, k), den von der Eingangssignal-Analysiervorrichtung 8 ausgegebenen maximalen Wert ρ1_max(λ) der ersten Autokorrelationsfunktion, und ein geschätztes Störungsspektrum N(λ, k), das von der Störungsspektrum-Schätzvorrichtung 21, die nachfolgend erläutert wird, ausgegeben wurde, bestimmt, ob jedes Eingangssignal des gegenwärtigen Rahmens ein Ton oder Störungen sind, und gibt das Ergebnis der Bestimmung als ein Bestimmungskennzeichen aus. Bei einem Verfahren des Bestimmens, ob jedes Eingangssignal des gegenwärtigen Rahmens ein Ton- oder Störungsabschnitt ist, bestimmt, wenn einer oder beiden der nachfolgenden Gleichungen (10) und (11) genügt ist, die Ton-/Störungsabschnitt-Bestimmungseinheit, dass jedes Eingangssignal des gegenwärtigen Rahmens ein Ton ist, und setzt das Bestimmungskennzeichen Vflag auf „1 (Ton)“, anderenfalls bestimmt die Ton-/Störungsabschnitts-Bestimmungseinheit, dass jedes Eingangssignal des gegenwärtigen Rahmens Störungen sind, und setzt das Bestimmungskennzeichen Vflag auf „0 (Störungen)“. V f l a g = { 1 ;   w e n n   20 log 10 ( S p o w / N p o w ) > T H F R _ S N 0 ;   w e n n   20 log 10 ( S p o w / N p o w ) T H F R _ S N
    Figure DE112011105791B4_0010
    w o r i n   S p o w = k = 0 127 Y s y n ( λ , k ) ,   N p o w = k = 0 127 N ( λ , k ) V f l a g = { 1   ;   i f   ρ 1 _ m a x ( λ ) > T H A C F 0 ;   i f   ρ 1 _ m a x ( λ ) T H A C F
    Figure DE112011105791B4_0011
    In der Gleichung (10) zeigt N(λ, k) das geschätzte Störungsspektrum, und Spow und Npow zeigen die Gesamtsumme von zusammengesetzten Energiespektren bzw. die Gesamtsumme von geschätzten Störungsspektren. Weiterhin zeigen THFR_SN und THACF jeweils vorbestimmte konstante Schwellenwerte für die Bestimmung. Bei einem bevorzugten Beispiel sind THFR_SN = 3 (dB) und THACF = 0,3. Dies kann auch ordnungsgemäß entsprechend dem Zustand des Eingangssignals und dem Störungspegel geändert werden.
  • Bei dem Bestimmungsprozess des Bestimmens, ob jedes Eingangssignal des gegenwärtigen Rahmens ein Ton- oder Störungsabschnitt gemäß diesem Ausführungsbeispiel 1 ist, wird der von der Eingangssignal-Analysiervorrichtung 8 ausgegebene maximale Wert ρ1_max(λ) des ersten Autokorrelationskoeffizienten als ein Parameter verwendet. Als eine Alternative kann beispielsweise durch Verwendung des von dem Energiespektrumsynthetisierer 9 ausgegebenen zusammengesetzten Energiespektrums Ysyn(λ, k) ein maximaler Wert des Autokorrelationskoeffizienten berechnet werden und kann anstelle des maximalen Werts des ersten Autokorrelationskoeffizienten verwendet werden. Da die Wiederberechnung des Autokorrelationskoeffizienten anhand des zusammengesetzten Energiespektrums, in welchem die periodische Struktur des Tons korrigiert ist, die Genauigkeit der Tonabschnittserfassung verbessert, wird ein Vorteil des Verbesserns der nachfolgend genannten Störungsspektrum-Schätzgenauigkeit und damit eine Verbesserung der Qualität der Störungsunterdrückungsvorrichtung erhalten.
  • Die Störungsspektrum-Schätzvorrichtung 21 empfängt das zusammengesetzte Energiespektrum Ysyn(λ, k), das von dem Energiespektrumsynthetisierer 9 ausgegebenen wurde, und das Bestimmungskennzeichen Vflag, das von der Ton-/Störungsabschnitts-Bestimmungseinheit 20 ausgegeben wurde, führt eine Schätzung und eine Aktualisierung eines Störungsspektrums gemäß der nachfolgend gezeigten Gleichung (12) und des Bestimmungskennzeichens Vflag durch gibt das geschätzte Störungsspektrum N(λ, k) aus. N ( λ , k ) = { α N ( λ 1, k ) + ( 1 α ) | Y s y n ( λ , k ) | 2 w e n n   V f l a g = 0 N ( λ 1, k ) w e n n   V f l a g = 1 ; 0 k<128
    Figure DE112011105791B4_0012
  • In dieser Gleichung zeigt N(λ-1, k) das geschätzte Störungsspektrum für den vorhergehenden Rahmen, und wird in einem Speicher wie einem RAM (Speicher mit wahlfreiem Zugriff) in der Störungsspektrum-Schätzvorrichtung 21 gehalten. In dem Fall des Bestimmungskennzeichens Vflag = 0 in der vorstehenden Gleichung (12) wird das geschätzte Störungsspektrum N(λ-1, k) des vorhergehenden Rahmens aktualisiert durch Verwendung des zusammengesetzten Energiespektrums Ysyn(λ, k) und eines Aktualisierungskoeffizienten α, da jedes Eingangssignal des gegenwärtigen Rahmens als Störungen bestimmt wird. Der Aktualisierungskoeffizient α ist eine vorbestimmte Konstante in dem Bereich von 0<α<1. α = 0,95 ist ein bevorzugtes Beispiel. Der Aktualisierungskoeffizient α kann ordnungsgemäß entsprechend dem Zustand des Eingangssignals und dem Störungspegel geändert werden. Demgegenüber ist in dem Fall des Bestimmungskennzeichens Vflag = 1 jedes Eingangssignal des gegenwärtigen Rahmens ein Ton, und das geschätzte Störungsspektrum N(λ-1, k) des vorhergehenden Rahmens wird als das geschätzte Störungsspektrum N(λ, k) des gegenwärtigen Rahmens so wie es ist ausgegeben.
  • Die SN-Verhältnis-Berechnungsvorrichtung 22 berechnet ein späteres SNR und ein früheres SNR für jede spektrale Komponente durch Verwendung des zusammengesetzten Energiespektrums Ysyn(λ, k), das von dem Energiespektrumsynthetisierer 9 ausgegeben wurde, des geschätzten Störungsspektrums N(λ, k), das von der Störungsspektrum-Schätzvorrichtung 21 ausgegeben wurde, und eines Spektrumunterdrückungsbetrags G(λ-1, k) des vorhergehenden Rahmens, das von der Unterdrückungsbetrags-Berechnungsvorrichtung 23 ausgegeben wurde, die später erwähnt wird. Die SN-Verhältnis-Berechnungsvorrichtung kann das spätere SNRγ(λ, k) bestimmen durch Verwendung des zusammengesetzten Energiespektrums Ysyn(λ, k) und des geschätzten Störungsspektrums N(λ, k) gemäß der nachfolgenden Gleichung (13). γ ( λ , k ) = | Y s y n ( λ , k ) | 2 N ( λ , k ) ; 0 k < 128
    Figure DE112011105791B4_0013
  • Die SN-Verhältnis-Berechnungsvorrichtung kann auch das frühere SNRξ(λ, k) bestimmen durch Verwendung des Spektrumunterdrückungsbetrags G(λ-1, k) des vorhergehenden Rahmens und des späteren SNRγ(λ-1, k) des vorhergehenden Rahmens gemäß der nachfolgenden Gleichung (14). ξ ( λ , k ) = δ γ ( λ 1, k ) G 2 ( λ 1, k ) + ( 1 δ ) F [ γ ( λ , k ) 1 ] ; 0 k < 128
    Figure DE112011105791B4_0014
    wobei F [ x ] = { x ,   x > 0 0,   a n d e r e n f a l l s
    Figure DE112011105791B4_0015
  • In dieser Gleichung ist δ eine vorbestimmte Konstante in dem Bereich von 0<δ<1, und δ = 0,98 ist bei diesem Ausführungsbeispiel 1 bevorzugt. Weiterhin bedeutet F[ · ] eine Halbwellengleichrichtung, und setzt das spätere SNR auf null, wenn das spätere SNR ein in Dezibel ausgedrückter negativer Wert ist.
  • Die SN-Verhältnis-Berechnungsvorrichtung gibt das spätere SNRγ(λ, k) und das frühere SNRξ(λ, k), die die SN-Verhältnis-Berechnungsvorrichtung in der vorbeschriebenen Weise erhalten hat, zu der Unterdrückungsgrößen-Berechnungsvorrichtung 23 aus, während sie ein früheres SNRξ(λ, k) als ein SN-Verhältnis für jede spektrale Komponente (Subband-SN-Verhältnis snrsb(λ, k)) zu dem Energiespektrumsynthetisierer 9 ausgibt.
  • Die Unterdrückungsbetrags-Berechnungsvorrichtung 23 berechnet den Spektrumunterdrückungsbetrag G(λ, k), der ein Betrag der Störungsunterdrückung für jedes Spektrum von dem früheren SNRξ(λ, k) und dem späteren SNRγ(λ, k) ist, die von der SN-Verhältnis-Berechnungsvorrichtung 22 ausgegeben werden, und gibt den Spektrumunterdrückungsbetrag zu der Energiespektrum-Unterdrückungsvorrichtung 11 aus.
  • Als ein Verfahren des Berechnens des Spektrumunterdrückungsbetrags G(λ, k) kann beispielsweise ein MAP-Verfahren (Maximum A Posteriori-Verfahren) angewendet werden. Das MAP-Verfahren ist ein Verfahren zum Schätzen des Spektrumunterdrückungsbetrags G(λ, k) durch Annehmen, dass das Störungssignal und das Tonsignal eine Gauß'sche Verteilung haben. Gemäß dem MAP-Verfahren werden ein Größenspektrum und ein Phasenspektrum, die eine Bedingungswahrscheinlichkeits-Dichtefunktion maximieren, bestimmt durch Verwendung der früheren SNRξ(λ, k) und der späteren SNRγ(λ, k) und ihre Werte werden als geschätzte Werte verwendet. Der Spektrumunterdrückungsbetrag kann durch die nachfolgende Gleichung (15) ausgedrückt werden, in der nu und mu, die die Form der Wahrscheinlichkeitsdichtefunktion bestimmen, als Parameter gesetzt sind. Hinsichtlich der Einzelheiten eines Verfahrens zum Bestimmen des Spektrumunterdrückungsbetrags zur Verwendung bei dem MAP-Verfahren wird auf das folgende Dokument 1 Bezug genommen, und die Erläuterung der Einzelheiten des Verfahrens wird nachfolgend weggelassen. G ( λ , k ) = u ( λ , k ) + u 2 ( λ , k ) + ν 2 γ ( λ , k ) u ( λ , k ) = 1 2 μ 4 γ ( λ , k ) ξ ( λ , k )
    Figure DE112011105791B4_0016
  • [Dokument 1]
  • T. Lotter, P. Vary, „Speech Enhancement by MAP Spectral Amplitude Using a Super-Gaussian Speech Model", EURASIP Journal on Applied Signal Processing, Seiten 1110 - 1126, Nr. 7, 2005.
  • Die Energiespektrum-Unterdrückungsvorrichtung 11 führt eine Unterdrückung bei jedem zusammengesetzten Energiespektrum Ysyn(λ, k) gemäß der nachfolgend gezeigten Gleichung (16) durch, um ein Energiespektrum S(λ, k) zu bestimmen, bei dem die Energiespektrum-Unterdrückungsvorrichtung die Störungsunterdrückung durchgeführt hat, und gibt dieses Energiespektrum zu der inversen Fourier-Transformationsvorrichtung 12 aus. S ( λ , k ) = G ( λ , k ) Y s y n ( λ , k ) ;   0 k < 128
    Figure DE112011105791B4_0017
  • Die inverse Fourier-Transformationsvorrichtung 12 empfängt das von der ersten Energiespektrum-Berechnungsvorrichtung 5 ausgegebene Phasenspektrum θ1(λ, k) und das Energiespektrum S(λ, k), bei dem die Störungsunterdrückung durchgeführt ist, und gibt nach der Transformation der Signale in einer Frequenzdomäne in ein Signal in einer Zeitdomäne und der Überlagerung dieses Signals über das Ausgangssignal des vorhergehenden Rahmens, um ein Signal zu erzeugen, dieses Signal von dem Ausgangsanschluss 13 als ein Tonsignal s(t) aus, bei dem die Störungsunterdrückung durchgeführt ist.
  • Weiterhin ist 6 eine erläuternde Zeichnung, die ein Beispiel für das Ausgangsergebnis der Störungsunterdrückungsvorrichtung gemäß diesem Ausführungsbeispiel 1 zeigt, und die schematisch das Spektrum des Ausgangssignals in einem Tonabschnitt zeigt. 6(a) zeigt ein Beispiel für ein Eingangssignalspektrum (nur das erste Energiespektrum). Eine ausgezogene Linie zeigt ein Tonspektrum, und eine gestrichelte Linie zeigt ein Störungsspektrum. In diesem Beispiel sind ein Teil eines Niedrigfrequenzbereichs (Bereich A) und ein Teil eines Hochfrequenzbereichs (Bereich B) in Störungen vergraben, so dass das SN-Verhältnis des Tonspektrums von jedem der Teile, die in den Störungen vergraben sind, nicht geschätzt werden kann, und dieses führt zu einem Faktor der Tonqualitätsverschlechterung.
  • 6(b) zeigt ein Ausgangsergebnis, das durch ein herkömmliches Störungsunterdrückungsverfahren erhalten wird, wenn das in 6(a) gezeigte Spektrum als ein Eingangssignal eingegeben wird, und 6(c) ist ein Diagramm, das das Ausgangsergebnis zeigt, das durch die Störungsunterdrückungsvorrichtung 100 gemäß diesem Ausführungsbeispiel 1 erhalten wird. In jeder der 6(b) und 6(c) zeigt eine ausgezogene Linie ein Ausgangssignalspektrum. Gemäß 6(b) verschwindet die harmonische Struktur eines Tons in Bändern (in einem Bereich A und in einem Bereich B), in denen jeweils der Ton vergraben ist. Im Gegensatz hierzu kann unter Bezugnahme auf 6(c) erkannt werden, dass die harmonische Struktur des Tons in den Bändern (in dem Bereich A und in dem Bereich B) in denen jeweils der Ton vergraben ist, wiedergewonnen ist, und eine gute Störungsunterdrückung wird durchgeführt.
  • Wie vorstehend erwähnt ist, kann, da die Störungsunterdrückungsvorrichtung gemäß diesem Ausführungsbeispiel 1 eine Korrektur in einer solchen Weise vornehmen kann, dass die harmonische Struktur eines Tons auch in einem Band, in welchem der Ton in Störungen vergraben ist, gehalten wird, und das SN-Verhältnis einen negativen Wert hat, und eine Störungsunterdrückung durchführen kann, die Störungsunterdrückungsvorrichtung die Durchführung einer übermäßigen Unterdrückung des Tons verhindern und eine Störungsunterdrückung hoher Qualität durchführen.
  • Weiterhin kann, auch wenn das Tonspektrum des ersten Mikrofons 1, das das Hauptmikrofon ist, in Störungen vergraben ist, die Störungsunterdrückungsvorrichtung gemäß diesem Ausführungsbeispiel 1 eine in den Störungen vergrabene Komponente reproduzieren, indem das Tonspektrum des zweiten Mikrofons 2, das die Eingabe eines anderen Mikrofons ist, verwendet und eine Störungsunterdrückung hoher Qualität durchgeführt wird, die die Durchführung einer übermäßigen Unterdrückung des Tons verhindert.
  • Weiterhin ist, obgleich gemäß der herkömmlichen Tonhöhenverbesserung keine andere Wahl als die Erhöhung harmonischer Komponenten mit einem identischen Grad der Betonung vorliegt, da die Störungsunterdrückungsvorrichtung gemäß diesem Ausführungsbeispiel 1 derart ausgebildet ist, dass sie einen Prozess (Energiespektrumsynthese) des Ersetzens einer spektralen Komponente durch eine spektrale Komponente mit größerer Energie gemäß der harmonischen Struktur des Tons durchführt, eine Tonhöhenzyklus-Verbesserungswirkung gemäß der harmonischen Struktur und der Frequenzcharakteristiken des Tons zu erwarten.
  • Weiterhin kann, da die Störungsunterdrückungsvorrichtung gemäß diesem Ausführungsbeispiel 1 so ausgebildet ist, dass sie einen Prozess des Synthetisierens eines Energiespektrums durch Verwendung eines durchschnittlichen SN-Verhältnisses, das aus dem Energiespektrum eines Eingangssignals und dem geschätzten Störungsspektrum berechnet ist, durchführt, die Störungsunterdrückungsvorrichtung eine unnötige Synthese verhindern, die zu einer Zunahme der Störungen und so weiter in einem Störungsabschnitt und in einem Band, in welchem das SN-Verhältnis niedrig ist, führt, und sie kann eine Störungsunterdrückung höherer Qualität durchführen.
  • Obgleich die Struktur des Durchführens eines Prozesses des Zusammensetzens eines Energiespektrums für etwa alle Bänder in diesem Ausführungsbeispiel 1 gezeigt ist, ist das vorliegende Ausführungsbeispiel nicht auf diese Struktur beschränkt. Die Störungsunterdrückungsvorrichtung kann alternativ in einer solchen Weise ausgebildet sein, dass sie den Zusammensetzungsprozess nur bei einem Niedrigfrequenz- oder Hochfrequenzband durchführt, falls dies erforderlich ist, oder sie kann alternativ in einer solchen Weise ausgebildet sein, dass sie den Zusammensetzungsprozess nur bei einem spezifischen Frequenzband durchführt, wie einem Band im Bereich von 500 Hz bis 800 Hz.
  • Eine derartige Korrektur bei einem bestimmten Frequenzband ist effektiv für die Korrektur eines beispielsweise in einer schmalbandigen Störung begrabenen Tons wie eines Zischtons oder des Tons einer Automobilmaschine.
  • Bei diesem Ausführungsbeispiel 1 wird aus Gründen der Einfachheit der Fall, in welchem die Anzahl von Mikrofonen gleich zwei ist, als ein Beispiel erläutert. Die Anzahl von Mikrofonen ist nicht auf zwei beschränkt und kann ordnungsgemäß geändert werden. Beispielsweise wird in einem Fall, in welchem die Anzahl von Mikrofonen gleich drei oder mehr ist, in der vergleichenden Bewertung, die in 5 gezeigt ist, der Spektralkomponentengrößen durch die Energiespektrum-Auswahlvorrichtung 7 ein Energiespektrum mit einem Maximum ausgewählt und als ein Kandidat für ein zusammengesetztes Energiespektrum bestimmt.
  • Ausführungsbeispiel 2
  • Bei dem vorbeschriebenen Ausführungsbeispiel 1 wird der Prozess des Änderns, ob die Energiespektrumsynthese unter Verwendung der vorgenannten Gleichung (8) durchzuführen ist oder nicht (EIN/AUS), durchgeführt auf der Grundlage eines Vergleichs zwischen dem durchschnittlichen snrave(λ) der Subband-SN-Verhältnisse, das in der vorgenannten Gleichung (9) gezeigt ist, und dem vorbestimmten Schwellenwert SNRTH . Als eine Alternative kann beispielsweise anstelle des Prozesses des Ersetzens einer Spektralkomponente ein Prozess der gewichteten Durchschnittsbildung eines Kandidaten für ein zusammengesetztes Spektrum und eines ersten Energiespektrums durch Verwendung dieses durchschnittlichen snrave(λ) als einen Index, der den Grad der Tonähnlichkeit des Eingangssignals zeigt, durchgeführt werden, als ein Energiespektrum-Synthetisierungsprozess mit einer kontinuierlicheren Änderung, für einen Abschnitt, in welchem ein Tonabschnitt in einen Störungsabschnitt übergeht, und für einen Abschnitt (Übergangsabschnitt), in welchem ein Störungsabschnitt in einen Tonabschnitt übergeht, wie in der nachfolgend gezeigten Gleichung (17) gezeigt ist. In dem Ausführungsbeispiel 2 wird diese Struktur gezeigt. Y ˜ s y n ( λ , k ) = { { Y c a n d ( λ , k ) ,  wenn  F l a g [ p 1 ( λ , k ) , p 2 ( λ , k ) ] = 1 Y 1 ( λ , k ) , s n r a v e ( λ ) > S N R H ( k ) { { 1 B ( λ , k ) } Y 1 ( λ , k ) + B ( λ , k ) Y c a n d ( λ , k ) , Y 1 ( λ , k ) w e n n F l a g [ p 1 ( λ , k ) , p 2 ( λ , k ) ] = 1 SNR H ( k ) s n r a v e ( λ ) > S N R L ( k )     Y 1 ( λ , k ) , S N R L , ( k ) snr ave ( λ ) ;0 k<128                                                                                                       
    Figure DE112011105791B4_0018
  • In dieser Gleichung ist Flag[p1(λ k), p2(λ, k)] eine logische Funktion der Rückführung von „1“, wenn beide Stücke der Periodizitätsinformation p1(λ, k) und p2(λ, k) gleich „1“ sind. Weiterhin ist B(λ, k) eine vorbestimmte Wichtungsfunktion, die als Antwort auf das durchschnittliche snrave(λ) von Subband-SN-Verhältnissen bestimmt ist. Bei diesem Ausführungsbeispiel ist eine Einstellung gemäß der folgenden Gleichung (18) bevorzugt. Weiterhin sind SNRH(k) und SNRL(k) vorbestimmte Schwellenwerte und auf Werte gemäß der Frequenz gesetzt, wie in 7 gezeigt ist. Ein Verfahren des Setzens der Wichtungsfunktion B(λ, k) und der Schwellenwerte SNRH(k) und SNRL(k) kann ordnungsgemäß geändert werden entsprechend den Zuständen und den Frequenzcharakteristiken des Objektsignals und der Störungen. B ( λ , k ) = s n r a v e ( λ ) S N R L S N R H S N R L
    Figure DE112011105791B4_0019
  • Wie vorstehend beschrieben ist, kann, da die Störungsunterdrückungsvorrichtung gemäß diesem Ausführungsbeispiel 2 so ausgebildet ist, dass sie den Prozess der gewichteten Durchschnittsbildung des Kandidaten für ein zusammengesetztes Spektrum und des ersten Energiespektrums durch Verwendung des Index, der den Grad der Tonähnlichkeit des Eingangssignals zeigt, durchführt, als den Energiespektrum-Synthetisierungsprozess mit einer kontinuierlicheren Änderung, für einen Übergangsabschnitt zwischen einem Ton und Störungen, anstelle des Prozess des Ersetzens einer spektralen Komponente, die Störungsunterdrückungsvorrichtung nach diesem Ausführungsbeispiel 2 den Energiespektrum-Synthetisierungsprozess für einen Übergangsbereich durchführen, und sie kann auch eine synergistische Wirkung des Freigebens der Diskontinuität erhalten, die sich aus dem EIN/AUS der Energiespektrumsynthese in einem Abschnitt zwischen einem Tonabschnitt und einem Störungsabschnitt ergibt, während die Störungsunterdrückungsvorrichtung gemäß dem vorbeschriebenen Ausführungsbeispiel 1 nicht den Energiespektrum-Synthesevorgang in einem Übergangsbereich zwischen einem Tonabschnitt und einem Störungsabschnitt durchführen kann.
  • Obgleich die Struktur des Verwendens des durchschnittlichen snrave(λ) der Subband-SN-Verhältnisse als den Index, der den Grad der Tonähnlichkeit des Eingangssignals zeigt, in dem vorbeschriebenen Ausführungsbeispiel 2 gezeigt ist, ist das vorliegende Ausführungsbeispiel nicht auf diese auf die Struktur beschränkt. Beispielsweise kann der Energiespektrum-Syntheseprozess auch gemäß der Korrelationsfähigkeit des Eingangssignals (Störungen gleich niedrige Autokorrelation und Ton = hohe Autokorrelation) gesteuert werden, so wie der maximale Wert ρM_max(λ) des Autokorrelationskoeffizienten, der in der vorstehenden Gleichung (7) gezeigt ist. Genauer gesagt, durch Erhöhen des Verhältnisses des zusammengesetzten Energiespektrums, wenn die Korrelationsfähigkeit hoch ist, und durch Herabsetzen des Verhältnisses des zusammengesetzten Energiespektrums, wenn die Korrelationsfähigkeit niedrig ist, kann derselbe Vorteil erhalten werden.
  • Ausführungsbeispiel 3
  • Obgleich die Struktur des Einstellens des Werts des Begrenzers A auf eine vorbestimmte Konstante in der vorstehenden Gleichung (4) in dem vorbeschriebenen Ausführungsbeispiel 1 gezeigt ist, wird in diesem Ausführungsbeispiel 3 eine Struktur des Umschaltens zwischen zwei oder mehr Konstanten gemäß einem Index, der den Grad der Tonähnlichkeit des Eingangssignals zeigt, zur Verwendung einer als der Wert des Begrenzers ausgewählten Konstanten, oder des Steuerns des Wertes des Begrenzers durch Verwendung einer vorbestimmten Funktion gezeigt. Wenn beispielsweise der maximale Wert ρM_max(λ) des Autokorrelationskoeffizienten in der vorstehenden Gleichung (7) als der Index, der den Grad der Tonähnlichkeit des Eingangssignals zeigt, d.h. ein Steuerfaktor des Zustands des Eingangssignals, groß ist, d.h., wenn die periodische Struktur des Eingangssignals deutlich sichtbar ist (es besteht eine hohe Wahrscheinlichkeit, dass das Eingangssignal ein Ton ist), kann der Wert groß gesetzt werden; anderenfalls kann der Wert klein gesetzt werden. Weiterhin kann der maximale Wert ρM_max(λ) des Autokorrelationskoeffizienten zusammen mit dem Bestimmungskennzeichen Vflag, das von der Ton-/Störungsabschnitt-Bestimmungseinheit 20 ausgegeben wird, verwendet werden, und der Wert kann herabgesetzt werden, wenn das Bestimmungskennzeichen Vflag Störungen anzeigt.
  • Durch Steuern des Wertes der Konstanten des Begrenzers gemäß dem Zustand des Eingangssignals kann die Tonverschlechterung mit einer Zunahme des Werts des Begrenzers verringert werden, wenn eine hohe Wahrscheinlichkeit besteht, dass das Eingangssignal ein Ton ist. Demgegenüber kann, wenn eine hohe Wahrscheinlichkeit besteht, dass das Eingangssignal eine Störung ist, durch Herabsetzen des Werts des Begrenzers das Mischen von Störungen verringert werden, und eine Störungsunterdrückung hoher Qualität kann durchgeführt werden.
  • Weiterhin besteht bei einer Variante dieses Ausführungsbeispiels 3 keine Notwendigkeit, den Begrenzerwert in einer Frequenzrichtung konstant zu machen, und der Begrenzerwert kann für jede Frequenz auf einen unterschiedlichen Wert gesetzt werden. Beispielsweise kann, da ein Ton niedrigerer Frequenz eine „klarere“ harmonische Struktur hat (die Berg/Tal-Struktur seines Spektrums ist unterscheidbar) als eine typische Toncharakteristik, der Wert des Begrenzers als ein großer gesetzt werden und kann mit Zunahme der Frequenz verringert werden.
  • Wie vorstehend beschrieben ist, kann, da die Störungsunterdrückungsvorrichtung gemäß diesem Ausführungsbeispiel 3 so ausgebildet ist, dass sie eine Begrenzersteuerung durchführt, die für jede Frequenz in der Energiespektrumauswahl unterschiedlich ist, die Störungsunterdrückungsvorrichtung eine Energiespektrumauswahl durchführen, die für jede Frequenz eines Tons geeignet ist, und sie kann weiterhin eine Störungsunterdrückung höherer Qualität durchführen.
  • Ausführungsbeispiel 4
  • Obgleich die Struktur des Erfassens aller spektralen Spitzen für die Analyse der harmonischen Struktur in dem vorbeschriebenen Ausführungsbeispiel 1 in der Erläuterung von 3 gezeigt ist, wird eine Struktur des Erfassens spektraler Spitzen nur in einem Band, in welchem Subband-SN-Verhältnisse hoch sind, in diesem Ausführungsbeispiel 4 gezeigt. 8 ist ein Blockschaltbild, das die Struktur einer Störungsunterdrückungsvorrichtung gemäß dem Ausführungsbeispiel 4 zeigt. Die Störungsunterdrückungsvorrichtung 100 gemäß dem Ausführungsbeispiel 4 gibt Subband-SN-Verhältnisse, die von einer SN-Verhältnis-Berechnungsvorrichtung 22, die eine innere strukturelle Komponente der Störungsunterdrückungsbetrags-Berechnungsvorrichtung 10 ist, ausgegeben wurden, in eine Eingangssignal-Analysiervorrichtung 8 ein. Die Eingangssignal-Analysiervorrichtung 8 erfasst spektrale Spitzen nur in einem Band, in welchem ein SN-Verhältnis hoch ist, durch Verwendung der in diese eingegebenen Subband-SN-Verhältnisse.
  • 3 dB sind beispielsweise bevorzugt als ein Schwellenwert, der als ein Dezibelwert ausgedrückt wird, für die Subband-SN-Verhältnisse. Eine spektrale Spitze kann erfasst werden durch Verwendung nur einer Energiespektrumkomponente in einem Band, das diesen Schwellenwert überschreitet. Der Schwellenwert für die Subband-SN-Verhältnisse kann ordnungsgemäß entsprechend den Zuständen und den Frequenzcharakteristiken des Objektsignals und der Störungen geändert werden. In gleicher Weise kann, auch wenn ein Autokorrelationskoeffizient berechnet wird, dieser Autokorrelationskoeffizient nur in einem Band berechnet werden, in welchem Subband-SN-Verhältnisse hoch sind.
  • Wie vorstehend beschrieben ist, kann, da die Störungsunterdrückungsvorrichtung gemäß diesem Ausführungsbeispiel 4 in einer solchen Weise ausgebildet ist, dass die SN-Verhältnis-Berechnungsvorrichtung 22 die von ihr berechneten Subband-SN-Verhältnisse in die Eingangssignal-Analysiervorrichtung eingibt und die Eingangssignal-Analysiervorrichtung 8 die Erfassung von spektralen Spitzen oder die Berechnung eines Autokorrelationskoeffizienten nur in einem Band durchführt, in welchem das SN-Verhältnis hoch ist, durch Verwendung der in diese eingegebenen Subband-SN-Verhältnisse, die Störungsunterdrückungsvorrichtung die Genauigkeit der Erfassung von spektralen Spitzen und den Genauigkeitsgrad, mit dem bestimmt wird, ob das Eingangssignal ein Ton- oder ein Störungsabschnitt ist, verbessern und daher eine Störungsunterdrückung höherer Qualität durchführen.
  • Ausführungsbeispiel 5
  • Obgleich die Struktur des bedingungslosen Auswählens eines Energiespektrumskandidaten, mit Ausnahme des Begrenzerprozesses, durch Verwendung des ersten Energiespektrums und des zweiten Energiespektrums in der vorhergehenden Gleichung (4) in dem vorbeschriebenen Ausführungsbeispiel 1 gezeigt ist, wird eine Struktur des Durchführens eines Ein/AUS-Prozesses, der in der Lage ist, zu wechseln, ob ein Energiespektrum-Auswahlprozess durchzuführen ist oder nicht, in diesem Ausführungsbeispiel 5 gezeigt. 9 ist ein Blockschaltbild, das die Struktur einer Störungsunterdrückungsvorrichtung gemäß dem Ausführungsbeispiel 5 zeigt. Die Störungsunterdrückungsvorrichtung 100 gemäß dem Ausführungsbeispiel 5 gibt einen maximalen Wert ρ2_max(λ) eines zweiten Autokorrelationskoeffizienten, der von einer Eingangssignal-Analysiervorrichtung 8 ausgegeben wurde, in eine Energiespektrum-Auswahlvorrichtung 7 ein. Die Energiespektrum-Auswahlvorrichtung 7 führt einen EIN/AUS-Prozess des Wechselns ob ein Energiespektrum-Auswahlprozess durchzuführen ist oder nicht, auf der Grundlage des in sie eingegebenen maximalen Wert ρ2_max(λ) des zweiten Autokorrelationskoeffizienten durch. Genauer gesagt, wenn der maximale Wert ρ2_max(λ) des zweiten Autokorrelationskoeffizienten kleiner als ein vorbestimmter Schwellenwert ist, bestimmt die Energiespektrum-Auswahlvorrichtung, dass eine hohe Möglichkeit besteht, dass ein zweites Energiespektrum ein Energiespektrum eines Störungssignals ist, überspringt einen Auswahlprozess gemäß der vorstehenden Gleichung (8) und gibt ein erstes Energiespektrum Y1(λ, k) als einen Kandidaten für ein zusammengesetztes Energiespektrum Ycand(λ, k) aus. Während „0,2“ als ein Schwellenwert bevorzugt ist, der verwendet wird, wenn bestimmt wird, ob das zweite Energiespektrum ein Energiespektrum eines Störungssignals ist oder nicht, kann der Schwellenwert ordnungsgemäß entsprechend den Zuständen des Objektsignals und der Störungen, sowie den SN-Verhältnissen geändert werden.
  • Wie vorstehend beschrieben ist, kann, da die Störungsunterdrückungsvorrichtung gemäß diesem Ausführungsbeispiel 5 in einer solchen Weise ausgebildet ist, dass die Energiespektrum-Auswahlvorrichtung 7 einen EIN/AUS-Prozess des Wechselns, ob oder nicht ein Energiespektrumauswahlprozess auf der Basis des maximalen Werts ρ2_max(λ) des in diese eingegebenen zweiten Autokorrelationskoeffizienten durchzuführen ist oder nicht, durchführt, und, wenn geschätzt wird, dass eine hohe Möglichkeit besteht, dass das zweite Energiespektrum ein Energiespektrum eines Störungssignals ist, das zweite Energiespektrum als einen Kandidaten für ein zusammengesetztes Energiespektrum ausgibt, so wie es ist, die Störungsunterdrückungsvorrichtung die Durchführung jeglichen unnötigen Energiespektrum-Synthetisierungsprozesses verhindern, und kann daher eine Qualitätsverschlechterung verhindern (z.B. eine Zunahme eines Störungspegels und eine Hinzufügung eines unnötigen Störungssignals).
  • Ausführungsbeispiel 6
  • In diesem Ausführungsbeispiel 6 wird eine Struktur des Einführens, beispielsweise als eines Vorprozesses, der bei jedem Mikrofon durchgeführt wird, eines Strahlenbündelungsprozesses und des Vorsehens jedes Mikrofons mit Richtwirkung erläutert. 10 ist ein Blockschaltbild, das die Struktur einer Störungsunterdrückungsvorrichtung gemäß diesem Ausführungsbeispiel 6 zeigt. Die Störungsunterdrückungsvorrichtung enthält einen ersten Strahlenbündelungsprozessor 31 und einen zweiten Strahlenbündelungsprozessor 32 zusätzlich zu den Komponenten der Störungsunterdrückungsvorrichtung gemäß dem in 1 gezeigten Ausführungsbeispiel 1. Da die anderen strukturellen Komponenten dieselben sind wie die im Ausführungsbeispiel 1 gezeigt, wird nachfolgend die Erläuterung der strukturellen Komponenten weggelassen.
  • Der erste Strahlenbündelungsprozessor 31 führt einen Strahlenbündelungsprozess durch Verwendung eines ersten Mikrofons 1 und eines zweiten Mikrofons 2 durch, um Eingangssignal mit Richtwirkung zu erhalten, und gibt die Signale zu einer ersten Fourier-Transformationsvorrichtung 3 aus. In gleicher Weise führt der zweite Strahlenbündelungsprozessor 32 einen Strahlenbündelungsprozess durch Verwendung des ersten Mikrofons 1 und des zweiten Mikrofons 2 durch, um die Eingangssignale mit Richtwirkung zu erhalten, und gibt die Signale zu einer zweiten Fourier-Transformationsvorrichtung 4 aus. Ein bekanntes Verfahren, wie ein durch das vorgenannte Nichtpatentdokument 2 offenbartes Verfahren oder ein verzögerungsfreies Antwortverfahren mit minimaler Varianz kann für die Strahlenbündelungsprozesse angewendet werden.
  • 11 ist eine erläuternde Zeichnung, die ein Beispiel für die Anwendung der Störungsunterdrückungsvorrichtung gemäß dem Ausführungsbeispiel 6 zeigt. In dem in 11 gezeigten Beispiel wird ein Telefonanruf unter Verwendung einer Freisprech-Rufvorrichtung, in der die Störungsunterdrückungsvorrichtung 100' auf das erste und das zweite Mikrofon 1 und 2 angewendet wird, gezeigt. In dieser Figur wird ein Fall, in welchem ein Sprecher X auf einem Fahrersitz 201 eines sich bewegenden Objekts 200 sitzt und einen Freisprech-Telefonanruf durch Verwendung des ersten und des zweiten Mikrofons 1 und 2 durchführt, gezeigt. Ein Bereich C zeigt die Richtwirkung der ersten Strahlenbündelungs-Verarbeitungseinheit 31 und wird in einer solchen Weise gesteuert, dass er zu dem Fahrersitz 201 gerichtet ist, um die Sprache des Sprechers X auf dem Fahrersitz 201 zu erhalten, während ein Bereich D die Richtwirkung des zweiten Strahlenbündelungsprozessors 32 zeigt und so gesteuert ist, dass er zu einem Vordersitz 202 gerichtet ist, um die Sprache eines Sprechers auf dem Vordersitz 202 zu erhalten.
  • Der erste Strahlenbündelungsprozessor 31 führt einen Strahlenbündelungsprozess durch durch Verwendung des ersten und zweiten Mikrofons 1 und 2 und gibt die Eingangssignale, die der erste Strahlenbündelungsprozessor verarbeitet hat, zu der ersten Fourier-Transformationsvorrichtung 3 aus. In gleicher Weise führt der zweite Strahlenbündelungsprozessor 32 einen Strahlenbündelungsprozess durch durch Verwendung des ersten und des zweiten Mikrofons 1 und 2 und gibt die Eingangssignale, die der zweite Strahlenbündelungsprozessor verarbeitet hat, zu der zweiten Fourier-Transformationsvorrichtung 4 aus. Bei dem in 11 gezeigten Beispiel bewegt sich eine direkte Welle 201a, die durch eine Äußerung des Sprechers X auf dem Fahrersitz 201 bewirkt wurde, innerhalb des durch die Strahlenbündelung erhaltenen Bereichs C und wird in das erste Mikrofon 1 eingegeben. Weiterhin bewegt sich eine reflektierte und gebeugte Welle 201b, die von der Äußerung des Sprechers X stammt und die durch eine reflektierende Oberfläche 203 wie eine Wand reflektiert wurde, innerhalb des durch die Strahlenbündelung erhaltenen Bereichs D und wird in das zweite Mikrofon 2 eingegeben. Störungen, die außerhalb der Bereiche C und D' existieren, werden nicht in das erste Mikrofon 1 oder das zweite Mikrofon 2 eingegeben und können daher entfernt werden.
  • Während bei einer herkömmlichen Störungsunterdrückungsvorrichtung ein durch die Strahlenbündelung auf der Seite des Vordersitzes 202 erhaltener Ton zu einer Verbesserung der Qualität der Störungsunterdrückungsvorrichtung beitragen kann, kann die Störungsunterdrückungsvorrichtung 100' gemäß diesem Ausführungsbeispiel 6 die Sprache des Sprechers auf dem Fahrersitz 201, die durch die Strahlenbündelung auf der Seite des Vordersitzes 202 als ein Eingangssignal des zweiten Mikrofons 2 erhalten wird, verwenden, und kann daher eine Verbesserung der Qualität der Störungsunterdrückungsvorrichtung erzielen.
  • Obgleich der Fall, bei dem die Strahlenbündelung für jeden der beiden Bereiche: C auf der Seite des Fahrersitzes 201 und D auf der Seite des Vordersitzes 202 durchgeführt wird, in dem vorbeschriebenen Ausführungsbeispiel 6 gezeigt ist, ist das vorliegende Ausführungsbeispiel nicht auf die beiden Bereich beschränkt und kann auch auf drei oder mehr Bereiche angewendet werden. Wenn die Strahlenbündelung für jeden der drei oder mehr Bereiche durchgeführt wird, wird ein Energiespektrum mit einem Maximum ausgewählt und wird als der Kandidat für ein zusammengesetztes Energiespektrum bei der vergleichenden Bewertung der Größen von spektralen Komponenten durch eine Energiespektrum-Auswahlvorrichtung 7 bestimmt.
  • Ausführungsbeispiel 7
  • Obgleich die Struktur des Zusammensetzens eines Energiespektrums auf der Grundlage von Periodizitätsinformationen in einer solchen Weise bei den vorbeschriebenen Ausführungsbeispielen 1 bis 6 gezeigt ist, dass der Ton, der das Objektsignal ist, erhöht wird, kann ein Prozess des Auswählens einer Energiespektrumkomponente mit einem kleinen Wert in einem Tal der Periodizitätsinformationen und des Ersetzens eines Energiespektrums bei diesem Ausführungsbeispiel 7 durchgeführt werden. Bei der Erfassung eines Tals eines Spektrums kann beispielsweise der Durchschnittswert der Spektrumnummern zwischen spektralen Spitzen als ein Tal des Spektrums bestimmt werden.
  • Wie vorstehend beschrieben ist, kann, da die Störungsunterdrückungsvorrichtung gemäß diesem Ausführungsbeispiel 7 so ausgebildet ist, dass sie eine Energiespektrumsynthese in einer solchen Weise durchführt, dass das SN-Verhältnis eines Tals eines Spektrums reduziert wird, die Störungsunterdrückungsvorrichtung bewirken, dass die harmonische Struktur des Tons unterscheidend gemacht wird und sie eine Störungsunterdrückung höherer Qualität durchführen kann.
  • Ausführungsbeispiel 8
  • Obgleich die Struktur des Durchführens des Zusammensetzungsprozesses nur für betroffene spektrale Komponenten in den vorbeschriebenen Ausführungsbeispielen 1 bis 7 gezeigt ist, kann eine spektrale Komponente beispielsweise durch ein Spektrum ersetzt werden, das durch eine gewichtete Bildung des Durchschnitts von benachbarten Periodizitätskomponenten erhalten wurde. Beispielsweise kann der Ersetzungsprozess unter Verwendung der vorstehenden Gleichung (8) oder (17) und eines vorbestimmten Wichtungsfaktors auch bei benachbarten Frequenzkomponenten der Periodizitätsinformationen durchgeführt werden. Wenn die Analysegenauigkeit der harmonischen Struktur sich verschlechtert und die Spektrumspitzenpositionen nicht genau bestimmt werden können, wie wenn der Amplitudenpegel von Störungen hoch ist mit Bezug auf den Amplitudenpegel des Objektsignals (das SN-Verhältnis ist niedrig), kann der Zusammensetzungsprozess des Zusammensetzens eines Energiespektrums durchgeführt werden.
  • Wie vorstehend erwähnt ist, kann, da die Störungsunterdrückungsvorrichtung gemäß diesem Ausführungsbeispiel 8 den Prozess des Ersetzens der Wichtungsfaktoren für benachbarte Frequenzkomponenten einer Periodizitätskomponente durchführt, die Störungsunterdrückungsvorrichtung den Zusammensetzungsprozess des Zusammensetzens eines Energiespektrums durchführen und die Qualität der Störungsunterdrückungsvorrichtung auch dann verbessern, wenn die Analysegenauigkeit der harmonischen Struktur sich verschlechtert und die Spektrumspitzenpositionen nicht genau bestimmt werden können.
  • Ausführungsbeispiel 9
  • Das Ausgangssignal, bei dem die Störungsunterdrückung durch die Störungsunterdrückungsvorrichtung 100 oder 100', die in einer solchen Weise ausgebildet ist, wie in jedem der vorbeschriebenen Ausführungsbeispiele 1 bis 8 gezeigt ist, durchgeführt wird, wird in einer digitalen Datenform zu einem von verschiedenen akustischen Tonprozessoren ausgesandt, wie einer Sprachcodiervorrichtung, einer Spracherkennungsvorrichtung, einer Sprachspeichervorrichtung und einer Freisprech-Rufvorrichtung. Als eine Alternative können die Störungsunterdrückungsvorrichtung sowie die vorgenannte andere Vorrichtung durch Software realisiert werden, die in einem DSP (digitaler Signalprozessor) enthalten ist, oder sie können als ein Softwareprogramm ausgebildet sein, das in einer CPU (zentrale arithmetische Einheit) ausgeführt wird. Das Programm kann in einer solchen Weise ausgebildet sein, dass es in einer Speichereinheit eines Computers, der das Softwareprogramm ausführt, gespeichert ist, oder es kann in einer Form ausgebildet sein, in der es als ein Speichermedium wie einer CD-ROM verteilt ist.
  • Weiterhin können das gesamte Programm oder ein Teil von diesem im Wege eines Netzwerks erhalten werden. 12 ist ein Blockschaltbild, das die Struktur eines Störungsunterdrückungssystems gemäß dem Ausführungsbeispiel 9 zeigt, und die Struktur des Störungsunterdrückungssystems zeigt, das einen Teil des Programms liefert. Wie in 12 gezeigt ist, enthält ein erster Computer 40 die erste und die zweite Fourier-Transformationsvorrichtung 3 und 4, die erste und die zweite Energiespektrum-Berechnungsvorrichtung 5 und 6, die Energiespektrum-Auswahlvorrichtung 7, die Eingangssignal-Analysiervorrichtung 8 und die Energiespektrumsynthetisierer 9, und führt Prozesse durch. Durch den ersten Computer 40 verarbeitete Daten werden über beispielsweise eine Netzwerkvorrichtung 41, die aus einem Kabel oder einem Funknetzwerk besteht, zu einem zweiten Computer 42 gesendet. Der zweite Computer 42 enthält die Störungsunterdrückungsbetrags-Berechnungsvorrichtung 10, die Energiespektrum-Unterdrückungsvorrichtung 11 und die inverse Fourier-Transformationsvorrichtung 12 und führt Prozesse durch.
  • Eine Servervorrichtung 43 hält das Softwareprogramm zur Realisierung der Störungsunterdrückungsvorrichtung 100 oder 100' gemäß einem der vorbeschriebenen Ausführungsbeispiele 1 bis 8 und sieht ein Programmmodul vor, das die Prozesse für jeden Computer über die Netzwerkvorrichtung 41 wie erforderlich durchführt. Der erste Computer 40 oder der zweite Computer 42 kann die Rolle der Servervorrichtung 43 spielen. Beispielsweise liefert in einem Fall, in welchem der zweite Computer 42 als die Servervorrichtung 43 dient, der zweite Computer 42 das vorgenannte Programm für den ersten Computer 40 über die Netzwerkvorrichtung 41.
  • Wie vorstehend erwähnt ist, wird gemäß diesem Ausführungsbeispiel 9 ein Vorteil erhalten, in der Lage zu sein, die Störungsunterdrückungsvorrichtung durch eine Störungsunterdrückungsvorrichtung auf der Grundlage eines Verfahrens, das sich von dem beispielsweise in einem der vorbeschriebenen Ausführungsbeispiele 1 bis 8 beschriebenen Verfahren unterscheidet, zu ersetzen, und in der Lage ist, das Programm über mehrere Computer zu verteilen, um zu bewirken, dass die Computer das Programm ausführen, wodurch es möglich ist, die Verarbeitungslast gemäß der Rechenleistung jedes der Computer herabzusetzen. Als ein Beispiel ist es in einem Fall, in welchem der erste Computer 40 eine Vorrichtung für den Einsatz in einer anderen Vorrichtung wie einer Fahrzeug-Navigationsvorrichtung oder einem Mobiltelefon ist und dessen Verarbeitungsfähigkeit beschränkt ist, und der zweite Computer 42 ein großer Computer vom Servertyp oder dergleichen ist und dessen Verarbeitungsfähigkeit einen Spielraum hat, möglich, zu bewirken, dass der zweite Computer 42 einen größeren Anteil der arithmetischen Verarbeitung durchführt. In jedem der vorbeschriebenen Fälle ist der Vorteil des Verbesserns der Qualität des Energiespektrum-Synthetisierungsvorgangs, der vorstehend beschrieben ist, effektiv, während er unverändert bleibt. Weiterhin kann zusätzlich zum Senden des Ausgangssignals zu einem der verschiedenen akustischen Tonprozessoren, nachdem das Ausgangssignal einer D/A(Digital/Analog)-Umwandlung unterzogen wurde, das Ausgangssignal durch eine Verstärkungsvorrichtung verstärkt und als ein Tonsignal direkt von einem Lautsprecher oder dergleichen ausgegeben werden.
  • Obgleich die Erläuterung anhand der Verwendung des MAP-Verfahrens als das Störungsunterdrückungsverfahren bei jedem der vorbeschriebenen Ausführungsbeispiele 1 bis 9 durchgeführt wird, können die Ausführungsbeispiele auch auf ein anderes Verfahren angewendet werden. Beispielsweise gibt es eine Kurzzeit-Spektralamplituden-Schätzvorrichtung mit minimalem statistischem Gesamtfehler, die in dem vorgenannten Nichtpatentdokument 1 erläutert ist, und ein Spektralsubtraktionsverfahren, das im Einzelnen in dem folgenden Dokument 2 erläutert ist.
  • [Dokument 2]
  • S.F. Boll, „Suppression of Acoustic Noise in Speech Using Spectral Subtraction", IEEE Trans. on ASSP, Vol. ASSP-27, No. 2, Seiten 113 -120, April 1979
  • Weiterhin ist, obgleich der Fall eines Schmalband-Telefons (0 Hz bis 4000 Hz) in den vorbeschriebenen Ausführungsbeispielen 1 bis 9 gezeigt ist, ist die vorliegende Erfindung nicht auf eine Schmalband-Telefonsprache beschränkt. Beispielsweise kann die vorliegende Erfindung auch auf eine Breitband-Telefonsprache in dem Bereich von beispielsweise 0 Hz bis 8000 Hz und ein akustisches Signal angewendet werden.
  • Während die Erfindung durch ihre bevorzugten Ausführungsbeispiele beschrieben wurde, ist darauf hinzuweisen, dass eine beliebige Kombination von zwei oder mehr der vorbeschriebenen Ausführungsbeispiele gebildet werden kann, verschiedene Änderungen in einer beliebigen Komponente gemäß einem der vorbeschriebenen Ausführungsbeispiele vorgenommen werden können, und eine beliebige Komponente gemäß einem der vorbeschriebenen Ausführungsbeispiele innerhalb des Bereichs der Erfindung weggelassen werden kann.
  • GEWERBLICHE ANWENDBARKEIT
  • Wie vorstehend beschrieben ist, kann die Störungsunterdrückungsvorrichtung gemäß der vorliegenden Erfindung einen Ton korrigieren und eine Störungsunterdrückung bei dem Ton in einer solchen Weise durchführen, dass die harmonische Struktur des Tons auch in einem Band gehalten wird, in welchem der Ton in Störungen vergraben ist, wobei die Störungsunterdrückungsvorrichtung geeignet ist zur Verwendung für eine Störungsunterdrückung in verschiedenen Vorrichtungen, in die jeweils ein Sprachruf-, ein Sprachspeicher- und ein Spracherkennungssystem eingeführt sind.
  • Bezugszeichenliste
  • 1 erstes Mikrofon, 2 zweites Mikrofon, 3 erste Fourier-Transformationsvorrichtung, 4 zweite Fourier-Transformationsvorrichtung, 5 erste Energiespektrum-Berechnungsvorrichtung, 6 zweite Energiespektrum-Berechnungsvorrichtung, 7 Energiespektrum-Auswahlvorrichtung, 8 Eingangssignal-Analysiervorrichtung, 9 Energiespektrumsynthetisierer, 10 Störungsunterdrückungsbetrags-Berechnungsvorrichtung, 11 Energiespektrum-Unterdrückungsvorrichtung, 12 inverse Fourier-Transformationsvorrichtung, 13 Ausgangsanschluss, 20 Ton-/Störungsabschnitts-Bestimmungsvorrichtung, 21 Störungsspektrum-Schätzvorrichtung, 31 erster Strahlenbündelungsprozessor, 32 zweiter Strahlenbündelungsprozessor, 40 erster Computer, 41 Netzwerkvorrichtung, 42 zweiter Computer, 43 Servervorrichtung, 100 und 100' Störungsunterdrückungsvorrichtung, 200 bewegtes Objekt, 201 Fahrersitz, 201a direkte Welle, 201b reflektierte und gebeugte Welle, 202 Vordersitz, 203 reflektierende Oberfläche, 204 Störungen.

Claims (6)

  1. Störungsunterdrückungsvorrichtung, welche aufweist: eine Fourier-Transformationsvorrichtung (3, 4), die mehrere in diese eingegebene Eingangssignale in einer Zeitdomäne in Spektralkomponenten, die Signale in einer Frequenzdomäne sind, transformiert; eine Energiespektrum-Berechnungsvorrichtung (5, 6), die Energiespektren aus den Spektralkomponenten, die durch die Fourier-Transformationsvorrichtung (3, 4) transformiert wurden, berechnet; eine Eingangssignal-Analysiervorrichtung (8), die eine harmonische Struktur und Periodizität der Eingangssignale auf Grundlage der von der Energiespektrum-Berechnungsvorrichtung (5, 6) berechneten Energiespektren analysiert; einen Energiespektrumsynthetisierer (9), der eine Synthese anhand der Energiespektren der mehreren Eingangssignale gemäß einem Ergebnis der Analyse durch die Eingangssignal-Analysiervorrichtung (8) durchführt, um ein zusammengesetztes Energiespektrum zu erzeugen; eine Störungsunterdrückungsbetrags-Berechnungsvorrichtung (10), die einen Betrag der Störungsunterdrückung auf Grundlage des von dem Energiespektrumsynthetisierer (9) erzeugten zusammengesetzten Energiespektrums und eines anhand der Eingangssignale geschätzten Störungsspektrums berechnet; eine Energiespektrum-Unterdrückungsvorrichtung (11), die eine Störungsunterdrückung bei dem von dem Energiespektrumsynthetisierer (9) erzeugten zusammengesetzten Energiespektrum durchführt durch Verwendung des von der Störungsunterdrückungsbetrags-Berechnungsvorrichtung (10) berechneten Betrags der Störungsunterdrückung; und eine inverse Fourier-Transformationsvorrichtung (12), die das zusammengesetzte Energiespektrum, bei dem die Störungsunterdrückung von der Energiespektrum-Unterdrückungsvorrichtung (11) durchgeführt wurde, in ein Signal in einer Zeitdomäne transformiert und dieses Signal als ein Tonsignal ausgibt.
  2. Störungsunterdrückungsvorrichtung nach Anspruch 1, bei der die Störungsunterdrückungsvorrichtung eine Energiespektrum-Auswahlvorrichtung (7) enthält, die Spektralkomponenten der von der Energiespektrum-Berechnungsvorrichtung (5, 6) berechneten Energiespektren für die mehreren Eingangssignale miteinander vergleicht, und die eine Spektralkomponente mit einem größten Wert für jede Frequenz auswählt, um ein Energiespektrum als Kandidaten für ein zusammengesetztes Energiespektrum zu bilden und zu erzeugen, wobei der Energiespektrumsynthetisierer (9) das Energiespektrum von einem der mehreren Eingangssignale als ein repräsentatives Energiespektrum definiert und eine Synthese anhand des repräsentativen Energiespektrums und des von der Energiespektrum-Auswahlvorrichtung (7) erzeugten Kandidaten für das zusammengesetzte Energiespektrum gemäß dem Ergebnis der Analyse durch die Eingangssignal-Analysiervorrichtung (8) durchführt, um ein zusammengesetztes Energiespektrum zu erzeugen.
  3. Störungsunterdrückungsvorrichtung nach Anspruch 2, bei der die Eingangssignal-Analysiervorrichtung (8) Periodizitätsinformationen und Autokorrelationskoeffizienten der Eingangssignale auf der Grundlage der von der Energiespektrum-Berechnungsvorrichtung (5, 6) berechneten Energiespektren berechnet und der Energiespektrumsynthetisierer (9) eine Synthese anhand des repräsentativen Energiespektrums und des von der Energiespektrum-Auswahlvorrichtung (7) erzeugten Kandidaten für das zusammengesetzte Energiespektrum gemäß den Periodizitätsinformationen und den Autokorrelationskoeffizienten der Eingangssignale, die von der Eingangssignal-Analysiervorrichtung (8) berechnet wurden, durchführt, um ein zusammengesetzten Energiespektrum zu erzeugen.
  4. Störungsunterdrückungsvorrichtung nach Anspruch 2, bei der der Energiespektrumsynthetisierer (9) eine Synthese anhand des repräsentativen Energiespektrums und des von der Energiespektrum-Auswahlvorrichtung (7) ausgewählten Kandidaten für das zusammengesetzte Energiespektrum auf der Basis ob oder nicht ein Durchschnittswert von Subband-SN-Verhältnissen der Eingangssignale gleich einem oder größer als ein vorbestimmter Schwellenwert ist, durchführt, um ein zusammengesetztes Energiespektrum zu erzeugen.
  5. Störungsunterdrückungsvorrichtung nach Anspruch 4, bei der der Energiespektrumsynthetisierer (9) einen Prozess des Synthetisierens eines Energiespektrums mit einer kontinuierlichen Änderung durchführt durch Verwenden entweder des Durchschnittswerts der Subband-SN-Verhältnisse der Eingangssignale oder eines Tonähnlichkeitsindex, der durch Korrelationsfähigkeit der Eingangssignale ausgedrückt wird.
  6. Störungsunterdrückungsvorrichtung nach Anspruch 5, bei der der Energiespektrumsynthetisierer (9) einen gewichteten Durchschnittswert-Bildungsprozess bei dem repräsentativen Energiespektrum und dem Kandidaten für das zusammengesetzte Energiespektrum durchführt, um ein zusammengesetztes Energiespektrum sowohl für einen Abschnitt, in welchem ein Tonabschnitt in einen Störungsabschnitt übergeht, als auch für einen Abschnitt, in welchem ein Störungsabschnitt in einen Tonabschnitt übergeht, in jedem der Eingangssignale zu erzeugen.
DE112011105791.1T 2011-11-02 2011-11-02 Störungsunterdrückungsvorrichtung Active DE112011105791B4 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2011/006143 WO2013065088A1 (ja) 2011-11-02 2011-11-02 雑音抑圧装置

Publications (2)

Publication Number Publication Date
DE112011105791T5 DE112011105791T5 (de) 2014-08-07
DE112011105791B4 true DE112011105791B4 (de) 2019-12-12

Family

ID=48191486

Family Applications (1)

Application Number Title Priority Date Filing Date
DE112011105791.1T Active DE112011105791B4 (de) 2011-11-02 2011-11-02 Störungsunterdrückungsvorrichtung

Country Status (5)

Country Link
US (1) US9368097B2 (de)
JP (1) JP5646077B2 (de)
CN (1) CN103718241B (de)
DE (1) DE112011105791B4 (de)
WO (1) WO2013065088A1 (de)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11172312B2 (en) 2013-05-23 2021-11-09 Knowles Electronics, Llc Acoustic activity detecting microphone

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6135106B2 (ja) * 2012-11-29 2017-05-31 富士通株式会社 音声強調装置、音声強調方法及び音声強調用コンピュータプログラム
CN104424954B (zh) * 2013-08-20 2018-03-09 华为技术有限公司 噪声估计方法与装置
DE102014009738A1 (de) 2014-07-01 2014-12-18 Daimler Ag Verfahren zum Betreiben eines Windabweisers eines Fahrzeugs, insbesondere eines Personenkraftwagens
JP6559427B2 (ja) * 2015-01-22 2019-08-14 株式会社東芝 音声処理装置、音声処理方法およびプログラム
JP6520276B2 (ja) * 2015-03-24 2019-05-29 富士通株式会社 雑音抑圧装置、雑音抑圧方法、及び、プログラム
JP2016182298A (ja) * 2015-03-26 2016-10-20 株式会社東芝 騒音低減システム
CN106303837B (zh) * 2015-06-24 2019-10-18 联芯科技有限公司 双麦克风的风噪检测及抑制方法、系统
CN106328165A (zh) * 2015-06-30 2017-01-11 芋头科技(杭州)有限公司 一种机器人自身音源消除系统
JP2017212557A (ja) * 2016-05-24 2017-11-30 エヌ・ティ・ティ・コミュニケーションズ株式会社 制御装置、対話システム、制御方法及びコンピュータプログラム
JP7244985B2 (ja) 2017-05-19 2023-03-23 川崎重工業株式会社 操作装置及び操作システム
JP7175096B2 (ja) * 2018-03-28 2022-11-18 沖電気工業株式会社 収音装置、プログラム及び方法
JP7210926B2 (ja) * 2018-08-02 2023-01-24 日本電信電話株式会社 集音装置
JP6854967B1 (ja) * 2019-10-09 2021-04-07 三菱電機株式会社 雑音抑圧装置、雑音抑圧方法、及び雑音抑圧プログラム
CN111337213A (zh) * 2020-02-21 2020-06-26 中铁大桥(南京)桥隧诊治有限公司 一种基于合成功率谱桥梁模态频率识别方法及系统
GB2612587A (en) * 2021-11-03 2023-05-10 Nokia Technologies Oy Compensating noise removal artifacts
CN115201753B (zh) * 2022-09-19 2022-11-29 泉州市音符算子科技有限公司 一种低功耗多频谱分辨的语音定位方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11259090A (ja) 1998-03-12 1999-09-24 Nippon Telegr & Teleph Corp <Ntt> 収音装置
US20110103615A1 (en) 2009-11-04 2011-05-05 Cambridge Silicon Radio Limited Wind Noise Suppression
EP2546831A1 (de) 2010-03-09 2013-01-16 Mitsubishi Electric Corporation Rauschunterdrückungsvorrichtung

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3454190B2 (ja) * 1999-06-09 2003-10-06 三菱電機株式会社 雑音抑圧装置および方法
JP3454206B2 (ja) * 1999-11-10 2003-10-06 三菱電機株式会社 雑音抑圧装置及び雑音抑圧方法
JP4445460B2 (ja) * 2000-08-31 2010-04-07 パナソニック株式会社 音声処理装置及び音声処理方法
JP2002149200A (ja) * 2000-08-31 2002-05-24 Matsushita Electric Ind Co Ltd 音声処理装置及び音声処理方法
JP2002140100A (ja) * 2000-11-02 2002-05-17 Matsushita Electric Ind Co Ltd 騒音抑圧装置
JP2004341339A (ja) * 2003-05-16 2004-12-02 Mitsubishi Electric Corp 雑音抑圧装置
JP4863713B2 (ja) * 2005-12-29 2012-01-25 富士通株式会社 雑音抑制装置、雑音抑制方法、及びコンピュータプログラム
JP4660578B2 (ja) 2008-08-29 2011-03-30 株式会社東芝 信号補正装置
WO2010052749A1 (ja) * 2008-11-04 2010-05-14 三菱電機株式会社 雑音抑圧装置
CN101763858A (zh) * 2009-10-19 2010-06-30 瑞声声学科技(深圳)有限公司 双麦克风信号处理方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11259090A (ja) 1998-03-12 1999-09-24 Nippon Telegr & Teleph Corp <Ntt> 収音装置
US20110103615A1 (en) 2009-11-04 2011-05-05 Cambridge Silicon Radio Limited Wind Noise Suppression
EP2546831A1 (de) 2010-03-09 2013-01-16 Mitsubishi Electric Corporation Rauschunterdrückungsvorrichtung

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
S.F. Boll, „Suppression of Acoustic Noise in Speech Using Spectral Subtraction", IEEE Trans. on ASSP, Vol. ASSP-27, No. 2, Seiten 113 -120, April 1979
T. Lotter, P. Vary, „Speech Enhancement by MAP Spectral Amplitude Using a Super-Gaussian Speech Model", EURASIP Journal on Applied Signal Processing, Seiten 1110 - 1126, Nr. 7, 2005
Y. Ephraim, D. Malah „Speech Enhancement Using a Minimum Mean Square Error Short-Time Spectral Amplitude Estimator", IEEE Trans. ASSP, Band ASSP-32, Nr. 6, Dezember 1984
Y. Kaneda, J. Ohga „Adaptive Microphone-Array System for Noise Reduction", IEEE Trans. ASSP, Band ASSP-34, Nr. 6, Dezember 1986

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11172312B2 (en) 2013-05-23 2021-11-09 Knowles Electronics, Llc Acoustic activity detecting microphone

Also Published As

Publication number Publication date
DE112011105791T5 (de) 2014-08-07
WO2013065088A1 (ja) 2013-05-10
JP5646077B2 (ja) 2014-12-24
US20140098968A1 (en) 2014-04-10
US9368097B2 (en) 2016-06-14
JPWO2013065088A1 (ja) 2015-04-02
CN103718241A (zh) 2014-04-09
CN103718241B (zh) 2016-05-04

Similar Documents

Publication Publication Date Title
DE112011105791B4 (de) Störungsunterdrückungsvorrichtung
DE112010005895B4 (de) Störungsunterdrückungsvorrichtung
DE112012005855B4 (de) Störungsunterdrückungsvorrichtung
DE112011104737B4 (de) Geräuschunterdrückungsvorrichtung
DE112009000805B4 (de) Rauschreduktion
DE112012000052B4 (de) Verfahren und Vorrichtung zum Ausblenden von Windgeräuschen
DE69627580T2 (de) Verfahren zur Rauschverminderung in einem Sprachsignal
DE102017102134B4 (de) Global optimierte Nachfilterung mit der Kleinste-Quadrate-Methode für die Sprachverbesserung
DE60027438T2 (de) Verbesserung eines verrauschten akustischen signals
DE112009001003B4 (de) Geräuschunterdrückungssystem mit zwei Mikrophonen
DE10041512B4 (de) Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen
DE60131639T2 (de) Vorrichtungen und Verfahren zur Bestimmung von Leistungswerten für die Geräuschunterdrückung für ein Sprachkommunikationssystem
DE602005000539T2 (de) Verstärkungsgesteuerte Geräuschunterdrückung
DE112010005020B4 (de) Sprachsignal-Wiederherstellungsvorrichtung und Sprachsignal-Wiederherstellungsverfahren
DE112016004161T5 (de) Mikrofonsignalzusammenführung
DE102010023615B4 (de) Signalverarbeitungsvorrichtung und Signalverarbeitungsverfahren
DE112017007005B4 (de) Akustiksignal-verarbeitungsvorrichtung, akustiksignalverarbeitungsverfahren und freisprech-kommunikationsvorrichtung
DE102014002899A1 (de) Verfahren, Vorrichtung und Herstellung zur Zwei-Mikrofon-Array-Sprachverbesserung für eine Kraftfahrzeugumgebung
DE102007030209A1 (de) Glättungsverfahren
DE102013111784B4 (de) Audioverarbeitungsvorrichtungen und audioverarbeitungsverfahren
DE112011106045B4 (de) Audiosignal-Wiederherstellungsvorrichtung und Audiosignal-Wiederherstellungsverfahren
AT509570B1 (de) Methode und apparat zur einkanal-sprachverbesserung basierend auf einem latenzzeitreduzierten gehörmodell
DE102022209004B3 (de) Vorrichtung und Verfahren zum Verarbeiten eines Audiosignals
DE102019102414A1 (de) Detektion von Reibelauten in Sprachsignalen
DE102018117558A1 (de) Adaptives nachfiltern

Legal Events

Date Code Title Description
R012 Request for examination validly filed
R084 Declaration of willingness to licence
R016 Response to examination communication
R018 Grant decision by examination section/examining division
R020 Patent grant now final