DE102011108234B4 - Mikrofonarrayvorrichtung - Google Patents

Mikrofonarrayvorrichtung Download PDF

Info

Publication number
DE102011108234B4
DE102011108234B4 DE102011108234.8A DE102011108234A DE102011108234B4 DE 102011108234 B4 DE102011108234 B4 DE 102011108234B4 DE 102011108234 A DE102011108234 A DE 102011108234A DE 102011108234 B4 DE102011108234 B4 DE 102011108234B4
Authority
DE
Germany
Prior art keywords
sound
area
noise
suppression
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
DE102011108234.8A
Other languages
English (en)
Other versions
DE102011108234A1 (de
Inventor
Naoshi Matsuo
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of DE102011108234A1 publication Critical patent/DE102011108234A1/de
Application granted granted Critical
Publication of DE102011108234B4 publication Critical patent/DE102011108234B4/de
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Signal Processing (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
  • Multimedia (AREA)

Abstract

Mikrofonarrayvorrichtung mit:einer ersten Tonempfangseinheit, die konfiguriert ist, um ein erstes Tonsignal zu erhalten, das von einem ersten Mikrofon eingegeben wird;einer zweiten Tonempfangseinheit, die konfiguriert ist, um ein zweites Tonsignal zu erhalten, das von einem zweiten Mikrofon eingegeben wird, das sich von dem ersten Mikrofon unterscheidet;einem ersten Signalkonverter, der konfiguriert ist, um erste Spektren zu erzeugen, die durch Konvertieren des ersten Tonsignals in eine Frequenzkomponente erhalten werden;einem zweiten Signalkonverter, der konfiguriert ist, um zweite Spektren zu erzeugen, die durch Konvertieren des zweiten Tonsignals in die Frequenzkomponente erhalten werden;einer Phasenspektrendifferenzberechnungseinheit, die konfiguriert ist, um eine Phasenspektrendifferenz zwischen den ersten Spektren und den zweiten Spektren für jede Frequenz auf der Basis der ersten Spektren und der zweiten Spektren zu berechnen;einer Geräuschzustandsbewertungseinheit, die konfiguriert ist, um eine Pegelveränderung für ein Spektrum zu berechnen, worin eine Richtung, die durch die Phasenspektrendifferenz für die jeweilige Frequenz angegeben wird, im Bereich von einer ersten Richtung bis zu einer zweiten Richtung enthalten ist, und weiter konfiguriert ist, um einen Bewertungsparameter auf der Basis der Pegelveränderung zu erhalten, um einen Einfluss eines Nichtzieltons auf einen Zielton zu bewerten, auf der Basis des Spektrums, worin eine Richtung, die durch die Phasenspektrendifferenz für die jeweilige Frequenz angegeben wird, im Bereich von der ersten Richtung bis zu der zweiten Richtung enthalten ist, unter den ersten Spektren; undeiner Unterdrückungseinheit, die konfiguriert ist, um den Nichtzielton, der in den ersten Spektren enthalten ist, auf der Basis des Bewertungsparameters zu unterdrücken.

Description

  • QUERVERWEIS AUF VERWANDTE ANMELDUNG
  • Diese Anmeldung basiert auf der früheren japanischen Patentanmeldung Nr. 2010-114897 , eingereicht am 19. Mai 2010, deren gesamter Inhalt hierin durch Bezugnahme inkorporiert ist, und beansprucht deren Priorität.
  • GEBIET
  • Die hierin diskutierten Ausführungsformen beziehen sich auf eine Mikrofonarrayvorrichtung.
  • HINTERGRUND
  • Eine Mikrofonarrayvorrichtung erhält einen Zielton von einer Zieltonquelle. Die Mikrofonarrayvorrichtung verwendet zum Beispiel ein Synchronsubtraktionsverfahren, das in 26 gezeigt ist, und ein Verfahren, das in 27 gezeigt ist. 26 und 27 zeigen Mikrofonarrayvorrichtungen mit verwandten Technologien.
  • Eine Mikrofonarrayvorrichtung 01 in 26 enthält ein Mikrofon MIC1 und ein Mikrofon MIC2. In 26 liegt eine Tonempfangsrichtung auf einer linken Seite des Mikrofons MIC1. Indessen liegt eine Unterdrückungsrichtung auf einer rechten Seite des Mikrofons MIC2. Die Tonempfangsrichtung enthält eine Zieltonquelle SS. Die Unterdrückungsrichtung ist eine Richtung, die zu der Tonempfangsrichtung entgegengesetzt ist. Sowohl das Mikrofon MIC1 als auch das Mikrofon MIC2 sind ungerichtete Mikrofone, die die Richtwirkung nicht steuern.
  • Eine Verzögerungseinheit 1 verzögert ein Tonsignal, das Geräusch enthält, das durch das Mikrofon MIC2 erhalten wird, um eine gewisse Verzögerungszeit. Eine Subtraktionseinheit 2 subtrahiert ein Ausgangssignal der Verzögerungseinheit 1 von einem Tonsignal, das einen Zielton enthält, der durch das Mikrofon MIC1 erhalten wird. Die Mikrofonarrayvorrichtung 01 ist als Vorrichtung mit Richtwirkung, die durch die gepunktete Linie in 26 gezeigt ist, gemäß dem oben beschriebenen Synchronsubtraktionsverfahren konfiguriert. Mit anderen Worten: die Mikrofonarrayvorrichtung 01 unterdrückt Geräusch aus der Unterdrückungsrichtung. Die Mikrofonarrayvorrichtung 01 kann einen Zielton von einer Zieltonquelle SS erhalten.
  • Eine Mikrofonarrayvorrichtung 02 in 27 enthält ein Mikrofon-MIC1 und ein Mikrofon MIC2. In 27 liegt ein Tonempfangsbereich auf einer linken Seite des Mikrofons MIC1. Ein Umstellbereich und ein Unterdrückungsbereich liegen auf einer rechten Seite des Mikrofons MIC2. Der Tonempfangsbereich ist ein Bereich, der eine Zieltonquelle SS enthält. Der Unterdrückungsbereich ist ein Bereich, der sich von dem Tonempfangsbereich unterscheidet. Die Mikrofonarrayvorrichtung 02 unterdrückt Geräusch, das von einer Tonquelle erzeugt wird, die in dem Unterdrückungsbereich enthalten ist. Der Umstellbereich ist ein Bereich, der zwischen dem Tonempfangsbereich und dem Unterdrückungsbereich liegt. Zudem ist der Umstellbereich da, wo ein Grad des Unterdrückens von Geräusch zwischen dem Tonempfangsbereich und dem Unterdrückungsbereich allmählich umgestellt wird.
  • Ein FFT 3a wendet die Schnelle Fourier-Transformation (FFT) an, um ein Tonsignal, das durch das Mikrofon MIC1 erhalten wird, in ein komplexes Spektrum IN1(f) auf einer Frequenzachse zu konvertieren. Desgleichen wendet ein FFT 3b die Schnelle Fourier-Transformation (FFT) an, um ein Tonsignal, das durch das Mikrofon MIC2 erhalten wird, in ein komplexes spektrum IN2(f) auf einer Frequenzachse zu konvertieren. Eine Phasenspektrendifferenzberechnungseinheit 1 berechnet eine Phasenspektrendifferenz DIFF(f) zwischen dem Tonsignal, das durch das Mikrofon MIC1 erhalten wird, und dem Tonsignal, das durch das Mikrofon MIC2 erhalten wird, auf der Basis des komplexen Spektrums IN1(f) und des komplexen Spektrums IN2(f). Die Mikrofonarrayvorrichtung 02 kann durch die Phasenspektrendifferenz DIFF(f) einen Bereich, wo eine Tonquelle enthalten ist, für jede Frequenz identifizieren. Eine Verstärkungsberechnungseinheit 5 berechnet eine Geräuschunterdrückungsverstärkung G(f) auf der Basis des identifizierten Bereiches der Tonquelle. Die Geräuschunterdrückungsverstärkung G(f) ist eine Variable, um ein Eingangs- und Ausgangsverhältnis zu bestimmen. Die Mikrofonarrayvorrichtung 02 bestimmt durch Anpassen der Geräuschunterdrückungsverstärkung G(f), wieviel Geräusch unterdrückt wird. Eine Gerächunterdrückungseinheit 6 berechnet eine Ausgabe OUT(f), in der Geräusch unterdrückt ist, auf der Basis des komplexen Spektrums IN1(f) und der Geräuschunterdrückungsverstärkung G(f). Ein IFFT 7 wendet die umgekehrte FFT auf die Ausgabe OUT(f) an, um eine Ausgabe zu erhalten. Die Mikrofonarrayvorrichtung 02 kann einen Zielton von der Zieltonquelle SS erhalten, während Geräusch unterdrückt wird.
  • Die oben beschriebene verwandte Technologie wird zum Beispiel in der japanischen offengelegten Patentveröffentlichung Nr. 2007-318528 diskutiert.
  • Dokument WO 2009/025 090 A1 beschreibt eine Richtmikrofoneinrichtung, welche eine Sensitivitätsverminderung verhindert und das Problem einer Erhöhung des thermischen Rauschens während einer Richtsynthese löst. Das Richtmikrofon umfasst eine Vielzahl von Mikrofonen mit Richt- und Nicht-Richt-Eigenschaften, ein Steuermittel, welches ein Ausgangssignal durch Verwendung von von den Mikrofonen ausgegebenen Signalen ausgibt, und eine Ausgabeeinheit welche die durch das Steuermittel erzeugten Ausgangssignale ausgibt.
  • Dokument US 7,436,188 B2 beschreibt eine Rauschunterscheidung in Signalen von einer Vielzahl von Sensoren, welche durch Verstärken der Phasendifferenz in den Signalen derart ausgeführt wird, dass eine Aufnahme abseits einer Achse verhindert wird, während eine Aufnahme auf einer Achse verstärkt wird. Insbesondere wird ein Einstellen eines Schärfeparameters in Reaktion auf eine Erhöhung in einem Rauschniveau und ein Einstellen eines Werts zum Aufrechterhalten eines bestimmten Signal-zu-Rausch-Verhältnisses beschrieben.
  • Dokument US 2010/0 056 227 A1 beschreibt eine Rauschunterdrückungsvorrichtung, welche Tonsignale über eine Vielzahl von Tonempfangseinheiten empfängt und in den Eingangstonsignalen umfasste Rauschkomponenten unterdrückt. Die Vorrichtung umfasst eine Detektoreinheit, welche ein Anwendungsmuster der Rauschunterdrückungsvorrichtung aus einer Vielzahl von Anwendungsmustern detektiert, in welcher Positionsbeziehungen der Vielzahl von Tonempfangseinheiten und/oder Positionsbeziehungen zwischen der Vielzahl von Tonempfangseinheiten und einer Zieltonquelle unterschiedlich zueinander sind, eine Umwandlungseinheit, welche eine Nutzungumgebungsinformation, welche in einem Rauschunterdrückungsprozess an einem jeden der durch die Vielzahl von Tonaufnahmeeinheiten eingegebenen Tonsignale verwendet wird, in eine Nutzungsumgebungsinformation entsprechend eines Nutzungsmusters, welches durch die Detektionseinheit detektiert ist, und eine Unterdrückungseinheit, welche den Rauschunterdrückungsprozess unter Verwendung der konvertierten Nutzungsumgebungsinformation ausführt.
  • Dokument EP 1 887 831 A2 beschreibt ein Verfahren zum Abschätzen einer Tonankunftsrichtung, in welcher sich eine Tonquelle eines Tonsignals befindet. Das Tonsignal wird in Tonsignaleingangseinheiten zum Eingeben von Tonsignalen von den sich in mehreren Richtungen befindenden Tonquellen als Eingänge von mehreren Kanälen eingegeben. Das Verfahren umfasst die Schritte zum Annehmen von Eingaben von mehreren Kanälen und Umwandeln eines jeden Signals in ein Signal auf einer Zeitachse für jeden Kanal, Transformieren des Signals eines jeden Kanals auf der Zeitachse in ein Signal auf einer Frequenzachse, Berechnen einer Phasenkomponente des transformierten Signals eines jeden Kanals auf der Frequenzachse für jede identische Frequenz, Berechnen einer Phasendifferenz zwischen den mehreren Kanälen unter Verwendung der Phasenkomponente, Berechnen einer Amplitudenkomponente des transformierten Signals auf der Frequenzachse, Abschätzen einer Rauschkomponente aus der berechneten Amplitudenkomponente, Berechnen eines Signal-zu-Rausch-Verhältnisses für jede Frequenz auf der Basis der berechneten Amplitudenkomponente und der abgeschätzten Rauschkomponente, Entnehmen von Frequenzen, bei welchen die Signal-zu-Rausch-Verhältnisse größer als ein vorbestimmter Wert sind, Berechnen eines Unterschieds zwischen eines Ankunftsabstands des Tonsignals von einer Zieltonquelle auf der Basis der berechneten Phasendifferenz und Abschätzen einer Richtung, in welcher sich eine Zieltonquelle befindet.
  • Dokumente US 2010/0 008 519 A1 beschreibt eine Rauschunterdrückungsvorrichtung zum Unterdrücken einer in einem Ton enthaltenen Rauschkomponente. Die Vorrichtung umfasst zumindest zwei Tonempfangsabschnitte, welche Töne aus einer Vielzahl von Richtungen aufnehmen, einen Abschätzungsabschnitt, welcher sowohl eine Richtungsinformation als auch eine Abstandsinformation erfasst und einen Komponentenwert einer Rauschkomponente unter Verwendung der Richtungsinformation der Abstandsinformation abschätzt, einen Steuerabschnitt, welcher einen Steuerwert eines Unterdrückungsbetrags für ein Steuern eines Bereichs einer Richtung der digitalen Tonsignale erfasst, einen Unterdrückungsabschnitt, welcher ein Signal aus einer Richtung mit Ausnahme der Richtung der gegebenen Tonquelle unterdrückt, und einen Ausgabeabschnitt, welcher ein Signal ausgibt, bei welchem das Signal aus der Richtung mit Ausnahme der Richtung der gegebenen Tonquelle unterdrückt ist.
  • Dokument US 2010/0 111 325 A1 beschreibt eine Signalverarbeitungseinheit mit zumindest zwei Tonsignaleingabeelementen, einer Orthogonal-Transformeinheit zum Transformieren von zumindest zwei Tonsignalen in zwei Spektren als Signale in einer Frequenzdomain, eine Phasendifferenzbestimmungseinheit zur Bestimmung einer Phasendifferenz zwischen den zwei Spektralsignalen und eine Virtuelle-Spektrum-Erzeugungseinheit zum Erzeugen eines virtuellen Spektrumssignals ([0007]).
  • Dokument US 6,668,062 B1 beschreibt ein System, bei welchem die Ausgaben von ersten und zweiten Mikrofonen abgetastet werden und eine diskrete Fourier-Transformation an den abgetasteten Zeitdomain-Signalen ausgeführt wird. Ein weiterer Verarbeitungsschritt verarbeitet die Ausgabe der diskreten Fourier-Transformation in ein rauschunterdrücktes Frequenzdomain-Signal.
  • Dokument DE 10 2009 034 264 A1 beschreibt eine Signalverarbeitungsvorrichtung mit zwei Tonsignaleingabeelementen, einem Orthogonaltransformierer zum orthogonalen Transformieren von wenigstens zwei Tonsignalen in einer Zeitdomäne, die von zwei jeweiligen Tonsignaleingabeelementen von den wenigstens zwei Tonsignaleingabeelementen empfangen werden, in zwei jeweilige Spektralsignale in einer Frequenzdomäne, einem Phasendifferenzbestimmer zum Bestimmen einer Phasendifferenz zwischen den zwei Spektralsignalen in der Frequenzdomäne und einem Generator eines virtuellen Spektrums zum Erzeugen eines virtuellen Spektralsignals in der Frequenzdomäne gemäß der Phasendifferenz und wenigstens einem von den zwei Spektralsignalen ([0010]).
  • ZUSAMMENFASSUNG
  • Gemäß einem Aspekt der Erfindung enthält eine Mikrofonarrayvorrichtung eine erste Tonempfangseinheit, die konfiguriert ist, um ein erstes Tonsignal zu erhalten, das von einem ersten Mikrofon eingegeben wird, eine zweite Tonempfangseinheit, die konfiguriert ist, um ein zweites Tonsignal zu erhalten, das von einem zweiten Mikrofon eingegeben wird, das sich von dem ersten Mikrofon unterscheidet, eine Geräuschzustandsbewertungseinheit, die konfiguriert ist, um das erste Tonsignal und das zweite Tonsignal zu vergleichen und einen Bewertungsparameter zu erhalten, um einen Einfluss eines Nichtzieltons, der in dem zweiten Tonsignal enthalten ist, auf einen Zielton, der in dem ersten Tonsignal enthalten ist, gemäß einem Resultat des Vergleichs zu bewerten, eine Subtraktionsanpassungseinheit, die konfiguriert ist, um einen Unterdrückungsbetrag für das zweite Tonsignal auf der Basis des Bewertungsparameters festzulegen und ein drittes Tonsignal auf der Basis des zweiten Tonsignals und des Unterdrückungsbetrags zu erzeugen; und eine Subtraktionseinheit, die konfiguriert ist, um ein Signal, das auszugeben ist, auf der Basis des dritten Tonsignals und des ersten Tonsignals zu erzeugen.
  • Das Ziel und die Vorteile der Erfindung werden mittels der Elemente und Kombinationen realisiert und erreicht, die in den Ansprüchen besonders angeführt sind.
  • Es versteht sich, dass sowohl die obige allgemeine Beschreibung als auch die folgende eingehendeBeschreibung als Beispiel und Erläuterung dienen und die Erfindung, so wie beansprucht, nicht einschränken.
  • Figurenliste
    • 1 ist ein Blockdiagramm, das eine Hardware-Konfiguration einer Mikrofonarrayvorrichtung gemäß einer ersten Ausführungsform zeigt;
    • 2 ist ein Blockdiagramm, das eine funktionelle Konfiguration der Mikrofonarrayvorrichtung gemäß der ersten Ausführungsform zeigt;
    • 3 zeigt ein Beispiel für eine Beziehung zwischen einem Geräuschpegel L(ti) und einer Verstärkung g(ti);
    • 4 zeigt ein Beispiel für eine Beziehung zwischen einer Geräuschpegelveränderung S(ti) und einer Verstärkung g(ti);
    • 5 ist ein Flussdiagramm, das die Geräuschunterdrückungsverarbeitung zeigt, die durch die Mikrofonarrayvorrichtung gemäß der Ausführungsform ausgeführt wird;
    • 6 ist ein Blockdiagramm, das eine funktionelle Konfiguration der Mikrofonarrayvorrichtung gemäß einer zweiten Ausführungsform zeigt;
    • 7 zeigt eine Beziehung zwischen jeder Frequenz und einer Phasenspektrendifferenz DIFF(f) (-π ≤ DIFF(f) ≤ π) der Mikrofone MIC1 und MIC2, die so wie in 6 angeordnet sind;
    • 8 zeigt eine Beziehung zwischen einem Geräuschpegel L(f) und einem relativen Pegelwert(f);
    • 9 zeigt eine Beziehung zwischen einer Geräuschpegelveränderung S(f) und einer Rate(f);
    • 10 zeigt ein Beispiel für ein Verfahren zum Steuern eines Tonempfangsbereiches, eines Umstellbereiches und eines Unterdrückungsbereiches;
    • 11 zeigt ein Beispiel für ein Verfahren zum Steuern eines Tonempfangsbereiches, eines Umstellbereiches und eines Unterdrückungsbereiches;
    • 12 zeigt ein Beispiel für ein Verfahren zum Steuern eines Tonempfangsbereiches, eines Umstellbereiches und eines Unterdrückungsbereiches;
    • 13 zeigt ein Beispiel für ein Verfahren zum Steuern eines Tonempfangsbereiches, eines Umstellbereiches und eines Unterdrückungsbereiches;
    • 14 zeigt ein Beispiel für eine Beziehung zwischen einem kombinierten Wert LS(f), der einen Geräuschzustand angibt, und einer Verstärkung g(f);
    • 15 ist ein Flussdiagramm, das die Geräuschunterdrückungsverarbeitung zeigt, die durch die Mikrofonarrayvorrichtung gemäß der Ausführungsform ausgeführt wird;
    • 16 ist ein Blockdiagramm, das eine funktionelle Konfiguration einer Mikrofonarrayvorrichtung gemäß einer dritten Ausführungsform zeigt;
    • 17A zeigt einen Tonempfangsbereich, einen Umstellbereich und einen Unterdrückungsbereich, die ausgehend von Anfangsfestlegungen verändert wurden;
    • 17B zeigt eine Beziehung zwischen einer Verstärkung G(f) und einerPhasenspektrendifferenz DIFF(f) in dem Zustand, wenn ein Tonempfangsbereich, ein Umstellbereich und ein Unterdrückungsbereich die Anfangsfestlegungen haben;
    • 17C zeigt einen Tonempfangsbereich, einen Umstellbereich und einen Unterdrückungsbereich, die ausgehend von Anfangsfestlegungen verändert wurden;
    • 18 ist ein Flussdiagramm, das die Geräuschunterdrückungsverarbeitung zeigt, die durch die Mikrofonarrayvorrichtung gemäß der Ausführungsform ausgeführt wird;
    • 19 ist ein-Blockdiagramm, das eine funktionelle Konfiguration der Mikrofonarrayvorrichtung gemäß einer vierten Ausführungsform zeigt;
    • 20A zeigt ein Beispiel für ein Verfahren zum Steuern eines Tonempfangsbereiches, eines Umstellbereiches und eines Unterdrückungsbereiches für jedes Mikrofon, wenn Pegel 1
      Figure DE102011108234B4_0001
      Pegel 2 ist;
    • 20B zeigt ein Beispiel für ein Verfahren zum Steuern eines Tonempfangsbereiches, eines Umstellbereiches und eines Unterdrückurigsbereiches für jedes Mikrofon, wenn Pegel 1 ≈ Pegel 2 ist;
    • 20C zeigt ein Beispiel für ein Verfahren zum Steuern eines Tonempfangsbereiches, eines Umstellbereiches und eines Unterdrückungsbereiches für jedes Mikrofon, wenn Pegel 1 Pegel 2 ist;
    • 21A zeigt eine Bereichssteuerung von 20A durch eine Beziehung zwischen jeder Frequenz und einer Phasenspektrendifferenz DIFF(f) (-π ≤ DIFF(f) ≤ π);
    • 21B zeigt eine Bereichssteuerung von 20B durch eine Beziehung zwischen jeder Frequenz und einer Phasenspektrendifferenz DIFF(f) (-π ≤ DIFF(f) ≤ π);
    • 21C zeigt eine Bereichssteuerung von 20C durch eine Beziehung zwischen jeder Frequenz und einer Phasenspektrendifferenz DIFF(f) (-π ≤ DIFF(f) ≤ π);
    • 22 ist ein Beispiel für ein Flussdiagramm, das die Bereichsfestlegungsverarbeitung auf der Basis eines Pegelverhältnisses zeigt, die durch die Mikrofonarrayvorrichtung gemäß der Ausführungsform ausgeführt wird;
    • 23 ist ein Beispiel für ein Blockdiagramm, das eine funktionelle Konfiguration zeigt, wenn die zweite Ausführungsform und die vierte Ausführungsform kombiniert werden;
    • 24A zeigt ein Beispiel für ein Verfahren zum Festlegen eines Tonempfangsbereiches, eines Umstellbereiches und eines Unterdrückungsbereiches;
    • 24B zeigt ein Beispiel für ein Verfahren zum Steuern eines Tonempfangsbereiches, eines Umstellbereiches und eines Unterdrückungsbereiches;
    • 24C zeigt eine Bereichssteuerung von 24B durch eine Beziehung zwischen jeder Frequenz und einer Phasenspektrendifferenz DIFF(f) (-π ≤ DIFF(f) ≤ π);
    • 25 ist ein Beispiel für ein Blockdiagramm, das eine funktionelle Konfiguration zeigt, wenn die dritte Ausführungsform und die vierte Ausführungsform kombiniert werden;
    • 26 zeigt eine Mikrofonarrayvorrichtung der verwandten Technik; und
    • 27 zeigt eine Mikrofonarrayvorrichtung der verwandten Technik.
  • BESCHREIBUNG DER AUSFÜHRUNGSFORMEN
  • Gemäß dem oben beschriebenen Synchronsubtraktionsverfahren in 26 subtrahiert eine Subtraktionseinheit 2 eine Ausgabe einer Verzögerungseinheit 1 von einem Tonsignal, das einen Zielton enthält, um Geräusch zu unterdrücken. Somit wird ein Spektrum des Tonsignals, das den Zielton enthält, verzerrt, und dies kann zum Beispiel solch einen Einfluss haben, dass die Qualität des Zieltons, der schließlich ausgegeben wird, verändert sein kann.
  • Darüber hinaus kann die Mikrofonarrayvorrichtung fälschlicherweise erkennen, dass eine Zieltonquelle SS in einer Unterdrückungsrichtung existiert, selbst wenn die Zieltonquelle SS in einer Tonempfangsrichtung liegt. Solch eine fälschliche Erkennung kann verursacht werden durch eine Schwankung einer Ankunftsrichtung eines Tons aufgrund einer Bewegung beispielsweise eines Sprechers, der eine Zieltonquelle SS ist, einer Reflexion von einer Wand und eines Umgebungsmilieus wie etwa eines Luftstroms. In diesem Fall sieht die Mikrofonarrayvorrichtung einen Zielton, der aus der Unterdrückungsrichtung kommt, als Geräusch an, selbst wenn die Zieltonquelle SS tatsächlich in der Tonempfangsrichtung liegt, und führt die Synchronsubtraktion aus, wie -oben beschrieben. Die oben beschriebene fälschliche Erkennung führt auch zu einer Verzerrung eines Spektrums des Tonsignals, das den Zielton enthält, der von der Subtraktionseinheit 2 ausgegeben wird, und dies kann zum Beispiel solch einen Einfluss haben, dass die Qualität des Zieltons, der schließlich ausgegeben wird, verändert sein kann.
  • Ein ähnliches Phänomen wird auch im Falle von 27 verursacht. Zum Beispiel kann die Mikrofonarrayvorrichtung aufgrund einer Tonschwankung durch das Umgebungsmilieu fälschlicherweise erkennen, dass die Zieltonquelle SS in dem Umstellbereich und dem Unterdrückungsbereich existiert, ungeachtet dessen, dass die Zieltonquelle SS tatsächlich im Tonempfangsbereich liegt. In diesem Fall wird der Zielton, der aus dem Umstellbereich und dem Unterdrückungsbereich kommt, als Geräusch angesehen, und der Zielton wird durch die Verarbeitung durch die Phasenspektrendifferenzberechnungseinheit 4, die Verstärkungsberechnungseinheit 5 und die Geräuschunterdrückungseinheit 6 unterdrückt. So kann ein Spektrum des Tonsignals, das den Zielton enthält, das von einem IFFT 7 ausgegeben wird, verzerrt sein, und dies kann zum Beispiel solch einen Einfluss haben, dass die Qualität des Zieltons verändert sein kann.
  • Wenn ein Zielton von einer Zieltonquelle SS zum Beispiel durch ein Mobiltelefon empfangen wird, können sich die Tonempfangsrichtung und der Tonempfangsbereich weiterhin in Abhängigkeit davon verändern, wie das Mobiltelefon durch den Nutzer gehalten wird. In diesem Fall nimmt die Mikrofonarrayvorrichtung den Zielton als Geräusch an, wenn der Zielton aus der Unterdrückungsrichtung, oder dem Unterdrückungsbereich und dem Umstellbereich, empfangen wird. Als Resultat wird der Zielton verzerrt.
  • Das Unterdrücken von Geräusch beispielsweise unter Verwendung des oben beschriebenen Synchronsubtraktiönsverfahrens in 26 und des in 27 gezeigten Verfahrens ist notwendig. Ferner lässt sich nicht vermeiden, dass fälschlicherweise erkannt wird, wie oben beschrieben, dass die Zieltonquelle SS an einer anderen Position liegt, beispielsweise aufgrund des Umgebungsmilieus, und sie dadurch als Geräusch angesehen wird und unterdrückt wird. Des Weiteren lässt sich auch nicht vermeiden, dass die Tonempfangsrichtung und der Tonempfangsbereich aufgrund einer Bewegung einer Vorrichtung verändert werden. Jedoch sind das Unterdrücken der Verzerrung des Zieltons und das Verbessern der Tonqualität erforderlich.
  • Daher sehen hierin offenbarte Ausführungsformen eine Technologie zum Unterdrücken der Verzerrung eines Zieltons vor, während Geräusch unterdrückt wird.
  • Gemäß einer unten beschriebenen Ausführungsform wird eine Verarbeitung unter Verwendung von Tonsignalen ausgeführt, die durch zwei Mikrofone von einer Vielzahl von Mikrofonen erhalten werden. Von den zwei Mikrofonen erhält ein Mikrofon hauptsächlich einen Ton, der einen Zielton aus einer Tonempfangsrichtung oder einem Tonempfangsbereich enthält. Das andere Mikrofon erhält hauptsächlich einen Ton, der Geräusch aus einer Unterdrückungsrichtung, einem Unterdrückungsbereich oder einem Umstellbereich enthält. Mit anderen Worten: das Mikrofon, das in der Tonempfangsrichtung oder in dem Tonempfangsbereich positioniert ist, erhält ein Nichtunterdrückungstonsignal als Torisignal aus einer Nichtunterdrückungsrichtung, die nicht die Unterdrückungsrichtung, der Unterdrückungsbereich oder der Umstellbereich ist. Andererseits erhält das Mikrofon, das in der Unterdrückungsrichtung, dem Unterdrückungsbereich oder dem Umstellbereich positioniert ist, ein Unterdrückungstonsignal. Das Nichtunterdrückungstonsignal enthält einen Zielton, während das Unterdrückungstonsignal einen Nichtzielton enthält. Der Nichtzielton unterscheidet sich von dem Zielton und ist zum Beispiel Geräusch.
  • Eine Mikrofonarrayvorrichtung gemäß der unten beschriebenen Ausführungsform unterdrückt die Verzerrung eines Zieltons, während sie Geräusch unterdrückt. Die Mikrofonarrayvorrichtung erhält einen Bewertungsparameter, um einen Einfluss eines Nichtzieltons auf den Zielton auf der Basis eines Resultates eines Vergleichs zwischen einem Nichtunterdrückungstonsignal aus der Nichtunterdrückungsrichtung und einem Unterdrückungstonsignal aus der Unterdrückungsrichtung zu bewerten. Die Mikrofonarrayvorrichtung steuert einen Unterdrückungsbetrag des Nichtzieltons auf der Basis des Bewertungsparameters. Ferner steuert die Mikrofonarrayvorrichtung die Richtwirkung der Mikrofone.
  • Der Bewertungsparameter enthält einen Parameter, der einen Geräuschzustand angibt, wie etwa einen Geräuschpegel und eine Geräuschpegelveränderung. Weiterhin enthält der Bewertungsparameter einen Parameter, der eine Richtung einer Zieltonquelle durch ein Bewertungsresultat eines Pegels jedes Tonsignals angibt. Nachfolgend werden Beispiele für Verfahren zum Unterdrücken von Geräusch auf der Basis eines Bewertungsparameters, der einen Geräuschzustand angibt, unter Bezugnahme auf die ersten bis dritten Ausführungsformen beschrieben. Außerdem wird ein Beispiel für ein Verfahren zum Bestimmen einer Tonempfangsrichtung auf der Basis eines Bewertungsparameters, der eine Zieltonrichtung angibt, durch eine vierte Ausführungsform beschrieben.
  • Erste Ausführungsform
  • Gemäß der ersten Ausführungsform erhält eine Mikrofonarrayvorrichtung einen Geräuschzustand durch das Verarbeiten von Tonsignalen, die durch zwei Mikrofone, erhalten werden, auf einer Zeitachse, und sie unterdrückt Geräusch durch eine Synchronsubtraktionsverarbeitung auf der Basis des Geräuschzustandes.
  • Hardware-Konfiguration
  • 1 ist ein Beispiel für ein Blockdiagramm, das eine Hardware-Konfiguration einer Mikrofonarrayvorrichtung gemäß der ersten Ausführungsform zeigt. Eine Mikrofonarrayvorrichtung 100 enthält eine zentrale Verarbeitungseinheit (CPU) 101, einen Nur-Lese-Speicher (ROM) 102, einen Speicher mit wahlfreiem Zugriff (RAM) 103, eine Mikrofonarrayvorrichtung 104 und eine Kommunikationsschnittstelle (I/F) 105.
  • Die Mikrofonarrayvorrichtung 104 enthält wenigstens zwei Mikrofone und enthält hier die Mikrofone MIC1, MIC2, ... MICn (n ist eine ganze Zahl und größer 3). Das Steuern der Richtwirkung der Mikrofonarrayvorrichtung 104 gestattet es, hauptsächlich einen gewünschten Zielton aus einer Tonempfangsrichtung zu empfangen, wodurch Geräusch unterdrückt werden kann.
  • Der ROM 102 speichert verschiedene Steuerprogramme für verschiedene Steuerungen, die später beschrieben werden, welche durch die Mikrofonarrayvorrichtung 100 ausgeführt werden. Die verschiedenen Programme enthalten zum Beispiel ein Programm, um einen Geräuschzustand zu erhalten, und ein Programm, um Geräusch zu unterdrücken, die später beschrieben werden. Der ROM 102 speichert verschiedene Werte, wie etwa einen Wert A1 und einen Wert A2 als Schwellen, und Konstanten oder Koeffizienten, wie etwa α, β und τ, die später beschrieben werden. Weiterhin speichert der ROM 102 Beziehungen, die zum Beispiel zwischen Geräuschpegel L(f). und relativem Wert des Pegels(f) und zwischen Geräuschpegelveränderung S(f) und Rate(f) festgelegt sind und später beschrieben werden.
  • Der RAM 103 speichert temporär verschiedene Steuerprogramme in dem ROM 102 und Tonsignale, die durch die Mikrofonarrayvorrichtung 104 erhalten werden. Der RAM 103 speichert temporär Informationen, wie etwa verschiedene Flags gemäß der Ausführung von verschiedenen Steuerprogrammen.
  • Die CPU 101 expandiert verschiedene Programme, die im ROM 102 gespeichert sind, auf dem RAM 103 und führt verschiedene Steuerungen aus.
  • Eine Kommunikations-I/F 105 verbindet die Mikrofonarrayvorrichtung 100 mit einem externen Netz etc. auf der Basis der Steuerung durch die CPU 101. Zum Beispiel ist die Mikrofonarrayvorrichtung 100 durch die Kommunikations-I/F 105 mit einer Tonerkennungsvorrichtung verbunden und gibt ein Tonsignal, das durch die Mikrofonarrayvorrichtung 100 verarbeitet wird, an die Tonerkennungsvorrichtung aus.
  • Funktionelle Konfiguration
  • 2 ist ein Blockdiagramm, das eine funktionelle Konfiguration der Mikrofonarrayvorrichtung gemäß der ersten Ausführungsform zeigt. 2 zeigt ein Mikrofon MIC1 und ein Mikrofon MIC2 von einem Mikrofonarray 104 der Mikrofonarrayvorrichtung 100. Hier sind das Mikrofon MIC1 und das Mikrofon MIC2 Richtmikrofone und entlang einer im Wesentlichen geraden Linie angeordnet.
  • In 2 ist die Zieltonquelle SS auf der linken Seite des Mikrofons MIC1 positioniert, während die Tonempfangsrichtung auf der linken Seite des Mikrofons MIC1 liegt. Ferner liegt die Unterdrückungsrichtung auf der rechten Seite des Mikrofons MIC2. Hier ist die Zieltonquelle SS eine Tonquelle, wo ein Zielton erzeugt wird. Die Tonempfangsrichtung ist eine Richtung, wo die Zieltonquelle SS enthalten ist. Indessen ist die Unterdrückungsrichtung eine Richtung, die zum Beispiel zu der Tonempfangsrichtung entgegengesetzt ist. Die Unterdrückungsrichtung ist zum Beispiel auf eine Richtung festgelegt, die sich um 180 Grad von der Tonempfangsrichtung unterscheidet. Ferner wird gemäß der Ausführungsform der Ton, der aus der Unterdrückungsrichtung kommt, als Geräusch angesehen. Die Tonempfangsrichtung und die Unterdrückungsrichtung können durch einen Nutzer durch eine Nutzereingabeakzeptanzeinheit (nicht gezeigt) der Mikrofonarrayvorrichtung 100 festgelegt werden. Alternativ kann eine Richtungsidentifikationseinheit (nicht gezeigt) der Mikrofonarrayvorrichtung 100 eine Zieltonquelle SS identifizieren. Die Tonempfangsrichtung und die Unterdrückungsrichtung können auf der Basis der identifizierten Zieltonquelle SS festgelegt werden.
  • Eine Distanz d zwischen dem Mikrofon MIC1 und dem Mikrofon MIC2 wird durch den folgenden Ausdruck (1) festgelegt, um dem Abtasttheorem zu genügen. Mikrofon-Distanz d = Schallgeschwindigkeit c/Abtastfrequenz fs
    Figure DE102011108234B4_0002
  • Die Verarbeitung durch Funktionseinheiten, der Mikrofonarrayvorrichtung 100 erfolgt in Zusammenarbeit mit der CPU 101, dem ROM 102, dem RAM 103 und dem Mikrofonarray 104 usw.
  • Die Funktionseinheiten der Mikrofonarrayvorrichtung 100 enthalten zum Beispiel eine erste Tonempfangseinheit 111, eine zweite Tonempfangseinheit 112, eine erste Verzögerungseinheit 113, eine erste Subtraktionseinheit 114, eine zweite Verzögerungseinheit 115, eine zweite Subtraktionseinheit 116, eine Geräuschzustandsbewertungseinheit 117 und eine Subtraktionsanpassungseinheit 118 Jede der Funktionseinheiten wird unten beschrieben.
  • Die erste Tonempfangseinheit und die zweite Tonempfangseinheit
  • Das Mikrofon MIC1 erhält einen Ton, der einen Zielton enthält. Das Mikrofon MIC1 konvertiert den erhaltenen Ton in ein analoges Signal und gibt das analoge Signal der ersten Tonempfangseinheit 111 ein. Die erste Tonempfangseinheit 111 enthält einen Verstärker (AMP) 111a, ein Tiefpassfilter (LPF) 111b und einen Analog-Digital-(A/D)-Konverter 111c. Die erste Tonempfangseinheit 111 erzeugt ein Tonsignal durch das Verarbeiten des Tons, der den Zielton enthält und von dem Mikrofon MIC1 eingegeben wird.
  • Der AMP 111a verstärkt das analoge Signal, das von dem Mikrofon MIC1 eingegeben wird, und gibt das verstärkte Signal dem LPF 111b ein.
  • Das LPF 111b, das ein Tiefpassfilter ist, wendet eine Tiefpassfilterung auf eine Ausgabe des AMP 111a zum Beispiel durch eine Grenzfrequenz fc an. Hier wird typischerweise das Tiefpassfilter verwendet. Das Tiefpassfilter kann jedoch zusammen mit einem Bandpassfilter oder einem Hochfrequenzpassfilter verwendet werden.
  • Der A/D-Konverter 111c nimmt eine Ausgabe des LPF 111b mit einer Abtastfrequenz fs (fs>2fc) auf und konvertiert die Ausgabe des LPF 111b in ein digitales Signal. Der A/D-Konverter 111c gibt ein Tonsignal in1(ti) auf einer Zeitachse aus.
  • Das Mikrofon MIC2 erhält einen Ton, der Geräusch enthält, konvertiert den Ton in ein analoges Signal und gibt es der zweiten Tonempfangseinheit 112 ein. Die zweite Tonempfangseinheit 112 enthält einen AMP 112a, ein LPF 112b und einen A/D-Konverter 112c. Die zweite Tonempfangseinheit 112 verarbeitet den Ton, der Geräusch enthält und von dem Mikrofon MIC2 eingegeben wird, um ein Tonsignal zu erzeugen. Die Verarbeitung durch den AMP 112a, das LPF 112b und den A/D-Konverter 112c ist im Wesentlichen dieselbe wie jene des AMP 111a, des LPF 111b und des A/D-Konverters 111c. Die zweite Tonempfangseinheit 112 gibt ein Tonsignal in2(ti) als digitales Signal auf einer Zeitachse aus.
  • Die zweite Verzögerungseinheit und die zweite Subtraktionseinheit
  • Die zweite Verzögerungseinheit 115 und die zweite Subtraktionseinheit 116 steuern die Richtwirkung, des Mikrofonarrays, das aus dem Mikrofon MIC1 und dem Mikrofon MIC2 gebildet ist. Zum Beispiel steuern die zweite Verzögerungseinheit 115 und die zweite Subtraktionseinheit 116 die Richtwirkung so, dass ein Ton aus einer anderen Richtung als der Tonempfangsrichtung, mit anderen Worten, ein Ton aus der Unterdrückungsrichtung, aufgenommen wird. Ein Beispiel für die Richtwirkung eines Tonsignals, das von der zweiten Verzögerungseinheit 115 und der zweiten Subtraktionseinheit 116 ausgegeben wird, ist in 2 durch die durchgehende Linie als „entgegengesetzte Richtwirkung“ gezeigt. Die Mikrofonarrayvorrichtung 100 erhält einen Ton, der Geräusch enthält und aus der Unterdrückungsrichtung kommt.
  • Die Verarbeitung durch die zweite Verzögerungseinheit 115 und die zweite Subtraktionseinheit, 116 wird auf eine Richtung angewendet, die zu der Verarbeitung durch die erste Verzögerungseinheit 113 und die erste Subtraktionseinheit 114 entgegengesetzt ist. Die Verarbeitung durch die erste Verzögerungseinheit 113 und die erste Subtraktionseinheit 114 steuert die Richtwirkung so, dass ein Ton aus der Tonempfangsrichtung aufgenommen wird, wie später beschrieben wird. Mit anderen Worten: die Richtwirkung, die durch die erste Verzögerungseinheit 113 und die erste Subtraktionseinheit 114 gesteuert wird, ist durch die gestrichelte Linie in 2 als „positive Richtwirkung“ angegeben. Hier beträgt eine Differenz zwischen der Tonempfangsrichtung und der Unterdrückungsrichtung 180 Grad, und die „positive Richtwirkung“ und die „entgegengesetzte Richtwirkung“ sind links und rechts symmetrisch.
  • Die zweite Verzögerungseinheit 115 empfängt ein Tonsignal in1(ti), das einen Zielton enthält, von der ersten Tonempfangseinheit 111. Die zweite Verzögerungseinheit 115 erzeugt ein Tonsignal, das durch Verzögern des Tonsignals in1(ti) um eine gewisse Periode Ta erhalten wird. Das durch die zweite Verzögerungseinheit 115 verzögerte Tonsignal wird dargestellt durch, in1(ti-1). Die gewisse Periode Ta ist hier zum Beispiel die Zeit, die von einer Mikrofon-Distanz d zwischen dem Mikrofon MIC1 und dem Mikrofon MIC2 abhängt. Wenn die Mikrofon-Distanz d so wie in dem obigen Ausdruck (1) festgelegt wird, ist die gewisse Periode Ta durch folgenden Ausdruck definiert: Signalabtastintervall = 1 /Abtastfrequenz fs
    Figure DE102011108234B4_0003
  • Dabei ist ti die Zeit, wenn ein Tonsignal in dem Mikrofon aufgenommen wird, und der Index i von t ist eine Abtastnummer jedes Tonsignals, wenn der Ton mit einer Abtastfrequenz fs aufgenommen wird. Hier ist ti eine ganze Zahl größer gleich 1.
  • Die zweite Subtraktionseinheit 116 empfängt ein Tonsignal in2(ti), das Geräusch enthält, von der zweiten Tonempfangseinheit 112 und subtrahiert das Tonsignal in1(ti-1) nach Anwenden der Verzögerung von dem Tonsignal in2(ti). Mit anderen Worten: die zweite Subtraktionseinheit 116 berechnet ein Geräuschsignal N(ti) durch den folgenden Ausdruck (2). Geräuschsignal N ( t i ) = Tonsignal in2  ( t i ) Tonsignal in1  ( t i 1 )
    Figure DE102011108234B4_0004
  • Die oben beschriebene Verarbeitung legt die Richtwirkung des Geräuschsignals N(ti), das von der zweiten Subtraktionseinheit 116 ausgegeben wird, auf „entgegengesetzte Richtwirkung“ fest. Mit anderen Worten: hauptsächlich wird ein Ton aus einer anderen Richtung als der Tonempfangsrichtung, die eine Zieltonquelle SS enthält, aufgenommen, während ein Tonsignal, das einen Zielton enthält, aus der Tonempfangsrichtung unterdrückt wird. Als Resultat gibt die zweite Subtraktionseinheit 116 ein Geräuschsignal N(ti) aus, in dem das Geräusch aus der Unterdrückungsrichtung hervorgehoben ist. Die Mikrofonarrayvorrichtung 100 gemäß der Ausführungsform kann einen Geräuschzustand durch das Geräuschsignal N(ti) erkennen.
  • Geräuschzustandsbewertungseinheit
  • Die Geräuschzustandsbewertungseinheit 117 bewertet einen Geräuschzustand auf der Basis des Geräuschsignals N(ti), das eine Ausgabe der zweiten Subtraktionseinheit 116 ist. Der Geräuschzustand enthält zum Beispiel einen Geräuschpegel und eine Geräuschpegelveränderung. Der Geräuschpegel ist ein Indikator, der eine Größe des Geräuschs darstellt. Die Geräuschpegelveränderung ist ein Indikator, der darstellt, ob die zeitliche Geräuschpegelveränderung groß oder klein ist. Wenn eine Geräuschpegelveränderung klein ist, ist die Stabilität des Geräuschs hoch. Mit anderen Worten: die Nichtstabilität des Geräuschs ist niedrig. Wenn umgekehrt die Geräuschpegelveränderung groß ist, ist die Stabilität des Geräuschs niedrig. Mit anderen Worten: die Nichtstabilität des Geräuschs ist hoch. Der Geräuschpegel und die Geräuschpegelveränderung werden zum Beispiel durch die Ausdrücke (3) und (4) unten dargestellt. Geräuschpegel L ( t i ) = 10log 10 ( N ( t i ) 2 )
    Figure DE102011108234B4_0005
    Geräuschpegelveränderung S ( t i ) = Geräuschpegel L ( t i ) /Durchschnittswert des Geräuschpegels vor der Zeit t i
    Figure DE102011108234B4_0006
  • Die Geräuschzustandsbewertungseinheit 117 kann einen kombinierten Wert, LS(ti) als Funktion erhalten, worin sowohl der Geräuschpegel L(ti) als auch die Geräuschpegelveränderung S(ti) Variablen sind.
  • Subtraktionsanpassungseinheit
  • Die Subtraktionsanpassungseinheit 118 legt eine Verstärkung g(ti) zum Anpassen eines Geräuschunterdrückungsbetrages auf einer Zeitachse gemäß einem Geräuschzustand fest. Durch das Anpassen der Verstärkung g(ti) wird ein Eingabe- und Ausgabeverhältnis der Subtraktionsanpassungseinheit 118 angepasst. Die Subtraktionsanpassungseinheit 118 passt einen Subtraktiönsbetrag an, wenn die erste Subtraktionseinheit 114 das Tonsignal in2(ti-1) von dem Tonsignal in1(ti) subtrahiert. Als Resultat wird ein Unterdrückungsbetrag des Geräuschs angepasst, das in einem Ton enthalten ist, der durch das Mikrofon MIC1 erhalten wird. Die Verstärkung g(ti) ist größer gleich 0 und kleiner gleich 1,0. Zudem kann die Verstärkung g(ti) bei jedem Abtasten eines Tonsignals aktualisiert werden. Alternativa kann die Verstärkung g(ti) in Einheiten einer Vielzahl, von Abtastungen aktualisiert werden.
  • Zum Beispiel nähert die Subtraktionsanpassungseinheit 118 die Verstärkung g(ti) mehr an 1, 0 an, wenn der Geräuschpegel L(ti) höher wird. Die Subtraktionsanpassungseinheit 118 nähert die Verstärkung g(ti) mehr an 1,0 an, wenn eine Geräuschpegelveränderung L(ti) größer ist und die Stabilität niedriger ist. Die Subtraktionsanpassungseinheit 118 nähert die Verstärkung g(ti) mehr an 0 an, wenn eine Geräuschpegelveränderung L(ti) kleiner ist und die Stabilität höher ist. Spezifische Beispiele werden unten beschrieben.
  • Festlegung der Verstärkung g(ti) gemäß dem Geräuschpegel L(ti)
  • 3 zeigt ein Beispiel für eine Beziehung zwischen einem Geräuschpegel L(ti) und einer Verstärkung g(ti). Die Werte A1 und A2 sind Schwellen.
  • (a1) Geräuschpegel L(ti) < Wert A1: Verstärkung g ( t i ) = 0
    Figure DE102011108234B4_0007
  • Wenn der Geräuschpegel L(ti) zum Beispiel kleiner als der Wert A1 ist, bestimmt die Subtraktionsanpassungseinheit 118, dass der Geräuschpegel L(ti) niedrig ist, und legt die Verstärkung g(ti) auf 0 fest.
  • (a2) Geräuschpegel L(ti) > Wert A2: Verstärkung g ( t i ) = 1,0
    Figure DE102011108234B4_0008
  • Wenn umgekehrt der Geräuschpegel L(ti) größer als der Wert A2 ist, bestimmt die Subträktionsanpassungseinheit 118, dass der Geräuschpegel L(ti) hoch ist, und legt die Verstärkung g(ti) auf 1,0 fest.
  • (a3) Wert A1 ≤ Geräuschpegel L(ti) ≤ Wert A2
  • Wenn der Geräuschpegel L(ti) größer gleich dem Wert A1 und kleiner gleich dem Wert A2 ist, wird die Verstärkung g(ti) zum Beispiel, durch einen einfach gewichteten Durchschnitt festgelegt, der durch den folgenden Ausdruck (5) angegeben wird. Der einfach gewichtete Durchschnitt ist ein Beispiel, und es können genauso gut ein arithmetischer Durchschnitt, ein quadratisch gewichteter Durchschnitt und ein kubisch gewichteter Durchschnitt verwendet werden. Verstärkung g ( t i ) = ( Geräuschpegel L ( t i ) A1 ) / ( A2 A1 )
    Figure DE102011108234B4_0009
  • (b) Festlegung der Verstärkung g(ti) gemäß einer Geräuschpegelveränderung S(ti)
  • 4 zeigt ein Beispiel für eine Beziehung zwischen einer Geräuschpegelveränderung S(ti) und einer Verstärkung g(ti). Die Werte B1 und B2 sind Schwellen.
  • (b1) Geräuschpegelveränderung S(ti) < Wert B1: Verstärkung g ( t i ) = 0
    Figure DE102011108234B4_0010
  • Wenn eine Geräuschpegelveränderung S(ti) zum Beispiel kleiner als der Wert B1 ist, bestimmt die Subtraktionsanpassungseinheit 118, dass die Geräuschpegelveränderung klein ist und die Stabilität hoch ist, und legt die Verstärkung g(ti) auf 0 fest.
  • (b2) Geräuschpegelveränderung S(ti) > Wert B2: Verstärkung g ( t i ) = 1,0
    Figure DE102011108234B4_0011
  • Wenn umgekehrt eine Geräuschpegelveränderung S(ti) größer als der Wert B2 ist, bestimmt die Subtraktionsanpassungseinheit 118, dass die Geräuschpegelveränderung groß ist und die Stabilität niedrig ist, und legt die Verstärkung g(ti) auf 1,0 fest.
  • (b3) Wert B1 ≤ Geräuschpegelveränderung S(ti) ≤ Wert B2
  • Wenn die Geräuschpegelveränderung S(ti) größer gleich dem Wert B1 und kleiner gleich dem Wert B2 ist, legt die Subtraktionsanpassungseinheit 118 die Verstärkung g(ti) durch einen einfach gewichteten Durchschnitt durch den folgenden Ausdruck (6) fest. Der einfach gewichtete Durchschnitt ist ein Beispiel, und es können genauso gut ein arithmetischer Durchschnitt, ein quadratisch gewichteter Durchschnitt und ein kubisch gewichteter Durchschnitt verwendet werden. Verstärkung g ( t i ) = ( Geräuschpegelveränderung S ( t i ) B1 ) / ( B2 B1 )
    Figure DE102011108234B4_0012
  • (c) Festlegung der Verstärkung g(ti) gemäß dem Geräuschpegel L(ti) und der Geräuschpegelveränderung S(ti)
  • Die Subtraktionsanpassungseinheit 118 kann eine Verstärkung g(ti) entweder auf der Basis des Geräuschpegels L(ti) oder der Geräuschpegelveränderung S(ti) oder sowohl auf der Basis des Geräuschpegels L(ti) als auch der Geräuschpegelveränderung S(ti) festlegen.
  • Wenn zum Beispiel, der Geräuschpegel L(ti) < Wert A1 ist und/oder die Geräuschpegelveränderung S(ti) < Wert B1 ist, legt die Subtraktionsanpassungseinheit 118 die Verstärkung g(ti) auf 0 fest. Wenn ferner der Geräuschpegel L(ti) > Wert A2 ist und/oder die Geräuschpegelveränderung S(ti) > Wert B2 ist, legt die Subtraktionsanpassungseinheit 118 die Verstärkung g(ti) auf 1,0 fest.
  • Wenn eine der folgenden Bedingungen erfüllt ist: Wert, A1 ≤ Geräuschpegel L(ti) ≤ Wert A2 und/oder Wert B1 ≤ Geräuschpegelveränderung S (ti) ≤ Wert B2, kann die Verstärkung g(ti) wie folgt festgelegt werden. Die Subtraktionsanpassungseinheit 118 legt die Verstärkung g(ti) auf der Basis des obigen Ausdrucks (5) fest, wenn ein Geräuschzustand, der die Bedingung erfüllt, der Geräuschpegel L(ti) ist. Ferner legt die Subtraktionsanpassungseinheit 118 die Verstärkung g(ti) auf der Basis des obigen Ausdrucks (6) fest, wenn ein Geräuschzustand, der die Bedingung erfüllt, der Geräuschpegel S(ti) ist. Indessen legt die Subtraktionsanpassungseinheit 118 die Verstärkung g(ti) auf der Basis des obigen Ausdrucks (5) oder des Ausdrucks (6) fest, wenn beide Bedingungen erfüllt sind.
  • Abgesehen von den oben beschriebenen Festlegungen , kann die Subtraktionsanpassungseinheit 118 die Verstärkung g(ti) gemäß einem kombinierten Wert LS(ti) festlegen. Daher kann eine Geräuschunterdrückungsverarbeitung ausgeführt werden, die den Geräuschpegel L(ti) und die Geräuschpegelveränderung S(ti) berücksichtigt.
  • Die Subtraktionsanpassungseinheit 118 empfängt ein Tonsignal in2(ti-1) von einer ersten Verzögerungseinheit 113, die später beschrieben wird. Die Subtraktionsanpassungseinheit 118 multipliziert das Tonsignal in2(ti) mit der Verstärkung g(ti) und gibt das Multiplikationsresultat an die erste Subtraktionseinheit 114 aus.
  • Die erste Verzögerungseiriheit und die erste Subtraktionseinheit
  • Die erste Verzögerungseinheit 113 und die erste Subtraktionseinheit 114 steuern die Richtwirkung so, dass hauptsächlich ein Ton aus der Tonempfangsrichtung aufgenommen wird. Die Richtwirkung ist in 2 durch die gestrichelte Linie als „positive Richtwirkung“ angegeben. Daher erhält das Mikrofonarray hauptsächlich einen Ton, der einen Zielton enthält, der aus der Tonempfangsrichtung kommt.
  • Die erste Verzögerungseinheit 113 nimmt ein Tonsignal in2(ti), das Geräusch enthält, von der zweiten Tonempfangseinheit 112 auf. Die erste Verzögerungseinheit 113 erzeugt ein Tonsignal, zum Beispiel in2(ti-1), das durch Verzögern des Tonsignals in2(ti) um eine gewisse Periode Ta erhalten wird. Die erste Verzögerungseinheit 113 gibt das in2(ti-1) an die Subtraktionsanpassungseinheit 118 aus.
  • Die erste Subtraktionseinheit 114 empfängt ein Tonsignal in1(ti), das einen Zielton enthält, von der ersten Tonempfangseinheit 111. Die erste Subtraktionseinheit 114 empfängt ein Resultat des Multiplizierens des Tonsignals in2 (ti-1) mit. der Verstärkung g(ti) von der Subtraktionsanpassungseinheit 118. Die erste Subtraktionseinheit 114 subtrahiert das Multiplikationsresultat von dem Tonsignal in1(ti) und gibt ein Zieltonsignal OUT (ti) aus, wie durch den Ausdruck (7) unten dargestellt. Zieltonsignal OUT ( t i ) = Tonsignal in1 ( t i ) Tonsignal in2 ( t i 1 ) × Verstärkung g ( t i )
    Figure DE102011108234B4_0013
  • Durch die oben beschriebene Verarbeitung gibt das Zieltonsignal OUT(ti), das von der ersten Subtraktionseinheit 114 ausgegeben wird, eine Richtwirkung an, durch die ein Ton aus der Tonempfangsrichtung aufgenommen wird, wie durch die gestrichelte Linie in 2 gezeigt. Mit anderen Worten: ein Tonsignal, das Geräusch enthält, das aus der Unterdrückungsrichtung kommt, wird unterdrückt. Als Resultat gibt die erste Subtraktionseinheit 114 ein Zieltonsignal OUT(ti), aus, in dem ein Zielton aus der Tönempfangsrichtung hervorgehoben ist.
  • Die Verstärkung g(ti) bestimmt einen Subtraktionsbetrag des Tonsignals in2(ti-1), der von dem Tonsignal in1(ti) durch die erste Subtraktionseinheit 114 zu subtrahieren ist. Mit anderen Worten: die Verstärkung g(ti) bestimmt einen Unterdrückungsbetrag von Geräusch in dem Tonsignal in1(ti), das den Zielton enthält. Ferner wird ein Unterdrückungsbetrag von Geräusch durch einen Geräuschzustand bestimmt, weil die Verstärkung g(ti) durch einen Geräuschzustand bestimmt wird, wie oben beschrieben.
  • Geräusch wird unterdrückt, wie oben beschrieben, wenn es gemäß einem Geräuschzustand notwendig ist, oder eine Unterdrückungsverarbeitung wird gemildert oder gestoppt, wenn die Notwendigkeit zum Unterdrücken von Geräusch klein ist. Daher wird eine Verzerrung eines Zieltons von einer Zieltonquelle SS unterdrückt, während Geräusch unterdrückt wird.
  • Die Mikrofonarrayvorrichtung 100 kann fälschlicherweise erkennen, dass eine Zieltonquelle SS in dem Tonempfangsbereich in der Unterdrückungsrichtung existiert. Die fälschliche Erkennung kann verursacht werden durch eine Schwankung einer Ankunftsrichtung des Tons aufgrund einer Bewegung zum Beispiel eines Sprechers, der eine Zieltonquelle SS ist, einer Reflexion von einer Wand und eines Umgebungsmilieus wie etwa eines Luftstroms. Selbst in dem obigen Fall kann die Verzerrung des Zieltons unterdrückt werden, wenn ein Grad der Geräuschunterdrückung klein ist, weil Geräusch gemäß dem Geräuschzustand unterdrückt wird.
  • Das Identifizieren einer Richtung einer Tonquelle von Geräusch mit hoher Stabilität durch ein Mikrofonarray ist generell schwierig. Zum Beispiel kommt Geräusch mit hoher Stabilität im Allgemeinen aus verschiedenen Richtungen, und die Geräuschpegelveränderung ist klein. Somit ist das Identifizieren der Tonquellenrichtung schwierig. Deshalb reduziert die Mikrofonarrayvorrichtung 100 gemäß der Ausführungsform den Unterdrückungsbetrag des Geräuschs. Mit anderen Worten: die Mikrofonarrayvorrichtung 100 steuert so, um statt Geräusch vielmehr eine Verzerrung eines Zieltons von der Zieltonquelle SS zu unterdrücken, wenn die Stabilität von Geräusch hoch,ist. Indessen ist das Identifizieren einer Tonquellenrichtung von Geräusch mit niedriger Stabilität im Allgemeinen leicht. Folglich unterdrückt die Mikrofonarrayvorrichtung das identifizierte Geräusch für den Zielton.
  • Verarbeitungsablauf
  • Nachfolgend wird die Verarbeitung gemäß der Ausführungsform unter Bezugnahme auf 5 beschrieben. 5 ist ein Beispiel für ein Flussdiagramm, das die Geräuschunterdrückungsverarbeitung zeigt, die durch die Mikrofonarrayvorrichtung gemäß der Ausführungsform ausgeführt wird.
  • Operation S1:
  • Die erste Tonempfangseinheit 111 erhält ein Tonsignal in1(ti), das einen Zielton enthält, aus der Tonempfangsrichtung. Die zweite Tonempfangseinheit 112 erhält ein Tonsignal in2(ti), das Geräusch enthält, aus der Unterdrückungsrichtung.
  • Operation S2:
  • Die zweite Verzögerungseinheit 115 empfängt das Tonsignal in1(ti), das den Zielton enthält, von der ersten Tonempfangseinheit 111 und erzeugt ein Tonsignal in1(ti-1), das erhalten wird, indem das Tonsignal in1(ti) um eine gewisse Periode Ta verzögert wird.
  • Operation S3:
  • Die zweite Subtraktionseinheit 116 subtrahiert das Tonsignal in1(ti) von dem Tonsignal in2(ti) und berechnet ein Geräuschsignal N(ti).
  • Operation S4:
  • Die Geräuschzustandsbewertungseinheit 117 bewertet einen Geräuschzustand auf der Basis eines Geräuschsignals N(ti), das eine Ausgabe von der zweiten Subtraktionseinheit 116 ist. Der Geräuschzustand enthält zum Beispiel einen Geräuschpegel (ti) und eine Geräuschpegelveränderung S(ti).
  • Operation S5:
  • Die Subtraktionsanpassungseinheit 118 legt eine Verstärkung g(ti) zum Anpassen eines Unterdrückungsbetrages von Geräusch auf einer Zeitachse gemäß einem Geräuschzustand fest.
  • Operation S6:
  • Die erste Verzögerungseinheit 113 empfängt ein Tonsignal in2(ti), das Geräusch enthält, von der zweiten Tonempfangseinheit 112 und erzeugt ein Tonsignal in2(ti-1), das erhalten wird, indem das Tonsignal in2(ti) um eine gewisse Periode Ta verzögert wird.
  • Operation S7:
  • Die Subtraktionsanpassungseinheit 118 multipliziert das Tonsignal in2 (ti-1) mit der Verstärkung g(ti) und gibt das Multiplikationsresultat an die erste Subtraktionseinheit 114 aus.
  • Operation S8:
  • Die erste Subtraktionseinheit 114 empfängt das Tonsignal in1(ti), das den Zielton enthält, von der ersten Tonempfangseinheit 111 und subtrahiert das Multiplikationsresultat von dem Tonsignal in1(ti).
  • Zweite Ausführungsform
  • Eine Mikrofonarrayvorrichtung 200 gemäß einer zweiten Ausführungsform erhält einen Geräuschzustand durch das Verarbeiten von. Tonsignalen, die durch zwei Mikrofone erhalten werden, auf einer Frequenzachse und unterdrückt das Geräusch durch eine Synchronsubtraktionsverarbeitung auf der Basis des Geräuschzustandes. Die Hardware-Konfiguration der Mikrofonarrayvorrichtung 200 gemäß der zweiten Ausführungsform ist im Wesentlichen dieselbe wie jene der ersten Ausführungsform. Ferner sind dieselben Bezugszeichen Komponenten zugeordnet, die dieselben wie in der ersten Ausführungsform sind.
  • Funktionelle Konfiguration
  • 6 ist ein Beispiel für ein Blockdiagramm, das eine funktionelle Konfiguration der Mikrofonarrayvorrichtung gemäß der zweiten Ausführungsform zeigt. 6 zeigt ein Mikrofon MIC1 und ein Mikrofon MIC2 in einem Mikrofonarray 104 der Mikrofonarrayvorrichtung 200. Hier sind das Mikrofon MIC1 und das Mikrofon MIC2 ungerichtete Mikrofone.
  • In 6 liegt eine Zieltonquelle SS auf der linken Seite des Mikrofons MIC1, während eine Tonempfangsrichtung, aus der ein Zielton kommt, auf der linken Seite des Mikrofons MIC1 liegt. Ferner liegt eine Unterdrückungsrichtung auf der rechten Seite des Mikrofons MIC2. Die Unterdrückungsrichtung ist mit 180 Grad zu der Tonempfangsrichtung entgegengesetzt. Ein gewisser Winkelbereich, der die Zieltonquelle SS enthält, ist als Tonempfangsbereich festgelegt. Ein gewisser Winkelbereich, der eine Unterdrückungsrichtung enthält, ist als Unterdrückungsbereich festgelegt. Ein Bereich zwischen dem Tonempfangsbereich und dem Ünterdrückungsbereich ist als Umstellbereich festgelegt. Der Umstellbereich erleichtert eine allmähliche Umstellung zwischen dem Unterdrückungsbereich und dem Tonempfangsbereich und eine allmähliche Veränderung eines Grades der Unterdrückung von Geräusch von dem Unterdrückungsbereich zu dem Tonempfangsbereich.
  • In 6 sind die Anfangsfestlegungen wie folgt: der Tonempfangsbereich ist ein Winkelbereich von 0 Grad bis -π, der Umstellbereich ist ein Winkelbereich von 0 Grad bis θ Grad und (π-θ) Grad bis π, und der Unterdrückungsbereich beträgt θ Grad bis (π-θ) Grad.
  • Eine Mikrofon-Distanz d zwischen dem Mikrofon MIC1 und dem Mikrofon MIC2 ist im Wesentlichen dieselbe wie jene in der ersten Ausführungsform.
  • Die Verarbeitung durch Funktionseinheiten der Mikrofonarrayvorrichtung 200 erfolgt in Zusammenarbeit mit der CPU 101, dem ROM 102, dem RAM 103 und dem Mikrofonarray 104.
  • Die Mikrofonarrayvorrichtung 200 enthält eine erste Tonempfangseinheit 111, eine zweite Tonempfangseinheit 112, eine Bereichsfestlegungseinheit 121, einen ersten Signalkonverter 122, einen zweiten Signalkonverter 123, eine Phasenspektrendifferenzberechnungseinheit 124, eine Geräuschzustandsbewertungseinheit 125, eine Synchronisationskoeffizientenberechnungseinheit 126, eine Synchronisationseinheit 127, eine Subtraktionseinheit 128 und eine Signalwiederherstellungseinheit 129. Gemäß der Ausführungsform enthält eine Unterdrückungseinheit 130 die Bereichsfestlegungseinheit 121, die Synchronisationskoeffizientenberechnungseinheit 126, die Synchronisationseinheit 127 und die Subtraktionseinheit 128. Nachfolgend wird jede der Funktionseinheiten beschrieben.
  • Bereichsfestlegungseinheit
  • Die Bereichsfestlegungseinheit 121 trifft Anfangsfestlegungen für einen Tonempfangsbereich, einen Umstellbereich und einen Unterdrückungsbereich für jedes Mikrofon zum Beispiel auf der Basis einer Nutzereingabe. Die Mikrofonarrayvorrichtung 200 akzeptiert eine Nutzereingabe durch eine Nutzereingabeakzeptanzeinheit (nicht gezeigt), und die Nutzereingabeakzeptanzeinheit gibt die akzeptierte Nutzereingabe an die Bereichsfestlegungseinheit 121 aus.
  • Die Bereichsfestlegungseinheit 121 kann Anfangsfestlegungen für einen Tonempfangsbereich, einen Umstellbereich und einen Unterdrückungsbereich für jedes Mikrofon auf der Basis von Anfangswerten treffen, die in dem ROM 203 gespeichert sind.
  • Darüber hinaus empfängt die Bereichsfestlegungseinheit 121 den Geräuschzustand von der Geräuschzustandsbewertungseinheit 125, der einen Geräuschpegel L(f), eine Geräuschpegelveränderung S(f) und einen kombinierten Wert LS(f) enthält. Die Bereichsfestlegungseinheit 121 steuert den Tonempfangsbereich, den Umstellbereich und den Unterdrückungsbereich auf der Basis des Zustandes des Geräuschs. Das Steuern der Bereiche wird in einem Abschnitt der Geräuschzustandsbewertungseinheit 125 beschrieben.
  • Die erste Tonempfangseinheit und die zweite Tonempfangseinheit
  • Die erste Tonempfangseinheit 111 und die zweite Tonempfangseinheit 112 sind im Wesentlichen dieselben wie jene der ersten Ausführungsform. Die erste Tonempfangseinheit 111 tastet ein Tonsignal von dem Mikrofon MIC1 mit einer gewissen Abtastfrequenz fs ab. Die erste Tonempfangseinheit 111 gibt ein Tonsignal in1(ti) als digitales Signal auf einer Zeitachse aus. Die zweite Tonempfangseinheit 112 tastet ein Tonsignal von dem Mikrofon MIC2 mit einer gewissen Abtastfrequenz fs ab. Die zweite Tonempfangseinheit 112 gibt ein Tonsignal in2(ti) als digitales Signal auf einer Zeitachse aus.
  • Erster Signalkonverter und zweiter Signalkonverter
  • Der erste Signalkonverter 122 führt eine Frequenzkonvertierung des Tonsignals in1(ti) auf der Zeitachse aus und erzeugt ein komplexes Spektrum IN1(f). Das f gibt hier eine Frequenz an. Für die Frequenzkonvertierung können zum Beispiel eine Schnelle Fourier-Transformation (FFT), eine Diskrete Kosinustransformation (DCT) und eine Wavelet-Transformation zum Einsatz kommen. Es kann auch eine Vielzahl von Bandpassfiltertechniken, wie etwa eine Subband-Zerlegung, verwendet werden. Hier verwendet der erste Signalkonverter 122 die FFT und multipliziert das Tonsignal in1(ti) mit einer Fensterfunktion, während jedes Signalintervall überlappt wird. Der erste Signalkonverter 122 wendet eine FFT auf das Multiplikationsresultat an und erzeugt ein komplexes Spektrum IN1(f) auf einer Frequenzachse.
  • Ebenso führt der zweite Signalkonverter 123 eine Frequenzkonvertierung des Tonsignals in2(ti) auf der Zeitachse aus und erzeugt ein komplexes Spektrum IN2(f) auf der Frequehzachse.
  • Das komplexe Spektrum IN1(f) und das komplexe Spektrum IN2(f)werden durch die folgenden Ausdrücke (8) und (9) dargestellt. IN1 ( f ) = W 1 ( f ) exp ( j ( 2 π ft i + φ 1 ( f ) ) )
    Figure DE102011108234B4_0014
    IN2 ( f ) = W 2 ( f ) exp ( j ( 2 π ft i + φ 2 f ) ) )
    Figure DE102011108234B4_0015
  • Das f stellt eine Frequenz dar, W1 und W2 stellen Amplituden dar, j stellt eine imaginäre Einheitszahl dar, φ1(f) und φ2(f) stellen Phasenverzögerungen dar, die Funktionen einer Frequenz f sind. Das ti stellt die Zeit dar, wenn ein Tonsignal dem Mikrofon zugeführt wird. Der Index i von t ist eine Abtastnummer jedes Tonsignals, wenn der Ton mit einer Abtastfrequenz fs aufgenommen wird. Der Index i ist eine ganze Zahl größer gleich 1.
  • Die Überlappungsfensterfunktionen enthalten die Hamming-Fensterfunktion, Hanning-Fensterfunktion, Blackman-Fensterfunktion, Gaußsche 3-Sigma-Fensterfunktion und Dreieck-Fensterfunktion.
  • Phasenspektrendifferenzberechnungseinheit
  • Die Phasenspektrendifferenzberechnungseinheit 124 empfängt das komplexe Spektrum IN1(f) und das komplexe Spektrum IN2(f) von dem ersten Signalkonverter 122 bzw. dem zweiten Signalkonverter 123. Die Phasenspektrendifferenzberechnungseinheit 124 berechnet eine Phasenspektrendifferenz DIFF(f) für jede Frequenz auf der Basis des komplexen Spektrums IN1(f) und des komplexen Spektrums IN2(f). Die Phasenspektrendifferenz DIFF(f) stellt eine Tonquellenrichtung für jede Frequenz f zwischen dem Mikrofon MIC1 und dem Mikrofon MIC2 dar, die mit der Distanz d beabstandet sind.
  • Die Phasenspektrendifferenz DIFF(f) wird durch den folgenden Ausdruck (10) dargestellt. DIFF ( f ) = tan 1 ( IN2 ( f ) /IN1 ( f ) ) = tan 1 ( ( W 2 ( f ) /W 1 ( f ) ) exp ( j ( φ 2 ( f ) φ 1 ( f ) ) )
    Figure DE102011108234B4_0016
  • 7 zeigt eine Beziehung zwischen jeder Frequenz und der Phasenspektrendifferenz DIFF(f) (-π ≤ DIFF(f) ≤ π), wenn jeder der Bereiche wie in 6 festgelegt wird. In 7 ist eine untere Seite der horizontalen Achse ein Tonempfangsbereich, ist eine obere Seite der horizontalen Achse ein Umstellbereich und ein Unterdrückungsbereich. Der schraffierte Bereich kennzeichnet den Umstellbereich.
  • Die Phasenspektrendifferenzberechnungseinheit 124 identifiziert einen Bereich, wo eine Tonquelle eines ankommenden Tons enthalten ist, auf der Basis der Beziehung in 7 und der Phasenspektrendifferenz DIFF(f). Wenn eine Phasenspektrendifferenz DIFF(f) bei einer gewissen Frequenz f zum Beispiel in dem Unterdrückungsbereich in 7 liegt, bestimmt die Phasenspektrendifferenzberechnungseinheit 124, dass eine Tonquelle des ankommenden Tons in dem Unterdrückungsbereich liegt. Wenn ferner eine Phasenspektrendifferenz DIFF(f) bei einer gewissen Frequenz f in dem Umstellbereich in 7 liegt, bestimmt die Phasenspektrendifferenzberechnungseinheit 124, dass eine Tonquelle des ankommenden Tons in dem Umstellbereich liegt.
  • Die Phasenspektrendifferenz DIFF(f) ist in einem von dem Tonempfangsbereich, dem Umstellbereich und dem Tonempfangsbereich enthalten, da die Mikrofon-Distanz d durch den Ausdruck (1) gemäß der ersten Ausführungsform festgelegt ist.
  • Das Verarbeiten eines Tonsignals für jede gewisse Frequenz auf der Frequenzachse gestattet es, wie oben beschrieben, eine Phasenspektrendifferenz zwischen jedem der Mikrofone genauer als beim Verarbeiten eines Tonsignals auf der Zeitachse zu detektieren. Zum Beispiel sind ein Zielton von einer Zieltonquelle SS und ein Geräusch, das bei verschiedenen Frequenzen durch eine andere Vielzahl von Tonquellen erzeugt wird, in einem Tonsignal von dem Mikrofon MIC1 und einem Tonsignal von dem Mikrofon MIC2 gleichzeitig, vorhanden. Daher können eine Tonquellenrichtung und ein Geräuschzustand für jeden Ton mit höherer Genauigkeit detektiert werden, indem eine Phasenspektrendifferenz für jede Frequenz detektiert wird.
  • Geräuschzustandsbewertungseinheit
  • Die Geräuschzustandsbewertungseinheit 125 empfängt einen Bereich einer Tonquelle eines ankommenden Tons, der durch die Phasenspektrendifferenz DIFF(f) von der Phasenspektrendifferenzberechnungseinheit 124 bestimmt wird. Die Geräuschzustandsbewertungseinheit 125 bewertet einen Geräuschzustand. Die Geräuschzustandsbewertungseinheit 125 sieht einen ankommenden Ton als Geräusch an, wenn die Phasenspektrendifferenz DIFF(f) in dem Unterdrückungsbereich in 7 enthalten ist; mit anderen Worten: die Tonquelle des ankommenden Tons ist bei einer Frequenz f in dem Unterdrückungsbereich enthalten. Wie oben beschrieben, bewertet die Geräuschzustandsbewertungseinheit 125 einen Geräuschzustand, wenn eine Tonquellenrichtung in dem Unterdrückungsbereich enthalten ist. Mit anderen Worten: die Geräuschzustandsbewertungseinheit 125 verwendet zum Bewerten eines Geräuschzustandes keinen Zielton, dessen Zieltonquelle in dem Tonempfangsbereich liegt. Die Geräuschzustandsbewertungseinheit 125 kann einen Ger-äuschzustand meistens auf der Basis des Geräuschs selbst genau bewerten.
  • Der Zustand des Geräuschs enthält zum Beispiel einen Geräuschpegel und eine Geräuschpegelveränderung, und Beispiele für das Berechnen des Geräuschpegels und der Geräuschpegelveränderung werden unten beschrieben.
  • Berechnen eines Geräuschzustandes
  • (a1) Berechnen eines Geräuschpegels L(f)
  • Es wird nun ein Verfahren zum Berechnen eines Geräuschpegels L(f) beschrieben.
  • Die Geräuschzustandsbewertungseinheit 125 berechnet einen Durchschnittswert von |IN1(f)| auf der Basis des folgenden Ausdrucks (11), wenn eine Tonquelle eines ankommenden Tons in dem Unterdrückungsbereich enthalten ist. Durchschnittswert von  | IN1 ( f ) | = β × ( Durchschnittswert eines Analyserahmens vor  | IN1 ( f ) | ) ( 1 β ) × | IN1 ( f ) |
    Figure DE102011108234B4_0017
  • Hier stellt β eine Zeitkonstante dar, um einen Durchschnittswert von |IN1(f)| zu erhalten, und gibt ein Additionsverhältnis oder ein Kombinationsverhältnis des vorhergehenden Analyserahmens an. Der vorhergehende Analyserahmen ist hier eine Verschiebung eines Analysefensters in dem FFT, oder mit anderen Worten, die Zeit, die für einen Betrag einer Überlappung zurückreicht. β ist größer als 0 und kleiner als 1,0.
  • Das Berechnen eines Durchschnitts von |IN1(f)| ist im Wesentlichen dasselbe wie das Anwenden eines Glättungsfilters auf |IN1(f)|, und in diesem Fall ist β eine Zeitkonstante des Glättungsfilters.
  • Die Geräuschzustandsbewertungseinheit 125 berechnet einen relativen Pegelwert (f) für ein volles Ausmaß eines Geräuschpegels, der durch einen Durchschnittswert von |IN1(f)| dargestellt wird. |IN1(f)|, das ein digitales Signal ist, wird durch Bit dargestellt. Das volle Ausmaß ist hier ein durch Dezibel dargestelltes Verhältnis eines im Wesentlichen maximalen Wertes und eines im Wesentlichen minimalen Wertes für den Pegel von |IN1(f)|, der durch Bit dargestellt wird. Wenn |IN1(f)| zum Beispiel durch, 16 Bit dargestellt wird, beträgt das Verhältnis des im Wesentlichen maximalen Wertes und des im Wesentlichen minimalen Wertes des Pegels von |IN1(f)| etwa 98 Dezibel. Daher kann in diesem Fall das volle Ausmaß auf 98 Dezibel festgelegt werden. Es sei erwähnt, dass sich ein Wert des vollen Ausmaßes gemäß der Anzahl von Bit verändert, die |IN1(f)| darstellen. Im Folgenden wird |IN1(f)| in 16 Bit dargestellt.
  • Der relative Pegelwert(f) des Durchschnittswertes von |IN1(f)| wird durch den folgenden Ausdruck (12) dargestellt. Relativer Pegelwert ( f ) = 10 log 10 ( Durchschnittswert von  | IN1 ( f ) | ) 2 = 20 log 10 ( Durchschnittswert von  | IN1 ( f ) | )
    Figure DE102011108234B4_0018
  • Ferner berechnet die Geräuschzustandsbewertungseinheit 125 einen Geräuschpegel L(f) auf der Basis einer Beziehung zwischen dem Geräuschpegel L(f) und dem relativen Pegelwert(f), der festgelegt ist.
  • 8 zeigt eine Beziehung zwischen einem Geräuschpegel L(f) und einem relativen Pegelwert(f). Die Geräuschzustandsbewertungseinheit 125 nimmt Bezug auf die Beziehung in 8 und erhält einen Geräuschpegel, der dem relativen Pegelwert (f) entspricht, wie unten beschrieben. Es sei erwähnt, dass der Geräuschpegel (L(f) in einem Bereich von 0 ≤ Geräuschpegel L(f) ≤ 1,0 definiert ist, und der Pegel wird höher, wenn der Geräuschpegel L(f) näher bei 1,0 liegt, und der Pegel ist niedriger, wenn der Geräuschpegel L(f) näher bei 0 liegt.
  • Wenn der relative Pegelwert (f) zum Beispiel größer als γ2 ist (relativer Pegelwert (f) > γ2), oder mit anderen Worten, wenn der Geräuschpegel hoch ist, berechnet die Geräuschzustandsbewertungseinheit 125, dass der Geräuschpegel L(f) 1,0 ist. Wenn ferner der relative Pegelwert (f) kleiner als γ1 ist (relativer Pegelwert (f) < γ1), oder mit anderen Worten, wenn der Geräuschpegel niedrig ist, berechnet die Geräuschzustandsbewertungseinheit 125, dass der Geräuschpegel L(f) 0 ist. Zum Beispiel beträgt γ1 58 dB und γ2 68 dB, und die Werte können experimentell erhalten werden.
  • Wenn der relative Pegelwert(f) größer gleich γ1 und kleiner gleich γ2 ist (γ1 ≤ relativer Pegelwert(f) ≤ γ2), wird der Geräuschpegel zum Beispiel durch einen einfach gewichteten Durchschnitt berechnet, der durch den folgenden Ausdruck (13) dargestellt wird. Der einfach gewichtete Durchschnitt ist nur ein Beispiel, und es können genauso gut ein arithmetischer Durchschnitt, ein quadratisch gewichteter Durchschnitt und ein kubisch gewichteter Durchschnitt verwendet werden. Geräuschpegel L ( f ) = ( relativer Pegelwert ( f ) γ 1 ) / ( γ 2 γ 1 )
    Figure DE102011108234B4_0019
  • (a2) Berechnen einer Geräuschpegelveränderung S(f)
  • Nun wird ein Verfahren zum Berechnen einer Geräuschpegelveränderung S(f) beschrieben.
  • Die Geräuschzustandsbewertungseinheit 125 berechnet einen Durchschnittswert von |IN1(f)| auf der Basis des obigen Ausdrucks (11), wenn eine Tonquelle eines ankommenden Tons in dem Unterdrückungsbereich enthalten ist.
  • Die Geräuschzustandsbewertungseinheit 125 berechnet eine Rate(f), die ein Verhältnis von |IN1(f)| zu einem Durchschnittswert von |IN1(f)| ist, durch den Ausdruck (14) unten. Rate ( f ) = | IN1 ( f ) | /Durchschnittswert von  | IN1 ( f ) |
    Figure DE102011108234B4_0020
  • Ferner berechnet die Geräuschzustandsbewertungseinheit 125 die Geräuschpegelveränderung S(f) auf der Basis einer Beziehung zwischen der Geräuschpegelveränderung S(f) und der Rate(f), die festgelegt ist. 9 zeigt eine Beziehung zwischen der Geräuschpegelveränderung S(f) und der Rate (f). Es sei erwähnt, dass die Geräuschpegelveränderung S(f) in einem Bereich von 0 ≤ Geräuschpegelveränderung S(f) ≤ 1,0 definiert ist. Es wird angenommen, dass die Geräuschpegelveränderung größer wird, wenn die Geräuschpegelveränderung näher bei 1,0 liegt, und die Stabilität niedrig ist. Die Geräuschzustandsbewertungseinheit 125 nimmt Bezug auf die Beziehung, die in 9 gezeigt ist, und erhält eine Geräuschpegelveränderung S(f) entsprechend der Rate(f).
  • Wenn die Rate (f) zum Beispiel größer als δ2 ist (Rate(f) > δ2), berechnet die Geräuschzustandsbewertungseinheit 125, dass die Geräuschpegelveränderung S(f) 1,0 ist. Wenn die Rate(f) kleiner als δ1 ist (Rate(f) < δ1), berechnet die Geräuschzustandsbewertungseinheit 125, dass die Geräuschpegelveränderung S(f) 0 ist. Zum Beispiel ist δ1 0,7 und δ2 1,4, und die Werte können experimentell erhalten werden.
  • Die Geräuschpegelveränderung S(f) wird zum Beispiel durch einen einfach gewichteten Durchschnitt berechnet, der in dem Ausdruck (15) unten dargestellt ist, wenn die Rate(f) größer gleich δ1 und kleiner gleich δ2 ist (δ1 ≤ Rate(f) ≤ δ2). Der einfach gewichtete Durchschnitt ist nur ein Beispiel, und es können genauso gut ein arithmetischer Durchschnitt, ein quadratisch gewichteter Durchschnitt und ein kubisch gewichteter Durchschnitt verwendet werden.
  • (a3) Berechnen eines kombinierten Wertes LS(f)
  • Die Geräuschzustandsbewertungseinheit 125 berechnet einen kombinierten Wert LS(f) als Funktion, in der sowohl der Geräuschpegel L(f) als auch die Geräuschpegelveränderung S(f) Variablen sind. Der kombinierte Wert LS(f) kann durch einen einfach gewichteten Durchschnitt des Geräuschpegels L(f) und der Geräuschpegelveränderung S(f) unter Verwendung des Ausdrucks (16) unten berechnet werden. Kombinierter Wert LS ( f ) = τ × L ( f ) + ( 1 τ ) × S ( f )
    Figure DE102011108234B4_0021
  • Das τ bestimmt hier ein Verhältnis des Geräuschpegels L(f) und der Geräuschpegelveränderung S(f) für den kombinierten Wert LS(f) und kann experimentell erhalten . werden. Ferner ist τ in einem Bereich von 0 ≤ τ ≤ 1,0 definiert.
  • Der kombinierte Wert LS(f) ist in einem Bereich von 0 ≤ kombinierter Wert LS(f) ≤ 1,0 definiert. Der kombinierte Wert LS(f) nähert sich 1,0, wenn die Geräuschpegelveränderung S(f) größer ist. Umgekehrt nähert sich der kombinierte Wert LS(f) 0, wenn der Geräuschpegel L(f) und die Geräuschpegelveränderung S(f) kleiner sind.
  • Die Geräuschzustandsbewertungseinheit 125 erhöht τ, wenn ein Zustand, dass der Geräuschpegel L(f) < die Geräuschpegelveränderung S(f) ist, für eine gewisse Periode andauert. Daher reduziert die Geräuschzustandsbewertungseinheit 125 einen Einfluss der Geräuschpegelveränderung S(f) auf den kombinierten Wert LS(f) in einem Zustand, wenn der Geräuschpegel L(f) < die Geräuschpegelveränderung S(f) ist. Umgekehrt verringert die Geräuschzustandsbewertungseinheit 125 τ, wenn ein Zustand, dass der Geräuschpegel L(f) > die Geräuschpegelveränderung S(f) ist, für eine gewisse Periode andauert. Daher reduziert die Geräuschzustandsbewertungseinheit 125 einen Einfluss des Geräuschpegels, L(f) auf den kombinierten Wert LS(f) in einem Zustand, wenn der Geräuschpegel L(f) > die Geräuschpegelveränderung S(f) ist. Durch die oben beschriebene Verarbeitung kann der kombinierte Wert LS(f) eine Funktion darstellen, in der sowohl der Geräuschpegel L(f) als auch die Geräuschpegelveränderung S(f) angemessen berücksichtigt sind.
  • Steuern von Bereichen auf der Basis eines Geräuschzustandes durch eine Bereichsfestlegungseinheit
  • Nun wird ein Verfahren zum Steuern des Tonempfangsbereiches, des Umstellbereiches und des Unterdrückungsbereiches auf der Basis eines Geräuschzustandes beschrieben.
  • Die Bereichsfestlegungseinheit 121 empfängt einen Geräuschzustand, der den Geräuschpegel L(f) und die Geräuschpegelveränderung S(f) enthält. Die Bereichsfestlegungseinheit 121 steuert den Tonempfangsbereich, den Umstellbereich und den Unterdrückungsbereich auf der Basis des Geräuschzustandes. Mit anderen Worten: die Bereichsfestlegungseinheit 121 steuert die Richtwirkung des Mikrofonarrays, welches das Mikrofon MIC1 und das Mikrofon MIC2 enthält. 10 bis 13 zeigen ein Beispiel für ein Verfahren zum Steuern des Tonempfangsbereiches, des Umstellbereiches und des Unterdrückungsbereiches. 11 zeigt die Bereichssteuerung in 10 durch eine Beziehung zwischen jeder Frequenz und einer Phasenspektrendifferenz DIFF(f) (-π ≤ DIFF(f) ≤ π). 13 zeigt die Bereichssteuerung in 12 durch eine Beziehung zwischen jeder Frequenz und einer Phasenspektrendifferenz DIFF(f) (-π ≤ DIFF(f) ≤ π).
  • Zunächst wird 10 beschrieben. Die Bereichsfestlegungseinheit 121 erweitert den Unterdrückungsbereich durch Einengen des Umstellbereiches, falls der Geräuschpegel L(f) hoch ist. Wenn zum Beispiel der Geräuschpegel L(f) = 1,0 ist, erweitert die Bereichsfestlegungseinheit 121 den Unterdrückungsbereich durch Einengen des Umstellbereiches. In 10 verschiebt sich nach der Veränderung eine Grenze zwischen dem Umstellbereich und dem Unterdrückungsbereich zu der Tonempfangsseite. Die Bereichsfestlegungseinheit 121 kann die Richtwirkung des Mikrofonarrays so steuern, um Geräusch, dessen Tonquelle der Unterdrückungsbereich ist, effektiv zu unterdrücken, indem der Unterdrückungsbereich erweitert wird. Der Zielton von der Zieltonquelle SS kann effektiv erfasst werden, während das Geräusch unterdrückt wird, weil der Unterdrückungsbereich und der Umstellbereich angepasst werden, ohne den Empfangsbereich zu verändern. Es sei erwähnt, dass der Empfangsbereich eingeengt werden kann.
  • Die Bereichsfestlegungseinheit 121 steuert jeden Bereich in derselben Weise wie in 10, wenn die Geräuschpegelveränderung S(f) groß ist und die Stabilität niedrig ist und zum Beispiel die Geräuschpegelveränderung S(f) 1,0 ist. Ferner steuert die Bereichsfestlegungseinheit 121 jeden Bereich in derselben Weise wie in 10, wenn zum Beispiel der kombinierte Wert LS(f) = 1,0 ist.
  • In 11 ist die Steuerung jedes Bereiches in 10 durch eine Beziehung zwischen -jeder Frequenz und einer Phasenspektrendifferenz DIFF(f) gezeigt. In 11 ist eine untere Seite der horizontalen Achse der Tonempfangsbereich, ist eine obere Seite der horizontalen Achse der Umstellbereich und der Unterdrückungsbereich. Der schraffierte Bereich ist der Umstellbereich. Der Punkt P1 kennzeichnet eine Position einer Phasenspektrendifferenz DIFF(f) bei einer gewissen Frequenz f. Der Punkt P1 liegt vor dem Einengen des Umstellbereiches im Umstellbereich und liegt nach dem Einengen des Umstellbereiches im Unterdrückungsbereich. Daher ist ein Effekt des Unterdrückens von Geräusch, das Charakteristiken wie der Punkt P1 aufweist, nach dem Verändern des Umstellbereiches größer als vor dem Verändern. Durch das Steuern der Bereiche durch Erweitern des Unterdrückungsbereiches, während der Umstellbereich eingeengt wird, wird eine effektive Geräuschunterdrückung erzielt.
  • Nun wird 12 beschrieben. Die Bereichsfestlegungseinheit 121 engt den Unterdrückungsbereich ein, indem der Umstellbereich erweitert wird, wenn der Geräuschpegel L(f) niedrig ist. Die Bereichsfestlegungseinheit 121 erweitert zum Beispiel den Umstellbereich, wenn der Geräuschpegel L(f) = 0 ist. In 12 verschiebt sich eine Grenze zwischen dem Umstellbereich und dem Unterdrückungsbereich nach der Veränderung zu der Seite des Unterdrückungsbereiches. Durch das Einengen des Unterdrückungsbereiches wird eine Verzerrung eines Zieltons von der Zieltonquelle SS in dem Tonempfangsbereich unterdrückt. Ferner kann die Mikrofonarrayvorrichtung die Richtwirkung des Mikrofonarrays so steuern, dass auch Geräusch, dessen Tonquelle im Unterdrückungsbereich liegt, unterdrückt werden kann. Das Erweitern des Umstellbereiches gestattet der Mikrofonarrayvorrichtung ein allmähliches Umstellen von dem Empfangsbereich auf den Unterdrückungsbereich und das Reduzieren eines Grades der Geräuschunterdrückung.
  • Die Mikrofonarrayvorrichtung 200 kann fälschlicherweise erkennen, dass eine Zieltonquelle SS, die tatsächlich im Tonempfangsbereich liegt, in einer Umstellrichtung existiert. Die fälschliche Erkennung kann durch eine Schwankung einer Ankunftsrichtung eines Tons aufgrund einer Bewegung zum Beispiel eines Sprechers, der eine Zieltonquelle SS ist, und des Umgebungsmilieus verursacht werden. Selbst in dem obigen Fall gestattet das Steuern der Bereiche, wie in 12 gezeigt, eine Reduzierung eines Grades der Geräuschunterdrückung und das Unterdrücken der Verzerrung des Zieltons.
  • Die Bereichsfestlegungseinheit 121 steuert jeden Bereich in derselben Weise wie in 12, wenn eine Geräuschpegelveränderung S(f) klein ist und die Stabilität hoch ist und beispielsweise die Geräuschpegelveränderung S(f) = 0 ist. Ferner steuert die Bereichsfestlegungseinheit 121 jeden Bereich in derselben Weise wie in 12, wenn der kombinierte Wert LS(f) klein ist und beispielsweise der kombinierte Wert LS(f) = 0 ist.
  • 13 zeigt die Bereichssteuerung in 12 durch eine Beziehung jeder Frequenz und einer Phasenspektrendifferenz DIFF(f). Der Punkt P2 kennzeichnet eine Position einer Phasenspektrendifferenz DIFF(f) bei einer gewissen Frequenz f. Der Punkt P2 liegt vor der Erweiterung des Umstellbereiches im Unterdrückungsbereich und liegt nach der Erweiterung des Umstellbereiches im Umstellbereich. Daher ist ein Effekt der Unterdrückung von Geräusch, das Charakteristiken wie der Punkt P2 aufweist, nach der Veränderung des Umstellbereiches kleiner als vor der Veränderung. Das Steuern der Bereiche durch Erweitern des Umstellbereiches, während der Unterdrückungsbereich eingeengt wird, gestattet es, einen Betrag der Unterdrückung von Geräusch zu reduzieren und eine Verzerrung des Zieltons zu unterdrücken.
  • In der obigen Beschreibung steuert die Bereichsfestlegungseinheit 121 typischerweise den Umstellbereich und den Unterdrückungsbereich. Jedoch kann auch der Tonempfangsbereich gesteuert werden. Wenn in 10 und 11 der Geräuschpegel L(f) zum Beispiel hoch ist, engt die Bereichsfestlegungseinheit 121 den Tonempfangsbereich ein, um den Unterdrückungsbereich zu erweitern, oder sie engt sowohl den Tonempfangsbereich als auch den Umstellbereich ein, um den Unterdrückungsbereich zu erweitern. Wenn in 12 und 13 der Geräuschpegel L(f) niedrig ist, erweitert die Bereichsfestlegungseinheit 121 den Tonempfangsbereich, um den Unterdrückungsbereich einzuengen, oder sie erweitert sowohl den Tonempfangsbereich als auch den Umstellbereich, um den Unterdrückungsbereich einzuengen.
  • Synchronisationskoeffizientenberechnungseinheit
  • Die Synchronisationskoeffizientenberechnungseinheit 126 empfängt Informationen über den Tonempfangsbereich, den Umstellbereich und den Unterdrückungsbereich, die auf der Basis eines Geräuschzustandes festgelegt sind, von der Bereichsfestlegungseinheit 121. Die Synchronisationskoeffizientenberechnungseinheit 126 empfängt eine Phasenspektrendifferenz DIFF(f) von der Phasenspektrendifferenzberechnungseinheit 124. Die Synchronisationskoeffizientenberechnungseinheit 126 berechnet Synchronisationskoeffizienten, wie unter (a1) bis (a3) unten beschrieben, auf der Basis des Tonempfangsbereiches, des Umstellbereiches und des Unterdrückungsbereiches, die auf der Basis eines Geräuschzustandes und der Phasenspektrendifferenz DIFF(f) festgelegt sind.
  • Synchronisationskoeffizient C(f)
  • (a1) Wenn die Phasenspektrendifferenz DIFF(f) im Unterdrückungsbereich liegt
  • Die Synchronisationskoeffizientenberechnungseinheit 126 berechnet einen Synchronisationskoeffizienten C(f), wenn die Phasenspektrendifferenz DIFF(f) in dem Unterdrückungsbereich liegt.
  • Die Synchronisationskoeffizientenberechnungseinheit 126 nimmt am Geräusch, das durch das Mikrofon MIC1 erhalten wird, die folgende Schätzung vor. Ein Ton, der durch das Mikrofon MIC1 für eine spezifische Frequenz f erhalten wird, enthält Geräusch aus dem Unterdrückungsbereich. Die Synchronisationskoeffizientenberechnungseinheit 126 schätzt, dass das durch das MikrofonMIC1 erhaltene Geräusch im Wesentlichen dasselbe Geräusch ist, das in einem Ton enthalten ist, der durch das Mikrofon MIC2 erhalten wird, und das Geräusch das Mikrofon MIC1 nach einer Verzögerung um eine Phasenspektrendifferenz DIFF(f) erreicht. Synchronisationskoeffizient  α × C ( f ) ' + ( 1 α ) × ( IN1 ( f ) /IN2 ( f ) )
    Figure DE102011108234B4_0022
  • Hier ist C(f)' ein Synchronisationskoeffizient vor einer Aktualisierung. Der Synchronisationskoeffizient C(f) kann zum Beispiel bei jedem Analyserahmen aktualisiert werden. α stellt ein Additionsverhältnis oder ein Kombinationsverhältnis eines Phasenverzögerungsbetrages eines vorhergehenden Analyserahmens für die Synchronisation dar. α ist größer als 0 und kleiner als 1,0.
  • (a2) Wenn eine Phasenspektrendifferenz DIFF(f) im Tonempfangsbereich liegt
  • Die Synchronisationskoeffizientenberechnungseinheit 126 berechnet einen Synchronisationskoeffizienten C(f) auf der Basis der folgenden Ausdrücke (18) oder (19), wenn die Phasenspektrendifferenz DIFF(f) im Tonempfangsbereich liegt. Synchronisationskoeffizient C ( f ) = exp ( 2 π f/fs )
    Figure DE102011108234B4_0023
    Synchronisationskoeffizient C ( f ) = 0
    Figure DE102011108234B4_0024
  • (a3) Wenn eine Phasenspektrendifferenz DIFF(f) im Umstellbereich liegt
  • Die Synchronisationskoeffizientenberechnungseinheit 126 wendet zum Beispiel einen gewichteten Durchschnitt auf ein berechnetes Resultat des Synchronisationskoeffizienten C(f) auf der Basis der oben beschriebenen Fälle (a1) und (a2) an. Entsprechend berechnet die Synchronisationskoeffizientenberechnungseinheit 126 einen Synchronisationskoeffizienten C(f).
  • Ein Beispiel für das Berechnen eines Synchronisationskoeffizienten C(f) wird unter erneuter Bezugnahme auf 11 und 13 beschrieben. In 11 liegt der Punkt P1 vor dem Einengen des Umstellbereiches im Umstellbereich. Nach dem Einengen des Umstellbereiches liegt der Punkt P1 jedoch im Unterdrückungsbereich. Somit berechnet die Synchronisationskoeffizientenberechnungseinheit 126 einen Synchronisationskoeffizienten C(f) auf der Basis eines gewichteten Durchschnitts im oben beschriebenen Fall (a3). Indessen berechnet die Synchronisationskoeffizientenberechnungseinheit 126 einen Synchronisationskoeffizienten C(f) nach dem Verändern des Bereiches im Unterdrückungsbereich auf der Basis des Ausdrucks (17).
  • In 13 liegt der Punkt P2 vor dem Erweitern des Umstellbereiches im Unterdrückungsbereich. Nach dem Erweitern des Umstellbereiches liegt der Punkt P2 jedoch im Umstellbereich. Somit berechnet die Synchronisationskoeffizientenberechnungseinheit 126 einen Synchronisationskoeffizienten C(f) vor dem Verändern des Bereiches im Unterdrückungsbereich auf der Basis des oben beschriebenen Ausdrucks (17). Indessen berechnet die Synchronisationskoeffizientenberechnungseinheit 126 einen Synchronisationskoeffizienten C(f) nach dem Verändern des Bereiches auf der Basis des oben beschriebenen gewichteten Durchschnitts im Fall (a3).
  • Synchronisationskoeffizient Cg(f), der von der Verstärkung g(f) abhängt
  • Die Synchronisationskoeffizientenberechnungseinheit 126 kann den Synchronisationskoeffizienten Cg(f) berechnen, der von der Verstärkung g(f) abhängt, indem der Synchronisationskoeffizient C(f), der auf der Basis der obigen Fälle (a1) bis (a3) berechnet wurde, ferner mit einer Verstärkung g(f) multipliziert wird. Synchronisationskoeffizient Cg ( f ) = Verstärkung g ( f ) × Synchronisationskoeffizient C ( f )
    Figure DE102011108234B4_0025
  • Die Verstärkung g(f) ist ein Wert, um einen Unterdrückungsbetrag von Geräusch auf einer Frequenzachse anzupassen. Die Synchrönisationskoeffizientenberechnungseinheit 126 legt die Verstärkung g(f) gemäß einem Geräuschzustand fest. 14 zeigt ein Beispiel für eine Beziehung zwischen einem kombinierten Wert LS(f), der einen Geräuschzustand angibt, und einer Verstärkung g(f). Die Synchronisationskoeffizientenberechnungseinheit 126 legt eine Verstärkung g(f) auf der Basis des kombinierten Wertes LS(f), der durch den oben beschriebenen Ausdruck (16) berechnet wurde, und 14 fest. Die Verstärkung g(f) ist größer gleich 0 und kleiner gleich 1,0. Eine Subtraktionseinheit 128, die später beschrieben wird, führt eine Verarbeitung unter Verwendung des Synchronisationskoeffizienten Cg(f) aus, der von der Verstärkung g(f) abhängt, und passt dadurch einen Betrag an, um ein komplexes Spektrum IN2(f) von einem komplexen Spektrum IN1(f) zu subtrahieren. Als Resultat wird ein Unterdrückungsbetrag von Geräusch angepasst, das in einem Ton enthalten ist, der durch das Mikrofon MIC1 erhalten wird.
  • Hier wird die Verstärkung g(f) auf der Basis des kombinierten Wertes LS(f) berechnet. Jedoch kann die Verstärkung g(f) auf der Basis eines Geräuschpegels L(f) oder einer Geräuschpegelveränderung S(f) berechnet werden.
  • Synchronisationseinheit
  • Die Synchronisationseinheit 127 empfängt den Synchronisationskoeffizienten C(f) oder den Synchronisationskoeffizienten Cg(f), der von der Verstärkung g(f) abhängt, von der Synchronisationskoeffizientenberechnungseinheit 126. Die Synchronisationseinheit 127 führt die Synchronisation unter Verwendung des Synchronisationskoeffizienten C(f) oder des Synchronisationskoeffizienten Cg(f) auf der Basis des Geräuschzustandes aus. Alternativ kann die Synchronisationseinheit 127 die Synchronisation auf der Basis einer Anfangsfestlegung ausführen, die spezifiziert, welcher von den Synchronisationskoeffizienten verwendet wird.
  • Wenn zum Beispiel der Synchronisationskoeffizient Cg(f) verwendet wird, multipliziert die Synchronisationseinheit 127 das komplexe Spektrum IN2(f) mit dem Synchronisationskoeffizienten Cg(f), wie durch den Ausdruck (21) unten dargestellt. Daher wird ein komplexes Spektrum INs2(f) berechnet, das durch Synchronisieren des komplexen Spektrums IN2(f) mit dem komplexen Spektrum IN1(f) erhalten wird. INs2 ( f ) = Cg ( f ) × IN2 ( f )
    Figure DE102011108234B4_0026
  • Hier wird Cg(f) als Synchronisationskoeffizient verwendet; jedoch kann stattdessen C(f) verwendet werden.
  • Subtraktionseinheit
  • Wie in dem folgenden Ausdruck (22) dargestellt, wird das komplexe Spektrum INs2(f), das synchronisiert ist, von dem komplexen Spektrum IN1(f) subtrahiert, um eine Ausgabe OUT(f) zu erhalten. OUT ( f ) = IN1 ( f ) INs2 ( f )
    Figure DE102011108234B4_0027
  • Signalwiederherstellungseinheit
  • Die Signalwiederherstellungseinheit 129 konvertiert die Ausgabe OUT(f) von der Subtraktionseinheit 128 in ein Signal auf einer Zeitachse. Die Verarbeitung durch die Signalwiederherstellungseinheit 129 ist die Umkehrung der Konvertierungen durch den ersten Signalkonverter 122 und den zweiten Signalkonverter 123. Hier wendet die Signalwiederherstellungseinheit 129 eine Inverse Schnelle Fourier-Transformation (IFFT) auf die Ausgabe OUT(f) an. Des Weiteren führt die Signalwiederherstellungseinheit 129 eine überlappende Additionsoperation für das Resultat der IFFT aus, um ein Ausgangssignal des Mikrofons MIC1 auf einer Zeitachse zu erzeugen.
  • Verarbeitungsablauf
  • Nachfolgend wird die Verarbeitung gemäß der Ausführungsform unter Bezugnahme auf 15 beschrieben. 15 ist ein Beispiel für ein Flussdiagramm, das die Geräuschunterdrückungsverarbeitung zeigt, die durch die Mikrofonarrayvorrichtung gemäß der Ausführungsform ausgeführt wird.
  • Operation S11:
  • Die Bereichsfestlegungseinheit 121 trifft Anfangsfestlegungen für einen Tonempfangsbereich, einen Umstellbereich und einen Unterdrückungsbereich für jedes Mikrofon zum Beispiel auf der Basis einer Nutzereingabe.
  • Operation S12:
  • Die erste Tonempfangseinheit 111 und die zweite Tonempfangseinheit 112 erhalten ein Tonsignal in1(ti) und ein Tonsignal in2(ti) auf einer Zeitachse.
  • Operation S13 und Operation S14:
  • Der erste Signalkonverter 122 multipliziert jedes Signalintervall des Tonsignals in1(ti) mit einer Überlappungsfensterfunktion (Operationen S13) und erzeugt ein komplexes Spektrum IN1(f) auf einer Frequenzachse, indem ferner die FFT angewendet wird (Operation S14). Desgleichen unterzieht der zweite Signalkonverter 123 das Tonsignal in2(ti) einer Frequenzkonvertierung, um ein komplexes Spektrum IN2(f) auf der Frequenzachse zu erzeugen.
  • Operation S15:
  • Die Phasenspektrendifferenzberechnungseinheit 124 berechnet eine Phasenspektrendifferenz DIFF(f) zwischen einem komplexen Spektrum IN1(f) und einem komplexen Spektrum IN2(f) für jede Frequenz.
  • Operation S16:
  • Die Phasenspektrendifferenzberechnungseinheit 124 bestimmt einen Bereich, in dem die Phasenspektrendifferenz DIFF(f) enthalten ist, von dem Tonempfangsbereich, dem Umstellbereich und dem Unterdrückungsbereich. Wenn die Phasenspektrendifferenz DIFF(f) in dem Unterdrückungsbereich enthalten ist, geht der Prozess zur Operation S17 über; anderenfalls kehrt er zur Operation S12 zurück.
  • Operationen S17:
  • Die Geräuschzustandsbewertungseinheit 125 sieht einen ankommenden Ton als Geräusch an und bewertet den Geräuschzustand, wenn die Phasenspektrendifferenz DIFF(f) in dem Unterdrückungsbereich enthalten ist; oder mit anderen Worten, wenn die Tonquelle des ankommenden Tons im Unterdrückungsbereich enthalten ist. Der Geräuschzustand enthält zum Beispiel einen Geräuschpegel L(f), eine Geräuschpegelveränderung S(f) und einen kombinierten Wert LS(f) des Geräuschpegels L(f) und der Geräuschpegelveränderung S(f).
  • Operation S18:
  • Die Bereichsfestlegungseinheit 121 erhält den Geräuschzustand von der Geräuschzustandsbewertungseinheit 125 und steuert die Richtwirkung des Mikrofonarrays durch Steuern des Tonempfangsbereiches, des Umstellbereiches und des Unterdrückungsbereiches auf der Basis des Geräuschzustandes.
  • Operation S19:
  • Die Synchronisatiönskoeffizientenberechnungseinheit 126 berechnet den Synchronisationskoeffizienten C(f) auf der Basis des Tonempfangsbereiches, des Umstellbereiches und des Unterdrückungsbereiches, die auf der Basis des Geräuschzustandes und der Phasenspektrendifferenz DIFF(f) festgelegt wurden.
  • Operation S20:
  • Wenn der Synchronisationskoeffizient C(f) weiter angepasst wird, um den Synchronisationskoeffizienten Cg(f) zu berechnen, der von der Verstärkung g(f) abhängt, geht der Prozess zur Operation S21 über; anderenfalls kehrt er zur Operation S24 zurück.
  • Operation S21:
  • Die Synchronisationskoeffizientenberechnungseinheit 126 multipliziert den Synchronisationskoeffizienten C(f) mit der Verstärkung g(f), um den Synchronisationskoeffizienten Cg(f) zu berechnen, der von der Verstärkung g(f) abhängt. Die Verstärkung g(f) ist ein Zahlenwert zum Anpassen eines Unterdrückungsbetrages von Geräusch auf der Frequenzachse.
  • Operation S22:
  • Die Synchronisationseinheit 127 multipliziert das komplexe Spektrum-IN2(f) mit dem Synchronisationskoeffizienten Cg(f), um das komplexe Spektrum IN2(f) mit dem komplexen Spektrum IN1(f) zu synchronisieren.
  • Operation S23:
  • Die Subtraktionseinheit 128 subtrahiert das Multiplikationsresultat von Operation S22 von dem komplexen Spektrum IN1(f), um eine Ausgabe OUT(f) zu erhalten.
  • Operation S24:
  • Die Synchronisationseinheit 127 multipliziert das komplexe Spektrum IN2(f) mit dem komplexen Spektrum C(f), um das komplexe Spektrum IN2(f) mit dem komplexen Spektrum IN1(f) zu synchronisieren.
  • Operation S25:
  • Die Subtraktionseinheit 128 subtrahiert das Multiplikationsresultat von Operation S24 von dem komplexen Spektrum IN1 (f), um eine Ausgabe OUT(f) zu erhalten.
  • Operation S26:
  • Die Signalwiederherstellungseinheit 129 konvertiert die Ausgabe OUT(f) von der Subtraktionseinheit 128 in ein Signal auf der Zeitachse und führt ferner eine überlappende Additionsoperation aus und gibt ein Ausgangssignal in einer Zeitdomäne des Mikrofons MIC1 aus. Nach Vollendung der Verarbeitung kehrt der Prozess zur Operation S12, zurück, und die oben beschriebene Verarbeitung wird in einem Intervall wiederholt, das zum Beispiel auf einer gewissen Abtastfrequenz basiert.
  • Die Mikrofonarrayvorrichtung 200 gemäß der Ausführungsform steuert den Tonempfangsbereich, den Umstellbereich und den Unterdrückungsbereich gemäß einem Geräuschzustand, und deshalb kann sie Geräusch gemäß dem Geräuschzustand unterdrücken. Wenn ein Geräuschpegel L(f) zum Beispiel hoch ist, kann die Mikrofonarrayvorrichtung 200 das Geräusch, dessen Tonquelle in dem Unterdrückungsbereich liegt, effektiv unterdrücken, indem der Umstellbereich eingeengt wird, um den Unterdrückungsbereich zu erweitern.
  • Die Mikrofonarrayvorrichtung 200 gemäß der Ausführungsform kann Geräusch unterdrücken, dessen Tonquelle im Unterdrückungsbereich liegt, während außerdem eine Verzerrung eines Zieltons von einer Zieltonquelle SS unterdrückt wird, indem der Umstellbereich erweitert wird, um den Unterdrückungsbereich einzuengen, zum Beispiel wenn der Geräuschpegel L(f) klein ist. Dabei erfolgt das Umstellen von dem Tonempfangsbereich auf den Unterdrückungsbereich allmählich, weil der Umstellbereich erweitert wird. Als Resultat kann die Mikrofonarrayvorrichtung 200 gemäß der Ausführungsform einen Grad der Geräuschunterdrückung allmählich verändern.
  • Selbst wenn fälschlicherweise erkannt wird, dass eine Zieltonquelle SS, die tatsächlich in dem Tonempfangsbereich liegt, in dem Umstellbereich existiert, kann ein Grad der Unterdrückung eines ankommenden Tons, der aus dem Umstellbereich zu der Mikrofonarrayvorrichtung 200 gelangt, in Abhängigkeit von dem Geräuschzustand reduziert werden. Wenn zum Beispiel, wie oben beschrieben, der Umstellbereich erweitert wird, wird der Grad der Unterdrückung des Zieltons, der fälschlicherweise als Geräusch erkannt wird, reduziert und kann die Verzerrung des Zieltons von der Zieltonquelle SS unterdrückt werden.
  • Unterdrückt wird Geräusch, wie oben beschrieben, gemäß einem Geräuschzustand, und deshalb dementsprechend, wie stark das Geräusch unterdrückt werden muss. Daher kann eine Verzerrung eines Zieltons unterdrückt werden.
  • Dritte Ausführungsform
  • Eine Mikrofonarrayvorrichtung 300 gemäß einer dritten Ausführungsform erhält einen Geräuschzustand durch das Verarbeiten von Tonsignalen, die durch zwei Mikrofone erhalten werden, auf einer Frequenzachse. Weiterhin unterdrückt die Mikrofonarrayvorrichtung 300 Geräusch durch Anpassen einer Verstärkung zum Anpassen eines Unterdrückungsbetrages von Geräusch auf der Basis des Geräuschzustandes.
  • Die Hardware-Konfiguration der Mikrofonarrayvorrichtung 300 gemäß der dritten Ausführungsform ist im Wesentlichen dieselbe wie jene der ersten Ausführungsform. Ferner sind dieselben Bezugszeichen Komponenten zugeordnet, die dieselben wie in der zweiten Ausführungsform sind.
  • Funktionelle Konfiguration
  • 16 ist ein Beispiel für ein Blockdiagramm, das eine funktionelle Konfiguration der Mikrofonarrayvorrichtung gemäß der dritten Ausführungsform zeigt. Die Mikrofonarrayvorrichtung 300 gemäß der dritten Ausführungsform enthält, wie die Mikrofonarrayvorrichtung 200 gemäß der zweiten Ausführungsform, eine erste Tonempfangseinheit 111, eine zweite Tonempfangseinheit 112, eine Bereichsfestlegungseinheit 121, einen ersten Signalkonverter 122, einen zweiten Signalkonverter 123, eine Phasenspektrendifferenzberechnungseinheit 124, eine Geräuschzustandsbewertungseinheit 125 und eine Signalwiederherstellungseinheit 129. Die Verarbeitung durch die oben beschriebenen Funktionseinheiten ist im Wesentlichen dieselbe wie jene der zweiten Ausführungsform.
  • Nachfolgend werden eine Verstärkungsberechnungseinheit 140 und eine Verstärkungsmultiplikationseinheit 141 beschrieben. In der dritten Ausführungsform enthält die Unterdrückungseinheit 130 die Bereichsfestlegungseinheit 121 und die Verstärkungsberechnungseinheit 140.
  • Verstärkungsberechnungseinheit
  • Die Verstärkungsberechnungseinheit 140 empfängt Informationen über einen Tonempfangsbereich, einen Umstellbereich und einen Unterdrückungsbereich, die auf der Basis eines Geräuschzustandes festgelegt werden, von der Bereichsfestlegungseinheit 121. Ferner empfängt die Verstärkungsberechnungseinheit 140 eine Phasenspektrendifferenz DIFF(f) von der Phasenspektrendifferenzberechnungseinheit 124. Die Verstärkungsberechnungseinheit 140 berechnet eine Verstärkung G(f) zum Anpassen eines Unterdrückungsbetrages von Geräusch auf einer Frequenzachse auf der Basis des Tonempfangsbereiches, des Umstellbereiches und des Unterdrückungsbereiches, die auf der Basis eines Geräuschzustandes festgelegt werden, und der Phasenspektrendifferenz DIFF(f). Die Verstärkung g(f) ist größer gleich 0 und kleiner gleich 1,0.
  • Zum Beispiel setzt die Verstärkungsberechnungseinheit 140 eine Verstärkung G(f) auf 1,0, wenn die Phasenspektrendifferenz DIFF(f) in dem Tonempfangsbereich enthalten ist, und auf 0, wenn die Phasenspektrendifferenz DIFF(f) in dem Unterdrückungsbereich enthalten ist. Ferner erhält die Verstärkungsberechnungseinheit 140 einen einfach gewichteten Durchschnitt der Verstärkung G(f) im Unterdrückungsbereich und der Verstärkung G(f) im Tonempfangsbereich gemäß einer Position der Phasenspektrendifferenz DIFF(f), wenn die Phasenspektrendifferenz DIFF(f) in dem Umstellbereich enthalten ist. Der einfach gewichtete Durchschnitt ist nur ein Beispiel, und es können genauso gut ein arithmetischer Durchschnitt, ein quadratisch gewichteter Durchschnitt und ein kubisch gewichteter Durchschnitt verwendet werden.
  • Durch Anpassen der Verstärkung G(f) durch die Verstärkungsberechnungseinheit 140 wird ein Betrag zum Unterdrücken eines Pegels des komplexen Spektrums IN1(f) durch die Verstärkungsmultiplikationseinheit 141 angepasst. Die Mikrofonarrayvorrichtung 300 passt einen Betrag zum Unterdrücken von Geräusch an, das in einem Ton enthalten ist, der durch das Mikrofon MIC1 erhalten wird. Ferner kann die Verstärkung G(f) bei jedem Abtasten eines Tonsignals aktualisiert werden.
  • 17A bis 17C zeigen eine Beziehung zwischen dem Tonempfangsbereich, dem Umstellbereich und dem Unterdrückungsbereich und der Verstärkung G(f).
  • 17B zeigt eine Beziehung zwischen einer Verstärkung G(f) und einer Phasenspektrendifferenz DIFF(f) bei den Anfangsfestlegungen des Tonempfangsbereiches, des Umstellbereiches und des Unterdrückungsbereiches.
  • Die Bereichsfestlegungseinheit 121 legt jeden Bereich zum Beispiel so wie in 17A fest, wenn ein Geräuschpegel L(f), der von der Geräuschzustandsbewertungseinheit 125 erhalten wird, niedrig ist oder eine Veränderung eines Geräuschpegels S(f) klein ist. Hier engt die Bereichsfestlegungseinheit 121 den Unterdrückungsbereich durch Erweitern des Umstellbereiches im Vergleich zu dem in 17B mehr ein. Die Verstärkung G(f) wird vom Tonempfangsbereich zum Unterdrückungsbereich allmählich reduziert, weil der Umstellbereich erweitert ist. Deshalb kann eine allmähliche Umstellung von dem Tonempfangsbereich auf den Unterdrückungsbereich erzielt werden, und die Mikrofonarrayvorrichtung 300 reduziert einen Grad der Unterdrückung von Geräusch. Daher kann die Mikrofonarrayvorrichtung 300 eine Verzerrung des Zieltons selbst dann unterdrücken, wenn eine Tonquelle eines ankommenden Tons von dem Tonempfangsbereich auf den Umstellbereich verschoben wird, weil der Grad der Unterdrückung klein ist.
  • Indessen legt die Bereichsfestlegungseinheit 121 jeden Bereich zum Beispiel so wie in 17C fest, wenn ein Geräuschpegel L(f), der von der Geräuschzustandsbewertungseinheit 121 erhalten wird, hoch ist oder eine Geräuschpegelveränderung S(f) groß ist. Hier erweitert die Bereichsfestlegungseinheit 121 den Unterdrückungsbereich, indem der Umstellbereich im Vergleich zu dem in 17B mehr eingeengt wird. Die Verstärkung G(f) wird von dem Tonempfangsbereich zum Unterdrückungsbereich drastisch reduziert, weil der Umstellbereich eingeengt ist. Daher kann die Mikrofonarrayvorrichtung 300 das Geräusch effektiv unterdrücken, dessen Tonquelle im Unterdrückungsbereich liegt.
  • Verstärkungsmultiplikationseinheit
  • Die Verstärkungsmultiplikationseinheit 141 erhält eine Verstärkung G(f) von der Verstärkungsberechnungseinheit 140. Die Verstärkungsmultiplikationseinheit 141 multipliziert das komplexe Spektrum IN1 (f) mit der Verstärkung G(f), um OUT(f) auszugeben, wie durch den folgenden Ausdruck (23) dargestellt. OUT ( f ) = IN1 ( f ) × G ( f )
    Figure DE102011108234B4_0028
  • OUT(f) wird durch die Signalwiederherstellungseinheit 129 verarbeitet und als Ausgangssignal des Mikrofons MIC1 auf einer Zeitachse ausgegeben.
  • Verarbeitungsablauf
  • Nachfolgend wird die Verarbeitung gemäß der Ausführungsform unter Bezugnahme auf 18 beschrieben. 18 ist ein Beispiel für ein Flussdiagramm, das die Geräuschunterdrückungsverarbeitung zeigt, die durch die Mikrofonarrayvorrichtung gemäß der Ausführungsform ausgeführt wird.
  • Operation S31 bis Operation S38:
  • Operation S31 bis Operation S38 sind im Wesentlichen dieselben wie Operation S11 bis Operation S18 in 15 gemäß der zweiten Ausführungsform. Die Mikrofonarrayvorrichtung 300 bewertet einen Geräuschzustand auf der Basis von Tonsignalen, die durch das Mikrofon MIC1 und das Mikrofon MIC2 empfangen werden, und steuert jeden Bereich auf der Basis des Geräuschzustandes.
  • Operation S39:
  • Die Verstärkungsberechnungseinheit 140 berechnet eine Verstärkung G(f) zum Anpassen eines Unterdrückungsbetrages von Geräusch auf einer Frequenzachse auf der Basis des Tonempfangsbereiches, des Umstellbereiches und des Unterdrückungsbereiches, die auf der Basis eines Geräuschzustandes festgelegt werden, und der Phasenspektrendifferenz DIFF(f).
  • Operation S40:
  • Die Verstärkungsmultiplikationseinheit 141 multipliziert das komplexe Spektrum IN1(f) mit der Verstärkung G(f), um OUT(f) auszugeben.
  • Operation S41:
  • Die Signalwiederherstellungseinheit 129 konvertiert die Ausgabe OUT(f) in ein Signal auf einer Zeitachse und führt ferner eine überlappende Additionsoperation aus und gibt ein Ausgangssignal in einer Zeitdomäne des Mikrofons MIC1 aus. Nach Vollendung der Verarbeitung kehrt der Prozess zur Operation S32 zurück. Die oben beschriebene Verarbeitung wird in einem Intervall wiederholt, das zum Beispiel auf einer gewissen Abtastfrequenz basiert.
  • Wie in den ersten und zweiten Ausführungsformen wird Geräusch auch in der dritten Ausführungsform gemäß dem Geräuschzustand unterdrückt, und deshalb wird das Geräusch dementsprechend unterdrückt, wie stark das Geräusch unterdrückt werden muss. Daher kann eine Verzerrung eines Zieltons unterdrückt werden.
  • Vierte Ausführungsform
  • Gemäß den ersten bis dritten Ausführungsformen wird eine Richtung, wo eine Zieltonquelle SS vorhanden ist, oder mit anderen Worten, eine Tonempfangsrichtung, aus der der Zielton kommt, anfangs festgelegt. Die Mikrofonarrayvorrichtung passt einen Unterdrückungsbetrag eines Zieltons aus der Tonempfangsrichtung und den Tonempfangsbereich an, wobei die Richtung als Tonempfangsrichtung angesehen wird, aus der der Zielton kommt. Indessen detektiert eine Mikrofonarrayvorrichtung 400 gemäß einer vierten Ausführungsform eine Richtung einer Zieltonquelle SS und legt eine Tonempfangsrichtung auf der Basis der Richtung der Zieltonquelle SS fest. Die Mikrofonarrayvorrichtung 400 gemäß der Ausführungsformen ist auf den Fall anwendbar, wenn eine Tonempfangsrichtung anfangs festgelegt wird und zum Beispiel die anfangs festgelegte Tonempfangsrichtung beispielsweise basierend auf der detektierten Richtung der Zieltonquelle SS verändert wird. Nachfolgend wird die Mikrofonarrayvorrichtung 400 gemäß der vierten Ausführungsform beschrieben.
  • Die Mikrofonarrayvorrichtung 400 gemäß der vierten Ausführungsform verarbeitet, wie in den zweiten und dritten Ausführungsformen, Tonsignale, die durch die zwei Mikrofone MIC1 und MIC2 erhalten werden, auf einer Frequenzachse. Die Hardware-Konfiguration der Mikrofonarrayvorrichtung 400 gemäß der vierten Ausführungsform ist im Wesentlichen dieselbe wie jene der ersten Ausführungsform. Ferner sind dieselben Bezugszeichen Komponenten zugeordnet, die im Wesentlichen dieselben wie in der ersten Ausführungsform sind.
  • Funktionelle Konfiguration
  • 19 ist ein Beispiel für ein Blockdiagramm, das eine funktionelle Konfiguration der Mikrofonarrayvorrichtung gemäß der vierten Ausführungsform zeigt. Die Mikrofonarrayvorrichtung 400 gemäß der vierten Ausführungsform enthält eine funktionelle Konfiguration, die teilweise dieselbe wie die funktionelle Konfiguration der Mikrofonarrayvorrichtung 200 gemäß der zweiten Ausführungsform ist. Die Mikrofonarrayvorrichtung 400 gemäß der vierten Ausführungsform enthält eine erste Tonempfangseinheit 111, eine zweite Tonempfangseinheit 112, eine Bereichsfestlegungseinheit 121, einen ersten Signalkonverter 122, einen zweiten Signalkonverter 123, eine Phasenspektrendifferenzberechnungseinheit 124, eine Synchronisationskoeffizientenberechnungseinheit 126, eine Synchronisationseinheit 127, eine Subtraktionseinheit 128 und eine Signalwiederherstellungseinheit 129. Die Mikrofonarrayvorrichtung 400 in 19 enthält eine Pegelbewertungseinheit 150 anstelle der Geräuschzustandsbewertungseinheit 125 gemäß der zweiten Ausführungsform. Gemäß der vierten Ausführungsform enthält eine Unterdrückungseinheit 130 die Bereichsfestlegungseinheit 121, die Synchronisationskoeffizientenberechnungseinheit 126, die Synchronisationseinheit 127 und die Subtraktionseinheit 128.
  • Nachfolgend wird ein Teil der Konfiguration beschrieben, der sich von jenem der zweiten Ausführungsform unterscheidet.
  • Bereichsfestlegungseinheit
  • Die Bereichsfestlegungseinheit 121 trifft keine Anfangsfestlegungen für einen Tonempfangsbereich, einen Umstellbereich und einen Unterdrückungsbereich für jedes Mikrofon. Demnach ist jedes der Mikrofone bei den Anfangsfestlegungen auf einen ungerichteten Zustand festgelegt.
  • Alternativ kann die Bereichsfestlegungseinheit 121 Anfangsfestlegungen für einen Tonempfangsbereich, einen Umstellbereich und einen Unterdrückungsbereich für jedes Mikrofon auf der Basis einer Nutzereingabe treffen. Darüber hinaus kann die Bereichsfestlegungseinheit 121 Anfangsfestlegungen für den Tonempfangsbereich, den Umstellbereich und den Unterdrückungsbereich für jedes Mikrofon auf der Basis von Anfangswerten treffen, die in einem ROM 102 gespeichert sind.
  • Ferner empfängt die Bereichsfestlegungseinheit 121 ein Bewertungsresultat eines Pegels eines Tons, der durch die zwei Mikrofone MIC1 und MIC2 empfangen wird. Die Bereichsfestlegungseinheit 121 steuert den Tonempfangsbereich, den Umstellbereich und den Unterdrückungsbereich auf der Basis des Bewertungsresultates. Das Steuern der Bereichewird unten in einem Abschnitt für die Pegelbewertungseinheit 150 beschrieben.
  • Pegelbewertungseinheit
  • Pegelbewertung
  • Die Pegelbewertungseinheit 150 empfängt das komplexe Spektrum IN1 (f) und das komplexe Spektrum IN2(f) von dem ersten Signalkonverter 122 bzw. dem zweiten Signalkonverter 123. Die Pegelbewertungseinheit 150 berechnet für jede Frequenz einen Pegel 1 eines Tonsignals in1 (ti), das durch das Mikrofon MIC1 erhalten wird, und einen Pegel 2 eines Tonsignals in2 (ti), das durch das Mikrofon MIC2 erhalten wird. Ein Pegel jedes Tonsignals kann durch die folgenden Ausdrücke (24) und (25) berechnet werden. Pegel 1 = | IN1 ( f ) | 2
    Figure DE102011108234B4_0029
    Pegel 2 = | IN2 ( f ) | 2
    Figure DE102011108234B4_0030
  • Detektieren einer Richtung einer Zieltonquelle SS
  • Die Pegelbewertungseinheit 150 detektiert eine Größe von Pegeln der oben beschriebenen Tonsignale und detektiert eine Richtung einer Zieltonquelle SS. Zum Beispiel kann die Pegelbewertungseinheit 150 eine Richtung einer Zieltonquelle SS auf der Basis einer Bewertung detektieren, die unten beschrieben ist.
  • Die Pegelbewertungseinheit 150 bestimmt, dass eine Zieltonquelle SS der Seite des Mikrofons MIC1 nahe ist, wenn Pegel 1 Pegel 2 ist. Pegel 1 Pegel 2 liegt zum Beispiel dann vor, wenn ∑|IN1 (f)|2 ≥ 2,0 × ∑|IN2(f)|2 ist.
  • Die Pegelbewertungseinheit. 150 bestimmt, dass eine Zieltonquelle SS an einer Position vorhanden ist, wo Distanzen zu dem Mikrofon MIC1 und dem Mikrofon MIC2 im Wesentlichen dieselben sind, wenn Pegel 1 ≈ Pegel 2 ist.
  • Die Pegelbewertungseinheit 150 bestimmt, dass eine Zieltonquelle SS der Seite des Mikrofons MIC2 nahe ist, wenn Pegel 1 Pegel 2 ist. Pegel 1 Pegel 2 liegt zum Beispiel dann vor, wenn 2,0 × ∑|IN1 (f)|2 ≤ ∑|IN2(f)|2 ist.
  • Die Beziehung des Pegels 1 und des Pegels 2 und die Richtung der Zieltonquelle SS können zum Beispiel experimentell bestimmt werden.
  • Die Pegelbewertungseinheit 150 kann die Bestimmung, wie oben beschrieben, dann vornehmen, wenn die Zieltonquelle SS zum Beispiel innerhalb einer Distanz, die sich beispielsweise auf das 10fache einer Mikrofon-Distanz d beläuft, von dem Mikrofon MIC1 oder dem Mikrofon MIC2 liegt. Gemäß der Ausführuhgsform wird zum Beispiel eine Tonquelle nahe dem Mikrofon als eine Zieltonquelle SS angesehen, wie etwa der Mund eines Nutzers, der einen Handapparat eines Telefons verwendet.
  • (c) Steuern von Bereichen auf der Basis einer Richtung einer Zieltonquelle SS durch eine Bereichsfestlegungseinheit
  • Ein Verfahren zum Steuern des Tonempfangsbereiches, des Umstellbereiches und des Unterdrückungsbereiches auf der Basis einer Richtung der Zieltonquelle SS, die durch die Pegelbewertungseinheit 150 detektiert wird, wird nun beschrieben.
  • 20A bis 20C sind Beispiele für Verfahren zum Steuern eines Tonempfangsbereiches, eines Umstellbereiches und eines Unterdrückungsbereiches für jedes Mikrofon. 21A bis 21C zeigen die Bereichssteuerung von 20A bis 20C durch eine Beziehung zwischen jeder Frequenz und einer Phasenspektrendifferenz DIFF(f) {-π ≤ DIFF(f) ≤ π).
  • Die Bereichsfestlegungseinheit 121 legt jeden Bereich zum Beispiel so wie in 20A und 21A gezeigt fest, wenn Pegel 1 Pegel 2 ist. Mit anderen Worten: die Bereichsfestlegungseinheit 121 legt einen Tonempfangsbereich auf der Seite des Mikrofons MIC1 fest, weil die Zieltonquelle SS auf der Seite des Mikrofons MIC1 existiert. Indessen legt die Bereichsfestlegungseinheit 121 einen Unterdrückungsbereich auf der Seite des Mikrofons MIC2 fest und legt einen Umstellbereich zwischen dem Tonempfangsbereich und dem Unterdrückungsbereich fest. In 20A werden der Tonempfangsbereich und der Umstellbereich auf einer Minus-(MIC1)-Seite von 0 Grad festgelegt, und der Unterdrückungsbereich wird auf einer Plus-(MIC2)-Seite von 0 Grad festgelegt.
  • Die Bereichsfestlegungseinheit 121 legt den Tonempfangsbereich schmaler als den Unterdrückungsbereich fest, da ein Pegel 1 des Tonsignals in1(ti), das durch das Mikrofon MIC1 erhalten wird, höher als der Pegel 2 des Tonsignals in1(ti) ist, das durch das Mikrofon MIC2 erhalten wird. Das Mikrofon MIC1 kann einen Zielton von der Zieltonquelle SS selbst dann ausreichend empfangen, wenn der Tonempfangsbereich schmal ist, da geschätzt wurde, dass die Zieltonquelle dem Mikrofon MIC1 nahe ist.
  • Die Bereichsfestlegungseinheit 121 legt jeden Bereich so wie in 20B und 21B gezeigt fest, wenn Pegel 1 ≈ Pegel 2 ist. Mit anderen Worten: die Bereichsfestlegungseinheit 121 legt einen Tonempfangsbereich an einem mittleren Punkt zwischen dem Mikrofon MIC1 und dem Mikrofon MIC2 fest, weil die Zieltonquelle SS an einer Position vorhanden ist, wo Distanzen zum Mikrofon MIC1 und Mikrofon MIC2 im Wesentlichen gleich sind. Der Tonempfangsbereich enthält einen ersten Tonempfangsbereich, der ein Winkelbereich über 0 Grad ist, und einen zweiten Tonempfangsbereich, der ein Winkelbereich unter 0 Grad ist. Indessen legt die Bereichsfestlegungseinheit 121 Unterdrückungsbereiche auf beiden Seiten vom Mikrofon MIC1 und vom Mikrofon MIC2 fest. Der Unterdrückungsbereich enthält einen ersten Unterdrückungsbereich, der ein Winkelbereich über +n/2 ist, und einen zweiten Unterdrückungsbereich, der ein Winkelbereichüber -π/2 ist. Ein Bereich zwischen dem Tonempfangsbereich und dem Unterdrückungsbereich wird als Umstellbereich festgelegt. Die Bereichsfestlegungseinheit 121 steuert so, dass ein Volumen des ersten,Tonempfangsbereiches dem Volumen des zweiten Tonempfangsbereiches im Wesentlichen gleich wird. Ferner steuert die Bereichsfestlegungseinheit 121 so, dass ein Volumen des ersten Unterdrückungsbereiches dem Volumen des zweiten Unterdrückungsbereiches im Wesentlichen gleich wird. Daher kann die Mikrofonarrayvorrichtung bewirken, dass ein Geräuschunterdrückungsbetrag jedes Tonsignals von dem Mikrofon MIC1 und dem Mikrofon MIC2 im Wesentlichen gleich wird.
  • Die Bereichsfestlegungseinheit 121 legt jeden Bereich wie in 20C und 21C gezeigt fest, wenn Pegel 1 Pegel 2 ist. Mit anderen Worten: die Bereichsfestlegungseinheit 121 legt einen Tonempfangsbereich auf der Seite des Mikrofons MIC2 fest und legt einen Unterdrückungsbereich auf der Seite des Mikrofons MIC1 fest, da die Zieltonquelle SS auf der Seite des Mikrofons MIC2 liegt. Ein Bereich zwischen dem Tonempfangsbereich und dem Unterdrückungsbereich wird als Umstellbereich festgelegt. In 20C werden der Tonempfangsbereich und der Umstellbereich auf einer Plus-(MIC2)-Seite von 0 Grad festgelegt und wird der Unterdrückungsbereich auf einer Minus-(MIC1)-Seite von 0 Grad festgelegt.
  • Jeweilige Größen des Tonempfangsbereiches, des Tonunterdrückungsbereiches und des Umstellbereiches gemäß einem Verhältnis des Pegels 1 und des Pegels 2 können zum Beispiel experimentell bestimmt werden.
  • Synchronisationskoeffizientenberechnungseinheit
  • Die Synchronisationskoeffizientenberechnungseinheit 126 empfängt Informationen über den Tonempfangsbereich, den Umstellbereich und den Unterdrückungsbereich, die auf der Basis der Pegelbewertung festgelegt werden, von der Bereichsfestlegungseinheit 121. Die Synchronisationskoeffizientenberechnungseinheit 126 empfängt eine Phasenspektrendifferenz DIFF(f) von der Phasenspektrendifferenzberechnungseinheit 124. Die Synchronisationskoeffizientenberechnungseinheit 126 berechnet einen Synchronisationskoeffizienten C(f) auf der Basis des Tonempfangsbereiches, des Umstellbereiches und des Unterdrückungsbereiches, die basierend auf dem Geräuschzustand festgelegt werden, und der Phasenspektrendifferenz DIFF(f). Ein Verfahren zum Berechnen des Synchronisationskoeffizienten C(f) ist im Wesentlichen dasselbe wie jenes der zweiten Ausführungsform. Weiterhin kann die Synchronisationskoeffizientenberechnungseinheit 126 einen Synchronisationskoeffizienten Cg(f) berechnen, der von einer Verstärkung g(f) abhängig ist, indem der Synchronisationskoeffizient C(f) ferner mit der Verstärkung g(f) multipliziert wird, wie durch den Ausdruck (20) dargestellt.
  • Verarbeitungsablauf
  • Nachfolgend wird die Verarbeitung gemäß der Ausführungsform unter Bezugnahme auf 22 beschrieben. 22 ist ein Beispiel für ein Flussdiagramm, das eine Bereichsfestlegungsverarbeitung auf der Basis eines Verhältnisses von Pegeln zeigt, die durch die Mikrofonarrayvorrichtung gemäß der Ausführungsform ausgeführt wird.
  • Operation S51 bis Operation S53:
  • Operation S51 bis Operation S53 sind im Wesentlichen dieselben wie Operation S12 bis Operation S14 gemäß der zweiten Ausführungsform. Die erste Tonempfangseinheit 111 und die zweite Tonempfangseinheit 112 erhalten ein Tonsignal in1 (ti) und ein Tonsignal in2 (ti) auf einer Zeitachse. Der erste Signalkonverter 122 erzeugt ein komplexes Spektrum IN1 (f) von dem Tonsignal in1(ti) auf einer Frequenzachse. Der zweite Signalkonverter 123 erzeugt ein komplexes Spektrum IN2(f) von dem Tonsignal in2(ti) auf der Frequenzachse.
  • Operation S54:
  • Die Pegelbewertungseinheit 150 berechnet einen Pegel 1 und einen Pegel 2 jedes Tonsignals auf, der Basis des komplexen Spektrums IN1 (f) und des komplexen Spektrums IN2(f). Ferner identifiziert die Pegelbewertungseinheit 150 eine Richtung einer Zieltonquelle SS auf der Basis eines Resultates des Vergleichs zwischen dem Pegel 1 und dem Pegel 2.
  • Operation S55:
  • Die Bereichsfestlegungseinheit 121 steuert den Tonempfangsbereich, den Umstellbereich und den Unterdrückungsbereich auf der Basis der Richtung der Zieltonquelle SS.
  • Operation S56:
  • Die Phasenspektrendifferenzberechnungseinheit 124 berechnet eine Phasenspektrendifferenz DIFF(f), zwischen einem komplexen Spektrum IN1 (f) und einem komplexen Spektrum IN2,(f) für jede Frequenz.
  • Operation- S57 bis Operation S60:
  • Operation S57 bis Operation S60 sind im Wesentlichen dieselben wie Operation S19 bis Operation S26 gemäß der zweiten Ausführungsform. Die Synchronisationskoeffizientenberechnungseinheit 126 berechnet den Synchronisationskoeffizienten C(f) auf der Basis des Tonempfangsbereiches, des Umstellbereiches und des Unterdrückungsbereiches, die auf der Basis der Pegelbewertung festgelegt werden, und der Phasenspektrendifferenz DIFF(f) (Operation S57). Weiterhin kann ein Synchronisationskoeffizient Cg(f) berechnet werden, der von der Verstärkung, g(f) abhängig ist.
  • Die Synchronisationseinheit 127 multipliziert das komplexe Spektrum IN2(f) mit dem komplexen Spektrum C(f) oder dem Synchronisationskoeffizienten Cg(f), um das komplexe Spektrum IN2(f) mit dem komplexen Spektrum IN1(f) zu synchronisieren (Operation S58). Die Subtraktionseinheit 128 subtrahiert das Multiplikationsresultat von Operation S58 von dem komplexen Spektrum IN1(f), um eine Ausgabe OUT(f) zu erhalten (Operation S59). Die Signalwiederherstellungseinheit 129 konvertiert die .Ausgabe OUT(f) von der Subtraktionseinheit 128 in ein Signal auf einer Zeitachse, führt ferner eine überlappende Additionsoperation aus und gibt ein Ausgangssignal in einer Zeitdomäne des Mikrofons MIC1 aus (Operation S60). Nach Vollendung der Verarbeitung kehrt der Prozess zu Operation S51 zurück, und die oben beschriebene Verarbeitung wird in einem Intervall wiederholt, das zum Beispiel auf einer gewissen Abtastfrequenz basiert.
  • Die Mikrofonarrayvorrichtung 400 gemäß der Ausführungsform legt jeden Bereich gemäß einer Richtung einer Zieltonquelle SS fest. Zum Beispiel kann sich eine tatsächliche Richtung eines Zieltons SS von einer Richtung einer Zieltonquelle SS, die zuvor festgelegt wurde, in Abhängigkeit davon unterscheiden, wie ein Mobiltelefon gehalten wird. Die Mikrofonarrayvorrichtung 400 gemäß der Ausführungsform kann Bereiche, wie zum Beispiel einen Tonempfangsbereich, gemäß einer Veränderung einer Richtung der Zieltonquelle SS auch dann festlegen, wenn die Richtung der Zielquelle SS verändert wird. Daher kann die Mikrofonarrayvorrichtung 400 einen Zielton von der Zieltonquelle SS als Ton aus dem Tonempfärigsbereich empfangen und kann Geräusch unterdrücken, während die Verzerrung des Zieltons unterdrückt wird.
  • Kombination der zweiten Ausführungsform und der dritten Ausführungsform
  • Die vierte Ausführungsform kann mit der zweiten Ausführungsform und der dritten Ausführungsform kombiniert werden. Mit anderen Worten: die Mikrofonarrayvorrichtung steuert den Tonempfangsbereich, den Umstellbereich und den Unterdrückungsbereich auf der Basis eines Bewertungsresultates eines Pegels von Tönen, die durch die zwei Mikrofone MIC1 und MIC2 empfangen werden, wie in der vierten Ausführungsform beschrieben. Die Mikrofonarrayvorrichtung steuert den Tonempfangsbereich, den Umstellbereich und den Unterdrückungsbereich gemäß einem Geräuschzustand, wie in der zweiten Ausführungsform und der dritten Ausführungsform beschrieben.
  • Kombination der zweiten Ausführungsform und der vierten Ausführungsform
  • 23 ist ein Blockdiagramm, das eine funktionelle Konfiguration zeigt, wenn die zweite Ausführungsform und die vierte Ausführungsform kombiniert werden. Eine Pegelbewertungseinheit 150 wurde zu der funktionellen Konfiguration in 6 gemäß der zweiten Ausführungsform hinzugefügt. Gemäß der Ausführungsförm enthält eine Unterdrückungseinheit 130 eine Bereichsfestlegungseinheit 121, eine Synchronisationskoeffizientenberechnungseinheit 126, eine Synchronisationseinheit 127 und eine Subtraktionseinheit 128.
  • Die Pegelbewertungseinheit 150 berechnet einen Pegel 1 und einen Pegel 2 jedes Tonsignals des Mikrofons MIC1 und des Mikrofons MIC2. Ferner identifiziert die Pegelbewertungseinheit 150 eine Richtung einer Zieltonquelle SS durch das Vergleichen des Pegels 1 und des Pegels 2. Die Bereichsfestlegungseinheit 121 steuert den Tonempfangsbereich, den Umstellbereich und den Unterdrückungsbereich auf der Basis der Richtung der Zieltonquelle SS. Ein Synchronisationskoeffizient C(f) usw. werden auf der Basis der Bereichsfestlegungen berechnet, und die Signalwiederherstellungseinheit 129 gibt ein Ausgangssignal aus. Die oben beschriebene Verarbeitung zum Steuern jedes Bereiches auf der Basis der detektierten Richtung der Zieltonquelle SS wird in einem Intervall wiederholt, das zum Beispiel auf einer gewissen Abtastfrequenz basiert.
  • Indessen sieht die Geräuschzustandsbewertungseinheit 125 einen ankommenden Ton als Geräusch an, wenn eine Phasenspektrendifferenz DIFF(f) in dem Unterdrückungsbereich enthalten ist, und bewertet einen Geräuschzustand wie in der zweiten Ausführungsformen. Die Bereichsfestlegungseinheit 121 erhält einen Geräuschzustand von der Geräuschzustandsbewertungseinheit 125 und steuert den Tonempfangsbereich, den Umstellbereich und den Unterdrückungsbereich auf der Basis des Geräuschzustandes. Ferner werden ein Synchronisationskoeffizient C(f) usw. berechnet, und die Signalwiederherstellungseinheit 129 gibt ein Ausgangssignal aus. Die oben beschriebene Verarbeitung zum Steuern jedes Bereiches auf der Basis des Geräuschzustandes wird in einem Intervall wiederholt, das zum Beispiel auf einer gewissen Abtastfrequenz basiert.
  • Ein Beispiel für das Steuern von Bereichen wird, unter Bezugnahme auf 24A bis 24C beschrieben. 24A bis 24C zeigen ein Beispiel für ein Verfahren zum Steuern eines Tonempfangsbereiches, eines Umstellbereiches und eines Unterdrückungsbereiches.
  • Als Resultat einer Bewertung durch die Pegelbewertungseinheit 150 wird hinsichtlich der Pegel von Tonsignalen der Mikrofone MIC1 und MIC2 zum Beispiel als gegeben angenommen, dass Pegel 1 Pegel 2 ist. In diesem Fall bestimmt die Pegelbewertungseinheit 150, dass eine Zieltonquelle SS auf der Seite des Mikrofons MIC1 liegt. Die Bereichsfestlegungseinheit 121 legt einen Tonempfangsbereich auf der Seite des Mikrofons MIC1 fest, wie in 24A gezeigt, und legt einen Unterdrückungsbereich auf der Seite des Mikrofons MIC2 fest. Ein Bereich zwischen dem Tonempfangsbereich und dem Unterdrückungsbereich wird als Umstellbereich festgelegt.
  • Die Geräuschzustandsbewertungseinheit 125 sieht einen ankommenden Ton als Geräusch an, wenn eine Phasenspektrendifferenz DIFF(f) in dem Unterdrückungsbereich enthalten ist, wie in 24A gezeigt, und bewertet den Geräuschzustand. Zum Beispiel wird davon ausgegangen, dass ein Geräuschpegel L(f) klein ist und der Geräuschpegel L(f) = 0 ist und eine Geräuschpegelveränderung S(f) klein ist und die Geräuschpegelveränderung S(f) = 0 ist und ein kombinierter Wert LS(f) = 0 ist. In diesem Fall verändert die Bereichsfestlegungseinheit 121 jeden Bereich, wie in 24A bis 24B gezeigt. In 24B wird zum Beispiel der Umstellbereich erweitert und dadurch der Unterdrückungsbereich eingeengt. Eine Grenze zwischen dem Umstellbereich und dem Unterdrückungsbereich verschiebt sich nach der Veränderung auf die Seite des Unterdrückungsbereiches. Das Einengen des Unterdrückungsbereiches gestattet das Steuern der Richtwirkung der Mikrofonarrayvorrichtung, um Geräusch zu unterdrücken, dessen Tonquelle, im Unterdrückungsbereich liegt, während eine Verzerrung eines Zieltons von der Zieltonquelle SS in dem Tonempfangsbereich unterdrückt wird. Weiterhin gestattet die Erweiterung des Umstellbereiches ein allmähliches Umstellen von dem Tonempfangsbereich auf den Unterdrückungsbereich, und dadurch eine allmähliche Veränderung eines Grades der Geräuschunterdrückung.
  • 24C zeigt eine Bereichssteuerung von 24B durch eine Beziehung zwischen jeder Frequenz und einer Phasenspektrendifferenz DIFF(f) (-π ≤ DIFF(f) ≤ π). Der Punkt P2 liegt vor dem Erweitern des Umstellbereiches im Unterdrückungsbereich. Nach dem Erweitern des Umstellbereiches liegt der Punkt P2 jedoch im Umstellbereich. Daher ist ein Betrag zum Unterdrücken von Geräusch, das Charakteristiken des Punktes P2 aufweist, nach dem Verändern des Umstellbereiches kleiner als vor dem Verändern des Umstellbereiches. Eine Steuerung, die den Umstellbereich erweitert, während der Unterdrückungsbereich eingeengt wird, kann eine Verzerrung eines Zieltons unterdrücken, während ein Unterdrückungsbetrag von Geräusch reduziert wird.
  • Kombination der dritten Ausführungsform und der vierten Ausführungsform
  • 25 ist ein Beispiel für ein Blockdiagramm, das eine funktionelle Konfiguration zeigt, wenn die dritte Ausführungsform und die vierte Ausführungsform kombiniert werden. In 25 wurde zu der funktionellen Konfiguration in 16 gemäß der dritten Ausführungsform ferner eine Pegelbewertungseinheit 150 hinzugefügt. Gemäß der Ausführungsform, die die dritte Ausführungsform und die vierte Ausführungsform kombiniert, enthält eine Unterdrückungseinheit 130 eine Bereichsfestlegungseinheit 121, eine Verstärkungsberechnungseinheit 140, eine Synchronisationseinheit 127 und eine Subtraktionseinheit 128.
  • Die Bereichsfestlegungseinheit 121 steuert einen Tonempfangsbereich, einen Umstellbereich und einen Unterdrückungsbereich auf der Basis eines Resultates des Vergleichs zwischen dem Pegel 1 und dem Pegel 2 durch die Pegelbewertungseinheit 150.
  • Indessen sieht die Geräuschzustandsbewertungseinheit 125 einen ankommenden Ton als Geräusch an, wenn eine Phasenspektrendifferenz DIFF(f) in dem Unterdrückungsbereich enthalten ist, und bewertet den Geräuschzustand wie in der zweiten Ausführungsform. Die Verstärkungsberechnungseinheit 140 berechnet eine Verstärkung G(f) zum Anpassen eines Unterdrückungsbetrages von Geräusch auf einer Frequenzachse auf der Basis des Tonempfangsbereiches, des Umstellbereiches und des Unterdrückungsbereiches, die basierend auf dem Geräuschzustand festgelegt werden, und der Phasenspektrendifferenz DIFF(f). Die Verstärkungsmultiplikationseinheit 141 multipliziert das komplexe Spektrum IN1(f) mit der Verstärkung G(f), um OUT(f) auszugeben. Die Signalwiederherstellungseinheit 129 konvertiert die Ausgabe OUT(f) in ein Signal auf der Zeitachse und führt ferner eine überlappende Additionsoperation aus und gibt ein Ausgangssignal in einer Zeitdomäne des Mikrofons MIC1 aus. Die oben beschriebene Verarbeitung wird in einem Intervall wiederholt, das zum Beispiel auf einer gewissen Abtastfrequenz basiert.
  • Wie oben beschrieben, kann durch das Festlegen jedes Bereiches gemäß einer Richtung der Zieltonquelle SS und einem Geräuschzustand Geräusch unterdrückt werden, während eine Verzerrung des Zieltons unterdrückt wird.
  • Alternative Ausführungsformen
  • Die oben beschriebenen Ausführungsformen können auf die unten beschriebenen alternativen Ausführungsformen angewendet werden.
  • Erste alternative Ausführungsform
  • In den ersten, zweiten, dritten und vierten Ausführungsformen werden ein Geräuschpegel, eine Geräuschpegelveränderung und ein kombinierter Wert, der von dem Geräuschpegel und der Geräuschpegelveränderung erhalten wird, zum Darstellen eines Geräuschzustandes verwendet. Die oben beschriebenen Elemente, die einen Geräuschzustand darstellen, können jedoch als Geräuschzustand verwendet werden. Darüber hinaus sind Verfahren zum Berechnen eines Geräuschpegels, einer Geräuschpegelveränderung und eines kombinierten Wertes nicht auf jene beschränkt, die in den ersten bis vierten Ausführungsformen beschrieben sind.
  • Zweite alternative Ausführungsform
  • In der zweiten Ausführungsform und der dritten Ausführungsform wird ein Unterdrückungsbetrag, von Geräusch durch angemessenes Berücksichtigen sowohl eines Geräuschpegels L(f) als auch einer Geräuschpegelveränderung S(f) angepasst. Zu diesem Zweck messen die Mikrofonarrayvorrichtungen gemäß der zweiten Ausführungsform und der dritten Ausführungsform die Dauer eines Zustandes, während der der Geräuschpegel L(f) < Geräuschpegelveränderung S(f) ist oder der Geräuschpegel L(f) > Geräuschpegelveränderung S(f) ist. Die Mikrofonarrayvorrichtung passt einen Einfluss des Geräuschpegels L(f) oder der Geräuschpegelveränderung S(f) auf den kombinierten Wert LS(f) gemäß der Dauer an. Mit anderen Worten: die Mikrofonarrayvorrichtung passt einen Einfluss von Geräusch auf einen Unterdrücküngsbetrag von Geräusch an.
  • Das Anpassungsverfahren kann auch auf die erste Ausführungsform angewendet werden. In der ersten Ausführungsform werden der Geräuschpegel L(ti) und die Geräuschpegelveränderung S(ti) so festgelegt, dass die zwei Werte verglichen werden können, wie in der zweiten Ausführungsform. Zum Beispiel berechnet die Geräuschzustandsbewertungseinheit 125 einen relativen Wert für ein volles Ausmaß für einen Geräuschpeger, der durch einen Durchschnittswert von |in1 (ti)| dargestellt wird. Die Geräuschzustandsbewertungseinheit 125 berechnet einen Geräuschpegel L(ti ) auf der Basis des relativen Wertes. Ferner berechnet die Geräuschzustandsbewertungseinheit 125 ein Verhältnis von |in1(ti)| und dem Durchschnittswert von |in1(ti)|. Die Geräuschzustandsbewertungseinheit 125 berechnet eine Geräuschpegelveränderung S(ti ) auf der Basis des Verhältnisses. Als Resultat werden sowohl der Geräuschpegel L(ti) als auch die Geräuschpegelveränderung S(ti) größer gleich 0 und kleiner gleich 1 und können verglichen werden.
  • Dritte alternative Ausführungsform
  • Die ersten bis vierten Ausführungsformen offenbaren Verfahren zum Anpassen eines Unterdrückungsbetrages von Geräusch auf der Basis eines Geräuschzustandes und zum Unterdrücken einer Verzerrung eines Zieltons. Die Konfiguration zum Anpassen eines Unterdrückungsbetrages von Geräusch auf der Basis des Geräuschzustandes kann zum Beispiel auf ein Synchronadditionsverfahren angewendet werden.
  • Vierte alternative Ausführungsform
  • Gemäß den ersten bis vierten Ausführungsformen ist eine Vielzahl von Mikrofonen auf einer im Wesentlichen geraden Linie eindimensional angeordnet. Von der Vielzahl von Mikrofonen werden das Mikrofon MIC1 und das Mikrofon MIC2 verwendet. Jedoch kann die Vielzahl von Mikrofonen zum Beispiel zu einem Scheitelpunkt eines Dreiecks zweidimensional angeordnet sein. Durch zweidimensionales Anordnen der Vielzahl von Mikrofonen kann eine komplexere und feinere Steuerung der Richtwirkung erzielt werden.
  • Fünfte alternative Ausführungsform
  • Eine Mikrofonarrayvorrichtung kann in solchen Vorrichtungen wie etwa einer Anlage an Bord eines Fahrzeuges oder einer Autonävigationsvorrichtung mit einer Audioerkennungsvorrichtung, einem Freisprechtelefon oder einem Mobiltelefon inkorporiert sein.
  • Sechste alternative Ausführungsform
  • Die oben beschriebene Verarbeitung kann erreicht werden, indem bewirkt wird, dass jede Funktionseinheit der CPU 101 Programme ausführt, die in dem ROM 102 gespeichert sind. Jedoch kann eine Signalverarbeitungsschaltung, die als Hardware implementiert ist, die oben beschriebene Verarbeitung gemäß den Programmen ausführen.
  • Siebte alternative Ausführungsform
  • Weiterhin sind Computerprogramme, die bewirken, dass ein Computer das oben beschriebene Verfahren ausführt, und ein computerlesbares Speichermedium, das die Computerprogramme speichert, im Umfang der vorliegenden Offenbarung enthalten. Das computerlesbare Speichermedium enthalt zum Beispiel eine flexible Platte, eine Festplatte, einen Kompaktplatten-Nür-Lese-Speicher (CD-ROM), eine magneto-optische (MO) Platte, eine digitale Mehrzweckplatte (DVD), eine DVD-ROM, einen DVD-Speicher mit wahlfreiem Zugriff (RAM), eine Blu-Ray-Disc (BD), einen Universal Serial-Bus-(USB)-Speicher und einen Halbleiterspeicher. Die oben beschriebenen Compüterprogramme sind nicht auf jene beschränkt, die in dem Speichermedium gespeichert sind, sondern sie können über eine elektrische Kommunikationsverbindung, eine drahtlose oder eine drahtgebundene Kommunikationsverbindung und ein Netz wie etwa das Internet geliefert werden.
  • Alle Beispiele und die bedingte Sprache, die hierin verwendet werden, sollen pädagogischen Zwecken dienen, um den Leser beim Verstehen der Prinzipien der Erfindung und der durch den Erfinder beigesteuerten Konzepte zum Fördern der Technik zu unterstützen, und sind so aufzufassen, dass sie nicht auf solche speziell angeführten Beispiele und Bedingungen beschränkt sind, noch soll sich die Anordnung solcher Beispiele in der Beschreibung auf eine Darstellung der Überlegenheit und Unterlegenheit der Erfindung beziehen. Obwohl die Ausführungsformen der vorliegenden Erfindungen eingehend beschrieben worden sind, versteht sich, dass an ihr die verschiedensten Veränderungen, Substitutionen und Abänderungen vorgenommen werden könnten, ohne vom Grundgedanken und Umfang der Erfindung abzuweichen.

Claims (6)

  1. Mikrofonarrayvorrichtung mit: einer ersten Tonempfangseinheit, die konfiguriert ist, um ein erstes Tonsignal zu erhalten, das von einem ersten Mikrofon eingegeben wird; einer zweiten Tonempfangseinheit, die konfiguriert ist, um ein zweites Tonsignal zu erhalten, das von einem zweiten Mikrofon eingegeben wird, das sich von dem ersten Mikrofon unterscheidet; einem ersten Signalkonverter, der konfiguriert ist, um erste Spektren zu erzeugen, die durch Konvertieren des ersten Tonsignals in eine Frequenzkomponente erhalten werden; einem zweiten Signalkonverter, der konfiguriert ist, um zweite Spektren zu erzeugen, die durch Konvertieren des zweiten Tonsignals in die Frequenzkomponente erhalten werden; einer Phasenspektrendifferenzberechnungseinheit, die konfiguriert ist, um eine Phasenspektrendifferenz zwischen den ersten Spektren und den zweiten Spektren für jede Frequenz auf der Basis der ersten Spektren und der zweiten Spektren zu berechnen; einer Geräuschzustandsbewertungseinheit, die konfiguriert ist, um eine Pegelveränderung für ein Spektrum zu berechnen, worin eine Richtung, die durch die Phasenspektrendifferenz für die jeweilige Frequenz angegeben wird, im Bereich von einer ersten Richtung bis zu einer zweiten Richtung enthalten ist, und weiter konfiguriert ist, um einen Bewertungsparameter auf der Basis der Pegelveränderung zu erhalten, um einen Einfluss eines Nichtzieltons auf einen Zielton zu bewerten, auf der Basis des Spektrums, worin eine Richtung, die durch die Phasenspektrendifferenz für die jeweilige Frequenz angegeben wird, im Bereich von der ersten Richtung bis zu der zweiten Richtung enthalten ist, unter den ersten Spektren; und einer Unterdrückungseinheit, die konfiguriert ist, um den Nichtzielton, der in den ersten Spektren enthalten ist, auf der Basis des Bewertungsparameters zu unterdrücken.
  2. Mikrofonarrayvorrichtung-nach Anspruch 1, bei der die Geräuschzustandsbewertungseinheit einen Pegel des, Spektrums berechnet, worin eine Richtung, die durch die Phasenspektrendifferenz für die jeweilige Frequenz angegeben wird, im Bereich von der ersten Richtung bis zu der zweiten Richtung enthalten ist, und den Bewertungsparameter auf der Basis des Pegels erhält.
  3. Mikrofonarrayvorrichtung nach Anspruch 1, bei der die Unterdrückungseinheit umfasst: eine Bereichsfestlegungseinheit, die konfiguriert ist, um einen ersten Unterdrückungsbereich zu verändern, der von der ersten Richtung bis zu der zweiten Richtung reicht, in einen zweiten Unterdrückungsbereich, der von einer dritten Richtung bis zu einer vierten Richtung reicht.
  4. Mikrofonarrayvorrichtung nach Anspruch 3, bei der die Bereichsfestlegungseinheit den zweiten Unterdrückungsbereich in einen breiteren Unterdrückungsbereich verändert, wenn der Bewertungsparameter größer wird.
  5. Mikrofonarrayvorrichtung nach Anspruch 1, bei der die Unterdrückungseinheit umfasst: eine Synchronisationseinheit, die konfiguriert ist, um andere zweite Spektren zu erzeugen, die durch Synchronisieren der zweiten Spektren mit den ersten Spektren erhalten werden, auf der Basis der Phasenspektrendifferenz, die für die jeweilige Frequenz berechnet wird, und des Bewertungsparameters; und eine Subtraktionseinheit, die konfiguriert ist, um Spektren, die auszugeben sind, auf der Basis der ersten Spektren und der anderen zweiten Spektren zu erzeugen.
  6. Mikrofonarrayvorrichtung nach Anspruch 1, bei der die Unterdrückungseinheit umfasst: eine Verstärkungsberechnungseinheit, die konfiguriert ist, um einen Unterdrückungsbetrag zu berechnen, der für die jeweilige Frequenz anzuwenden ist, auf der Basis der Phasenspektrendifferenz, die für die jeweilige. Frequenz berechnet wird, und des Bewertungsparameters; und eine Verstärkungsmultiplikationseinheit, die konfiguriert ist um die ersten Spektren mit der Verstärkung für die jeweilige Frequenz zu multiplizieren.
DE102011108234.8A 2010-05-19 2011-05-13 Mikrofonarrayvorrichtung Active DE102011108234B4 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2010-114897 2010-05-19
JP2010114897A JP5672770B2 (ja) 2010-05-19 2010-05-19 マイクロホンアレイ装置及び前記マイクロホンアレイ装置が実行するプログラム

Publications (2)

Publication Number Publication Date
DE102011108234A1 DE102011108234A1 (de) 2011-12-01
DE102011108234B4 true DE102011108234B4 (de) 2019-01-24

Family

ID=44924939

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102011108234.8A Active DE102011108234B4 (de) 2010-05-19 2011-05-13 Mikrofonarrayvorrichtung

Country Status (3)

Country Link
US (2) US8891780B2 (de)
JP (1) JP5672770B2 (de)
DE (1) DE102011108234B4 (de)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5672770B2 (ja) * 2010-05-19 2015-02-18 富士通株式会社 マイクロホンアレイ装置及び前記マイクロホンアレイ装置が実行するプログラム
JP5333559B2 (ja) * 2011-10-07 2013-11-06 株式会社デンソー 車両用装置
US9805738B2 (en) * 2012-09-04 2017-10-31 Nuance Communications, Inc. Formant dependent speech signal enhancement
JP6214651B2 (ja) * 2013-06-11 2017-10-18 Toa株式会社 マイクロホンアレイ制御装置
US9247364B2 (en) * 2013-10-18 2016-01-26 The Boeing Company Variable aperture phased array incorporating vehicle swarm
JP6421313B2 (ja) * 2014-07-28 2018-11-14 株式会社オーディオテクニカ マイクロホン装置
US10515650B2 (en) 2015-06-30 2019-12-24 Nec Corporation Signal processing apparatus, signal processing method, and signal processing program
JP6594721B2 (ja) * 2015-09-28 2019-10-23 アルパイン株式会社 音声認識システム、ゲイン設定システム及びコンピュータプログラム
US10825465B2 (en) 2016-01-08 2020-11-03 Nec Corporation Signal processing apparatus, gain adjustment method, and gain adjustment program
CN107437420A (zh) * 2016-05-27 2017-12-05 富泰华工业(深圳)有限公司 语音信息的接收方法、系统及装置
CN106128448A (zh) * 2016-08-30 2016-11-16 金嵩 一种新型球场用声音收集器
DE102017206788B3 (de) 2017-04-21 2018-08-02 Sivantos Pte. Ltd. Verfahren zum Betrieb eines Hörgerätes
CN107742522B (zh) * 2017-10-23 2022-01-14 科大讯飞股份有限公司 基于麦克风阵列的目标语音获取方法及装置

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6668062B1 (en) 2000-05-09 2003-12-23 Gn Resound As FFT-based technique for adaptive directionality of dual microphones
JP2007318528A (ja) * 2006-05-26 2007-12-06 Fujitsu Ltd 指向性集音装置、指向性集音方法、及びコンピュータプログラム
EP1887831A2 (de) 2006-08-09 2008-02-13 Fujitsu Limited Verfahren, Vorrichtung und Programm zur Schätzung der Richtung einer Schallquelle
US7436188B2 (en) 2005-08-26 2008-10-14 Step Communications Corporation System and method for improving time domain processed sensor signals
WO2009025090A1 (ja) 2007-08-22 2009-02-26 Panasonic Corporation 指向性マイクロホン装置
US20100008519A1 (en) 2008-07-11 2010-01-14 Fujitsu Limited Noise suppressing device, noise suppressing method and mobile phone
US20100056227A1 (en) 2008-08-27 2010-03-04 Fujitsu Limited Noise suppressing device, mobile phone, noise suppressing method, and recording medium
DE102009034264A1 (de) 2008-10-31 2010-05-06 Fujitsu Limited, Kawasaki Vorrichtung zum Verarbeiten eines Tonsignals und Verfahren zum Verarbeiten eines Tonsignals
JP2010114897A (ja) 2008-11-04 2010-05-20 Gn Resound As 非対称的調整

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08191496A (ja) * 1995-01-09 1996-07-23 Matsushita Electric Ind Co Ltd 接話マイクロホン
JPH09149490A (ja) * 1995-11-22 1997-06-06 Matsushita Electric Ind Co Ltd マイクロホン装置
JPH1118186A (ja) * 1997-06-25 1999-01-22 Purimo:Kk 一次圧力傾度マイク
JP3484112B2 (ja) * 1999-09-27 2004-01-06 株式会社東芝 雑音成分抑圧処理装置および雑音成分抑圧処理方法
JP4457221B2 (ja) 2003-08-29 2010-04-28 学校法人早稲田大学 音源分離方法およびそのシステム、並びに音声認識方法およびそのシステム
JP4520732B2 (ja) * 2003-12-03 2010-08-11 富士通株式会社 雑音低減装置、および低減方法
JP2005266797A (ja) 2004-02-20 2005-09-29 Sony Corp 音源信号分離装置及び方法、並びにピッチ検出装置及び方法
EP1755112B1 (de) 2004-02-20 2008-05-28 Sony Corporation Verfahren und Vorrichtung zur Trennung von Schallquellensignalen
JP2007174011A (ja) * 2005-12-20 2007-07-05 Yamaha Corp 収音装置
JP4823713B2 (ja) 2006-02-17 2011-11-24 株式会社ハウステック 貯湯式給湯機
JP5401759B2 (ja) * 2007-01-16 2014-01-29 ソニー株式会社 音声出力装置、音声出力方法、音声出力システムおよび音声出力処理用プログラム
JP4854533B2 (ja) * 2007-01-30 2012-01-18 富士通株式会社 音響判定方法、音響判定装置及びコンピュータプログラム
JP5070993B2 (ja) * 2007-08-27 2012-11-14 富士通株式会社 音処理装置、位相差補正方法及びコンピュータプログラム
JP2010124370A (ja) * 2008-11-21 2010-06-03 Fujitsu Ltd 信号処理装置、信号処理方法、および信号処理プログラム
US8873769B2 (en) * 2008-12-05 2014-10-28 Invensense, Inc. Wind noise detection method and system
JP5446745B2 (ja) * 2009-11-05 2014-03-19 富士通株式会社 音信号処理方法および音信号処理装置
JP5493850B2 (ja) * 2009-12-28 2014-05-14 富士通株式会社 信号処理装置、マイクロホン・アレイ装置、信号処理方法、および信号処理プログラム
JP5672770B2 (ja) * 2010-05-19 2015-02-18 富士通株式会社 マイクロホンアレイ装置及び前記マイクロホンアレイ装置が実行するプログラム

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6668062B1 (en) 2000-05-09 2003-12-23 Gn Resound As FFT-based technique for adaptive directionality of dual microphones
US7436188B2 (en) 2005-08-26 2008-10-14 Step Communications Corporation System and method for improving time domain processed sensor signals
JP2007318528A (ja) * 2006-05-26 2007-12-06 Fujitsu Ltd 指向性集音装置、指向性集音方法、及びコンピュータプログラム
EP1887831A2 (de) 2006-08-09 2008-02-13 Fujitsu Limited Verfahren, Vorrichtung und Programm zur Schätzung der Richtung einer Schallquelle
WO2009025090A1 (ja) 2007-08-22 2009-02-26 Panasonic Corporation 指向性マイクロホン装置
US20100008519A1 (en) 2008-07-11 2010-01-14 Fujitsu Limited Noise suppressing device, noise suppressing method and mobile phone
US20100056227A1 (en) 2008-08-27 2010-03-04 Fujitsu Limited Noise suppressing device, mobile phone, noise suppressing method, and recording medium
DE102009034264A1 (de) 2008-10-31 2010-05-06 Fujitsu Limited, Kawasaki Vorrichtung zum Verarbeiten eines Tonsignals und Verfahren zum Verarbeiten eines Tonsignals
US20100111325A1 (en) 2008-10-31 2010-05-06 Fujitsu Limited Device for processing sound signal, and method of processing sound signal
JP2010114897A (ja) 2008-11-04 2010-05-20 Gn Resound As 非対称的調整

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Englischsprachige Maschinenübersetzung zur WO 2009 / 025090 A1 *

Also Published As

Publication number Publication date
US20150030174A1 (en) 2015-01-29
JP5672770B2 (ja) 2015-02-18
US10140969B2 (en) 2018-11-27
US8891780B2 (en) 2014-11-18
US20110286604A1 (en) 2011-11-24
DE102011108234A1 (de) 2011-12-01
JP2011244232A (ja) 2011-12-01

Similar Documents

Publication Publication Date Title
DE102011108234B4 (de) Mikrofonarrayvorrichtung
DE112014003443B4 (de) Mikrophonkalibrierung
EP1595427B1 (de) Verfahren und vorrichtung zur separierung von schallsignalen
DE102008039276B4 (de) Tonverarbeitungsvorrichtung, Vorrichtung und Verfahren zum Steuern der Verstärkung und Computerprogramm
DE60108752T2 (de) Verfahren zur rauschunterdrückung in einem adaptiven strahlformer
DE102010023615B4 (de) Signalverarbeitungsvorrichtung und Signalverarbeitungsverfahren
DE112011105791B4 (de) Störungsunterdrückungsvorrichtung
DE112011104737B4 (de) Geräuschunterdrückungsvorrichtung
US9854368B2 (en) Method of operating a hearing aid system and a hearing aid system
US8488806B2 (en) Signal processing apparatus
US8090119B2 (en) Noise suppressing apparatus and program
DE102009052539B4 (de) Signalverarbeitungseinheit und Signalverarbeitungsverfahren
DE102010055476A1 (de) Signalverarbeitungsgerät, Mikrofonarrayvorrichtung und Speichermedium, das ein Signalverarbeitungsprogramm speichert
DE102008027848A1 (de) Echounterdrücker, Echounterdrückungsverfahren und computerlesbares Speichermedium
DE102009034264B4 (de) Vorrichtung zum Verarbeiten eines Tonsignals und Verfahren zum Verarbeiten eines Tonsignals
DE112009000805T5 (de) Rauschreduktion
US8208666B2 (en) Method for determining unbiased signal amplitude estimates after cepstral variance modification
EP1771034A2 (de) Mikrofonkalibrierung bei einem RGSC-Beamformer
CN103886865A (zh) 声音处理装置、声音处理方法和程序
DE102008004674A1 (de) Signalaufnahme mit variabler Richtcharakteristik
EP2023669A2 (de) Verfahren zum Betrieb eines Hörgerätesystems und Hörgerätesystem
DE102013201043B4 (de) Verfahren und Vorrichtung zum Bestimmen eines Verstärkungsfaktors eines Hörhilfegeräts
DE102015221764A1 (de) Verfahren zum Angleichen von Mikrofonempfindlichkeiten
DE102008017550A1 (de) Mehrstufiges Schätzverfahren zur Störgeräuschreduktion und Hörvorrichtung
EP3065417B1 (de) Verfahren zur unterdrückung eines störgeräusches in einem akustischen system

Legal Events

Date Code Title Description
R012 Request for examination validly filed
R082 Change of representative

Representative=s name: HOFFMANN - EITLE PATENT- UND RECHTSANWAELTE PA, DE

R016 Response to examination communication
R018 Grant decision by examination section/examining division
R020 Patent grant now final