-
TECHNISCHES GEBIET
-
Die vorliegende Offenbarung bezieht sich auf eine Signalverarbeitungsvorrichtung, die ein Signal erwirbt, in welchem ein aus einer bestimmten Richtung kommender Ton hervorgehoben wird, indem eine Signalverarbeitung bei Beobachtungssignalen durchgeführt wird, die von einer Sensorgruppe, die mehrere Schallsensoren enthält, erworben wurden.
-
STAND DER TECHNIK
-
Eine Signalverarbeitungsvorrichtung kann einen Ton (Zielton), der aus einer von einem Benutzer gewünschten Richtung kommt, hervorheben und andere Töne (Störtöne) unterdrücken durch Verwendung einer Sensorgruppe, die mehrere Schallsensoren (z. B. Mikrofone) enthält, und Durchführen einer vorbestimmte Signalverarbeitung bei einem Beobachtungssignal, das von jedem der mehreren Schallsensoren erworben wurde.
-
Mit dieser Vorrichtung ist es beispielsweise möglich, einen Ton klar zu erhalten, der aufgrund eines Geräusches, das in einer Anlage, wie einem Klimagerät, auftritt, schwierig zu erfassen ist, und nur die Äußerung eines gewünschten Sprechers hervorzuheben, wenn mehrere Sprecher sich gleichzeitig äußern.
-
Die vorgenannte Technik kann nicht nur bewirken, dass ein Ton leicht von Menschen erfasst wird, sondern auch die Robustheit gegenüber Störungen in Spracherkennungssystemen oder dergleichen verbessern. Weiterhin kann die Technik zusätzlich zum Bewirken, dass die Äußerung eines Menschen klar ist, beispielsweise in einem Gerätschaftüberwachungssystem, das automatisch bestimmt, ob ein anomaler Ton in einem Betriebston von der Gerätschaft enthalten ist oder nicht, für einen Zweck oder dergleichen des Verhinderns der Verschlechterung der Genauigkeit der Bestimmung aufgrund eines Geräuschs in der Umgebung verwendet werden.
-
Verschiedene Verfahren des Bildens einer Richtwirkung durch Verwendung einer Sensorgruppe und des Durchführens einer Signalverarbeitung wurden herkömmlich offenbart. Beispielsweise wird im Nichtpatentdokument 1 eine Technik zum Bilden einer Richtwirkung durch Verwendung linearer Strahlenbündelung offenbart. Die lineare Strahlenbündelung hat den Vorteil der Verringerung einer Verschlechterung der Tonqualität eines ausgegebenen Signals im Vergleich zu einem Verfahren, das eine nichtlineare Signalverarbeitung einbezieht.
-
ZITIERUNGSLISTE
-
NICHTPATENTLITERATUR
-
Nichtpatentdokument 1: Ikuma Ikeda, Akiro Omoto, „Study for 5.1 surround reproduction in 80-channel microphone array sound collecting system", Lectures of the Acoustical Society of Japan, Seiten 587 - 588, Sep. 2012.
-
KURZFASSUNG DER ERFINDUNG
-
TECHNISCHES PROBLEM
-
Obgleich bei der vorgenannten herkömmlichen Technik, nachdem die Richtwirkung in einer von einem Benutzer gewünschten Zielrichtung erhalten wurde, ein Filterkoeffizientenvektor in einer solchen Weise erzeugt wird, dass ein quadratischer Fehler zwischen der Richtwirkung in der Zielrichtung und der Richtwirkung, die tatsächlich gebildet ist, minimiert wird, besteht keine Beschränkung hinsichtlich der Größe des absoluten Werts jedes der Elemente, die den erzeugten Filterkoeffizientenvektor bilden.
-
Wenn keine Beschränkung der Größe des Filterkoeffizientenvektors besteht, gibt es einen Fall, in welchem der absolute Wert jedes der Elemente, die den Filterkoeffizientenvektor bilden, in Abhängigkeit von einer Zielfrequenz oder der Anordnung von Mikrofonen sehr groß ist. Obgleich ein korrektes Ausgangssignal, wenn ein Element mit einem großen absoluten Wert in dem Filterkoeffizientenvektor enthalten ist, theoretisch erworben werden kann, indem eine Strahlenbündelung durch Verwendung des Filterkoeffizientenvektors durchgeführt wird, existiert auch eine individuelle Differenz zwischen den Schallsensoren oder einer elektrischen Störung in einem tatsächlichen Umfeld, und daher werden ihre Einflüsse erhöht, und ein schlechter Einfluss wird auf das Ausgangssignal ausgeübt.
-
Da, wenn der Einfluss der individuellen Differenz zwischen den Schallsensoren erhöht ist, die Abweichung zwischen der Richtwirkung in der Zielrichtung und der tatsächlichen gebildeten Richtwirkung groß wird, besteht die Möglichkeit, dass ein Ton (Zielton), der aus der Zielrichtung kommt, nicht hervorgehoben ist oder andere Töne (Störtöne) hervorgehoben sind.
-
Wenn weiterhin eine elektrische Störung vergrößert wird, besteht eine Möglichkeit dahingehend, dass im Vergleich mit dem Signalpegel des in dem Ausgangssignal enthaltenen Zieltons der Signalpegel der elektrischen Störung bis zu einem wahrnehmbaren Pegel auch für das menschliche Hörempfinden hervorgehoben ist und die Tonqualität merklich verschlechtert ist.
-
Die vorliegende Offenbarung wurde gemacht, um das vorbeschriebene Problem zu lösen, und es ist daher eine Aufgabe der vorliegenden Offenbarung, eine Signalverarbeitungsvorrichtung anzugeben, die eine Verschlechterung der Tonqualität eines Ausgangssignals vermeiden kann, wobei die Verschlechterung durch eine individuelle Differenz zwischen Schallsensoren oder elektrischen Störungen bewirkt wird.
-
LÖSUNG DES PROBLEMS
-
Eine Signalverarbeitungsvorrichtung nach der vorliegenden Offenbarung enthält: mehrere Schallsensoren; eine Filterkoeffizientenvektor-Erzeugungseinheit zum Erzeugen eines Filterkoeffizientenvektors, der zum Einstellen der Richtwirkung in einer Zielrichtung durch Verwendung einer Strahlenbündelung verwendet wird, während der Filterkoeffizientenvektor in einer solchen Weise unterdrückt wird, dass der Filterkoeffizientenvektor einen Wert gleich einem oder kleiner als ein Setzwert hat; und eine Strahlenbündelungseinheit zum Durchführen der Strahlenbündelung auf der Grundlage sowohl von Beobachtungssignalen, die von den jeweiligen mehreren Schallsensoren erworben wurden, als auch des von der Filterkoeffizientenvektor-Erzeugungseinheit erzeugten Filterkoeffizientenvektors, um die Richtwirkung in der Zielrichtung einzustellen, und zum Ausgeben eines Signals, in welchem ein Ton mit der eingestellten Richtwirkung hervorgehoben ist.
-
VORTEILHAFTE WIRKUNGEN DER ERFINDUNG
-
Die Signalverarbeitungsvorrichtung nach der vorliegenden Offenbarung erzeugt einen Filterkoeffizientenvektor, der zur Einstellung der Richtwirkung in einer Zielrichtung durch Verwendung der Strahlenbündelung verwendet wird, während der Filterkoeffizientenvektor in einer solchen Weise unterdrückt wird, dass der Filterkoeffizientenvektor einen Wert gleich dem oder kleiner als der Setzwert hat. Als eine Folge kann eine Verschlechterung der Tonqualität in dem Ausgangssignal, die durch eine individuelle Differenz zwischen den Schallsensoren oder elektrischen Störungen bewirkt wird, vermieden werden.
-
Figurenliste
-
- 1 ist ein Blockschaltbild einer Signalverarbeitungsvorrichtung nach dem Ausführungsbeispiel 1 der vorliegenden Offenbarung;
- 2 ist ein Hardware-Blockschaltbild der Signalverarbeitungsvorrichtung nach dem Ausführungsbeispiel 1 der vorliegenden Offenbarung;
- 3 ist ein Hardware-Blockschaltbild eines anderen Beispiels für die Signalverarbeitungsvorrichtung nach dem Ausführungsbeispiel 1 der vorliegenden Offenbarung;
- 4 ist ein Blockschaltbild, das die Einzelheiten einer Strahlenbündelungseinheit in der Signalverarbeitungsvorrichtung nach dem Ausführungsbeispiel 1 der vorliegenden Offenbarung zeigt;
- 5 ist eine erläuternde Zeichnung, die ein Beispiel für ein Mikrofon, das vier Mikrofone enthält, in der Signalverarbeitungsvorrichtung nach dem Ausführungsbeispiel 1 der vorliegenden Offenbarung zeigt;
- 6 ist eine erläuternde Zeichnung, die die ideale Richtwirkung der Signalverarbeitungsvorrichtung nach dem Ausführungsbeispiel der vorliegenden Offenbarung zeigt;
- 7 ist eine erläuternde Zeichnung der durch Berechnung erworbenen Richtwirkung in der Signalverarbeitungsvorrichtung nach dem Ausführungsbeispiel 1 der vorliegenden Offenbarung;
- 8 ist eine erläuternde Zeichnung, die eine Norm für jede Frequenz in der Signalverarbeitungsvorrichtung nach dem Ausführungsbeispiel 1 der vorliegenden Offenbarung zeigt;
- 9 ist eine erläuternde Zeichnung, die die Richtwirkung in einem Fall der Verwendung einer Singularwertzerlegung in der Signalverarbeitungsvorrichtung nach dem Ausführungsbeispiel 1 der vorliegenden Offenbarung zeigt;
- 10 ist eine erläuternde Zeichnung, die eine Norm für jede Frequenz in dem Fall von 9 in der Signalverarbeitungsvorrichtung nach dem Ausführungsbeispiel 1 der vorliegenden Offenbarung zeigt;
- 11 ist ein Flussdiagramm, das die Arbeitsweise einer Filterkoeffizientenvektor-Erzeugungseinheit in der Signalverarbeitungsvorrichtung nach dem Ausführungsbeispiel 1 der vorliegenden Offenbarung zeigt;
- 12 ist eine erläuternde Zeichnung, die eine Norm für jede Frequenz in einer Signalverarbeitungsvorrichtung nach dem Ausführungsbeispiel 2 der vorliegenden Offenbarung zeigt;
- 13 ist ein Flussdiagramm, das die Arbeitsweise einer Filterkoeffizientenvektor-Erzeugungseinheit in der Signalverarbeitungsvorrichtung nach dem Ausführungsbeispiel 2 der vorliegenden Offenbarung zeigt;
- 14 ist eine erläuternde Zeichnung, die eine Norm für jede Frequenz in einer Signalverarbeitungsvorrichtung nach dem Ausführungsbeispiel 3 der vorliegenden Offenbarung zeigt; und
- 15 ist ein Flussdiagramm, das die Arbeitsweise einer Filterkoeffizientenvektor-Erzeugungseinheit in der Signalverarbeitungsvorrichtung nach dem Ausführungsbeispiel 3 der vorliegenden Offenbarung zeigt.
-
BESCHREIBUNG VON AUSFÜHRUNGSBEISPIELEN
-
Nachfolgend werden, um die vorliegende Offenbarung im Einzelnen zu erläutern, Ausführungsbeispiele der vorliegenden Offenbarung mit Bezug auf die begleitenden Zeichnungen beschrieben. In den folgenden Ausführungsbeispielen wird eine Sensorgruppe als eine Mikrofongruppe erläutert, die ungerichtete Mikrofone als ein konkretes Beispiel für Schallsensoren verwendet. Jedoch sind die Schallsensoren bei der vorliegenden Offenbarung nicht auf ungerichtete Mikrofone beschränkt, und es wird angenommen, dass beispielsweise Richtmikrofone, Ultraschallsensoren usw. in den Schallsensoren inbegriffen sind.
-
Ausführungsbeispiel 1
-
1 ist ein Blockschaltbild einer Signalverarbeitungsvorrichtung nach diesem Ausführungsbeispiel.
-
Die illustrierte Signalverarbeitungsvorrichtung 1 enthält: eine Mikrofongruppe 2, die mit mehreren Mikrofonen ausgestattet ist; eine Filterkoeffizientenvektor-Erzeugungseinheit 3; und eine Strahlenbündelungseinheit 4. Die Mikrofongruppe 2 ist so konfiguriert, dass sie eine A/D-Umwandlung von analogen Tonsignalen, die von den mehreren Mikrofonen 2-1 bis 2-m beobachtet werden, durchführt und hierdurch erworbene digitale Signale als Beobachtungssignale ausgibt. Die Filterkoeffizientenvektor-Erzeugungseinheit 3 ist eine Verarbeitungseinheit, die einen Filterkoeffizientenvektor erzeugt, der für die Einstellung einer Richtwirkung in einer von einem Benutzer gewünschten Richtung durch Verwendung einer Strahlenbündelung verwendet wird. Im Folgenden wird die von einem Benutzer gewünschte Richtung als die Zielrichtung definiert. Es wird weiterhin angenommen, dass Informationen über die Zielrichtung der Filterkoeffizientenvektor-Erzeugungseinheit 3 von außerhalb der Signalverarbeitungsvorrichtung 1 zugeführt werden. Der Filterkoeffizientenvektor enthält Informationen über eine Verstärkung und eine Verzögerung, die für ein Beobachtungssignal von jedem der in der Mikrofongruppe 2 enthaltenen Mikrofone vorgesehen sind. Die Filterkoeffizientenvektor-Erzeugungseinheit 3 unterdrückt die Größe des zu erzeugenden Filterkoeffizientenvektors in einer solchen Weise, dass die Verstärkung, die der Filterkoeffizientenvektor für das Beobachtungssignal jedes der Mikrofone vorsieht, nicht übermäßig ist. Die Strahlenbündelungseinheit 4 ist eine Verarbeitungseinheit, die ein Tonsignal ausgibt, in welchem ein aus der Zielrichtung ankommender Ton auf der Grundlage sowohl des von jedem der Mikrofone, die die Mikrofongruppe 2 bilden, erworbenen Beobachtungssignals als auch des von der Filterkoeffizientenvektor-Erzeugungseinheit 3 erworbenen Filterkoeffizientenvektors hervorgehoben ist. Die Einzelheiten dieses Prozesses werden später erläutert.
-
Die Filterkoeffizientenvektor-Erzeugungseinheit 3 und die Strahlenbündelungseinheit 4 sind beispielsweise entweder als Software in einem Computer oder als entsprechende Hardwareteile für exklusiven Gebrauch installiert. 2 ist ein Beispiel für die Hardwarekonfiguration in einem Fall, in welchem die Signalverarbeitungsvorrichtung unter Verwendung eines Computers installiert ist, und 3 ist ein Beispiel für die Hardwarekonfiguration in einem Fall, in welchem die Signalverarbeitungsvorrichtung unter Verwendung von Hardware für exklusiven Gebrauch installiert ist.
-
Bei der Konfiguration nach 2 enthält die Signalverarbeitungsvorrichtung 1 mehrere Mikrofone 101-1 bis 101-m, einen A/D-Wandler 102, einen Prozessor 103, einen Speicher 104 und einen D/A-Wandler 105. Eine Ausgangsvorrichtung 5 in der Figur ist die gleiche wie die Ausgangsvorrichtung 5 in 1. In einem Fall, in welchem die Konfiguration von 1 durch die Hardware von 2 implementiert wird, sind durch Entwickeln eines Programms in dem Speicher 104, das die Funktionen der Filterkoeffizientenvektor-Erzeugungseinheit 3 und der Strahlenbündelungseinheit 4 konfiguriert, und Ausführen des Programms durch den Prozessor 103 die Filterkoeffizientenvektor-Erzeugungseinheit 3 und die Strahlenbündelungseinheit 4 implementiert. Die mehreren Mikrofone 101-1 bis 101-m und der A/D-Wandler 102 sind in der Mikrofongruppe 2 enthalten. Weiterhin ist der D/A-Wandler 105 eine Schaltung, die ein digitales Signal der Strahlenbündelungseinheit 4 in ein analoges Signal in einem Fall umwandelt, in welchem die Ausgabevorrichtung 5 durch ein analoges Signal betrieben wird.
-
Weiterhin sind in der Konfiguration nach 3 mehrere Mikrofone 101-1 bis 101-m, ein A/D-Wandler 102, ein D/A-Wandler 105 und eine Verarbeitungsschaltung 200 enthalten. Die Verarbeitungsschaltung 200 implementiert die Funktionen der Filterkoeffizientenvektor-Erzeugungseinheit 3 und der Strahlenbündelungseinheit 4. Jede der anderen Komponenten ist die gleiche wie die in 2.
-
Die Ausgangsvorrichtung gibt das Ausgangssignal der Strahlenbündelungseinheit 4 als ein Verarbeitungsergebnis der Signalverarbeitungsvorrichtung 1 aus oder speichert dieses. Beispielsweise wird in einem Fall, in welchem die Ausgangsvorrichtung 5 ein Lautsprecher ist, das Ausgangssignal von dem Lautsprecher als ein Ton ausgegeben. Die Ausgangsvorrichtung 5 kann alternativ ein Speichermedium, wie eine Harddisk oder ein Speicher, sein. In einem derartigen Fall wird das von der Strahlenbündelungseinheit 4 ausgegebene Ausgangssignal in der Harddisk oder dem Speicher als digitale Daten registriert.
-
4 ist ein Blockschaltbild der Signalverarbeitungsvorrichtung 1, wobei das Schaltbild die Einzelheiten der Strahlenbündelungseinheit 4 zeigt.
-
Wie in der Figur gezeigt ist, enthält die Strahlenbündelungseinheit 4 DFT-Einheiten 41, eine Beobachtungssignalvektor-Erzeugungseinheit 42, eine Innenprodukteinheit 43 und eine IDFT-Einheit 44. Die DFT-Einheiten 41 sind Schaltungen, die angeordnet sind, während sie mit den jeweiligen Mikrofonen in der Mikrofongruppe 2 assoziiert sind, und die jeweils eine diskrete Fouriertransformation (DFT) durchführen. Die Beobachtungssignalvektor-Erzeugungseinheit 42 ist eine Schaltung, die von den jeweiligen DFT-Einheiten 41 ausgegebene Frequenzspektren in einen komplexen Vektor integriert und die diesen komplexen Vektor ausgibt. Die Innenprodukteinheit 43 ist eine Schaltung, die das innere Produkt des Ausgangssignals der Beobachtungssignalvektor-Erzeugungseinheit 42 und des Ausgangssignals der Filterkoeffizientenvektor-Erzeugungseinheit 3 berechnet. Die IDFT-Einheit 44 ist eine Schaltung, die eine inverse Fouriertransformation (IDFT) bei einem Ausgangssignal der Innenprodukteinheit 43 durchführt.
-
Als Nächstes wird die Arbeitsweise der Signalverarbeitungsvorrichtung 1 nach dem Ausführungsbeispiel 1 unter Verwendung der in 4 gezeigten Konfiguration erläutert. Hier wird ein Fall angenommen, in welchem die Mikrofongruppe 2 M Mikrofone 2-1 bis 2-m enthält, und ein Beobachtungssignal zu einer Zeit t, das von dem m-ten Mikrofon erworben wurde, wird als xm(t) bezeichnet.
-
Von den jeweiligen Mikrofonen 2-1 bis 2-m ausgegebene Beobachtungssignale werden in die jeweiligen DFT-Einheiten 41 eingegeben, und jede der DFT-Einheiten 41 führt eine diskrete Kurzzeit-Fouriertransformation bei dem entsprechenden eingegebenen Signal durch und gibt ein hierdurch erworbenes Frequenzspektrum aus. Das von der DFT-Einheit 41 entsprechend dem m-ten Mikrofon ausgegebene Frequenzspektrum (komplexe Zahl) wird als Xm(τ, ω) bezeichnet. τ bezeichnet eine Kurzzeit-Blocknummer, und ω bezeichnet eine diskrete Frequenz.
-
Die Beobachtungssignalvektor-Erzeugungseinheit
42 integriert die von den DFT-Einheiten
41 ausgegebenen m Frequenzspektren in einen komplexen Vektor x(τ, ω), wie in der folgenden Gleichung (1) gezeigt ist, und gibt x(τ, ω) aus. T bezeichnet die Umstellung eines Vektors oder einer Matrix.
-
Die Filterkoeffizientenvektor-Erzeugungseinheit 3 gibt einen Filterkoeffizientenvektor w(ω), der ein komplexer Vektor mit der gleichen Anzahl (M) von Elementen wie der des komplexen Vektors x(τ, ω) ist. Eine komplexe Zahl, die das m-te Element des Filterkoeffizientenvektors w(ω) ist, zeigt durch ihren absoluten Wert die für das Beobachtungssignal des m-ten Mikrofons vorgesehene Verstärkung und zeigt durch ihr Argument die für das Beobachtungssignal vorgesehene Verzögerung. Ein Verfahren zum Erzeugen eines geeigneten w(ω) anhand der Richtwirkung der Zielrichtung in der Filterkoeffizientenvektor-Erzeugungseinheit 3 wird später beschrieben.
-
Die Innenprodukteinheit
43 berechnet ein inneres Produkt wie in der folgenden Gleichung (2) gezeigt anhand von x(τ, ω), der von der Beobachtungssignalvektor-Erzeugungseinheit
42 ausgegeben wurde, und des Filterkoeffizientenvektors w(cj), der von der Filterkoeffizientenvektor-Erzeugungseinheit
3 ausgegeben wurde, und gibt Y(τ, ω), das als ein Ergebnis erworben wurde, aus. Y(τ, ω) ist eine diskrete Kurzzeit-Fouriertransformation des Ausgangssignals.
-
Die IDFT-Einheit 44 führt eine inverse diskrete Kurzzeit-Fouriertransformation von Y(τ, ω), das von der Innenprodukteinheit 43 ausgegeben wurde, durch und gibt ein endgültiges Ausgangssignal y(t) aus. In einem Fall, in welchem der Filterkoeffizientenvektor w(ω) ordnungsgemäß gestaltet ist, ist dieses Ausgangssignal ein Tonsignal, in welchem ein Ton mit der Richtwirkung in der Zielrichtung hervorgehoben ist.
-
Als Nächstes wird ein konkretes Verfahren zum Erzeugen eines geeigneten Filterkoeffizientenvektors w(ω) anhand der Richtwirkung in der Zielrichtung in der Filterkoeffizientenvektor-Erzeugungseinheit 3 erläutert.
-
Hier werden
N Punkte, an denen der Umfang eines Kreises, dessen Mitte sich bei der Mikrofongruppe
2 befindet und der eine Größe hat, die ausreichend größer als die der Mikrofongruppe ist, in
N gleiche Teile geteilt ist, betrachtet. Zu dieser Zeit wird ein Lenkvektor (die Anzahl von Elementen ist M) für einen n-ten Punkt, wenn er von der Mikrofongruppe
2 aus betrachtet wird, durch a
ω,
n bezeichnet. Weiterhin wird eine Matrix, die durch Anordnen von N Lenkvektoren in der folgenden Weise geschaffen wird, durch A(ω) bezeichnet.
-
Als Nächstes wird eine gewünschte Verstärkung für einen Ton, der aus der Richtung des n-ten Punktes kommt, wenn er von der Mikrofongruppe
2 aus betrachtet wird, durch r
n bezeichnet. Weiterhin wird ein Vektor, der durch Anordnen der gewünschten Verstärkungen entsprechend den N Punkten in einer solchen Weise wie in der folgenden Gleichung gezeigt geschaffen wird, durch r bezeichnet. Genauer gesagt, r zeigt die ideale Richtwirkung.
-
Wenn ein quadrierter Fehler zwischen der tatsächlich gebildeten Richtwirkung und der gewünschten Richtung durch e bezeichnet wird, kann e durch die folgende Gleichung (5) ausgedrückt werden.
-
Der Filterkoeffizientenvektor w(cj), der e minimiert, kann wie in der folgenden Gleichung (6) gezeigt durch Differenzieren von e mit Bezug auf w(ω) und Setzen des Differenzierungsergebnisses gleich 0 erworben werden. + bezeichnet eine pseudoinverse Moore-Penrose-Matrix.
-
Jedoch besteht, da, wenn die Gleichung (6) so, wie sie ist, verwendet wird, keine Beschränkung für die Größe des absoluten Werts jedes der Elemente von w(ω) besteht, die Möglichkeit, dass die Größe des absoluten Werts in Abhängigkeit von einem bestimmten Frequenzband übermäßig wird. In einem derartigen Fall verschlechtert sich in einem tatsächlichen Umfeld, in welchem eine individuelle Differenz zwischen den Mikrofonen oder eine elektrische Störung existiert, die Tonqualität des Ausgangssignals merklich.
-
5 ist ein Beispiel für das Mikrofon, das vier Mikrofone enthält. Diese Mikrofone sind an den jeweiligen Scheitelpunkten eines Quadrats, dessen diagonale Linien jeweils eine Länge von 4 cm haben, angeordnet. Wenn diese Mikrofongruppe verwendet wird und w(ω) einfach anhand der Gleichung (6) berechnet wird, nachdem die in 6 gezeigte Richtwirkung als die ideale Richtwirkung r erhalten wurde, wird die Richtwirkung wie in 7 gezeigt durch Berechnen bei 300 Hz erworben, während die Norm von w(ω) bei jeder Frequenz wie in 8 gezeigt ist. Gemäß 8 ist ersichtlich, dass die Norm von w(ω) bei besonders niedrigen Frequenzen bemerkenswert groß ist.
-
Eines der Verfahren zum Unterdrücken des absoluten Werts jedes der Elemente des Filterkoeffizientenvektors w(ω) in einer solchen Weise, dass der absolute Wert nicht übermäßig wird, besteht in der Verwendung einer Singularwertzerlegung, wenn die pseudoinverse Moore-Penrose-Matrix in der Gleichung (6) berechnet wird, um Singularwerte nahe 0 durch 0 zu ersetzen. Wenn beispielsweise die in 5 gezeigte Mikrofongruppe verwendet wird und w(ω) unter Verwendung der Gleichung (6) berechnet wird, während 6 als die ideale Richtwirkung r bereitgestellt wird, wird die pseudoinverse Matrix berechnet, während Singularwerte, die kleiner als 0,1 sind, auf 0 gesetzt werden. Als eine Folge ist, obgleich die Schärfte der eingestellten Richtwirkung geringfügig verlorengeht, wie in 9 gezeigt ist, die Norm von w(ω) wie in 10 gezeigt. Gemäß 10 ist ersichtlich, dass die Größe der Norm des Filterkoeffizientenvektors kleiner als die in 8 gezeigte ist. Als ein Ergebnis wird es auch in einem tatsächlichen Umfeld, in welchem eine individuelle Differenz zwischen den Mikrofonen oder eine elektrische Störung existiert, möglich, die Tonqualität des Ausgangssignals zu gewährleisten.
-
11 zeigt die vorgenannten Prozesse in der Filterkoeffizientenvektor-Erzeugungseinheit 3 als ein Flussdiagramm.
-
Die Filterkoeffizientenvektor-Erzeugungseinheit 3 liest zuerst die Richtwirkung (r) in einer Zielrichtung (Schritt ST1). Dieser Prozess entspricht dem Lesen der in der vorstehenden Gleichung (4) gezeigten r. Weiterhin berechnet die Filterkoeffizientenvektor-Erzeugungseinheit 3 eine Matrix A(ω), wie in der vorstehenden Gleichung (3) gezeigt ist (Schritt ST2). Als Nächstes führt die Filterkoeffizientenvektor-Erzeugungseinheit 3 eine Singularwertzerlegung bei der im Schritt ST2 erworbenen Matrix A(ω) durch und ersetzt Singularwerte, die gleich einem oder kleiner als ein Schwellenwert sind, durch 0 (Schritt ST3). Dann wird die pseudoinverse Moore-Penrose-Matrix der Matrix A(ω) erworben, und die Gleichung (6) wird berechnet (Schritt ST4). Schließlich wird ein in der Gleichung (6) erworbener Filterkoeffizientenvektor w(ω) ausgegeben (Schritt ST5).
-
Wie oben erwähnt ist, kann in der Signalverarbeitungsvorrichtung nach dem Ausführungsbeispiel 1 durch Unterdrücken der Größe des Filterkoeffizientenvektors in einer solchen Weise, dass die Größe nicht übermäßig wird, die Verschlechterung der Tonqualität des Ausgangssignals aufgrund übermäßiger Zunahme einer individuellen Differenz zwischen den Mikrofonen oder einer elektrischen Störung, die in einem tatsächlichen Umfeld existiert, und dann Mischen der vergrößerten Differenz oder der elektrischen Störung in das Ausgangssignal verhindert werden.
-
Weiterhin kann, obgleich der Prozess des Berechnens einer pseudoinversen Matrix unter Verwendung der Singularwertzerlegung in vielen Fällen implementiert wird, das Verfahren des Erwerbens einer pseudoinversen Matrix nach dem Ersetzen kleiner Singularwerte durch 0 nur durch Hinzufügen einer sehr kleinen Änderungen zu der Implementierung, die die Singularwertzerlegung verwendet, implementiert werden. Daher kann, da die für die Implementierung erforderliche Zeit und die für Tests erforderliche Zeit verkürzt werden können, eine Kostenherabsetzung für die Vorrichtung erwartet werden.
-
Da, wie vorstehend erläutert, die Signalverarbeitungsvorrichtung nach dem Ausführungsbeispiel 1 Folgendes enthält: die mehreren Schallsensoren; die Filterkoeffizientenvektor-Erzeugungseinheit zum Erzeugen eines Filterkoeffizientenvektors, der zur Einstellung der Richtwirkung in einer Zielrichtung durch Verwendung einer Strahlenbündelung verwendet wird, während der Filterkoeffizientenvektor in einer solchen Weise unterdrückt wird, dass der Filterkoeffizientenvektor einen Wert hat, der gleich einem oder kleiner als ein Setzwert ist; und die Strahlenbündelungseinheit zum Durchführen der Strahlenbündelung auf der Grundlage von sowohl Beobachtungssignalen, die von den jeweiligen mehreren Schallsensoren erworben wurden, als auch des von der Filterkoeffizientenvektor-Erzeugungseinheit erzeugten Filterkoeffizientenvektors, um die Richtwirkung in der Zielrichtung einzustellen, und zum Ausgeben eines Signals, in welchem ein Ton mit der eingestellten Richtwirkung hervorgehoben ist, kann die Verschlechterung der Tonqualität des Ausgangssignals, die durch eine individuelle Differenz zwischen den Schallsensoren oder eine elektrische Störung bewirkt wird, vermieden werden.
-
Weiterhin können, da bei der Signalverarbeitungsvorrichtung nach dem Ausführungsbeispiel 1 die Filterkoeffizientenvektor-Erzeugungseinheit einen Filterkoeffizientenvektor erzeugt, dessen Norm gleich einem oder kleiner als ein Setzwert ist, durch Verwendung der Singularwertzerlegung die für die Implementierung erforderliche Zeit und die für Tests erforderliche Zeit verkürzt werden, und eine Kostenherabsetzung kann erreicht werden.
-
Ausführungsbeispiel 2
-
Bei dem Ausführungsbeispiel 2 ist eine Filterkoeffizientenvektor-Erzeugungseinheit 3 so konfiguriert, dass ein Filterkoeffizientenvektor durch Verwendung einer L2-Regulierung erzeugt wird. Da jede der anderen Komponenten die gleiche wie die bei dem in 1 gezeigten Ausführungsbeispiel 1 ist, wird eine Erläuterung nachfolgend weggelassen.
-
Bei dem Ausführungsbeispiel 1 berechnet die Filterkoeffizientenvektor-Erzeugungseinheit 3 einen Filterkoeffizientenvektor w(ω) durch Verwendung einer Singularwertzerlegung. Andererseits gibt es andere Verfahren des Unterdrückens der Größe eines Filterkoeffizientenvektors. Beispielsweise gibt es ein Verfahren des Hinzufügens einer Strafbedingung für die Zunahme in der Norm von w(ω) zu einer in der Gleichung (5) gezeigten Fehlerfunktion. Dieses Verfahren wird als L2-Regulierung bezeichnet, und die Filterkoeffizientenvektor-Erzeugungseinheit 3 nach dem Ausführungsbeispiel 2 erzeugt einen Filterkoeffizientenvektor durch Verwendung dieser L2-Regulierung.
-
Bei dem Ausführungsbeispiel
2 wird ein Fehler e der Gleichung (5) bei dem Ausführungsbeispiel
1 wie in der folgenden Gleichung (7) gezeigt modifiziert. λ bezeichnet einen Parameter zum Einstellen des Beitrags der Strafe.
-
Wenn e in der Gleichung (7) mit Bezug auf w(ω) differenziert wird und das Differentiationsergebnis gleich 0 gesetzt wird, wird ein Filterkoeffizientenvektor w(cj), der klein e minimiert, wie in der folgenden Gleichung (8) gezeigt erworben.
H bezeichnet eine hermitesche Umstellung, und I bezeichnet eine Identitätsmatrix.
-
Bei dem auf der L2-Regulierung basierenden Verfahren ist, wenn die Norm von w(ω) für jede Frequenz aufgezeichnet wird, die Norm wie in 12 gezeigt. 13 ist ein Flussdiagramm, das eine Operation in der Filterkoeffizientenvektor-Erzeugungseinheit 3 zeigt. In dem Flussdiagramm von 14 sind die Schritte ST1 und ST2 die gleichen wie diejenigen der in 11 gezeigten Operation des Ausführungsbeispiels 1. Als Nächstes berechnet die Filterkoeffizientenvektor-Erzeugungseinheit 3 nach dem Ausführungsbeispiel 2 die Gleichung (8) im Schritt ST11. Dann wird der in der Gleichung (8) erworbene Filterkoeffizientenvektor w(ω) ausgegeben (Schritt ST12).
-
Bei dem Ausführungsbeispiel 2 ist aus 12 ersichtlich, dass der Wert des auf der Basis der L2-Regulierung berechneten Filterkoeffizientenvektors im Vergleich mit dem des in 10 gezeigten und auf der Singularwertzerlegung basierenden Filterkoeffizientenvektors kontinuierlich ist. Genauer gesagt, da der Wert jedes der Elemente des auf der L2-Regulierung basierenden Filterkoeffizientenvektors in Abhängigkeit von der Frequenz nicht stark variiert, kann erwartet werden, dass die Tonqualität des Ausgangssignals verbessert ist.
-
Wie oben erläutert ist, kann, da bei der Signalverarbeitungsvorrichtung nach dem Ausführungsbeispiel 2 die Filterkoeffizientenvektor-Erzeugungseinheit einen Filterkoeffizientenvektor durch Verwendung der L2-Regulierung erzeugt, eine weitere Verbesserung der Tonqualität des Ausgangssignals erzielt werden.
-
Ausführungsbeispiel 3
-
Das Ausführungsbeispiel 3 ist so konfiguriert, dass ein Schwellenwert für die Norm eines Filterkoeffizientenvektors für eine Filterkoeffizientenvektor-Erzeugungseinheit 3 vorgesehen ist, und die Filterkoeffizientenvektor-Erzeugungseinheit 3 erzeugt einen Filterkoeffizientenvektor mit einem Wert, der gleich dem oder kleiner dieser Schwellenwert ist. Da jede der anderen Komponenten die gleiche wie die bei dem in 1 gezeigten Ausführungsbeispiel 1 ist, wird eine Erläuterung im Folgenden weggelassen.
-
Das Verfahren des Unterdrückens der Größe eines Filterkoeffizientenvektors durch Verwendung der Singularwertzerlegung bei dem Ausführungsbeispiel 1 und das Verfahren des Unterdrückens der Größe des Filterkoeffizientenvektors durch Verwendung der L2-Regulierung bei dem Ausführungsbeispiel 2 müssen als ihre jeweiligen Parameter mit einem Schwellenwert für Singularwerte und einem Koeffizienten einer Strafbedingung versehen sein. Da nicht selbstverständlich ist, in welchen Bereich jede der Normen von unter Verwendung dieser Parameter erzeugten Filterkoeffizientenvektoren fällt, sind empirische Verfahren für eine Einstellung jedes der Parameter erforderlich. Demgegenüber wird, wenn ein Bereich von Werten, den die Norm eines Filterkoeffizientenvektors haben kann, explizit bestimmt ist, eine empirisch ermittelte Parametereinstellung unnötig. Demgemäß wird bei dem Ausführungsbeispiel 3 ein Bereich von Werten, den die Norm eines Filterkoeffizientenvektors haben kann, explizit als ein Schwellenwert für die Filterkoeffizientenvektor-Erzeugungseinheit 3 bestimmt, und die Filterkoeffizientenvektor-Erzeugungseinheit 3 erzeugt einen Filterkoeffizientenvektor, dessen Norm gleich diesem oder kleiner als dieser Schwellenwert ist.
-
Beispielsweise gibt es ein Verfahren, wenn eine Bedingung, dass die Norm eines Filterkoeffizientenvektors w(ω) gleich oder kleiner als ψ sein muss, der Filterkoeffizientenvektor-Erzeugungseinheit 3 auferlegt ist, bei dem, nachdem zuerst w(ω) durch Verwendung eines einfachen Verfahrens wie in der Gleichung (6) gezeigt berechnet wurde, in einem Frequenzband, in welchem die Norm von w(ω) ψ überschreitet, w(ω) erworben wird, das einen Fehler e unter einer Beschränkung, dass die Norm von w(ω) gleich groß ψ sein muss, minimiert. Genauer gesagt, unter der Beschränkung, dass die Norm eines Filterkoeffizientenvektors gleich dem oder kleiner als der Schwellenwert sein muss, erzeugt die Filterkoeffizientenvektor-Erzeugungseinheit 3 einen Filterkoeffizientenvektor, der einen Fehler zwischen der Richtungswirkung in einer Zielrichtung und der durch eine Strahlenbündelungseinheit 4 gebildeten Richtungswirkung bewirkt, der gleich einem oder kleiner als ein Setzwert ist. Hier kann, obgleich es schwierig ist, w(ω), das den Fehler e unter der Beschränkung minimiert, dass die Norm von w(ω) gleich ψ sein muss, analytisch zu erwerben, eine numerische Lösung durch Verwendung eines newtonschen Verfahrens oder dergleichen erworben werden.
-
Wenn die Filterkoeffizientenvektor-Erzeugungseinheit 3 w(ω) durch Verwendung des vorgenannten Verfahrens nach dem Setzen von ψ = 10 berechnet, ist die Norm von w(ω) wie in 14 gezeigt. 15 ist ein Flussdiagramm, das eine Operation in der Filterkoeffizientenvektor-Erzeugungseinheit 3 zeigt. In dem Flussdiagramm von 15 sind die Schritte ST1 und ST2 die gleichen wie diejenigen der in 11 gezeigten Operation des Ausführungsbeispiels 1. Als Nächstes berechnet die Filterkoeffizientenvektor-Erzeugungseinheit 3 nach dem Ausführungsbeispiel 3 die Gleichung (6) (Schritt ST21). Zusätzlich wird bestimmt, ob die Norm des erworbenen w(ω) gleich dem oder kleiner als der Schwellenwert ist oder nicht (Schritt ST22). Wenn im Schritt ST22 die Norm einen Wert hat, der den Schwellenwert überschreitet, wird ein optimaler w(ω) erworben durch Verwendung des newtonschen Verfahrens unter der Beschränkung, dass die Norm von w(ω) gleich dem Schwellenwert sein muss (Schritt ST23), und dieses w(ω) wird ausgegeben (Schritt ST23). Demgegenüber wird, wenn im Schritt ST22 die Norm von w(ω) gleich dem oder kleiner als der Schwellenwert ist, dieses w(ω) ausgegeben (Schritt ST24), und die Operation wird beendet.
-
Wie vorstehend erwähnt ist, wird bei dem Ausführungsbeispiel 3, indem es möglich gemacht wird, den Bereich von Werten, den ein Filterkoeffizientenvektor haben kann, explizit zu bestimmen, die empirische Parametereinstellung unnötig, und die Installationskosten für die Vorrichtung können herabgesetzt werden.
-
Weiterhin wird bei dem Ausführungsbeispiel 3, da in dem Frequenzband, in welchem die Norm von w(ω) ψ überschreitet, w(ω) erworben, das den Fehler e unter der Beschränkung minimiert, dass die Norm von w(ω) gleich groß ψ sein muss, die Richtwirkung, die der Richtwirkung in der Zielrichtung innerhalb des Bereichs von Werten, die der Filterkoeffizientenvektor haben kann, am nächsten ist, wird gebildet, und daher wird es möglich, einen Ton, der aus der Zielrichtung kommt, korrekt hervorzuheben, während der Einfluss einer individuellen Differenz zwischen den Mikrofonen und von elektrischen Störungen minimiert wird.
-
Wie vorstehend erläutert ist, kann, da in der Signalverarbeitungsvorrichtung nach dem Ausführungsbeispiel 3 die Filterkoeffizientenvektor-Erzeugungseinheit mit der Norm eines Filterkoeffizientenvektors als Schwellenwert versehen ist und diese einen Filterkoeffizientenvektor erzeugt, dessen Norm gleich dem oder kleiner als der Schwellenwert ist, eine Einstellung des Parameters prompt durchgeführt werden, und die Installationskosten der Vorrichtung können herabgesetzt werden.
-
Weiterhin wird, da in der Signalverarbeitungsvorrichtung nach dem Ausführungsbeispiel 3 die Filterkoeffizientenvektor-Erzeugungseinheit unter der Beschränkung, dass die Norm eines Filterkoeffizientenvektors gleich dem oder kleiner als der Schwellenwert sein muss, einen Filterkoeffizientenvektor erzeugt, der bewirkt, dass ein Fehler zwischen der Richtwirkung in einer Zielrichtung und der durch die Strahlenbündelungseinheit gebildeten Richtwirkung gleich einem oder kleiner als ein Setzwert ist, es möglich, einen aus der Zielrichtung kommenden Ton korrekt hervorzuheben, während der Einfluss einer individuellen Differenz zwischen den Schallsensoren und von elektrischen Störungen minimiert wird.
-
Es ist darauf hinzuweisen, dass jede Kombination von zwei oder mehr der vorbeschriebenen Ausführungsbeispiele durchgeführt werden kann, verschiedene Änderungen bei jeder Komponente gemäß irgendeinem der vorbeschriebenen Ausführungsbeispiele vorgenommen werden können, und jede Komponente gemäß jedem der vorbeschriebenen Ausführungsbeispiele innerhalb des Bereichs der vorliegenden Offenbarung weggelassen werden kann.
-
GEWERBLICHE ANWENDBARKEIT
-
Wie vorstehend erwähnt ist, ist die Signalverarbeitungsvorrichtung nach der vorliegenden Offenbarung eine solche, die ein Signal erwirbt, in welchem ein Ton, der aus einer bestimmten Richtung kommt, hervorgehoben wird durch Durchführen einer Signalverarbeitung bei Beobachtungssignalen, die von einer Sensorgruppe erworben wurden, die mehrere Schallsensoren enthält, und die zur Verwendung in Spracherkennungssystemen und Einrichtungsüberwachungssystemen geeignet ist.
-
Bezugszeichenliste
-
1 Signalverarbeitungsvorrichtung, 2 Mikrofongruppe, 3 Filterkoeffizientenvektor-Erzeugungseinheit, 4 Strahlenbündelungseinheit, und 5 Ausgangsvorrichtung.
-
ZITATE ENTHALTEN IN DER BESCHREIBUNG
-
Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
-
Zitierte Nicht-Patentliteratur
-
- Ikuma Ikeda, Akiro Omoto, „Study for 5.1 surround reproduction in 80-channel microphone array sound collecting system“, Lectures of the Acoustical Society of Japan, Seiten 587 - 588, Sep. 2012 [0006]