-
Die Erfindung betrifft ein Mikrofonarray.
-
Hintergrund
-
Bei Tonaufnahmen in großen Sportstätten können für eine immersive Wiedergabe die akustischen Ereignisse auf dem Spielfeld besonders interessant sein, so wie Geräusche des Balls, des Schlägers usw. und die Gespräche der Spieler, Schiedsrichter, Trainer, usw. Dabei ist es wegen der vielen Umgebungsgeräusche schwierig, eine gute Tonqualität und Sprachverständlichkeit zu erreichen. Das hängt damit zusammen, dass Mikrofone oft am Spielfeldrand positioniert sein müssen, weil ein großer Abstand zu den gewünschten Schallquellen eingehalten werden muss. Die Störgeräusche umfassen im Wesentlichen den Lärm des Publikums, das sich in den Sportstätten normalerweise auf Zuschauertribünen befindet. Außerdem sollten die Mikrofone zur Tonaufnahme weder dem Publikum noch den üblicherweise vorhandenen Kameras die Sicht versperren.
-
Ein typisches Beispiel ist das Spielfeld eines Fußballstadions, bei dem Ballgeräusche, Spielergespräche, das Pfeifen des Schiedsrichters und Traineranweisungen aufgenommen werden sollen.
-
Vergleichbare Probleme können bei anderen Sportarten wie z.B. Baseball oder auch in anderen Situationen auftreten, in denen Tonaufnahmen von Schallquellen gemacht werden sollen, die weit über eine ebene Fläche verteilt und ggf. beweglich sind und die trotz Störgeräuschen aus der Umgebung nicht direkt mit einem Mikrofon versehen werden können.
-
Eine bekannte Lösung der Firma LAWO (https://www.lawo.com/en/products/audio-production-tools/kick.html) besteht in einem Aufbau aus zahlreichen Richtmikrofonen oder Mikrofonen mit Supernierencharakteristik, die um ein Fußballspielfeld herum am Spielfeldrand parallel zum Boden verteilt sind. Zur Erfassung der Ballgeräusche wird die Position des Balls automatisch oder halbautomatisch visuell verfolgt. Die Positionsdaten werden in eine automatische Audio-Mischeinheit gegeben, die auch die Ausgangssignale der Mikrofone erhält und entsprechend der Positionsdaten verarbeitet bzw. gewichtet und mischt. Die dahinterstehende Idee ist, dass Signale von Mikrofonen, die der momentanen Ballposition am nächsten sind, besonders hoch gewichtet werden. Ein Nachteil dieser bekannten Lösung ist, dass ein hoher Verkabelungsaufwand erforderlich ist. Die Kabel und die Mikrofone müssen vor jedem Spiel verlegt und nach jedem Spiel wieder abgebaut werden. Zusätzliche Mikrofone erfordern zusätzliche Kabel und verteuern das System. Außerdem sorgt die feste Ausrichtung der Mikrofone dafür, dass deren optimal erfasster Bereich relativ breit sein muss, um auch Bereiche zwischen benachbarten Mikrofonen abzudecken. Trotzdem werden diese Bereiche nur mit geringer Tonqualität und somit suboptimal erfasst. Darüber hinaus führt ein größerer Erfassungsbereich der Mikrofone in der Ebene (Azimutwinkel) auch dazu, dass der vertikale Erfassungsbereich (Elevationswinkel) größer wird, da die Richtcharakteristiken bekannter Mikrofone rotationssymmetrisch sind. Dies führt dazu, dass Geräusche aus den höher gelegenen Zuschauertribünen miterfasst werden.
-
Eine andere mögliche Lösung besteht in einer manuellen Ausrichtung oder Nachführung von Richtmikrofonen mit besonders hoher Richtwirkung. Dies ist jedoch mit einer zeitlichen Verzögerung verbunden. Außerdem ist im Fall der manuellen Ausrichtung Bedienpersonal für jedes Richtmikrofon notwendig, und es kann sich dabei Körperschall auf das Mikrofon übertragen. Bei einer möglichen Fernbedienung zur Nachführung der Mikrofone würden sowohl zusätzliche Verzögerungen als auch Motorgeräusche auftreten, die zwangsläufig vom Mikrofon aufgenommen und als Störgeräusche hörbar würden. Von einer fehlerhaften Ausrichtung eines Richtmikrofons sind verschiedene Frequenzen unterschiedlich betroffen, weil die Richtwirkung der Richtmikrofone für höhere Frequenzen stärker ist als für niedrigere. Dies führt dazu, dass sich die Klangfarbe des Tonsignals ständig ändert.
-
Eine weitere bekannte Lösung, um eine hohe Richtwirkung zu erzielen, ist die Strahlformung (beamforming). Dabei werden die Ausgangssignale mehrerer, zu einem Array angeordneter Mikrofone zusammengeschaltet, z.B. mittels Verzögerung, Addition und Filterung. Der resultierende Strahl, d.h. der Bereich besonders hoher Empfindlichkeit, hat eine einstellbare Richtung und ist üblicherweise rotationssymmetrisch. Die jeweilige Form des Strahls hängt von dem Typ, der Anzahl und der Anordnung der Mikrofone sowie von dem Algorithmus ab, der zur Kombination verwendet wird. Übliche Algorithmen sind z.B. der Verzögerungs- und Summationsalgorithmus („Delay-and-Sum“, DS) und der „Minimum Variance Distortionless Response“ (MVDR) Algorithmus, die jedoch jeweils auch Nachteile haben. Normalerweise werden Mikrofonarrays aus Mikrofonen mit geringer Richtwirkung aufgebaut, weil sie einfach zu handhaben und günstig sind. Um eine hohe Richtwirkung über einen weiten Azimutwinkel und eine vergleichbare Richtwirkung bezüglich der Elevation zu erhalten, sind dabei sehr viele Mikrofone notwendig, was zu einem hohen Rechenaufwand führt.
-
Es ist daher eine Aufgabe der vorliegenden Erfindung, eine Mikrofonanordnung anzugeben, die die oben genannten Probleme löst.
-
Um mehrkanalige Audioaufnahmen zu machen, z.B. für 22 Kanäle, ist eine Anordnung mit kreisförmig angeordneten Richtmikrofonen bekannt (Yo Sasaki, Toshiyuki Nishiguchi, Kazuho Ono: Development of multichannel single-unit microphone using shotgun microphone array. In PROCEEDINGS of the 22nd International Congress on Acoustics (ICA), 2016). Dabei werden benachbarte Richtmikrofone benutzt, um bei tiefen Frequenzen die rotationssymmetrische Richtcharakteristik jedes einzelnen Richtmikrofons zusätzlich auf die jeweilige Richtung zu verengen.
-
Zusammenfassung der Erfindung
-
Eine Aufgabe der vorliegenden Erfindung besteht in der Bereitstellung einer Mikrofonanordnung mit besonders hoher Richtwirkung in vertikaler Richtung und einer hohen, jedoch in weiten Grenzen einstellbaren Richtwirkung in horizontaler Richtung.
-
Die Aufgabe wird durch das in Anspruch 1 angegebene Mikrofonarray gelöst.
-
Erfindungsgemäß hat ein Mikrofonarray eine Mehrzahl von Mikrofonen, deren Ausgangssignale zu mindestens einem gemeinsamen Ausgangssignal kombiniert werden, wobei die Mikrofone Richtmikrofone mit einer bevorzugten Richtung hoher Empfindlichkeit und im Wesentlichen in einer Ebene angeordnet sind. Die Mikrofone sind außerdem so auf einem Kreis oder Kreisabschnitt angeordnet, dass für jedes der Mikrofone die bevorzugte Richtung hoher Empfindlichkeit im Wesentlichen orthogonal nach außen zu dem Kreis oder Kreisabschnitt liegt, so dass jedes der Mikrofone eine andere bevorzugte Richtung hoher Empfindlichkeit aufweist. Das gemeinsame Ausgangssignal des Mikrofonarrays kann durch Strahlformung (beamforming) gewonnen werden.
-
Durch die hohe Richtwirkung der Richtmikrofone sind sowohl der Elevationswinkel wie auch der Azimutwinkel der Anordnung sehr klein, während der Azimutwinkel in einem sehr großen Bereich, der bis zu 360° betragen kann, einstellbar ist. In Ausführungsformen, in denen die Mikrofone über einen Vollkreis verteilt angeordnet sind, zeigen immer auch einige Richtmikrofone entgegen der eigentlichen Zielrichtung. Dies ermöglicht eine gleichbleibende Richtcharakteristik unabhängig von der Ausrichtung des Mikrofonarrays.
-
Ein Verfahren zur Audioaufnahme mittels Richtmikrofonen ist in Anspruch 12 angegeben.
-
Weitere vorteilhafte Ausführungsformen werden in den Ansprüchen 2-11, 13 sowie in der folgenden detaillierten Beschreibung angegeben.
-
Figurenliste
-
Weitere Einzelheiten und vorteilhafte Ausführungsformen sind in den Zeichnungen dargestellt. Darin zeigt
- 1 ein Mikrofonarray in einer ersten Ausführungsform;
- 2 ein Richtmikrofon mit Interferenzrohr;
- 3 ein Blockschaltbild einer Signalverarbeitung für den Beamforming-Algorithmus;
- 4 ein Mikrofonarray in einer zweiten Ausführungsform;
- 5 ein Mikrofonarray in einer dritten Ausführungsform;
- 6 ein Mikrofonarray in einer vierten Ausführungsform;
- 7 ein Blockschaltbild einer Multifokus-Signalverarbeitung für den Beamforming-Algorithmus; und
- 8 ein Diagramm der Radialkomponenten von Modalantworten eines Sennheiser MKH8070 Richtrohrmikrofons.
-
Detaillierte Beschreibung der Erfindung
-
1 zeigt exemplarisch ein zirkulares Mikrofonarray 100 mit einunddreißig Richtmikrofonen 110 mit sehr hoher Richtwirkung. Jedes der Richtmikrofone 110 enthält eine Mikrofonkapsel, wobei die Mikrofonkapseln aller Richtmikrofone 110 auf einem Kreis 120 mit dem Radius r um einen Mittelpunkt C herum angeordnet sind. Außerdem enthält jedes Richtmikrofon 110 ein Interferenzrohr, das orthogonal zu dem Kreis 120 liegt und daher radial nach außen gerichtet ist. Die Mikrofone werden daher auch als Richtrohrmikrofone bezeichnet. Die bevorzugte Richtung hoher Empfindlichkeit jedes Richtrohrmikrofons ist in seiner jeweiligen Längsrichtung, also ebenfalls orthogonal zum Kreis 120 bzw. radial zur gesamten Anordnung. Damit hat jedes Mikrofon eine andere bevorzugte Richtung hoher Empfindlichkeit. Weiterhin sind alle Richtrohrmikrofone im Wesentlichen in einer gemeinsamen Ebene angeordnet. Die gesamte Anordnung wird z.B. in einem Fußballstadion im Wesentlichen waagerecht positioniert, so dass die Richtrohrmikrofone parallel zum Boden liegen.
-
Alternativ könnten die Richtrohrmikrofone in zwei oder mehr verschiedenen Ebenen angeordnet sein. Diese sollten bevorzugt eng zusammenliegen. Die Mikrofone können grundsätzlich auch in völlig verschiedenen Ebenen angeordnet sein, jedoch sollte dann die Empfindlichkeit aller Mikrofone bezüglich einer festgelegten Elevation ähnlich sein. Mit anderen Worten, die „Blickrichtungen“ oder Fokusbereiche der verschiedenen Mikrofone sollten in einer beabsichtigten Entfernung alle im Wesentlichen in einer Ebene liegen.
-
Der Radius des Kreises oder Kreissegments bestimmt die Aliasfrequenz und den Betriebsfrequenzbereich. Ein größerer Radius bei konstanter Anzahl der Richtmikrofone führt zu einer Verschiebung dieses Bereichs zu tieferen Frequenzen und zu einer tieferen Aliasfrequenz. Eine Erhöhung der Anzahl der Mikrofone führt zu einer höheren Aliasfrequenz.
-
2 zeigt exemplarisch ein einzelnes Richtrohrmikrofon 200, das als Richtmikrofon 110 in der Anordnung 100 verwendet werden kann. Das Richtrohrmikrofon enthält ein Rohr 210 mit einer darin liegenden Mikrofonkapsel 240 (nicht in der Zeichnung sichtbar). Die Mikrofonkapsel kann über einen elektrischen Anschluss 250 am hinteren Ende des Richtrohrmikrofons elektrisch angeschlossen werden. Das Richtrohr 210 enthält an seinem vorderen Ende eine oder mehrere Öffnungen 230, die als Hauptöffnungen für den Schalleintritt dienen. Seitlich befinden sich über die Länge des Rohrs verteilt weitere Öffnungen 220, durch die seitlich eintreffender Schall in das Rohr gelangen kann. Dieser seitlich eintreffende Schall gelangt auch durch die Hauptöffnungen 230 in das Rohr, allerdings phasenversetzt wegen des längeren Weges. Im Rohr überlagert er sich mit dem durch die Seitenöffnungen 220 eintreffenden seitlichen Schall. Durch Interferenz innerhalb des Rohres wird dieser Schall daher kompensiert, so dass sich eine geringere Empfindlichkeit für den seitlich eintreffenden Schall ergibt und daher zu einer höheren Empfindlichkeit des Mikrofons für den frontal eintreffenden Schall führt („endfire shotgun microphone“).
-
Richtmikrofone bieten den Vorteil einer besonders hohen Richtwirkung, was sich sowohl auf einen sehr kleinen Azimutwinkel als auch einen sehr kleinen Elevationswinkel bezieht. Der Elevationswinkel ist der Winkel senkrecht zur Zeichenebene in 1. Zwar ist auch der Azimutwinkel, d.h. der Winkel in der Zeichenebene der 1, jedes einzelnen Richtmikrofons sehr klein, aber durch Einbeziehen benachbarter Richtmikrofone und durch geeignete Berechnungen zur Kombination der verschiedenen Mikrofonsignale lässt sich eine Richtwirkung der gesamten Anordnung in der Ebene steuern. Insbesondere lässt sich die Richtwirkung einer rotationssymmetrischen Anordnung wie in 1 in jede beliebige Richtung der Ebene, d.h. zu jedem beliebigen Azimutwinkel steuern. Dabei ist der Elevationswinkel der Richtcharakteristik der gesamten Anordnung derselbe wie der Elevationswinkel der Richtcharakteristik jedes einzelnen Richtmikrofons, also sehr klein. Daher ist es nicht notwendig, Mikrofone in mehreren vertikalen Ebenen anzuordnen, um eine hohe vertikale Richtwirkung zu erzielen. Dadurch entsteht eine flache Anordnung, die z.B. in einem Sportstadion die Sicht der Zuschauer oder Kameras nicht stört. Außerdem sind keine Berechnungen für eine (ggf. zeitlich veränderliche) Kombination der Mikrofonsignale über die vertikale Achse erforderlich.
-
Ein weiterer Vorteil einer rotationssymmetrischen Anordnung wie in 1 besteht darin, dass die Richtwirkung in jede beliebige Richtung der Ebene, d.h. zu jedem beliebigen Azimutwinkel, gleichmäßig ist. So entstehen keine klanglichen Verfärbungen von seitlich eintreffenden Tönen, wie z.B. Geräuschen aus dem Publikum, wenn die Richtung hoher Empfindlichkeit der Anordnung geändert wird. Außerdem ist es durch mehrfach parallele unterschiedliche Verarbeitung der Mikrofonsignale leicht, mehrere Richtungen gleichzeitig als Richtungen hoher Empfindlichkeit zu definieren. Dadurch lässt sich der Strahl auf mehrere Azimutwinkel gleichzeitig fokussieren, d.h. es können mehrere Schallquellen aus unterschiedlichen Richtungen gleichzeitig mit hoher Richtwirkung („directivity“) aufgenommen werden.
-
Verschiedene Methoden der Signalverarbeitung können verwendet werden. Eine mögliche und besonders vorteilhafte Signalverarbeitung für das Mikrofonarray ist der Beamforming-Algorithmus. Hierbei basiert die Strahlformung auf dem sogenannten modalen Beamforming, das speziell für Konfigurationen geeignet ist, in denen alle Mikrofone im Wesentlichen gleiche Direktivität (Richtwirkung) haben und auf einer Kugel oder auf einem Kreis angeordnet sind. Für den Betriebsfrequenzbereich des Arrays ist es möglich, eine annähernd gleichförmige Richtwirkung (uniform beam pattern) über alle Frequenzen des Betriebsfrequenzbereichs zu erzielen. Die Anzahl Q der benutzten Mikrofone bestimmt den maximalen realisierbaren Grad M des Ausgangssignals, der der räumlichen Auflösung der Richtcharakteristik (beam pattern) entspricht, gemäß
Die Verarbeitung erfolgt in zwei Schritten: (a) ein frequenzunabhängiges Mischen (oder Matrizieren) der Mikrofonsignale, um 2M+1 Zwischensignale oder Mischsignale zu erzeugen, und (b) Filtern und anschließendes Gewichten und Aufsummieren (weighted summing) der Zwischensignale oder Mischsignale.
-
Besonders beachtenswert ist die Option, den Strahl (d.h. die resultierende Richtung hoher Empfindlichkeit) auf einen gewünschten Azimutwinkel Φ
T zu lenken, indem die reellwertigen Gewichtungen
entsprechend errechnet werden. Die Steuerung (d.h. die Angabe von Informationen über den gewünschten Azimutwinkel Φ
T) kann entweder manuell oder automatisiert erreicht werden, z.B. durch ein visuelles Verfolgungssystem (visual tracking system). Von besonderer Bedeutung ist, dass die Steuerinformation zeitlich variiert. Weiter werden die gefilterten Signale vor dem Aufsummieren entsprechend gewichtet, was die gleichzeitige Aufnahme mehrerer Schallquellen als Ziele (targets) erleichtert. Ein Beispiel ist in
7 gezeigt und wird weiter unten erläutert.
-
3 zeigt ein Blockschaltbild einer Signalverarbeitung für den modalen Beamforming-Algorithmus für ein Array von zirkulär angeordneten Richtmikrofonen. Die Q Mikrofonsignale X(ω,x
1),...,X(ω,x
Q) werden in einer Transformationsmatrix T
(M)(ϕ
1, ϕ
2, ..., ϕ
Q) 310 frequenzunabhängig gemischt. Die Transformationsmatrix ist gilt für einen gewünschten maximalen Grad
und liefert (2M+1) Ausgangssignale. Jedes Ausgangssignal wird gefiltert, wobei von den (2M+1) Filtern
320,...,
322' ein Filter
320 einmal und alle anderen jeweils zweimal gleichartig als Filterpaar
321,
321' auftreten. Z.B. sind das Filter
321 für den (-M+1)-ten Ausgang der Matrix und das Filter
321' für den (M-1)-ten Ausgang der Matrix gleich. Jedes Filter bzw. Filterpaar hat eine eigene Filterfunktion, entsprechend einer Ordnung einer bestimmten Mode. Das Ausgangssignal jedes Filters
320,...,
322' wird in einer oder mehreren Gewichtungseinheiten
330 entsprechend der gewünschten Azimutrichtung Φ
T mit einem entsprechenden Wert (gain)
gewichtet. Die 2M+1 gewichteten gefilterten Mischsignale werden in einer Summationseinheit
340 aufsummiert, und das Summensignal Y(ω) kann dann entweder als Ausgangssignal
360 ausgegeben werden, oder optional in einem Equalisationsfilter
350 gefiltert und dann ausgegeben werden.
-
Für die Anzahl der Richtmikrofone und ihre Positionen gilt folgendes. Generell bestimmt die Anzahl der Mikrofone die räumliche Auflösung der möglichen Richtcharakteristik (target beam pattern), insbesondere den Richtungsindex (maximum directivity index), der das Verhältnis zwischen der Ausgangsleistung in Bezug auf eine gewünschte Zielrichtung und der gesamten, über alle anderen Richtungen integrierten Ausgangsleistung angibt. Im Kontext der modalen Strahlsteuerung (modal beam forming) ist es sinnvoll, die Anzahl Q der Mikrofone in Abhängigkeit von dem erforderlichen maximalen Grad M zu wählen, gemäß Q=2M+1. Wenn die weiter unten beschriebene Zirkuläre Harmonische Transformation (Circular Harmonics Transform) benutzt wird, ist es in Anbetracht der dafür gemachten Annahmen vorteilhaft, eine gleichmäßige Verteilung der Mikrofone auf einem Kreis zu verwenden. Dies sichert eine gleichmäßige Signalqualität (uniform beam former performance) über alle (Azimut-) Richtungen, wie es bei der modalen Strahlformung beabsichtigt ist.
-
4 zeigt ein Mikrofonarray 400 in einer zweiten Ausführungsform. Dabei werden elf Richtmikrofone 4101 ,...,41011 gleichmäßig über einen Kreis 420 verteilt radial angeordnet. Gemäß der Formel Q = 2M + 1 mit Q=11 lässt sich ein Signal mit dem Grad von höchstens M=5 erzeugen.
-
Wenn ein anderer Algorithmus als die modale Strahlsteuerung (modal beam forming) benutzt wird, kann es jedoch sinnvoll sein, die Richtmikrofone anders anzuordnen, nämlich nicht exakt radial, sondern leicht verdreht bzw. verschoben. Die gesamte Anordnung wird dadurch kleiner, ohne dass die Länge der einzelnen Richtmikrofone oder der Durchmesser des Mikrofonkreises reduziert werden. 5 zeigt ein Mikrofonarray 500 in einer dritten Ausführungsform, bei dem jedes der elf Richtmikrofone 5101 ,...,51011 um einen Winkel α gedreht und auf einem Kreis 520 angeordnet ist. Der verwendete Algorithmus muss diese Drehung berücksichtigen.
-
Es kann außerdem für bestimmte Anwendungen sinnvoll sein, die Richtmikrofone auf einem Kreissegment mit einem bestimmten Winkel anzuordnen, z.B. wenn nur geringe Störgeräusche von hinten zu erwarten sind. Der Nachteil einer Kreissegmentanordnung gegenüber einer Vollkreisanordnung ist jedoch, dass bei einer Ausrichtung nahe am Rand die Störgeräusche aus Richtungen, in die kein Richtmikrofon zeigt, nicht gut unterdrückt werden können. Dieses Problem kann teilweise kompensiert werden, indem das Kreissegment größer gemacht wird als der zu beobachtende Bereich. 6 zeigt ein Mikrofonarray 600 in einer vierten Ausführungsform, bei dem wieder elf Richtmikrofone 6101 ,...,61011 gleichmäßig über einen Halbkreis 620 verteilt sind. Für eine zentrale Ausrichtung nahe 0° entsprechend der Mikrofon 6106 ist diese Anordnung gut einsetzbar. Auf für einen Bereich von z.B. ±45° um die zentrale Ausrichtung kann ein akzeptables Ergebnis erreichbar sein. Entsprechend ist ein Mikrofonarray der in 6 gezeigten Form z.B. an den Ecken eines Spielfeldes einsetzbar, wo ein Bereich von im Wesentlichen 90° erfasst werden soll.
-
Allerdings sind für eine kreissegmentförmige Anordnung von Richtmikrofonen andere Algorithmen als modale Strahlsteuerung normalerweise besser geeignet, weil sie nicht auf einer kreissymmetrischen Anordnung der Mikrofone beruhen. Jedoch haben solche alternativ einsetzbaren Algorithmen den Nachteil, dass nicht nur ihre skalaren Gewichtungen, sondern auch ihre Filterfunktionen richtungsabhängig sind. Da die Berechnung der Filterfunktionen bzw. Filterkoeffizienten oft relativ rechenaufwendig ist, können diese vorab berechnet werden. Die Vorrichtung enthält dann einen Speicher, in dem die jeweiligen Filterkoeffizienten für bestimmte Richtungen abgelegt sind und aus dem sie bei Bedarf abgerufen werden können. Auf diese Art ist auch mit solchen alternativen Algorithmen ein Betrieb in Echtzeit möglich.
-
7 zeigt ein Blockschaltbild einer Multifokus-Signalverarbeitung für den Beamforming-Algorithmus. Wie schon die in 3 gezeigte Einzelfokus-Signalverarbeitung enthält die Multifokus-Signalverarbeitung eine Mischmatrix 310 zum Mischen der Mikrofonsignale auf (2M+1) Mischsignale, wobei M die Ordnung des gemeinsamen Ausgangssignals ist, und eine Mehrzahl von (2M+1) Filtern 320,321,321',322,322' zum Filtern der Mischsignale, wobei gefilterte Mischsignale QF-M,QF-M+1,...,QF0,...,QFM-1, QFM entstehen. Die gefilterten Mischsignale werden nun nicht nur an (2M+1) erste Gewichtungseinheiten 3301 weitergeleitet, sondern auch an (2M+1) zweite Gewichtungseinheiten 3302 . Die erste Gewichtungseinheiten 3301 gewichten jedes der gefilterten Mischsignale mit einer ersten Gewichtung g-M(ΦT1),...,g0(ΦT1),...,gM(ΦT1), und die zweiten Gewichtungseinheiten 3302 gewichten jedes der gefilterten Mischsignale mit einer zweiten Gewichtung g-M(ΦT2),...,g0(ΦT2),...,gM(ΦT2). Dabei entspricht die Gewichtung jeder ersten Gewichtungseinheit der ersten bevorzugten Richtung hoher Empfindlichkeit ΦT1, und die Gewichtung jeder zweiten Gewichtungseinheit entspricht der zweiten bevorzugten Richtung hoher Empfindlichkeit ΦT2. Die Ausgangssignale der ersten Gewichtungseinheiten 3301 und die Ausgangssignale der zweiten Gewichtungseinheiten 3302 werden getrennt voneinander in zwei separaten Summationseinheiten 3401 ,3402 aufaddiert, optional gefiltert 3501,3502 und dann ausgegeben. Damit hat das Mikrofonarray gleichzeitig zwei bevorzugte Richtungen hoher Empfindlichkeit ΦT1,ΦT2. Die beiden Ausgangssignale 3601 ,3602 enthalten diese Audiosignale aus den zwei bevorzugten Richtungen hoher Empfindlichkeit des Mikrofonarrays. Z.B. können Geräusche aus Richtung des Balls und aus Richtung des Schiedsrichters gleichzeitig extrahiert und aufgenommen werden. Ein Vorteil der Anordnung ist, dass die zweiten Gewichtungseinheiten 3302 dieselben gefilterten Mischsignale wie die ersten Gewichtungseinheiten 3301 verarbeiten, und nur eine andere Richtungsinformation für die bevorzugte Richtung hoher Empfindlichkeit ΦT2 benutzen. Daher müssen die Filter 320, ..., 322' nur einmal berechnet und implementiert werden, denn sie sind richtungsunabhängig. Die Gewichtungseinheiten können z.B. als Multiplizierer implementiert werden. Die gesamte in 3 oder in 7 gezeigte Anordnung kann durch einen oder mehrere Mikroprozessoren ggf. mit entsprechenden Softwareprogrammen realisiert werden.
-
(4) Details der zweidimensionalen modalen Strahlsteuerung (two-dimensional modal beam forming) werden im Folgenden erklärt.
-
(4.1) Zunächst werden grundlegende Annahmen und Zusammenhänge erklärt. In einem kompakten Areal von Interesse innerhalb des drei-dimensionalen Raumes, das das Zentrum eines gedachten Koordinatensystems enthält, frei von Schallquellen ist und von außen durch ein von der z-Achse unabhängiges Schallfeld angeregt wird, liegt ein Array von Q akustischen Sensoren (d.h. Mikrofonen), die sich linear verhalten. Diese sind auf einem Kreis innerhalb der xy-Ebene des gedachten Koordinatensystems angeordnet, mit den (zwei-dimensionalen) Koordinaten
-
Dabei ist ro der Radius des Kreises und der Azimutwunkel des q-ten Mikrofons, gemessen gegen den Uhrzeigersinn in der xy-Ebene von der x-Achse aus. Die Repräsentation X(ω,x
q) des q-ten Mikrofonsignals im Frequenzbereich bei einer Kreisfrequenz ω kann als Überlagerung (composition) von Antworten auf individuelle ebene Wellen beschrieben werden, die von allen möglichen Azimutwinkeln Φ eintreffen, d.h.
-
Dabei ist C(ω,Φ) die sogenannte Amplitudendichtefunktion der ebenen Welle (plane wave amplitude density function), die im Wesentlichen eine Frequenzbereichs-Repräsentation des Schalldrucks im Koordinatenursprung ist, der durch eine einzelne, ebene, mit einem Azimutwinkel Φ einfallenden Welle hervorgerufen wird. H(ω,xq,ϕ) ist die Richtcharakteristik des q-ten Mikrofons.
-
Durch Reihenzerlegung der Richtcharakteristik H(ω,x
q,ϕ) und der Amplitudendichtefunktion der ebenen Welle C(ω,ϕ) in Reihen reellwertiger orthonormaler Zirkulär Harmonischer (einer Sonderform der Sphärisch Harmonischen), definiert durch
gemäß
und unter Ausnutzung der Orthonormalität der Zirkulär Harmonischen, d.h.
wobei δ.,. die Kronecker-Delta-Funktion ist, kann die Repräsentation des Mikrofonsignals im Frequenzbereich X(ω,x
q) formuliert werden als
-
Die individuellen Gewichte Hm(ω,xq) der Zirkulär Harmonischen Reihe in (4) werden als Modalantworten vom Grad m bezeichnet.
-
Wenn alle Mikrofone gleiche Richtcharakteristiken (directivity pattern) haben und orthogonal zu dem Kreis nach außen gerichtet sind, kann dies formal ausgedrückt werden als
mit H
PROTO(ω,r
0,ϕ) als Φ-symmetrische Prototyp-Richtcharakteristik (prototype directivity). Diese kann betrachtet werden als einem Mikrofon an einer Position (r
0,ϕ
q = 0) zugehörig. Wegen dieser Φ-Symmetrie ist die Zirkulär Harmonische Reihenzerlegung von H
PROTO(ω,r
0,ϕ) gegeben durch
mit
-
Für diesen speziellen Fall können die Modalantworten faktorisiert werden in eine frequenz- und radiusabhängige Komponente und eine andere Komponente, die nur vom Azimutwinkel abhängt gemäß
mit
-
Außerdem bemerkenswert sind die Symmetrie der Radialkomponenten
und die Tatsache, dass die Radialkomponenten vom Produkt der Kreisfrequenz und dem Radius abhängen:
-
Durch Einsetzen von (12) in (8) kann die Frequenzbereichs-Repräsentation X(ω, x
q) des q-ten Mikrofonsignals ausgedrückt werden als
-
(4.2) Im Folgenden wird das grundlegende Prinzip der modalen Strahlformung (modal beam-forming) beschrieben. Dieses kann in die folgenden beiden Schritte unterteilt werden:
- (1) Rekonstruktion der zugrunde liegenden Überlagerung des einwirkenden Schallfeldes individueller ebener Wellen aus den Mikrofonsignalen X(ω,xq), repräsentiert durch die Koeffizienten Cm(ω) der Zirkulär Harmonischen Reihenzerlegung der Amplitudendichtefunktion der ebenen Wellen, und
- (2) Gewichten der individuellen ebenen Wellen des einwirkenden Schallfeldes gemäß einer gewünschten Richtcharakteristik (target beam-pattern) und anschließend deren Integration, um das Ausgangssignal des Strahlformers (beam-former) zu erhalten.
-
Ein Blockdiagramm eines typischen modalen Strahlformers ist in 3 und 7 gezeigt, wie oben beschrieben. Die beiden genannten Schritte werden im Folgenden detaillierter beschrieben.
-
(4.2.1) Zur Motivation der Rekonstruktion des einwirkenden Schallfelds wird die Zirkulär Harmonische Reihenzerlegung der Mikrofonsignale im Frequenzbereich
verglichen mit (15). Dabei wird klar, dass die Reihenkoeffizienten X
m(ω r
0) in Beziehung stehen zu den gesuchten Zirkulär Harmonischen Reihenkoeffizienten C
m(ω) der Amplitudendichtefunktion der ebenen Welle gemäß
-
Daher werden zwei weitere Schritte durchgeführt:
- (1) Die Zirkulär Harmonischen Reihenkoeffizienten der Mikrofonsignale im Frequenzbereich werden abgeschätzt (estimated) durch eine Zirkulär Harmonische Transformation gemäß
Hier ist zu beachten, dass wegen der endlichen Anzahl Q der räumlichen Abtastpunkte xq der maximale Absolutwert des Grades m, der rekonstruiert werden kann, ebenfalls endlich ist und von der Verteilung der räumlichen Abtastpunkte xq auf dem Kreis abhängt. Z.B. sind die Gewichte für den speziellen Fall einer gleichmäßigen Verteilung alle gleich, nämlich
und der maximale Absolutwert des Grades m, der rekonstruiert werden kann, ist gegeben durch
Durch Definition des Vektors X(ω), der die Signale aller Mikrofone enthält, als
des Vektors aller Zirkulär Harmonischen Reihenkoeffizienten als
und der diskreten Zirkulär Harmonischen Transformationsmatrix als
kann die Abschätzung der Zirkulär Harmonischen Reihenkoeffizienten durch folgende Matrizenmultiplikation ausgedrückt werden:
Besonders wichtig ist, dass diese Matrix frequenzunabhängig ist.
- (2) Unter Berücksichtigung von (17) und (14) werden die Zirkulär Harmonischen Reihenkoeffizienten der Amplitudendichtefunktion der ebenen Welle (Circular Harmonics series expansion coefficients of the plane wave amplitude density function) im Prinzip wie folgt abgeschätzt:
mit
was einer Filterung für jeden einzelnen geschätzten Zirkulär Harmonischen Reihenkoeffizienten der Mikrofonsignale X̂m(ω,r0) im Frequenzbereich entspricht.
-
(4.2.2) Mit den abgeschätzten Zirkulär Harmonischen Reihenkoeffizienten der Amplitudendichtefunktion der ebenen Welle werden nun die einzelnen ebenen Wellen des einwirkenden Schallfeldes entsprechend einer gewünschten Richtcharakteristik (target beam pattern) gewichtet, um anschließend integriert bzw. aufsummiert zu werden.
-
Der maximale Grad M der Zirkulär Harmonischen Reihenkoeffizienten der Amplitudendichtefunktion der ebenen Welle bestimmt die maximal mögliche räumliche Auflösung der gewünschten Richtcharakteristik. Daher wird ein Prototyp einer gewünschten Richtcharakteristik mittels einer abgebrochenen Zirkulär Harmonischen Reihenentwicklung desselben Grades M definiert:
die für einen Ziel-Azimutwinkel ϕ
T = 0 eingestellt wird und Φ-symmetrisch ist. Wegen der Symmetrie sind die Reihenkoeffizienten für negative Grad-Indizes m Null.
-
Wenn die Richtcharakteristik auf einen beliebigen gewünschten Azimutwinkel Φ
T eingestellt wird, können ihre entsprechenden Zirkulär Harmonischen Reihenkoeffizienten aus denjenigen für ϕ
T = 0 berechnet werden gemäß
-
Das aktuelle Strahlformer-Ausgangssignal Y(ω) im Frequenzbereich wird als gewichtete Summe der Zirkulär Harmonischen Reihenkoeffizienten der Amplitudendichtefunktion der ebenen Welle wie folgt berechnet:
Wegen der Äquivalenz von (28) mit
wird die Integration der gewichteten Beiträge der ebenen Welle zum einwirkenden Schallfeld deutlich.
-
Für die meisten Anwendungsfälle ist die hier benutzte frequenzunabhängige Richtcharakteristik vorteilhaft und gewünscht. Es lässt sich jedoch auch sehr einfach eine frequenzabhängige Richtcharakteristik erstellen, indem die Gewichtungsfaktoren frequenzabhängig gemacht werden. Dies erfordert je einen Filter pro Koeffizient der Zirkulär Harmonischen Reihenkoeffizienten der Amplitudendichtefunktion der ebenen Welle vor der Summation.
-
Optional kann ein Equalizingfilter 350,350' auf das Ausgangssignal Y(ω) des Strahlformers angewandt werden, um eine richtungsunabhängige Färbung (coloration).zu erzeugen bzw. eine richtungsabhängige Färbung zu kompensieren, z.B. um von räumlichem Aliasing betroffene hochfrequente Signalkomponenten zu dämpfen.
-
(4.3) Der Radius des Kreises, auf dem die Mikrofonkapseln der Richtmikrofone angeordnet sind, beeinflusst mindestens zwei Kennwerte des Arrays, nämlich die in der Praxis realisierbare Richtwirkung (directivity) bei niedrigen Frequenzen und diejenige Frequenz, ab der das räumliche Aliasing einsetzt.
-
(4.3.1) Die Richtwirkung bei niedrigen Frequenzen wird wie folgt beeinträchtigt. Die radialen Komponenten b
m(ω,r
0) der Modalantworten haben typischerweise eine Hochpass-Charakteristik, wobei die Grenzfrequenz (cutoff frequency) mit dem Grad-Index m steigt. Zur Veranschaulichung zeigt
8 exemplarisch ein Diagramm der Radialkomponenten von Modalantworten für verschiedene Grade m eines Sennheiser MKH8070 Richtrohrmikrofons, aufgetragen über ein Produkt ω · r
0. Wie zu erkennen ist, werden insbesondere für niedrige Spektralfrequenzen (low spectral frequencies) die Beiträge der Moden mit steigendem Grad m innerhalb der gemessenen Mikrofonsignale (16) sehr klein. Um die entsprechenden Zirkulär Harmonischen Reihenkoeffizienten der Amplitudendichtefunktion der ebenen Welle zu rekonstruieren, ist deshalb ein hoher Verstärkungsfaktor von
notwendig (siehe (26)), da |b
|m|(ω,r
0)| klein ist. Das führt zu einer typischerweise geringen Verstärkung des Weißen Rauschens (typically low white noise gain) für eine Richtcharakteristik mit einem hohen Grad M, was bedeutet, dass das Mikrofonrauschen im Ausgangssignal des Strahlformers stark verstärkt wird. Durch Vergrößerung des Radius r des Arrays werden die in
8 dargestellten Kurven im Wesentlichen nach links verschoben, d.h. in Richtung niedrigerer Frequenzen. Dies führt zu einer Verringerung der Hochpass-Grenzfrequenzen und reduziert dadurch den Effekt der Verstärkung des Weißen Rauschens (white noise amplification) bei niedrigen Frequenzen, verglichen mit einem kleineren Radius.
-
(4.3.2) Räumliches Aliasing ist ein Phänomen, das auftritt, wenn z.B. ein Schallfeld an zu wenigen Abtastpunkten abgetastet wird, um hochfrequente räumliche Oszillationen des Schalldrucks zu erfassen. Da die Relevanz der Zirkulär Harmonischen mit höherem Grad m innerhalb der Signaturfunktion normalerweise mit der Spektralfrequenz steigt, gilt dies auch für die Größe des durch das räumliche Aliasing hervorgerufenen Fehlers. Insbesondere kann die Winkelfrequenz (angular frequency), bei der der Beitrag der Zirkulär Harmonische mit Graden größer als M zur Signaturfunktion signifikant wird, angesehen werden als diejenige Frequenz, bei der der Aliasingeffekt störend bzw. nennenswert (severe) wird. Im Wesentlichen liegt diese Winkelfrequenz bei
wobei es die Schallgeschwindigkeit ist. Das bedeutet, dass für eine gewählte Anzahl Q von Mikrofonen die räumliche Aliasingfrequenz erhöht werden kann, indem der Radius r des Arrays reduziert wird. Alternativ kann für einen gegebenen Radius des Arrays die Anzahl der Mikrofone erhöht werden.
-
Für Mikrofonarrays für hörbare Frequenzen sollten die Mikrofonkapseln auf einem Kreis oder Kreisabschnitt mit einem Radius mit mindestens rmin = 5 cm liegen. Aus praktischen Gründen ist ein maximaler Radius von ca. rmax = 100 cm zu empfehlen. Für Mikrofonarrays die zur Anwendung z.B. in einem Sportstadion gedacht sind, ist es vorteilhaft, wenn der Radius zwischen rmin = 30 cm und rmax = 40 cm beträgt. Mit dem beispielhaft beschriebenen Aufbau lässt sich z.B. für Frequenzen von 200 Hz - 3 kHz eine sehr hohe Richtwirkung erzielen.
-
Ein besonderer Vorteil des erfindungsgemäßen Mikrofonarrays ist, dass es nicht bewegt werden muss, sondern ortsfest bleibt, wobei die Richtung höchster Empfindlichkeit durch elektronische Steuerung eingestellt werden kann auf jede beliebige Richtung innerhalb der Kreisebene (entsprechend einem Azimutwinkel von 0°-360° bei waagerechtem Aufbau). Es kann in anderen Anwendungsfällen sinnvoll sein, die Kreisebene senkrecht zu positionieren, um einen Elevationswinkel von 0°-360° zu erfassen und dabei den Azimutwinkel des Erfassungsbereichs sehr gering zu halten. Ebenso sind beliebige, dazwischenliegende Ausrichtungen der Mikrofonebene möglich. Wie in den Zeichnungen dargestellt, befindet sich kein Mikrofon in der Mitte der Anordnung, und alle auf dem Kreis bzw. Kreisabschnitt befindlichen Richtmikrofone sind nach außen (vom Mittelpunkt weg) gerichtet. Die jeweils angegebene Anzahl von Richtmikrofonen pro Array ist die jeweilige Mindestanzahl; es ist immer möglich und kann vorteilhaft sein, die Anzahl Q der Mikrofone zu erhöhen, wie oben erläutert. Dabei kann die Anzahl Q gerade oder ungerade sein.
-
In einer Ausführungsform betrifft die Erfindung ein Verfahren zur Audioaufnahme mittels eines Mikrofonarrays aus Richtmikrofonen, wobei mindestens ein gemeinsames Ausgangssignal erzeugt wird, das den Schall in einer einstellbaren bevorzugten Richtung hoher Empfindlichkeit des Mikrofonarrays enthält, mit den Schritten: Mischen mehrerer Mikrofonsignale in einer Mischmatrix auf (2M+1) Mischsignale, wobei M die Ordnung des gemeinsamen Ausgangssignals ist, und wobei die Mikrofonsignale von den Richtmikrofonen kommen und die Richtmikrofone im Wesentlichen in einer Ebene und auf einem Kreis oder Kreisabschnitt so angeordnet ist, dass für jedes der Richtmikrofone eine bevorzugte Richtung hoher Empfindlichkeit im Wesentlichen orthogonal nach außen zu dem Kreis oder Kreisabschnitt liegt, Filtern der Mischsignale in einer Mehrzahl von (2M+1) Filtern, wobei gefilterte Mischsignale entstehen, Gewichten jedes der gefilterten Mischsignale mit einer Gewichtung in einer Mehrzahl von (2M+1) Gewichtungseinheiten, wobei die Gewichtung jeder Gewichtungseinheit der einstellbaren bevorzugten Richtung hoher Empfindlichkeit des Mikrofonarrays entspricht, und Aufsummieren der (2M+1) gewichteten, gefilterten Mischsignale in einer Summationseinheit, wobei das gemeinsame Ausgangssignal entsteht.