-
Die
vorliegende Erfindung bezieht sich auf Wellenfeldsynthesesysteme
und insbesondere auf die Reduktion oder Eliminierung von Pegel-Artefakten
in Wellenfeldsynthesesystemen.
-
Es
besteht ein steigender Bedarf an neuen Technologien und innovativen
Produkten im Bereich der Unterhaltungselektronik. Dabei ist es eine
wichtige Voraussetzung für
den Erfolg neuer multimedialer Systeme, optimale Funktionalitäten bzw.
Fähigkeiten anzubieten.
Erreicht wird das durch den Einsatz digitaler Technologien und insbesondere
der Computertechnik. Beispiele hierfür sind die Applikationen, die einen
verbesserten realitätsnahen
audiovisuellen Eindruck bieten. Bei bisherigen Audiosystemen liegt ein
wesentlicher Schwachpunkt in der Qualität der räumlichen Schallwiedergabe von
natürlichen,
aber auch von virtuellen Umgebungen.
-
Verfahren
zur mehrkanaligen Lautsprecherwiedergabe von Audiosignalen sind
seit vielen Jahren bekannt und standardisiert. Alle üblichen
Techniken besitzen den Nachteil, dass sowohl der Aufstellungsort
der Lautsprecher als auch die Position des Hörers dem Übertragungsformat bereits eingeprägt sind.
Bei falscher Anordnung der Lautsprecher im Bezug auf den Hörer leidet
die Audioqualität
deutlich. Ein optimaler Klang ist nur in einem kleinen Bereich des
Wiedergaberaums, dem so genannten Sweet Spot, möglich.
-
Ein
besserer natürlicher
Raumeindruck sowie eine stärkere
Einhüllung
bei der Audiowiedergabe kann mit Hilfe einer neuen Technologie erreicht werden.
Die Grundlagen dieser Technologie, die so genannte Wellenfeldsynthese
(WFS; WFS = Wave-Field Synthesis), wurden an der TU Delft erforscht
und erstmals in den späten
80er-Jahren vorgestellt (Berkhout, A.J.; de Vries, D.; Vogel, P.: Acoustic
control by Wavefield Synthesis. JASA 93, 1993).
-
Infolge
der enormen Anforderungen dieser Methode an Rechnerleistung und Übertragungsraten wurde
die Wellenfeldsynthese bis jetzt nur selten in der Praxis angewendet.
Erst die Fortschritte in den Bereichen der Mikroprozessortechnik
und der Audiocodierung gestatten heute den Einsatz dieser Technologie
in konkreten Anwendungen. Erste Produkte im professionellen Bereich
werden nächstes
Jahr erwartet. In wenigen Jahren sollen auch erste Wellenfeldsynthese-Anwendungen für den Konsumerbereich
auf den Markt kommen.
-
Die
Grundidee von WFS basiert auf der Anwendung des Huygens'schen Prinzips der
Wellentheorie:
Jeder Punkt, der von einer Welle erfasst wird,
ist Ausgangspunkt einer Elementarwelle, die sich kugelförmig bzw.
kreisförmig
ausbreitet.
-
Angewandt
auf die Akustik kann durch eine große Anzahl von Lautsprechern,
die nebeneinander angeordnet sind (einem so genannten Lautsprecherarray),
jede beliebige Form einer einlaufenden Wellenfront nachgebildet
werden. Im einfachsten Fall, einer einzelnen wiederzugebenden Punktquelle
und einer linearen Anordnung der Lautsprecher, müssen die Audiosignale eines
jeden Lautsprechers mit einer Zeitverzögerung und Amplitudenskalierung
so gespeist werden, dass sich die abgestrahlten Klangfelder der
einzelnen Lautsprecher richtig überlagern. Bei
mehreren Schallquellen wird für
jede Quelle der Beitrag zu jedem Lautsprecher getrennt berechnet und
die resultierenden Signale addiert. In einem Raum mit reflektierenden
Wänden
können
auch Reflexionen als zusätzliche
Quellen über
das Lautsprecherarray wiedergegeben werden. Der Aufwand bei der
Berechnung hängt
daher stark von der Anzahl der Schallquellen, den Reflexionsei genschaften
des Aufnahmeraums und der Anzahl der Lautsprecher ab.
-
Der
Vorteil dieser Technik liegt im Besonderen darin, dass ein natürlicher
räumlicher
Klangeindruck über
einen großen
Bereich des Wiedergaberaums möglich
ist. Im Gegensatz zu den bekannten Techniken werden Richtung und
Entfernung von Schallquellen sehr exakt wiedergegeben. In beschränktem Maße können virtuelle
Schallquellen sogar zwischen dem realen Lautsprecherarray und dem
Hörer positioniert
werden.
-
Obgleich
die Wellenfeldsynthese für
Umgebungen gut funktioniert, deren Beschaffenheiten bekannt sind,
treten doch Unregelmäßigkeiten
auf, wenn sich die Beschaffenheit ändert bzw. wenn die Wellenfeldsynthese
auf der Basis einer Umgebungsbeschaffenheit ausgeführt wird,
die nicht mit der tatsächlichen
Beschaffenheit der Umgebung übereinstimmt.
-
Die
Technik der Wellenfeldsynthese kann jedoch ebenfalls vorteilhaft
eingesetzt werden, um eine visuelle Wahrnehmung um eine entsprechende räumliche
Audiowahrnehmung zu ergänzen.
Bisher stand bei der Produktion in virtuellen Studios die Vermittlung
eines authentischen visuellen Eindrucks der virtuellen Szene im
Vordergrund. Der zum Bild passende akustische Eindruck wird in der
Regel durch manuelle Arbeitsschritte in der sogenannten Postproduktion
nachträglich
dem Audiosignal aufgeprägt oder
als zu aufwendig und zeitintensiv in der Realisierung eingestuft
und daher vernachlässigt.
Dadurch kommt es üblicherweise
zu einem Widerspruch der einzelnen Sinnesempfindungen, der dazu
führt, daß der entworfene
Raum, d. h. die entworfene Szene, als weniger authentisch empfunden
wird.
-
In
der Fachveröffentlichung „Subjective
experiments on the effects of combining spatialized audio and 2D
video projection in audio-visual systems", W. de Bruijn und M. Boone, AES convention
paper 5582, 10. bis 13. Mai 2002, München, werden subjektive Experimente
bezüglich
der Auswirkungen des Kombinierens von räumlichem Audio und einer zweidimensionalen
Videoprojektion in audiovisuellen Systemen dargestellt. Insbesondere
wird hervorgehoben, daß zwei
in einer unterschiedlichen Entfernung zu einer Kamera stehende Sprecher,
die nahezu hintereinander stehen, von einem Betrachter besser verstanden
werden können,
wenn mit Hilfe der Wellenfeldsynthese die zwei hintereinander stehenden
Personen als unterschiedliche virtuelle Schallquellen aufgefaßt und rekonstruiert
werden. In diesem Fall hat sich durch subjektive Tests herausgestellt,
daß ein
Zuhörer
die beiden gleichzeitig sprechenden Sprecher getrennt voneinander
besser verstehen und unterscheiden kann.
-
In
einem Tagungsbeitrag zum 46. internationalen wissenschaftlichen
Kolloquium in Ilmenau vom 24. bis 27. September 2001 mit dem Titel „Automatisierte
Anpassung der Akustik an virtuelle Räume", U. Reiter, F. Melchior und C. Seidel,
wird ein Ansatz vorgestellt, Tonnachbearbeitungsprozesse zu automatisieren.
Hierzu werden die für
die Visualisierung notwendigen Parameter eines Film-Sets, wie z.
B. Raumgröße, Textur
der Oberflächen
oder Kameraposition und Position der Akteure auf ihre akustische Relevanz
hin überprüft, woraufhin
entsprechende Steuerdaten generiert werden. Diese beeinflussen dann
automatisiert die zur Postproduktion eingesetzten Effekt- und Nachbearbeitungsprozesse,
wie z. B. die Anpassung der Sprecherlautstärkenabhängigkeit von der Entfernung
zur Kamera oder die Nachhallzeit in Abhängigkeit von Raumgröße und Wandbeschaffenheit.
Hierbei besteht das Ziel darin, den visuellen Eindruck einer virtuellen
Szene für
eine gesteigerte Realitätsempfindung
zu verstärken.
-
Es
soll ein „Hören mit
den Ohren der Kamera" ermöglicht werden,
um eine Szene echter erscheinen zu lassen. Hierbei wird eine möglichst
hohe Korrelation zwischen Schallereignisort im Bild und Hörereignisort
im Surroundfeld angestrebt. Das bedeutet, daß Schallquellenpositionen ständig einem Bild
angepaßt
sein sollen. Kameraparameter, wie z. B.
-
Zoom,
sollen in die Tongestaltung ebenso mit einbezogen werden wie eine
Position von zwei Lautsprechern L und R. Hierzu werden Trackingdaten
eines virtuellen Studios zusammen mit einem zugehörigen Timecode
vom System in eine Datei geschrieben. Gleichzeitig werden Bild,
Ton und Timecode auf einer MAZ aufgezeichnet. Das Camdump-File wird zu
einem Computer übertragen,
der daraus Steuerdaten für
eine Audioworkstation geniert und synchron zum von der MAZ stammenden
Bild über
eine MIDI-Schnittstelle ausgibt. Die eigentliche Audiobearbeitung
wie Positionierung der Schallquelle im Surroundfeld und Einfügen von
frühen
Reflexionen und Nachhall findet innerhalb der Audioworkstation statt. Das
Signal wird für
ein 5.1-Surround-Lautsprechersystem aufbereitet.
-
Kamera-Tracking-Parameter
genauso wie Positionen von Schallquellen im Aufnahme-Setting können bei
realen Film-Sets
aufgezeichnet werden. Solche Daten können auch in virtuellen Studios
erzeugt werden.
-
In
einem virtuellen Studio steht ein Schauspieler oder Moderator allein
in einem Aufnahmeraum. Insbesondere steht er vor einer blauen Wand, die
auch als Blue-Box oder Blue-Panel
bezeichnet wird. Auf diese Blauwand ist ein Muster aus blauen und
hellblauen Streifen aufgebracht. Das besondere an diesem Muster
ist, daß die
Streifen unterschiedlich breit sind und sich somit eine Vielzahl
von Streifen-Kombinationen
ergeben. Aufgrund der einmaligen Streifen-Kombinationen auf der Blauwand ist es bei
der Nachbearbeitung, wenn die Blauwand durch einen virtuellen Hintergrund
ersetzt wird, möglich,
genau zu bestimmen, in welche Richtung die Kamera blickt. Mit Hilfe
dieser Informationen kann der Rechner den Hintergrund für den aktuellen
Kamerablickwinkel ermitteln. Ferner werden Sensoren an der Kamera
ausgewertet, die zusätzliche
Kameraparameter erfassen und ausgeben. Typische Parameter einer Kamera,
die mittels Sensorik erfaßt
werden, sind die drei Translationsgrade x, y, z, die drei Rotationsgrade,
die auch als Roll, Tilt, Pan be zeichnet werden, und die Brennweite
bzw. der Zoom, der gleichbedeutend mit der Information über den Öffnungswinkel
der Kamera ist.
-
Damit
die genaue Position der Kamera auch ohne Bilderkennung und ohne
aufwendige Sensortechnik bestimmt werden kann, kann man auch ein Tracking-System
einsetzen, das aus mehreren Infrarot-Kameras besteht, die die Position
eines an der Kamera befestigten Infrarot-Sensors ermitteln. Somit ist
auch die Position der Kamera bestimmt. Mit den von der Sensorik
gelieferten Kameraparametern und den von der Bilderkennung ausgewerteten
Streifen-Informationen kann ein Echtzeitrechner nun den Hintergrund
für das
aktuelle Bild berechnen. Hierauf wird der Blau-Farbton, den der
blaue Hintergrund hatte, aus dem Bild entfernt, so daß statt
dem blauen Hintergrund der virtuelle Hintergrund eingespielt wird.
-
In
der Mehrzahl der Fälle
wird ein Konzept verfolgt, bei dem es darum geht, einen akustischen Gesamteindruck
der visuell abgebildeten Szenerie zu bekommen. Dieses lässt sich
gut mit dem aus der Bildgestaltung stammenden Begriff der „Totalen" umschreiben. Dieser „totale" Klangeindruck bleibt
meist über
alle Einstellungen in einer Szene konstant, obwohl sich der optische
Blickwinkel auf die Dinge meist stark ändert. So werden optische Details
durch entsprechende Einstellungen herausgehoben oder in den Hintergrund
gestellt. Auch Gegenschüsse
bei der filmischen Dialoggestaltung werden vom Ton nicht nachvollzogen.
-
Daher
besteht der Bedarf, den Zuschauer akustisch in eine audiovisuelle
Szene einzubetten. Hierbei bildet die Leinwand oder Bildfläche die
Blickrichtung und den Blickwinkel des Zuschauers. Dies bedeutet,
daß der
Ton dem Bild in der Form nachgeführt
werden soll, daß er
stets mit dem gesehenen Bild übereinstimmt.
Dies wird insbesondere für
virtuelle Studios noch wichtiger, da es typischerweise keine Korrelation
zwischen dem Ton der Moderation beispielsweise und der Umgebung
gibt, in der sich der Moderator gerade befindet. Um einen audiovisuellen Gesamteindruck
der Szene zu bekommen, muß ein zum
gerenderten Bild passender Raumeindruck simuliert werden. Eine wesentliche
subjektive Eigenschaft bei einem solchen klanglichen Konzept ist
in diesem Zusammenhang der Ort einer Schallquelle, wie ihn ein Betrachter
beispielsweise einer Kinoleinwand empfindet.
-
Im
Audiobereich läßt sich
also durch die Technik der Wellenfeldsynthese (WFS) ein guter räumlicher
Klang für
eine großen
Hörerbereich
erzielen. Wie es ausgeführt
worden ist, basiert die Wellenfeldsynthese auf dem Prinzip von Huygens,
nach welchem sich Wellenfronten durch Überlagerung von Elementarwellen
formen und aufbauen lassen. Nach mathematisch exakter theoretischer
Beschreibung müßten unendlich
viele Quellen in unendlich kleinem Abstand für die Erzeugung der Elementarwellen
genutzt werden. Praktisch werden jedoch endlich viele Lautsprecher
in einem endlich kleinen Abstand zueinander genutzt. Jeder dieser
Lautsprecher wird gemäß dem WFS-Prinzip
mit einem Audiosignal von einer virtuellen Quelle, das ein bestimmtes
Delay und einen bestimmten Pegel hat, angesteuert. Pegel und Delays
sind in der Regel für
alle Lautsprecher unterschiedlich.
-
Wie
es bereits ausgeführt
worden ist, arbeitet das Wellenfeldsynthesesystem auf der Basis
des Huygens-Prinzips und rekonstruiert eine gegebene Wellenform
beispielsweise einer virtuellen Quelle, die in einem bestimmten
Abstand zu einem Vorführbereich
bzw. zu einem Hörer
in dem Vorführbereich
angeordnet ist durch eine Vielzahl von Einzelwellen. Der Wellenfeldsynthesealgorithmus
erhält
somit Informationen über
die tatsächliche
Position eines Einzellautsprechers aus dem Lautsprecherarray, um dann
für diesen
Einzellautsprecher ein Komponentensignal zu berechnen, das dieser
Lautsprecher dann letztendlich abstrahlen muß, damit beim Zuhörer eine Überlagerung
des Lautsprechersignals von dem einen Lautsprecher mit den Lautsprechersignalen
der anderen aktiven Lautsprecher eine Rekonstruktion dahingehend
durch führt,
daß der
Hörer den Eindruck
hat, daß er
nicht von vielen Einzellautsprechern „beschallt" wird, sondern lediglich von einem einzigen
Lautsprecher an der Position der virtuellen Quelle.
-
Für mehrere
virtuelle Quellen in einem Wellenfeldsynthesesetting wird der Beitrag
von jeder virtuellen Quelle für
jeden Lautsprecher, also das Komponentensignal der ersten virtuellen
Quelle für
den ersten Lautsprecher, der zweiten virtuellen Quelle für den ersten
Lautsprecher, etc. berechnet, um dann die Komponentensignale aufzuaddieren,
um schließlich das
tatsächliche
Lautsprechersignal zu erhalten. Im Falle von beispielsweise drei
virtuellen Quellen würde
die Überlagerung
der Lautsprechersignale aller aktiven Lautsprecher beim Hörer dazu
führen,
daß der
Hörer nicht
den Eindruck hat, daß er
von einem großen
Array von Lautsprechern beschallt wird, sondern daß der Schall,
den er hört,
lediglich von drei an speziellen Positionen positionierten Schallquellen kommt,
die gleich den virtuellen Quellen sind.
-
Die
Berechnung der Komponentensignale erfolgt in der Praxis meist dadurch,
daß das
einer virtuellen Quelle zugeordnete Audiosignal je nach Position
der virtuellen Quelle und Position des Lautsprechers zu einem bestimmten
Zeitpunkt mit einer Verzögerung
und einem Skalierungsfaktor beaufschlagt wird, um ein verzögertes und/oder
skaliertes Audiosignal der virtuellen Quelle zu erhalten, das das
Lautsprechersignal unmittelbar darstellt, wenn nur eine virtuellen
Quelle vorhanden ist, oder das nach Addition mit weiteren Komponentensignalen
für den
betrachteten Lautsprecher von anderen virtuellen Quellen dann zum
Lautsprechersignal für
den betrachteten Lautsprecher beiträgt.
-
Typische
Wellenfeldsynthesealgorithmen arbeiten unabhängig davon, wie viele Lautsprecher
im Lautsprecherarray vorhanden sind. Die der Wellenfeldsynthese
zugrundeliegende Theorie besteht darin, daß jedes beliebige Schallfeld
durch ei ne unendlich hohe Anzahl von Einzellautsprechern exakt rekonstruiert
werden kann, wobei die einzelnen Einzellautsprecher unendlich nahe
zueinander angeordnet sind. In der Praxis kann jedoch weder die
unendlich hohe Anzahl noch die unendlich nahe Anordnung realisiert
werden. Statt dessen existiert eine begrenzte Anzahl von Lautsprechern,
die zudem in bestimmten vorgegebenen Abständen zueinander angeordnet
sind. Damit wird in realen Systemen immer nur eine Annäherung an
die tatsächliche
Wellenform erreicht, die stattfinden würde, wenn die virtuelle Quelle tatsächlich vorhanden
wäre, also
eine reale Quelle sein würde.
-
Ferner
existieren verschiedene Szenarien, dahingehend, daß das Lautsprecherarray
nur, wenn ein Kinosaal betrachtet wird, z. B. auf der Seite der Kinoleinwand
angeordnet ist. In diesem Fall würde das
Wellenfeldsynthesemodul Lautsprechersignale für diese Lautsprecher erzeugen,
wobei die Lautsprechersignale für
diese Lautsprecher normalerweise dieselben sein werden wie für entsprechende Lautsprecher
in einem Lautsprecherarray, das sich nicht nur über die Seite eines Kinos beispielsweise erstreckt,
an der die Leinwand angeordnet ist, sondern das auch links, rechts
und hinter dem Zuhörerraum
angeordnet ist. Dieses „360°"-Lautsprecherarray wird natürlich eine
bessere Annäherung
an ein exaktes Wellenfeld schaffen als lediglich ein einseitiges
Array, beispielsweise vor den Zuschauern. Dennoch sind die Lautsprechersignale
für die
Lautsprecher, die sich vor den Zuschauern befinden, in beiden Fällen die
gleichen. Dies bedeutet, daß ein
Wellenfeldsynthesemodul typischerweise keine Rückkopplung dahingehend erhält, wie
viele Lautsprecher vorhanden sind bzw. ob es sich um ein einseitiges
oder mehrseitiges oder gar um ein 360°-Array handelt oder nicht. Anders
ausgedrückt
berechnet eine Wellenfeldsyntheseeinrichtung ein Lautsprechersignal für einen
Lautsprecher aufgrund der Position des Lautsprechers und unabhängig davon,
welche weiteren Lautsprecher noch vorhanden sind oder nicht vorhanden
sind.
-
Hierin
besteht zwar eine wesentliche Stärke des
Wellenfeldsynthesealgorithmus dahingehend, daß er optimal modular anpaßbar an
verschiedene Gegebenheiten ist, indem einfach die Koordinaten der
vorhandenen Lautsprecher in ganz unterschiedlichen Vorführräumen gegeben
sind. Nachteilig ist jedoch, daß neben
der unter Umständen
hinnehmbaren schlechteren Rekonstruktion des aktuellen Wellenfeldes
erhebliche Pegelartefakte entstehen. So ist für einen realen Eindruck nicht
nur entscheidend, in welcher Richtung sich die virtuelle Quelle
bezüglich des
Zuhörers
befindet, sondern auch wie laut der Zuhörer die virtuelle Quelle hört, also
welcher Pegel beim Zuhörer
aufgrund einer speziellen virtuellen Quelle „ankommt". Der bei einem Zuhörer ankommende Pegel, der auf
eine betrachtete virtuelle Quelle bezogen ist, ergibt sich aus der Überlagerung
der einzelnen Signale der Lautsprecher.
-
Wird
beispielsweise der Fall betrachtet, daß sich ein Lautsprecherarray
von 50 Lautsprechern vor dem Zuhörer
befindet, und daß das
Audiosignal der virtuellen Quelle durch die Wellenfeldsyntheseeinrichtung
in Komponentensignale für
die 50 Lautsprecher abgebildet wird, derart, daß das Audiosignal mit unterschiedlicher
Verzögerung
und unterschiedlicher Skalierung von den 50 Lautsprechern gleichzeitig
abgestrahlt wird, so empfindet ein Zuhörer der virtuellen Quelle einen
Pegel der Quelle, der sich aus den Einzelpegeln der Komponentensignale
der virtuellen Quelle in den einzelnen Lautsprechersignalen ergibt.
-
Wird
dieselbe Wellenfeldsyntheseeinrichtung nunmehr für ein reduziertes Array verwendet, bei
dem sich beispielsweise nur 10 Lautsprecher vor dem Zuhörer befinden,
so ist es ohne weiteres einsichtig, daß der Pegel des Signals von
der virtuellen Quelle, der sich am Ohr des Zuhörers ergibt, abgenommen hat,
da gewissermaßen
40 Komponentensignale der nunmehr fehlenden Lautsprecher „fehlen".
-
Es
kann auch der alternative Fall auftreten, bei dem sich z. B. zunächst links
und rechts des Zuhörers
Lautsprecher befinden, die in einer bestimmten Konstellation gegenphasig
angesteuert werden, so daß sich
die Lautsprechersignale von zwei gegenüberliegenden Lautsprechern
aufgrund einer bestimmten von der Wellenfeldsyntheseeinrichtung
berechneten Verzögerung
aufheben. Wird nunmehr in einem reduzierten System z. B. auf die
Lautsprecher auf der einen Seite des Zuhörers verzichtet, so erscheint
die virtuelle Quelle auf einmal wesentlich lauter als sie eigentlich
sein dürfte.
-
Während für statische
Quellen zur Pegelkorrektur noch an konstante Faktoren gedacht werden könnte, ist
diese Lösung
dann nicht mehr tragbar, wenn die virtuellen Quellen nicht statisch
sind, sondern sich bewegen. Dies ist gerade ein wesentliches Merkmal
der Wellenfeldsynthese, daß sie
auch und besonders sich bewegende virtuelle Quellen verarbeiten
kann. Eine Korrektur mit einem konstanten Faktor würde hier
zu kurz greifen, da der konstante Faktor zwar für eine Position stimmen würde, jedoch für eine andere
Position der virtuellen Quelle Artefakt-steigernd wirken würde.
-
Wellenfeldsyntheseeinrichtungen
sind ferner in der Lage, mehrere verschiedene Quellenarten nachzubilden.
Eine prominente Quellenform ist die Punktquelle, bei der der Pegel
proportional 1/r abnimmt, wobei r der Abstand zwischen einem Zuhörer und
der Position der virtuellen Quelle ist. Eine andere Quellenform
ist eine Quelle, die ebene Wellen aussendet. Hier bleibt der Pegel
unabhängig
von der Entfernung zum Hörer
konstant, da ebene Wellen durch Punktquellen erzeugt werden können, die
in einem unendlichen Abstand angeordnet sind.
-
Gemäß der Wellenfeldsynthesetheorie stimmt
bei zweidimensionalen Lautsprecheranordnungen die Pegeländerung
abhängig
von r bis auf einen vernachlässigbaren
Fehler mit der natürlichen Pegeländerung überein.
Je nach Position der Quelle können
sich jedoch unterschiedliche, zum Teil erhebliche Fehler im absoluten
Pegel ergeben, welche aus der Nutzung einer endlichen Anzahl von
Lautsprechern statt der theoretisch geforderten unendlichen Anzahl
von Lautsprechern resultiert, wie es vorstehend dargelegt worden
ist.
-
Die
Fachveröffentlichung
von de VRIES, D. und BOONE, M.M., "Wave field synthesis and analysis using
array technology",
in Proc. 1999 IEEE Workshop on Applications of Signal Processing
to Audio and Acoustics, New Paltz, New York, Oct. 17-20, 1999, die
Fachveröffentlichung
von BOONE, Marius M. u.a., "Spatial
Sound-Field Reproduction by Wave-Field
Synthesis", in J.
Audio Soc., Vol. 43, No. 12, 1995, und die Fachveröffentlichung
von de VRIES, Diemer: Sound Reinforcement by Wavefield Synthesis, "Adaption of the Synthesis
Operator to the Loudspeaker Directivity Characteristics", in J. Audio Eng.
Soc., Vo. 44, No. 12, 1996, beziehen sich auf die Anwendung der
räumlichen
Schallfeldreproduktion mit der Wellenfeldsynthese und offenbaren Grundlagen
hierzu.
-
Die
Aufgabe der vorliegenden Erfindung besteht darin, ein Konzept zur
Pegel-Korrektur für
Wellenfeldsynthesesysteme zu schaffen, das für bewegliche Quellen geeignet
ist.
-
Diese
Aufgabe wird durch eine Vorrichtung gemäß Patentanspruch 1 und ein
Verfahren gemäß Patentanspruch
17 gelöst.
-
Der
vorliegenden Erfindung liegt die Erkenntnis zugrunde, daß die Unzulänglichkeiten
eines Wellenfeldsynthesesystems mit einer (praktisch realisierbaren)
endlichen Anzahl von Lautsprechern dahingehend zumindest abgemildert
werden können,
wenn eine Pegel-Korrektur durchgeführt wird, dahingehend, daß entweder
das einer virtuellen Quelle zugeordnete Audiosignal vor der Wellenfeldsynthese
oder die Komponentensignale für
verschiedene Lautsprecher, die auf eine virtuelle Quelle zurückgehen,
nach der Wellenfeldsynthese unter Verwendung eines Korrekturwerts
manipuliert werden, um eine Abweichung zwischen einem Soll-Amplitudenzustand
in einem Vorführbereich
und einem Ist-Amplitudenzustand in dem Vorführbereich zu reduzieren. Der
Soll-Amplitudenzustand ergibt sich dadurch, daß abhängig von der Position der virtuellen
Quelle, und z. B. abhängig von
einem Abstand eines Zuhörers
bzw. eines optimalen Punkts in einem Vorführbereich zu der virtuellen
Quelle und gegebenenfalls unter Berücksichtigung der Wellenart
ein Soll-Pegel als Beispiel für
einen Soll-Amplitudenzustand ermittelt wird, und daß ferner
ein Ist-Pegel als Beispiel für
einen Ist-Amplitudenzustand
beim Hörer
ermittelt wird. Während
der Soll-Amplitudenzustand unabhängig
von der tatsächlichen
Gruppierung und Art der Einzellautsprecher lediglich auf der Basis
der virtuellen Quelle bzw. deren Position ermittelt wird, wird die
Ist-Situation unter Berücksichtigung der
Positionierung, Art und Ansteuerung der Einzellautsprecher des Lautsprecherarrays berechnet.
-
So
kann bei einem Ausführungsbeispiel
der vorliegenden Erfindung der Schallpegel am Ohr des Hörers im
optimalen Punkt innerhalb des Vorführbereichs aufgrund eines Komponentensignale
der virtuellen Quelle, das über
einen Einzellautsprecher abgestrahlt wird, ermittelt werden. Entsprechend
kann für
die anderen Komponentensignale, die auf die virtuelle Quelle zurückgehen
und über
andere Lautsprecher abgestrahlt werden, ebenfalls der Pegel am Ohr
des Hörers
im optimalen Punkt innerhalb des Vorführbereichs ermittelt werden,
um dann durch Zusammenfassung dieser Pegel den tatsächlichen Ist-Pegel
am Ohr des Hörers
zu erhalten. Hierzu kann die Übertragungsfunktion
jedes einzelnen Lautsprechers sowie der Pegel des Signals an dem
Lautsprecher und der Abstand des Zuhörers im betrachteten Punkt
innerhalb des Vorführbereichs
zu dem einzelnen Lautsprecher berücksichtigt werden. Für einfachere
Ausführungen
kann die Sendecharakteristik des Lautsprechers dahingehend angenommen werden,
daß er
als ideale Punktquelle arbeitet. Für aufwendigere Implementierungen
kann jedoch auch die Richtcharakteristik des einzelnen Lautsprechers berücksichtigt
werden.
-
Ein
wesentlicher Vorteil des erfindungsgemäßen Konzepts besteht darin,
daß bei
einem Ausführungsbeispiel,
bei dem Schallpegel betrachtet werden, lediglich multiplikative
Skalierungen auftreten, dahingehend, daß für einen Quotient zwischen dem
Soll-Pegel und dem Ist-Pegel, der den Korrekturwert ergibt, nicht
der absolute Pegel beim Zuhörer oder
der absolute Pegel der virtuellen Quelle erforderlich ist. Statt
dessen hängt
der Korrekturfaktor lediglich von der Position der virtuellen Quelle
(und damit von den Positionen der Einzellautsprecher) sowie des
optimalen Punkts innerhalb des Vorführbereichs ab. Diese Größen sind
jedoch im Hinblick auf die Position des optimalen Punkts und die
Positionen und Übertragungscharakteristika
der einzelnen Lautsprecher fest vorgegeben und nicht von einem abgespielten
Stück abhängig.
-
Daher
kann das erfindungsgemäße Konzept rechenzeiteffizient
als Nachschlagtabelle implementiert werden, dahingehend, daß eine Nachschlagtabelle
erzeugt und verwendet wird, die Position-Korrekturfaktor-Wertepaare
umfaßt,
und zwar für
sämtliche
oder einen wesentlichen Teil von möglichen virtuellen Positionen.
In diesem Fall ist dann kein On-line-Sollwertermittlungs-, Istwertermittlungs-
und Sollwert/Istwert-Vergleichsalgorithmus durchzuführen. Auf
diese unter Umständen
rechenzeitaufwändigen
Algorithmen kann verzichtet werden, wenn auf der Basis einer Position
einer virtuellen Quelle auf die Nachschlagtabelle zugegriffen wird,
um von dort den für
diese Position der virtuellen Quelle gültigen Korrekturfaktor zu ermitteln.
Um die Rechen- und Speicher-Effizienz noch weiter zu steigern, wird
es bevorzugt, lediglich relativ grob gerasterte Stützwert-Paare für Positionen
und zugeordnete Korrekturfaktoren in der Tabelle abzuspeichern und
Korrekturfaktoren für Positionswerte,
die zwischen zwei Stützwerten
liegen, einseitig, zweiseitig, linear, kubisch etc. zu interpolieren.
-
Alternativ
kann es ferner in dem einen oder anderen Fall sinnvoll sein, einen
empirischen Ansatz zu verwenden, dahingehend, daß Pegelmessungen durchgeführt werden.
In einem solchen Fall würde eine
virtuelle Quelle mit einem bestimmten Kalibrierungspegel an einer
bestimmten virtuellen Position plaziert werden. Dann würde für ein reales
Wellenfeldsynthesesystem ein Wellenfeldsynthesemodul die Lautsprechersignale
für die
einzelnen Lautsprecher berechnen, um schließlich am Hörer den tatsächlich aufgrund
der virtuellen Quelle ankommenden Pegel zu messen. Ein Korrekturfaktor
würde dann
dahingehend bestimmt, daß er
die Abweichung vom Sollpegel zum Istpegel zumindest reduziert oder vorzugsweise
zu 0 bringt. Dieser Korrekturfaktor würde dann in der Nachschlagtabelle
in Zuordnung zu der Position der virtuellen Quelle abgespeichert
werden, um so nach und nach, also für viele Positionen der virtuellen
Quelle, für
ein bestimmtes Wellenfeldsynthesesystem in einem speziellen Vorführraum die gesamte
Nachschlagtabelle zu erzeugen.
-
Zur
Manipulation auf der Basis des Korrekturfaktors existieren mehrere
Möglichkeiten.
Bei einer Ausführungsform
wird es bevorzugt, das Audiosignal der virtuellen Quelle, wie es
beispielsweise in einem Audiotrack, der aus einem Tonstudio kommt, aufgezeichnet
ist, mit dem Korrekturfaktor zu manipulieren, um dann erst das manipulierte
Signal in ein Wellenfeldsynthesemodul einzuspeisen. Dies führt gewissermaßen automatisch
dazu, daß somit
alle Komponentensignale, die auf diese manipulierte virtuelle Quelle
zurückgehen,
ebenfalls entsprechend gewichtet sind, und zwar im Vergleich zu
dem Fall, bei dem keine Korrektur gemäß der vorliegenden Erfindung
vorgenommen worden ist.
-
Alternativ
kann es für
bestimmte Anwendungsfälle
auch günstig
sein, nicht auf das Ursprungs-Audiosignal der virtuellen Quelle
einzugreifen, sondern in die durch das Wellenfeldsynthesemodul erzeugten
Komponentensignale einzugreifen, um diese Komponentensignale alle
vorzugsweise mit demselben Korrekturfaktor zu manipulieren. An dieser
Stelle sei darauf hingewiesen, daß der Korrekturfaktor nicht
unbedingt identisch für
alle Komponentensignale sein muß.
Dies wird jedoch in weiten Teilen bevorzugt, um nicht die relative
Skalierung der Komponentensignale zueinander, die zur Rekonstruktion
der tatsächlichen
Wellensituation erforderlich ist, zu stark zu beeinträchtigen.
-
Ein
Vorteil der vorliegenden Erfindung besteht darin, daß mit relativ
einfachen Maßnahmen
zumindest während
des Betriebs eine Pegelkorrektur dahingehend vorgenommen werden
kann, daß der Zuhörer zumindest
im Hinblick auf die von ihm wahrgenommene Lautstärke einer virtuellen Quelle
nichts davon merkt, daß nicht
die eigentlich erforderlichen unendlich vielen Lautsprecher vorhanden
sind, sondern lediglich eine begrenzte Menge an Lautsprechern.
-
Ein
weiterer Vorteil der vorliegenden Erfindung besteht darin, daß auch dann,
wenn sich eine virtuelle Quelle in einem bezüglich des Zuschauers gleichbleibenden
Abstand (z. B. von links nach rechts) bewegt, diese Quelle für den Zuschauer,
der beispielsweise in der Mitte vor der Leinwand sitzt, immer gleich
laut ist und nicht einmal lauter und einmal leiser ist, was ohne
Korrektur der Fall sein würde.
-
Ein
weiterer Vorteil der vorliegenden Erfindung besteht darin, daß sie die
Option dahingehend liefert, preisgünstigere Wellenfeldsynthesesysteme mit
einer geringeren Anzahl von Lautsprechern anzubieten, die dennoch
insbesondere bei sich bewegenden Quellen keine Pegelartefakte mit
sich bringen, also für
einen Zuhörer
im Hinblick auf die Pegelproblematik genau so gut wirken wie aufwendigere
Wellenfeldsynthesesysteme mit einer hohen Anzahl an Lautsprechern.
Auch für
Löcher
im Array können eventuell
zu niedrige Pegel erfindungsgemäß korrigiert
werden.
-
Bevorzugte
Ausführungsbeispiele
der vorliegenden Erfindung werden nachfolgend Bezug nehmend auf
die beiliegenden Zeichnungen detailliert erläutert. Es zeigen:
-
1 ein
Blockschaltbild der erfindungsgemäßen Vorrichtung zum Pegel-Korrigieren
in einem Wellenfeldsynthesesystem;
-
2 ein
Prinzipschaltbild einer Wellenfeldsyntheseumgebung, wie sie für die vorliegende
Erfindung einsetzbar ist;
-
3 eine
detailliertere Darstellung des in 2 gezeigten
Wellenfeldsynthesemoduls;
-
4 ein
Blockschaltbild einer erfindungsgemäßen Einrichtung zum Ermitteln
des Korrekturwerts gemäß einem
Ausführungsbeispiel
mit Nachschlagtabelle und gegebenenfalls Interpolationseinrichtung;
-
5 ein
weiteres Ausführungsbeispiel
der Einrichtung zum Ermitteln von 1 mit Sollwert/Istwert-Ermittlung und anschließendem Vergleich;
-
6a ein
Blockschaltbild eines Wellenfeldsynthesemoduls mit eingebetteter
Manipulationseinrichtung zur Manipulation der Komponentensignale;
-
6b ein
Blockschaltbild eines weiteren Ausführungsbeispiels der vorliegenden
Erfindung mit einer vorgeschalteten Manipulationseinrichtung;
-
7a eine
Skizze zur Erläuterung
des Soll-Amplitudenzustands
an einem Optimal-Punkt in einem Vorführbereich;
-
7b eine
Skizze zur Erläuterung
des Ist-Amplitudenzustands
an einem Optimal-Punkt in dem Vorführbereich; und
-
8 ein
prinzipielles Blockschaltbild eines Wellenfeldsynthesesystems mit
Wellenfeldsynthesemodul und Lautsprecherarray in einem Vorführbereich.
-
Bevor
detailliert auf die vorliegende Erfindung eingegangen wird, wird
nachfolgend anhand von 8 der prinzipielle Aufbau eines
Wellenfeldsynthesesystems dargestellt. Das Wellenfeldsynthesesystem
hat ein Lautsprecherarray 800, das bezüglich eines Vorführbereichs 802 plaziert
ist. Im einzelnen umfaßt
das in 8 gezeigte Lautsprecherarray, das ein 360°-Array ist,
vier Arrayseiten 800a, 800b, 800c und 800d.
Ist der Vorführbereich 802 z.
B. ein Kinosaal, so wird bezüglich
der Konventionen vorne/hinten oder rechts/links davon ausgegangen,
daß sich
die Kinoleinwand auf derselben Seite des Vorführbereichs 802 befindet,
an der auch das Teil-Array 800c angeordnet ist. In diesem
Fall würde
der Betrachter, der an dem hier so genannten Optimal-Punkt P in dem Vorführbereich 802 sitzt,
nach vorne, also auf die Leinwand, sehen. Hinter dem Zuschauer würde sich
dann das Teil-Array 800a befinden, während sich links vom Zuschauer
das Teil-Array 800d befinden würde, und während sich rechts vom Zuschauer
das Teil-Array 800b befinden würde. Jedes Lautsprecherarray
besteht aus einer Anzahl von verschiedenen Einzellautsprechern 808,
die jeweils mit eigenen Lautsprechersignalen angesteuert werden,
die von einem Wellenfeldsynthesemodul 810 über einen
in 8 lediglich schematisch gezeigten Datenbus 812 bereitgestellt
werden. Das Wellenfeldsynthesemodul ist ausgebildet, um unter Verwendung
der Informationen über
z. B. Art und Lage der Lautsprecher bezüglich des Vorführbereichs 802,
also von Lautsprecher-Informationen (LS-Infos), und gegebenenfalls
mit sonstigen Inputs Lautsprechersignale für die einzelnen Lautsprecher 808 zu
berechnen, die jeweils von den Audiotracks für virtuelle Quellen, denen
ferner Positionsinformationen zugeordnet sind, gemäß den bekannten
Wellenfeldsynthesealgorithmen abgeleitet werden. Das Wellenfeldsynthesemodul
kann ferner noch weitere Eingaben erhalten, wie beispielsweise Informationen über die
Raumakustik des Vorführbereichs
etc.
-
Die
nachfolgenden Ausführungen
zur vorliegenden Erfindung können
prinzipiell für
jeden Punkt P in dem Vorführbereich
durchgeführt
werden. Der Optimal-Punkt kann somit an jeder beliebigen Stelle im
Vorführbereich 802 liegen.
Es kann auch mehrere Optimal-Punkte, z. B. auf einer Optimal-Linie,
geben. Um jedoch möglichst
gute Verhältnisse
für möglichst viele
Punkte im Vorführbereich 802 zu
erhalten, wird es bevorzugt, den Optimal-Punkt bzw. die Optimal-Linie
in der Mitte bzw. am Schwerpunkt des Wellenfeldsynthesesystems,
das durch die Lautsprecher-Teilarrays 800a, 800b, 800c, 800d definiert
ist, anzunehmen.
-
Eine
detailliertere Darstellung des Wellenfeldsynthesemoduls 800 wird
nachfolgend anhand der 2 und 3 Bezug
nehmend auf das Wellenfeldsynthesemodul 200 in 2 bzw.
auf die in 3 detailliert dargestellte Anordnung
gegeben.
-
2 zeigt
eine Wellenfeldsyntheseumgebung, in der die vorliegende Erfindung
implementiert werden kann. Zentrum einer Wellenfeldsyntheseumgebung
ist ein Wellenfeldsynthesemodul 200, das diverse Eingänge 202, 204, 206 und 208 sowie
diverse Ausgänge 210, 212, 214, 216 umfaßt. Über Eingänge 202 bis 204 werden
dem Wellenfeldsynthesemodul verschieden Audiosignale für virtuelle
Quellen zugeführt.
So empfängt
der Eingang 202 z. B. ein Audiosignal der virtuellen Quelle
1 sowie zugeordnete Positionsinformationen der virtuellen Quelle.
In einem Kinosetting beispielsweise wäre das Audiosignal 1 z. B.
die Sprache eines Schauspielers, der sich von einer linken Seite
der Leinwand zu einer rechten Seite der Leinwand und möglicherweise
zusätzlich
noch vom Zuschauer weg bzw. zum Zuschauer hin bewegt. Das Audiosignal
1 wäre
dann die tatsächliche Sprache
dieses Schauspielers, während
die Positionsinformationen als Funktion der Zeit die zu einem bestimmten
Zeitpunkt aktuelle Position des ersten Schauspielers im Aufnahmesetting
darstellt. Dagegen wäre
das Audiosignal n die Sprache beispielsweise eines weiteren Schauspielers,
der sich gleich oder anders als der erste Schauspieler bewegt. Die aktuelle
Position des anderen Schauspielers, dem das Audiosignal n zugeordnet
ist, wird durch mit dem Audiosignal n synchronisierte Positionsinformationen dem
Wellenfeldsynthesemodul 200 mitgeteilt. In der Praxis existieren
verschiedene virtuelle Quellen je nach Aufnahmesetting, wobei das
Audiosignal jeder virtuellen Quelle als eigener Audiotrack dem Wellenfeldsynthesemodul 200 zugeführt wird.
-
Wie
es vorstehend dargelegt worden ist, speist ein Wellenfeldsynthesemodul
eine Vielzahl von Lautsprechern LS1, LS2, LS3, LSm durch Ausgabe
von Lautsprechersignalen über
die Ausgänge 210 bis 216 zu
den einzelnen Lautsprechern. Dem Wellenfeldsynthesemodul 200 werden über den
Eingang 206 die Positionen der einzelnen Lautsprecher in
einem Wiedergabesetting, wie beispielsweise einem Kinosaal mitgeteilt.
Im Kinosaal befinden sich um den Kinozuschauer herum gruppiert viele
einzelne Lautsprecher, die in Arrays vorzugsweise derart angeordnet
sind, daß sich
sowohl vor dem Zuschauer, also beispielsweise hinter der Leinwand,
als auch hinter dem Zuschauer sowie rechts und links des Zuschauers
Lautsprecher befinden. Ferner können
dem Wellenfeldsynthesemodul 200 noch sonstige Eingaben
mitgeteilt werden, wie beispielsweise Informationen über die
Raumakustik etc., um in einem Kinosaal die tatsächliche während des Aufnahmesettings
herrschende Raumakustik simulieren zu können.
-
Allgemein
gesagt wird das Lautsprechersignal, das beispielsweise dem Lautsprecher
LS1 über den
Ausgang 210 zugeführt
wird, eine Überlagerung von
Komponentensignalen der virtuellen Quellen sein, dahingehend, daß das Lautsprechersignal
für den
Lautsprecher LS1 eine erste Komponente, die auf die virtuelle Quelle
1 zurückgeht,
eine zweite Komponente, die auf die virtuelle Quelle 2 zurückgeht,
sowie eine n-te Komponente, die auf die virtuelle Quelle n zurückgeht,
umfassen. Die einzelnen Komponentensignale werden linear superponiert, also
nach ihrer Berechnung addiert, um die linerare Superposition am
Ohr des Zuhörers
nachzubilden, der in einem realen Setting eine lineare Überlagerung der
von ihm wahrnehmbaren Schallquellen hören wird.
-
Nachfolgend
wird Bezug nehmend auf 3 eine detailliertere Ausgestaltung
des Wellenfeldsynthesemoduls 200 dargelegt. Das Wellenfeldsynthesemodul 200 hat
einen stark parallelen Aufbau dahingehend, daß ausgehend von dem Audiosignal
für jede
virtuelle Quelle und ausgehend von den Positionsinformationen für die entsprechende
virtuelle Quelle zunächst
Verzögerungsinformationen
Vi sowie Skalierungsfaktoren SFi berechnet
werden, die von den Positionsinformationen und der Position des gerade
betrachteten Lautspre chers, z. B. dem Lautsprecher mit der Ordnungsnummer
j, also LSj, abhängen.
Die Berechnung einer Verzögerungsinformation
Vi sowie eines Skalierungsfaktors SFi aufgrund der Positionsinformationen einer
virtuellen Quelle und der Lage des betrachteten Lautsprechers j
geschieht durch bekannte Algorithmen, die in Einrichtungen 300, 302, 304, 306 implementiert
sind. Auf der Basis der Verzögerungsinformationen
Vi(t) und SFi(t)
sowie auf der Basis des der einzelnen virtuellen Quelle zugeordneten
Audiosignals ASi(t) wird für einen
aktuellen Zeitpunkt tA ein diskreter Wert
AWi(tA) für das Komponentensignal
Kij in einem letztendlich erhaltenen Lautsprechersignal
berechnet. Dies erfolgt durch Einrichtungen, 310, 312, 314, 316,
wie sie in 3 schematisch dargestellt sind. 3 zeigt ferner
gewissermaßen
eine „Blitzlichtaufnahme" zum Zeitpunkt tA für
die einzelnen Komponentensignale. Die einzelnen Komponentensignale
werden dann durch einen Summierer 320 summiert, um den
diskreten Wert für
den aktuellen Zeitpunkt tA des Lautsprechersignals
für den
Lautsprecher j zu ermitteln, der dann für den Ausgang (beispielsweise
der Ausgang 214, wenn der Lautsprecher j der Lautsprecher LS3
ist), dem Lautsprecher zugeführt
werden kann.
-
Wie
es aus 3 ersichtlich ist, wird zunächst für jede virtuelle Quelle einzeln
ein aufgrund einer Verzögerung
und einer Skalierung mit einem Skalierungsfaktor zu einem aktuellen
Zeitpunkt gültiger
Wert berechnet, wonach sämtliche
Komponentensignale für
einen Lautsprecher aufgrund der verschiedenen virtuellen Quellen
summiert werden. Wäre
beispielsweise nur eine virtuelle Quelle vorhanden, so würde der
Summierer entfallen, und das am Ausgang des Summierers in 3 anliegende
Signal würde
z. B. dem Signal entsprechen, das von der Einrichtung 310 ausgegeben
wird, wenn die virtuelle Quelle 1 die einzige virtuelle Quelle ist.
-
An
dieser Stelle sei darauf hingewiesen, daß an dem Ausgang 322 von 3 der
Wert eines Lautsprechersignals erhalten wird, das eine Überlagerung
der Komponentensignale für
die sen Lautsprecher aufgrund der verschiedenen virtuellen Quellen 1,
2, 3, ..., n ist. Eine Anordnung, wie sie in 3 gezeigt
ist, wäre
prinzipiell für
jeden Lautsprecher 808 im Wellenfeldsynthesemodul 810 vorgesehen,
es sei denn, daß,
was aus praktischen Gründen
bevorzugt wird, immer z. B. 2, 4 oder 8 zusammenliegende Lautsprecher
mit demselben Lautsprechersignal angesteuert werden.
-
1 zeigt
ein Blockschaltbild der erfindungsgemäßen Vorrichtung zum Pegel-Korrigieren in
einem Wellenfeldsynthesesystem, das Bezug nehmend auf 8 dargelegt
worden ist. Das Wellenfeldsynthesesystem umfaßt das Wellenfeldsynthesemodul 810 sowie
das Lautsprecherarray 800 zur Schallversorgung des Vorführbereichs 802,
wobei das Wellenfeldsynthesemodul 810 ausgebildet ist, um
ein einer virtuellen Schallquelle zugeordnetes Audiosignal sowie
der virtuellen Schallquelle zugeordnete Quellenpositionsinformationen
zu empfangen und unter Berücksichtigung
von Lautsprecher-Positionsinformationen
Komponentensignale für
die Lautsprecher aufgrund der virtuellen Quelle zu berechnen. Die
erfindungsgemäße Vorrichtung
umfaßt
zunächst
eine Einrichtung 100 zum Ermitteln eines Korrekturwerts,
der auf einem Soll-Amplitudenzustand
in dem Vorführbereich
basiert, wobei der Soll-Amplitudenzustand von einer Position der
virtuellen Quelle oder einer Art der virtuellen Quelle abhängt, und
wobei der Korrekturwert ferner auf einem Ist-Amplitudenzustand in dem Vorführbereich
basiert, der von den Komponentensignalen für die Lautsprecher aufgrund
der virtuellen Quelle abhängt.
-
Die
Einrichtung 100 hat einen Eingang 102 zum Erhalten
einer Position der virtuellen Quelle, wenn sie z. B. eine Punktquellencharakteristik
hat, oder zum Erhalten von Informationen über eine Art der Quelle, wenn
die Quelle z. B. eine Quelle zur Erzeugung von ebenen Wellen ist.
In diesem Fall ist der Abstand des Zuhörers von der Quelle zur Bestimmung
des Ist-Zustands nicht nötig,
da sich die Quelle aufgrund der erzeugten ebenen Wellen im Modell
gedacht oh nehin unendlich weit entfernt von dem Hörer befindet
und einen positionsunabhängigen
Pegel hat. Die Einrichtung 100 ist ausgebildet, um ausgangsseitig
einen Korrekturwert 104 auszugeben, der einer Einrichtung 106 zum
Manipulieren eines der virtuellen Quelle zugeordneten Audiosignals
(das über
einen Eingang 108 erhalten wird) oder zum Manipulieren
von Komponentensignalen für
die Lautsprecher aufgrund einer virtuellen Quelle (die über einen
Eingang 110 erhalten werden), zu manipulieren. Falls die
Alternative des Manipulierens des Audiosignals, das über den
Eingang 108 bereitgestellt wird, durchgeführt wird,
ergibt sich an einem Ausgang 112 ein manipuliertes Audiosignal,
das dann erfindungsgemäß statt
des ursprünglichen
Audiosignals, das am Eingang 108 bereitgestellt wird, in
das Wellenfeldsynthesemodul 200 eingespeist wird, um die
einzelnen Lautsprechersignale 210, 212, ..., 216 zu
erzeugen.
-
Wurde
dagegen die andere Alternative zum Manipulieren verwendet, nämlich die
gewissermaßen
eingebettete Manipulation der Komponentensignale, die über den
Eingang 110 erhalten worden sind, so werden ausgangsseitig
manipulierte Komponentensignale erhalten, die noch Lautsprecher-weise aufsummiert
werden müssen
(Einrichtung 116), und zwar mit gegebenenfalls manipulierten
Komponentensignalen von anderen virtuellen Quellen, die über weitere
Eingänge 118 bereitgestellt
werden. Ausgangsseitig liefert die Einrichtung 116 wieder
die Lautsprechersignale 210, 212, ..., 216.
Es sei darauf hingewiesen, daß die
in 1 gezeigten Alternativen der vorgeschalteten Manipulation
(Ausgang 112) oder der eingebetteten Manipulation (Ausgang 114) alternativ
zueinander verwendet werden können.
Je nach Ausführungsform
kann es jedoch auch Fälle
geben, in denen der Gewichtungsfaktor bzw. Korrekturwert, der über den
Eingang 104 in die Einrichtung 106 bereitgestellt
wird, gewissermaßen
gesplittet wird, so daß teilweise
eine vorgeschaltete Manipulation und teilweise eine eingebettete
Manipulation durchgeführt
wird.
-
Im
Hinblick auf 3 würde die vorgeschaltete Manipulation
somit darin bestehen, daß das
Audiosignal der virtuellen Quelle, das in eine Einrichtung 310, 312, 314 bzw. 316 eingespeist
wird, vor seiner Einspeisung manipuliert wird. Die eingebettete Manipulation
würde dagegen
darin bestehen, daß die von
den Einrichtungen 310, 312, 314 bzw. 316 ausgegebenen
Komponentensignale vor ihrer Summation, um tatsächliche Lautsprechersignal
zu erhalten, manipuliert werden.
-
Diese
beiden Möglichkeiten,
die entweder alternativ oder kumulativ verwendbar sind, sind in
den 6a und 6b dargestellt.
So zeigt 6a die eingebettete Manipulation
durch die Manipulationseinrichtung 106, die in 6a als
Multiplizierer gezeichnet ist. Eine Wellenfeldsyntheseeinrichtung, die
beispielsweise aus den Blöcken 300, 310 bzw. 302, 312,
bzw. 304, 314 und 306 bzw. 316 von 3 besteht,
liefert die Komponentensignale K11, K12, K13 für den Lautsprecher
LS1 bzw. die Komponentensignale Kn1, Kn2 und Kn3 für den Lautsprecher
LSn.
-
In
der in 6a gewählten Notation zeigt der erste
Index von Kij den Lautsprecher an, und zeigt
der zweite Index die virtuelle Quelle an, von der das Komponentensignal
stammt. Die virtuelle Quelle 1 beispielsweise äußert sich in dem Komponentensignal
K11, ..., Kn1. Um
den Pegel der virtuellen Quelle 1 abhängig von den Positionsinformationen
der virtuellen Quelle 1 (ohne Beeinflussung der Pegel der anderen
virtuellen Quellen) selektiv zu beeinflussen, wird bei der in 6a gezeigten
eingebetteten Manipulation eine Multiplikation der Komponentensignale, die
zu der Quelle 1 gehören,
also der Komponentensignale, deren Index j auf die virtuelle Quelle
1 hinweist, mit dem Korrekturfaktor F1 stattfinden.
Um eine entsprechende Amplituden- bzw. Pegelkorrektur für die virtuelle
Quelle 2 durchzuführen,
werden sämtliche
Komponentensignale, die auf die virtuelle Quelle 2 zurückgehen,
mit einem hierfür
bestimmten Korrekturfaktor F2 multipliziert.
Schließlich
werden auch die Komponenten signale, die auf die virtuelle Quelle
3 zurückgehen,
durch einen entsprechenden Korrekturfaktor F3 gewichtet.
-
Es
sei darauf hingewiesen, daß die
Korrekturfaktoren F1, F2 und
F3, wenn alle sonstigen geometrischen Parameter
gleich sind, lediglich von der Position der entsprechenden virtuellen
Quelle abhängen.
Würden
somit alle drei virtuellen Quellen z. B. Punktquellen (also gleicher
Art) sein und an derselben Position sein, so wäre die Korrekturfaktoren für die Quellen
identisch. Diese Gesetzmäßigkeit
wird noch Bezug nehmend auf 4 näher erläutert, da es
zur Rechenzeitvereinfachung möglich
ist, eine Nachschlagtabelle mit Positionsinformationen und jeweils
zugeordneten Korrekturfaktoren zu verwenden, die zwar irgendwann
erstellt werden muß,
auf die jedoch im Betrieb schnell zugegriffen werden kann, ohne
daß im
Betrieb ständig
eine Sollwert/Istwert-Berechnungs-
und Vergleichs-Operation durchgeführt werden muß, was jedoch
prinzipiell ebenfalls möglich ist.
-
6b zeigt
die erfindungsgemäße Alternative
zur Quellenmanipulation. Die Manipulationseinrichtung ist hier der
Wellenfeldsyntheseeinrichtung vorgeschaltet und ist wirksam, um
die Audiosignale der Quellen mit den entsprechenden Korrekturfaktoren
zu korrigieren, um manipulierte Audiosignale für die virtuellen Quellen zu
erhalten, die dann der Wellenfeldsyntheseeinrichtung zugeführt werden,
um die Komponentensignale zu erhalten, die dann von den jeweiligen
Komponentensummationseinrichtungen aufsummiert werden, um die Lautsprechersignale
LS für
die entsprechenden Lautsprecher, wie beispielsweise den Lautsprecher
LSi, zu erhalten.
-
Bei
einem bevorzugten Ausführungsbeispiel der
vorliegenden Erfindung ist die Einrichtung 100 zum Ermitteln
des Korrekturwerts als Nachschlagtabelle 400 ausgebildet,
die Position-Korrekturfaktor-Wertepaare speichert. Die Einrichtung 100 ist
vorzugsweise ferner mit einer Interpolationseinrichtung 402 versehen,
um einerseits die Tabellengröße der Nachschlagtabelle 400 in
einem begrenzten Rahmen zu halten, und um andererseits auch für aktuelle
Positionen einer virtuellen Quelle, die über einen Eingang 404 in
die Interpolationseinrichtung eingespeist werden, zumindest unter
Verwendung einer oder mehrerer benachbarter in der Nachschlagtabelle
gespeicherten Position-Korrekturfaktor-Wertepaare, die der Interpolationseinrichtung 402 über eine
Eingang 406 zugeführt
werden, einen interpolierten aktuellen Korrekturfaktor an einem
Ausgang 408 zu erzeugen. Bei einer einfacheren Version
kann die Interpolationseinrichtung 402 jedoch auch weggelassen
werden, so daß die
Einrichtung 100 zum Ermitteln von 1 einen
direkten Zugriff unter Verwendung von an einem Eingang 410 zugeführten Positionsinformationen
auf die Nachschlagtabelle durchführt
und an einem Ausgang 412 einen entsprechenden Korrekturfaktor
liefert. Entsprechen die aktuellen Positionsinformationen, die dem
Audiotrack der virtuellen Quelle zugeordnet sind, nicht genau einer
Positionsinformation, die in der Nachschlagtabelle zu finden ist,
so kann der Nachschlagtabelle noch eine einfache Abrundungs-/Aufrundungs-Funktion
zugeordnet sein, um den nächstliegenden
in der Tabelle gespeicherten Stützwert
statt des aktuellen Stützwerts
zu nehmen.
-
An
dieser Stelle sei darauf hingewiesen, dass für verschiedene Quellenarten
verschiedene Tabellen angelegt werden können, oder dass einer Position
nicht nur ein Korrekturfaktor zugeordnet ist, sondern mehrere Korrekturfaktoren,
wobei jeder Korrekturfaktor mit einer Quellenart verknüpft ist.
-
Alternativ
kann statt der Nachschlagtabelle oder zur „Auffüllung" der Nachschlagtabelle in 4 die
Einrichtung zum Ermitteln ausgebildet sein, um tatsächlich einen
Sollwert-Istwert-Vergleich durchzuführen. In diesem Fall umfaßt die Einrichtung 100 von 1 eine
Soll-Amplituden-Zustandsermittlungseinrichtung 500 sowie
eine Ist-Amplituden-Zustandsermittlungseinrichtung 502,
um einen Soll-Amplitudenzustand 504 sowie einen Ist-Amplitudenzustand 506 zu
liefern, die einer Vergleichsein richtung 508 zugeführt werden,
die beispielsweise einen Quotienten aus dem Soll-Amplitudenzustand 504 und
dem Ist-Amplitudenzustand 506 berechnet,
um einen Korrekturfaktor 510 zu erzeugen, der der Einrichtung 106 zum
Manipulieren, die in 1 gezeigt ist, zur weiteren
Verwendung zugeführt
wird. Alternativ kann der Korrekturwert auch in einer Nachschlagtabelle
abgespeichert werden.
-
Die
Soll-Amplituden-Zustandsberechnung ist ausgebildet, um einen Soll-Pegel
am Optimal-Punkt für
eine an einer bestimmten Position bzw. in einer bestimmten Art ausgestaltete
virtuelle Quelle zu ermitteln. Für
die Soll-Amplitudenzustandsberechnung benötigt die
Soll-Amplitudenzustandsermittlungseinrichtung 500 selbstverständliche
keine Komponentensignale, da der Soll-Amplitudenzustand von den Komponentensignalen
unabhängig
ist. Komponentensignale werden jedoch, wie es aus 5 ersichtlich
ist, der Ist-Amplitudenermittlungseinrichtung 502 zugeführt, die
ferner je nach Ausführungsform
auch noch Informationen über
die Lautsprecherpositionen sowie Informationen über Lautsprecher-Übertragungsfunktionen
und/oder Informationen über Richtcharakteristika
der Lautsprecher erhalten kann, um eine Ist-Situation so gut als
möglich
zu ermitteln. Alternativ kann die Ist-Amplitudenzustandsermittlungseinrichtung 502 auch
als tatsächliches
Meßsystem
ausgebildet sein, um eine Ist-Pegelsituation
an dem Optimal-Punkt für
bestimmte virtuelle Quellen an bestimmten Positionen zu ermitteln.
-
Nachfolgend
wird Bezug nehmend auf 7a und 7b auf
den Ist-Amplitudenzustand bzw. den Soll-Amplitudenzustand Bezug
genommen. 7a zeigt ein Diagramm zum Ermitteln
eines Soll-Amplitudenzustands an einem vorbestimmten Punkt, der
in 7a mit „Optimal-Punkt" bezeichnet ist,
und der im Vorführbereich 802 von 8 liegt.
In 7a ist lediglich beispielhaft eine virtuelle Quelle 700 als
Punktquelle eingezeichnet, die ein Schallfeld mit konzentrischen
Wellenfronten erzeugt. Ferner ist aufgrund des Audiosignals für die virtuelle
Quelle 700 der Pegel Lv der virtuellen
Quelle 700 bekannt. Der Soll-Amplitudenzustand bzw. dann,
wenn der Amplitudenzustand ein Pegelzustand ist, der Soll-Pegel an dem Punkt
P im Vorführbereich
wird ohne weiteres dadurch erhalten, daß der Pegel LP am
Punkt P gleich dem Quotienten aus Lv und
einem Abstand r ist, den der Punkt P zu der virtuellen Quelle 700 hat. Der
Soll-Amplitudenzustand
kann somit ohne weiteres durch Berechnung des Pegels Lv der
virtuellen Quelle und durch Berechnung des Abstands r vom Optimal-Punkt
zur virtuellen Quelle ermittelt werden. Zur Berechnung des Abstands
r muß typischerweise eine
Koordinatentransformation der virtuellen Koordinaten in die Koordinaten
des Vorführraums
oder eine Koordinatentransformation der Vorführraumkoordinaten des Punkts
P in die virtuellen Koordinaten durchgeführt werden, was für Fachleute
auf dem Gebiet der Wellenfeldsynthese bekannt ist.
-
Ist
die virtuellen Quelle dagegen eine unendlich weit entfernte virtuelle
Quelle, die am Punkt P ebene Wellen erzeugt, so wird zur Bestimmung
des Soll-Amplitudenzustands der Abstand zwischen dem Punkt P und
der Quelle nicht benötigt,
da dieser ohnehin gegen unendlich geht. In diesem Fall wird lediglich
eine Informationen über
die Art der Quelle benötigt.
Der Soll-Pegel am Punkt P ist dann gleich dem Pegel, der dem ebenen
Wellenfeld, das durch die unendlich weit entfernte virtuelle Quelle
erzeugt wird, zugeordnet ist.
-
7 zeigt ein Diagramm zur Erläuterung des
Ist-Amplitudenzustands.
Insbesondere sind in 7b verschiedene Lautsprecher 808 gezeichnet, die
alle mit einem eigenen Lautsprechersignal gespeist werden, das z.
B. von dem Wellenfeldsynthesemodul 810 von 8 erzeugt
worden ist. Ferner wird jeder Lautsprecher als Punktquelle modelliert, die
ein konzentrisches Wellenfeld ausgibt. Die Gesetzmäßigkeit
des konzentrischen Wellenfelds besteht wieder darin, daß der Pegel
gemäß 1/r abfällt. Damit
kann zur Berechnung des Ist-Amplitudenzustands (ohne Messung) das
von dem Lautsprecher 808 unmittelbar an der Lautsprechermembran
erzeugte Signal bzw. der Pegel dieses Signals auf der Basis der
Lautsprechercharakteristika und des Komponentensignals im Lautsprechersignal
LSn, das auf die betrachtete virtuelle Quelle zurückgeht,
berechnet werden. Ferner kann aufgrund der Koordinaten des Punkts
P und der Ortsinformationen zur Lage des Lautsprechers LSn der Abstand
zwischen P und der Lautsprechermembran des Lautsprechers LSn ausgerechnet
werden, so daß ein
Pegel für
den Punkt P aufgrund eines Komponentensignals erhalten werden kann,
das auf die betrachtete virtuelle Quelle zurückgeht und von dem Lautsprecher
LSn ausgesendet worden ist.
-
Eine
entsprechende Prozedur kann für
die anderen Lautsprecher des Lautsprecherarrays ebenfalls durchgeführt werden,
so daß sich
für den
Punkt P eine Anzahl von „Teilpegelwerten" ergibt, die einen Signalbeitrag
der betrachteten virtuellen Quelle darstellen, der von den einzelnen
Lautsprechern zum Hörer
am Punkt P gelangt ist. Durch Zusammenfassung dieser Teilpegelwerte
wird dann der gesamte Ist-Amplitudenzustand
am Punkt P erhalten, der dann, wie es ausgeführt worden ist, mit dem Soll-Amplitudenzustand
verglichen werden kann, um einen Korrekturwert, der vorzugsweise
multiplikativ ist, der jedoch prinzipiell additiv oder subtraktiv
sein könnte, zu
erhalten.
-
Erfindungsgemäß wird somit
auf der Basis bestimmter Quellenformen der gewünschte Pegel für einen
Punkt berechnet, also der Soll-Amplitudenzustand. Es wird bevorzugt,
daß der
Optimal-Punkt bzw. der Punkt im Vorführbereich, der betrachtet wird,
sinnvollerweise in der Mitte des Wellenfeldsynthesesystems liegt.
An dieser Stelle sei darauf hingewiesen, daß auch dann bereits eine Verbesserung
erreicht wird, wenn der Punkt, der zur Berechnung des Soll-Amplitudenzustands
zugrunde gelegt worden ist, nicht unmittelbar mit dem Punkt übereinstimmt, der
zur Ermittlung des Ist-Amplitudenzustands verwendet worden ist.
Nachdem eine möglichst
gute Pegelartefaktreduktion für
eine möglichst
große
Anzahl von Punkten im Vorführbereich
angestrebt wird, ist es prinzipiell ausreichend, daß ein Soll-Amplitudenzustand
für irgendeinen
Punkt im Vorführbereich
ermittelt wird, und daß ein
Ist-Amplitudenzustand ebenfalls für irgendeinen Punkt im Vorführbereich
ermittelt wird, wobei es jedoch bevorzugt wird, daß sich der Punkt,
auf den der Ist-Amplitudenzustand bezogen ist, in einer Zone um
den Punkt herum befindet, für den
der Soll-Amplitudenzustand bestimmt worden ist, wobei diese Zone
vorzugsweise kleiner als 2 Meter für normale Kinoanwendungen ist.
Für beste
Ergebnisse sollten diese Punkte im wesentlichen zusammenfallen.
-
Erfindungsgemäß wird somit
nach Berechnung der Einzelpegel der Lautsprecher gemäß üblicher
Wellenfeldsynthesealgorithmen der praktisch durch Überlagerung
entstehende Pegel an diesem Punkt, der der Optimal-Punkt im Vorführbereich
genannt wird, berechnet. Die Pegel der einzelnen Lautsprecher und/oder
Quellen werden dann erfindungsgemäß mit diesem Faktor korrigiert.
Für rechenzeiteffizienten
Anwendungen wird es besonders bevorzugt, Korrekturfaktoren einmal
für alle
Positionen bei einer bestimmten Arrayanordnung zu berechnen und abzuspeichern,
um dann im Betrieb auf die Tabelle zuzugreifen, um Rechenzeiteinsparungen
zu erreichen.