-
Die
vorliegende Erfindung bezieht sich auf moderne Audiotechnologien
und insbesondere auf die Erzeugung und Bearbeitung von räumlichen
Toneindrücken
für Tonwiedergabesysteme.
-
In
modernen Tonwiedergabesystemen kann durch den Einsatz von mehreren
Lautsprechern erreicht werden, dass einzelne Tonquellen im Raum präzise geortet
werden können
und dass innerhalb der Wiedergabeumgebung der Eindruck erzeugt wird,
man befände
sich innerhalb eines simulierten Raumes, wie z. B. einem Stadium
oder einer Kathedrale. Dabei kann man prinzipiell zwei unterschiedliche
Wiedergabekonzepte unterscheiden. Bei der herkömmlichen auch im Homeentertainmentbereich üblichen
Surroundwiedergabe wird die Ortungs- und Rauminformation bereits
während
des Tonmischvorgangs in einzelne, diskret zu übertragende Kanäle gemischt,
wobei ein Wiedergabesystem aus mehreren Lautsprechern dazu verwendet
wird, die einzelnen Kanäle
wiederzugeben. Dabei sollten sich die wiedergebenden Lautsprecher
an einer vorgegebenen Position relativ zur Wiedergabeumgebung befinden,
um einen bestmöglichen
Raumeindruck zu erzielen.
-
Fortgeschrittenere
Systeme, wie die auf Wellenfeldsynthese basierenden Raumsimulationen,
erzeugen die Ansteuersignale für
die einzelnen Lautsprecher erst während der Wiedergabe, basierend auf
einer Positionsinformation einer Tonquelle bezüglich des Wiedergaberaums und
der Rauminformation einer zu simulierenden Wiedergabeumgebung. Dadurch
lassen sich bezüglich
der Ortung und des räumlichen
Eindrucks wesentlich authentischere Ergebnisse erzielen, da hier
während
der Wiedergabe das individuelle Lautsprechersetup berück sichtigt werden
kann, um in der Wiedergabeumgebung eine Wellenfront zu erzeugen,
die den zu simulierenden Raumeindruck bestmöglich repräsentiert.
-
Nachfolgend
wird zum besseren Verständnis der
vorliegenden Erfindung auf die Wellenfeldsynthese-Technik näher eingegangen.
-
Ein
besserer natürlicher
Raumeindruck sowie eine stärkere
Einhüllung
bei der Audiowiedergabe kann mit Hilfe einer neuen Technologie erreicht werden.
Die Grundlagen dieser Technologie, die so genannte Wellenfeldsynthese
(WFS; WFS = Wave-Field Synthesis), wurden an der TU Delft erforscht
und erstmals in den späten
80er-Jahren vorgestellt (Berkhout, A.J.; de Vries, D.; Vogel, P.: Acoustic
control by Wavefield Synthesis. JASA 93, 1993).
-
Infolge
der enormen Anforderungen dieser Methode an Rechnerleistung und Übertragungsraten wurde
die Wellenfeldsynthese bis jetzt nur selten in der Praxis angewendet.
Erst die Fortschritte in den Bereichen der Mikroprozessortechnik
und der Audiocodierung gestatten heute den Einsatz dieser Technologie
in konkreten Anwendungen.
-
Die
Grundidee von WFS basiert auf der Anwendung des Huygens'schen Prinzips der
Wellentheorie:
Jeder Punkt, der von einer Welle erfasst wird,
ist Ausgangspunkt einer Elementarwelle, die sich kugelförmig bzw.
kreisförmig
ausbreitet.
-
Angewandt
auf die Akustik kann durch eine große Anzahl von Lautsprechern,
die nebeneinander angeordnet sind (einem so genannten Lautsprecherarray),
jede beliebige Form einer einlaufenden Wellenfront nachgebildet
werden. Im einfachsten Fall, einer einzelnen wiederzugebenden Punktquelle
und einer linearen Anordnung der Lautsprecher, müssen die Audiosignale eines
jeden Lautsprechers mit einer Zeitverzö gerung und Amplitudenskalierung
so gespeist werden, dass sich die abgestrahlten Klangfelder der
einzelnen Lautsprecher richtig überlagern. Bei
mehreren Schallquellen wird für
jede Quelle der Beitrag zu jedem Lautsprecher getrennt berechnet und
die resultierenden Signale addiert. Befinden sich die wiederzugebenden
Quellen in einem virtuellen Raum mit reflektierenden Wänden, dann
müssen auch
Reflexionen als zusätzliche
Quellen über
das Lautsprecherarray wiedergegeben werden. Der Aufwand bei der
Berechnung hängt
daher stark von der Anzahl der Schallquellen, den Reflexionseigenschaften
des Raums und der Anzahl der Lautsprecher ab.
-
Der
Vorteil dieser Technik liegt im Besonderen darin, dass ein natürlicher
räumlicher
Klangeindruck über
einen großen
Bereich des Wiedergaberaums möglich
ist. Im Gegensatz zu den bekannten Techniken werden Richtung und
Entfernung von Schallquellen sehr exakt wiedergegeben. In beschränktem Maße können virtuelle
Schallquellen sogar zwischen dem realen Lautsprecherarray und dem
Hörer positioniert
werden.
-
Die
Wellenfeldsynthese ermöglicht
somit eine korrekte Abbildung von virtuellen Schallquellen über einen
großen
Wiedergabebereich. Gleichzeitig bietet sie dem Tonmeister und Toningenieur
neues technisches und kreatives Potential bei der Erstellung auch
komplexer Klanglandschaften. Die Wellenfeldsynthese (WFS oder auch
Schallfeldsynthese), wie sie Ende der 80-er Jahre an der TU Delft
entwickelt wurde, stellt einen holographischen Ansatz der Schallwiedergabe
dar. Als Grundlage hierfür
dient das Kirchhoff-Helmholtz-Integral.
Dieses besagt, dass beliebige Schallfelder innerhalb eines geschlossenen
Volumens mittels einer Verteilung von Monopol- und Dipolschallquellen
(Lautsprecherarrays) auf der Oberfläche dieses Volumens erzeugt
werden können.
Details hierzu finden sich in M.M. Boone, E.N.G. Verheijen, P.F.
v. Tol, „Spatial
Sound-Field Reproduction by Wave-Field
Synthesis", Delft
University of Technology Laboratory of Seismics and Acoustics, Journal
of J. Audio Eng. Soc., Bd. 43, Nr. 12, Dezember 1995 und Diemer
de Vries, „Sound Reinforcement
by Wavefield Synthesis: Adaption of the Synthesis Operator to the
Loudspeaker Directivity Characteristics", Delft University of Technology Laboratory
of Seismics and Acoustics, Journal of J. Audio Eng. Soc., Bd. 44,
Nr. 12, Dezember 1996.
-
Bei
der Wellenfeldsynthese wird aus einem Audiosignal, das eine virtuelle
Quelle an einer virtuellen Position aussendet, eine Synthesesignal
für jeden
Lautsprecher des Lautsprecherarrays berechnet, wobei die Synthesesignale
derart hinsichtlich Amplitude und Phase gestaltet sind, dass eine
Welle, die sich aus der Überlagerung
der einzelnen durch die im Lautsprecherarray vorhandenen Lautsprecher ausgegebenen
Schallwelle ergibt, der Welle entspricht, die von der virtuellen
Quelle an der virtuellen Position herrühren würde, wenn diese virtuelle Quelle
an der virtuellen Position eine reale Quelle mit einer realen Position
wäre.
-
Typischerweise
sind mehrere virtuelle Quellen an verschiedenen virtuellen Positionen
vorhanden. Die Berechnung der Synthesesignale wird für jede virtuelle
Quelle an jeder virtuellen Position durchgeführt, so dass typischerweise
eine virtuelle Quelle in Synthesesignalen für mehrere Lautsprecher resultiert.
Von einem Lautsprecher aus betrachtet empfängt dieser Lautsprecher somit
mehrere Synthesesignale, die auf verschiedene virtuelle Quellen
zurückgehen.
Eine Überlagerung
dieser Quellen, die aufgrund des linearen Superpositionsprinzips möglich ist,
ergibt dann das von dem Lautsprecher tatsächlich ausgesendete Wiedergabesignal.
-
Die
Möglichkeiten
der Wellenfeldsynthese können
um so besser ausgeschöpft
werden, je geschlossener die Lautsprecherarrays sind, d. h. um so mehr
einzelne Lautsprecher möglichst
nah beieinander angeordnet werden können. Damit steigt jedoch auch
die Rechenleistung, die eine Wellenfeldsyntheseeinheit vollbringen
muss, da typischerweise auch Kanalinformationen berücksichtigt
werden müssen. Dies bedeutet
im einzelnen, dass von jeder virtuellen Quelle zu jedem Lautsprecher
prinzipiell ein eigener Übertragungskanal
vorhanden ist, und dass prinzipiell der Fall vorhanden sein kann,
dass jede virtuelle Quelle zu einem Synthesesignal für jeden
Lautsprecher führt,
bzw. dass jeder Lautsprecher eine Anzahl von Synthesesignalen erhält, die
gleich der Anzahl von virtuellen Quellen ist.
-
Darüber hinaus
sei an dieser Stelle angemerkt, dass die Qualität der Audiowiedergabe mit der Anzahl
der zur Verfügung
gestellten Lautsprecher steigt. Dies bedeutet, dass die Audiowiedergabequalität um so
besser und realistischer wird, um so mehr Lautsprecher in dem bzw.
den Lautsprecherarrays vorhanden sind.
-
Räumliche
Tonwiedergabesysteme wie die Wellenfeldsynthese ermöglichen
es also, den Ton in 360 Grad um den Zuhörerraum mit optimaler räumlicher
Auflösung
zu generieren. Bisher wurden diese Systeme im Wesentlichen zum Positionieren
von diskreten Schallquellen und zur Direktschallwiedergabe verwendet.
Auf die Signale der so generierten Schallquellen lassen sich zusätzlich alle
bekannten linearen Signalverarbeitungen anwenden, wie z. B das Hinzufügen von
Nachhall. In räumlichen
Tonwiedergabesystemen wie der Wellenfeldsynthese (WFS) ist es weiterhin
möglich,
räumliche
Effekte basierend auf dem Direktschall zu generieren. Dies geschieht
beispielsweise bei der Raumsimulation, bei der aus Gründen der
Effizienz die Wiedergabe auf eine begrenzte Anzahl von Raumrichtungen
(ebene Wellen) vereinfacht werden kann.
-
In
einem sehr einfachen Fall der Raumsimulation werden gleiche Parameter
zur Beschreibung des Raumes für
alle Raumrichtungen verwendet (diffuser Nachhall) und richtungsabhängige Raumanteile
(frühe
Reflexionen) automatisiert generiert. Ein Erzeugen räumlicher
Effekte ist nicht nur dann sinnvoll, wenn es um die Nachbildung
natürlicher
Raumeffekte geht, da die prinzipiellen Möglichkeiten dieser Art der
Signalverarbeitung auch anderweitig kreativ genutzt werden können.
-
Bei
der Wellenfeldsynthese wird ein zu beschallender Raum von möglichst
vielen individuellen Lautsprechern beschallt, um die Rekonstruktion
von Wellenfronten mit bestmöglicher
Genauigkeit zu erlauben. Für
die Ortbarkeit von Tonsignalen und die Erzeugung eines Raumeindrucks
werden üblicherweise
eine Vielzahl von Parametern herangezogen, die für jeden Lautsprecher während des
Abmischens des Tonsignals individuell zu bestimmen sind.
-
Wie
im Vorhergehenden beschrieben wurde, zeichnen sich die mehrkanaligen
Tonwiedergabesysteme durch außerordentlich
hohe Komplexität
aus, so dass das zusätzliche
Erzeugen einer Rauminformation bzw. der Ortungsinformation während des
Abmischens des Tons bedingt, eine Vielzahl von Parametern zu erzeugen,
die lautsprecherindividuell die Ortungsinformation bzw. zusätzliche
lineare Signalverarbeitungsschritte (zum Erzeugen von akustischen
Effekten) beschreiben. Diese Beschreibung anhand einer Vielzahl
abstrakter mathematischer Parameter ohne unmittelbar intuitiv erfassbare
Bedeutung ist insbesondere bei Wellenfeldsynthesesystemen schwer
beherrschbar.
-
Beispielsweise
bietet die Wellenfeldsynthese die Möglichkeit, Schallquellen auf
einer zweidimensionalen Hörebene
frei zu positionieren. Dies geschieht durch die Synthetisierung
unterschiedlicher Wellenfronten abhängig von der Position der Schallquellen.
Benutzeroberflächen,
wie sie derzeit verwendet werden, verwenden zur Positionierung der Schallquelle
einen Punkt in einer Aufsicht der zweidimensionalen Hörebene,
wobei der Punkt die Position der Schallquelle repräsentiert.
Da bei diesem Ansatz die räumliche
Position der Schallquelle zwar hinreichend visualisiert wird, der
klangliche Tiefeneindruck (Raumeindruck) jedoch prinzipiell in der
Visualisierung nicht simultan darstellbar ist, kommt es zu Diskrepanzen
zwischen der realen Wahrnehmung und der Darstellung, so dass nur
in wenigen Ausnahmefällen
ein visuelles Bild zur Verfügung
gestellt wird, welches dem realen Klangeindruck entspricht oder einen
Rückschluss
auf diesen zulässt.
-
Die
Aufgabe der vorliegenden Erfindung besteht darin, eine graphische
Benutzerschnittstelle zu schaffen, die es erlaubt, ein Tonwiedergabesystem zur
Erzeugung eines räumlichen
Toneindrucks effizienter zu steuern.
-
Diese
Aufgabe wird durch eine Vorrichtung gemäß Anspruch 1 oder 20 sowie
durch ein Verfahren gemäß Anspruch
25 oder 26 gelöst.
-
Der
vorliegenden Erfindung liegt die Erkenntnis zugrunde, dass ein Tonwiedergabesystem,
das in einer Wiedergabeumgebung einen räumlichen Toneindruck erzeugen
kann, effizient und intuitiv mittels einer graphischen Benutzerschnittstelle
gesteuert werden kann, wenn eine einer Raumrichtung bezüglich der
Wiedergabeumgebung zugeordnete Impulsantwort bzw. eine aus der Impulsantwort
gewonnene graphische Repräsentation
graphisch dargestellt wird, und wenn die Möglichkeit geschaffen wird, dass
ein Benutzer diese Darstellung graphisch verändern kann, so dass basierend
auf der Benutzeränderungseingabe
die geänderte
Impulsantwort graphisch dargestellt sowie die geänderte graphische Darstellung
erfasst werden kann, um das Tonwiedergabesystem anzusteuern.
-
Da
es systemtheoretisch möglich
ist, alle bekannten linearen Signalverarbeitungen durch Impulsantworten
zu beschreiben, ist es mit der erfindungsgemäßen graphischen Benutzerschnittstelle möglich, einem
Tongestalter über
eine graphische Repräsentierung
einen intuitiven Zugriff auf richtungsabhängige Klangeffekte zu geben,
um somit die Effizienz und die Qualität bei der Steuerung des Tonwiedergabesystems
zu erhöhen.
-
Durch
Faltung eines ursprünglichen
Signals mit Impulsantworten lassen sich alle linearen Signalverarbeitungsalgorithmen
darstellen. Als Beispiel können
so bei einer auf Wellenfeldsynthese basierenden Raumsimulation die
Signale für
ebene Wellen durch Faltung mit entsprechenden Raumimpulsantworten,
die korrespondierenden Raumrichtungen zugeordnet sind, erzeugt werden.
Damit können
auch Räume
nachgebildet werden, wobei die verwendeten Impulsantworten erfindungsgemäß neben
einer Beschreibung durch die ihnen zugrundeliegenden Parameter auch
direkt visualisiert werden. Das erfindungsgemäße neue Werkzeug zur Tongestaltung
besteht aus eine simultanen Visualisierung aller richtungsabhängigen Impulsantworten
korrespondierend zu einer Quelle. Die Klanggestaltung findet durch
direkte Interaktion mit dieser Visualisierung statt. Die Bearbeitung
der visuellen Darstellung wird in eine parametrische Beschreibung
umgerechnet und aus dieser werden die zugehörigen Impulsantworten generiert.
-
Die
Richtungsinformation bzw. eine Räumlichkeit
wird einem Tonsignal also durch eine mathematische Faltung mit einer
Impulsantwort eingeprägt, was
zum besseren Verständnis
des Erfindungsgedankens im Folgenden kurz erläutert wird.
-
Einem
Tonsignal f(y) wird ein Raumeindruck oder Reflexionsmuster bzw.
eine Ortungsinformation durch Faltung mit einer Impulsantwort g(x)
eingeprägt,
so dass sich das kombinierte Tonsignal F(x) gemäß folgendem Faltungsintegral
ergibt:
-
Die
Impulsantwort g(x) beschreibt allgemein die Antwort eines Systems
auf einen Diracimpuls δ(x),
also einen Impuls infinitesimaler Länge für den gilt:
-
Das
heißt
also, ein idealer Diracimpuls zeichnet sich durch eine infinitesimale
Länge aus
und zusätzlich
dadurch, dass sein Integral, wie oben beschrieben, endlich ist.
Im Falle eines Tonsignals bedeutet dies, dass ein Diracpuls beliebig
klein ist, jedoch feste akustische Energie trägt.
-
Testet
man einen Raum mit einem Diracpuls, so erhält man als einfachste Impulsantwort
wiederum einen Diracpuls, der mit einer Laufzeitverzögerung t zum
Aussenden des Testpulses am Ort des Aussendens des Testpulses registriert
wird. Dies ist genau dann der Fall, wenn in der Richtung, in die
der Testpuls emittiert wurde, ein idealer Reflektor befindlich ist,
der das akustische Testsignal ohne Dämpfung reflektiert, wobei die
Laufzeit zwischen dem Ort des Aussendens der Quelle und dem Reflektor
dann genau t/2 beträgt.
-
Es
sei hier bemerkt, dass es in der Realität unmöglich ist, einen idealen Diracpuls
zu erzeugen, stattdessen werden von jetzt an auch Pulse, deren Breite
endlich ist und deren Intensität
A beträgt,
als Diracpulse bezeichnet.
-
Anschaulich
kann man sich solche realen Impulse beispielsweise aus gaussförmige Kurven
geringer Breite mit Flächeninhalt
A vorstellen.
-
Würde der
oben beschriebene Reflektor einen Teil der akustischen Energie absorbieren,
das Testsignal also dämpfen,
so würde
der nach Laufzeit t empfangene, reflektierte Diracpuls eine geringere Fläche B unter
der Kurve aufweisen als der ursprüngliche Puls (B < A).
-
Neben
den bislang beschriebenen, idealisierten einfachen Fällen einer
Impulsantwort ist es ferner möglich,
beliebig komplexe Impulsantworten zu erhalten. Befinden sich beispielsweise
zwei Reflektoren in voneinander unterschiedlichen Entfernungen,
die den akustischen Laufzeiten t1 und t2 entsprechen, zum Ort des Aussendens des
Testsignals, so wird die Impulsantwort aus zwei zu den Zeitpunkten
2·t1 und 2·t2 empfangenen Diracpulsen bestehen. Normalerweise
sind akustische Szenen sehr komplex, so dass eine reale Impulsantwort
eine mit der Zeit dichter werdende Pulsfolge sein wird, die mit
frühen
Reflexionen beginnt, und deren zeitlich später eintreffenden Komponenten
beispielsweise einen Nachhall beschreiben.
-
Wie
oben erläutert
beschreibt eine Impulsantwort in Form eines Diracpulses ein Delay
bzw. ein Echo. Ebenso lässt
sich beispielsweise ein Mehrfachecho durch eine Summe von diracförmigen Pulsen
darstellen. Zur realistischen Raumsimulation wird im Allgemeinen
die Impulsantwort, die mit dem Tonsignal gefaltet wird, kontinuierlich
sein, z. B. ein zum Zeitpunkt t0 stark ansteigendes
und dann sanft ausklingendes Signal, das eine Mehrfachreflexion beschreibt,
wobei die zu späteren
Zeitpunkten reflektierten Signale stärker gedämpft sind.
-
In
realen Szenarien werden Tonsignale zusätzlich frequenzselektiv gedämpft, beispielsweise werden
hohe Tonsignale von Teppichen und Wandbehängen stärker gedämpft als tiefe Tonsignale.
Um diesem Sachverhalt gerecht zu werden, können beispielsweise für mehrere
Frequenzbereiche getrennt unterschiedliche Impulsantworten verwendet
und visualisiert werden oder muss die Visualisierung der Impulsantwort
den Zeit- und Frequenzbereich umfassen.
-
In
einem weiteren Ausführungsbeispiel
der vorliegenden Erfindung wird die graphische Benutzerschnittstelle
dazu verwendet, die räumliche
Position einer Tonquelle relativ zum Tonwiedergabesystem darzustellen,
und die daraus resultierenden Impulsantworten, die für jeden
Lautsprecher eines Wiedergabesystems individuell die räumliche
Orientierung des Tonsignals bezüglich
des wiedergebenden Lautsprechers darstellen, zu visualisieren.
-
Dabei
kann der Benutzer auf anschauliche Art und Weise die Position der
Quelle bezüglich
der Wiedergabeumgebung graphisch verändern, wobei sich aus der dargestellten
Wellenfront der punktförmigen
akustischen Signalquelle automatisch die lautsprecherindividuelle
Impulsantwort bzw. die Parameter zur Ansteuerung der Lautsprecher
ergeben. Ein Toningenieur hat somit die Möglichkeit, auf intuitive Art
und Weise die komplexen Parameter, die zur Steuerung des Tonwiedergabesystems
von Nöten sind,
zu erzeugen.
-
Dabei
ist ein wesentlicher Aspekt, dass zusätzlich die Möglichkeit
geschaffen wird, durch graphische Interaktion mit der Benutzerschnittstelle
die Impulsantworten direkt zu verändern, wobei unmittelbar dargestellt
wird, wie sich die aktuelle Änderung auf
die Wahrnehmung der Position der Tonquelle auswirkt. Mit der erfindungsgemäßen graphischen Benutzerschnittstelle
hat man also vorteilhafterweise die Wahl, ob man von der physikalischen
Realität ausgehend
die Tonquelle direkt platzieren will oder ob man die Möglichkeiten
der Veränderung
der Impulsantwort kreativ nutzen möchte. Im letzteren Fall erhält man dabei
zusätzlich
eine Abschätzung,
wie die manuelle Änderung
der Impulsantworten in der Wahrnehmung eines Zuhörers interpretiert wird. Ein Toningenieur
kann also zwischen zwei Möglichkeiten der
visuellen Klangbearbeitung wählen
und dabei den Ansatz verfolgen, der für das gewünschte klangliche Ergebnis
bzw. den räumlichen
Toneindruck, den es zu erzielen gilt, am vorteilhaftesten ist.
-
In
einem weiteren Ausführungsbeispiel
der vorliegenden Erfindung wird die erfindungsgemäße graphische
Benutzerschnittstelle genutzt, um Impulsantworten, die Informationen über einen
zu simulierenden Raum beinhalten, darzustellen. Dabei werden von
der Anzeigeeinrichtung die Impulsantworten bezüglich eines festen Punktes
innerhalb der Wieder gabeumgebung in den Raumrichtungen dargestellt,
für die
sie auch die Rauminformationen tragen.
-
Von
der Anzeigeeinrichtung werden also simultan alle für den räumlichen
Gesamteindruck relevanten Daten (Impulsantworten) dargestellt, wobei sie
als dreidimensionales Abbild der Umgebung visualisiert werden. Ein
Benutzer hat also den Vorteil, dass er sämtliche Informationen, die
den räumlichen Klangeindruck
betreffen, zeitgleich dargestellt bekommt bzw. dass er diese simultan
verändern
kann, wobei zu jedem Zeitpunkt der durch eine Veränderung
entstandene veränderte
räumliche
Klangeindruck dargestellt wird und beurteilt werden kann.
-
Dadurch
wird es ermöglicht,
auf intuitive Art und Weise einen Klangeindruck mit Nachhall bzw. gewünschten
Dämpfungen
und anderen Signalmanipulationen zu erzielen, ohne die den Impulsantworten
zugrundeliegenden Parameter manuell verändern zu müssen, was ein erhebliches Maß an Abstraktion
erfordert.
-
Die
graphische Darstellung erlaubt es ferner, den Designprozess losgelöst von technischen
Rahmenbedingungen durchzuführen.
So wird im Allgemeinen eine Impulsantwortfunktion diskret abgespeichert
sein, d. h. für
diskrete Zeitabschnitte existiert ein zugeordneter Amplitudenwert.
Bei der intuitiven Bedienung der graphischen Benutzerschnittstelle muss
darauf keine Rücksicht
genommen werden, da die relevanten Parameter basierend auf einer
graphischen Änderung
der angezeigten Impulsantwort automatisch erzeugt werden.
-
Ein
weiterer Vorteil besteht darin, dass die Komplexität eines
Systems leicht erhöht
werden kann, ohne dass die Intuitivität der Bedienung unter der erhöhten Anzahl
von Parametern verringert wird.
-
In
einem weiteren Ausführungsbeispiel
der vorliegenden Erfindung wird es ermöglicht, die Impulsantworten
mehrere Raumrichtungen betreffend frequenzselektiv darzustellen
bzw. zu bearbeiten. Dadurch wird es möglich, die Natürlichkeit
des Raumeindrucks weiter zu erhöhen,
indem man beispielsweise für
unterschiedliche Raumrichtungen verschiedene frequenzabhängige Dämpfungsprofile annimmt,
was die Authentizität
des erzielten Klangeindrucks einerseits erhöht, andererseits jedoch die Komplexität der Erzeugung
der Parameter ebenfalls ansteigen lässt. In der visuellen Darstellung
ist es dabei dennoch möglich,
das erzielbare Klangerlebnis vorherzusagen, und dieses darüber hinaus
kreativ zu verändern,
indem beispielsweise bei einer bestimmten Frequenz für eine frei
wählbare
Raumrichtung eine starke künstliche
Dämpfung
eingeführt
wird. Diese Änderungen
sind sofort sichtbar und es ist möglich, im Kontext des Gesamtsystems
den Einfluss auf das gesamte Klanggeschehen zuverlässig vorauszusagen.
-
In
einem einfachen Beispiel können
gleiche Parameter zur Beschreibung des Raumes für alle Raumrichtungen verwendet
werden, was einem diffusen Nachhall entspricht. Richtungsabhängige Raumanteile
(frühe
Reflexionen) werden erst im Anschluss daran angebracht. Daraus entsteht
für jede
Raumrichtung eine spezifische Raumimpulsantwort, eine ungewünschte Abweichung
der Parameter für
eine Raumrichtung kann sofort erkannt und korrigiert werden.
-
Ein
weiterer Vorteil der erfindungsgemäßen dreidimensionalen Darstellung
ist, dass die frequenzselektive Impulsantwortdarstellung für jede Richtung durch
einfaches Abtasten leicht in eine Matrixdarstellung überführt werden
kann, deren weitere Verarbeitung außerordentlich effizient möglich ist.
-
Bei
einem weiteren Ausführungsbeispiel
der vorliegenden Erfindung werden für eine vorgegebene Anzahl von
Raumrichtungen individuell Delayzeiten eingestellt, wobei die Delayzeiten
als diracförmige Impulsantworten
dargestellt werden. Diese sind bezüglich eines festen Punktes
in der Wiedergabeumgebung in einer dreidimensionalen Ansicht dargestellt
sind. Dabei ist besonders vorteilhaft, dass die graphische Manipulation,
die das Verschieben der diracförmigen
Impulsantworten bezüglich
eines Referenzpunktes erlaubt, unmittelbar den räumlichen Effekt visuell widerspiegelt.
Die einem Delay entsprechenden diracförmigen Impulsantworten beschreiben
gerade eine Reflexion an einem Gegenstand, wobei das Vergrößern des
Abstands der Impulsantwort bezüglich
des Referenzpunktes in der graphischen Darstellung einem Vergrößern der
Laufzeit des reflektierten Signals entspricht. Durch die unmittelbare
Entsprechung der graphischen Darstellung zur simulierten Realität können somit
auf effizienteste Art und Weise beispielsweise Räume simuliert werden, innerhalb
derer sich die Wiedergabeumgebung befindet.
-
Ein
besonderer Vorteil dieser vereinfachten Art der Raumgestaltung ist
die hohe Intuitivität
der Darstellung und die damit verbundene reduzierte Fehlerwahrscheinlichkeit
bei der Steuerung eines Tonwiedergabesystems.
-
Bei
einem weiteren Ausführungsbeispiel
der vorliegenden Erfindung wird die graphische Benutzerschnittstelle
für ein
Tonwiedergabesystem mit einem Signalgenerator betrieben, der Lautsprechersignale
für eine
Mehrzahl von an unterschiedlichen räumlichen Positionen angebrachte
Lautsprecher erzeugt. Die hohe Intuitivität und Benutzerfreundlichkeit
der graphischen Benutzerschnittstelle macht es dabei möglich, die
Wiedergabe von Signalquellen auch in Echtzeit so zu manipulieren,
dass die akustische Ortbarkeit eines Tonsignals, beispielsweise
eines Sängers
auf der Bühne,
mit dem optischen Eindruck übereinstimmt.
In diesem Fall ist lediglich ein Nachführen der bewegten Tonquelle
innerhalb der erfindungsgemäßen graphischen
Benutzeroberfläche
notwendig, was mittels klassischer Parametereingabe für ein zu
steuerndes Lautsprechersystem nicht realisierbar wäre.
-
Bevorzugte
Ausführungsbeispiele
der vorliegenden Erfindung werden nachfolgend Bezug nehmend auf
die beiliegenden Zeichnungen näher
erläutert.
Es zeigen:
-
1 ein
Blockschaltbild zur Erläuterung
der Funktionsweise der graphischen Benutzerschnittstelle;
-
2 Blockschaltbild
zum Festlegen und Bearbeiten der Position von Schallquellen;
-
3a ein
Beispiel für
eine graphische Benutzerschnittstelle zum Bearbeiten von Impulsantworten
der Parameter, die den Ort einer Schallquelle beschreiben;
-
3b ein
weiteres Beispiel für
eine graphische Benutzerschnittstelle
-
4 Hinzufügen eines
räumlichen
Klangeindrucks für
zu einer Tonquelle;
-
5 Hinzufügen eines
räumlichen
Klangeindrucks zu einzelnen Lautsprechersignalen;
-
6 eine
graphische Benutzerschnittstelle zum Anzeigen und Ändern von
Impulsantworten;
-
7 eine
graphische Benutzerschnittstelle zum Anzeigen und Verändern von
frequenzselektiven Impulsantworten;
-
8 eine
graphische Benutzerschnittstelle zum Anzeigen und Ändern von
Zeitverzögerungen für verschiedene
Raumrichtungen; und
-
9 ein
System zum Ansteuern eines Tonwiedergabesystems mit einer graphischen
Benutzeroberfläche.
-
1 zeigt
in einem Blockschaltbild die Funktionsweise einer erfindungsgemäßen graphischen
Benutzerschnittstelle 10, die eine Anzeigeeinrichtung 12 zum
graphischen Anzeigen einer Impulsantwort, eine Einrichtung zum Ermöglichen
einer Änderung
der graphischen Anzeige 14, eine Einrichtung zum Empfangen
einer Benutzeränderungseingabe 16 und
eine Einrichtung zum Erfassen der geänderten Impulsantwort 18 aufweist.
-
Die
Anzeigeeinrichtung 12 stellt die Impulsantworten für den Benutzer
graphisch aufbereitet so dar, dass die Auswirkungen einer Veränderung der
dargestellten Impulsantworten intuitiv interpretiert und vorhergesagt
werden können.
-
Die
Einrichtung zum Ermöglichen
der Änderung
der graphischen Anzeige 14 hat dabei Zugriff auf die Anzeigeeinrichtung 12 und
die von ihr visualisierten Daten.
-
Um
eine Änderung
der Impulsantworten zu ermöglichen,
ist eine Benutzereingabe erforderlich, die von der Einrichtung zum
Empfangen einer Benutzeränderungseingabe 16 empfangen
wird, wobei die Änderung
beispielsweise mittels einer Computer-Maus, eines Touchpads oder
Interaktions- und Visualisierungstechniken aus Systemen für virtuelle Realität geschehen
kann.
-
Basierend
auf der Benutzeränderungseingabe
kann nun von der Anzeigeeinrichtung 12 eine geänderte Impulsantwort
graphisch dargestellt.
-
Durch
das Zusammenspiel der Anzeigeeinrichtung 12, der Einrichtung
zum Ermöglichen
einer Änderung 14 und
der Einrichtung zum Empfangen einer Benutzeränderungseingabe 16 wird
ein iteratives Änderungsverfahren
aus Benutzereingabe und darauf folgender graphischer Aktualisierung
möglich. Dies
hat den großen
Vorteil, dass die Auswirkung einer Benutzeränderung unmittelbar graphisch
oder akustisch kontrolliert werden kann. Ein explizites Durchführen der Änderungen
und eine anschließende
Kontrolle durch Testhören
innerhalb eines Tonwiedergabesystems kann dadurch entfallen, was
erheblich zur Kosten- und Zeitersparnis beiträgt.
-
Von
der Einrichtung zum Erfassen der geänderten Impulsantwort 18 wird
die modifizierte Impulsantwort erfasst und beispielsweise zur weiteren Verwendung
gespeichert. Die Möglichkeit,
die Impulsantwort zu speichern, kann vorteilhafterweise dazu genutzt
werden, eine bereits einmal erzeugte Impulsantwort, die einen speziellen
zu simulierenden Raum beschreibt, für weitere Projekte wieder zu
verwenden.
-
Es
ist zu bemerken, dass verschiedene Möglichkeiten denkbar sind, Impulsantworten
zu visualisieren. Die einfachste Möglichkeit ist, die Impulsantworten
entsprechend ihrer Richtung um den Mittelpunkt eines Wiedergabesystems
anzuordnen. In dem daraus entstehenden, dargestellten „Gebirge" können frequenzunabhängige Bearbeitungen
der Amplitudenverläufe
der Impulsantworten vorgenommen werden. Für Beispiele von Visualisierungsmethoden
wird auf die folgenden Figuren verwiesen, in denen die folgenden
vier Varianten der Visualisierung beschrieben werden:
- – Wellenfeldsynthese
Punktquelle
- – Impulsantwort-Zeit
Darstellung
- – Impulsantwort-Zeit-Frequenz
Darstellung
- – Multitapdelay
-
2 zeigt
schematisch, wie es anhand der in 3a oder 3b gezeigten
Visualisierung der graphischen Benutzerschnittstelle möglich ist,
die Position einer Tonquelle mittels einer erfindungsgemäßen graphischen
Benutzerschnittstelle festzulegen oder eine bestehende Position
so zu verändern, dass
ein gewünschter
Positionseindruck entsteht.
-
Im
Positionierungsschritt 20 wird dabei zunächst die
Position einer Tonquelle relativ zur Wiedergabeumgebung graphisch
festgelegt.
-
Die
graphische Benutzerschnittstelle stellt im zweiten Schritt 22 die
die Position der Tonquelle repräsentierenden
Impulsantworten graphisch dar, welche vom Benutzer direkt verändert werden
können.
-
Dabei
ist zu bemerken, dass, wie es im Folgenden anhand von 3a oder 3b zu
sehen sein wird, sowohl die Position der Quelle variiert, als auch
der Verlauf der errechneten Impulsantworten direkt manipuliert werden
kann. Dies ermöglicht
es zusätzlich,
kreative Toneffekte zu implementieren, welche nicht unmittelbar
mit einer „realen" Ortsinformation
verknüpft
sein müssen.
-
3a oder 3b zeigt
eine Ausführungsform
einer erfindungsgemäßen graphischen
Benutzerschnittstelle zum Festlegen der räumlichen Position einer Tonquelle
bzw. zum Ändern
der die Tonquelle repräsentierenden
Impulsantworten.
-
Dargestellt
ist eine punktförmige
Schallquelle 30 in Form einer Kugel, eine Wiedergabeumgebung 32 und
eine zur Punktquelle korrespondierende Wellenfront 34.
-
Die
Position der Kugel beschreibt die Position der Schallquelle 30 im
Raum. Basierend auf der Position der Punktquelle 30 wird
die Wellenfront 34 dargestellt, die sich aus der Schallabstrahlung
der punktförmigen
Signalquelle ergibt. Wird beispielsweise die Punktquelle 30 zu
einem Punkt im Raum bewegt, der weiter von der Wiedergabeumgebung 32 entfernt
ist, so wird die Wellenfront 34 flacher. Wird die Punktquelle 30 näher an das
Lautsprechersystem heran bewegt, dann wird die entsprechende Wellenfront
stärker
gekrümmt
sein.
-
Erfindungsgemäß lässt sich
die Krümmung der
Wellenfront auch direkt mit Hilfe von zwei Anfassern 36a und 36b verändern. Dies
wirkt sich unmittelbar auf die wahrgenommene Position der Punktquelle 30 aus,
was von der erfindungsgemäßen graphischen
Benutzerschnittstelle automatisch dargestellt wird.
-
Die
graphische Benutzerschnittstelle in 3a oder 3b zeigt
ferner einen Verzögerungsradius 38,
der dazu dient, akausale Zustände bei
der Wiedergabe eines auf Wellenfeldsynthese basierenden Systems
zu vermeiden wobei die Position der Wellenfront 34 durch
den Verzögerungsradius bestimmt
wird. Der Verzögerungsradius 38 entspricht dabei
einer Grundverzögerung,
die ein Wellenfeldsynthesesystem benötigt, und die der Entfernung
des am weitesten vom Mittelpunkt des Systems entfernten Lautsprechers
entspricht. Durch die Grundverzögerung
wird es möglich,
Quellen beliebig innerhalb und außerhalb des Lautsprechersystems/Rekonstruktions-gebiets
bzw. der Wiedergabeumgebung 32 zu positionieren.
-
Wie
es 3a oder 3b zeigt,
wird die Position der Wellenfront durch den Schnittpunkt der Verbindungslinie
zwischen Systemmittelpunkt und Position der Schallquelle 30 mit
dem Verzögerungsradius
definiert. Die so bestimmte Position der Wellenfront 34 ist
somit gleichbedeutend mit einer verschwindenden Verzögerung,
da der Verzögerungsradius 38 ja
gerade die minimal einzuhaltende Verzögerungszeit bestimmt. Mit der
erfindungsgemäßen graphischen
Benutzerschnittstelle ist es möglich, eine
Schallquelle beliebig zu positionieren und deren Wellenfront bzw.
die die Wellenfront repräsentierende
Impulsantwort zu verändern.
-
Bezüglich der
Laufzeitverzögerungen
ist zu bemerken, dass es bei der eines realen Schallfeldes abhängig von
der Entfernung der Schallquelle zum Abhörraum zu einer realen Signallaufzeit
kommt. Diese bestimmt sich durch den Abstand zwischen der Schallquellenposition
und dem Mittelpunkt des Wiedergabesystems. Bei der Erstellung von
imaginären auditiven
Szenen ist diese Laufzeit in der Regel nicht erwünscht, da sie die Positionierungsmöglichkeiten der
Quellen einschränkt,
da dadurch beispielsweise zeitliche Zusammenhänge bei einer Musikaufnahme verändert werden
können.
Diese Verzögerung
kann daher in Wellenfeldsynthesesystemen deaktiviert werden, was
für einen
authentischen Klangeindruck erforderlich sein kann. Dieser wichtige
zusätzliche Parameter
wird in der erfindungsgemäßen graphischen
Benutzerschnittstelle als Kreis 40 dargestellt, wobei die
Position des Kreises 40 auf der Verbindungslinie zwischen
dem Systemmittelpunkt und der Schallquelle 30 die eingestellte
Verzögerungszeit
visualisiert.
-
Im
in 3a oder 3b gezeigten
Fall befindet sich der Kreis 40 direkt an der Grenze des
Verzögerungsradius 38,
die dargestellte Laufzeit hat ihren minimal möglichen Wert, welcher der Grundverzögerung des
Wellenfeldsynthesesystems entspricht. Soll der Fall einer realen
Schalllaufzeit/Verzögerung
nachgebildet werden, würde
die Position des Kreises 40 direkt unterhalb der die Schallquelle 30 repräsentierenden
Kugel befindlich sein, wobei selbstverständlich sämtliche Zwischenwerte zusätzlich dar-
und einstellbar sind. Mittels der erfindungsgemäßen graphischen Benutzeroberfläche lassen sich
also auch die wichtigen Delayzeitparameter intuitiv einstellen und
verändern,
was die gestalterische Freiheit weiter erhöht und darüber hinaus die Effizienz des
Designvorganges bei der räumliche
Tonwiedergabe steigert.
-
Die
erfindungsgemäße graphische
Benutzerschnittstelle hat zusätzlich
den Vorteil einer äußerst großen Flexibilität, so dass
weitere Parameter leicht hinzugefügt werden können, beispielsweise könnte die
Fläche
des Kreises 40 ein Verhältnis
von Diffusschall zu Direktschall beschreiben, was von einem Zuhörer als
weiteres Merkmal für
die Entfernung einer Schallquelle zur Abhörposition aufgefasst wird, wobei
das Ändern
dieses Verhältnisses
beispielsweise durch ein Verschieben des Kreises 40 bzw.
das Ändern
seiner Fläche
implementiert werden könnte.
-
Entsprechend
der Position einer virtuellen Schallquelle S gegenüber den
einzelnen Lautsprecherpositionen L1..n berechnet
der Wellenfeldsynthesealgorithmus die Impulsantwort IRL1..Ln für jeden
beteiligten Lautsprecher (Amplitude, Verzögerung). Betrachtet man zu
einem Zeitpunkt t diese Impulsantworten nebeneinander aufgereiht,
so ergeben die Peaks eine abgetastete Version der von der virtuellen
Schallquelle ausgehenden Wellenfront. In einem weiteren graphischen
Verarbeitungsschritt (siehe 3a) kann
daraus die Wellenfront vereinfacht dargestellt und mit Interaktionselementen
dargestellt werden. Interagiert der Nutzer nun mit diesen Elementen,
so verändert
sich die graphische Darstellung der Wellenfront. Diese Darstellungsänderung
kann im nächsten
Schritt auf die einzelnen Impulsantworten IRL1..Ln aufgeprägt werden
-
Allgemein
gesagt wird durch das graphische Benutzerinterface die Manipulation
von Impulsantworten ermöglicht,
die für
jeden einzelnen Lautsprecher, der das Wiedergabevolumen 32 beschallt,
vorzugsweise zu berechnen sind.
-
Bei
dem in 3b gezeigten Ausführungsbeispiel
wird durch das graphische Benutzerinterface die Manipulation von
Impulsantworten ermöglicht,
die für
jeden einzelnen Lautsprecher, der das Wiedergabevolumen 32 beschallt,
zu berechnen sind. Die Darstellung der Impulsantworten ergibt sich
dabei direkt aus der Darstellung der graphischen Benutzerschnittstelle,
wozu exemplarisch eine Verbindungslinie 42 zwischen der
Tonquelle 30 und einem gedachten Lautsprecher am Rand des
Wiedergabevolumens 32 dargestellt ist. Die zu berechnende
Impulsantwort ist dabei unmittelbar durch die Form der Wellenfront
an dem Ort gegeben, an dem die Verbindungslinie 42 die
Wellenfront 34 schneidet. Die räumliche Position einer Tonquelle 30 wird,
wie es in 3a oder 3b zu
sehen ist, für
jeden einzelnen Lautsprecher in eine Zeitverzögerung und eine Amplitude übersetzt.
Die Amplitude ergibt sich dabei unmittelbar aus der Höhe der graphischen
Repräsentierung
der Wellenfront 34, wobei die Zeitverzögerung ebenfalls durch den
Schnittpunkt der Geraden 42 mit der Wellenfront 34 bestimmt
ist, wobei für
die Bestimmung der Zeitverzögerung
die Länge
der geschnittenen Teilstücke
der Geraden 42 maßgeblich
ist.
-
Alternativ
zu den bereits beschriebenen Manipulationsformen, die in der graphischen
Benutzerschnittstelle implementiert sind, ist eine Reihe weiterer
alternativer Szenarien leicht implementierbar.
-
So
wird z. B. die Wellenfrontdarstellung 34 in der Abbildung
durch zwei Kugeln bzw. Anfasser 36a und 36b begrenzt.
Die Manipulation der Wellenfront an diesen Punkten wirkt sich letztendlich
auf die Delays bzw. die Zeitverzögerungen
der an der Synthese beteiligten Lautsprecher des Wellenfeldsynthesesystems
aus. Weitere Anfasser auf der dargestellten Wellenfront 34 könnten beispielsweise
zur Veränderung
der Lautsprecheramplituden benutzt werden. Damit wird die einfache
Justierung einer Fensterung zur Vermeidung von Randeffekten genauso
möglich wie
die Definition eines Punktes mit maximaler Amplitude. Dieser Punkt
kann dann der Schallquelle, zumindest bezogen auf die Intensität, eine
frequenzunabhängige
Richtcharakteristik geben.
-
Für die Darstellung
der Lautstärke
einer Schallquelle kann beispielsweise die Größe der die Tonquelle beschreibenden
Kugel 30 benutzt werden. Die oben erwähnte Manipulation des Direktschall/Diffusschall-Verhältnisses
kann auch hier noch einmal angezeigt werden. Wenn die Lautstärke des
Direktschalls der Größe der Kugel 30 entspricht,
ist z. B. eine entfernte Schallquelle eher leiser und entspricht somit
einer kleinen Kugel. Eine Verknüpfung
mit der entfernungsabhängigen
Berechnung der Lautstärke einer
Schallquelle ist durch diese Darstellung somit einfachst realisierbar.
-
Mit
der erfindungsgemäßen graphischen
Benutzerschnittstelle in 3a oder 3b gelingt
es also, die mathematische Funktion, die die Impulsantwort verkörpert, intuitiv
und allgemein verständlich
so darzustellen, dass die Impulsantwort zielgerichtet dahingehend
manipuliert werden kann, dass ein gewünschter Richtungseindruck entsteht.
-
Während sich
die Möglichkeiten
der graphischen Benutzeroberfläche
aus 3a oder 3b zur
Positionierung einer Tonquelle, also zum Bestimmen eines Klangeindrucks,
der den Ort der Tonquelle wiedergibt, bezogen haben, wird anhand
der 4–8 erläutert werden,
dass die erfindungsgemäße graphische
Benutzerschnittstelle auch dazu geeignet ist, solche Impulsantworten
zu visualisieren und deren Änderung
zu ermöglichen,
die einen Klangeindruck bewirken, der dem eines zu simulierenden
Raums, wie beispielsweise einer Kathedrale, entspricht.
-
Um
dies zu ermöglichen,
gibt es zwei prinzipielle Möglichkeiten,
die anhand der 4 und 5 im Folgenden
erläutert
werden sollen.
-
4 zeigt
dabei eine Möglichkeit,
bei der zunächst
in einem Positionierungsschritt 50 die Tonquellen im Raum
angeordnet werden, wie es beispielsweise anhand von 3a oder 3b beschrieben
wurde. Dabei werden den Lautsprechen für jede Tonquelle Impulsantworten
zugeordnet.
-
Da
sich die Tonquelle in definierter räumlicher Position bezüglich der
Wiedergabeumgebung befindet, kann ein räumlicher Klangeindruck der
Tonquelle direkt aufgeprägt
werden, wenn sich diese in einer Raumrichtung bezüglich der
Wiedergabeumgebung befindet, für
die ein bestimmter räumlicher Klangeindruck
zu simulieren ist.
-
In
diesem Fall wird in einem Raumsimulationsschritt 52 für jede Tonquelle
und Raumrichtung eine Impulsantwortfunktion erzeugt, die an ein
Wiedergabesystem zusammen mit der Tonquelle in einem Transferschritt 54 übertragen
werden muss, um bei der Wiedergabe den gewünschten räumlichen Klangeindruck zu erzielen.
-
Wie
es 5 zeigt, ist es alternativ auch möglich, zunächst die
Position der Tonquellen in einem Positionierungsschritt 60 festzulegen,
in dem für Lautsprecher
für jede
Tonquelle Impulsantworten erzeugt werden, die die Position beschreiben.
Der Raumeindruck, der in einer Hörrichtung
entstehen soll, kann, da die im Wiedergabesystem verwendeten Lautsprecher
ebenfalls festen Raumrichtungen zugeordnet sind, auch dadurch erzeugt
werden, dass für
jeden Lautsprecher in einem Raumsimulationsschritt 62 zusätzlich eine
Impulsantwort erzeugt wird, die die Information über den in der Richtung des
betreffenden Lautsprechers befindlichen Raum enthält.
-
In
einem Transfer- bzw. Speicherschritt 64 muss an das Tonwiedergabesystem
dann die Tonquelle und für
jeden einzelnen Lautsprecher eine Positionsimpulsantwort und eine
Raumimpulsantwort übertragen
werden. Durch die Flexibilität
der erfindungsgemäßen graphischen
Benutzerschnittstelle kann die Zuordnung eines räumlichen Klangeindrucks also
entweder zu jeder Tonquelle individuell erfolgen oder es können Gruppen
von Tonquellen, die in einer ähnlichen
Raumrichtung bezüglich
der Wiedergabeumgebung angeordnet sind, zusammengefasst werden,
um mehrere diskrete Raumrichtungen darzustellen, wodurch bei der
Wiedergabe die erforderliche Rechenkapazität verringert wird.
-
Eine
Ausführungsform
der erfindungsgemäßen graphischen
Benutzerschnittstelle, die die Manipulation einer Impulsantwort
in einer Impulsantwort-Zeitdarstellung zeigt, ist in 6 gezeigt.
-
Dazu
werden die Raumrichtungen bezüglich einer
Wiedergabeumgebung 70 in acht diskrete Sektoren 72a–72h unterteilt.
Für jeden
der Sektoren 72a–72h wird
also ein gemeinsamer Raumeindruck mittels einer Impulsantwort-Zeitdarstellung
erzielt. Zur Visualisierung werden dabei die Einhüllenden
der zur Raumsimulation verwendeten acht Impulsantworten zu Flächen extruiert.
Diese Flächen werden
in Form eines Achtecks angeordnet und zu einer gemeinsamen Fläche 74 verbunden.
Dabei entspricht die Höhe
der Fläche über der
durch die Sektoren 72a–72i definierten
Fläche
der Amplitude der Impulsantwort. Die Entfernung vom Mittelpunkt
der Wiedergabeumgebung 70 stellt die Zeit dar, zeitlich am
Ende der Impulsantwort auftretende Ereignisse sind daher weiter
entfernt vom Mittelpunkt der Wiedergabeumgebung 70.
-
Mit
dieser Darstellung können
die Amplitudenverläufe
der Raumimpulsantworten über
die Zeit entsprechend ihrer Raumrichtung dargestellt werden. Die
Veränderung
erfolgt interaktiv durch Bewegen von hier beispielhaft dargestellten
Interaktionselementen 76a, b und c. Es wird also ermöglicht,
mit einem Blick die gesamte räumliche
Klangsituation zu erfassen und Abweichungen von dem gewünschten Verhalten
zu erkennen und zu beseitigen.
-
Beispielsweise
soll für
einen realen Raum die Nachhallzeit aus allen Richtungen in der Regel nahezu
gleich sein. In dem aufgezeigten Beispiel von 6 ist
die Nachhallzeit in Richtung des Sektors 72h jedoch reduziert,
was sich durch die Unsymmetrie der Gesamtfläche 74 leicht erkennen
lässt,
so dass der Unterschied zum realen, gleichmäßig nachhallenden Raum sofort
erkannt werden kann.
-
7 beschreibt
eine Darstellung von räumlichen
Impulsantworten in einer Zeit-Frequenz-Darstellung. Dargestellt
ist die Wiedergabeumgebung 80 und acht Zeit-Frequenz-Darstellungen von
Impulsantworten 82a–82h,
die acht diskreten Raumrichtungen bezüglich der Wiedergabeumgebung 80 zugeordnet
sind.
-
Allgemein
ist es mit dem erfindungsgemäßen Ausführungsbeispiel
in 7 möglich,
sowohl die Zeit- als auch die Frequenzkomponenten von Impulsantworten
bezogen auf ihre Raumrichtungen zu visualisieren und manipulierbar
zu machen. Die Zeitachse der Visualisierung läuft dabei ausgehend vom Mittelpunkt
der Wiedergabeumgebung 80 nach außen, so dass weiter entfernte
Punkte spätere
Ereignisse beschreiben. Die acht Flächen 82a–82h,
die die Impulsantworten in Form eines Wasserfalldiagramms darstellen,
können
beispielsweise anhand von Interaktionselementen 86a–86c verändert werden.
Die beispielhaft dargestellten Interaktionselemente 86a–86c erlauben
die Manipulation des Amplitudenfrequenzgangs zu einer bestimmten
Zeit, im hier dargestellten Beispiel also am Anfang der Impulsantwort.
In dem hier dargestellten Fall sind tiefe Frequenzen weiter links
und hohe Frequenzen weiter rechts angeordnet, so dass sofort zu
erkennen ist, dass in der räumlichen
Simulation die tiefen Frequenzen mit höherer Amplitude beginnen und
länger
ausklingen als die hohen Frequenzen. Dieser komplexe Zusammenhang,
der beispielsweise durch Beschreibung der Flächen 82a–82h in
Form einer Matrix gespeichert werden kann, ist hier intuitiv zu
erfassen und zu verändern.
-
Die
Art der Darstellung erlaubt es weiterhin, zusätzliche Effekte anzubringen
bzw. deren Wirkung zu erkennen, beispielsweise würden in dieser Darstellung
starke Reflexionen aus bestimmten Raumrichtungen als Erhebungen
auf den Flächen
der entsprechenden Raumimpulsantwort sichtbar werden.
-
Es
ist also durch die gleichzeitige Ansicht der Zeit- und Frequenzkomponente
ersichtlich, welche Frequenzanteile reflektiert werden. Mit einer
Verschiebung der Interaktionselemente 86a–86c an
eine entsprechende Stelle in der Impulsantwort kann diese Reflexion
sowohl zeitlich als auch frequenzbezogen bearbeitet werden, so dass
die große
Anzahl von der Visualisierung zugrundeliegenden Parameter günstig und
effizient abgetastet und gespeichert werden können.
-
8 zeigt
ein weiteres Beispiel einer erfindungsgemäßen graphischen Benutzerschnittstelle, bei
dem die Impulsant worten der einzelnen Raumrichtungen aus diskreten
Peaks bestehen. Dargestellt sind eine Wiedergabeumgebung 90,
acht diskrete Raumrichtungen 92a–92i und fünf exemplarische,
deltaförmige
Impulsantworten 94a–94e.
-
Da
peak- oder deltaförmige
Impulsantworten Zeitverzögerungen
eines Tonsignals entsprechen, können
somit richtungsabhängige
Multi-Tap-Delays realisiert werden. Dabei repräsentieren die Wellenfronten 94a–94e Echos
aus den ihnen zugeordneten Raumrichtungen. Ihr Abstand zum Mittelpunkt
des Wiedergabevolumens gibt den Zeitpunkt der Wiederholung des Ursprungssignals
an. Erfindungsgemäß kann beispielsweise
mittels eines Interaktionselementes 96 in Form einer Kugel
die Position der Wiederholungen durch radiale Bewegungen der Impulsantworten
von oder zum Mittelpunkt des Systems beeinflusst werden. Dabei kann
gleichzeitig die Amplitude der Wiederholungen durch die Höhe der Wellenfronten
in der vertikalen Richtung beeinflusst werden.
-
Der
Vorteil der hohen Intuitivität
der erfindungsgemäßen graphischen
Benutzerschnittstelle wird hier besonders deutlich, da die Position
der deltaförmigen
Peaks die Verzögerungszeit
eines Echos beschreibt, was akustisch gleichbedeutend ist mit einer
reflektierenden Wand mit vorgegebener Dämpfung, die sich an der Position
der Impulsantworten befindet.
-
In
einer erweiterten Variante der erfindungsgemäßen graphischen Benutzerschnittstelle
ist hier auch eine Zeit-Frequenz-Darstellung
realisierbar, um jedem Echo zusätzlich
einen individuellen Frequenzgang einzuprägen.
-
9 beschreibt
ein System zum Visualisieren und Bearbeiten von räumlichen
Toneffekten 100, das sich aus einem Signalverarbeitungsteil 102 und einem
Visualisierungs- und Interaktionsteil 104 zusammensetzt.
-
Erfindungsgemäß besteht
die Signalverarbeitung darin, dass eingehende Audiosignale 106 mittels
einer mathematischen Faltung 108 mit denen mittels des
Visualisierungs- und Interaktionsteils 104 bestimmten Impulsantworten
gefaltet werden, um daraus Audiosignale 110 zu erzeugen,
die den Klangeindruck eines zu simulierenden Raumes tragen. Der
Visualisierungs- und Interaktionsteil 104 weist eine Anzeigeeinrichtung
zum Anzeigen von berechneten Impulsantworten 112, eine
Einrichtung zum Empfangen einer Benutzeränderungseingabe 114,
eine Einrichtung zum Ermöglichen
einer Änderung
der graphischen Anzeige 116 sowie eine Einrichtung zum
Erfassen der geänderten
Impulsantwort 118 auf. Die Einrichtung zum Empfangen einer
Benutzeränderungseingabe 114 umfasst
ein Interaktionsgerät 120 sowie
eine Einrichtung zum Umsetzen der Interaktion 122. Die
Einrichtung zum Ermöglichen
einer Änderung
der graphischen Anzeige der Impulsantwort 116 umfasst eine
Ausgabeeinrichtung 124 zum Darstellen der ursprünglichen
Impulsantwort sowie eine Bildberechnungseinheit 126 zum
Visualisieren der ursprünglichen
Impulsantwort.
-
Von
der Einrichtung zum Empfangen einer Benutzeränderungseingabe und der Einrichtung
zum Ermöglichen
einer Änderung
der graphischen Anzeige der Impulsantwort 116 wird ein
visuelles Modell 112 erzeugt, das auf Parametern basiert,
die die Impulsantworten beschreiben und somit die Information über den
zu simulierenden Raum beinhalten. Wenn durch mehrmalige Interaktion
und Visualisierung ein geeignetes visuelles Modell erstellt wurde,
wird von der Einrichtung zum Erfassen der geänderten Impulsantwort 118 die
Parameter, die der Visualisierung zugrunde liegen, extrahiert und
als Impulsantworten an die Signalverarbeitung 102 übermittelt.
-
Bei
einem bevorzugten Ausführungsbeispiel der
vorliegenden Erfindung umfasst die Signalverarbeitung die Faltung
von N Eingangssignalen mit n Impulsantworten zu n Ausgangssignalen.
N kann dabei von z. B. acht Signalen bei der Generie rung von Halleffekten
für die
Wellenfeldsynthesewiedergabe bis hin zu einer sehr großen Zahl
bei der Generierung eines ganzen Wellenfeldes schwanken. Werden
mehrere Effekte oder Quellen gleichzeitig erzeugt, so müssen die
Ausgangssignale für
jeden Effekt oder jede Quelle am Ende aufsummiert werden.
-
Die
für die
Signalverarbeitung benötigten
Impulsantworten werden also mit Hilfe des Visualisierungs- und Interaktionsteils
des Systems generiert. Aus einer Impulsantwort können klangrelevante Parameter
generiert werden. Dabei ist zu unterscheiden, ob es sich um Raumsignale
oder Direktsignale handelt.
-
Bei
Raumsignalen können
unterschiedliche Methoden nach angewendet werden. Die gewonnenen
Werte lassen sich dann wie im Abschnitt zur Visualisierung beschrieben
grafisch darstellen. Mit Hilfe der Graphiken und den eingebauten
Interaktionselementen können
die Parameter verändert
und zu einer neuen Impulsantwort verarbeitet werden.
-
Im
Falle der Positionierung von Direktschall können aus dem Interface ebenfalls
Parameter gewonnen werden. Allerdings können diese erst durch die Anwendung
des Wellenfeldsynthese-Algorithmus in Impulsantworten für die Lautsprecherkanäle umgewandelt
werden. Die Parameter sind damit auf einer abstrakteren Ebene. Doch
der Aufbau des Blockschaltbildes in 9 ändert sich
dadurch nicht.
-
Mit
Hilfe dieses Systems können
also alle räumlichen
Toneffekte von Raumsimulation bis hin zu Multi-Tap-Delays visualisiert
und editiert werden. Dieses Konzept kann in allen herkömmlichen
Mehrkanalsystemen bis hin zur Wellenfeldsynthese eingesetzt werden.
Es bietet einen universellen Lösungsweg
für räumliche
Klangeffekte und deren intuitive Nutzbarmachung für den Benutzer.
-
Wie
es durch die beschriebenen Ausführungsbeispiele
verdeutlicht wird, besteht ein wesentlicher Vorteil der erfindungsgemäßen graphischen Benutzerschnittstelle
darin, dass komplexe mathematische Parameter intuitiv zugänglich gemacht
werden. Dadurch wird das Erzeugen bzw. Einstellen dieser Parameter
ermöglicht,
wobei insbesondere das gesamte Klanggeschehen jederzeit im Auge
behalten werden kann. Besonders vorteilhaft ist dabei, dass bei
den beschriebenen Ausführungsbeispielen, die
auf 3D-Visualisierungen basieren, die Richtung, in der die Wiedergabeumgebung
betrachtet wird, variiert werden kann, so dass ein entstehender
Klangeindruck dadurch noch besser vorhergesagt werden kann, dass
dieser aus verschiedenen Raumrichtungen beurteilt wird.
-
Obwohl
in der Darstellung in 1 die graphische Benutzerschnittstelle
einzelne diskrete Funktionsblöcke
aufweist, ist eine derartige Aufteilung nur als beispielhaft zu
verstehen, es sind prinzipiell beliebige Kombinationen und Zusammenfassungen
der einzelnen Funktionsblöcke
möglich.
So kann z. B. in naheliegender Weise die Anzeigeeinrichtung 12 mit
der Einrichtung zum Ermöglichen
einer Änderung 14 der
graphischen Anzeige kombiniert werden, wie es in den dargestellten
Ausführungsbeispielen teilweise
der Fall ist, wo die Änderungsmöglichkeit als
Teil der Anzeige bereits implementiert ist, beispielsweise in Form
der Anfasser 36a und 36b in 3a oder 3b.
-
Bei
der Einrichtung zum Empfangen einer Benutzeränderungseingabe sind prinzipiell
auch andere Verfahren als die in den Ausführungsbeispielen gezeigten
denkbar. Die Benutzereingabe kann mittels einer Maus, eines Touchscreens
oder jedweden anderen Möglichkeit
der Bewegung eines Cursors auf einem Bildschirm erfolgen. Auch die
direkte Eingabe von diskreten Änderungsschritten
mittels einer Tastatur ist darstellbar, beispielsweise bei einer
diskretisierten Darstellung einer Impulsantwort, wo in definierten
Zeitbereichen der Wert der Impulsantwort in diskreten Schritten eingestellt
werden kann, was beispielsweise mittels einer herkömmlichen
Tastatur leicht möglich
ist.
-
Die
Darstellung der Wellenfronten bzw. Impulsantworten und die Möglichkeit
zur Manipulation derselben sind nur als Beispiele zu verstehen,
es ist jedwede andere geeignete Darstellung von Impulsantwortfunktionen
ebenfalls möglich,
um erfindungsgemäß das Einstellen
bzw. das Erzeugen eines Raumeindrucks zu ermöglichen. Beispielsweise wäre es denkbar,
bei der Betrachtung verschiedener Raumrichtungen eine gemeinsame
Impulsantwortfunktion darzustellen, die gewissermaßen den
räumlichen
Grundcharakter vorgibt, die also für alle Raumrichtungen dieselbe
ist. Einen richtungsabhängigen Raumklangcharakter
könnte
man vorteilhafterweise dadurch darstellen, dass für jede Raumrichtung
lediglich die Differenz zur gemeinsamen Impulsantwortfunktion dargestellt
wird, so dass man leicht einen Eindruck davon erhält, wie
sich die betrachtete Raumrichtung in ihren räumlichen Eigenschaften von
dem Gesamtklangbild (mittleres Klangbild) unterscheidet.
-
Eine
Reihenfolge der Bearbeitung der Impulsantwortfunktionen, die die
Position einer Tonquelle bzw. den Raumeindruck beschreiben, ist
nicht fest vorgegeben. Es ist sowohl möglich, zuerst alle Tonquellen
im Raum zu positionieren und danach einen Raumeindruck zu erzeugen,
als auch zuerst den zu simulierenden Raum zu definieren, um darauffolgend
die Tonquellen innerhalb des Raums zu positionieren.
-
Demzufolge
unterscheiden sich die Bearbeitungsschritte für ein System zur Ansteuerung
eines Tonwiedergabesystems, das eine erfindungsgemäße graphische
Benutzerschnittstelle sowie einen Signalgenerator zum Liefern von
Lautsprechersignalen aufweist. Zum einen ist es möglich, jeder
Tonquelle, die in einer definierten Raumrichtung befindlich ist,
eine Rauminformation durch Falten mit einer räumlichen Impulsantwortfunktion
einzuprägen,
um dann in einem weiteren Schritt lautsprecherindividuell eine Faltung
mit Im pulsantworten vorzunehmen, welche die Position der Tonquellen
relativ zum Wiedergabevolumen beschreiben.
-
Alternativ
ist es möglich,
zunächst
die Tonquelle lautsprecherindividuell zu bearbeiten, d. h. individuelle
Lautsprechersignale durch Faltung des Tonsignals mit den die Position
der Tonquelle beschreibenden Impulsantworten zu erzeugen, um danach
Lautsprecher individuell eine weitere Faltung durchzuführen, die
den Raumeindruck erzeugt, wobei die Lautsprecher, die in fester
geometrischer Richtung zur Wiedergabeumgebung angeordnet sind, mit
einer räumlichen
Impulsantwort gefaltet werden, die dem zu simulierenden Raumeindruck
in der Richtung der Lautsprecher entsprechen.
-
Die
Form der graphischen Elemente, die in den Ausführungsbeispielen zur Visualisierung
der einzelnen wesentlichen Komponenten, wie der Position der Tonquelle
oder der Form einer Impulsantwort, dargestellt sind, sind als bevorzugte Ausführungsbeispiele
zu verstehen, jedoch ist die erfindungsgemäße Funktionsweise ebenso sichergestellt,
wenn sich die Art der geometrischen Darstellung bezüglich der
Form unterscheidet, je nach Anwendungszweck könnte eine unterschiedliche
Form sogar funktionalen Charakter haben, d. h. verschiedene Eigenschaften
beispielsweise einer Tonquelle beschreiben.
-
Die
Signalbearbeitung, die lautsprecherindividuell durch Faltung eines
Tonsignals mit einer Impulsantwortfunktion dargestellt ist, kann
sowohl kontinuierlich als auch diskret implementiert sein, wobei auch
alternative mathematische Methoden, den Raumeindruck, den eine Impulsantwort
beschreibt, einem Tonsignal aufzuprägen, möglich sind.
-
In
den Ausführungsbeispielen,
die im Vorhergehenden gezeigt sind, ist zur Erzeugung eines Raumeindrucks
der die Wiedergabeumgebung umschließende Raum in acht diskrete
Raumrichtungen unterteilt, wobei für jede Raumrichtung individuell
ein räumlicher
Klangcharakter festgelegt werden kann. Dies ist nur als Beispiel
zu verstehen, es sind selbstverständlich beliebige andere Anzahlen
von Raumrichtungen möglich,
prinzipiell ist die Zahl der Richtungen nach oben nicht begrenzt,
so dass es erfindungsgemäß leicht
möglich
ist, den gesamten Klangeindruck noch weiter zu verbessern.
-
Abhängig von
den Gegebenheiten kann das erfindungsgemäße Verfahren zum Verwenden
einer graphischen Benutzerschnittstelle zum Benutzen eines Tonwiedergabesystems
in Hardware oder in Software implementiert werden. Die Implementation kann
auf einem digitalen Speichermedium, insbesondere einer Diskette
oder CD mit elektronisch auslesbaren Steuersignalen erfolgen, die
so mit einem programmierbaren Computersystem zusammenwirken können, dass
das erfindungsgemäße Verfahren
zum Überprüfen des
Erfolges eines Entkernvorganges ausgeführt wird. Allgemein besteht
die Erfindung somit auch in einem Computer-Programm-Produkt mit einem
auf einem maschinenlesbaren Träger
gespeicherten Programmcode zur Durchführung des erfindungsgemäßen Verfahrens,
wenn das Computer-Programm-Produkt auf einem Rechner abläuft. In anderen
Worten ausgedrückt
kann die Erfindung somit als ein Computer-Programm mit einem Programmcode
zur Durchführung
des Verfahrens realisiert werden, wenn das Computer-Programm auf einem
Computer abläuft.