WO2007110087A1 - Anordnung zum wiedergeben von binauralen signalen (kunstkopfsignalen) durch mehrere lautsprecher - Google Patents

Anordnung zum wiedergeben von binauralen signalen (kunstkopfsignalen) durch mehrere lautsprecher Download PDF

Info

Publication number
WO2007110087A1
WO2007110087A1 PCT/EP2006/002731 EP2006002731W WO2007110087A1 WO 2007110087 A1 WO2007110087 A1 WO 2007110087A1 EP 2006002731 W EP2006002731 W EP 2006002731W WO 2007110087 A1 WO2007110087 A1 WO 2007110087A1
Authority
WO
WIPO (PCT)
Prior art keywords
head
transauralization
sources
virtual
signals
Prior art date
Application number
PCT/EP2006/002731
Other languages
English (en)
French (fr)
Inventor
Helmut Wittek
Original Assignee
Institut für Rundfunktechnik GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institut für Rundfunktechnik GmbH filed Critical Institut für Rundfunktechnik GmbH
Priority to PCT/EP2006/002731 priority Critical patent/WO2007110087A1/de
Publication of WO2007110087A1 publication Critical patent/WO2007110087A1/de

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/13Application of wave-field synthesis in stereophonic audio systems

Definitions

  • the invention relates to an arrangement for reproducing binaural signals (artificial head signals) by a plurality of loudspeakers according to the preamble of patent claim 1.
  • Binaural Technique o Dynamic Binaural Technique - Transaural Technique o Dynamic Transaural Technique Sound field synthesis techniques especially: wave field synthesis
  • an acoustic event can be transmitted by recording via the artificial head and playback via headphones.
  • the spatial quality of the reproduction achieved by the binaural technique is superior to loudspeaker reproduction. For example, sources in all directions in three-dimensional space can be reproduced.
  • FIG. 1 The left side shows the A Recording room in which an artificial head measures the BRIR in the respective direction.
  • the right side shows the playback, where the head rotation is measured by head tracker.
  • the head spin direction determines the associated BRIR set used in the processor for convolution.
  • the same ear signals are generated, which he would also have a headphone.
  • This effect describes a delusion of the listener: If he does occur, not the actual sound sources (namely the speakers) are localized, but the virtual source to which the binaural signals belong. This is achieved with the so-called "crosstalk canceling", as shown in Fig. 2.
  • transauralization loudspeakers The transaural signals (crosstalk canceling signals) will be referred to as "transauralization loudspeakers.”
  • the number and position of the transauralization transducers affect the quality of transauralization Compatibility Using a standard 2/0 stereo setup Adding rear speakers increases the quality and, above all, the stability of the transauralization, as described in Hokari, H., Furumi, Y., Shimada, S. "A Study on Loudspeaker Arrangement in Multi-Channel Transaural System for Sound Image Localization "in Proceedings of the AES 19th Int. Conference, Elmau, Germany, 2002 is known.
  • the head movement of the listener is evaluated.
  • the respective ear transfer functions are dynamically exchanged.
  • the crosstalk canceling filters also depend on the head angle because they are based on filters calculated from the crosstalk transfer functions HLR and HRL.
  • HLR and HRL filters calculated from the crosstalk transfer functions
  • BRIR filters calculated from the crosstalk transfer functions
  • the range of possible head rotations or head movements in which dynamic transauralization succeeds depends on the position of the transauralization loudspeakers.
  • the problem with dynamic transauralization is the relative position of the ear and transauralization loudspeaker that changes during head movements. From this relative position, the design of the crosstalk canceling filter depends. In addition, the quality of transauralization is highly dependent on it. Since the relative position of the transauralization loudspeakers changes with static arrangement of the transauralization loudspeakers with each head rotation / movement, the crosstalk canceling filters also change to the same extent. Likewise, the quality of transauralization is constantly changing.
  • the relative positional changes of the transauralization loudspeakers are therefore detrimental to the success of the transauralization because it helps inadvertently localizing the transauralization loudspeakers. This is explained by the fact that in human perception, not just auditory perception, the change in a state is generally very perceptible. In contrast, the hearing can describe the shape of a static state worse.
  • the object of the invention is to provide an arrangement for reproducing binaural signals (artificial head signals) in which the same crosstalk canceling filter can be used for all head directions.
  • the relative position of ears and transauralization loudspeakers is kept constant for each head rotation direction.
  • the same crosstalk canceling filter can be used.
  • Wave field synthesis see Berkhout, AJ., De Vries, D. and Vogel, P. "Acoustic control by wave field synthesis” in Journal of the Acoustical Society of America, Vol.93, 1993, pp 2764-2778
  • HOA Higher Order Ambisonics
  • Fig. 4 is a signal flow diagram of the inventive arrangement, wherein in the
  • Brackets are missing the not displayed symbol ⁇ for the head rotation angle (azimuth) missing, and
  • Fig. 5 shows three views of a WFS circle array for generating the used in the inventive arrangement virtual transauration sources (in the example 2 sources, it can also be n sources), with 22 speakers are mounted in a certain radius and critical to the height of the Alias frequency among other things is the speaker distance.
  • the virtual sources are generated by a loudspeaker array according to the principles of wavefield synthesis.
  • the array is in a location where it can generate all sorts of virtual sources. That is, all positions of the virtual transauralization sources for each possible head spin direction must be able to be generated by the array.
  • Essential to the invention are the inclusion of the WFS and the direction independence of the crosstalk canceling filter.
  • the virtual sources are generated in such a way that they also have as few differences as possible, especially in the frequency spectrum at the ear of the listener, at the different locations, that is to say when the head moves. This is achieved by two measures:
  • Focused sources are virtual WFS sources that are reproduced before the array. This has two advantages:
  • a focused source has a very high alias frequency (Spatial Aliasing Frequency) at a small distance to the listener
  • the wave field can only be correctly reproduced up to a certain maximum frequency, the alias frequency, due to the finite speaker spacing All sounds above the alias frequency will be displayed incorrectly and, in particular, differently at each point in the listening zone, which also means that virtual sources at different locations in a listening location will produce different frequency spectrums in the range above the alias frequency with a movement of the head and a corresponding movement of the virtual source also the frequency spectrum above the alias frequency, which could then be audible.
  • a maximum shift of the alias frequency upwards improves this and leads to a substantial reduction of the changing sound components. 2.
  • a circular array is used whose bisector intersects the head of the listener. In the plan view, the head is thereby in the middle of the circle, as can be seen from the view 1 in FIG. 5.
  • the height of array and head may be different, as shown in views 2 and 3 of FIG. As a result, the acceptance and applicability of such a system is significantly increased.
  • the circular design of the array minimizes the difference between the virtual sources in the different directions. This is because, except for the exact location of each speaker, the relative array design is the same for each source. There is only a shift of the individual speakers instead.
  • the distance between the virtual transauralization sources and the distance between the ear and the array level depend on the desired alias frequency. Similarly, the radius of the circle array and the speaker distances determine the alias frequency. The maximum distance between the ear and the array plane is limited by the necessary signal separation between the different transauralization sources and the achievable stability of the transauralization.
  • the alias frequency should be high enough to reproduce the frequency range important for transauralization as accurately as possible, and the perceptible color changes in head movement to be minimal.
  • the speaker spacing of the speaker array can be kept small by using small speakers. These do not necessarily reflect the full audible frequency range.
  • the decisive parts for directional perception are located above approx. 200 Hz.
  • the frequency components below this frequency can be reproduced by a separate monophonic woofer. This is optimally over the head, since the localizability of the woofer is minimal.
  • An optimal solution to avoid disturbing ceiling reflections and to optimize the speaker radiation is the installation of the circular array in a baffle, so an acoustically dense plate, which is suspended above the head. This is indicated in Fig. 5 by the gray area. An acoustic short circuit should be avoided.
  • the woofer can be installed over the head.
  • the arrangement according to the invention is preferably used as a virtual headphone when headphone reproduction without the actual wearing of a headphone is required.
  • the arrangement according to the invention can be regarded as an extension of the BRS system. That is, a virtual space can be auralized (made to be heard) without the listener being affected by headphones. This could be used as a virtual listening room or in any other situations where a realistic auralization is required, e.g. Spatial planning, computer games, 3D cinema.
  • the location of the listener is however static, which means that those applications are preferred in which this does not matter, e.g. in front of the computer, in the car, in the cinema, etc.
  • a virtual sound field can be put over the actually existing sound field. That is, real and virtual sound field can be perceived at the same time.
  • a virtual audio environment can complement, accompany and support the natural sounds of driving.
  • Special sound installations are conceivable which make use of real and virtual sound objects, e.g. in the museum or in a theme park, or ghost train.
  • Another important application is the protuberance of a virtual acoustic environment, ie a room.
  • the signal of the real sound source is picked up with a microphone and processed with the stored BRIR (which in this case is artificially exempt from the direct signal).
  • the listener perceives the direct sound of the real sound source, which guarantees optimal localization.
  • the real source of sound is through the virtual space pattern in virtual space.

Abstract

Für eine Anordnung zum Wiedergeben von binauralen Signalen (Kunstkopfsignalen) durch mehrere Lautsprecher, bei welcher dasselbe Crosstalk-Cancelling-Filter zum Ausfiltern von Übersprechanteilen der wiedergegebenen binauralen Signale für alle Kopfrichtungen benutzt werden kann, wird vorgeschlagen, dass die Lautsprecherwiedergabe durch virtuelle Transauralisierungsquellen unter Verwendung einer Schallfeldsynthese mit Hilfe eines Lautsprecherarrays erfolgt. Die Position der virtuellen Transauralisierungsquellen ist in Abhängigkeit von der ermittelten Kopfdrehung des Hörers dynamisch veränderbar, derart, dass die relative Position der Ohren des Hörers und der Transauralisierungsquellen für jede Kopfdrehung konstant ist.

Description

Anordnung zum Wiedergeben von binauralen Signalen (Kunstkopfsignalen) durch mehrere Lautsprecher
BESCHREIBUNG
Die Erfindung bezieht sich auf eine Anordnung zum Wiedergeben von binauralen Signalen (Kunstkopfsignalen) durch mehrere Lautsprecher gemäß dem Oberbegriff des Patentanspruchs 1.
Stand der Technik
Der für die Erfindung maßgebliche Stand der Technik ergibt sich aus folgenden Gebieten der Elektroakustik:
Binauraltechnik o dynamische Binauraltechnik - Transauraltechnik o dynamische Transauraltechnik Schallfeldsynthesetechniken, speziell: Wellenfeldsynthese
Mit Hilfe der Binauraltechnik kann ein akustisches Ereignis durch Aufnahme per Kunstkopf und Wiedergabe per Kopfhörer übertragen werden. Die räumliche Qualität der durch die Binauraltechnik erreichten Wiedergabe ist einer Lautsprecherwiedergabe überlegen. Es können beispielsweise Quellen in allen Raumrichtungen im dreidimensionalen Raum wiedergegeben werden.
Dies gelingt am einfachsten, wenn die Ohrübertragungsfunktionen bekannt sind. Diese werden mit dem trockenen Eingangssignal gefaltet und auf dem Kopfhörer wiedergegeben. Befindet sich der Kopf bei der Aufnahme in einem Raum, spricht man von binauralen Raumübertragungsfunktionen („BRIR" = Binaural Room Impulse Response). Dasselbe Prinzip wird erfolgreich im Verfahren „BRSλV (Binaural Room Scanning, vergl. Mackensen, P., Felderhoff, U., Theile, G. „Binaural Room Scanning - A new Tool for Acoustic and Psychoacoustic Research" in Proceedings of the DAGA 1999 und Theile, G. Vortrag zur AES Convention Paris, 2000 auf www.hauptmikrofon.de/theile.htm) des Instituts für Rundfunktechnik eingesetzt. Hier wird zusätzlich ein dynamischer Austausch der BRIR vorgenommen und damit ein wesentliches Merkmal des natürlichen Hörens implementiert. Schon kleine Kopfbewegungen vermeiden nachweisbar die Artefakte der Binauraltechnik, nämlich Vorne-Hinten-Vertauschungen und Im-Kopf-Lokalisation. Deshalb wird bei BRS oder allgemein bei dynamischer Binauraltechnik die Kopfdrehung bzw. Kopfbewegung mit einem sogenannten Headtracker gemessen und an einen Prozessor übermittelt. Der Prozessor ermittelt die zu der jeweiligen Kopfdrehrichtung passende BRIR. Das Prinzip ist in Fig. 1 erläutert. Die linke Seite zeigt den Aufnahmeraum, in dem ein Kunstkopf die BRIR in der jeweiligen Richtung misst. Die rechte Seite zeigt die Wiedergabe, bei der die Kopfdrehrichtung mittels Headtracker gemessen wird. Die Kopfdrehrichtung bestimmt den zugehörigen BRIR-Satz, der im Prozessor für die Faltung verwendet wird. Als Eingangssignale dienen die Signale für fünf Studiolautsprecher (3/2-Stereo-Mix), die in einem virtuellen Abhörraum auralisiert werden.
Mit Hilfe der Transauraltechnik können binaurale Signale (=Kunstkopfsignale) durch Lautsprecher wiedergegeben werden. Für einen Hörer können damit an einer bestimmten Hörposition (mit Kenntnis der jeweiligen Ohrübertragungsfunktionen) dieselben Ohrsignale erzeugt werden, die er auch mit einem Kopfhörer hätte. Dieser Effekt beschreibt eine Täuschung des Hörers: Tritt er auf, werden nicht die eigentlichen Schallquellen (nämlich die Lautsprecher) lokalisiert, sondern die virtuelle Quelle, zu der die binauralen Signale gehören. Dies wird mit dem so genannten „Crosstalk Cancelling" erreicht, wie Fig. 2 zeigt. Mit Hilfe eines einfachen vorgeschalteten Prozessors (Ctc filter) kann das Übersprechen (Crosstalk) ausgelöscht werden. Die Theorie dazu ist seit langem bekannt, beispielsweise aus Bauck, J., Cooper, D.H. „Generalized Transaural Stereo and Applications" in Journal of the AES, Vol.44/9, 1996 und Schroeder, M. R. and Atal, B.S., "Computer Simulation of Sound Transmission in Rooms" in IEEE Conv. Rec, pt. 7, pp. 150-155 (1963). Die Lautsprecher, auf denen die transauralen Signale (Signale nach dem Crosstalk- Cancelling) wiedergegeben werden, sollen im folgenden als „Transauralisierungs- Lautsprecher" bezeichnet werden. Die Anzahl und Position der Transauralisierungs- Lautsprecher beeinflusst die Qualität der Transauralisierung. Normalerweise wird aus Gründen der Kompatibilität ein gewöhnliches 2/0-Stereo-Setup verwendet. Durch das Hinzufügen von Lautsprechern im hinteren Bereich lässt sich die Qualität und vor allem Stabilität der Transauralisierung erhöhen, wie aus Hokari, H., Furumi, Y., Shimada, S. „A Study on Loudspeaker Arrangement in Multi-Channel Transaural System for Sound Image Localization" in Proceedings of the AES 19th Int. Conference, Elmau, Germany, 2002 bekannt ist.
Es ist weiterhin bekannt, dass sich auch ein transaurales System mit dynamisch veränderbaren Filtern verwirklichen lässt (so genannte „dynamische Transauraltechnik", siehe Lentz, T., Renner, C. „A Four-Channel Dynamic Cross-Talk Cancellation System" in Proceedings of the CFA/DAGA 2004, Strasbourg, France; Gardner, B. "3-D Audio using Loudspeakers", Doktorarbeit am Massachusetts Institute of Technology, USA, 1997; Georgiou, G., Mouchtaris, A., Roumeliotis, S., Kyriakakis, C. "Immersive Sound Rendering Using Laser-Based Tracking" in Proceedings of the 109th AES Convention, Los Angeles, 2000, Preprint No.5227; Algazi, V., Duda, R., Thompson, D. "Motion-Tracked Binaural Sound" in Proceedings of the 116th AES Convention, Berlin, 2004, Preprint No.6015).
Dabei wird wiederum wie bei der dynamischen Binauraltechnik die Kopfbewegung des Hörers ausgewertet. Wiederum werden die jeweiligen Ohrübertragungsfunktionen dynamisch ausgetauscht. Auch die Crosstalk-Cancelling-Filter sind vom Kopfwinkel abhängig, da sie auf Filtern basieren, die aus den Übersprech-Übertragungsfunktionen HLR und HRL errechnet werden. In einer Datenbank müssen nun sowohl die Übersprech- Übertragungsfunktionen als auch die Ohrübertragungsfunktionen bzw. BRIR für mehrere Kopfdrehwinkel vorliegen, so dass der gesamte Datensatz dynamisch ausgetauscht werden kann. Der Bereich der möglichen Kopfdrehrichtungen bzw. Kopfbewegungen, in dem eine dynamische Transauralisierung gelingt, ist abhängig von der Position der Transauralisierungs-Lautsprecher. Für die Transauralisierungs-Lautsprecher sind jedoch nicht beliebige Positionen möglich, wie aus Lentz, T., Renner, C. aaO und Algazi, V., Duda, R., Thompson, D. aaO bekannt ist. Wird z.B. ein gewöhnliches 2/0-Stereo-Setup verwendet, ist eine Kopfdrehung aus dem Bereich der Lautsprecher hinaus (d.h. +/- 30°) nicht möglich. In dem Aufsatz von Lentz, T., Renner, C. wird diesem Problem damit begegnet, dass für unterschiedliche Kopfrichtungen auch unterschiedliche Transauralisierungs-Lautsprecher verwendet werden, so dass einer gewissen Kopfrichtung auf ein anderes Transauralisierungs-Lautsprecher-Paar umgeschaltet wird Wie hierzu in Fig. 3 gezeigt ist, wird eine 360°-Drehung des Kopfes dadurch ermöglicht, dass jedem Sektor von möglichen Kopfdrehrichtungen ein bestimmtes Transauralisierungs-Lautsprecher-Paar (gebildet aus den vier statischen Lautsprechern „Speaker 1 bis 4") zugeordnet wird. Es ergeben sich dadurch acht Sektoren I bis VIII. So soll für jede Kopfdrehrichtung eine stabile Transauralisierung ermöglicht werden.
Problemstellung
Das Problem bei der dynamischen Transauralisierung ist die sich bei Kopfbewegungen verändernde relative Position von Ohr und Transauralisierungs-Lautsprecher. Von dieser relativen Position ist die Gestaltung der Crosstalk-Cancelling-Filter abhängig. Außerdem ist die Qualität der Transauralisierung davon stark abhängig. Da sich die relative Position der Transauralisierungs-Lautsprecher bei statischer Anordnung der Transauralisierungs- Lautsprecher bei jeder Kopfdrehung/-bewegung verändert, verändern sich auch die Crosstalk-Cancelling-Filter in gleichem Maße. Ebenso ändert sich ständig die Qualität der Transauralisierung.
Zum Verständnis dieser Probleme sei folgendes angemerkt:
Da jede Transauralisierung in Bezug auf die physikalische Genauigkeit der Signale nur eine Näherung darstellt, weil weder die Aussenohr-Übertragungsfunktionen noch die genaue Position der Ohren genau ermittelt werden können und außerdem der inversen Filterung beim Crosstalk-Cancelling Grenzen gesetzt sind, treten bei jeder Kopfdrehrichtung gewisse spezifische Fehler auf. Diese Fehler bestehen aus dem Unterschied zwischen tatsächlicher und eigentlich notwendiger Filterung. Die Fehler machen sich als Beeinträchtigung der Klangfarbe bemerkbar, was im statischen Fall das nicht hörbar unbedingt sein muss. Werden nun diese Fehler in ihrer Gestalt variiert, was eine unvermeidbare Folge der beschriebenen Veränderung der relativen Position ist, so treten spektrale Verschiebungen auf, die unweigerlich als Klangfarbenartefakte hörbar werden. Damit ist nun auch der Gesamterfolg der Transauralisierung beeinträchtigt, da sich die laufend verändernden Spektren negativ auf die beabsichtigte akustische Täuschung auswirken.
Außerdem sind die relativen Positionsänderungen der Transauralisierungs-Lautsprecher deshalb schädlich für den Erfolg der Transauralisierung, weil die unbeabsichtigte Lokalisierung der Transauralisierungs-Lautsprecher dadurch unterstützt wird. Dies erklärt sich dadurch, dass in der menschlichen Wahrnehmung, nicht nur der auditiven Wahrnehmung, im Allgemeinen immer die Veränderung eines Zustands stark wahrnehmbar ist. Im Gegensatz dazu kann das Gehör die Gestalt eines statischen Zustands schlechter beschreiben.
Die Aufgabe der Erfindung besteht darin, eine Anordnung zum Wiedergeben von binauralen Signalen (Kunstkopfsignalen) anzugeben, bei welcher für alle Kopfrichtungen dasselbe Crosstalk-Cancelling-Filter benutzt werden kann.
Diese Aufgabe wird durch die kennzeichnenden Merkmale es Patentanspruchs 1 gelöst.
Vorteilhafte Ausgestaltungen und Weiterbildung der erfindungsgemäßen Anordnung ergeben sich aus den Unteransprüchen.
Bei der erfindungsgemäßen Anordnung wird die relative Position von Ohren und Transauralisierungs-Lautsprechern für jede Kopfdrehrichtung konstant gehalten. Damit treten die vorstehend beschriebenen Nachteile nicht mehr auf. Für alle Kopfrichtungen kann dasselbe Crosstalk-Cancelling-Filter benutzt werden. Um die relative Position von Ohren und Transauralisierungs-Lautsprechern für jede Kopfdrehrichtung konstant zu halten, werden nicht diskrete Transauralisierungs-Lautsprecher sondern virtuelle Transauralisierungs-Quellen benutzt. Diese werden mit Hilfe einer Wiedergabetechnik erzeugt, die eine Schallfeldsynthese unter Verwendung mehrerer Sekundärquellen (=Arraylautsprecher) durchführt. Da die Quellen virtuelle Quellen sind, kann ihre Position dynamisch verändert werden. Die virtuellen Transauralisierungs-Quellen werden bei einer Kopfdrehung mit dem Kopf „mitgeführt" und verändern somit ihre absolute Position.
Es sind eine Reihe von Techniken für die Schallfeldsynthese bekannt, die eng miteinander verwandt sind, z.B. Wellenfeldsynthese (WFS, siehe Berkhout, AJ., de Vries, D. and Vogel, P. „Acoustic control by wave field synthesis" in Journal of the Acoustical Society of America, Vol.93, 1993, pp 2764-2778) und und Higher Order Ambisonics (HOA, siehe Daniel, J., Moreau, S., Nicol, R. "Further Investigations of High Order Ambisoncis and Wave Field Synthesis for Holophonic Sound Reproduction" in Proceedings 114th AES Convention, Amsterdam, Preprint No. 5788, 1998.). Da diese Verfahren in der Lage sind, in Bezug auf viele Schallfeldparameter dieselben Ergebnisse zu produzieren, ist keines dieser Verfahren gegenüber einem anderen für die Zwecke der Erfindung schlechter. Entscheidend für die Erfindung ist lediglich, dass eine virtuelle Quelle mit definierten physikalischen Eigenschaften (stabiler Ort, Schallbündelung, Übertragungsfunktion) erzeugt wird. Dies kann nur mit einer Technik geschehen, die ein Schallfeld quasi realgetreu nachbilden kann, so wie dies WFS und HOA leisten. Im Folgenden wird nur die Wellenfeldsynthese genannt, wenn von einer Schallfeldsynthese-Technik die Rede ist. Es kann aber auch eine andere Schallfeldsynthese-Technik wie z.B. HOA verwendet werden, wenn sie so implementiert wird, dass damit die gleichen oder bessere Eigenschaften der virtuellen Quelle im Sinne der Erfindung erzielt werden.
Die Erfindung wird an Hand der Zeichnungen näher erläutert. Es zeigt:
Fig. 4 einen Signallaufplan der erfindungsgemäßen Anordnung, wobei in den
Klammern fehlt jeweils das nicht angezeigte Symbol Φ für den Kopfdrehwinkel (Azimuth) fehlt, und
Fig. 5 drei Ansichten eines WFS-Kreisarrays zur Erzeugung der bei der erfindungsgemäßen Anordnung benutzten virtuellen Transaurisierungs- Quellen (im Beispiel 2 Quellen, es können auch n Quellen sein), wobei 22 Lautsprecher in einem bestimmten Radius angebracht sind und entscheidend für die Höhe der Alias-Frequenz unter anderem der Lautsprecherabstand ist. Bei dem in Fig. 4 gezeigten Signallaufplan der erfindungsgemäßen Anordnung werden die virtuellen Quellen von einem Lautsprecherarray nach den Prinzipien der Wellenfeldsynthese erzeugt. Das Array befindet sich an einem Ort, an dem es alle möglichen virtuellen Quellen erzeugen kann. Das heißt, alle Positionen der virtuellen Transauralisierungs-Quellen für jede mögliche Kopfdrehrichtung müssen vom Array erzeugt werden können. Erfindungswesentlich sind dabei die Einbeziehung der WFS und die Richtungsunabhängigkeit der Crosstalk-Cancelling-Filter. Die virtuellen Quellen werden derart erzeugt, dass auch sie an den unterschiedlichen Orten, das heißt bei Bewegung des Kopfes, möglichst wenig Unterschiede, besonders im Frequenzspektrum am Ohr des Hörers, aufweisen. Dies wird durch zwei Maßnahmen erreicht:
1. Es werden sog. fokussierte WFS-Quellen zwischen dem Array und den Ohren des Hörers erzeugt. Fokussierte Quellen sind virtuelle WFS-Quellen, die vor dem Array reproduziert werden. Dies hat zwei Vorteile:
a) Im Fokuspunkt wird der Schall gebündelt. Dadurch haben störende und schlecht zu kontrollierende Einflüsse wie Hintergrundgeräusche und Raumreflektionen weniger Gewicht, weil der direkte Schallanteil, der von der fokussierten Quelle ausgeht, durch seine Nähe zum Ohr relativ laut ist.
b) Eine fokussierte Quelle hat bei geringem Abstand zum Hörer eine sehr hohe Alias-Frequenz (englisch „Spatial Aliasing Frequency"). Bei WFS kann aufgrund des endlich kleinen Lautsprecherabstands das Wellenfeld nur bis zu einer gewissen Höchstfrequenz, der Alias-Frequenz, korrekt reproduziert werden. Alle Schallanteile über der Alias-Frequenz werden unkorrekt und vor allem an jedem Punkt in der Hörzone unterschiedlich wiedergegeben. Das bedeutet auch, dass virtuelle Quellen an verschiedenen Orten an einem Hörort unterschiedliche Frequenzspektren im Bereich über der Alias- Frequenz erzeugen. Demzufolge ändert sich bei einer Bewegung des Kopfes und einer korrespondierenden Bewegung der virtuellen Quelle auch das Frequenzspektrum über der Alias-Frequenz, was dann hörbar sein könnte. Eine größtmögliche Verschiebung der Alias-Frequenz nach oben verbessert dies und führt zu einer wesentlichen Verringerung der sich ändernden Schallanteile. 2. Es wird ein kreisrundes Array benutzt, dessen Mittelsenkrechte den Kopf des Hörers schneidet. In der Draufsicht befindet sich dadurch der Kopf in der Mitte des Kreises, wie aus der Ansicht 1 in Fig. 5 ersichtlich ist. Die Höhe von Array und Kopf kann unterschiedlich sein, wie dies in Ansicht 2 und 3 von Fig. 5 gezeigt ist. Dadurch wird die Akzeptanz und Einsetzbarkeit eines solchen Systems deutlich erhöht. Durch das kreisrunde Design des Arrays wird der Unterschied zwischen den virtuellen Quellen in den unterschiedlichen Richtungen minimiert. Grund dafür ist, dass bis auf die genaue Position der einzelnen Lautsprecher das relative Arraydesign für jede Quelle dieselbe ist. Es findet lediglich eine Verschiebung der Einzellautsprecher statt.
Der Abstand der virtuellen Transauralisierungs-Quellen sowie der Abstand zwischen Ohr und Arrayebene hängen von der gewünschten Alias-Frequenz ab. Ebenso bestimmen der Radius des Kreisarrays sowie die Lautsprecherabstände die Alias-Frequenz. Der maximale Abstand zwischen Ohr und Arrayebene wird durch die nötige Signaltrennung zwischen den verschiedenen Transauralisierungs-Quellen sowie die erreichbare Stabilität der Transauraiisierung begrenzt.
Die Alias-Frequenz sollte so hoch sein, dass der für die Transauraiisierung wichtige Frequenzbereich möglichst korrekt reproduziert wird und dass die wahrnehmbaren Klangfarbenänderungen bei Kopfbewegungen minimal sind.
Die Lautsprecherabstände des Lautsprecherarrays können dadurch klein gehalten werden, dass kleine Lautsprecher verwendet werden. Diese müssen nicht unbedingt den vollen hörbaren Frequenzbereich wiedergeben. Die für die Richtungswahrnehmung entscheidenden Anteile sind über ca. 200 Hz angesiedelt. Die Frequenzanteile unter dieser Frequenz können von einem separaten monophonen Tieftöner wiedergegeben werden. Dieser befindet sich im Optimalfall über dem Kopf, da hier die Lokalisierbarkeit des Tieftöners minimal ist.
Eine optimale Lösung zur Vermeidung von störenden Deckenreflektionen sowie zur Optimierung der Lautsprecherabstrahlung ist der Einbau des Kreisarrays in eine Schallwand, also eine akustisch dichte Platte, die über dem Kopf abgehängt wird. Dies ist in Fig. 5 durch die graue Fläche angedeutet. Ein akustischer Kurzschluss ist zu vermeiden. Der Tieftöner kann über dem Kopf eingebaut werden. Die erfindungsgemäße Anordnung kommt bevorzugt als virtueller Kopfhörer zur Anwendung, wenn eine Kopfhörerwiedergabe ohne das tatsächliche Tragen eines Kopfhörers erforderlich ist.
Im Zusammenhang mit der Wiedergabe von binauralen Signalen kann die erfindungsgemäße Anordnung als Erweiterung des BRS-Systems angesehen werden. Das heißt, es kann ein virtueller Raum auralisiert (zu Gehör gebracht) werden, ohne dass der Hörer durch Kopfhörer beeinträchtigt ist. Dies könnte Anwendung finden als virtueller Abhörraum oder auch in beliebigen anderen Situationen, in denen eine realistische Auralisierung gefragt ist, z.B. Raumplanung, Computerspiele, 3D-Kino. Der Ort des Hörers ist dabei allerdings statisch, was bedeutet, dass diejenigen Anwendungen bevorzugt sind, bei der dies keine Rolle spielt, z.B. vor dem Computer, im Auto, im Kino, usw.
Das Fehlen eines Kopfhörers bietet noch einen weiteren entscheidenden Vorteil: Nun kann ein virtuelles Schallfeld über das tatsächlich vorhandene Schallfeld gestülpt werden. Das heißt, reales und virtuelles Schallfeld können zur selben Zeit wahrgenommen werden. Beispielsweise kann eine virtuelle Audioumgebung die natürlichen Geräusche beim Autofahren komplettieren, begleiten und unterstützen. Spezielle Klanginstallationen sind denkbar, die Gebrauch von echten und virtuellen Schallobjekten machen, z.B. im Museum oder in einem Themenpark, bzw. Geisterbahn. Eine weitere wichtige Anwendung ist die Überstülpung einer virtuellen akustischen Umgebung, also eines Raums. Dabei wird das Signal der echten Schallquelle mit einem Mikrofon abgenommen und mit der gespeicherten BRIR (die in diesem Fall künstlich vom Direktsignal befreit ist) verarbeitet. Der Hörer nimmt den Direktschall der echten Schallquelle wahr, der optimale Lokalisation garantiert. Die echte Schallquelle befindet sich durch das virtuelle Raummuster im virtuellen Raum.

Claims

PATENTANSPRÜCHE
1. Anordnung zum Wiedergeben von binauralen Signalen (Kunstkopfsignalen) durch mehrere Lautsprecher, mit einer Filtereinrichtung, welche die Übersprechanteile der binauralen Signale bei der Lautsprecherwiedergabe ausfiltert, dadurch gekennzeichnet, dass die Lautsprecherwiedergabe durch virtuelle Transauralisierungsquellen unter Verwendung einer Schallfeldsynthese mit Hilfe eines Lautsprecherarrays erfolgt, wobei die Position der virtuellen Transauralisierungsquellen in Abhängigkeit von der ermittelten Kopfdrehung des Hörers dynamisch veränderbar ist, derart, dass die relative Position der Ohren des Hörers und der Transauralisierungsquellen für jede Kopfdrehung konstant ist.
2. Anordnung nach Anspruch I1 dadurch gekennzeichnet, dass ferner die Position des Kopfes des Hörers im Raum ermittelt und zur Auswertung herangezogen wird.
3. Anordnung nach Anspruch 1, dadurch gekennzeichnet, dass ein kreisrundes Lautsprecherarray vorgesehen ist, dessen Mittelsenkrechte den Kopf des Hörers schneidet.
4. Anordnung nach Anspruch 1, dadurch gekennzeichnet, dass ein Lautsprecherarray vorgesehen ist, das über dem Kopf des Hörers angebracht ist.
5. Anordnung nach Anspruch 1, dadurch gekennzeichnet, dass als virtuelle Transauralisierungsquellen fokussierte virtuelle Quellen vorgesehen sind.
6. Anordnung nach einem der Ansprüche 1 bis 4, dadurch gekennzeichnet, dass für das Lautsprecherarray kleine Lautsprecher vorgesehen sind und ein Tieftöner als separater monophoner Lautsprecher vorgesehen ist.
PCT/EP2006/002731 2006-03-24 2006-03-24 Anordnung zum wiedergeben von binauralen signalen (kunstkopfsignalen) durch mehrere lautsprecher WO2007110087A1 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
PCT/EP2006/002731 WO2007110087A1 (de) 2006-03-24 2006-03-24 Anordnung zum wiedergeben von binauralen signalen (kunstkopfsignalen) durch mehrere lautsprecher

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/EP2006/002731 WO2007110087A1 (de) 2006-03-24 2006-03-24 Anordnung zum wiedergeben von binauralen signalen (kunstkopfsignalen) durch mehrere lautsprecher

Publications (1)

Publication Number Publication Date
WO2007110087A1 true WO2007110087A1 (de) 2007-10-04

Family

ID=37103139

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/EP2006/002731 WO2007110087A1 (de) 2006-03-24 2006-03-24 Anordnung zum wiedergeben von binauralen signalen (kunstkopfsignalen) durch mehrere lautsprecher

Country Status (1)

Country Link
WO (1) WO2007110087A1 (de)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2315458A2 (de) 2008-04-09 2011-04-27 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Vorrichtung und Verfahren zur Erzeugung von Filterungsmerkmale
EP2611214A1 (de) * 2010-10-22 2013-07-03 Sony Corporation Kopfhörervorrichtung
US11553296B2 (en) 2016-06-21 2023-01-10 Dolby Laboratories Licensing Corporation Headtracking for pre-rendered binaural audio

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
PETER KAMINSKI: "Binaural Sky: 3D-Sound über Lautsprecher", SOUND AND RECORDING, vol. 2006, no. 3, 3 March 2006 (2006-03-03), Koeln, Deutschland, pages 74 - 76, XP002404714 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2315458A2 (de) 2008-04-09 2011-04-27 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Vorrichtung und Verfahren zur Erzeugung von Filterungsmerkmale
EP2611214A1 (de) * 2010-10-22 2013-07-03 Sony Corporation Kopfhörervorrichtung
EP2611214A4 (de) * 2010-10-22 2014-05-28 Sony Corp Kopfhörervorrichtung
US11553296B2 (en) 2016-06-21 2023-01-10 Dolby Laboratories Licensing Corporation Headtracking for pre-rendered binaural audio

Similar Documents

Publication Publication Date Title
DE102005003431B4 (de) Anordnung zum Wiedergeben von binauralen Signalen (Kunstkopfsignalen) durch mehrere Lautsprecher
EP3044972B1 (de) Vorrichtung, verfahren und computerprogramm zur dekorrelation von lautsprechersignalen
DE102006017791A1 (de) Wiedergabegerät und Wiedergabeverfahren
DE102005001395B4 (de) Verfahren und Vorrichtung zur Transformation des frühen Schallfeldes
EP3677053B1 (de) Lautsprechersystem für raumklang mit unterdrückung unerwünschten direktschalls
DE19911507A1 (de) Verfahren zur Verbesserung dreidimensionaler Klangwiedergabe
JPH0823600A (ja) 音空間効果方法および装置
WO2001047319A2 (de) Verfahren und anlage zur aufnahme und wiedergabe von klängen
EP2373054B1 (de) Wiedergabe in einem beweglichen Zielbeschallungsbereich mittels virtueller Lautsprecher
WO2007110087A1 (de) Anordnung zum wiedergeben von binauralen signalen (kunstkopfsignalen) durch mehrere lautsprecher
EP0484354B1 (de) STEREOKOPFHöRER ZUR VORNEORTUNG VON MITTELS STEREOKOPFHöRERN ERZEUGTEN HöREREIGNISSEN
EP3314915A1 (de) Verfahren zur schallwiedergabe in reflexionsumgebungen, insbesondere in hörräumen
DE3512155C2 (de)
DE102011108788B4 (de) Verfahren zur Verarbeitung eines Audiosignals, Audiowiedergabesystem und Verarbeitungseinheit zur Bearbeitung von Audiosignalen
DE102006033009B4 (de) Anordnung zum Synthetisieren eines binauralen Raumsynthese-Audiosignals
DE2023377C3 (de) Verfahren zur räumlichen Wiedergabe von Schallsignalen und Anordnung zu seiner Durchfuhrung
AT389610B (de) Stereophonische aufnahmeeinrichtung zur verbesserung des raeumlichen hoerens
AT391389B (de) Elektroakustische anordnung zur darbietung von audiosignalen fuer das richtungsorientierte raeumliche hoeren bei binauraler wiedergabe
AU2002325063B2 (en) Recording a three dimensional auditory scene and reproducing it for the individual listener
DE10222006B4 (de) Lautsprecheranordnung
EP2503799A1 (de) Verfahren und System zur Berechnung synthetischer Außenohrübertragungsfunktionen durch virtuelle lokale Schallfeldsynthese
DE3130301A1 (de) Fuenf-lautsprecher-anordnung zur akustischen wiedergabe von signalen, die mit hilfe zweier stereo-kanaele uebertragen werden.
EP2373055B1 (de) Kopfhörer-Vorrichtung zur Wiedergabe binauraler räumlicher Audiosignale und damit ausgestattetes System
Sontacchi et al. “GETTING MIXED UP WITH WFS, VBAP, HOA, TRM…” FROM ACRONYMIC CACOPHONY TO A GENERALIZED RENDERING TOOLBOX
Rumsey Basic psychoacoustics for surround recording

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 06723710

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 06723710

Country of ref document: EP

Kind code of ref document: A1