WO2022183231A1 - Method for producing audio signal filters for audio signals in order to generate virtual sound sources - Google Patents

Method for producing audio signal filters for audio signals in order to generate virtual sound sources Download PDF

Info

Publication number
WO2022183231A1
WO2022183231A1 PCT/AT2022/060060 AT2022060060W WO2022183231A1 WO 2022183231 A1 WO2022183231 A1 WO 2022183231A1 AT 2022060060 W AT2022060060 W AT 2022060060W WO 2022183231 A1 WO2022183231 A1 WO 2022183231A1
Authority
WO
WIPO (PCT)
Prior art keywords
audio signal
auditory
sound
loudspeaker arrangement
generating
Prior art date
Application number
PCT/AT2022/060060
Other languages
German (de)
French (fr)
Inventor
Christian SCHÖRKHUBER
Markus Zaunschirm
Original Assignee
Atmoky Gmbh
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Atmoky Gmbh filed Critical Atmoky Gmbh
Publication of WO2022183231A1 publication Critical patent/WO2022183231A1/en

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • H04S7/303Tracking of listener position or orientation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]

Definitions

  • the present invention relates to a method for generating audio signal filters that are applied to audio signals in order to generate virtual sound sources through sound propagation between a loudspeaker arrangement and a listening area.
  • Three-dimensional audio formats are enjoying increasing popularity due to the increased spatial quality. While the reproduction of immersive, spatial audio content via headphones, especially when including head rotation, can achieve high reproduction quality with little hardware outlay, their reproduction using loudspeakers currently still places very high demands on the reproduction system consisting of a loudspeaker arrangement and the playback room.
  • room reflections can be used for sound reproduction, with known methods only making heuristic assumptions about the position and properties of reflecting surfaces, such as in a surround sound system in US5809150A, a soundbar in US2018184202A1, a loudspeaker arrangement in US2014126753A1, or an adjustable radiation pattern of a loudspeaker arrangement in WO2014138134A2, or that their influence in terms of a physically motivated Sound field synthesis are taken into account as in the surround sound system in WO2012023864A1.
  • loudspeaker arrangements with variable directional characteristics are used to generate surround channels with the aid of reflections, although i) only the main emission direction is varied and not the shape of the emission pattern, and ii ) The influence of superimposed sound events is not taken into account or modeled.
  • This object is achieved by the method for generating filters that are applied to audio signals, with the method steps and features of claim 1. Further features and details of the invention result from the dependent claims, the description and the drawings.
  • the method for generating audio signal filters that are applied to audio signals is used to generate auditory sound sources through sound propagation between a real loudspeaker arrangement and an auditory area.
  • the following method steps are carried out according to the invention: Determination of auditory sound events in the auditory range on the basis of the generation sound events generated by the loudspeaker arrangement. Determining an auditory sound source on the basis of the determined auditory sound events using a perceptive model. comparing the determined auditory sound source with a target auditory sound source. Finally, an audio signal filter is created on the basis of the comparison result. Accordingly, the present invention provides for the first time the use of a perceptive model within the scope of generating audio signal filters, which anticipates the auditory impression of a person in relation to the spatial perception of a virtual sound source. This is to be understood as a perception provided with a recognized location by a listener of an audio signal.
  • a reference is thus provided for the targeted regulation of the localization, ie the perceptibly reproduced position of the virtual sound source in a sound event.
  • the principle according to the invention has the advantage, among other things, that a result that is spatially perceptible to a person listening or their hearing impression can flow into the generation of the audio signal filter in order to optimize playback without or even without the possibility of feedback to this cognitive process is given in the person.
  • a central advantage of the invention is that the desired or essentially the desired spatial auditory impression can be realized with little hardware effort, ie with a relatively small number and in particular with any combination of loudspeakers and types by means of signal processing. becomes feasible.
  • a further advantage of the invention is that data processing essentially only requires frequency-specific amplitude adjustment and/or phase delay to the audio signal or its channels from a signal source, ie relatively little demand for available computing power.
  • a virtual sound source and thus an auditory sound source is a sound source that can be perceived emerging from a three-dimensional acoustic representation, in particular with a physical or content-related sound source Reference, such as a spatially located voice, or a peripheral, moving vehicle noise.
  • an audio signal filter is generated for each of the different loudspeakers in the loudspeaker arrangement, ie the method is carried out several times or separately for each loudspeaker, so that each loudspeaker receives a differently filtered audio signal.
  • several object-based audio signals can be processed on the input side in the sense of soundtracks, eg a trumpet and a saxophone, which are to be reproduced as separate auditory sound sources located at different positions.
  • the method according to the invention is also carried out multiple times in relation to each loudspeaker and each object-based audio signal.
  • a separate set of audio signal filters is generated for each object-based audio signal, with the number of audio signal filters in each set corresponding to the number of loudspeakers.
  • a desired position and thus the auditory sound source can be moved by varying the audio signal filter over the course of the reproduction over time.
  • a listening area is a spatially predetermined area in an area surrounding the loudspeaker arrangement, in particular in a reproduction room, which is intended for one or more listening persons.
  • This area can be static, such as a seat, or, in a specific embodiment described later, movable in the space.
  • a generation sound event consists of the sound waves that are each generated separately from a loudspeaker of the loudspeaker arrangement.
  • a loudspeaker arrangement is an arrangement of loudspeakers with different orientations to one another and preferably different, distributed positions in relation to one another in the reproduction space or in the environment.
  • an auditory sound event in the auditory area is a local sound field resulting from the sum of superimposed sound waves that arrive in the auditory area via direct and indirect or reflected sound propagation from the loudspeaker arrangement.
  • the local sound field ie the sum of the incoming sound waves, can be measured and results in no specific Measures usually no auditory impression of a defined spatial desertification, or a correct desertification according to a signal source or an object-based audio signal, or a soundtrack in the example of a trumpet.
  • the auditory impression of a spatial perception of auditory sound sources and their correct obliteration can be achieved for a person listening.
  • a perceptive model is, according to the present disclosure of the Ede precise, an anticipatory simulation which the obliteration and quality of the virtual sound source, in particular its direction and extent, based on, for example, the amplitudes, the directions and the relative time or phase differences of all in the audible range incoming sound waves, i.e. the auditory sound events which are generated by the speaker arrangement and propagate directly as well as indirectly via reflections to the auditory area.
  • a target auditory sound source is a virtual sound source and thus an auditory sound source that determines and tracks or approximates a correct obliteration according to the signal source of the audio signal or the auditory sound source based on the perceptual model and conveys correct obliteration according to the audio signal in the auditory impression of the listener.
  • the creation of the audio signal filter includes a calculation of filter coefficients for directly obtaining an audio signal filter on the basis of the comparison result.
  • an iteration of filter coefficients can also be carried out until a termination criterion is met, such as a specified maximum number of iterations, or until no further improvement is achieved.
  • a termination criterion such as a specified maximum number of iterations, or until no further improvement is achieved.
  • the creation of the audio signal filter includes an iteration of filter coefficients to approach an optimum of the audio signal filter until the comparison result is below a threshold value of an error specification. This allows an approximation of a optimum result can be adjusted with less computing power required or with fewer available parameters.
  • the determination of the auditory sound source preferably includes a direction and/or an extent of the auditory sound source in relation to the auditory area. In this way, the desolation can be determined clearly and yet with a low data load.
  • the determination of audible sound events in the audible area includes a simulation of the sound propagation between the loudspeaker arrangement and the audible area using a propagation model based on application-specific acoustic-geometric parameters influencing the sound propagation. This allows a parameter-based prediction of the acoustic behavior of the room and the arrangement with regard to the reproduction of the audio signal to be made.
  • the acoustic-geometric parameters can be predetermined in an application-specific manner and made available in the propagation model.
  • the parameters are fixed or predetermined for a specific configuration of the system and possibly the environment.
  • the acoustic-geometric parameters can be determined in advance in an application-specific manner before they are made available in the propagation model.
  • the following method steps are carried out beforehand: transmission of acoustic signals by means of the loudspeaker arrangement; Acquiring measured values relating to directional room impulse responses from an environment surrounding the loudspeaker arrangement using a microphone arrangement with a defined position and orientation in relation to the loudspeaker arrangement; and determining the application-specific acoustic-geometric parameters in accordance with the measured values. This allows the parameters to be measured or calibrated beforehand in relation to any change in the system and environmental configuration.
  • a position of the hearing area is also movable.
  • the following method steps are performed: detecting a position of the movable auditory area; and tracking a change among the acoustico-geometric parameters in accordance with the detected position.
  • the application-specific acoustic-geometric parameters used for the propagation model or also for the perceptual model can be selected from: configuration parameters for describing a spatial configuration of the loudspeaker arrangement and its surroundings the group: position, orientation and/or acoustic emission behavior of the loudspeaker arrangements, and position, orientation and/or acoustic properties of reflection surfaces in the vicinity of the loudspeaker arrangement; and audible area parameters for describing a spatial determination of the audible area from the group: position and/or extent of the audible area.
  • the determination of auditory sound events in the auditory range includes the acquisition of measured values of the sound events generated by the loudspeaker arrangement using a microphone arrangement in the auditory range .
  • a multi-channel audio signal is provided with one channel for each loudspeaker in the loudspeaker arrangement, the audio signal filter being produced separately for each channel and applied to the respective channel .
  • the audio signal filter being produced separately for each channel and applied to the respective channel .
  • a radiation behavior of the loudspeaker arrangement with loudspeakers of different orientation can be controlled and their sound propagation in the playback room can be influenced or adjusted.
  • further embodiments of the invention consist of a software or hardware-based embodiment, such as an audio signal processing program or an audio signal processing device, the instructions or means for carrying out the method steps for generating according to the invention of audio signal filters.
  • another use-related embodiment of the method according to the invention for generating audio signal filters consists in a method for generating virtual sound sources by sound propagation between a real loudspeaker arrangement and a listening area using at least one audio signal filter generated according to the invention on audio - signals.
  • An advantageous embodiment of the method for generating virtual sound sources also includes activation of a real primary loudspeaker arrangement and indirect activation of a virtual secondary loudspeaker arrangement, which is acoustically effective through reflections of sound waves from the primary loudspeaker arrangement Reflective surfaces is formed.
  • the following method steps are additionally carried out: aligning an acoustic radiation behavior of the primary loudspeaker arrangement by applying the respective audio signal filter created to each channel of the audio signal for each loudspeaker of the primary loudspeaker arrangement; and adjusting reflection paths of the sound waves to form the secondary speaker assembly by aligning the acoustic directivity of the primary speaker assembly.
  • the formation of virtual loudspeakers increases the total number and directionality of the sound sources, resulting in a higher spatial resolution of the acoustic reproduction.
  • FIG. 1 A situation according to the prior art, 2 shows a first step of a method according to the invention
  • FIG 9 shows a further embodiment for determining the auditory sound events.
  • FIG. 1 shows schematically how a piler perceives sound in a pile area 20 in the prior art.
  • the loudspeakers usually have an emission direction for sound directed towards the pile area, so that, illustrated by the arrows on the loudspeakers, the sound is emitted towards the pile in the pile area 20 .
  • the sound emitted by the loudspeakers reaches the floor area 20 both directly and indirectly via reflections on the walls of the room, which represent reflection surfaces 40 for the sound, and is perceived there by the floor operator.
  • part of the perception is also the obliteration of the sound impression, which results from the received auditory sound events 32 in the Florer. Due to time delays and amplitude shifts in the auditory sound events reaching it, the latter is able to assign an auditory sound source 30 to each auditory sound event 32 , ie in particular the location of the respective auditory sound event 32 .
  • this assignment can be resolved with regard to the direction and/or the extent of the auditory sound source 30, so that the florist can assign the auditory sound events 32 reaching him to a position in space and/or, depending on the extent, can assign a certain accuracy to this position.
  • the Flörer a spatial auditory impression which, in the prior art, depends solely on the placement and type of loudspeakers and the reflection properties of the room.
  • FIG. 1 and in the stereo arrangement shown in this figure the known effect results that the audible sound events 32 of these two stereo loudspeakers combine to form an audible sound source 30 in the middle between these two loudspeakers.
  • audio signal filters 50 are used, which allow the generation sound events 31 emitted by the loudspeaker arrangement 10 to be influenced.
  • FIGS. 2 to 4 show one way in which such audio signal filters 50 can be produced.
  • FIG. 2 shows a loudspeaker arrangement 10 with two positions, each with an array with three individual loudspeakers. In this way, three generating sound events 31 can be emitted in three directions from two positions.
  • An audio signal filter 50 is provided for each output direction, which can amplify or attenuate frequency-specific amplitudes or change the phase over a frequency range, preferably the complete frequency range perceptible by the human ear.
  • FIG. 2 shows the initial situation of a procedure in accordance with the provisions, so that the audio signal filter 50 is still in an initial setting.
  • This initial setting includes, for example, a passive function, i.e. an unfiltered output of the generation sound events 31.
  • the emission of the generation sound events 31 in FIG. 2 results in one or more auditory sound sources 30, as with stereo loudspeakers in the prior art, due to the reflections of the room and the installation positions of the loudspeaker arrangement 10. Their positioning depends from those in the listening area by the listener 20 perceived auditory sound events 32 and the obliteration based on these by the listener.
  • the obliterated auditory sound source 30 will deviate from the desired target auditory sound source 33, as shown in FIG.
  • the listener does not allocate the auditory sound events 32 he has received to the desired target auditory sound source 33, but to an auditory sound source 30 objected to by the latter.
  • the sound does not come from the desired direction for the listener.
  • the goal according to the invention is now to position the auditory sound source 30 as close as possible to the target auditory sound source 33 in order to generate the desired acoustic spatial impression for the user.
  • This correction of the positioning is done digitally, namely by applying an audio signal filter 50 as shown in FIG.
  • an audio signal filter 50 By specifically filtering the generation sound events 31 and/or the time delay of individual generation sound events 31, the reflection on the reflecting surfaces 40 can be influenced and thus the type and time of the auditory sound events 32 in the auditory area 20 can also be changed.
  • the listener also correspondingly obliterates the sound signal associated with these auditory sound events 32 at a different spatial position, in FIG. 4 in the desired target auditory sound source 50.
  • the spatial obliteration of the auditory sound source 30 is shifted solely by changing the settings of the audio signal filter 50.
  • An adaptation of the type, orientation and/or positioning of the loudspeaker arrangement 10 is not necessary.
  • the spatial impression in the perception in the listening area 20 can be changed.
  • the audio signal filter 50 which generates the desired spatial assignment for the listening area 20, has been determined, it can be applied and generate spatial sound situations in a digital manner.
  • a speaker can be clearly positioned in space as part of a complex sound signal.
  • Even complex relationships between different sound signals, for example background noise in relation to a conversation, can be digitally are encoded in the generation sound events 31, so that suitable auditory sound events 32 result in the auditory area 20, which correspond to the desired positioning in the perception of the listener.
  • a core idea of the present invention is the way in which such an audio signal filter 50 is generated. This is particularly important because the audio signal filter 50 are specific to a listening position 20 and specific to a reflection situation in a room, and must therefore be designed individually. For this purpose, a method according to the invention is designed so that such individual audio signal filters 50 can be generated easily and automatically.
  • FIG. 5 shows a first step of such a generation.
  • auditory sound events 32 that reach the auditory range 20 are determined.
  • the possible types of determination will be explained in more detail later.
  • a digitized and/or partially digitized determination is also conceivable.
  • the core of these generation steps is a perceptual model that can map and simulate the listener's perception in the auditory area 20 .
  • the perceptive model allows an algorithmic relationship to be established between the sound parameters of the auditory sound event 32 and the obliteration of these auditory sound events 32 performed by a human listener.
  • the perceptive model thus determines an auditory sound source 30 in space, in particular with regard to its direction to the auditory area 20 and/or its extent, by means of an algorithmic relationship, for example from input parameters such as amplitudes, direction vectors and/or time delays.
  • the perceptive model thus models the listener's perception.
  • the modeled location of the auditory sound source 30 is known, it can be easily compared geometrically with a desired location of the target auditory sound source 33 .
  • a quantitative comparison is particularly advantageous, which can reflect the distance and difference in direction, for example as an angle. Different subsequent steps in the production process can be generated from this comparison result.
  • a retrospective determination via the perceptual model is possible.
  • the required auditory sound events 32 can be determined from the desired target auditory sound source 33, which would be necessary for this obliteration in the perception by the perceptual model. From these necessary auditory sound events, the generation sound events 31 necessary for this can be re-determined, in particular with knowledge of the reflection conditions in the room.
  • filtering must be applied to the unfiltered generation sound events 31 in order to generate the necessary generation sound events 31 from them. This determined necessary filtering can finally be set and/or output as an audio signal filter 50 .
  • the effect of the deliberate variation can be determined in the form of an approximation of the auditory sound source 30 to the target auditory sound source 33, so that the auditory sound source 30 is gradually shifted to the Target auditory sound source 33 takes place by means of a gradual variation of the audio signal filter 50.
  • FIGS. 7 to 9 show different possibilities for determining the auditory sound events 32.
  • a completely digital variant is shown in FIG.
  • a propagation model which contains the reflection properties of the room and the positioning of the loudspeaker arrangement 10 as framework parameters, creates an algorithmic connection between the generation sound events 31 and the auditory sound events 32 .
  • This relationship is bidirectional, in particular, for the redetermination option described above when generating the audio signal filter 50.
  • a real determination of the auditory sound events 32 can also take place, as shown in FIG.
  • the florer in the flor area 20 is replaced here by a microphone arrangement 60, so that sound events 31 actually produced by the loudspeaker arrangement 10 become real through real propagation in space and are received by the microphone arrangement 60. Sound events 32 lead.
  • defined and/or standardized test signals are used as generating sound events 31 in particular.
  • FIG. 9 shows a combination of the digital design in FIG. 7 and the real design in FIG.
  • a general propagation model can be equipped with the necessary specification parameters or acoustic-geometric parameters of an environmental configuration by means of the microphone arrangement 60, which then enable this propagation model to determine the propagation algorithmically, as has been explained for FIG is.

Abstract

The invention relates to a method for producing audio signal filters (50) which is used on audio signals in order to generate audio sound sources (30) by means of sound propagation between a real loudspeaker assembly (10) and a listening area (20). According to the invention, the method has the following steps: determining audio sound events (32) in the listening area (20) on the basis of generated sound events (31) generated by the loudspeaker assembly (10); determining an audio sound source (30) on the basis of the determined audio sound events (32) using a perceptive model; comparing the determined audio sound source (30) with a virtual target audio sound source (33); and producing an audio signal filter (50) on the basis of the result of the comparison.

Description

VERFAHREN ZUR ERZEUGUNG VON AUDIOSIGNALFILTERN FÜR AUDIOSIG- NALE ZUR ERZEUGUNG VIRTUELLER SCHALLQUELLEN PROCESS FOR GENERATION OF AUDIO SIGNAL FILTERS FOR AUDIO SIGNALS FOR GENERATION OF VIRTUAL SOUND SOURCES
Die vorliegende Erfindung betrifft ein Verfahren zur Erzeugung von Audiosignalfiltern, die auf Audiosignale angewendet werden, um virtuelle Schallquellen durch Schallaus- breitung zwischen einer Lautsprecheranordnung und einem Hörbereich zu erzeugen. The present invention relates to a method for generating audio signal filters that are applied to audio signals in order to generate virtual sound sources through sound propagation between a loudspeaker arrangement and a listening area.
Gebiet der Erfindung field of invention
Dreidimensionale Audioformate erfreuen sich aufgrund der erhöhten räumlichen Qua- lität einer stark wachsenden Beliebtheit. Während bei der Wiedergabe von immersi- ven, räumlichen Audioinhalten über Kopfhörer, insbesondere unter Einbeziehung der Kopfrotation, eine hohe Reproduktionsqualität bei geringem Hardwareaufwand er- reicht werden kann, stellt deren Wiedergabe mittels Lautsprecher derzeit noch recht große Anforderungen an das Wiedergabesystem bestehend aus einer Lautsprecher- anordnung und dem Wiedergaberaum. Three-dimensional audio formats are enjoying increasing popularity due to the increased spatial quality. While the reproduction of immersive, spatial audio content via headphones, especially when including head rotation, can achieve high reproduction quality with little hardware outlay, their reproduction using loudspeakers currently still places very high demands on the reproduction system consisting of a loudspeaker arrangement and the playback room.
Hintergrund der Erfindung Background of the Invention
Bei bekannten Wiedergabeverfahren wird üblicherweise eine große Anzahl von Laut- sprechern mit vordefinierten Positionen angenommen. Raumeinflüsse werden dabei sehr oft nicht berücksichtigt beziehungsweise lediglich antizipiert, etwa über eine ele- vierte Schallabstrahlung mit vordefinierter Richtung um erhöhte Schallquellen abbilden zu können. Da der Effekt der tatsächlich auftretenden Schallreflektionen dabei aller- dings nicht berücksichtigt werden kann, ist es dabei nicht möglich, die wahrgenom- mene Qualität eines Schallereignisses, also etwa die wahrgenommene Richtung und die wahrgenommen räumliche Ausdehnung des Schallereignisses, gezielt zu steuern. With known playback methods, a large number of loudspeakers with predefined positions is usually assumed. Room influences are very often not taken into account or only anticipated, for example via enhanced sound radiation with a predefined direction in order to be able to map increased sound sources. However, since the effect of the sound reflections that actually occur cannot be taken into account, it is not possible to specifically control the perceived quality of a sound event, i.e. the perceived direction and the perceived spatial extent of the sound event.
Es ist bekannt, dass Raumreflektionen für die Schallwiedergabe genutzt werden kön- nen, wobei bei bekannten Verfahren lediglich heuristische Annahmen über die Position und Eigenschaften von reflektierenden Oberflächen gemacht werden, wie beispiels- weise in einem Surround-Sound System in der US5809150A, einer Soundbar in der US2018184202A1 , einer Lautsprecheranordnung in der US2014126753A1 , oder ei- nem einstellbaren Abstrahlmuster einer Lautsprecheranordnung in der WO2014138134A2, oder dass deren Einfluss im Sinne einer physikalisch motivierten Schallfeldsynthese berücksichtigt werden wie in dem Surround-Sound System in der WO2012023864A1 . Bei einem anderen bekannten Verfahren zur Ausgabe eines Surround-Sounds in der EP2096883A2 werden Lautsprecheranordnungen mit variab- ler Richtcharakteristik verwendet um Surround Kanäle mit Hilfe von Reflektionen zu erzeugen, wobei allerdings i) nur die Hauptabstrahlrichtung variiert wird und nicht die Form des Abstrahlungsmusters, und ii) Einfluss von überlagerten Schallereignissen nicht berücksichtigt bzw. modelliert wird. It is known that room reflections can be used for sound reproduction, with known methods only making heuristic assumptions about the position and properties of reflecting surfaces, such as in a surround sound system in US5809150A, a soundbar in US2018184202A1, a loudspeaker arrangement in US2014126753A1, or an adjustable radiation pattern of a loudspeaker arrangement in WO2014138134A2, or that their influence in terms of a physically motivated Sound field synthesis are taken into account as in the surround sound system in WO2012023864A1. In another known method for outputting a surround sound in EP2096883A2, loudspeaker arrangements with variable directional characteristics are used to generate surround channels with the aid of reflections, although i) only the main emission direction is varied and not the shape of the emission pattern, and ii ) The influence of superimposed sound events is not taken into account or modeled.
Demnach besteht Bedarf an technischen Lösungen, die für ein Wiedergabesystem be- stehend aus einer Lautsprecheranordnung und einem Wiedergaberaum eine im We- sentlichen ähnlich hohe Reproduktionsqualität von virtuellen Schallquellen wie bei den zuvor genannten Wiedergabesystemen zu ermöglichen, ohne entsprechend aufwän- dige Anforderungen an die Hardware, insbesondere umfangreiche oder definiert ar- rangierte Konstellationen von Lautsprechern und keine hohen Rechenleistungen zu benötigen. Accordingly, there is a need for technical solutions which, for a reproduction system consisting of a loudspeaker arrangement and a reproduction room, enable a reproduction quality of virtual sound sources that is essentially similar to that of the reproduction systems mentioned above, without correspondingly complex requirements for the hardware, in particular, extensive or defined arranged constellations of loudspeakers and not requiring high computing power.
Es ist eine Aufgabe der vorliegenden Erfindung, eine Technik der Audiosignalverar- beitung zu schaffen, die einen Höreindruck mit räumlicher Wahrnehmung von virtuel- len Schallquellen über eine Lautsprecheranordnung in einem räumlich definierten Hör- bereich erzielt, und das bei möglichst geringen Anforderungen an den Umfang und die Spezifikationen der Hardware des Wiedergabesystems. Diese Aufgabe wird gelöst durch das Verfahren zur Erzeugung von Filtern, die auf Audiosignale angewendet wer- den, mit den Verfahrensschritten und Merkmalen des Anspruchs 1. Weitere Merkmale und Details der Erfindung ergeben sich aus den Unteransprüchen, der Beschreibung und den Zeichnungen. It is an object of the present invention to create an audio signal processing technique that achieves an auditory impression with spatial perception of virtual sound sources via a loudspeaker arrangement in a spatially defined auditory area, and that with the lowest possible requirements in terms of volume and volume the specifications of the playback system hardware. This object is achieved by the method for generating filters that are applied to audio signals, with the method steps and features of claim 1. Further features and details of the invention result from the dependent claims, the description and the drawings.
Erfindungsgemäß dient das Verfahren zur Erzeugung von Audiosignalfiltern, die auf Audiosignale angewendet werden, dazu um Hör-Schallquellen durch Schallausbrei- tung zwischen einer realen Lautsprecheranordnung und einem Hörbereich zu erzeu- gen. According to the invention, the method for generating audio signal filters that are applied to audio signals is used to generate auditory sound sources through sound propagation between a real loudspeaker arrangement and an auditory area.
Hierzu werden erfindungsgemäß die folgenden Verfahrensschritte durchgeführt: Be- stimmen von Hör-Schallereignissen im Hörbereich auf Basis der von der Lautsprecher- anordnung erzeugten Erzeugungs-Schallereignisse. Bestimmen einer Hör-Schall- quelle auf Basis der bestimmten Hör-Schallereignisse mittels eines perzeptiven Mo- dells. Vergleichen der bestimmten Hör-Schallquelle mit einer Ziel-Hör-Schallquelle. Zuletzt erfolgt ein Erstellen eines Audiosignalfilters auf Basis des Vergleichsergebnis- ses. Demnach sieht die vorliegende Erfindung erstmals vor, ein perzeptives Modell im Rah- men einer Erzeugung von Audiosignalfiltern zu verwenden, die den Höreindruck einer Person in Bezug auf die räumliche Wahrnehmung einer virtuellen Schallquelle antizi- piert. Darunter ist eine mit einem erkannten Ort versehene Wahrnehmung durch einen Hörer eines Audiosignals zu verstehen. Somit wird eine Referenz zur gezielten Rege- lung der Verortung, d.h. der wahrnehmbar wiedergegebenen Position der virtuellen Schallquelle in einem Schallereignis bereitgestellt. Das erfindungsgemäße Prinzip hat u.a. den Vorteil, dass ein für eine zuhörende Per- son räumlich wahrnehmbares Resultat bzw. deren Höreindruck vorab in die Erzeugung der Audiosignalfilter zur Optimierung der Wiedergabe einfließen kann, ohne dass eine bzw. obwohl keine Möglichkeit zur Rückkopplung auf diesen kognitiven Vorgang in der Person gegeben ist. Ein zentraler Vorteil der Erfindung besteht darin, dass der gewünschte oder im We- sentlichen der gewünschte räumliche Höreindruck mit einem geringen Hardwareauf- wand, d.h. mit einer verhältnismäßig geringen Anzahl und insbesondere mit einer be- liebigen Kombination von Lautsprechern und -arten mittels Signalverarbeitung reali- sierbar wird. Ein weiterer Vorteil der Erfindung besteht darin, dass eine Datenverarbeitung im We- sentlichen lediglich eine frequenzspezifische Amplitudenanpassung und/oder Phasen- verzögerung auf das Audiosignal bzw. dessen Kanäle aus einer Signalquelle erfordert, d.h. einen relativ geringen Bedarf an verfügbarer Rechenleistung. Den Begriffen der erfindungsgemäßen Merkmalen werden im Rahmen dieser Offen- barung die folgenden Definitionen und Eigenschaften zugeschrieben: Eine virtuelle Schallquelle und damit eine Hör-Schallquelle ist gemäß der vorliegenden Offenbarung der Erfindung eine aus einer dreidimensionalen akustischen Darstellung hervortretend wahrnehmbare Schallquelle, insbesondere mit gegenständlichem oder inhaltlichem Bezug, wie beispielsweise eine räumlich verortete Stimme, oder ein peri- pheres, bewegliches Fahrzeuggeräusch. Ferner wird für die verschiedenen Lautsprecher in der Lautsprecheranordnung jeweils ein Audiosignalfilter erzeugt, d.h. das Verfahren wird mehrfach bzw. für jeden Laut- sprecher separat durchgeführt, so dass jeden Lautsprecher ein unterschiedlich gefil- tertes Audiosignal erreicht. Ebenso können mehrere objektbasierte Audiosignale im Sinne von Tonspuren eingangsseitig verarbeitet werden, z.B. eine Trompete und ein Saxophon, die als separate Hör-Schallquellen an unterschiedlichen Positionen veror- tet wiedergegeben werden sollen. In diesem Fall wird das erfindungsgemäße Verfah- ren ebenfalls mehrfach in Bezug auf jeden Lautsprecher und jedes objektbasierte Au- diosignal durchgeführt. Mit anderen Worten wird für jedes objektbasierte Audiosignal ein separater Satz von Audiosignalfiltern erzeugt, wobei die Anzahl der Audiosignalfil- ter in jedem Satz der Anzahl der Lautsprecher entspricht. For this purpose, the following method steps are carried out according to the invention: Determination of auditory sound events in the auditory range on the basis of the generation sound events generated by the loudspeaker arrangement. Determining an auditory sound source on the basis of the determined auditory sound events using a perceptive model. comparing the determined auditory sound source with a target auditory sound source. Finally, an audio signal filter is created on the basis of the comparison result. Accordingly, the present invention provides for the first time the use of a perceptive model within the scope of generating audio signal filters, which anticipates the auditory impression of a person in relation to the spatial perception of a virtual sound source. This is to be understood as a perception provided with a recognized location by a listener of an audio signal. A reference is thus provided for the targeted regulation of the localization, ie the perceptibly reproduced position of the virtual sound source in a sound event. The principle according to the invention has the advantage, among other things, that a result that is spatially perceptible to a person listening or their hearing impression can flow into the generation of the audio signal filter in order to optimize playback without or even without the possibility of feedback to this cognitive process is given in the person. A central advantage of the invention is that the desired or essentially the desired spatial auditory impression can be realized with little hardware effort, ie with a relatively small number and in particular with any combination of loudspeakers and types by means of signal processing. becomes feasible. A further advantage of the invention is that data processing essentially only requires frequency-specific amplitude adjustment and/or phase delay to the audio signal or its channels from a signal source, ie relatively little demand for available computing power. The following definitions and properties are ascribed to the terms of the features according to the invention in the context of this disclosure: According to the present disclosure of the invention, a virtual sound source and thus an auditory sound source is a sound source that can be perceived emerging from a three-dimensional acoustic representation, in particular with a physical or content-related sound source Reference, such as a spatially located voice, or a peripheral, moving vehicle noise. Furthermore, an audio signal filter is generated for each of the different loudspeakers in the loudspeaker arrangement, ie the method is carried out several times or separately for each loudspeaker, so that each loudspeaker receives a differently filtered audio signal. Likewise, several object-based audio signals can be processed on the input side in the sense of soundtracks, eg a trumpet and a saxophone, which are to be reproduced as separate auditory sound sources located at different positions. In this case, the method according to the invention is also carried out multiple times in relation to each loudspeaker and each object-based audio signal. In other words, a separate set of audio signal filters is generated for each object-based audio signal, with the number of audio signal filters in each set corresponding to the number of loudspeakers.
Darüber hinaus kann eine gewünschte Position und damit die Hör-Schallquelle bewegt werden durch Variation der Audiosignalfilter über den zeitlichen Verlauf der Wieder- gabe. In addition, a desired position and thus the auditory sound source can be moved by varying the audio signal filter over the course of the reproduction over time.
Ein Hörbereich ist gemäß der vorliegenden Offenbarung der Erfindung ein räumlich vorbestimmter Bereich in einer Umgebung der Lautsprecheranordnung, insbesondere in einem Wiedergaberaum, der für eine oder mehrere zuhörende Personen vorgese- hen ist. Dieser Bereich kann statisch sein, wie z.B. ein Sitzplatz, oder in einer später beschriebenen speziellen Ausführung beweglich in dem Raum vorgesehen sein. According to the present disclosure of the invention, a listening area is a spatially predetermined area in an area surrounding the loudspeaker arrangement, in particular in a reproduction room, which is intended for one or more listening persons. This area can be static, such as a seat, or, in a specific embodiment described later, movable in the space.
Ein Erzeugungs-Schallereignis besteht gemäß der vorliegenden Offenbarung der Er- findung aus den Schallwellen, die jeweils aus einem Lautsprecher der Lautsprecher- anordnung separat erzeugt werden. According to the present disclosure of the invention, a generation sound event consists of the sound waves that are each generated separately from a loudspeaker of the loudspeaker arrangement.
Eine Lautsprecheranordnung ist gemäß der vorliegenden Offenbarung der Erfindung eine Anordnung von Lautsprechern mit unterschiedlicher Orientierung zueinander und vorzugsweise unterschiedlichen, verteilten Positionen zueinander im Wiedergaberaum bzw. in der Umgebung. According to the present disclosure of the invention, a loudspeaker arrangement is an arrangement of loudspeakers with different orientations to one another and preferably different, distributed positions in relation to one another in the reproduction space or in the environment.
Ein Hör-Schallereignis im Hörbereich ist gemäß der vorliegenden Offenbarung der Er- findung ein lokales Schallfeld, resultierend aus der Summe an überlagernden Schall- wellen, die über direkte und indirekt bzw. reflektierte Schallausbreitung aus der Laut- sprecheranordnung in dem Hörbereich eintreffen. Das lokale Schallfeld, d.h. die Summe der eintreffenden Schallwellen ist messbar und ergibt ohne gezielte Maßnahmen i.d.R. keinen Höreindruck einer definierten räumlichen Verödung, oder eine korrekte Verödung gemäß einer Signalquelle bzw. einem objektbasierten Audio- signal, oder einer Tonspur in dem Beispiel einer Trompete. In Abhängigkeit davon, ob die Summe der eintreffenden Schallwellen bzw. das resultierende lokale Schallfeld ein homogenes Hör-Schallereignis ergibt, wird für eine zuhörende Person der Höreindruck einer räumlichen Wahrnehmung von Hör-Schallquellen und deren korrekte Verödung erzielbar. According to the present disclosure of the invention, an auditory sound event in the auditory area is a local sound field resulting from the sum of superimposed sound waves that arrive in the auditory area via direct and indirect or reflected sound propagation from the loudspeaker arrangement. The local sound field, ie the sum of the incoming sound waves, can be measured and results in no specific Measures usually no auditory impression of a defined spatial desertification, or a correct desertification according to a signal source or an object-based audio signal, or a soundtrack in the example of a trumpet. Depending on whether the sum of the incoming sound waves or the resulting local sound field results in a homogeneous auditory sound event, the auditory impression of a spatial perception of auditory sound sources and their correct obliteration can be achieved for a person listening.
Ein perzeptives Modell ist gemäß der vorliegenden Offenbarung der Edindung eine antizipierende Simulation, welche die Verödung und Qualität der virtuellen Schall- quelle, insbesondere deren Richtung und Ausdehnung, basierend auf beispielsweise den Amplituden, den Richtungen und den relativen Zeit- bzw. Phasenunterschieden aller im Hörbereich eintreffenden Schallwellen, d.h. den Hör-Schallereignissen, die von der Laufsprecheranordnung erzeugt werden und sich direkt wie auch indirekt über Reflexionen zum Hörbereich ausbreiten, bestimmt. A perceptive model is, according to the present disclosure of the Edenderung, an anticipatory simulation which the obliteration and quality of the virtual sound source, in particular its direction and extent, based on, for example, the amplitudes, the directions and the relative time or phase differences of all in the audible range incoming sound waves, i.e. the auditory sound events which are generated by the speaker arrangement and propagate directly as well as indirectly via reflections to the auditory area.
Eine Ziel-Hör-Schallquelle ist gemäß der vorliegenden Offenbarung der Erfindung eine virtuelle Schallquelle und damit eine Hör-Schallquelle, die eine gemäß der Signalquelle des Audiosignals korrekte Verödung bzw. der Hör-Schallquelle, die basierend auf dem perzeptiven Modell ermittelt und nachgeführt oder angenähert wird, und eine korrekte Verödung gemäß dem Audiosignal im Höreindruck der zuhörenden Person vermit- telt.Vorteilhafte Aspekte der Edindung sind Gegenstand der anhängigen Ansprüche. According to the present disclosure of the invention, a target auditory sound source is a virtual sound source and thus an auditory sound source that determines and tracks or approximates a correct obliteration according to the signal source of the audio signal or the auditory sound source based on the perceptual model and conveys correct obliteration according to the audio signal in the auditory impression of the listener. Advantageous aspects of the invention are the subject of the dependent claims.
In einer vorteilhaften Ausführungsform der Edindung umfasst das Erstellen des Audi- osignalfilters eine Berechnung von Filterkoeffizienten zur direkten Erlangung eines Au- diosignalfilters auf Basis des Vergleichsergebnisses. Alternativ kann auch eine Itera- tion von Filterkoeffizienten edolgen bis ein Abbruchkriterium erfüllt ist, wie beispiels- weise eine festgelegte maximale Anzahl von Iterationen, oder bis keine weitere Ver- besserung mehr erreicht wird. Hierdurch kann ein optimales Ergebnis besonders schnell eingeregelt werden, wenn die bereitgestellte Rechenleistung ausreicht. In an advantageous embodiment of the invention, the creation of the audio signal filter includes a calculation of filter coefficients for directly obtaining an audio signal filter on the basis of the comparison result. Alternatively, an iteration of filter coefficients can also be carried out until a termination criterion is met, such as a specified maximum number of iterations, or until no further improvement is achieved. As a result, an optimal result can be adjusted particularly quickly if the computing power provided is sufficient.
Bei einer alternativen vodeilhaften Ausführungsform der Edindung umfasst das Erstel- len des Audiosignalfilters eine Iteration von Filterkoeffizienten zur Annäherung an ein Optimum des Audiosignalfilters, bis das Vergleichsergebnis unterhalb von einem Schwellwert einer Fehlervorgabe liegt. Hierdurch kann der eine Annäherung an ein optimales Ergebnis mit geringerem Erfordernis von Rechenleistung oder mit weniger verfügbaren Parametern eingeregelt werden. In an alternative advantageous embodiment of the invention, the creation of the audio signal filter includes an iteration of filter coefficients to approach an optimum of the audio signal filter until the comparison result is below a threshold value of an error specification. This allows an approximation of a optimum result can be adjusted with less computing power required or with fewer available parameters.
Vorzugsweise umfasst das Bestimmen der Hör-Schallquelle eine Richtung und/oder eine Ausdehnung der Hör-Schallquelle in Bezug zum Hörbereich. So lässt sich die Verödung eindeutig und dennoch mit geringer Datenlast bestimmen. The determination of the auditory sound source preferably includes a direction and/or an extent of the auditory sound source in relation to the auditory area. In this way, the desolation can be determined clearly and yet with a low data load.
Von Vorteil ist es ferner, wenn das Bestimmen von Hör-Schallereignissen im Hörbe- reich eine Simulation der Schallausbreitung zwischen der Lautsprecheranordnung und dem Hörbereich mittels eines Ausbreitungsmodells auf Basis von anwendungsspezifi- schen akustisch-geometrischen Parametern mit Einfluss auf die Schallausbreitung umfasst. Dadurch kann eine parameterbasierte Vorhersage des akustischen Verhal- tens des Raumes und der Anordnung in Bezug auf die Wiedergabe des Audiosignals vorgenommen werden. It is also advantageous if the determination of audible sound events in the audible area includes a simulation of the sound propagation between the loudspeaker arrangement and the audible area using a propagation model based on application-specific acoustic-geometric parameters influencing the sound propagation. This allows a parameter-based prediction of the acoustic behavior of the room and the arrangement with regard to the reproduction of the audio signal to be made.
Bei der vorteilhaften Ergänzung des Ausbreitungsmodells können die akustisch-geo- metrischen Parameter anwendungsspezifisch vorbestimmt und in dem Ausbreitungs- modell bereitgestellt sein. In diesem Fall sind die Parameter auf eine bestimmte Kon- figuration des Systems und ggf. der Umgebung festgelegt bzw. vorbestimmt. In the case of the advantageous addition to the propagation model, the acoustic-geometric parameters can be predetermined in an application-specific manner and made available in the propagation model. In this case, the parameters are fixed or predetermined for a specific configuration of the system and possibly the environment.
Vorab können für die vorteilhafte Ergänzung des Ausbreitungsmodells die akustisch- geometrischen Parameter anwendungsspezifisch ermittelt werden bevor sie in dem Ausbreitungsmodell bereitgestellt werden. Dafür werden zuvor folgende Verfahrens- schritte durchgeführt: Aussenden von akustischen Signalen mittels der Lautsprecher- anordnung; Erfassen von Messwerten in Bezug auf direktionale Raumimpulsantworten aus einer Umgebung der Lautsprecheranordnung mittels einer Mikrofonanordnung mit definierter Position und Orientierung zu der Lautsprecheranordnung; und Bestimmen der anwendungsspezifischen akustisch-geometrischen Parameter in Übereinstim- mung mit den Messwerten. Dadurch können die Parameter in Bezug auf jede Ände- rung der System- und Umgebungskonfiguration zuvor eingemessen oder kalibriert werden. For the advantageous supplementation of the propagation model, the acoustic-geometric parameters can be determined in advance in an application-specific manner before they are made available in the propagation model. For this purpose, the following method steps are carried out beforehand: transmission of acoustic signals by means of the loudspeaker arrangement; Acquiring measured values relating to directional room impulse responses from an environment surrounding the loudspeaker arrangement using a microphone arrangement with a defined position and orientation in relation to the loudspeaker arrangement; and determining the application-specific acoustic-geometric parameters in accordance with the measured values. This allows the parameters to be measured or calibrated beforehand in relation to any change in the system and environmental configuration.
In einer vorteilhaften Ausführungsform, die weitere Anwendungsmöglichkeiten er- schließt, ist ferner eine Position des Hörbereichs beweglich. Zur Ermöglichung einer Reaktion auf die Bewegung des Hörbereichs werden die folgenden Verfahrensschritte durchgeführt: Erfassen einer Position des beweglichen Hörbereichs; und Nachführen einer Änderungen unter den akustisch-geometrischen Parametern in Übereinstim- mung mit der erfassten Position. Hierdurch wird es ermöglicht, dass sich eine zuhö- rende Person im Wiedergaberaum bewegen kann und dennoch stets einem nachge- führten, homogenen Hör-Schallereignis ausgesetzt wird, das einen räumlichen Hör- eindruck mit korrekter Verortung von Hör-Schallquellen vermittelt. In an advantageous embodiment, which opens up further application possibilities, a position of the hearing area is also movable. To enable a reaction to the movement of the auditory area, the following method steps are performed: detecting a position of the movable auditory area; and tracking a change among the acoustico-geometric parameters in accordance with the detected position. This makes it possible for a listening person to be able to move in the playback room and still be exposed to a tracked, homogeneous auditory sound event that conveys a spatial auditory impression with correct localization of auditory sound sources.
In Bezug auf die zuvor genannten Ausführungsformen können die anwendungsspezi- fischen akustisch-geometrischen Parameter, die für das Ausbreitungsmodell oder auch für das perzeptive Modell verwendet werden, ausgewählt sein aus: Konfigurati- onsparametern zur Beschreibung einer räumlichen Konfiguration der Lautsprecheran- ordnung und deren Umgebung aus der Gruppe: Position, Orientierung und/oder akus- tisches Abstrahlverhalten der Lautsprecheranordnungen, sowie Position, Orientierung und/oder akustische Eigenschaften von Reflexionsflächen in der Umgebung der Laut- sprecheranordnung; und Hörbereichsparametern zur Beschreibung einer räumlichen Bestimmung des Hörbereichs aus der Gruppe: Position und/oder Ausdehnung des Hörbereichs. Auf dieser Auswahl an Parametern lässt sich die Verortung eindeutig und dennoch mit geringer Datenlast bestimmen. With regard to the above-mentioned embodiments, the application-specific acoustic-geometric parameters used for the propagation model or also for the perceptual model can be selected from: configuration parameters for describing a spatial configuration of the loudspeaker arrangement and its surroundings the group: position, orientation and/or acoustic emission behavior of the loudspeaker arrangements, and position, orientation and/or acoustic properties of reflection surfaces in the vicinity of the loudspeaker arrangement; and audible area parameters for describing a spatial determination of the audible area from the group: position and/or extent of the audible area. With this selection of parameters, the localization can be determined clearly and yet with a low data load.
In einer weiteren vorteilhaften Ausführungsform der Erfindung, die eine technische Al- ternative zu einer Ergänzung des Ausbreitungsmodells darstellt, umfasst das Bestim- men von Hör-Schallereignissen im Hörbereich eine Erfassung von Messwerten der von der Lautsprecheranordnung erzeugten Erzeugungs-Schallereignisse mittels einer Mikrofonanordnung im Hörbereich umfasst. Hierdurch wird eine alternative technische Lösung ohne dem Erfordernis einer Rechenleistung für eine Simulation des Ausbrei- tungsmodells bereitgestellt, und durch eine direkte Messwerterfassung ersetzt. In a further advantageous embodiment of the invention, which represents a technical alternative to a supplement to the propagation model, the determination of auditory sound events in the auditory range includes the acquisition of measured values of the sound events generated by the loudspeaker arrangement using a microphone arrangement in the auditory range . This provides an alternative technical solution without the need for computing power for a simulation of the propagation model and replaces it with direct measurement value acquisition.
In einer besonders vorteilhaften Ausführungsform des erfindungsgemäßen Verfahrens zur Erzeugung von Audiosignalfiltern ist ein mehrkanaliges Audiosignal mit einem Ka- nal für jeden Lautsprecher in der Lautsprecheranordnung bereitgestellt, wobei das Er- stellen des Audiosignalfilters für jeden Kanal separat durchgeführt und auf den jewei- ligen Kanal angewendet wird. Hierdurch kann insbesondere ein Abstrahlverhalten der Lautsprecheranordnung mit Lautsprechern von unterschiedlicher Orientierung ange- steuert und deren Schallausbreitung im Wiedergaberaum beeinflusst bzw. eingestellt werden. Analog zu den Vorteilen des erfindungsgemäßen Verfahrens zur Erzeugung von Au- diosignalfiltern, bestehen weitere Ausführungsformen der Erfindung in einer software- oder hardwarebasierte Verkörperung, wie ein Audiosignalverarbeitungsprogramm o- der eine Audiosignalverarbeitungsvorrichtung, die Befehle bzw. Mittel zur Durchfüh- rung der Verfahrensschritte zur erfindungsgemäßen Erzeugung von Audiosignalfiltern aufweisen. In a particularly advantageous embodiment of the inventive method for generating audio signal filters, a multi-channel audio signal is provided with one channel for each loudspeaker in the loudspeaker arrangement, the audio signal filter being produced separately for each channel and applied to the respective channel . In this way, in particular, a radiation behavior of the loudspeaker arrangement with loudspeakers of different orientation can be controlled and their sound propagation in the playback room can be influenced or adjusted. Analogous to the advantages of the method according to the invention for generating audio signal filters, further embodiments of the invention consist of a software or hardware-based embodiment, such as an audio signal processing program or an audio signal processing device, the instructions or means for carrying out the method steps for generating according to the invention of audio signal filters.
Analog zu den Vorteilen besteht eine weitere verwendungsbezogene Ausführungs- form des erfindungsgemäßen Verfahrens zur Erzeugung von Audiosignalfiltern, in ei- nem Verfahren zur Erzeugung von virtuellen Schallquellen durch Schallausbreitung zwischen einer realen Lautsprecheranordnung und einem Hörbereich unter Anwen- dung von wenigstens einem erfindungsgemäß erzeugten Audiosignalfilter auf Audio- signale. Analogous to the advantages, another use-related embodiment of the method according to the invention for generating audio signal filters consists in a method for generating virtual sound sources by sound propagation between a real loudspeaker arrangement and a listening area using at least one audio signal filter generated according to the invention on audio - signals.
Eine vorteilhafte Ausführungsform des Verfahrens zur Erzeugung von virtuellen Schall- quellen umfasst ferner eine Ansteuerung von einer realen primären Lautsprecherano- rdnung und ein indirektes Ansteuern von einer virtuellen sekundären Lautsprecheran- ordnung auf, die durch Reflexionen von Schallwellen aus der primären Lautsprecher- anordnung an akustisch wirksamen Reflexionsflächen gebildet wird. Hierzu werden zusätzlich die folgenden Verfahrensschritte durchgeführt: Ausrichten eines akusti- schen Abstrahlverhaltens der primären Lautsprecheranordnung durch Anwendung der erstellten jeweiligen Audiosignalfilter auf jeden Kanal des Audiosignals für jeden Laut- sprecher der primären Lautsprecheranordnung; und Einstellen von Reflexionspfaden der Schallwellen zur Ausbildung der sekundären Lautsprecheranordnung durch das Ausrichten des akustische Abstrahlverhaltens der primären Lautsprecheranordnung. Durch die Bildung virtueller Lautsprecher wird die Gesamtanzahl und Richtungsvielfalt der Schallquellen erhöht, wodurch eine höhere räumliche Auflösung der akustischen Wiedergabe erzielt wird. An advantageous embodiment of the method for generating virtual sound sources also includes activation of a real primary loudspeaker arrangement and indirect activation of a virtual secondary loudspeaker arrangement, which is acoustically effective through reflections of sound waves from the primary loudspeaker arrangement Reflective surfaces is formed. To this end, the following method steps are additionally carried out: aligning an acoustic radiation behavior of the primary loudspeaker arrangement by applying the respective audio signal filter created to each channel of the audio signal for each loudspeaker of the primary loudspeaker arrangement; and adjusting reflection paths of the sound waves to form the secondary speaker assembly by aligning the acoustic directivity of the primary speaker assembly. The formation of virtual loudspeakers increases the total number and directionality of the sound sources, resulting in a higher spatial resolution of the acoustic reproduction.
Weitere Vorteile, Merkmale und Einzelheiten der Erfindung ergeben sich aus der nach- folgenden Beschreibung, in der unter Bezugnahme auf die Zeichnungen, Ausfüh- rungsbeispiele der Erfindung im Einzelnen beschrieben sind. Dabei können die in den Ansprüchen und in der Beschreibung erwähnten Merkmale jeweils einzeln für sich o- der in beliebiger Kombination erfindungswesentlich sein. Es zeigen schematisch: Further advantages, features and details of the invention result from the following description, in which exemplary embodiments of the invention are described in detail with reference to the drawings. The features mentioned in the claims and in the description can each be essential to the invention individually or in any combination. They show schematically:
Fig. 1 Eine Situation gemäß dem Stand der Technik, Fig. 2 ein erster Schritt eines erfindungsgemäßen Verfahrens, Fig. 1 A situation according to the prior art, 2 shows a first step of a method according to the invention,
Fig. 3 ein weiterer Schritt eines erfindungsgemäßen Verfahrens, 3 shows a further step of a method according to the invention,
Fig. 4 ein weiterer Schritt eines erfindungsgemäßen Verfahrens, 4 a further step of a method according to the invention,
Fig. 5 eine Darstellung der Anwendung eines perzeptiven Modells, 5 shows a representation of the application of a perceptual model,
Fig. 6 eine Darstellung der weiteren Anwendung des perzeptiven Modells, 6 shows a representation of the further application of the perceptual model,
Fig. 7 eine Ausführungsform zur Bestimmung der Hör-Schallereignisse, 7 shows an embodiment for determining the auditory sound events,
Fig. 8 eine weitere Ausführungsform zur Bestimmung der Hör-Schallereignisse, und 8 shows a further embodiment for determining the auditory sound events, and
Fig. 9 eine weitere Ausführungsform zur Bestimmung der Hör-Schallereignisse. 9 shows a further embodiment for determining the auditory sound events.
Die Figur 1 zeigt schematisch, wie sich eine Schallwahrnehmung für einen Flörer in einem Flörbereich 20 im Stand der Technik ergibt. Für eine bessere Verständlichkeit ist hier ein Beispiel mit einer Stereoanordnung mit zwei klassischen Lautsprechern gewählt. Die Lautsprecher haben üblicherweise eine Emissionsrichtung für Schall auf den Flörbereich zugerichtet, so dass, dargestellt durch die Pfeile an den Lautspre- chern, sich eine Emission des Schalls auf den Flörer im Flörbereich 20 zu ergibt. FIG. 1 shows schematically how a piler perceives sound in a pile area 20 in the prior art. For better understanding, an example with a stereo arrangement with two classic loudspeakers has been chosen here. The loudspeakers usually have an emission direction for sound directed towards the pile area, so that, illustrated by the arrows on the loudspeakers, the sound is emitted towards the pile in the pile area 20 .
Der von den Lautsprechern abgegebene Schall gelangt sowohl direkt, als auch indirekt über Reflexionen an den Wänden des Raumes, welche Reflexionsflächen 40 für den Schall darstellen, in den Flörbereich 20 und wird dort vom Flörer wahrgenommen. Ne- ben der inhaltlichen Wahrnehmung, also dem Wahrnehmen eines Geräuschs, eines Musikstücks, gesprochener Worte oder ähnlichem, ist ein Teil der Wahrnehmung auch die Verödung des Schalleindrucks, welcher sich durch die empfangenen Hör-Schal- lereignisse 32 beim Flörer ergibt. Dieser ist durch Zeitverzögerungen und Amplituden- verschiebungen der ihn erreichenden Hör-Schallereignisse in der Lage jedem Hör- Schallereignis 32 eine Hör-Schallquelle 30, also insbesondere den Flerkunftsort des jeweiligen Hör-Schallereignisses 32 zuzuordnen. Insbesondere ist eine Auflösung die- ser Zuordnung hinsichtlich der Richtung und/oder der Ausdehnung der Hör-Schall- quelle 30 möglich, so dass der Flörer die ihn erreichenden Hör-Schallereignisse 32 im Raum einer Position zuordnen kann und/oder, je nach Ausdehnung, dieser Position eine gewisse Genauigkeit zuweisen kann. Auf diese Weise ergibt sich für den Flörer ein räumlicher Höreindruck, welcher im Stand der Technik ausschließlich von der Auf- stellung und der Art der Lautsprecher sowie den Reflexionseigenschaften des Raumes abhängt. In der Figur 1 und bei der in dieser Figur dargestellten Stereoanordnung ergibt sich damit der bekannte Effekt, dass die Hör-Schallereignisse 32 dieser beiden Stereo-Lautsprecher sich zu einer Hör-Schallquelle 30 in der Mitte zwischen diesen beiden Lautsprechen zusammensetzen. The sound emitted by the loudspeakers reaches the floor area 20 both directly and indirectly via reflections on the walls of the room, which represent reflection surfaces 40 for the sound, and is perceived there by the floor operator. In addition to the perception of the content, i.e. the perception of a noise, a piece of music, spoken words or the like, part of the perception is also the obliteration of the sound impression, which results from the received auditory sound events 32 in the Florer. Due to time delays and amplitude shifts in the auditory sound events reaching it, the latter is able to assign an auditory sound source 30 to each auditory sound event 32 , ie in particular the location of the respective auditory sound event 32 . In particular, this assignment can be resolved with regard to the direction and/or the extent of the auditory sound source 30, so that the florist can assign the auditory sound events 32 reaching him to a position in space and/or, depending on the extent, can assign a certain accuracy to this position. In this way arises for the Flörer a spatial auditory impression which, in the prior art, depends solely on the placement and type of loudspeakers and the reflection properties of the room. In FIG. 1 and in the stereo arrangement shown in this figure, the known effect results that the audible sound events 32 of these two stereo loudspeakers combine to form an audible sound source 30 in the middle between these two loudspeakers.
Sind komplexere Verödungen der Hör-Schallquellen 30 im Raum gewünscht, so muss dies im Stand der Technik durch entsprechende komplexere Verteilung einer größeren Anzahl von Lautsprechern im Raum physikalisch erzeugt werden. Solche Systeme werden üblicherweise als Surround Systeme bezeichnet und erfordern eine größere Anzahl und vor allem exakte Aufstellung der einzelnen Lautsprecher im Raum. If more complex obliterations of the auditory sound sources 30 in the room are desired, this must be physically generated in the prior art by correspondingly more complex distribution of a larger number of loudspeakers in the room. Such systems are usually referred to as surround systems and require a larger number and, above all, precise positioning of the individual loudspeakers in the room.
Erfindungsgemäß soll nun eine verbesserte Verödung von Hör-Schallquellen 30 ohne Veränderung der realen Lautsprecheranordnung 10 ermöglicht werden. Hiedür wer- den Audiosignalfilter 50 eingesetzt, welche eine Beeinflussung des von der Lautspre- cheranordnung 10 abgegebenen Erzeugungs-Schallereignisse 31 erlauben. Die Figu- ren 2 bis 4 zeigen eine Möglichkeit, wie solche Audiosignalfilter 50 erzeugt werden können. According to the invention, an improved obliteration of auditory sound sources 30 without changing the real loudspeaker arrangement 10 should now be made possible. For this purpose, audio signal filters 50 are used, which allow the generation sound events 31 emitted by the loudspeaker arrangement 10 to be influenced. FIGS. 2 to 4 show one way in which such audio signal filters 50 can be produced.
In der Figur 2 ist eine Lautsprecheranordnung 10 mit zwei Positionen mit jeweils einem Array mit drei Einzellautsprechern dargestellt. Damit können von zwei Positionen aus jeweils drei Erzeugungs-Schallereignisse 31 in drei Richtungen abgegeben werden. Für jede Abgaberichtung ist ein Audiosignalfilter 50 vorgesehen, welcher über einen Frequenzbereich, vorzugsweise den kompletten, vom menschlichen Ohr wahrnehm- baren Frequenzbereich, frequenzspezifisch Amplituden verstärken oder abschwächen bzw. die Phase ändern kann. Die Figur 2 zeigt die Ausgangssituation eines edindungs- gemäßen Vedahrens, so dass der Audiosignalfilter 50 sich noch in einer Ausgangs- einstellung befindet. Diese Ausgangseinstellung beinhaltet beispielsweise eine pas- sive Funktion, also ein ungefiltedes Abgeben der Erzeugungs-Schallereignisse 31. FIG. 2 shows a loudspeaker arrangement 10 with two positions, each with an array with three individual loudspeakers. In this way, three generating sound events 31 can be emitted in three directions from two positions. An audio signal filter 50 is provided for each output direction, which can amplify or attenuate frequency-specific amplitudes or change the phase over a frequency range, preferably the complete frequency range perceptible by the human ear. FIG. 2 shows the initial situation of a procedure in accordance with the provisions, so that the audio signal filter 50 is still in an initial setting. This initial setting includes, for example, a passive function, i.e. an unfiltered output of the generation sound events 31.
Durch das Abgeben der Erzeugungs-Schallereignisse 31 in der Figur 2 ergibt sich, wie auch bei Stereo-Lautsprechern im Stand der Technik, eine durch die Reflexionen des Raums und die Aufstellpositionen der Lautsprecheranordnung 10, eine oder mehrere Hör-Schallquellen 30. Deren Positionierung hängt von den vom Hörer im Hörbereich 20 wahrgenommenen Hör-Schallereignissen 32 und der auf diesen basierenden Ver- ödung durch den Hörer ab. The emission of the generation sound events 31 in FIG. 2 results in one or more auditory sound sources 30, as with stereo loudspeakers in the prior art, due to the reflections of the room and the installation positions of the loudspeaker arrangement 10. Their positioning depends from those in the listening area by the listener 20 perceived auditory sound events 32 and the obliteration based on these by the listener.
Ohne einen Eingriff in das System wird die verödete Hör-Schallquelle 30 von der ge- wünschten Ziel-Hör-Schallquelle 33, wie in Figur 3 gezeigt, abweichen. Mit anderen Worten ordnet der Hörer die von ihm empfangenden Hör-Schallereignisse 32 nicht der gewünschten Ziel-Hör-Schallquelle 33, sondern einer von dieser beanstandeten Hör- Schallquelle 30 zu. Der Schall kommt also für den Hörer nicht aus der gewünschten Richtung. Das edindungsgemäße Ziel ist es nun die Hör-Schallquelle 30 möglichst nahe an der Ziel-Hör-Schallquelle 33 zu positionieren, um den gewünschten akusti- schen Raumeindruck beim Nutzer zu erzeugen. Without any intervention in the system, the obliterated auditory sound source 30 will deviate from the desired target auditory sound source 33, as shown in FIG. In other words, the listener does not allocate the auditory sound events 32 he has received to the desired target auditory sound source 33, but to an auditory sound source 30 objected to by the latter. The sound does not come from the desired direction for the listener. The goal according to the invention is now to position the auditory sound source 30 as close as possible to the target auditory sound source 33 in order to generate the desired acoustic spatial impression for the user.
Diese Berichtigung der Positionierung edolgt in digitaler Weise, nämlich durch das An- wenden eines Audiosignalfilters 50 wie in der Figur 4 dargestellt. Durch spezifisches Filtern der Erzeugungs-Schallereignisse 31 , und/oder der Zeitverzögerung einzelner Erzeugungs-Schallereignisse 31 kann die Reflexion an den Reflexionsflächen 40 be- einflusst und damit auch die Art und der Zeitpunkt der Hör-Schallereignisse 32 im Hör- bereich 20 verändert werden. Durch die auf diese Weise veränderte Wiedergabe ver- ödet der Hörer in entsprechender Weise auch das diesen Hör-Schallereignissen 32 zugehörige Schallsignal an einer anderen Raumposition, in der Figur 4 in der ge- wünschten Ziel-Hör-Schallquelle 50. This correction of the positioning is done digitally, namely by applying an audio signal filter 50 as shown in FIG. By specifically filtering the generation sound events 31 and/or the time delay of individual generation sound events 31, the reflection on the reflecting surfaces 40 can be influenced and thus the type and time of the auditory sound events 32 in the auditory area 20 can also be changed. As a result of the reproduction changed in this way, the listener also correspondingly obliterates the sound signal associated with these auditory sound events 32 at a different spatial position, in FIG. 4 in the desired target auditory sound source 50.
Wie der Figur 4 zu entnehmen ist, erfolgt das Verschieben der räumlichen Verödung der Hör-Schallquelle 30 alleine durch die Veränderung der Einstellungen des Audio- signalfilters 50. Eine Anpassung der Art, Ausrichtung und/oder Positionierung der Laut- sprecheranordnung 10 ist nicht notwendig. Somit kann ohne Steigerung der Komple- xität der Lautsprecheranordnung und ohne manuellen Eingriff des Nutzers in Form eine Neu-Positionierung der Lautsprecheranordnung, der räumliche Eindruck in der Wahrnehmung im Hörbereich 20 veränded werden. As can be seen from FIG. 4, the spatial obliteration of the auditory sound source 30 is shifted solely by changing the settings of the audio signal filter 50. An adaptation of the type, orientation and/or positioning of the loudspeaker arrangement 10 is not necessary. Thus, without increasing the complexity of the loudspeaker arrangement and without manual intervention by the user in the form of a repositioning of the loudspeaker arrangement, the spatial impression in the perception in the listening area 20 can be changed.
Sobald der Audiosignalfilter 50, welcher die gewünschte räumlicher Zuordnung für den Hörbereich 20 erzeugt, ermittelt ist, kann dieser angewendet werden und räumliche Schallsituationen in digitaler Weise erzeugen. Beispielsweise kann ein Sprecher als Teil eines komplexen Schallsignals eindeutig wahrnehmbar im Raum positioniert wer- den. Auch komplexe Zusammenhänge unterschiedlicher Schallsignale, beispielsweise Hintergrundgeräusche im Verhältnis zu einer Konversation, können in digitaler Weise in den Erzeugungs-Schallereignissen 31 codiert werden, sodass sich passende Hör- Schallereignisse 32 im Hörbereich 20 ergeben, welche in der Wahrnehmung durch den Hörer der gewünschten Positionierung entsprechen. As soon as the audio signal filter 50, which generates the desired spatial assignment for the listening area 20, has been determined, it can be applied and generate spatial sound situations in a digital manner. For example, a speaker can be clearly positioned in space as part of a complex sound signal. Even complex relationships between different sound signals, for example background noise in relation to a conversation, can be digitally are encoded in the generation sound events 31, so that suitable auditory sound events 32 result in the auditory area 20, which correspond to the desired positioning in the perception of the listener.
Neben der Anwendung eines solchen Audiosignalfilters 50 und der Wirkung, wie sie zu den Figuren 2 bis 4 erläutert wird, ist ein Kerngedanke der vorliegenden Erfindung die Art und Weise der Erzeugung eines solchen Audiosignalfilters 50. Dies ist insbe- sondere wesentlich, da die Audiosignalfilter 50 spezifisch für eine Hörposition 20 und spezifisch für eine Reflexionssituation in einem Raum sind, folglich individuell ausge- bildet sein müssen. Hierfür ist ein erfindungsgemäßes Verfahren darauf ausgelegt, dass solche individuellen Audiosignalfilter 50 einfach und automatisiert erzeugt wer- den können. In addition to the use of such an audio signal filter 50 and the effect as explained in Figures 2 to 4, a core idea of the present invention is the way in which such an audio signal filter 50 is generated. This is particularly important because the audio signal filter 50 are specific to a listening position 20 and specific to a reflection situation in a room, and must therefore be designed individually. For this purpose, a method according to the invention is designed so that such individual audio signal filters 50 can be generated easily and automatically.
Die Figur 5 zeigt einen ersten Schritt einer solchen Erzeugung. Dabei werden Hör- Schallereignisse 32 bestimmt, welche den Hörbereich 20 erreichen. Die möglichen Ar- ten der Bestimmung werden später noch näher erläutert. Neben einem realen Bestim- men mittels Mikrofonen ist auch eine digitalisierte und/oder teilweise digitalisierte Be- stimmung denkbar. Kern dieser Erzeugungsschritte ist ein perzeptives Modell, welches die Wahrnehmung des Hörers im Hörbereich 20 abbilden und simulieren kann. Mit anderen Worten erlaubt das perzeptive Modell, eine algorithmische Beziehung zwi- schen den Schallparametern des Hör-S challereignisses 32 und der von einem menschlichen Hörer durchgeführten Verödung dieser Hör-Schallereignisse 32 herzu- stellen. Das perzeptive Modell bestimmt also durch algorithmischen Zusammenhang, zum Beispiel aus Eingangsparametern wie Amplituden, Richtungsvektoren und/oder Zeitverzögerungen, eine Hör-Schallquelle 30 im Raum, insbesondere hinsichtlich ihrer Richtung zum Hörbereich 20 und/oder ihrer Ausdehnung. Das perzeptive Modell mo- delliert also die Wahrnehmung des Hörers. FIG. 5 shows a first step of such a generation. Here, auditory sound events 32 that reach the auditory range 20 are determined. The possible types of determination will be explained in more detail later. In addition to a real determination using microphones, a digitized and/or partially digitized determination is also conceivable. The core of these generation steps is a perceptual model that can map and simulate the listener's perception in the auditory area 20 . In other words, the perceptive model allows an algorithmic relationship to be established between the sound parameters of the auditory sound event 32 and the obliteration of these auditory sound events 32 performed by a human listener. The perceptive model thus determines an auditory sound source 30 in space, in particular with regard to its direction to the auditory area 20 and/or its extent, by means of an algorithmic relationship, for example from input parameters such as amplitudes, direction vectors and/or time delays. The perceptive model thus models the listener's perception.
Ist der modellierte Ort der Hör-Schallquelle 30 bekannt, kann dieser einfach in geo- metrischer Weise mit einem gewünschten Ort der Ziel-Hör-Schallquelle 33 verglichen werden. Neben einem rein qualitativen Vergleich ist insbesondere ein quantitativer Vergleich vorteilhaft, welcher Abstand und Richtungsunterschied, beispielsweise als Winkel, wiedergeben kann. Aus diesem Vergleichsergebnis können unterschiedliche Folgeschritte im Erzeugungsverfahren generiert werden. Zum einen ist eine Rückbestimmung über das perzeptive Modell möglich. So können zum Beispiel aus der gewünschten Ziel-Hör-Schallquelle 33 die notwendigen Hör- Schallereignisse 32 bestimmt werden, welche für diese Verödung in der Wahrneh- mung durch das perzeptive Modell notwendig wären. Aus diesen notwendigen Hör- Schallereignissen kann, insbesondere unter Kenntnis der Reflexionsverhältnisse im Raum, eine Rückbestimmung der dafür notwendigen Erzeugungs-Schallereignisse 31 erfolgen. Abschließend kann ermittelt werden, wie eine Filterung auf die ungefilterten Erzeugungs-Schallereignisse 31 aufgesetzt werden muss, um aus diesen die notwen- digen Erzeugungs-Schallereignisse 31 zu erzeugen. Diese ermittelte notwendige Fil- terung kann abschließend als Audiosignalfilter 50 gesetzt und/oder ausgegeben wer- den. If the modeled location of the auditory sound source 30 is known, it can be easily compared geometrically with a desired location of the target auditory sound source 33 . In addition to a purely qualitative comparison, a quantitative comparison is particularly advantageous, which can reflect the distance and difference in direction, for example as an angle. Different subsequent steps in the production process can be generated from this comparison result. On the one hand, a retrospective determination via the perceptual model is possible. For example, the required auditory sound events 32 can be determined from the desired target auditory sound source 33, which would be necessary for this obliteration in the perception by the perceptual model. From these necessary auditory sound events, the generation sound events 31 necessary for this can be re-determined, in particular with knowledge of the reflection conditions in the room. Finally, it can be determined how filtering must be applied to the unfiltered generation sound events 31 in order to generate the necessary generation sound events 31 from them. This determined necessary filtering can finally be set and/or output as an audio signal filter 50 .
Alternativ zu der voranstehend beschriebenen direkten, algorithmischen Bestimmung des Audiosignalfilters 50 sind auch iterierende, insbesondere optimierende Vorge- hensweisen denkbar. So kann durch gezielte Variation des Audiosignalfilters 50 und erneuten Durchlauf der Verfahrensschritte die Wirkung der gezielten Variation in Form einer Annäherung der Hör- Schallquelle 30 zur Ziel-Hör- Schallquelle 33 bestimmt wer- den, so dass schrittweise eine Verschiebung des Hör- Schallquelle 30 zur Ziel-Hör- Schallquelle 33 mittels einer schrittweisen Variation des Audiosignalfilters 50 erfolgt. As an alternative to the direct, algorithmic determination of the audio signal filter 50 described above, iterative, in particular optimizing, procedures are also conceivable. By deliberately varying the audio signal filter 50 and repeating the process steps, the effect of the deliberate variation can be determined in the form of an approximation of the auditory sound source 30 to the target auditory sound source 33, so that the auditory sound source 30 is gradually shifted to the Target auditory sound source 33 takes place by means of a gradual variation of the audio signal filter 50.
Die Figuren 7 bis 9 zeigen noch unterschiedliche Möglichkeiten der Bestimmung der Hör- Schallereignisse 32. In der Figur 7 ist eine vollständig digitale Variante gezeigt. Ein Ausbreitungsmodell, welches die Reflexionseigenschaften des Raumes und die Positionierung der Lautsprecheranordnung 10 als Rahmenparameter beinhaltet, stellt einen algorithmischen Zusammenhang zwischen den Erzeugungs-Schallereignissen 31 und den Hör- Schallereignissen 32 her. Dieser Zusammenhang ist insbesondere bidirektional ausgebildet für die weiter oben beschriebene Rückbestimmungsmöglich- keit bei der Erzeugung der Audiosignalfilter 50. FIGS. 7 to 9 show different possibilities for determining the auditory sound events 32. A completely digital variant is shown in FIG. A propagation model, which contains the reflection properties of the room and the positioning of the loudspeaker arrangement 10 as framework parameters, creates an algorithmic connection between the generation sound events 31 and the auditory sound events 32 . This relationship is bidirectional, in particular, for the redetermination option described above when generating the audio signal filter 50.
Ist ein solches Ausbreitungsmodell nicht vorhanden, kann auch eine reale Bestimmung der Hör- Schallereignisse 32 erfolgen, wie dies die Figur 8 zeigt. Der Flörer im Flörbe- reich 20 wird hier durch eine Mikrofonanordnung 60 ersetzt, so dass real von der Laut- sprecheranordnung 10 erzeugte Erzeugungs-Schallereignisse 31 durch reale Ausbrei- tung im Raum zu realen und von der Mikrofonanordnung 60 empfangen Flor- Schallereignissen 32 führen. Dabei kommen insbesondere definierte und/oder stan- dardisierte Testsignale als Erzeugungs-Schallereignisse 31 zum Einsatz. If such a propagation model is not available, a real determination of the auditory sound events 32 can also take place, as shown in FIG. The florer in the flor area 20 is replaced here by a microphone arrangement 60, so that sound events 31 actually produced by the loudspeaker arrangement 10 become real through real propagation in space and are received by the microphone arrangement 60. Sound events 32 lead. In this case, defined and/or standardized test signals are used as generating sound events 31 in particular.
Die Figur 9 zeigt eine Kombination der digitalen Ausbildung der Figur 7 und der realen Ausbildung der Figur 8. So dient die reale Mikrofonanordnung 60 hier nicht der direkten Bestimmung der Hör- Schallereignisse 32, sondern der Anpassung des Ausbreitungs- modells an den Raum. Mittels der Mikrofonanordnung 60 kann ein allgemeines Aus- breitungsmodell mit den notwendigen Spezifizierungsparametern bzw. akustisch-geo- metrischen Parametern einer Umgebungskonfiguration ausgestattet werden, welche dieses Ausbreitungsmodell anschließend in die Lage versetzen die Ausbreitung algo- rithmisch zu ermitteln, wie dies zur Figur 7 erläutert worden ist. FIG. 9 shows a combination of the digital design in FIG. 7 and the real design in FIG. A general propagation model can be equipped with the necessary specification parameters or acoustic-geometric parameters of an environmental configuration by means of the microphone arrangement 60, which then enable this propagation model to determine the propagation algorithmically, as has been explained for FIG is.
Die voranstehenden Erläuterungen der Ausführungsformen beschreiben die vorlie- gende Erfindung ausschließlich im Rahmen von Beispielen. Selbstverständlich können einzelne Merkmale der Ausführungsformen, sofern technisch sinnvoll, frei miteinander kombiniert werden, ohne den Rahmen der vorliegenden Erfindung zu verlassen. The above explanations of the embodiments describe the present invention exclusively in the context of examples. It goes without saying that individual features of the embodiments can be freely combined with one another, insofar as this makes technical sense, without departing from the scope of the present invention.
Bezugszeichenliste 10 Lautsprecheranordnung 20 Hörbereich LIST OF REFERENCE NUMERALS 10 Loudspeaker arrangement 20 listening area
30 Hör-Schallquelle 30 auditory sound source
31 Erzeugungs-Schallereignisse31 generation sound events
32 Hör-Schallereignis 32 auditory sound event
33 Ziel-Hör-Schallquelle 40 Reflexionsfläche 33 target auditory sound source 40 reflection surface
50 Audiosignalfilter 60 Mikrofonanordnung 50 audio signal filter 60 microphone arrangement

Claims

Patentansprüche patent claims
1. Verfahren zur Erzeugung von Audiosignalfiltern (50), die auf Audiosignale ange- wendet werden, um Hör-Schallquellen (30) durch Schallausbreitung zwischen ei- ner realen Lautsprecheranordnung (10) und einem Hörbereich (20) zu erzeugen, wobei das Verfahren die folgenden Verfahrensschritte aufweist: 1. A method for generating audio signal filters (50) that are applied to audio signals in order to generate auditory sound sources (30) by sound propagation between a real loudspeaker arrangement (10) and an auditory area (20), the method has the following process steps:
Bestimmen von Hör-Schallereignissen (32) im Hörbereich (20) auf Basis von der Lautsprecheranordnung (10) erzeugten Erzeugungs-Schallereig- nissen (31); Determining auditory sound events (32) in the auditory area (20) on the basis of the loudspeaker arrangement (10) generating sound events (31);
Bestimmen einer Hör-Schallquelle (30) auf Basis der bestimmten Hör- Schallereignisse (32) mittels eines perzeptiven Modells; determining an auditory sound source (30) on the basis of the determined auditory sound events (32) using a perceptual model;
Vergleichen der bestimmten Hör-Schallquelle (30) mit einer virtuellen Ziel- Hör-Schallquelle (33); und Comparing the determined auditory sound source (30) with a virtual target auditory sound source (33); and
Erstellen eines Audiosignalfilters (50) auf Basis des Vergleichsergebnisses. Creation of an audio signal filter (50) based on the comparison result.
2. Verfahren zur Erzeugung von Audiosignalfiltern (50) nach Anspruch 1 , wobei das Erstellen des Audiosignalfilters (50) eine Berechnung von Filterkoeffizienten zur direkten Erlangung eines Audiosignalfilters (50) auf Basis des Vergleichsergeb- nisses umfasst. 2. A method for generating audio signal filters (50) according to claim 1, wherein the creation of the audio signal filter (50) comprises a calculation of filter coefficients for directly obtaining an audio signal filter (50) on the basis of the comparison result.
3. Verfahren zur Erzeugung von Audiosignalfiltern (50) nach Anspruch 1 , wobei das Erstellen des Audiosignalfilters (50) eine Iteration von Filterkoeffizienten zur An- näherung an ein Optimum des Audiosignalfilters (50) umfasst, bis das Vergleich- sergebnis unterhalb von einem Schwellwert einer Fehlervorgabe liegt. 3. A method for generating audio signal filters (50) according to claim 1, wherein the creation of the audio signal filter (50) comprises an iteration of filter coefficients for approximating an optimum of the audio signal filter (50) until the comparison result falls below a threshold value of one default error lies.
4. Verfahren zur Erzeugung von Audiosignalfiltern (50) nach einem der vorherge- henden Ansprüche, wobei das Bestimmen der Hör-Schallquelle (30) eine Rich- tung und/oder eine Ausdehnung der Hör-Schallquelle (30) in Bezug zum Hörbe- reich (20) umfasst. 4. Method for generating audio signal filters (50) according to one of the preceding claims, wherein the determination of the auditory sound source (30) includes a direction and/or an extension of the auditory sound source (30) in relation to the auditory area (20) includes.
5. Verfahren zur Erzeugung von Audiosignalfiltern (50) nach einem der vorherge- henden Ansprüche, wobei das Bestimmen von Hör-Schallereignissen (32) im Hörbereich (20) eine Simulation der Schallausbreitung zwischen der Lautsprecheranordnung (10) und dem Hörbereich (20) mittels eines Ausbrei- tungsmodells auf Basis von anwendungsspezifischen akustisch-geometrischen Parametern mit Einfluss auf die Schallausbreitung umfasst. 5. A method for generating audio signal filters (50) according to any one of the preceding claims, wherein the determination of auditory sound events (32) in the auditory area (20) is a simulation of the sound propagation between the Loudspeaker arrangement (10) and the listening area (20) by means of a propagation model based on application-specific acoustic-geometric parameters that influence the sound propagation.
6. Verfahren zur Erzeugung von Audiosignalfiltern (50) nach Anspruch 5, wobei die akustisch-geometrischen Parameter anwendungsspezifisch vorbestimmt und in dem Ausbreitungsmodell bereitgestellt sind. 6. Method for generating audio signal filters (50) according to claim 5, wherein the acoustic-geometric parameters are predetermined in an application-specific manner and are provided in the propagation model.
7. Verfahren zur Erzeugung von Audiosignalfiltern (50) nach Anspruch 5 oder 6, wobei die akustisch-geometrischen Parameter anwendungsspezifisch ermittelt werden bevor sie in dem Ausbreitungsmodell bereitgestellt werden, aufweisend die Schritte: 7. Method for generating audio signal filters (50) according to claim 5 or 6, wherein the acoustic-geometric parameters are determined application-specifically before they are provided in the propagation model, having the steps:
Aussenden von akustischen Signalen mittels der LautsprecheranordnungSending out acoustic signals by means of the loudspeaker arrangement
(10); (10);
Erfassen von Messwerten in Bezug auf direktionale Raumimpulsantworten aus einer Umgebung der der Lautsprecheranordnung (10) mittels einer Mik- rofonanordnung (60) mit definierter Position und Orientierung zu der Laut- sprecheranordnung (10); und Recording measured values relating to directional room impulse responses from an environment of the loudspeaker arrangement (10) by means of a microphone arrangement (60) with a defined position and orientation in relation to the loudspeaker arrangement (10); and
Bestimmen der anwendungsspezifischen akustisch-geometrischen Para- meter in Übereinstimmung mit den Messwerten. Determining the application-specific acoustic-geometric parameters in accordance with the measured values.
8. Verfahren zur Erzeugung von Audiosignalfiltern (50) nach einem der Ansprüche 5 bis 7, wobei ferner eine Position des Hörbereichs (20) beweglich ist, aufweisend die Schritte: 8. A method for generating audio signal filters (50) according to any one of claims 5 to 7, further wherein a position of the listening area (20) is movable, comprising the steps of:
Erfassen einer Position des beweglichen Hörbereichs (20); unddetecting a position of the movable listening area (20); and
Nachführen einer Änderungen unter den akustisch-geometrischen Parame- tern in Übereinstimmung mit der erfassten Position. Tracking of a change in the acoustic-geometric parameters in accordance with the detected position.
9. Verfahren zur Erzeugung von Audiosignalfiltern (50) nach einem der vorherge- henden Ansprüche, wobei die anwendungsspezifischen akustisch-geometri- schen Parameter ausgewählt sind aus: Konfigurationsparametern zur Beschreibung einer räumlichen Konfiguration der Lautsprecheranordnung (10) und deren Umgebung aus der Gruppe: Position, Orientierung und/oder akustisches Abstrahlverhalten der Lautsprecheranordnun- gen, sowie Position, Orientierung und/oder akustische Eigenschaften von Refle- xionsflächen (40) in der Umgebung der Lautsprecheranordnung (10); und9. Method for generating audio signal filters (50) according to one of the preceding claims, wherein the application-specific acoustic-geometric parameters are selected from: Configuration parameters for describing a spatial configuration of the loudspeaker arrangement (10) and its environment from the group: position, orientation and/or acoustic emission behavior of the loudspeaker arrangements, and position, orientation and/or acoustic properties of reflection surfaces (40) in the environment the speaker assembly (10); and
Hörbereichsparametern zur Beschreibung einer räumlichen Bestimmung des Hörbereichs (20) aus der Gruppe: Position und/oder Ausdehnung des Hörbe- reichs (20). Hörbereichsparameter to describe a spatial determination of the hearing area (20) from the group: position and / or extent of the hearing area (20).
10. Verfahren zur Erzeugung von Audiosignalfiltern (50) nach einem der Ansprüche 1 bis 4, wobei das Bestimmen von Hör-Schallereignissen (32) im Hörbereich (20) eine Erfassung von Messwerten der von der Lautsprecheranordnung (10) er- zeugten Erzeugungs-Schallereignisse (31) mittels einer Mikrofonanordnung (60) im Hörbereich umfasst. 10. A method for generating audio signal filters (50) according to any one of claims 1 to 4, wherein the determination of auditory sound events (32) in the auditory area (20) includes a detection of measured values of the loudspeaker arrangement (10) generated generating sound events (31) by means of a microphone arrangement (60) in the listening area.
11. Verfahren zur Erzeugung von Audiosignalfiltern (50) nach einem der vorherge- henden Ansprüche, wobei ein mehrkanaliges Audiosignal mit einem Kanal für jeden Lautsprecher in der Lautsprecheranordnung (10) bereitgestellt wird, und wobei das Erstellen des Audiosignalfilters (50) für jeden Kanal separat durchge- führt und auf den jeweiligen Kanal angewendet wird. 11. Method for generating audio signal filters (50) according to any one of the preceding claims, wherein a multi-channel audio signal with one channel for each loudspeaker in the loudspeaker arrangement (10) is provided, and wherein the creation of the audio signal filter (50) for each channel separately carried out and applied to the respective channel.
12. Audiosignalverarbeitungs-Programm, umfassend Befehle, die bei der Ausfüh- rung des Programms durch einen Computer oder eine Audiosignalverarbeitungs- vorrichtung diesen oder diese veranlassen, das Verfahren nach einem der An- sprüche 1 bis 11 auszuführen. 12. An audio signal processing program comprising instructions which, when the program is executed by a computer or an audio signal processing device, cause the latter to carry out the method according to any one of claims 1 to 11.
13. Audiosignalverarbeitungs-Vorrichtung, die dazu eingerichtet ist, das Verfahren nach einem der Ansprüche 1 bis 11 durchzuführen. 13. Audio signal processing device that is set up to carry out the method according to any one of claims 1 to 11.
14. Verfahren zur Erzeugung von virtuellen Schallquellen (30) durch Schallausbrei- tung zwischen einer realen Lautsprecheranordnung (10) und einem Hörbereich (20) unter Anwendung von wenigstens einem Audiosignalfilter (50) auf Audiosig- nale, wobei der wenigstens eine Audiosignalfilter (50) durch das Verfahren nach einem der Ansprüche 1 bis 11 erzeugt wird. 14. Method for generating virtual sound sources (30) by sound propagation between a real loudspeaker arrangement (10) and a listening area (20) using at least one audio signal filter (50) on audio signals, wherein the at least one audio signal filter (50) produced by the method of any one of claims 1 to 11.
15. Verfahren zur Erzeugung von virtuellen Schallquellen (30) nach Anspruch 14, ferner aufweisend eine Ansteuerung von einer realen primären Lautsprecheran- ordnung (10) und ein indirektes Ansteuern von einer virtuellen sekundären Laut- sprecheranordnung, die durch Reflexionen von Schallwellen aus der primären Lautsprecheranordnung (10) an akustisch wirksamen Reflexionsflächen (40) ge- bildet wird, aufweisend die Schritte: 15. The method for generating virtual sound sources (30) according to claim 14, further comprising driving from a real primary loudspeaker arrangement (10) and indirectly driving from a virtual secondary loudspeaker arrangement, which is formed by reflections of sound waves from the primary loudspeaker arrangement (10) is formed on acoustically effective reflection surfaces (40), having the steps:
Ausrichten eines akustischen Abstrahlverhaltens der primären Lautspre- cheranordnung (10) durch Anwendung der erstellten jeweiligen Audiosig- nalfilter (50) auf jeden Kanal des Audiosignals für jeden Lautsprecher der primären Lautsprecheranordnung (10); und aligning an acoustic directivity of the primary speaker assembly (10) by applying the created respective audio signal filters (50) to each channel of the audio signal for each speaker of the primary speaker assembly (10); and
Einstellen von Reflexionspfaden der Schallwellen zur Ausbildung der se- kundären Lautsprecheranordnung durch das Ausrichten des akustische Ab- strahlverhaltens der primären Lautsprecheranordnung (10). Adjusting reflection paths of the sound waves to form the secondary loudspeaker arrangement by aligning the acoustic radiation behavior of the primary loudspeaker arrangement (10).
PCT/AT2022/060060 2021-03-02 2022-03-02 Method for producing audio signal filters for audio signals in order to generate virtual sound sources WO2022183231A1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
AT600592021 2021-03-02
ATA60059/2021 2021-03-02

Publications (1)

Publication Number Publication Date
WO2022183231A1 true WO2022183231A1 (en) 2022-09-09

Family

ID=80683620

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/AT2022/060060 WO2022183231A1 (en) 2021-03-02 2022-03-02 Method for producing audio signal filters for audio signals in order to generate virtual sound sources

Country Status (1)

Country Link
WO (1) WO2022183231A1 (en)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5809150A (en) 1995-06-28 1998-09-15 Eberbach; Steven J. Surround sound loudspeaker system
EP2096883A2 (en) 2008-02-27 2009-09-02 Yamaha Corporation Surround sound outputting device and surround sound outputting method
WO2012023864A1 (en) 2010-08-20 2012-02-23 Industrial Research Limited Surround sound system
US20140126753A1 (en) 2011-06-30 2014-05-08 Yamaha Corporation Speaker Array Apparatus
WO2014138134A2 (en) 2013-03-05 2014-09-12 Tiskerling Dynamics Llc Adjusting the beam pattern of a speaker array based on the location of one or more listeners
US20160330562A1 (en) * 2014-01-10 2016-11-10 Dolby Laboratories Licensing Corporation Calibration of virtual height speakers using programmable portable devices
US20180184202A1 (en) 2015-08-03 2018-06-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Soundbar
GB2579348A (en) * 2018-11-16 2020-06-24 Nokia Technologies Oy Audio processing
WO2021021682A1 (en) * 2019-07-30 2021-02-04 Dolby Laboratories Licensing Corporation Rendering audio over multiple speakers with multiple activation criteria

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5809150A (en) 1995-06-28 1998-09-15 Eberbach; Steven J. Surround sound loudspeaker system
EP2096883A2 (en) 2008-02-27 2009-09-02 Yamaha Corporation Surround sound outputting device and surround sound outputting method
WO2012023864A1 (en) 2010-08-20 2012-02-23 Industrial Research Limited Surround sound system
US20140126753A1 (en) 2011-06-30 2014-05-08 Yamaha Corporation Speaker Array Apparatus
WO2014138134A2 (en) 2013-03-05 2014-09-12 Tiskerling Dynamics Llc Adjusting the beam pattern of a speaker array based on the location of one or more listeners
US20160330562A1 (en) * 2014-01-10 2016-11-10 Dolby Laboratories Licensing Corporation Calibration of virtual height speakers using programmable portable devices
US20180184202A1 (en) 2015-08-03 2018-06-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Soundbar
GB2579348A (en) * 2018-11-16 2020-06-24 Nokia Technologies Oy Audio processing
WO2021021682A1 (en) * 2019-07-30 2021-02-04 Dolby Laboratories Licensing Corporation Rendering audio over multiple speakers with multiple activation criteria

Similar Documents

Publication Publication Date Title
EP1977626B1 (en) Method for recording and reproducing a sound source with time-variable directional characteristics
EP3280161B1 (en) Speaker system
EP3005732B1 (en) Device and method for spatially selective audio playback
DE60125553T2 (en) METHOD OF INTERFERENCE SUPPRESSION
EP1013141B1 (en) Method and device for reproducing a stereophonic audiosignal
DE69806040T3 (en) HEARING DEVICE WITH MICROPHONE ARRAY
DE102019129330A1 (en) Conference system with a microphone array system and method for voice recording in a conference system
EP1489884B1 (en) Method for operating an hearing aid device and hearing aid device with a microphone system wherein different directional characteristics are selectable
EP0905933A2 (en) Method and system for mixing audio signals
EP3677053B1 (en) Loudspeaker system for surround sound with rejection of undesirable direct sound
EP1933590B1 (en) Method for adjusting hearing aids
EP1471770B1 (en) Method for generating an approximated partial transfer function
EP0712264B1 (en) Method and apparatus for multi-channel sound reproduction
WO2022183231A1 (en) Method for producing audio signal filters for audio signals in order to generate virtual sound sources
DE102019135690A1 (en) Method and device for audio signal processing for binaural virtualization
WO2012016992A2 (en) Device and method for evaluating and optimizing signals on the basis of algebraic invariants
EP3698474B1 (en) Method for the adjustment of parameters for the individual modification of an audio signal
AT523644B1 (en) Method for generating a conversion filter for converting a multidimensional output audio signal into a two-dimensional auditory audio signal
DE10215775B4 (en) Method for the spatial representation of sound sources
EP1238567B1 (en) Method for fixing the hifi position of an audio system
DE102005060036B4 (en) Method and device for audio signal processing
DE3737873C2 (en) Use of headsets to improve speech intelligibility in a noisy environment
EP2503799B1 (en) Method and system for calculating synthetic head related transfer functions by means of virtual local sound field synthesis
EP1900250B1 (en) Electroacoustic method
EP2487891B1 (en) Prevention of an acoustic echo in full duplex systems

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 22708730

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 22708730

Country of ref document: EP

Kind code of ref document: A1