EP1576847A1 - Audio playback system and method for playing back an audio signal - Google Patents

Audio playback system and method for playing back an audio signal

Info

Publication number
EP1576847A1
EP1576847A1 EP03782222A EP03782222A EP1576847A1 EP 1576847 A1 EP1576847 A1 EP 1576847A1 EP 03782222 A EP03782222 A EP 03782222A EP 03782222 A EP03782222 A EP 03782222A EP 1576847 A1 EP1576847 A1 EP 1576847A1
Authority
EP
European Patent Office
Prior art keywords
audio
loudspeaker
playback
module
wave field
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
EP03782222A
Other languages
German (de)
French (fr)
Other versions
EP1576847B1 (en
Inventor
Frank Melchior
Thomas Röder
Michael Beckinger
Sandra Brix
Thomas Sporer
Haymo Kutschbach
Berthold Schlenker
Carsten Land
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Publication of EP1576847A1 publication Critical patent/EP1576847A1/en
Application granted granted Critical
Publication of EP1576847B1 publication Critical patent/EP1576847B1/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/02Spatial or constructional arrangements of loudspeakers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/12Circuits for transducers, loudspeakers or microphones for distributing signals to two or more loudspeakers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • H04R1/403Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers loud-speakers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/13Application of wave-field synthesis in stereophonic audio systems

Definitions

  • the present invention relates to audio playback systems and, more particularly, to practical audio playback systems for variable size playback rooms such as cinemas, the audio playback systems being based on wave field synthesis.
  • wave field synthesis Due to the enormous demands of this method on computer performance and transmission rates, wave field synthesis has so far only rarely been used in practice. It is only the advances in the areas of microprocessor technology and audio coding that allow this technology to be used in concrete applications. The first products in the professional sector are expected next year. In a few years, the first wave field synthesis applications for the consumer sector will also be launched.
  • Every point that is captured by a wave is the starting point of an elementary wave that propagates in a spherical or circular manner.
  • a large number of loudspeakers that are arranged next to each other can be used to simulate any shape of an incoming wavefront.
  • the audio signals of each loudspeaker must be fed with a time delay and amplitude scaling in such a way that the radiated sound fields of the individual loudspeakers overlap correctly. If there are several sound sources, the contribution to each source becomes Speakers calculated separately and the resulting signals added. If the sources to be reproduced are in a room with reflecting walls, then reflections must also be reproduced as additional sources via the loudspeaker array. The effort involved in the calculation therefore depends heavily on the number of sound sources, the reflection properties of the recording room and the number of speakers.
  • the advantage of this technique lies in the fact that a natural spatial sound impression is possible over a large area of the playback room.
  • the direction and distance of sound sources are reproduced very precisely.
  • virtual sound sources can even be positioned between the real speaker array and the listener.
  • wave field synthesis works well for environments whose properties are known, irregularities do occur when the nature changes or when the wave field synthesis is carried out on the basis of an environment condition that does not match the actual nature of the environment.
  • An environmental condition can be described by the impulse response of the environment.
  • Wave field synthesis thus enables correct mapping of virtual sound sources over a large reproduction range. At the same time, it offers the sound engineer and sound engineer new technical and creative potential when creating complex soundscapes.
  • Wave field synthesis (WFS or sound field synthesis), as developed at the TU Delft in the late 1980s, represents a holographic approach to sound reproduction.
  • the Kirchhoff-Helmholtz integral serves as the basis for this. This says that any sound fields can be generated within a closed volume by means of a distribution of monopole and dipole sound sources (loudspeaker arrays) on the surface of this volume. Details can be found in MM Boone, ENG Verheijen, PF v.
  • a synthesis signal for each loudspeaker of the loudspeaker array is calculated from an audio signal which emits a virtual source at a virtual position, the synthesis signals being designed in terms of amplitude and phase in such a way that a wave resulting from the superimposition of the individual the loudspeaker output in the loudspeaker array results in the sound wave that corresponds to the wave that would come from the virtual source at the virtual position if this virtual source at the virtual position were a real source with a real position.
  • synthesis signals there are multiple virtual sources in different virtual locations.
  • the calculation of the synthesis signals is carried out for each virtual source at each virtual position, so that typically one virtual source results in synthesis signals for several loudspeakers. Seen from a loudspeaker, this loudspeaker thus receives several synthesis signals that go back to different virtual sources. An overlay of these sources, which is possible due to the linear superposition principle, results then the playback signal actually sent from the speaker.
  • the fully rendered and analog-to-digital converted playback signals for the individual loudspeakers could, for example, be transmitted from the wave field synthesis via two-wire lines.
  • Central unit can be transmitted to the individual speakers. This would have the advantage that it is almost guaranteed that all loudspeakers work synchronously, so that no further measures would be necessary for synchronization purposes.
  • the wave field synthesis central unit could only ever be manufactured for a special reproduction room or for reproduction with a fixed number of loudspeakers.
  • a separate wave field synthesis central unit can be built for each playback room, which is not acceptable due to the individual production in terms of price.
  • a maximally equipped wave field synthesis central unit could be set up, which is controllable with regard to the connectable loudspeakers, i.e. with regard to the number of analog signal outputs, but which includes internal computing processors which is designed for the maximum number of analog outputs, i.e. connectable loudspeakers.
  • Such a system would result in audio reproducing systems for smaller display rooms also having almost the same price as audio reproducing systems for very large display rooms, which should not be acceptable for operators of small display rooms.
  • the medium to small display rooms are of interest to providers of audio display systems, with the "smallest" display rooms, which represent, for example, domestic living rooms or smaller restaurants, also being mentioned here.
  • the object of the present invention is to provide an audio reproduction concept which has a higher market acceptance.
  • the present invention is based on the knowledge that audio playback systems which are to achieve market acceptance must be scalable.
  • scalability must not only take place in terms of the computing power provided, but must also be reflected in the price of the audio playback system impact.
  • this means that an audio playback system for a large playback space may cost more than an audio playback system for a small playback space.
  • an audio playback system for a small playback room must cost significantly less than an audio playback system for a large playback room.
  • the price differences were insignificant, since the price differences were only due to the number of individual loudspeakers, which, however, was offered at low cost due to the fact that a large number of loudspeakers were provided and due to novel integration concepts into the structure that included the reproduction space can be.
  • the audio playback system is divided into a central wave field synthesis module and into many individual loudspeaker modules that are decentrally connected to the central wave field synthesis module.
  • the central wave field synthesis module receives an audio signal with a plurality of audio tracks and on the one hand calculates the synthesis signals and on the other hand the channel information for the channels from the virtual positions to the real speaker positions.
  • the central wave field synthesis module is further configured to supply each speaker with one or more synthesis signals that are to be reproduced by the speaker in question, and channel information for the audio channels from the virtual positions of the virtual sources, from which the one or more synthesis signals originate, to the affected one Deliver speakers.
  • a considerable data rate transmission limitation can already be achieved here, since experience shows that it is very rare for every loudspeaker to receive synthesis signals whose Energy content is greater than a certain threshold.
  • the central wave field synthesis module according to the invention thus already has the option of supplying only the synthesis signals to a decentralized loudspeaker module and also only the channel information for the synthesis signals which are important for the individual loudspeakers.
  • the loudspeaker modules according to the invention are decentralized and directly coupled to the loudspeaker or preferably arranged in close proximity to the loudspeaker.
  • Each loudspeaker module comprises a receiver for receiving the one or 'more synthesis signals for the respective loudspeaker, as well as the synthesis signals associated with channel information.
  • each loudspeaker module comprises a rendering device for calculating a reproduction signal for the loudspeaker using the synthesis signals and the channel information for the supplied synthesis signals.
  • each loudspeaker module also comprises a signal processing device with possibly a digital amplifier, a further digital signal processing device and finally a digital-to-analog converter for generating an analog loudspeaker signal which is to be supplied to the loudspeaker concerned, on the basis of the reproduction signal.
  • a plurality of transmission links are provided for connecting the central wave field synthesis module and the decentralized loudspeaker modules, one transmission link each extending from the central wave field synthesis module to the individual loudspeaker.
  • the operation of the rendering is very computationally expensive, which, with regard to the necessary circuit hardware in the form of, for example, a DSP or a hard-wired circuit, contributes considerably to the costs, in particular when considering the multiplier which is provided for each individual loudspeaker.
  • the rendering device works using channel impulse responses as channel information and thus performs computationally intensive convolution, which can either be carried out directly in the time domain or is carried out in the frequency domain, which requires transformations in the frequency domain and transformations from the frequency domain, which are required together with the actual multiplication operation in the frequency domain lead to considerable effort.
  • a rendering unit does not only have to render a single synthesis signal, but always a large number of synthesis signals, which normally corresponds to the number of virtual sources.
  • the concept according to the invention means that operations which can be carried out in a decentralized manner are shifted out of the central wave field synthesis module into the decentralized loudspeaker modules in such a way that, in the best case, only the operations in the central wave field synthesis module which are equally important for all loudspeakers are carried out during all operations that affect only one loudspeaker, or several loudspeakers that are connected to a loudspeaker module, are also implemented decentrally in the loudspeaker module.
  • the costs for the central wave synthesis module can thus be considerably reduced, but at the expense of the loudspeaker modules, the price of which can no longer be neglected, due to the operation of the audio rendering which is mainly carried out in the loudspeaker modules.
  • the audio reproduction system according to the invention is now scalable both in terms of performance and in terms of price. This opens up the possibility of offering a central wave field synthesis module for a large number of display rooms at a reduced price, such that the costs for the overall system, which result from the costs for the central unit and the decentralized loudspeaker modules, now correspond strongly to the number of loudspeakers set up and thus the size of the playback room.
  • an operator of a large display room will still have to pay a certain price for a display system for his large display room.
  • an operator of a smaller playback room will be able to purchase an audio playback system at a significantly lower price, since the number of loudspeakers and thus the number of complex and costly loudspeaker modules is considerably reduced compared to the large playback room.
  • the audio playback system according to the invention thus makes it possible to offer audio playback systems for smaller playback rooms at considerably reduced prices compared to large playback rooms, so that market acceptance is hoped for due to the reduced price in the very competitive market of audio / video components.
  • the central wave field synthesis unit is designed to be able to process cinema films recorded in the conventional audio format for cinema films, conventional recording formats being, for example, the 5.1 surround format or 7.1. Format or 10.2 format.
  • conventional recording formats being, for example, the 5.1 surround format or 7.1. Format or 10.2 format.
  • a film includes six audio tracks, ie audio tracks for the "left rear", “right rear”, “front left”, “front right” and “front center” channels, as well as the bass channel (subwoofer channel ).
  • a playback of such a movie with respect to audio technology conventional in the audio playback system according to the invention can be achieved in that the Audio tracks can be placed as virtual sources in virtual positions, which can be selected according to the needs of the sound engineer or the operator of the playback room.
  • FIG. 1 shows a conceptual diagram of the audio reproduction system according to the invention
  • FIG. 2 shows a block diagram of the central wave field synthesis module according to the invention
  • FIG. 3 shows a block diagram of a decentralized loudspeaker module according to the invention
  • Fig. 4 is a block diagram of a preferred embodiment
  • FIG. 5 shows a schematic diagram of a compatible reproduction with a large sweet spot
  • FIG. 6 shows a schematic diagram for the formation of a plurality of synthesis signals for a loudspeaker, each of which is to be supplied with channel information in order to obtain the playback signal for the loudspeaker LSi; and
  • Fig. 7 shows a schematic diagram of a channel from a virtual source to a real loudspeaker, showing the quantities that can have an influence on the channel.
  • the audio playback system is basically divided into two parts, as shown in FIG. 1.
  • One part is the central wave field synthesis module 10.
  • the other part is composed of individual loudspeaker modules 12a, 12b, 12c, 12d, 12e, which are connected to actual physical loudspeakers 14a, 14b, 14c, 14d, 14e in the manner shown in FIG. 1 is shown.
  • the number of loudspeakers 14a-14e is in the range above 50 and typically even well above 100 in typical applications. If each speaker is assigned its own speaker module, the corresponding number of speaker modules is also required. Depending on the application, however, it is preferred to address a small group of loudspeakers next to one another from a loudspeaker module.
  • a loudspeaker module which is connected to four loudspeakers, for example, feeds the four loudspeakers with the same playback signal, or whether corresponding different synthesis signals are calculated for the four loudspeakers, so that such a loudspeaker module actually consists of there are several individual loudspeaker modules, but these are physically combined in one unit.
  • each transmission path 16a-leee there is a separate transmission path 16a-leee between the wave field synthesis module 10 and each individual loudspeaker module 12a-12e, each transmission path being coupled to the central wave field synthesis module and a separate loudspeaker module.
  • a serial transmission format that delivers a high data rate is preferred, such as a so-called Firewire transmission format or a USB data format. Data transfer rates of over 100 megabits per second are advantageous.
  • the data stream that is transmitted from the wave field synthesis module 10 to a loudspeaker module is accordingly formatted in accordance with the selected data format in the wave field synthesis module and with a
  • synchronization information which is provided in conventional serial data formats.
  • This synchronization information is extracted by the individual loudspeaker modules from the data stream and used to analyze the individual loudspeaker modules with regard to their reproduction, i.e. ultimately to the analog-digital conversion for obtaining the analog loudspeaker signal and the sampling (resampling) provided for this purpose. to synchronize.
  • the central wave field synthesis module operate as a master and that all loudspeaker modules operate as clients, with the individual data streams via the various transmission links 16a-16e all receiving the same synchronization information from the central module 10.
  • the central wave field synthesis module initially comprises an input device 20 which is basically designed to receive an audio signal at an input, the audio signal having a plurality of audio tracks, each audio track being assigned an audio source position.
  • the audio source position is an indication of the position of a loudspeaker with respect to a listener in the playback room in accordance with a standardized audio format, such as, for. B. 5.1 to achieve a compatible playback.
  • the audio signal can have a larger number of audio tracks, which are already available as signals suitable for wave field synthesis and represent audio sources or audio objects in a real recording position, which are reproduced with respect to the audio signal reproduction as virtual sources in the playback space using the wave field synthesis.
  • the input device 20 is also used as the main control unit, which advantageously has further functionalities. In particular, it has the functionality of a decoding module, as is usually used in cinemas. As an alternative or in addition, the input device 20 is also designed as a DVD decoder which supplies the separate audio channels or audio tracks. Alternatively, the playback device 20 is also designed as an MPEG-4 decoding module, which already provides audio tracks 21 and corresponding audio source information 22 intended for wave field synthesis.
  • the audio tracks 21 each relate to audio signals from audio objects in a recording setting, to the position of the audio objects in the recording setting, to properties of audio objects, in particular with regard to the size of the audio object or the density with regard to the acoustic properties of the audio object ,
  • the information about the recording room or the recording environment should serve to give the listener not only a visual but also an audio impression of the recording situation.
  • the visitor should also notice from the reproduced sound whether, for example, a recording scene of a movie is taking place outdoors or e.g. B. in a small space, such as a submarine. While a recording scenario in the open air delivers relatively "dry" audio signals because the recording environment shows hardly any or no reflections, this situation will be completely different in a submarine, for example.
  • the central wave field synthesis module further comprises a device 24 for determining channel information on the one hand and wave field synthesis signals on the other hand for the individual loudspeakers.
  • a device 25 for converting the audio source positions 22 into virtual positions for the wave field synthesis is also provided.
  • the device 24 is designed to determine audio channel information for each audio channel from a virtual position to a loudspeaker position, the virtual position from the
  • Audio source position associated with the audio track depends (means 25) so that for each channel from each virtual position to each speaker
  • Audio channel information is available. Furthermore, the
  • Device 24 is configured to use the
  • the central wave field synthesis module in FIG. 2 further comprises means 26 for supplying synthesis signals to one or more loudspeakers.
  • the device 26 is also designed to transmit channel information for the transmitted synthesis information from the central wave field synthesis module via the corresponding transmission links to the individual loudspeaker modules, so that audio rendering can take place there.
  • the device 24 also supplies channel information for each synthesis signal or interpolates from calculated channel information and the device 26 for Provides so that the same can initiate a transmission to the individual speaker modules.
  • the device 26 is preferably designed to filter out insignificant synthesis signals and thus neither to transmit the insignificant synthesis signals nor the associated channel information in order to save data transmission capacities. So often occurs the case that a virtual source leads to significant synthesis signals only for some speakers, while for all other speakers in the speaker array synthesis signals can also be calculated based on the theory of wave field synthesis. B. are relatively small in terms of their performance in a certain period of time and can therefore be neglected in terms of a reduced amount of data transfer.
  • the device 24 includes functionalities to be used to preprocess the audio signals.
  • the device 24 controls the individual loudspeaker modules in particular in such a way that it either directly or in conjunction with the device 26 introduces synchronization information into the data streams transmitted to the individual loudspeaker modules and thus achieves central synchronization of all loudspeaker modules with the central wave field synthesis module.
  • the central wave field synthesis module is designed to carry out all processing operations that are the same for all reproduction channels, while according to the inventive concept, the processing operations that are different for the individual loudspeakers or the individual reproduction channels are carried out decentrally.
  • the device 24 is also designed to simulate wave field synthesis information for stereo Signals, 5.1 signals, 7.2 signals, 10.2 signals, etc. with a view to compatible playback.
  • the standard positions of loudspeakers with respect to a playback space for the standardized audio format are used as audio source positions.
  • FIG. 5 shows a playback room 50, a speaker array 52 that extends around the playback room, and a plurality of virtual sources 53a-53e that, as can be seen in FIG. 5, are positioned at virtual positions outside of the Playroom 50 are located.
  • the device 24 is designed in connection with the device 25 from FIG. 1 in order to calculate virtual positions which can be controlled manually from the audio source information, that is to say the standard position information for such a 5.1 signal, for example.
  • the virtual positions e.g. B. to infinity
  • the speaker array 52 sonicates the playback room 50 with plane waves.
  • the so-called sweet spot i.e. the area in a reproduction room in which an optimal sound impression is obtained, is considerably enlarged compared to a common situation in which real 5.1 speakers are placed in the reproduction room.
  • the virtual sources can also be placed at finite virtual positions and modeled as point sources, this option having the advantage that the sound impression has a more pleasant effect on the cinema viewer / listener.
  • Flat waves have the property that the listener has the impression that he is sitting in a very large room, which leads in particular to an unpleasant sensation when, for example, a submarine scene is currently taking place on the screen.
  • conventional films with, for example, 5.1 audio tracks have no information about acoustic Features of the recording setting include. In such a case, it is therefore preferred to find a compromise between the plane waves, that is to say the virtual sources at an infinite position or the virtual sources at a finite position.
  • the audio playback system also provides the possibility of varying the virtual positions of the virtual loudspeakers 53a-53e depending on the film scene. For example, if a scene is taking place outdoors, the speakers can be positioned indefinitely. On the other hand, if a scene takes place in a small room, the loudspeakers can be positioned closer to the playback room 50.
  • input device 20 is configured to sample the audio tracks associated with the video signal by a certain time "delay" before the video signals, such that after processing in the wave field synthesis module in the individual loudspeaker modules, the sound belonging to a point in time is sampled simultaneously with the video signal belonging to a point in time.
  • the negative “delay” must at least be dimensioned in such a way that sound and image are emitted in the audio reproduction system according to the invention in a manner that is associated with one another. If the negative delay is dimensioned somewhat larger, the signals can already be calculated and, for example, can be output from the loudspeaker modules to the loudspeakers by means of a corresponding synchronization signal which ensures the synchronism of image and sound.
  • Information about the playback room can either be determined on the basis of the geometrical nature of the playback room, or can be measured in the playback room using the loudspeakers and special microphone arrays, with control and evaluation for this being possible via an adaptation module 28 for the playback room.
  • the acoustic properties of the display room differ significantly from those when there are no people in the display room.
  • the adaptation module 28 for the reproduction room further comprises a microphone array which can be used to measure the properties of the reproduction. Furthermore, the adaptation module 28 for the reproduction space comprises algorithms to find the position of speaker arrays in the reproduction space. In addition, preprocessing of measurement results is carried out here in order to carry out an optimal inversion of the room and loudspeaker properties, the adaptation module 28 preferably being controlled by the device 24 for this purpose.
  • the adaptation module 28 for the playback room is only required for the system structure. However, if continuous adaptation to a changed situation in the playback room is desired, the adaptation module 28 can also be used continuously during operation.
  • the additional WFS information that is to say the properties of, for example, the audio objects and the properties of the recording space, are extracted from the input audio signal and via a WFS information line 29 fed to the device 24 so that this information can be taken into account in the channel information calculation.
  • the central WFS module is also designed to carry out preprocessing of the WFS-prepared audio signals.
  • the device 24 and / or the device 26 is intended to achieve the synchronization between image and sound, for which, as has been explained, time codes are introduced into the preferably serial data streams for the individual loudspeaker modules.
  • the channel information calculation device 24 is also responsible for driving the adaptation module 28 in order to control the measurement of the acoustic properties of the reproduction space, if desired, either before playback or during playback.
  • the multiplexer / transmission stage 26 is designed to insert synchronization information, which is generated either by the device 24, by the control device 20 or in the device 26 itself, into the data streams to the loudspeaker modules, to which those for the individual speakers required synthesis signals and necessary channel information are supplied.
  • the device 24 for calculating the channel information and for calculating the synthesis signals must also be provided with the speaker locations in the special reproduction room in order to calculate the individual synthesis signals and the individual channel information for the individual speakers. This is symbolically represented in FIG. 2 by a line 30.
  • the loudspeaker module first comprises a receiver / decoder block 31 in order to receive the data stream from the selection device and to extract associated channel information 31b and synchronization information 31c from the same synthesis signals 31a.
  • the loudspeaker module shown in Fig. 3 further includes, as a central unit, an audio rendering device 32 for calculating a playback signal for the speaker using the one or more synthesis signals and using the channel information associated with the synthesis signals.
  • a loudspeaker module comprises a signal processing device 33 with a digital / analog converter for generating an analog loudspeaker signal which is fed to the loudspeaker LSi 34 concerned in order to generate a sound signal.
  • the signal processing device 33 and in particular the resampler, which cooperates with the digital / analog converter, is supplied via the synchronization information (31c) extracted from the data stream by the receiver 31 in order to be synchronous to the central wave field synthesis module and thus synchronous to all other loudspeaker modules 24 of Fig. 1 calculated on the To overlay loudspeakers overlaid with channel information and channel signals.
  • the loudspeaker module shown in FIG. 3 is thus characterized by the combination of a digital receiver, a further signal processing device and a digital-to-analog converter, wherein in particular a digital amplifier can also be provided in the signal processing device 33.
  • a digital amplifier can also be provided in the signal processing device 33.
  • the signal can also be amplified after the digital / analog conversion, although digital amplification is preferred due to the more precise possibility of synchronization. It is further preferred to couple the loudspeaker 34 to the signal processing device 33 via a short analog line.
  • the corresponding lines of all loudspeakers have the same length or have length differences which are within a predetermined tolerance limit, since the synchronization is preferably on digital side is performed so that with very different line lengths between the loudspeaker modules and the loudspeaker a desynchronization could occur, which could already lead to audible artifacts or to a loss of the sound impression that is to be created by the wave field synthesis.
  • channel impulse responses in the time domain or in the frequency domain are transmitted as channel information.
  • the audio rendering device 32 is designed to carry out a convolution of the individual synthesis signals with the channel information assigned to the synthesis signals.
  • This convolution can actually be implemented as convolution in the time domain, or can be implemented in the Frequency range can be performed by multiplying the analysis signal in the frequency range with the channel transfer function.
  • FIG. 4 shows a preferred embodiment of the audio rendering device 32 and comprises for each synthesis signal S j i (t) a time-frequency conversion block 34a, 34b, 34c, and for each branch a multiplier 35a, 35b, 35c for multiplying the transformed a synthesis signal with the transform of a channel impulse response H j i (f), a summer 36 and a final frequency-time conversion device 37, which are connected as shown in FIG. 4.
  • the arrangement shown in Fig. 4 is characterized in that it is reduced in terms of processing effort by the summation of the synthesis signals, which are already acted on by the corresponding channel transmission functions, takes place in the frequency domain, so that for each speaker module regardless of the number the synthesis signals only a single frequency-time converter is available.
  • the time-frequency transformation of the synthesis signals s- ⁇ can be carried out completely in parallel, or, if there is sufficient time, also serial / parallel or completely serial.
  • the audio rendering device 32 shown in FIG. 3 is also designed to receive special program information from the central wave field synthesis module shown in FIG. 2.
  • the multiplexer / transmitter stage 26 has a special output in order to supply the program information to the loudspeaker modules.
  • the program information can also be multiplexed into the data stream with synthesis signals and channel information, although this is not absolutely necessary.
  • channel information is described as channel impulse responses and transmitted to the individual loudspeaker modules, it is preferred not to transmit the entire impulse response in the sense of a data rate saving, but rather only samples of the impulse response that lie in a front area of the impulse response, the envelope of which is still an amount has a threshold.
  • impulse responses typically have large values at small points in time and gradually take on smaller values and finally have a so-called "reverberation tail", which is important for the sound impression, but whose samples are no longer particularly large, and In this case, it is preferred not to transmit the reverberation tail, whose envelope is below the threshold value, on the basis of its sample values, but only to transmit base values for the envelope
  • That are required by the audio rendering device 32 are then generated according to the invention in that the audio rendering device generates a random sequence of zeros and ones, the amplitude of which is weighted for the envelope with the transmitted base values it is preferred to transfer only a few base values and to interpolate between the base values, and then use the interpolated envelope to weight the random 0/1 sequence.
  • the random 0/1 sequence is preferably implemented by positive voltage values for a "1" and negative voltage values for a "0".
  • the information that the audio rendering device receives channel information that is actual samples up to a certain value and then is only support values for the envelope is transmitted via the program information input shown in FIG. 3 or is fixed agreed.
  • the wave field synthesis module further comprises a WFS mixing console, not shown in FIG.
  • the procedure on which the generation of synthesis signals is based is discussed below with reference to FIG. 6.
  • a system with three virtual sources at three virtual positions 60, 61, 62 and a speaker LSi 63 at a real speaker position, which is known to the central WFS module, is considered.
  • the virtual positions of the virtual sources 60, 61, 62 are known to the central wave field synthesis module either from the fact that they are supplied in a WFS-processed input signal or from the fact that they are derived by means of audio source positions by the means 25 for calculating the virtual positions.
  • the synthesis signals s 2 ⁇ , s 2 ⁇ and s 3 i are the signals which the loudspeaker 63 must emit and which go back to the respective virtual positions 60, 61, 62. From this it can be seen that, as has been stated, each loudspeaker will emit the overlay of several synthesis signals.
  • a channel ji is also defined between each virtual position and each loudspeaker can be described by an impulse response, a transfer function or any other channel information, as shown with reference to FIG. 7. All desired properties can be packaged in the channel description, in order then to apply the channel information for the corresponding channel assigned to a synthesis signal to the synthesis signals which are calculated by the wave field synthesis module. If the channel information is given in the form of an impulse response that describes the channel, the loading is a convolution. If the signals are in the frequency range, the application is a multiplication. Alternative channel information can also be used depending on the embodiment.
  • FIG. 7 shows which information can be used to influence a channel 70 from a virtual source 71 to a real loudspeaker 72.
  • the virtual position of the virtual source 71 is included in the channel information, for example the channel impulse response.
  • Properties of the virtual source are also included, such as. B. size, density, etc. B. a small triangle must be described and modeled differently than a large timpani.
  • the properties of the recording space are included in the channel transmission function.
  • Further influencing components are a system distortion of the entire audio reproduction system, which, for example, contains loudspeaker distortions or non-idealities of the loudspeakers.
  • the channel information also includes information about the playback space in order to compensate for the acoustic properties of the playback space. If, for example, the reproduction room is known to have a wall opposite a loudspeaker that is reflecting and whose reflection is to be suppressed, however, the corresponding loudspeaker is underneath Taking this information into account is controlled in such a way that it contains a signal which is 180 degrees out of phase with the reflected signal and has a corresponding amplitude, so that an extinguishing reflection occurs and the wall becomes acoustically transparent, ie no longer for a listener due to the reflections is identifiable.
  • the channel information can also be used to set a specific target reproduction acoustics.
  • the method according to the invention for reproducing an audio signal can be implemented in hardware or in software.
  • the implementation can take place on a digital storage medium, in particular a floppy disk or CD with electronically readable control signals, which can cooperate with a programmable computer system such that the method is carried out.
  • the invention thus also consists in a computer program product with program code stored on a machine-readable carrier for carrying out the method according to the invention when the computer program product runs on a computer.
  • the invention can thus be implemented as a computer program with a program code for carrying out the method if the computer program runs on a computer.

Abstract

An audio playback system is divided into a central wavefield synthesis module (10) and a multitude of decentrally arranged loudspeaker modules (12a-12e). Synthesis signals for the individual loudspeakers and corresponding items of channel information, which are assigned to the synthesis signals, are calculated in the central wavefield synthesis module. The synthesis signals for a loudspeaker together with associated items of channel information are then transmitted to corresponding loudspeaker modules via a transmission link (16a-16e). Each loudspeaker module receives the synthesis signals and associated items of channel information that are intended for the loudspeaker assigned to the loudspeaker module. A decentralized audio rendering and digital-to-analog conversion takes place inside the loudspeaker modules in order to decentrally generate the actual analog loudspeaker signals in spatial proximity to each loudspeaker. The division into a central wavefield synthesis module and a multitude of decentralized loudspeaker modules enables the production of audio playback systems that can be scaled with regard to price in order to offer different size systems, which can be scaled in terms of price, for, in particular, cinema playback spaces that vary greatly in size.

Description

Audiowiedergabesystem und Verf hren zum Wiedergeben eines Audiosignals Audio playback system and method for playing an audio signal
Beschreibungdescription
Die vorliegende Erfindung bezieht sich auf Audiowiedergabesysteme und insbesondere auf für die Praxis geeignete Audiowiedergabesysteme für Wiedergaberäume variabler Größe, wie beispielsweise Kinos, wobei die Audiowiedergabesysteme auf der Wellenfeldsynthese basieren.The present invention relates to audio playback systems and, more particularly, to practical audio playback systems for variable size playback rooms such as cinemas, the audio playback systems being based on wave field synthesis.
Es besteht ein steigender Bedarf an neuen Technologien und innovativen Produkten im Bereich der Unterhaltungselektronik. Dabei ist es eine wichtige Voraussetzung für den Erfolg neuer multimedialer Systeme, optimale Funktionalitäten bzw. Fähigkeiten anzubieten. Erreicht wird das durch den Einsatz digitaler Technologien und insbesondere der Computertechnik. Beispiele hierfür sind die Applikationen, die einen verbesserten realitätsnahen audiovisuellen Eindruck bieten. Bei bisherigen Audiosystemen liegt ein wesentlicher Schwachpunkt in der Qualität der räumlichen Schallwiedergabe von natürlichen, aber auch von virtuellen Umgebungen .There is an increasing need for new technologies and innovative products in the field of consumer electronics. It is an important prerequisite for the success of new multimedia systems to offer optimal functionalities and capabilities. This is achieved through the use of digital technologies and especially computer technology. Examples of this are the applications that offer an improved realistic audiovisual impression. With previous audio systems, a major weakness lies in the quality of the spatial sound reproduction of natural, but also of virtual environments.
Verfahren zur mehrkanaligen Lautsprecherwiedergabe von Audiosignalen sind seit vielen Jahren bekannt und standardisiert. Alle üblichen Techniken besitzen den Nachteil, daß sowohl der Aufstellungsort der Lautsprecher als auch die Position des Hörers dem Übertragungsformat bereits eingeprägt sind. Bei falscher Anordnung der Lautsprecher im Bezug auf den Hörer leidet die Audioqualität deutlich. Ein optimaler Klang ist nur in einem kleinen Bereich des Wiedergaberaums, dem so genannten Sweet Spot, möglich. Ein besserer natürlicher Raumeindruck sowie eine stärkere Einhüllung bei der Audiowiedergabe kann mit Hilfe einer neuen Technologie erreicht werden. Die Grundlagen dieser Technologie, die so genannte Wellenfeldsynthese (WFS; WFS = Wave-Field Synthesis), wurden an der TU Delft erforscht und erstmals in den späten 80er-Jahren vorgestellt (Berkhout, A.J.; de Vries, D. ; Vogel, P. : Acoustic control by Wave- field Synthesis. JASA 93, 1993).Methods for multi-channel loudspeaker reproduction of audio signals have been known and standardized for many years. All common techniques have the disadvantage that both the location of the speakers and the position of the listener are already imprinted on the transmission format. If the speakers are arranged incorrectly in relation to the listener, the audio quality suffers significantly. Optimal sound is only possible in a small area of the playback room, the so-called sweet spot. A better natural spatial impression as well as a stronger wrapping in the audio playback can be achieved with the help of a new technology. The basics of this technology, the so-called wave field synthesis (WFS = Wave-Field Synthesis), were researched at TU Delft and first introduced in the late 80s (Berkhout, AJ; de Vries, D.; Vogel, P. : Acoustic control by Wavefield Synthesis. JASA 93, 1993).
Infolge der enormen Anforderungen dieser Methode an Rechnerleistung und Übertragungsraten wurde die Wellenfeldsynthese bis jetzt nur selten in der Praxis angewendet. Erst die Fortschritte in den Bereichen der Mikroprozessortechnik und der Audiocodierung gestatten heute den Einsatz dieser Technologie in konkreten Anwendungen. Erste Produkte im professionellen Bereich werden nächstes Jahr erwartet. In wenigen Jahren sollen auch erste Wellenfeldsynthese-Anwendungen für den Konsumerbereich auf den Markt kommen.Due to the enormous demands of this method on computer performance and transmission rates, wave field synthesis has so far only rarely been used in practice. It is only the advances in the areas of microprocessor technology and audio coding that allow this technology to be used in concrete applications. The first products in the professional sector are expected next year. In a few years, the first wave field synthesis applications for the consumer sector will also be launched.
Die Grundidee von WFS basiert auf der Anwendung des Huygens' sehen Prinzips der Wellentheorie:The basic idea of WFS is based on the application of Huygens' principle of wave theory:
Jeder Punkt, der von einer Welle erfaßt wird, ist Ausgangspunkt einer Elementarwelle, die sich kugelförmig bzw. kreisförmig ausbreitet.Every point that is captured by a wave is the starting point of an elementary wave that propagates in a spherical or circular manner.
Angewandt auf die Akustik kann durch eine große Anzahl von Lautsprechern, die nebeneinander angeordnet sind (einem so genannten Lautsprecherarray) , jede beliebige Form einer einlaufenden Wellenfront nachgebildet werden. Im einfachsten Fall, einer einzelnen wiederzugebenden Punktquelle und einer linearen Anordnung der Lautsprecher, müssen die Audiosignale eines jeden Lautsprechers mit einer Zeitverzögerung und Amplitudenskalierung so gespeist werden, daß sich die abgestrahlten Klangfelder der einzelnen Lautsprecher richtig überlagern. Bei mehreren Schallquellen wird für jede Quelle der Beitrag zu jedem Lautsprecher getrennt berechnet und die resultierenden Signale addiert. Befinden sich die wiederzugebenden Quellen in einem Raum mit reflektierenden Wänden, dann müssen auch Reflexionen als zusätzliche Quellen über das Lautsprecherarray wiedergegeben werden. Der Aufwand bei der Berechnung hängt daher stark von der Anzahl der Schallquellen, den Reflexionseigenschaften des Aufnahmeraums und der Anzahl der Lautsprecher ab.Applied to acoustics, a large number of loudspeakers that are arranged next to each other (a so-called loudspeaker array) can be used to simulate any shape of an incoming wavefront. In the simplest case, a single point source to be reproduced and a linear arrangement of the loudspeakers, the audio signals of each loudspeaker must be fed with a time delay and amplitude scaling in such a way that the radiated sound fields of the individual loudspeakers overlap correctly. If there are several sound sources, the contribution to each source becomes Speakers calculated separately and the resulting signals added. If the sources to be reproduced are in a room with reflecting walls, then reflections must also be reproduced as additional sources via the loudspeaker array. The effort involved in the calculation therefore depends heavily on the number of sound sources, the reflection properties of the recording room and the number of speakers.
Der Vorteil dieser Technik liegt im Besonderen darin, daß ein natürlicher räumlicher Klangeindruck über einen großen Bereich des Wiedergaberaums möglich ist. Im Gegensatz zu den bekannten Techniken werden Richtung und Entfernung von Schallquellen sehr exakt wiedergegeben. In beschränktem Maße können virtuelle Schallquellen sogar zwischen dem realen Lautsprecherarray und dem Hörer positioniert werden.The advantage of this technique lies in the fact that a natural spatial sound impression is possible over a large area of the playback room. In contrast to the known techniques, the direction and distance of sound sources are reproduced very precisely. To a limited extent, virtual sound sources can even be positioned between the real speaker array and the listener.
Obgleich die Wellenfeldsynthese für Umgebungen gut funktioniert, deren Beschaffenheiten bekannt sind, treten doch Unregelmäßigkeiten auf, wenn sich die Beschaffenheit ändert bzw. wenn die Wellenfeldsynthese auf der Basis einer Umgebungsbeschaffenheit ausgeführt wird, die nicht mit der tatsächlichen Beschaffenheit der Umgebung übereinstimmt.Although wave field synthesis works well for environments whose properties are known, irregularities do occur when the nature changes or when the wave field synthesis is carried out on the basis of an environment condition that does not match the actual nature of the environment.
Eine Umgebungsbeschaffenheit kann durch die Impulsantwort der Umgebung beschrieben werden.An environmental condition can be described by the impulse response of the environment.
Dies wird anhand des nachfolgenden Beispiels näher dargelegt. Es wird davon ausgegangen, daß ein Lautsprecher ein Schallsignal gegen eine Wand aussendet, deren Reflexion unerwünscht ist. Für dieses einfache Beispiel würde die Raumkompensation unter Verwendung der Wellenfeldsynthese darin bestehen, daß zunächst die Reflexion dieser Wand bestimmt wird, um zu ermitteln, wann ein Schallsignal, das von der Wand reflektiert worden ist, wieder beim Lautsprecher ankommt, und welche Amplitude dieses reflektierte Schallsignal hat. Wenn die Reflexion von dieser Wand unerwünscht ist, so besteht mit der Wellenfeldsynthese die Möglichkeit, die Reflexion von dieser Wand zu eliminieren, indem dem Lautsprecher ein zu dem Reflexionssignal gegenphasiges Signal mit entsprechender Amplitude zusätzlich zum ursprünglichen Audiosignal eingeprägt wird, so daß die hinlaufende Kompensationswelle die Reflexionswelle auslöscht, derart, daß die Reflexion von dieser Wand in der Umgebung, die betrachtet wird, eliminiert ist. Dies kann dadurch geschehen, daß zunächst die Impulsantwort der Umgebung berechnet wird und auf der Basis der Impulsantwort dieser Umgebung die Beschaffenheit und Position der Wand bestimmt wird, wobei die Wand als Spiegelquelle interpretiert wird, also als Schallquelle, die einen einfallenden Schall reflektiert .This is explained in more detail using the example below. It is assumed that a loudspeaker emits a sound signal against a wall, the reflection of which is undesirable. For this simple example, space compensation using wave field synthesis would be to first determine the reflection of that wall to determine when a sound signal that was reflected from the wall would arrive back at the speaker and what amplitude that reflected sound signal would be Has. If the reflection from this wall is undesirable, there is the Wave field synthesis the possibility of eliminating the reflection from this wall by impressing the speaker with a signal in phase opposition to the reflection signal with a corresponding amplitude in addition to the original audio signal, so that the incoming compensation wave extinguishes the reflection wave, such that the reflection from this wall in the Environment that is considered is eliminated. This can be done by first calculating the impulse response of the environment and determining the nature and position of the wall on the basis of the impulse response of this environment, the wall being interpreted as a mirror source, that is to say as a sound source that reflects an incident sound.
Wird zunächst die Impulsantwort dieser Umgebung gemessen und wird dann das Kompensationssignal berechnet, das dem Audiosignal überlagert dem Lautsprecher eingeprägt werden muß, so wird eine Aufhebung der Reflexion von dieser Wand stattfinden, derart, daß ein Hörer in dieser Umgebung schallmäßig den Eindruck hat, daß diese Wand überhaupt nicht existiert.If the impulse response of this environment is measured first and then the compensation signal is calculated, which must be impressed on the loudspeaker superimposed on the audio signal, the reflection from this wall will be canceled in such a way that a listener in this environment has the sound impression that it is Wall does not exist at all.
Entscheidend für eine optimale Kompensation der reflektierten Welle ist jedoch, daß die Impulsantwort des Raums genau bestimmt wird, damit keine Über- oder Unterkompensation auftritt.However, it is crucial for an optimal compensation of the reflected wave that the impulse response of the room is exactly determined, so that no over- or under-compensation occurs.
Die Wellenfeldsynthese ermöglicht somit eine korrekte Abbildung von virtuellen Schallquellen über einen großen Wiedergabebereich. Gleichzeitig bietet sie dem Tonmeister und Toningenieur neues technisches und kreatives Potential bei der Erstellung auch komplexer Klanglandschaften. Die Wellenfeldsynthese (WFS oder auch Schallfeldsynthese) , wie sie Ende der 80-er Jahre an der TU Delft entwickelt wurde, stellt einen holographischen Ansatz der Schallwiedergabe dar. Als Grundlage hierfür dient das Kirchhoff-Helmholtz- Integral. Dieses besagt, daß beliebige Schallfelder innerhalb eines geschlossenen Volumens mittels einer Verteilung von Monopol- und Dipolschallquellen (Lautsprecherarrays) auf der Oberfläche dieses Volumens erzeugt werden können. Details hierzu finden sich in M.M. Boone, E.N.G. Verheijen, P.F. v. Toi, „Spatial Sound-Field Reproduction by Wave-Field Synthesis", Delft University of Technology Laboratory of Seismics and Acoustics, Journal of J. Audio Eng. Soc, Bd. 43, Nr. 12, Dezember 1995 und Diemer de Vries, „Sound Reinforcement by Wavefield Synthesis: Adaption of the Synthesis Operator to the Loudspeaker Directivity Characteristics", Delft University of Technology Laboratory of Seismics and Acoustics, Journal of J. Audio Eng. Soc, Bd. 44, Nr. 12, Dezember 1996.The wave field synthesis thus enables correct mapping of virtual sound sources over a large reproduction range. At the same time, it offers the sound engineer and sound engineer new technical and creative potential when creating complex soundscapes. Wave field synthesis (WFS or sound field synthesis), as developed at the TU Delft in the late 1980s, represents a holographic approach to sound reproduction. The Kirchhoff-Helmholtz integral serves as the basis for this. This says that any sound fields can be generated within a closed volume by means of a distribution of monopole and dipole sound sources (loudspeaker arrays) on the surface of this volume. Details can be found in MM Boone, ENG Verheijen, PF v. Toi, "Spatial Sound-Field Reproduction by Wave-Field Synthesis", Delft University of Technology Laboratory of Seismics and Acoustics, Journal of J. Audio Eng. Soc, Vol. 43, No. 12, December 1995 and Diemer de Vries, " Sound Reinforcement by Wavefield Synthesis: Adaption of the Synthesis Operator to the Loudspeaker Directivity Characteristics ", Delft University of Technology Laboratory of Seismics and Acoustics, Journal of J. Audio Eng. Soc, Vol. 44, No. 12, December 1996.
Bei der Wellenfeldsynthese wird aus einem Audiosignal, das eine virtuelle Quelle an einer virtuellen Position aussendet, eine Synthesesignal für jeden Lautsprecher des Lautsprecherarrays berechnet, wobei die Synthesesignale derart hinsichtlich Amplitude und Phase gestaltet sind, daß eine Welle, die sich aus der Überlagerung der einzelnen durch die im Lautsprecherarray vorhandenen Lautsprecher ausgegebenen Schallwelle ergibt, der Welle entspricht, die von der virtuellen Quelle an der virtuellen Position herrühren würde, wenn diese virtuelle Quelle an der virtuellen Position eine reale Quelle mit einer realen Position wäre.In wave field synthesis, a synthesis signal for each loudspeaker of the loudspeaker array is calculated from an audio signal which emits a virtual source at a virtual position, the synthesis signals being designed in terms of amplitude and phase in such a way that a wave resulting from the superimposition of the individual the loudspeaker output in the loudspeaker array results in the sound wave that corresponds to the wave that would come from the virtual source at the virtual position if this virtual source at the virtual position were a real source with a real position.
Typischerweise sind mehrere virtuelle Quellen an verschiedenen virtuellen Positionen vorhanden. Die Berechnung der Synthesesignale wird für jede virtuelle Quelle an jeder virtuellen Position durchgeführt, so daß typischerweise eine virtuelle Quelle in Synthesesignalen für mehrere Lautsprecher resultiert. Von einem Lautsprecher aus betrachtet empfängt dieser Lautsprecher somit mehrere Synthesesignale, die auf verschiedene virtuelle Quellen zurückgehen. Eine Überlagerung dieser Quellen, die aufgrund des linearen Superpositionsprinzips möglich ist, ergibt dann das von dem Lautsprecher tatsächlich ausgesendete Wiedergabesignal .Typically, there are multiple virtual sources in different virtual locations. The calculation of the synthesis signals is carried out for each virtual source at each virtual position, so that typically one virtual source results in synthesis signals for several loudspeakers. Seen from a loudspeaker, this loudspeaker thus receives several synthesis signals that go back to different virtual sources. An overlay of these sources, which is possible due to the linear superposition principle, results then the playback signal actually sent from the speaker.
Die Möglichkeiten der Wellenfeldsynthese können um so besser ausgeschöpft werden, je größer die Lautsprecherarrays sind, d. h. um so mehr einzelne Lautsprecher bereitgestellt werden. Damit steigt jedoch auch die Rechenleistung, die eine Wellenfeldsyntheseeinheit vollbringen muß, da typischerweise auch Kanalinformationen berücksichtigt werden müssen. Dies bedeutet im einzelnen, daß von jeder virtuellen Quelle zu jedem Lautsprecher prinzipiell ein eigener Übertragungskanal vorhanden ist, und daß prinzipiell der Fall vorhanden sein kann, daß jede virtuelle Quelle zu einem Synthesesignal für jeden Lautsprecher führt, bzw. daß jeder Lautsprecher eine Anzahl von Synthesesignalen erhält, die gleich der Anzahl von virtuellen Quellen ist.The larger the speaker arrays, the better the possibilities of wave field synthesis can be exploited. H. the more individual speakers are provided. However, this also increases the computing power that a wave field synthesis unit has to achieve, since channel information must also typically be taken into account. Specifically, this means that there is in principle a separate transmission channel from each virtual source to each loudspeaker, and that there can in principle be the case that each virtual source leads to a synthesis signal for each loudspeaker, or that each loudspeaker has a number of synthesis signals that is equal to the number of virtual sources.
Wenn insbesondere bei Kinoanwendungen die Möglichkeiten der Wellenfeldsynthese dahingehend ausgeschöpft werden sollen, daß die virtuellen Quellen auch beweglich sein können, so ist zu erkennen, daß aufgrund der Berechnung der Synthesesignale, der Berechnung der Kanalinformationen und der Erzeugung der Wiedergabesignale durch Kombination der Kanalinformationen und der Synthesesignale ganz erhebliche Rechenleistungen zu bewältigen sind.If, in particular in cinema applications, the possibilities of wave field synthesis are to be exploited to the extent that the virtual sources can also be mobile, it can be seen that due to the calculation of the synthesis signals, the calculation of the channel information and the generation of the playback signals by combining the channel information and the synthesis signals considerable computing power has to be mastered.
Darüber hinaus sei an dieser Stelle angemerkt, daß die Qualität der Audiowiedergabe mit der Anzahl der zur Verfügung gestellten Lautsprecher steigt. Dies bedeutet, daß die Audiowiedergabequalität um so besser und realistischer wird, um so mehr Lautsprecher in dem bzw. den Lautsprecherarrays vorhanden sind.In addition, it should be noted at this point that the quality of the audio reproduction increases with the number of speakers provided. This means that the audio reproduction quality becomes the better and more realistic the more speakers are present in the speaker array (s).
Im obigen Szenario könnten die fertig gerenderten und Analog-Digital-gewandelten Wiedergabesignale für die einzelnen Lautsprecher beispielsweise über Zweidrahtleitungen von der Wellenfeldsynthese- Zentraleinheit zu den einzelnen Lautsprechern übertragen werden. Dies hätte zwar den Vorteil, daß nahezu sichergestellt ist, daß alle Lautsprecher synchron arbeiten, so daß hier zu Synchronisationszwecken keine weiteren Maßnahmen erforderlich wären. Andererseits könnte die Wellenfeldsynthese-Zentraleinheit immer nur für einen speziellen Wiedergaberaum bzw. für eine Wiedergabe mit einer festgelegten Anzahl von Lautsprechern hergestellt werden. Dies bedeutet, daß für jeden Wiedergaberaum eine eigene Wellenfeldsynthese-Zentraleinheit gefertigt werden müßte, die ein erhebliches Maß an Rechenleistung zu vollbringen hat, da die Berechnung der Audiowiedergabesignale insbesondere im Hinblick auf viele Lautsprecher bzw. viele virtuelle Quellen zumindest teilweise parallel und in Echtzeit erfolgen muß.In the scenario above, the fully rendered and analog-to-digital converted playback signals for the individual loudspeakers could, for example, be transmitted from the wave field synthesis via two-wire lines. Central unit can be transmitted to the individual speakers. This would have the advantage that it is almost guaranteed that all loudspeakers work synchronously, so that no further measures would be necessary for synchronization purposes. On the other hand, the wave field synthesis central unit could only ever be manufactured for a special reproduction room or for reproduction with a fixed number of loudspeakers. This means that a separate wave field synthesis central unit would have to be manufactured for each playback room, which has to accomplish a considerable amount of computing power, since the calculation of the audio playback signals, in particular with regard to many speakers or many virtual sources, has to be carried out at least partially in parallel and in real time ,
Insbesondere im Hinblick auf Audiowiedergabesysteme, die für Kinos gedacht sind, existiert jedoch das Problem, daß die Wiedergaberäume in Kinos hinsichtlich ihrer Größe erheblich variieren. So haben Kinos manchmal einen sehr großen Kinosaal und/oder gleichzeitig mehrere kleine Kinosäle für Filme, die nicht einen derart hohen Zuschauerandrang erleben als Filme, die in großen Kinosälen gespielt werden sollen. So haben jedoch auch unterschiedliche Kinos unterschiedlich große Wiedergaberäume, die insbesondere dann, wenn an eine Audiowiedergabe nicht nur in Kinos sondern z. B. in Konzertsälen gedacht wird, möglicherweise bis zu einem Faktor 100 variieren können.Particularly with regard to audio playback systems intended for cinemas, however, there is a problem that the playback spaces in cinemas vary considerably in size. Cinemas sometimes have a very large cinema hall and / or at the same time several small cinema halls for films that are not as crowded as films that should be played in large cinema halls. However, different cinemas also have differently sized playback rooms, which are particularly important when audio is played not only in cinemas but e.g. B. is thought in concert halls, may possibly vary up to a factor of 100.
Um derart verschieden Audiowiedergaberäume mit einem Audiowiedergabesystem auf der Basis der Wellenfeldsynthese auszustatten, müßte z. B. für jeden Wiedergaberaum eine eigene Wellenfeldsynthese-Zentraleinheit gebaut werden, was aufgrund der Einzelproduktion im Hinblick auf den Preis nicht akzeptabel ist. Andererseits könnte eine maximal ausgestattete Wellenfeldsynthese-Zentraleinheit aufgebaut werden, die im Hinblick auf die anschließbaren Lautsprecher, also im Hinblick auf die Anzahl von Analogsignalausgängen steuerbar ist, jedoch intern Rechenprozessoren umfaßt, die für die maximale Anzahl von Analogausgängen, also verbindbaren Lautsprechern, ausgelegt ist.In order to equip such different audio playback rooms with an audio playback system based on wave field synthesis, e.g. B. a separate wave field synthesis central unit can be built for each playback room, which is not acceptable due to the individual production in terms of price. On the other hand, a maximally equipped wave field synthesis central unit could be set up, which is controllable with regard to the connectable loudspeakers, i.e. with regard to the number of analog signal outputs, but which includes internal computing processors which is designed for the maximum number of analog outputs, i.e. connectable loudspeakers.
Ein solches System würde dazu führen, daß auch Audiowiedergabesysteme für kleinere Wiedergaberäume nahezu denselben Preis mit sich bringen wie Audiowiedergabesysteme für sehr große Wiedergaberäume, was für die Betreiber von kleinen Wiedergaberäumen nicht akzeptabel sein dürfte. Insbesondere die mittleren bis kleinen Wiedergaberäume sind für Anbieter von Audiowiedergabesystemen interessant, wobei an dieser Stelle auch die „kleinsten" Wiedergaberäume erwähnt werden sollen, die z. B. häusliche Wohnzimmer oder kleinere Gaststätten darstellen.Such a system would result in audio reproducing systems for smaller display rooms also having almost the same price as audio reproducing systems for very large display rooms, which should not be acceptable for operators of small display rooms. In particular, the medium to small display rooms are of interest to providers of audio display systems, with the "smallest" display rooms, which represent, for example, domestic living rooms or smaller restaurants, also being mentioned here.
Die vorstehend beschriebenen Möglichkeiten sind daher dahingehend nachteilhaft, daß eine durchgreifende Marktakzeptanz nicht unmittelbar zu erwarten ist.The possibilities described above are therefore disadvantageous in that a thorough market acceptance is not to be expected immediately.
Die Aufgabe der vorliegenden Erfindung besteht darin, ein Audiowiedergabekonzept zu schaffen, das eine höhere Marktakzeptanz aufweist.The object of the present invention is to provide an audio reproduction concept which has a higher market acceptance.
Diese Aufgabe wird durch ein Audiowiedergabesystem nach Patentanspruch 1, ein Verfahren zum Wiedergeben eines Audiosignals nach Patentanspruch 19 oder ein Computer- Programm nach Patentanspruch 20 gelöst.This object is achieved by an audio playback system according to claim 1, a method for playing back an audio signal according to claim 19 or a computer program according to claim 20.
Der vorliegenden Erfindung liegt die Erkenntnis zugrunde, daß Audiowiedergabesysteme, die eine Marktakzeptanz erreichen sollen, skalierbar sein müssen. Die Skalierbarkeit darf jedoch nicht nur hinsichtlich der zur Verfügung gestellten Rechenleistung stattfinden, sondern muß sich auch in dem Preis des Audiowiedergabesystems auswirken. Dies bedeutet in anderen Worten, daß ein Audiowiedergabesystem für einen großen Wiedergaberaum mehr kosten darf als ein Audiowiedergabesystem für einen kleinen Wiedergaberaum. In anderen Worten ausgedrückt muß ein Audiowiedergabesystem für einen kleinen Wiedergaberaum erheblich weniger kosten als ein Audiowiedergabesystem für einen großen Wiedergaberaum.The present invention is based on the knowledge that audio playback systems which are to achieve market acceptance must be scalable. However, scalability must not only take place in terms of the computing power provided, but must also be reflected in the price of the audio playback system impact. In other words, this means that an audio playback system for a large playback space may cost more than an audio playback system for a small playback space. In other words, an audio playback system for a small playback room must cost significantly less than an audio playback system for a large playback room.
Bei vorstehend beschriebenen denkbaren Konzepten waren die Preisunterschiede unerheblich, da Preisunterschiede lediglich durch die Anzahl von einzelnen Lautsprechern bedingt waren, die jedoch aufgrund der Tatsache, daß sehr viele Lautsprecher bereitgestellt werden, und aufgrund neuartiger Integrationskonzepte in das Bauwerk, das den Wiedergaberaum beinhaltet, preisgünstig angeboten werden können .In the case of the conceivable concepts described above, the price differences were insignificant, since the price differences were only due to the number of individual loudspeakers, which, however, was offered at low cost due to the fact that a large number of loudspeakers were provided and due to novel integration concepts into the structure that included the reproduction space can be.
Erfindungsgemäß wird das Audiowiedergabesystem in ein zentrales Wellenfeldsynthesemodul und in viele dezentral mit dem zentralen Wellenfeldsynthesemodul verbundene einzelne Lautsprechermodule aufgeteilt. Das zentrale Wellenfeldsynthesemodul empfängt ein Audiosignal mit einer Mehrzahl von Audiospuren und berechnet einerseits die Synthesesignale und andererseits die Kanalinformationen für die Kanäle von den virtuellen Positionen zu den realen Lautsprecherpositionen .According to the invention, the audio playback system is divided into a central wave field synthesis module and into many individual loudspeaker modules that are decentrally connected to the central wave field synthesis module. The central wave field synthesis module receives an audio signal with a plurality of audio tracks and on the one hand calculates the synthesis signals and on the other hand the channel information for the channels from the virtual positions to the real speaker positions.
Das zentrale Wellenfeldsynthesemodul ist ferner ausgebildet, um jedem Lautsprecher eines oder mehrere Synthesesignale zuzuführen, die von dem betroffenen Lautsprecher wiederzugeben sind, sowie Kanalinformationen für die Audiokanäle von den virtuellen Positionen der virtuellen Quellen, von denen das eine oder die mehreren Synthesesignale stammen, zu dem betroffenen Lautsprecher zu liefern. Hierbei kann bereits eine erhebliche Datenratenübertragungseinschränkung erreicht werden, da die Erfahrung zeigt, daß sehr selten der Fall eintritt, daß jeder Lautsprecher Synthesesignale erhält, deren Energieinhalt größer als ein bestimmter Schwellwert ist. Das erfindungsgemäße zentrale Wellenfeldsynthesemodul hat somit bereits die Option, einem dezentralen Lautsprechermodul nur die Synthesesignale und ferner nur die Kanalinformationen für die Synthesesignale zuzuführen, die für den einzelnen Lautsprecher bedeutsam sind.The central wave field synthesis module is further configured to supply each speaker with one or more synthesis signals that are to be reproduced by the speaker in question, and channel information for the audio channels from the virtual positions of the virtual sources, from which the one or more synthesis signals originate, to the affected one Deliver speakers. A considerable data rate transmission limitation can already be achieved here, since experience shows that it is very rare for every loudspeaker to receive synthesis signals whose Energy content is greater than a certain threshold. The central wave field synthesis module according to the invention thus already has the option of supplying only the synthesis signals to a decentralized loudspeaker module and also only the channel information for the synthesis signals which are important for the individual loudspeakers.
Die erfindungsgemäßen Lautsprechermodule sind dezentral ausgeführt und mit dem Lautsprecher unmittelbar gekoppelt bzw. vorzugsweise in räumlicher Nähe zum Lautsprecher angeordnet. Jedes Lautsprechermodul umfaßt einen Empfänger zum Empfangen des einen oder der' mehreren Synthesesignale für den betroffenen Lautsprecher sowie der den Synthesesignalen zugeordneten Kanalinformationen. Ferner umfaßt jedes Lautsprechermodul eine Rendering-Einrichtung zum Berechnen eines Wiedergabesignals für den Lautsprecher unter Verwendung der Synthesesignale und der Kanalinformationen für die zugeführten Synthesesignale. Schließlich umfaßt jedes Lautsprechermodul noch eine Signalverarbeitungseinrichtung mit möglicherweise einem digitalen Verstärker, einer weiteren digitalen Signalverarbeitungseinrichtung sowie schließlich einem Digital-Analog-Wandler zum Erzeugen eines analogen Lautsprechersignals, das dem betroffenen Lautsprecher zuzuführen ist, aufgrund des Wiedergabesignals. Zur Verbindung des zentralen Wellenfeldsynthesemoduls und der dezentralen Lautsprechermodule ist eine Mehrzahl von Übertragungsstrecken vorgesehen, wobei sich eine Übertragungsstrecke jeweils von dem zentralen Wellenfeldsynthesemodul zu dem einzelnen Lautsprecher erstreckt.The loudspeaker modules according to the invention are decentralized and directly coupled to the loudspeaker or preferably arranged in close proximity to the loudspeaker. Each loudspeaker module comprises a receiver for receiving the one or 'more synthesis signals for the respective loudspeaker, as well as the synthesis signals associated with channel information. Furthermore, each loudspeaker module comprises a rendering device for calculating a reproduction signal for the loudspeaker using the synthesis signals and the channel information for the supplied synthesis signals. Finally, each loudspeaker module also comprises a signal processing device with possibly a digital amplifier, a further digital signal processing device and finally a digital-to-analog converter for generating an analog loudspeaker signal which is to be supplied to the loudspeaker concerned, on the basis of the reproduction signal. A plurality of transmission links are provided for connecting the central wave field synthesis module and the decentralized loudspeaker modules, one transmission link each extending from the central wave field synthesis module to the individual loudspeaker.
Sehr rechenaufwendig ist die Operation des Renderings, die im Hinblick auf die erforderliche Schaltungshardware in Form eines beispielsweise DSP oder einer fest verdrahteten Schaltung erheblich zu den Kosten beiträgt, insbesondere wenn an den Multiplikator gedacht wird, der für jeden einzelnen Lautsprecher vorgesehen ist. Vorzugsweise arbeitet die Rendering-Einrichtung unter Verwendung von Kanalimpulsantworten als Kanalinformationen und führt somit eine rechenzeitintensive Faltung durch, die entweder im Zeitbereich direkt ausführbar ist, oder im Frequenzbereich durchgeführt wird, wobei hierfür Transformationen in den Frequenzbereich und Transformationen aus dem Frequenzbereich erforderlich sind, die zusammen mit der eigentlichen Multiplikationsoperation im Frequenzbereich zu einem erheblichen Aufwand führen. Hierbei sei insbesondere daran gedacht, daß eine Rendering-Einheit nicht nur ein einziges Synthesesignal rendern muß, sondern immer eine große Anzahl von Synthese-Signalen, die normalerweise mit der Anzahl von virtuellen Quellen korrespondiert.The operation of the rendering is very computationally expensive, which, with regard to the necessary circuit hardware in the form of, for example, a DSP or a hard-wired circuit, contributes considerably to the costs, in particular when considering the multiplier which is provided for each individual loudspeaker. Preferably the rendering device works using channel impulse responses as channel information and thus performs computationally intensive convolution, which can either be carried out directly in the time domain or is carried out in the frequency domain, which requires transformations in the frequency domain and transformations from the frequency domain, which are required together with the actual multiplication operation in the frequency domain lead to considerable effort. In particular, it should be borne in mind that a rendering unit does not only have to render a single synthesis signal, but always a large number of synthesis signals, which normally corresponds to the number of virtual sources.
Das erfindungsgemäße Konzept führt dazu, daß dezentral durchführbare Operationen aus dem zentralen Wellenfeldsynthesemodul heraus in die dezentralen Lautsprechermodule verlagert werden, derart, daß im besten Fall nur noch die Operationen in dem zentralen Wellenfeldsynthesemodul ausgeführt werden, die für alle Lautsprecher gleichermaßen bedeutend sind, während sämtliche Operationen, die nur einen Lautsprecher betreffen, oder mehrere Lautsprecher, die an ein Lautsprechermodul angeschlossen sind, auch dezentral in dem LautSprechermodul ausgeführt werden.The concept according to the invention means that operations which can be carried out in a decentralized manner are shifted out of the central wave field synthesis module into the decentralized loudspeaker modules in such a way that, in the best case, only the operations in the central wave field synthesis module which are equally important for all loudspeakers are carried out during all operations that affect only one loudspeaker, or several loudspeakers that are connected to a loudspeaker module, are also implemented decentrally in the loudspeaker module.
Damit können die Kosten für das zentrale Wellensynthesemodul erheblich verringert werden, jedoch auf Kosten der Lautsprechermodule, deren Preis nunmehr nicht mehr vernachlässigbar ist, aufgrund der in den Lautsprechermodulen hauptsächlich durchgeführten Operation des Audio-Renderings .The costs for the central wave synthesis module can thus be considerably reduced, but at the expense of the loudspeaker modules, the price of which can no longer be neglected, due to the operation of the audio rendering which is mainly carried out in the loudspeaker modules.
Das erfindungsgemäße Audiowiedergabesystem ist nun jedoch sowohl hinsichtlich der Leistung als auch des Preises skalierbar. Es eröffnet sich die Möglichkeit, ein zentrales Wellenfeldsynthesemodul für eine große Anzahl von Wiedergaberäumen zu einem reduzierten Preis anzubieten, derart, daß die Kosten für das Gesamtsystem, die sich aus den Kosten für die Zentraleinheit und die dezentralen Lautsprechermodule ergeben, nunmehr stark mit der Anzahl von eingerichteten Lautsprechern und damit der Größe des Wiedergaberaums korrespondieren.However, the audio reproduction system according to the invention is now scalable both in terms of performance and in terms of price. This opens up the possibility of offering a central wave field synthesis module for a large number of display rooms at a reduced price, such that the costs for the overall system, which result from the costs for the central unit and the decentralized loudspeaker modules, now correspond strongly to the number of loudspeakers set up and thus the size of the playback room.
In anderen Worten ausgedrückt wird ein Betreiber eines großen Wiedergaberaums nach wie vor einen bestimmten Preis für ein Wiedergabesystem für seinen großen Wiedergaberaum entrichten müssen. Andererseits wird jedoch ein Betreiber eines kleineren Wiedergaberaums ein Audiowiedergabesystem zu einem erheblich geringeren Preis erstehen können, da die Anzahl von Lautsprechern und damit die Anzahl von aufwendigen und kostenintensiven Lautsprechermodulen im Vergleich zum großen Wiedergaberaum erheblich reduziert ist.In other words, an operator of a large display room will still have to pay a certain price for a display system for his large display room. On the other hand, however, an operator of a smaller playback room will be able to purchase an audio playback system at a significantly lower price, since the number of loudspeakers and thus the number of complex and costly loudspeaker modules is considerably reduced compared to the large playback room.
Das erfindungsgemäße Audiowiedergabesystem ermöglicht es somit, Audiowiedergabesysteme für kleinere Wiedergaberäume zu erheblich reduzierten Preisen im Vergleich zu großen Wiedergaberäumen anzubieten, so daß aufgrund des reduzierten Preises auf dem sehr wettbewerbsintensiven Markt der Audio/Video-Komponenten eine Marktakzeptanz erhofft wird.The audio playback system according to the invention thus makes it possible to offer audio playback systems for smaller playback rooms at considerably reduced prices compared to large playback rooms, so that market acceptance is hoped for due to the reduced price in the very competitive market of audio / video components.
Bei einem bevorzugten Ausführungsbeispiel der vorliegenden Erfindung ist die zentrale Wellenfeldsyntheseeinheit ausgebildet, um im herkömmlichen Audioformat für Kinofilme aufgezeichnete Kinofilme verarbeiten zu können, wobei übliche Aufnahmeformate beispielsweise das 5.1-Surround- Format oder 7.1. -Format oder 10.2-Format sind. Ein solcher Kinofilm umfaßt am Beispiel des 5.1-Formats sechs Audiospuren, also Audiospuren für den Kanal "links hinten", "rechts hinten", "vorne links", "vorne rechts" und "vorne mitte", sowie den Baßkanal (Subwoofer-Kanal) . Eine Wiedergabe eines solchen im Hinblick auf die Audiotechnik herkömmlichen Kinofilms in dem erfindungsgemäßen Audiowiedergabesystem kann dadurch erreicht werden, daß die Audiospuren als virtuelle Quellen an virtuellen Positionen plaziert werden, die je nach Belieben des Tonmeisters bzw. des Betreibers des Wiedergaberaums gewählt werden können. Die Möglichkeit der kompatiblen Wiedergabe für ein Audiowiedergabesystem mit skalierbarem Preis liefert daher einen Beitrag, daß sich Audiowiedergabesysteme auf der Basis der Wellenfeldsynthese bereits zu einem Zeitpunkt verbreiten, zu dem noch wenig Kino/Video-Filme mit vollständig Wellenfeldsynthese-geeigneten Audiospuren zusammen mit den entsprechend nötigen Metainformationen über das Aufnahme-Setting vorliegen.In a preferred exemplary embodiment of the present invention, the central wave field synthesis unit is designed to be able to process cinema films recorded in the conventional audio format for cinema films, conventional recording formats being, for example, the 5.1 surround format or 7.1. Format or 10.2 format. Using the 5.1 format as an example, such a film includes six audio tracks, ie audio tracks for the "left rear", "right rear", "front left", "front right" and "front center" channels, as well as the bass channel (subwoofer channel ). A playback of such a movie with respect to audio technology conventional in the audio playback system according to the invention can be achieved in that the Audio tracks can be placed as virtual sources in virtual positions, which can be selected according to the needs of the sound engineer or the operator of the playback room. The possibility of compatible playback for an audio playback system with a scalable price therefore makes a contribution to the fact that audio playback systems based on wave field synthesis are already spreading at a time when there are still few cinema / video films with audio tracks that are fully suitable for wave field synthesis, together with the correspondingly necessary ones Meta information about the recording setting is available.
Bevorzugte Ausführungsbeispiele der vorliegenden Erfindung werden nachfolgend Bezug nehmend auf die beiliegenden Zeichnungen detailliert erläutert. Es zeigen:Preferred embodiments of the present invention are explained in detail below with reference to the accompanying drawings. Show it:
Fig. 1 ein Konzeptionsdiagramm des erfindungsgemäßen Audiowiedergabesystems ;1 shows a conceptual diagram of the audio reproduction system according to the invention;
Fig. 2 ein Blockschaltbild des erfindungsgemäßen zentralen Wellenfeldsynthesemoduls ;2 shows a block diagram of the central wave field synthesis module according to the invention;
Fig. 3 ein Blockschaltbild eines erfindungsgemäßen dezentralen Lautsprechermoduls;3 shows a block diagram of a decentralized loudspeaker module according to the invention;
Fig. 4 ein Blockschaltbild einer bevorzugtenFig. 4 is a block diagram of a preferred
Ausgestaltung der Audio-Renderingeinheit in einem dezentralen Lautsprechermodul;Design of the audio rendering unit in a decentralized loudspeaker module;
Fig. 5 eine Prinzipdarstellung einer kompatiblen Wiedergabe mit großem Sweet Spot;5 shows a schematic diagram of a compatible reproduction with a large sweet spot;
Fig. 6 eine Prinzipskizze für das Zustandekommen von mehreren Synthesesignalen für einen Lautsprecher, die jeweils mit Kanalinformationen zu beaufschlagen sind, um das Wiedergabesignal für den Lautsprecher LSi zu erhalten; und Fig. 7 eine Prinzipdarstellung eines Kanals von einer virtuellen Quelle zu einem realen Lautsprecher mit Darstellung der Größen, die einen Einfluß auf den Kanal haben können.6 shows a schematic diagram for the formation of a plurality of synthesis signals for a loudspeaker, each of which is to be supplied with channel information in order to obtain the playback signal for the loudspeaker LSi; and Fig. 7 shows a schematic diagram of a channel from a virtual source to a real loudspeaker, showing the quantities that can have an influence on the channel.
Das erfindungsgemäße Audiowiedergabesystem gliedert sich, wie es in Fig. 1 dargestellt ist, grundsätzlich in zwei Teile. Ein Teil ist das zentrale Wellenfeldsynthesemodul 10. Der andere Teil setzt sich aus einzelnen Lautsprechermodulen 12a, 12b, 12c, 12d, 12e zusammen, die mit tatsächlichen physikalischen Lautsprechern 14a, 14b, 14c, 14d, 14e derart verbunden sind, wie es in Fig. 1 gezeigt ist. Es sei darauf hingewiesen, daß die Anzahl der Lautsprecher 14a-14e bei typischen Anwendungen im Bereich über 50 und typischerweise sogar deutlich über 100 liegt. Wird jedem Lautsprecher ein eigenes LautSprechermodul zugeordnet, so wird auch die entsprechende Anzahl von Lautsprecher-Modulen benötigt. Je nach Anwendung wird es jedoch bevorzugt, von einem Lautsprecher-Modul aus eine kleine Gruppe von nebeneinander liegenden Lautsprechern anzusprechen. In diesem Zusammenhang ist es beliebig, ob ein Lautsprecher-Modul, das mit vier Lautsprechern beispielsweise verbunden ist, die vier Lautsprecher mit demselben Wiedergabesignal speist, oder ob für die vier Lautsprecher entsprechende unterschiedliche Synthesesignale berechnet werden, so daß ein solches Lautsprecher-Modul eigentlich aus mehreren einzelnen Lautsprecher-Modulen besteht, die jedoch physikalisch in einer Einheit zusammengefaßt sind.The audio playback system according to the invention is basically divided into two parts, as shown in FIG. 1. One part is the central wave field synthesis module 10. The other part is composed of individual loudspeaker modules 12a, 12b, 12c, 12d, 12e, which are connected to actual physical loudspeakers 14a, 14b, 14c, 14d, 14e in the manner shown in FIG. 1 is shown. It should be noted that the number of loudspeakers 14a-14e is in the range above 50 and typically even well above 100 in typical applications. If each speaker is assigned its own speaker module, the corresponding number of speaker modules is also required. Depending on the application, however, it is preferred to address a small group of loudspeakers next to one another from a loudspeaker module. In this context, it is arbitrary whether a loudspeaker module, which is connected to four loudspeakers, for example, feeds the four loudspeakers with the same playback signal, or whether corresponding different synthesis signals are calculated for the four loudspeakers, so that such a loudspeaker module actually consists of there are several individual loudspeaker modules, but these are physically combined in one unit.
Zwischen dem Wellenfeldsynthesemodul 10 und jedem einzelnen Lautsprecher-Modul 12a-12e befindet sich eine eigene Übertragungsstrecke 16a-lβe, wobei jede Übertragungsstrecke mit dem zentralen Wellenfeldsynthesemodul und einem eigenen Lautsprecher-Modul gekoppelt ist.There is a separate transmission path 16a-leee between the wave field synthesis module 10 and each individual loudspeaker module 12a-12e, each transmission path being coupled to the central wave field synthesis module and a separate loudspeaker module.
Als Datenübertragungsmodus zum Übertragen von Daten von dem Wellenfeldsynthesemodul zu einem Lautsprecher-Modul wird ein serielles Übertragungsformat bevorzugt, das eine hohe Datenrate liefert, wie beispielsweise ein sogenanntes Firewire-Übertragungsformat oder ein USB-Datenformat. Datenübertragungsraten von über 100 Megabit pro Sekunde sind vorteilhaft.As a data transmission mode for transmitting data from the wave field synthesis module to a speaker module a serial transmission format that delivers a high data rate is preferred, such as a so-called Firewire transmission format or a USB data format. Data transfer rates of over 100 megabits per second are advantageous.
Der Datenstrom, der von dem Wellenfeldsynthesemodul 10 zu einem Lautsprecher-Modul übertragen wird, wird somit je nach gewähltem Datenformat in dem Wellenfeldsynthesemodul entsprechend formatiert und mit einerThe data stream that is transmitted from the wave field synthesis module 10 to a loudspeaker module is accordingly formatted in accordance with the selected data format in the wave field synthesis module and with a
Synchronisationsinformation versehen, die in üblichen seriellen Datenformaten vorgesehen ist. Diese Synchronisationsinformation wird von den einzelnen Lautsprecher-Modulen aus dem Datenstrom extrahiert und verwendet, um die einzelnen Lautsprecher-Module im Hinblick auf ihre Wiedergabe, also letztendlich auf die Analog- Digital-Wandlung zum Erhalten des analogen Lautsprechersignals und die dafür vorgesehene Abtastung (resampling) zu synchronisieren. Es wird bevorzugt, daß das zentrale Wellenfeldsynthesemodul als Master arbeitet, und daß alle Lautsprecher-Module als Clients arbeiten, wobei die einzelnen Datenströme über die verschiedenen Übertragungsstrecken 16a-16e alle dieselben Synchronisationsinformationen von dem Zentralmodul 10 erhalten. Dies stellt sicher, daß alle Lautsprecher-Module synchron, und zwar synchronisiert von dem Master 10, arbeiten, was für das vorliegende Audiowiedergabesystem wichtig ist, um keinen Verlust an Audioqualität zu erleiden, damit die vom Wellenfeldsynthesemodul berechneten Synthesesignale nicht zeitversetzt von den einzelnen Lautsprechern nach entsprechendem Audio-Rendering abgestrahlt werden. Vorteilhaft an diesem Konzept ist, daß die einzelnen Lautsprecher-Module nicht untereinander synchronisiert werden müssen. Sie sind automatisch untereinander synchronisiert, da sie alle synchron zum Master laufen. Eine Verbindung der einzelnen Lautsprecher- Module untereinander wird für die vorliegende Erfindung ungünstig sein, da das modulare Konzept der Skalierbarkeit mit den Lautsprecher-Modulen hinsichtlich der Wiedergaberaum-Größe ein einfaches Hinzufügen von Modulen erfordert, ohne daß entsprechende Verdrahtungen unter den Modulen erreicht werden müssen.Provide synchronization information, which is provided in conventional serial data formats. This synchronization information is extracted by the individual loudspeaker modules from the data stream and used to analyze the individual loudspeaker modules with regard to their reproduction, i.e. ultimately to the analog-digital conversion for obtaining the analog loudspeaker signal and the sampling (resampling) provided for this purpose. to synchronize. It is preferred that the central wave field synthesis module operate as a master and that all loudspeaker modules operate as clients, with the individual data streams via the various transmission links 16a-16e all receiving the same synchronization information from the central module 10. This ensures that all loudspeaker modules work synchronously, synchronized by the master 10, which is important for the present audio reproduction system in order not to suffer any loss of audio quality, so that the synthesis signals calculated by the wave field synthesis module are not delayed by the individual loudspeakers corresponding audio rendering are emitted. This concept has the advantage that the individual loudspeaker modules do not have to be synchronized with one another. They are automatically synchronized with each other since they all run synchronously with the master. A connection of the individual loudspeaker modules to each other will be unfavorable for the present invention because of the modular concept of scalability with the loudspeaker modules in terms of the reproduction space size, a simple addition of modules is required without corresponding wiring between the modules having to be achieved.
Fig. 2 zeigt ein Blockschaltbild eines zentralen Wellenfeldsynthesemoduls gemäß einem bevorzugten Ausführungsbeispiel der vorliegenden Erfindung. Das zentrale Wellenfeldsynthesemodul umfaßt zunächst eine Eingabe-Einrichtung 20, die grundsätzlich ausgebildet ist, um ein Audiosignal an einem Eingang zu empfangen, wobei das Audiosignal eine Mehrzahl von Audiospuren aufweist, wobei jeder Audiospur eine Audioquellenposition zugeordnet ist.2 shows a block diagram of a central wave field synthesis module according to a preferred exemplary embodiment of the present invention. The central wave field synthesis module initially comprises an input device 20 which is basically designed to receive an audio signal at an input, the audio signal having a plurality of audio tracks, each audio track being assigned an audio source position.
Je nach Anwendung ist die Audioquellenposition eine Angabe über die Position eines Lautsprechers bezüglich eines Zuhörers im Wiedergaberaum gemäß einem standardisierten Audio-Format, wie z. B. 5.1, um eine kompatible Wiedergabe zu erreichen. In diesem Fall hätte das Audiosignal 5+1=6 Audiospuren. Alternativ kann das Audiosignal eine größere Anzahl von Audiospuren haben, die bereits als Wellenfeldsynthese-geeignete Signale vorliegen und Audioquellen bzw. Audioobjekte in einer realen AufZeichnungsposition darstellen, die im Hinblick auf die Audiosignalwiedergabe als virtuelle Quellen im Wiedergaberaum unter Verwendung der Wellenfeldsynthese abgebildet werden.Depending on the application, the audio source position is an indication of the position of a loudspeaker with respect to a listener in the playback room in accordance with a standardized audio format, such as, for. B. 5.1 to achieve a compatible playback. In this case the audio signal would have 5 + 1 = 6 audio tracks. Alternatively, the audio signal can have a larger number of audio tracks, which are already available as signals suitable for wave field synthesis and represent audio sources or audio objects in a real recording position, which are reproduced with respect to the audio signal reproduction as virtual sources in the playback space using the wave field synthesis.
Die Eingabeeinrichtung 20 wird ferner bei einem bevorzugten Ausführungsbeispiel der vorliegenden Erfindung als Hauptsteuerungseinheit verwendet, die vorteilhafterweise weitere Funktionalitäten hat. Insbesondere hat sie die Funktionalität eines Decodiermoduls, wie es üblicherweise in Kinos verwendet wird. Alternativ oder zusätzlich ist die Eingabeeinrichtung 20 auch als DVD-Decoder ausgebildet, der die separaten Audiokanäle bzw. Audiospuren liefert. Alternativ ist die Wiedergabeeinrichtung 20 auch als MPEG- 4-Decodiermodul ausgebildet, das bereits für eine Wellenfeldsynthese gedachte Audiospuren 21 und entsprechende Audioquelleninformationen 22 liefert. Insbesondere beziehen sich die Audiospuren 21 jeweils auf Audiosignale von Audioobjekten in einem Aufnahme-Setting, auf die Position der Audioobjekte in dem Aufnahme-Setting, auf Eigenschaften von Audioobjekten, insbesondere hinsichtlich der Größe des Audioobjekts oder der Dichte im Hinblick auf die akustischen Eigenschaften des Audioobjekts.In a preferred exemplary embodiment of the present invention, the input device 20 is also used as the main control unit, which advantageously has further functionalities. In particular, it has the functionality of a decoding module, as is usually used in cinemas. As an alternative or in addition, the input device 20 is also designed as a DVD decoder which supplies the separate audio channels or audio tracks. Alternatively, the playback device 20 is also designed as an MPEG-4 decoding module, which already provides audio tracks 21 and corresponding audio source information 22 intended for wave field synthesis. In particular, the audio tracks 21 each relate to audio signals from audio objects in a recording setting, to the position of the audio objects in the recording setting, to properties of audio objects, in particular with regard to the size of the audio object or the density with regard to the acoustic properties of the audio object ,
Ferner wird es bevorzugt, auch Eigenschaften des Aufzeichnungsraums bzw. der AufZeichnungsumgebung zusätzlich zu den Audiospuren 21 zu übertragen, um diese bei der Wellenfeldsynthese gegebenenfalls berücksichtigen zu können. Die Informationen über den Aufzeichnungsraum bzw. die AufZeichnungsumgebung sollen dafür dienen, daß dem Zuhörer nicht nur ein visueller sondern auch ein audiomäßiger Eindruck der Aufnahmesituation gegeben wird. So soll der Besucher auch an dem wiedergegebenen Ton merken, ob sich eine Aufnahmeszene eines Kinofilms unter freiem Himmel beispielsweise abspielt oder z. B. in einem kleinen Raum, wie beispielsweise einem U-Boot. Während ein Aufnahmeszenario unter freiem Himmel relativ „trockene" Audiosignale liefert, da die Aufnahmeumgebung kaum bzw. keine Reflexionen zeigt, wird diese Situation in einem U- Boot beispielsweise komplett anders sein. Hier ist das Aufnahme-Setting durch einen sehr reflexionsreichen Raum bzw. eine sehr reflexionsreiche Audioumgebung dargestellt. In diesem Fall wird es bevorzugt, die Audiospuren möglichst trocken, also ohne die Raumakustik im Aufnahmeraum einzuspielen und die Raumakustik hinsichtlich ihrer Eigenschaften durch zusätzliche Metainformationen zu beschreiben, wie sie gemäß dem Standard MPEG 4 im standardisierten Datenstrom übertragen werden können. Das zentrale Wellenfeldsynthesemodul umfaßt ferner eine Einrichtung 24 zum Bestimmen von Kanalinformationen einerseits und Wellenfeld-Synthesesignalen andererseits für die einzelnen Lautsprecher. Hierzu ist ferner eine Einrichtung 25 zum Umsetzen der Audioquellenpositionen 22 in virtuelle Positionen für die Wellenfeldsynthese vorgesehen.Furthermore, it is preferred to also transmit properties of the recording space or the recording environment in addition to the audio tracks 21 in order to be able to take these into account in the wave field synthesis, if necessary. The information about the recording room or the recording environment should serve to give the listener not only a visual but also an audio impression of the recording situation. Thus, the visitor should also notice from the reproduced sound whether, for example, a recording scene of a movie is taking place outdoors or e.g. B. in a small space, such as a submarine. While a recording scenario in the open air delivers relatively "dry" audio signals because the recording environment shows hardly any or no reflections, this situation will be completely different in a submarine, for example. Here the recording setting is due to a very reflective room or a In this case, it is preferred to keep the audio tracks as dry as possible, that is, without playing in the room acoustics in the recording room and to describe the properties of the room acoustics in terms of their properties using additional meta information, such as can be transmitted in the standardized data stream in accordance with the MPEG 4 standard. The central wave field synthesis module further comprises a device 24 for determining channel information on the one hand and wave field synthesis signals on the other hand for the individual loudspeakers. For this purpose, a device 25 for converting the audio source positions 22 into virtual positions for the wave field synthesis is also provided.
Im einzelnen ist die Einrichtung 24 ausgebildet, um Audiokanalinformationen für jeden Audiokanal von einer virtuellen Position zu einer Lautsprecherposition zu bestimmen, wobei die virtuelle Position von derIn particular, the device 24 is designed to determine audio channel information for each audio channel from a virtual position to a loudspeaker position, the virtual position from the
Audioquellenposition, die der Audiospur zugeordnet ist, abhängt (Einrichtung 25) , so daß für jeden Kanal von jeder virtuellen Position zu jedem LautsprecherAudio source position associated with the audio track depends (means 25) so that for each channel from each virtual position to each speaker
Audiokanalinformationen vorliegen. Ferner ist dieAudio channel information is available. Furthermore, the
Einrichtung 24 ausgebildet, um unter Verwendung derDevice 24 is configured to use the
Prinzipien der Wellenfeldsynthese, wie sie eingangs dargestellt und bekannt sind, Synthesesignale von den virtuellen Positionen für die Lautsprecher zu berechnen.Principles of wave field synthesis, as they are presented and known at the beginning, to calculate synthesis signals from the virtual positions for the loudspeakers.
Das zentrale Wellenfeldsynthesemodul in Fig. 2 umfaßt ferner eine Einrichtung 26 zum Liefern von Synthesesignalen zu einem oder mehreren Lautsprechern. Die Einrichtung 26 ist ferner ausgebildet, um Kanalinformationen für die übertragenen Syntheseinformationen von dem zentralen Wellenfeldsynthesemodul über die entsprechenden Übertragungsstrecken zu den einzelnen Lautsprechermodulen zu übertragen, damit dort ein Audio-Rendering stattfinden kann. Je nach Ausführungsform wird es bevorzugt, zu jedem Synthesesignal, das sich auf einen Kanal von einer virtuellen Position zu einem konkreten Lautsprecher bezieht, weitere Kanalinformationen für diesen Kanal zu übertragen. Dies bedeutet, daß bei einem bevorzugten Ausführungsbeispiel der vorliegenden Erfindung die Einrichtung 24 für jedes Synthesesignal auch Kanalinformationen liefert bzw. aus berechneten Kanalinformationen interpoliert und der Einrichtung 26 zur Verfügung stellt, damit dieselbe eine Übertragung zu den einzelnen Lautsprechermodulen initiieren kann. Vorzugsweise ist die Einrichtung 26 ausgebildet, um nicht-signifikante Synthesesignale herauszufiltern und damit weder die nicht- signifikanten Synthesesignale noch die dazugehörigen Kanalinformationen zu übertragen, um Datenübertragungskapazitäten einzusparen. So tritt oft der Fall auf, daß eine virtuelle Quelle zu signifikanten Synthesesignalen nur für einige Lautsprecher führt, während für alle anderen Lautsprecher im Lautsprecherarray zwar aufgrund der Theorie der Wellenfeldsynthese ebenfalls Synthesesignale berechnet werden können, die jedoch z. B. hinsichtlich ihrer Leistung in einem bestimmten Zeitabschnitt relativ klein sind und daher im Hinblick auf eine reduzierte Datenübertragungsmenge vernachlässigt werden können.The central wave field synthesis module in FIG. 2 further comprises means 26 for supplying synthesis signals to one or more loudspeakers. The device 26 is also designed to transmit channel information for the transmitted synthesis information from the central wave field synthesis module via the corresponding transmission links to the individual loudspeaker modules, so that audio rendering can take place there. Depending on the embodiment, it is preferred to transmit further channel information for this channel for each synthesis signal which relates to a channel from a virtual position to a specific loudspeaker. This means that, in a preferred exemplary embodiment of the present invention, the device 24 also supplies channel information for each synthesis signal or interpolates from calculated channel information and the device 26 for Provides so that the same can initiate a transmission to the individual speaker modules. The device 26 is preferably designed to filter out insignificant synthesis signals and thus neither to transmit the insignificant synthesis signals nor the associated channel information in order to save data transmission capacities. So often occurs the case that a virtual source leads to significant synthesis signals only for some speakers, while for all other speakers in the speaker array synthesis signals can also be calculated based on the theory of wave field synthesis. B. are relatively small in terms of their performance in a certain period of time and can therefore be neglected in terms of a reduced amount of data transfer.
Im einzelnen umfaßt die Einrichtung 24 Funktionalitäten, um dazu verwendet zu werden, um die Audiosignale vorzuverarbeiten. Darüber hinaus steuert die Einrichtung 24 die einzelnen Lautsprechermodule insbesondere auch dahingehend, daß sie entweder unmittelbar oder in Verbindung mit der Einrichtung 26 Synchronisationsinformationen in die zu den einzelnen Lautsprechermodulen übertragenen Datenströme einbringt und somit eine Zentralsynchronisation aller Lautsprechermodule auf das zentrale Wellenfeldsynthesemodul erreicht.In particular, the device 24 includes functionalities to be used to preprocess the audio signals. In addition, the device 24 controls the individual loudspeaker modules in particular in such a way that it either directly or in conjunction with the device 26 introduces synchronization information into the data streams transmitted to the individual loudspeaker modules and thus achieves central synchronization of all loudspeaker modules with the central wave field synthesis module.
Insbesondere ist das zentrale Wellenfeldsynthesemodul ausgebildet, um sämtliche Verarbeitungsoperationen durchzuführen, die für alle Reproduktionskanäle gleich sind, während gemäß dem erfindungsgemäßen Konzept die Verarbeitungsoperationen dezentral durchgeführt werden, die für die einzelnen Lautsprecher bzw. die einzelnen Reproduktionskanäle unterschiedlich sind.In particular, the central wave field synthesis module is designed to carry out all processing operations that are the same for all reproduction channels, while according to the inventive concept, the processing operations that are different for the individual loudspeakers or the individual reproduction channels are carried out decentrally.
Die Einrichtung 24 ist ferner ausgebildet, um eine Simulation von Wellenfeldsynthese-Informationen für Stereo- Signale, 5.1-Signale, 7.2-Signale, 10.2-Signale etc. im Hinblick auf eine kompatible Wiedergabe durchzuführen. Hierzu werden als Audioquellenpositionen die Normpositionen von Lautsprechern bezüglich eines Wiedergaberaums für das genormte Audioformat verwendet .The device 24 is also designed to simulate wave field synthesis information for stereo Signals, 5.1 signals, 7.2 signals, 10.2 signals, etc. with a view to compatible playback. For this purpose, the standard positions of loudspeakers with respect to a playback space for the standardized audio format are used as audio source positions.
In dieser Hinsicht wird nachfolgend auf Fig. 5 Bezug genommen. Fig. 5 zeigt einen Wiedergaberaum 50, ein Lautsprecherarray 52, das sich um den Wiedergaberaum erstreckt, sowie eine Vielzahl von virtuellen Quellen 53a- 53e, die, wie es aus Fig. 5 ersichtlich ist, an virtuellen Positionen positioniert sind, die sich außerhalb des Wiedergaberaums 50 befinden. Die Einrichtung 24 ist in Verbindung mit der Einrichtung 25 von Fig. 1 ausgebildet, um aus den Audioquelleninformationen, also den Norm- Positionsangaben für ein solches beispielsweise 5.1-Signal, virtuelle Positionen zu berechnen, die manuell steuerbar sind. Je nach Ausführungsform wird es bevorzugt, die virtuellen Positionen z. B. ins Unendliche zu verschieben, so daß das Lautsprecherarray 52 den Wiedergaberaum 50 mit ebenen Wellen beschallt. Dies führt dazu, daß der sogenannte Sweet-Spot, also der Bereich in einem Wiedergaberaum, in dem ein optimaler Klangeindruck erhalten wird, im Vergleich zu einer üblichen Situation, bei der reale 5.1-Lautsprecher im Wiedergaberaum plaziert sind, erheblich vergrößert wird.In this regard, reference is made to FIG. 5 below. FIG. 5 shows a playback room 50, a speaker array 52 that extends around the playback room, and a plurality of virtual sources 53a-53e that, as can be seen in FIG. 5, are positioned at virtual positions outside of the Playroom 50 are located. The device 24 is designed in connection with the device 25 from FIG. 1 in order to calculate virtual positions which can be controlled manually from the audio source information, that is to say the standard position information for such a 5.1 signal, for example. Depending on the embodiment, it is preferred to use the virtual positions e.g. B. to infinity, so that the speaker array 52 sonicates the playback room 50 with plane waves. As a result, the so-called sweet spot, i.e. the area in a reproduction room in which an optimal sound impression is obtained, is considerably enlarged compared to a common situation in which real 5.1 speakers are placed in the reproduction room.
Alternativ können die virtuellen Quellen auch an finiten virtuellen Positionen plaziert werden und als Punktquellen modelliert werden, wobei diese Option den Vorteil hat, daß der Klangeindruck auf den Kino-Zuschauer/Zuhörer angenehmer wirkt. Ebene Wellen haben die Eigenschaft, daß der Zuhörer den Eindruck hat, daß er in einem sehr großen Raum sitzt, was insbesondere zu einer unangenehmen Sinneswahrnehmung führt, wenn auf der Leinwand beispielsweise gerade eine U- Boot-Szene stattfindet. In diesem Zusammenhang sei darauf hingewiesen, daß übliche Kinofilme mit beispielsweise 5.1- Audiospuren keine Informationen über akustische Eigenschaften des Aufnahme-Settings umfassen. Daher wird es in einem solchen Fall bevorzugt, einen Kompromiß zwischen den ebenen Wellen, also den virtuellen Quellen an unendlicher Position oder den virtuellen Quellen an einer finiten Position zu finden. In diesem Zusammenhang liefert das erfindungsgemäße Audiowiedergabesystem ferner die Möglichkeit, je nach Filmszene die virtuellen Positionen der virtuellen Lautsprecher 53a-53e zu variieren. Findet beispielsweise eine Szene unter freiem Himmel statt, so können die Lautsprecher ins Unendliche positioniert werden. Findet dagegen eine Szene in einem kleinen Raum statt, so können die Lautsprecher näher an den Wiedergaberaum 50 hin positioniert werden.Alternatively, the virtual sources can also be placed at finite virtual positions and modeled as point sources, this option having the advantage that the sound impression has a more pleasant effect on the cinema viewer / listener. Flat waves have the property that the listener has the impression that he is sitting in a very large room, which leads in particular to an unpleasant sensation when, for example, a submarine scene is currently taking place on the screen. In this context, it should be pointed out that conventional films with, for example, 5.1 audio tracks have no information about acoustic Features of the recording setting include. In such a case, it is therefore preferred to find a compromise between the plane waves, that is to say the virtual sources at an infinite position or the virtual sources at a finite position. In this context, the audio playback system according to the invention also provides the possibility of varying the virtual positions of the virtual loudspeakers 53a-53e depending on the film scene. For example, if a scene is taking place outdoors, the speakers can be positioned indefinitely. On the other hand, if a scene takes place in a small room, the loudspeakers can be positioned closer to the playback room 50.
Im Zusammenhang mit der kompatiblen Wiedergabe ist bei einem bevorzugten Ausführungsbeispiel der vorliegenden Erfindung die Eingabeeinrichtung 20 ausgebildet, um die Audiospuren, die dem Videosignal zugeordnet sind, um eine bestimmte Zeit-„Verzögerung" vor den Videosignalen abzutasten, derart, daß nach der Verarbeitung im Wellenfeldsynthesemodul in den einzelnen Lautsprechermodulen der zu einem Zeitpunkt gehörige Ton gleichzeitig mit dem zu einem Zeitpunkt gehörigen Videosignal abgetastet wird. Die negative „Verzögerung" muß zumindest derart bemessen sein, daß in dem erfindungsgemäßen Audiowiedergabesystem Ton und Bild zueinander gehörig ausgestrahlt werden. Wird die negative Verzögerung etwas größer bemessen, so können die Signale bereits fertig berechnet werden und beispielsweise durch ein entsprechendes Synchronisationssignal, das Synchronität von Bild und Ton sicherstellt, von den Lautsprechermodulen zu den Lautsprechern ausgegeben werden.In the context of compatible playback, in a preferred embodiment of the present invention, input device 20 is configured to sample the audio tracks associated with the video signal by a certain time "delay" before the video signals, such that after processing in the wave field synthesis module in the individual loudspeaker modules, the sound belonging to a point in time is sampled simultaneously with the video signal belonging to a point in time. The negative “delay” must at least be dimensioned in such a way that sound and image are emitted in the audio reproduction system according to the invention in a manner that is associated with one another. If the negative delay is dimensioned somewhat larger, the signals can already be calculated and, for example, can be output from the loudspeaker modules to the loudspeakers by means of a corresponding synchronization signal which ensures the synchronism of image and sound.
Sowohl im Fall der kompatibel Wiedergabe als auch im Fall, in dem das eingegebene Audiosignal bereits vorbereitete Wellenfeldsynthese-Informationen über Schallquellen im Aufnahme-Setting umfaßt, wird es bevorzugt, Informationen über den Wiedergaberaum über eine Leitung 27 der Kanalinformationsberechnungseinrichtung 24 zuzuführen, so daß die Synthesesignale unter Verwendung der Informationen über den Wiedergaberaum aufbereitet werden können, um z. B. eine Elimination der akustischen Eigenschaften des Wiedergaberaums zu erreichen.Both in the case of compatible playback and in the case where the input audio signal already includes prepared wave field synthesis information about sound sources in the recording setting, it is preferred to provide information about the playback space via a line 27 Channel information calculator 24 supply so that the synthesis signals can be prepared using the information about the playback space to z. B. to achieve an elimination of the acoustic properties of the playback room.
Informationen über den Wiedergaberaum können entweder aufgrund der geometrischen Beschaffenheit des Wiedergaberaums ermittelt werden, oder im Wiedergaberaum unter Verwendung der Lautsprecher und spezieller Mikrophonarrays gemessen werden, wobei eine Ansteuerung und Auswertung hierfür über ein Adaptionsmodul 28 für den Wiedergaberaum stattfinden kann. So wird es bei einem Ausführungsbeispiel der vorliegenden Erfindung bevorzugt, während der Wiedergabe die akustischen Eigenschaften des Wiedergaberaums zu bestimmen und entsprechend die Informationen über den Wiedergaberaum nachzustellen, so daß auch für ein beispielsweise gefülltes Kino eine optimale Unterdrückung der Kinoakustik stattfindet. An dieser Stelle sei darauf hingewiesen, daß sich insbesondere bei kleineren, vollgefüllten Wiedergaberäumen die akustischen Eigenschaften des Wiedergaberaums deutlich von denen unterscheiden, wenn keine Personen in dem Wiedergaberaum vorhanden sind.Information about the playback room can either be determined on the basis of the geometrical nature of the playback room, or can be measured in the playback room using the loudspeakers and special microphone arrays, with control and evaluation for this being possible via an adaptation module 28 for the playback room. Thus, in one embodiment of the present invention, it is preferred to determine the acoustic properties of the display room during playback and to re-adjust the information about the display room accordingly, so that optimum suppression of the cinema acoustics also takes place for a filled cinema, for example. At this point, it should be pointed out that, particularly in the case of smaller, fully-filled display rooms, the acoustic properties of the display room differ significantly from those when there are no people in the display room.
Das Adaptionsmodul 28 für den Wiedergaberaum umfaßt ferner ein Mikrophonarray, das zur Messung der Eigenschaften der Wiedergabe eingesetzt werden kann. Ferner umfaßt das Adaptionsmodul 28 für den Wiedergaberaum Algorithmen, um die Position von Lautsprecherarrays in dem Reproduktionsraum zu finden. Ferner wird hier eine Vorverarbeitung von Meßergebnissen durchgeführt, um eine optimale Invertierung der Raum- und der Lautsprechereigenschaften durchzuführen, wobei das Adaptionsmodul 28 hierzu vorzugsweise von der Einrichtung 24 angesteuert wird. Je nach Ausführungsform wird das Adaptionsmodul 28 für den Wiedergaberaum lediglich zum Systemaufbau benötigt. Wenn aber eine durchgehende Adaption an eine veränderte Situation im Wiedergaberaum gewünscht ist, kann das Adaptionsmodul 28 auch im Betrieb dauernd eingesetzt werden.The adaptation module 28 for the reproduction room further comprises a microphone array which can be used to measure the properties of the reproduction. Furthermore, the adaptation module 28 for the reproduction space comprises algorithms to find the position of speaker arrays in the reproduction space. In addition, preprocessing of measurement results is carried out here in order to carry out an optimal inversion of the room and loudspeaker properties, the adaptation module 28 preferably being controlled by the device 24 for this purpose. Depending on the embodiment, the adaptation module 28 for the playback room is only required for the system structure. However, if continuous adaptation to a changed situation in the playback room is desired, the adaptation module 28 can also be used continuously during operation.
Wenn die Kanalinformationsberechnungseinrichtung 24 zum Verarbeiten von in die Einrichtung 20 eingegebenen WFS- spezifischen Signalen eingesetzt wird, werden die zusätzlichen WFS-Informationen, also die Eigenschaften beispielsweise der Audioobjekte und die Eigenschaften des Aufnahmeraums, aus dem eingegebenen Audiosignal extrahiert und über eine WFS-Informationsleitung 29 der Einrichtung 24 zugeführt, damit diese Informationen bei der Kanalinformationsberechnung berücksichtigt werden können.If the channel information calculation device 24 is used to process WFS-specific signals input into the device 20, the additional WFS information, that is to say the properties of, for example, the audio objects and the properties of the recording space, are extracted from the input audio signal and via a WFS information line 29 fed to the device 24 so that this information can be taken into account in the channel information calculation.
In diesem Fall ist das zentrale WFS-Modul ferner ausgebildet, um eine Vorverarbeitung der WFS-aufbereiteten Audiosignale durchzuführen. Ferner ist die Einrichtung 24 und/oder die Einrichtung 26 dafür vorgesehen, die Synchronisation zwischen Bild und Ton zu erreichen, wobei hierfür, wie es ausgeführt worden ist, in den vorzugsweise seriellen Datenströmen zu den einzelnen Lautsprechermodulen Zeitcodes eingebracht werden. Schließlich ist die Kanalinformationsberechnungseinrichtung 24, wie es bereits ausgeführt worden ist, auch dafür verantwortlich, um das Adaptionsmodul 28 anzusteuern, um die Messung der akustischen Eigenschaften des Reproduktionsraums, wenn dies gewünscht ist, entweder vor der Wiedergabe oder während der Wiedergabe zu steuern.In this case, the central WFS module is also designed to carry out preprocessing of the WFS-prepared audio signals. Furthermore, the device 24 and / or the device 26 is intended to achieve the synchronization between image and sound, for which, as has been explained, time codes are introduced into the preferably serial data streams for the individual loudspeaker modules. Finally, as has already been stated, the channel information calculation device 24 is also responsible for driving the adaptation module 28 in order to control the measurement of the acoustic properties of the reproduction space, if desired, either before playback or during playback.
Die Multiplexer/Sendestufe 26 ist ausgebildet, um Synchronisationsinformationen, die entweder von der Einrichtung 24, von der Steuereinrichtung 20 oder in der Einrichtung 26 selbst erzeugt werden, in die Datenströme zu den Lautsprechermodulen einzufügen, denen ferner die für die einzelnen Lautsprecher erforderlichen Synthesesignale und nötige Kanalinformationen zugeführt werden.The multiplexer / transmission stage 26 is designed to insert synchronization information, which is generated either by the device 24, by the control device 20 or in the device 26 itself, into the data streams to the loudspeaker modules, to which those for the individual speakers required synthesis signals and necessary channel information are supplied.
An dieser Stelle sei ferner darauf hingewiesen, daß der Einrichtung 24 zur Berechnung der Kanalinformationen und zur Berechnung der Synthesesignale ferner die Lautsprecherorte in dem speziellen Wiedergaberaum zur Verfügung gestellt werden müssen, um die einzelnen Synthesesignale und die einzelnen Kanalinformationen für die einzelnen Lautsprecher zu berechnen. Dies ist in Fig. 2 durch eine Leitung 30 symbolisch dargestellt.At this point it should also be pointed out that the device 24 for calculating the channel information and for calculating the synthesis signals must also be provided with the speaker locations in the special reproduction room in order to calculate the individual synthesis signals and the individual channel information for the individual speakers. This is symbolically represented in FIG. 2 by a line 30.
Nachfolgend wird Bezug nehmend auf Fig. 3 auf ein bevorzugtes Ausführungsbeispiel für ein Lautsprechermodul eingegangen. Das LautSprechermodul umfaßt zunächst einen Empfänger/Decodiererblock 31, um den Datenstrom von der Selektionseinrichtung zu empfangen, und aus demselben Synthesesignale 31a, zugeordnete Kanalinformationen 31b sowie Synchronisationsinformationen 31c zu extrahieren. Das LautSprechermodul, das in Fig. 3 dargestellt ist, umfaßt ferner als zentrale Einheit eine Audio-Rendering- Einrichtung 32 zum Berechnen eines Wiedergabesignals für den Lautsprecher unter Verwendung der einen oder der mehreren Synthesesignale und unter Verwendung der Kanalinformationen, die den Synthesesignalen zugeordnet sind. Schließlich umfaßt ein Lautsprechermodul eine Signalverarbeitungseinrichtung 33 mit einem Digital/Analog- Wandler zum Erzeugen eines analogen Lautsprecher-Signals, das dem betroffenen Lautsprecher LSi 34 zugeführt wird, um ein Schallsignal zu erzeugen. Die Signalverarbeitungseinrichtung 33 und insbesondere der Resampler, der mit dem Digital/Analog-Wandler zusammenarbeitet, wird über die vom Empfänger 31 aus dem Datenstrom extrahierten Synchronisationsinformationen (31c) versorgt, um synchron zum zentralen Wellenfeldsynthesemodul und damit synchron zu allen anderen Lautsprechermodulen die von der Einrichtung 24 von Fig. 1 berechneten an den Lautsprechern überlagerten und mit Kanalinformationen beaufschlagten Synthesesignale zeitrichtig abzustrahlen.A preferred exemplary embodiment of a loudspeaker module is discussed below with reference to FIG. 3. The loudspeaker module first comprises a receiver / decoder block 31 in order to receive the data stream from the selection device and to extract associated channel information 31b and synchronization information 31c from the same synthesis signals 31a. The loudspeaker module shown in Fig. 3 further includes, as a central unit, an audio rendering device 32 for calculating a playback signal for the speaker using the one or more synthesis signals and using the channel information associated with the synthesis signals. Finally, a loudspeaker module comprises a signal processing device 33 with a digital / analog converter for generating an analog loudspeaker signal which is fed to the loudspeaker LSi 34 concerned in order to generate a sound signal. The signal processing device 33 and in particular the resampler, which cooperates with the digital / analog converter, is supplied via the synchronization information (31c) extracted from the data stream by the receiver 31 in order to be synchronous to the central wave field synthesis module and thus synchronous to all other loudspeaker modules 24 of Fig. 1 calculated on the To overlay loudspeakers overlaid with channel information and channel signals.
Das in Fig. 3 gezeigte Lautsprechermodul zeichnet sich somit durch die Kombination eines digitalen Empfängers, einer weiteren Signalverarbeitungseinrichtung und eines Digital-Analog-Wandlers aus, wobei in der Signalverarbeitungseinrichtung 33 insbesondere auch ein digitaler Verstärker vorgesehen sein kann. Alternativ kann das Signal jedoch auch nach der Digital/Analog-Wandlung verstärkt werden, obgleich die digitale Verstärkung aufgrund der genaueren Möglichkeit der Synchronisation bevorzugt wird. Ferner wird es bevorzugt, den Lautsprecher 34 über eine kurze Analogleitung mit der Signalverarbeitungseinrichtung 33 zu koppeln. Ist es jedoch nicht möglich, daß die Leitung von der Signalverarbeitungseinrichtung 33 zum Lautsprecher 34 kurz ist, so wird es bevorzugt, daß die entsprechenden Leitungen aller Lautsprecher dieselbe Länge haben bzw. Längenunterschiede haben, die in einer vorbestimmten Toleranzgrenze liegen, da die Synchronisation vorzugsweise auf digitaler Seite durchgeführt wird, so daß bei stark unterschiedlichen Leitungslängen zwischen den Lautsprechermodulen und dem Lautsprecher eine Desynchronisation auftreten könnte, die bereits zu hörbaren Artefakten bzw. zu einem Verlust des Klangeindrucks, der durch die Wellenfeldsynthese geschaffen werden soll, führen könnten.The loudspeaker module shown in FIG. 3 is thus characterized by the combination of a digital receiver, a further signal processing device and a digital-to-analog converter, wherein in particular a digital amplifier can also be provided in the signal processing device 33. Alternatively, however, the signal can also be amplified after the digital / analog conversion, although digital amplification is preferred due to the more precise possibility of synchronization. It is further preferred to couple the loudspeaker 34 to the signal processing device 33 via a short analog line. However, if it is not possible for the line from the signal processing device 33 to the loudspeaker 34 to be short, it is preferred that the corresponding lines of all loudspeakers have the same length or have length differences which are within a predetermined tolerance limit, since the synchronization is preferably on digital side is performed so that with very different line lengths between the loudspeaker modules and the loudspeaker a desynchronization could occur, which could already lead to audible artifacts or to a loss of the sound impression that is to be created by the wave field synthesis.
Bei einem bevorzugten Ausführungsbeispiel der vorliegenden Erfindung werden als Kanalinformationen Kanalimpulsantworten im Zeitbereich oder im Frequenzbereich übertragen. In diesem Fall ist die Audio- Renderingeinrichtung 32 ausgeführt, um eine Faltung der einzelnen Synthesesignale mit den den Synthesesignalen zugeordneten Kanalinformationen durchzuführen. Diese Faltung kann tatsächlich im Zeitbereich als Faltung implementiert werden, oder kann je nach Bedarf im Frequenzbereich durch Multiplikation des Analysesignals im Frequenzbereich mit der Kanalübertragungsfunktion durchgeführt werden. Eine im Hinblick auf den Verarbeitungsaufwand optimierte Ausgestaltung ist in Fig. 4 dargestellt. Fig. 4 zeigt eine bevorzugte Ausführungsform der Audio-Renderingeinrichtung 32 und umfaßt für jedes Synthesesignals Sji(t) einen Zeit-Frequenz-Umsetzungsblock 34a, 34b, 34c, sowie für jeden Zweig einen Multiplizierer 35a, 35b, 35c zum Multiplizieren der Transformierten eines Synthesesignals mit der Transformierten einer Kanalimpulsantwort Hji(f), einen Summierer 36 sowie eine abschließende Frequenz-Zeit-Umsetzungseinrichtung 37, die derart verschaltet sind, wie es in Fig. 4 gezeigt ist. Die in Fig. 4 gezeigte Anordnung zeichnet sich dadurch aus, daß sie im Hinblick auf den Verarbeitungsaufwand reduziert ist, indem die Summation der Synthesesignale, die bereits mit den entsprechenden Kanalübertragungsfunktionen beaufschlagt sind, im Frequenzbereich stattfindet, so daß für jedes Lautsprechermodul unabhängig von der Anzahl der Synthesesignale nur eine einzige Frequenz-Zeit- Umsetzungseinrichtung vorhanden ist. Je nach Ausführungsform kann die Zeit-Frequenz-Transformation der Synthesesignale s-μ vollständig parallel ausgeführt werden, oder, wenn ausreichend Zeit vorhanden ist, auch seriell/parallel oder komplett seriell.In a preferred embodiment of the present invention, channel impulse responses in the time domain or in the frequency domain are transmitted as channel information. In this case, the audio rendering device 32 is designed to carry out a convolution of the individual synthesis signals with the channel information assigned to the synthesis signals. This convolution can actually be implemented as convolution in the time domain, or can be implemented in the Frequency range can be performed by multiplying the analysis signal in the frequency range with the channel transfer function. A configuration which is optimized with regard to the processing outlay is shown in FIG. 4. Fig. 4 shows a preferred embodiment of the audio rendering device 32 and comprises for each synthesis signal S j i (t) a time-frequency conversion block 34a, 34b, 34c, and for each branch a multiplier 35a, 35b, 35c for multiplying the transformed a synthesis signal with the transform of a channel impulse response H j i (f), a summer 36 and a final frequency-time conversion device 37, which are connected as shown in FIG. 4. The arrangement shown in Fig. 4 is characterized in that it is reduced in terms of processing effort by the summation of the synthesis signals, which are already acted on by the corresponding channel transmission functions, takes place in the frequency domain, so that for each speaker module regardless of the number the synthesis signals only a single frequency-time converter is available. Depending on the embodiment, the time-frequency transformation of the synthesis signals s-μ can be carried out completely in parallel, or, if there is sufficient time, also serial / parallel or completely serial.
Wie es ausgeführt worden ist, zeichnet sich die in Fig. 4 gezeigte bevorzugte Audio-Rendering-Einrichtung 32 dadurch aus, daß sie unabhängig von der Anzahl von Synthesesignalen, die einem Lautsprechermodul zugeführt werden, lediglich eine einzige Frequenz-Zeit- Umsetzungseinrichtung 37 aufweist, die vorzugsweise als inverse FFT implementiert ist, wobei in diesem Fall die Einrichtungen 34a, 34b, 34c als FFT (FFT = schnelle Fourier-Transformation) implementiert sind.As has been explained, the preferred audio rendering device 32 shown in FIG. 4 is characterized in that, regardless of the number of synthesis signals that are fed to a loudspeaker module, it has only a single frequency-time conversion device 37, which is preferably implemented as an inverse FFT, in which case the devices 34a, 34b, 34c are implemented as FFT (FFT = fast Fourier transform).
Die in Fig. 3 gezeigte Audio-Rendering-Einrichtung 32 ist ferner ausgebildet, um spezielle Programminformationen von dem zentralen Wellenfeldsynthesemodul, das in Fig. 2 gezeigt ist, zu erhalten. Hierzu umfaßt die Multiplexer/Sendestufe 26 einen speziellen Ausgang, um die Programminformationen zu den Lautsprecher-Modulen zu liefern. Je nach Anwendungsfall können die Programminformationen auch in den Datenstrom mit Synthesesignalen und Kanalinformationen gemultiplext sein, obgleich dies nicht zwingend erforderlich ist.The audio rendering device 32 shown in FIG. 3 is also designed to receive special program information from the central wave field synthesis module shown in FIG. 2. For this purpose, the multiplexer / transmitter stage 26 has a special output in order to supply the program information to the loudspeaker modules. Depending on the application, the program information can also be multiplexed into the data stream with synthesis signals and channel information, although this is not absolutely necessary.
Nachfolgend wird ein Beispiel für die Übertragung von Programminformationen zu einem Lautsprecher-Modul dargestellt. Werden die Kanalinformationen als Kanalimpulsantworten beschrieben und zu den einzelnen LautSprechermodulen übertragen, so wird es bevorzugt, im Sinne einer Datenrateneinsparung, nicht die gesamte Impulsantwort zu übertragen, sondern lediglich Abtastwerte der Impulsantwort, die in einem vorderen Bereich der Impulsantwort liegen, dessen Einhüllende noch einen Betrag über einen Schwellenwert hat. An dieser Stelle sei darauf hingewiesen, daß Impulsantworten typischerweise zu kleinen Zeitpunkten große Werte haben und nach und nach kleinere Werte annehmen und schließlich einen sogenannten „Nachhallschwanz" haben, der für den Klangeindruck zwar wichtig ist, dessen Abtastwerte jedoch nicht mehr besonders groß sind, und dessen spezielle Phasenverhältnisse vom Ohr nicht mehr stark wahrgenommen werden. In diesem Fall wird es bevorzugt, den Nachhallschwanz, dessen Einhüllende unterhalb des Schwellenwerts liegt, nicht mehr anhand seiner Abtastwerte zu übertragen, sondern lediglich noch Stützwerte für die Einhüllende zu übertragen. Abtastwerte für den Nachhallschwanz, die von der Audio-Rendering- Einrichtung 32 benötigt werden, werden dann erfindungsgemäß dadurch erzeugt, daß die Audio-Rendering-Einrichtung eine zufällige Folge von Nullen und Einsen erzeugt, deren Amplitude mit den übertragenen Stützwerten für die Einhüllende gewichtet werden. Zur weiteren Datenreduktion wird es bevorzugt, nur einige wenige Stützwerte zu übertragen und zwischen den Stützwerten zu interpolieren, und die interpolierte Einhüllende dann zur Gewichtung der Zufalls-0/1-Folge zu verwenden.An example of the transmission of program information to a loudspeaker module is shown below. If the channel information is described as channel impulse responses and transmitted to the individual loudspeaker modules, it is preferred not to transmit the entire impulse response in the sense of a data rate saving, but rather only samples of the impulse response that lie in a front area of the impulse response, the envelope of which is still an amount has a threshold. At this point it should be pointed out that impulse responses typically have large values at small points in time and gradually take on smaller values and finally have a so-called "reverberation tail", which is important for the sound impression, but whose samples are no longer particularly large, and In this case, it is preferred not to transmit the reverberation tail, whose envelope is below the threshold value, on the basis of its sample values, but only to transmit base values for the envelope That are required by the audio rendering device 32 are then generated according to the invention in that the audio rendering device generates a random sequence of zeros and ones, the amplitude of which is weighted for the envelope with the transmitted base values it is preferred to transfer only a few base values and to interpolate between the base values, and then use the interpolated envelope to weight the random 0/1 sequence.
Es sei darauf hingewiesen, daß die Zufalls-0/1-Folge vorzugsweise durch positive Spannungswerte für eine „1" und negative Spannungswerte für eine „0" realisiert wird. Die Information darüber, daß die Audio-Rendering-Einrichtung Kanalinformationen empfängt, die bis zu einem bestimmten Wert tatsächliche Samples sind und dann lediglich Stützwerte für die Einhüllende sind, wird über den Programminformationeneingang, der in Fig. 3 gezeigt ist, übertragen, oder ist fest vereinbart.It should be noted that the random 0/1 sequence is preferably implemented by positive voltage values for a "1" and negative voltage values for a "0". The information that the audio rendering device receives channel information that is actual samples up to a certain value and then is only support values for the envelope is transmitted via the program information input shown in FIG. 3 or is fixed agreed.
Das erfindungsgemäße Wellenfeldsynthesemodul umfaßt ferner eine in Fig. 2 nicht gezeigte WFS-Mixingkonsole, die einThe wave field synthesis module according to the invention further comprises a WFS mixing console, not shown in FIG
Autorensystem umfaßt, um WFS-Tonbeschreibungen zu erzeugen.Authoring system included to generate WFS sound descriptions.
Nachfolgend wird Bezug nehmend auf Fig. 6 auf die der Erzeugung von Synthesesignalen zugrundeliegende Vorgehensweise eingegangen. Betrachtet wird ein System mit drei virtuellen Quellen an drei virtuellen Positionen 60, 61, 62 sowie einem Lautsprecher LSi 63 an einer realen Lautsprecherposition, die dem zentralen WFS-Modul bekannt ist. Ferner sind die virtuellen Positionen der virtuellen Quellen 60, 61, 62 dem zentralen Wellenfeldsynthesemodul entweder daraus bekannt, daß sie in einem WFS-aufbereiteten Eingabesignal zugeführt werden, oder daß sie unter Verwendung von Audioquellenpositionen durch die Einrichtung 25 zur Berechnung der virtuellen Positionen abgeleitet werden. Die Synthesesignale s2ι, s2ι und s3i sind die Signale, die der Lautsprecher 63 abstrahlen muß, und die auf die jeweiligen virtuellen Positionen 60, 61, 62 zurückgehen. Daraus wird ersichtlich, daß, wie es ausgeführt worden ist, jeder Lautsprecher die Überlagerung von mehreren Synthesesignalen abstrahlen wird.The procedure on which the generation of synthesis signals is based is discussed below with reference to FIG. 6. A system with three virtual sources at three virtual positions 60, 61, 62 and a speaker LSi 63 at a real speaker position, which is known to the central WFS module, is considered. Furthermore, the virtual positions of the virtual sources 60, 61, 62 are known to the central wave field synthesis module either from the fact that they are supplied in a WFS-processed input signal or from the fact that they are derived by means of audio source positions by the means 25 for calculating the virtual positions. The synthesis signals s 2 ι, s 2 ι and s 3 i are the signals which the loudspeaker 63 must emit and which go back to the respective virtual positions 60, 61, 62. From this it can be seen that, as has been stated, each loudspeaker will emit the overlay of several synthesis signals.
Zwischen jeder virtuellen Position und jedem Lautsprecher wird ferner ein Kanal ji definiert, der beispielsweise durch eine Impulsantwort, eine Übertragungsfunktion oder irgendeine andere Kanalinformation beschrieben werden kann, wie es anhand von Fig. 7 dargestellt ist. In die Kanalbeschreibung können sämtliche gewünschte Eigenschaften verpackt werden, um dann die Synthesesignale, die von dem Wellenfeldsynthesemodul berechnet werden, mit den Kanalinformationen für den entsprechenden einem Synthesesignal zugeordneten Kanal zu beaufschlagen. Ist die Kanalinformation in Form einer Impulsantwort gegeben, die den Kanal beschreibt, so ist die Beaufschlagung eine Faltung. Liegen die Signale im Frequenzbereich vor, so ist die Beaufschlagung eine Multiplikation. Alternative Kanalinformationen können ebenfalls je nach Ausführungsform eingesetzt werden.A channel ji is also defined between each virtual position and each loudspeaker can be described by an impulse response, a transfer function or any other channel information, as shown with reference to FIG. 7. All desired properties can be packaged in the channel description, in order then to apply the channel information for the corresponding channel assigned to a synthesis signal to the synthesis signals which are calculated by the wave field synthesis module. If the channel information is given in the form of an impulse response that describes the channel, the loading is a convolution. If the signals are in the frequency range, the application is a multiplication. Alternative channel information can also be used depending on the embodiment.
Im nachfolgenden wird anhand von Fig. 7 dargestellt, durch welche Informationen ein Kanal 70 von einer virtuellen Quelle 71 zu einem realen Lautsprecher 72 beeinflußt werden kann. Zunächst geht in die Kanalinformation, also beispielsweise die Kanalimpulsantwort die virtuelle Position der virtuellen Quelle 71 ein. Ferner gehen Eigenschaften der virtuellen Quelle ein, wie z. B. Größe, Dichte, etc. So wird z. B. ein kleines Triangel anders beschrieben und modelliert werden müssen, als eine große Pauke. Ferner gehen, wie es in Fig. 7 gezeigt ist, die Eigenschaften des Aufnahmeraums in die Kanalübertragungsfunktion ein. Weitere Einflußkomponenten sind eine Systemverzerrung des gesamten Audiowiedergabesystems, in dem beispielsweise Lautsprecherverzerrungen bzw. Nichtidealitäten der Lautsprecher enthalten sind. In die Kanalinformationen gehen ferner Informationen über den Wiedergaberaum ein, um eine Kompensation der akustischen Eigenschaften des Wiedergaberaums zu erreichen. Wenn von dem Wiedergaberaum beispielsweise bekannt ist, daß er eine frontal einem Lautsprecher gegenüberliegende Wand aufweist, die reflektiert, und deren Reflexion jedoch unterdrückt werden soll, so wird der entsprechende Lautsprecher unter Berücksichtigung dieser Informationen derart angesteuert, daß er ein Signal enthält, das zu dem reflektierten Signal um 180 Grad phasenverschoben ist und eine entsprechende Amplitude hat, so daß eine auslöschende Reflexion auftritt und die Wand akustisch transparent wird, d. h. für einen Zuhörer nicht mehr aufgrund der Reflexionen identifizierbar ist.In the following, FIG. 7 shows which information can be used to influence a channel 70 from a virtual source 71 to a real loudspeaker 72. First of all, the virtual position of the virtual source 71 is included in the channel information, for example the channel impulse response. Properties of the virtual source are also included, such as. B. size, density, etc. B. a small triangle must be described and modeled differently than a large timpani. Furthermore, as shown in FIG. 7, the properties of the recording space are included in the channel transmission function. Further influencing components are a system distortion of the entire audio reproduction system, which, for example, contains loudspeaker distortions or non-idealities of the loudspeakers. The channel information also includes information about the playback space in order to compensate for the acoustic properties of the playback space. If, for example, the reproduction room is known to have a wall opposite a loudspeaker that is reflecting and whose reflection is to be suppressed, however, the corresponding loudspeaker is underneath Taking this information into account is controlled in such a way that it contains a signal which is 180 degrees out of phase with the reflected signal and has a corresponding amplitude, so that an extinguishing reflection occurs and the wall becomes acoustically transparent, ie no longer for a listener due to the reflections is identifiable.
Schließlich kann die Kanalinformation auch dazu verwendet werden, um eine bestimmte Zielwiedergabeakustik einzustellen. Hierzu wird es bevorzugt, zunächst die Akustik des Wiedergaberaums zu unterdrücken in Form einer Wiedergaberaumkompensation, um dann Kanalinformationen zu erzeugen und dem Wellenfeldsynthesemodul zuzuführen, so daß in einem Wiedergaberaum eine Akustik eines beliebigen anderen Wiedergaberaums simuliert werden kann.Finally, the channel information can also be used to set a specific target reproduction acoustics. For this purpose, it is preferred to first suppress the acoustics of the display room in the form of a display room compensation, in order to then generate channel information and feed it to the wave field synthesis module, so that the acoustics of any other display room can be simulated in a display room.
Abhängig von den Gegebenheiten kann das erfindungsgemäße Verfahren zum Wiedergeben eines Audiosignals in Hardware oder in Software implementiert werden. Die Implementation kann auf einem digitalen Speichermedium, insbesondere einer Diskette oder CD mit elektronisch auslesbaren Steuersignalen erfolgen, die so mit einem programmierbaren Computersystem zusammenwirken können, daß das Verfahren ausgeführt wird. Allgemein besteht die Erfindung somit auch in einem Computer-Programm-Produkt mit auf einem maschinenlesbaren Träger gespeichertem Programmcode zur Durchführung des erfindungsgemäßen Verfahrens, wenn das Computer-Programm-Produkt auf einem Rechner abläuft. In anderen Worten ausgedrückt kann die Erfindung somit als ein Computer-Programm mit einem Programmcode zur Durchführung des Verfahrens realisiert werden, wenn das Computer- Programm auf einem Computer abläuft. Depending on the circumstances, the method according to the invention for reproducing an audio signal can be implemented in hardware or in software. The implementation can take place on a digital storage medium, in particular a floppy disk or CD with electronically readable control signals, which can cooperate with a programmable computer system such that the method is carried out. In general, the invention thus also consists in a computer program product with program code stored on a machine-readable carrier for carrying out the method according to the invention when the computer program product runs on a computer. In other words, the invention can thus be implemented as a computer program with a program code for carrying out the method if the computer program runs on a computer.

Claims

Patentansprüche claims
Audiowiedergabesystem für einen Wiedergaberaum, in dem eine Vielzahl von Lautsprechern (14a-14e) an definierten Lautsprecherorten angeordnet ist, unter Verwendung eines Audiosignals mit einer Mehrzahl von Audiospuren, wobei jeder Audiospur eine Audioquellenposition zugeordnet ist, mit folgenden Merkmalen:Audio reproduction system for a reproduction room, in which a plurality of loudspeakers (14a-14e) are arranged at defined loudspeaker locations, using an audio signal with a plurality of audio tracks, each audio track being assigned an audio source position, with the following features:
einem zentralen Wellenfeldsynthesemodul (10) , das ausgebildet ist,a central wave field synthesis module (10) which is designed
um Audiokanalinformationen für jeden Audiokanal von einer virtuellen Position zu einer Lautsprecherposition zu bestimmen, wobei die virtuelle Position von der Audioquellenposition, die der Audiospur zugeordnet ist, abhängt, so daß für jeden Kanal von jeder virtuellen Position zu jedem Lautsprecher Audiokanalinformationen vorliegen,to determine audio channel information for each audio channel from a virtual position to a speaker position, the virtual position depending on the audio source position associated with the audio track so that there is audio channel information for each channel from each virtual position to each speaker,
um Synthesesignale von den virtuellen Positionen für die Lautsprecher (24) zu berechnen, undto calculate synthesis signals from the virtual positions for the speakers (24), and
um jedem Lautsprecher eines oder mehrere Synthesesignale, die von dem betroffenen Lautsprecher wiederzugeben sind, sowieto each speaker one or more synthesis signals to be reproduced by the speaker concerned, and
Kanalinformationen für das eine oder die mehreren Synthesesignale zuzuführen (26) ;Supply (26) channel information for the one or more synthesis signals;
einer Vielzahl von Lautsprechermodulen (12a-12e) , wobei ein Lautsprechermodul einem Lautsprecher zugeordnet ist, und wobei jedes LautSprechermodul folgende Merkmale aufweist: einen Empfänger (31) zum Empfangen des einen oder der mehreren Synthesesignale für den betroffenen Lautsprecher sowie der Kanalinformationen;a plurality of loudspeaker modules (12a-12e), one loudspeaker module being assigned to one loudspeaker, and each loudspeaker module having the following features: a receiver (31) for receiving the one or more synthesis signals for the affected speaker and the channel information;
eine Renderingeinrichtung (32) zum Berechnen eines Wiedergabesignals für den Lautsprecher unter Verwendung des einen oder der mehreren Synthesesignale und der Kanalinformationen für den betroffenen Lautsprecher; undrendering means (32) for calculating a playback signal for the speaker using the one or more synthesis signals and the channel information for the affected speaker; and
einer Signalverarbeitungseinrichtung (33) zum Erzeugen eines analogen Lautsprechersignals, das dem betroffenen Lautsprecher zuführbar ist, aufgrund des Wiedergabesignals; unda signal processing device (33) for generating an analog loudspeaker signal, which can be fed to the loudspeaker concerned, on the basis of the playback signal; and
einer Mehrzahl von Übertragungsleitungen (16a-16e) von dem zentralen Wellenfeldsynthesemodul zu jedem Lautsprecher, wobei jede Übertragungsstrecke mit dem zentralen Wellenfeldsynthesemodul einerseits und einem eigenen Lau Sprechermodul andererseits gekoppelt ist.a plurality of transmission lines (16a-16e) from the central wave field synthesis module to each loudspeaker, each transmission link being coupled to the central wave field synthesis module on the one hand and its own Lau speaker module on the other.
2. Audiowiedergabesystem nach Anspruch 1, bei dem jedes Lautsprechermodul mit dem Lautsprecher, dem dasselbe zugeordnet ist, in einem Verbund ausgeführt ist, so daß eine räumliche Entfernung zwischen dem Lautsprecher und dem Lautsprechermodul kleiner ist als eine räumliche Entfernung zwischen dem Lautsprechermodul und dem zentralen Wellenfeldsynthesemodul .2. Audio playback system according to claim 1, wherein each speaker module with the speaker with which it is associated, is carried out in a compound, so that a spatial distance between the speaker and the speaker module is smaller than a spatial distance between the speaker module and the central wave field synthesis module ,
3. Audiowiedergabesystem nach Anspruch 1 oder 2, bei dem die Audiokanalinformationen Impulsantworten für die Audiokanäle sind.3. The audio playback system of claim 1 or 2, wherein the audio channel information is impulse responses for the audio channels.
4. Audiowiedergabesystem nach Anspruch 3, bei dem die Rendering-Einrichtung zum Berechnen eines Wiedergabesignals eine Faltungseinrichtung aufweist, um eine oder mehrere Faltungsinformationen unter Verwendung des einen oder der mehreren Synthesesignale mit den entsprechenden Impulsantworten durchzuführen.4. The audio playback system according to claim 3, wherein the rendering device for calculating a playback signal comprises a folding device for under one or more folding information Use the one or more synthesis signals with the appropriate impulse responses.
5. Audiowiedergabesystem nach Anspruch 4, bei dem die Rendering-Einrichtung (32) folgende Merkmale aufweist:5. The audio playback system as claimed in claim 4, in which the rendering device (32) has the following features:
eine Zeitbereich-Frequenzbereich-UmsetZungseinrichtung (34a, 34b, 34c) für jedes Synthesesignal;time domain frequency domain converting means (34a, 34b, 34c) for each synthesis signal;
eine Multipliziereinrichtung (35a, 35b, 35c) für jedes Synthesesignal;a multiplier (35a, 35b, 35c) for each synthesis signal;
eine Summationseinrichtung (26) zum Summieren von im Frequenzbereich vorliegenden mit entsprechenden Kanalimpulsantworten beaufschlagten Synthesesignalen; unda summation device (26) for summing synthesis signals present in the frequency range and subjected to corresponding channel impulse responses; and
eine einzige Frequenzbereich-Zeitbereich-Umsetzungseinrichtung (37) zum Umsetzen des Summensignals in den Zeitbereich, um das Wiedergabesignal zu erhalten.a single frequency domain-time domain converting means (37) for converting the sum signal into the time domain to obtain the reproduction signal.
6. Audiowiedergabesystem nach Anspruch 1, bei dem die Signalverarbeitungseinrichtung (33) in dem Lautsprechermodul einen digitalen Verstärker aufweist.6. Audio playback system according to claim 1, wherein the signal processing device (33) in the loudspeaker module comprises a digital amplifier.
7. Audiowiedergabesystem nach Anspruch 4, bei dem das zentrale Wellenfeldsynthesemodul ausgebildet ist, um einen ersten Teil der Kanalimpulsantwort abtastwertweise zu übertragen und einen zweiten Teil lediglich unter Verwendung von Hüllkurven-Stützwerten, und7. The audio playback system as claimed in claim 4, in which the central wave field synthesis module is designed to sample-transmit a first part of the channel impulse response and a second part only using envelope curve support values, and
bei dem die Rendering-Einrichtung (32) ausgebildet ist, um den zweiten Teil der Kanalimpulsantwort unter Verwendung der Stützwerte zu rekonstruieren.in which the rendering device (32) is designed to reconstruct the second part of the channel impulse response using the reference values.
8. Audiowiedergabesystem nach Anspruch 7, bei dem die Rendering-Einrichtung (32) ausgebildet ist, um den zweiten Teil der Kanalimpulsantwort durch einen Rauschgenerator oder Pseudo-Rausch-Generator zu erzeugen, wobei Rauschwerte oder Pseudo-Rausch-Werte amplitudenmäßig mit den Stützwerten und/oder aus den Stützwerten interpolierten Hilfswerten gewichtet sind.8. The audio playback system according to claim 7, wherein the rendering device (32) is designed to display the to generate the second part of the channel impulse response by means of a noise generator or pseudo-noise generator, wherein noise values or pseudo-noise values are amplitude-weighted with the base values and / or auxiliary values interpolated from the base values.
9. Audiowiedergabesystem nach einem der vorhergehenden Ansprüche, bei dem die Audiospuren genormte Mehrkanalspuren sind und die Audioquellenpositionen Normpositionen sind, die sich auf eine Positionierung von Wiedergabe-Lautsprechern in einem Wiedergaberaum beziehen, wobei die Anzahl der Normpositionen gleich der Anzahl der genormten Mehrkanalspuren ist.9. Audio playback system according to one of the preceding claims, in which the audio tracks are standardized multi-channel tracks and the audio source positions are standard positions which relate to a positioning of playback speakers in a playback room, the number of standard positions being equal to the number of standardized multi-channel tracks.
10. Audiowiedergabesystem nach Anspruch 9, bei dem das Wellenfeldsynthesemodul ausgebildet ist, um die virtuellen Positionen zur Berechnung der Audiokanalinformationen aus den Normpositionen (22) zu berechnen (25) .10. Audio reproduction system according to claim 9, in which the wave field synthesis module is designed to calculate (25) the virtual positions for calculating the audio channel information from the standard positions (22).
11. Audiowiedergabesystem nach Anspruch 10, bei dem das Wellenfeldsynthesemodul ausgebildet ist, um die virtuellen Positionen im Unendlichen zu plazieren11. The audio playback system according to claim 10, wherein the wave field synthesis module is designed to place the virtual positions in infinity
(25) , so daß die Vielzahl von Lautsprechern zusammen ebene Schallwellen abstrahlen.(25) so that the multitude of loudspeakers together emit plane sound waves.
12. Audiowiedergabesystem nach Anspruch 10, bei der das Wellenfeldsynthesemodul ausgebildet ist, um virtuelle Wiedergabe-Lautsprecher an definierten virtuellen Positionen als punktförmige Schallquellen zu simulieren, die so weit von der Vielzahl von Lautsprechern entfernt sind, daß ein optimaler Wiedergabebereich im wesentlichen den gesamten Wiedergaberaum umfaßt.12. The audio playback system according to claim 10, wherein the wave field synthesis module is designed to simulate virtual playback speakers at defined virtual positions as point-shaped sound sources that are so far away from the plurality of speakers that an optimal playback area essentially encompasses the entire playback space ,
13. Audiowiedergabesystem nach einem der Ansprüche 9 bis 12, bei dem die Audiospuren Teil eines Video- oder Kinofilms sind, wobei das Wellenfeldsynthesemodul ausgebildet ist, um die Audiospuren des Video- oder Kinofilms um eine Zeitspanne versetzt vor einer Videowiedergabe abzutasten, wobei die Zeitspanne ausgewählt ist, um unter Berücksichtigung einer Verarbeitungszeit in dem Wellenfeldsynthesemodul und dem Lautsprechermodul eine gleichzeitige Wiedergabe von Bild und Ton zu erhalten.13. Audio playback system according to one of claims 9 to 12, wherein the audio tracks are part of a video or cinema film, the wave field synthesis module is designed to sample the audio tracks of the video or cinema film offset by a time period before video playback, the time period being selected in order to obtain a simultaneous reproduction of image and sound taking into account a processing time in the wave field synthesis module and the loudspeaker module.
14. Audiowiedergabesystem nach einem der Ansprüche 1 bis " 13, bei dem das Audiosignal für Audioobjekte in einer14. Audio reproduction system according to one of claims 1 to " 13, wherein the audio signal for audio objects in one
Aufnahmeumgebung jeweils als Audiospur ein Audiosignal des Objekts sowie eine Position des Audioobjekts in der Aufnahmeumgebung, eine oder mehrere Eigenschaften des Audioobjekts wie Größe oder Dichte und/oder Informationen über akustische Eigenschaften einer Auf ahmeumgebung umfaßt .Recording environment each include an audio signal of the object as an audio track and a position of the audio object in the recording environment, one or more properties of the audio object such as size or density and / or information about acoustic properties of a recording environment.
15. Audiowiedergabesystem nach Anspruch 14, bei dem die Wellenfeldsynthesemodul ausgebildet ist, um die virtuellen Positionen aus Positionen der Audioobjekte in der Aufnahmeumgebung zu bestimmen.15. The audio playback system according to claim 14, wherein the wave field synthesis module is designed to determine the virtual positions from positions of the audio objects in the recording environment.
16. Audiowiedergabesystem nach einem der vorhergehenden Ansprüche, bei dem das Wellenfeldsynthesemodul ausgebildet ist, um Informationen über akustische Eigenschaften des Wiedergaberaums zu erhalten und bei der Bestimmung der Kanalinformationen zu berücksichtigen, so daß die durch die Vielzahl von Lautsprechern wiedergegebenen Schallwellen derart gestaltet sind, daß akustische Einflüsse des Wiedergaberaums reduziert sind.16. Audio reproduction system according to one of the preceding claims, in which the wave field synthesis module is designed to receive information about acoustic properties of the reproduction space and to take it into account when determining the channel information, so that the sound waves reproduced by the plurality of loudspeakers are designed in such a way that acoustic Influences of the playback space are reduced.
17. Audiowiedergabesystem nach einem der vorhergehenden Ansprüche, bei dem das Wellenfeldsynthesemodul ausgebildet ist, um eine Adaption an eine Akustik des Wiedergaberaums vor oder während einer Wiedergabe des Audiosignals durchzuführen, indem eine Vielzahl von Raumimpulsantworten zwischen den Lautsprechern und in dem Wiedergaberaum positionierten Mikrophonen berechnet wird,17. Audio reproduction system according to one of the preceding claims, in which the wave field synthesis module is designed to adapt to an acoustics of the reproduction space before or during a reproduction of the audio signal by a plurality of room impulse responses between the speakers and microphones positioned in the playback room is calculated,
eine insgesamte Impulsantwort des Wiedergaberaums aus der Vielzahl von Raumimpulsantworten interpoliert wird, undan overall impulse response of the playback space is interpolated from the plurality of space impulse responses, and
die gesamte Impulsantwort bei der Berechnung der Kanalinformationen berücksichtigt wird, um akustische Eigenschaften des Wiedergaberaums zu reduzieren.the entire impulse response is taken into account when calculating the channel information in order to reduce acoustic properties of the reproduction space.
18. Audiowiedergabesystem nach einem der vorhergehenden Ansprüche, bei dem das zentrale18. Audio playback system according to one of the preceding claims, wherein the central
Wellenfeldsynthesemodul ausgebildet ist, um Synchronisationsinformationen zu erzeugen und in Datenströme zu den Lautsprechermodulen einzubetten, und bei dem die Mehrzahl von Lautsprechermodulen ausgebildet ist, um die Synchronisationsinformationen von dem zentralen Wellenfeldsynthesemodul zu empfangen und zur Synchronisation zu verwenden, so daß die Lautsprechermodule auf das zentrale Wellenfeldsynthesemodul synchronisiert sind.The wave field synthesis module is designed to generate synchronization information and to embed it in data streams to the loudspeaker modules, and in which the plurality of loudspeaker modules is designed to receive the synchronization information from the central wave field synthesis module and to use it for synchronization, so that the loudspeaker modules synchronize with the central wave field synthesis module are.
19. Verfahren zum Wiedergeben eines Audiosignals in einem Wiedergaberaum, in dem eine Vielzahl von Lautsprechern an definierten Lautsprecherorten angeordnet ist, wobei das Audiosignal eine Mehrzahl von Audiospuren aufweist, wobei jeder Audiospur eine Audioquellenposition zugeordnet ist, mit folgenden Schritten:19. A method for reproducing an audio signal in a playback room in which a plurality of loudspeakers are arranged at defined loudspeaker locations, the audio signal having a plurality of audio tracks, each audio track being assigned an audio source position, comprising the following steps:
zentrales Bestimmen von Audiokanalinformationen für jeden Audiokanal von einer virtuellen Position zu einer Lautsprecherposition, wobei die virtuelle Position von der Audioquellenposition, die der Audiospur zugeordnet ist, abhängt, so daß für jeden Kanal von jeder virtuellen Position zu jedem Lautsprecher Audiokanalinformationen vorliegen;centrally determining audio channel information for each audio channel from a virtual position to a speaker position, the virtual position depending on the audio source position associated with the audio track so that for each Channel from each virtual position to each speaker there is audio channel information;
zentrales Bestimmen von Synthesesignalen von den virtuellen Positionen für die Lautsprecher;central determination of synthesis signals from the virtual positions for the loudspeakers;
Übertragen von einem oder mehreren Synthesesignalen sowie zugehörigen Kanalinformationen zu einer Vielzahl von Lautsprechermodulen;Transmitting one or more synthesis signals and associated channel information to a plurality of loudspeaker modules;
dezentrales Berechnen eines Wiedergabesignals für den Lautsprecher unter Verwendung des einen oder der mehreren Synthesesignale und der zugehörigen Kanalinformationen für einen betroffenen Lautsprecher;decentrally calculating a playback signal for the speaker using the one or more synthesis signals and the associated channel information for an affected speaker;
Durchführen einer Signalverarbeitung unter Verwendung einer Digital/Analog-Wandlung, um ein analoges Lautsprechersignal zu erzeugen; undPerforming signal processing using digital to analog conversion to produce an analog speaker signal; and
gemeinsames Wiedergewinnen der analogen Lautsprechersignale durch die Vielzahl von Lautsprechern.collectively recovering the analog speaker signals through the plurality of speakers.
20. Computer-Programm mit einem Programmcode zur Durchführung des Verfahrens nach Anspruch 19, wenn das Programm auf einem Computer abläuft. 20. Computer program with a program code for performing the method according to claim 19, when the program runs on a computer.
EP03782222A 2002-11-21 2003-11-21 Audio playback system and method for playing back an audio signal Expired - Lifetime EP1576847B1 (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
DE10254404A DE10254404B4 (en) 2002-11-21 2002-11-21 Audio reproduction system and method for reproducing an audio signal
DE10254404 2002-11-21
PCT/EP2003/013110 WO2004047485A1 (en) 2002-11-21 2003-11-21 Audio playback system and method for playing back an audio signal

Publications (2)

Publication Number Publication Date
EP1576847A1 true EP1576847A1 (en) 2005-09-21
EP1576847B1 EP1576847B1 (en) 2006-04-19

Family

ID=32318606

Family Applications (1)

Application Number Title Priority Date Filing Date
EP03782222A Expired - Lifetime EP1576847B1 (en) 2002-11-21 2003-11-21 Audio playback system and method for playing back an audio signal

Country Status (5)

Country Link
EP (1) EP1576847B1 (en)
JP (1) JP4620468B2 (en)
AT (1) ATE324021T1 (en)
DE (2) DE10254404B4 (en)
WO (1) WO2004047485A1 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9648437B2 (en) 2009-08-03 2017-05-09 Imax Corporation Systems and methods for monitoring cinema loudspeakers and compensating for quality problems
CN109068261A (en) * 2018-07-17 2018-12-21 费迪曼逊多媒体科技(上海)有限公司 A kind of playback restoring method carrying out non real-time rendering processing using WFS method

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10321986B4 (en) * 2003-05-15 2005-07-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for level correcting in a wave field synthesis system
JP2006086921A (en) 2004-09-17 2006-03-30 Sony Corp Reproduction method of audio signal and reproducing device
JP4625671B2 (en) * 2004-10-12 2011-02-02 ソニー株式会社 Audio signal reproduction method and reproduction apparatus therefor
JP2006115396A (en) * 2004-10-18 2006-04-27 Sony Corp Reproduction method of audio signal and reproducing apparatus therefor
DE102004057500B3 (en) * 2004-11-29 2006-06-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Device and method for controlling a sound system and public address system
DE102005008369A1 (en) 2005-02-23 2006-09-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for simulating a wave field synthesis system
DE102005008342A1 (en) * 2005-02-23 2006-08-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio-data files storage device especially for driving a wave-field synthesis rendering device, uses control device for controlling audio data files written on storage device
DE102005008343A1 (en) * 2005-02-23 2006-09-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for providing data in a multi-renderer system
DE102005008366A1 (en) 2005-02-23 2006-08-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Device for driving wave-field synthesis rendering device with audio objects, has unit for supplying scene description defining time sequence of audio objects
DE102005008333A1 (en) * 2005-02-23 2006-08-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Control device for wave field synthesis rendering device, has audio object manipulation device to vary start/end point of audio object within time period, depending on extent of utilization situation of wave field synthesis system
JP2006304165A (en) * 2005-04-25 2006-11-02 Yamaha Corp Speaker array system
DE102005043641A1 (en) * 2005-05-04 2006-11-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating and processing sound effects in spatial sound reproduction systems by means of a graphical user interface
DE102006053919A1 (en) * 2006-10-11 2008-04-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating a number of speaker signals for a speaker array defining a playback space
JP5338053B2 (en) * 2007-09-11 2013-11-13 ソニー株式会社 Wavefront synthesis signal conversion apparatus and wavefront synthesis signal conversion method
KR100943215B1 (en) 2007-11-27 2010-02-18 한국전자통신연구원 Apparatus and method for reproducing surround wave field using wave field synthesis
KR102033071B1 (en) * 2010-08-17 2019-10-16 한국전자통신연구원 System and method for compatible multi channel audio
EP2451196A1 (en) 2010-11-05 2012-05-09 Thomson Licensing Method and apparatus for generating and for decoding sound field data including ambisonics sound field data of an order higher than three
CN105792086B (en) 2011-07-01 2019-02-15 杜比实验室特许公司 It is generated for adaptive audio signal, the system and method for coding and presentation
DE102011082310A1 (en) 2011-09-07 2013-03-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and electroacoustic system for reverberation time extension
US9661436B2 (en) 2012-08-29 2017-05-23 Sharp Kabushiki Kaisha Audio signal playback device, method, and recording medium
JP5590169B2 (en) * 2013-02-18 2014-09-17 ソニー株式会社 Wavefront synthesis signal conversion apparatus and wavefront synthesis signal conversion method
JP5743003B2 (en) * 2014-05-09 2015-07-01 ソニー株式会社 Wavefront synthesis signal conversion apparatus and wavefront synthesis signal conversion method
US9924291B2 (en) * 2016-02-16 2018-03-20 Sony Corporation Distributed wireless speaker system
JP6670259B2 (en) * 2017-01-26 2020-03-18 日本電信電話株式会社 Sound reproduction device

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ATE376892T1 (en) * 1999-09-29 2007-11-15 1 Ltd METHOD AND APPARATUS FOR ALIGNING SOUND WITH A GROUP OF EMISSION TRANSDUCERS

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See references of WO2004047485A1 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9648437B2 (en) 2009-08-03 2017-05-09 Imax Corporation Systems and methods for monitoring cinema loudspeakers and compensating for quality problems
US10924874B2 (en) 2009-08-03 2021-02-16 Imax Corporation Systems and method for monitoring cinema loudspeakers and compensating for quality problems
CN109068261A (en) * 2018-07-17 2018-12-21 费迪曼逊多媒体科技(上海)有限公司 A kind of playback restoring method carrying out non real-time rendering processing using WFS method

Also Published As

Publication number Publication date
WO2004047485A1 (en) 2004-06-03
DE10254404A1 (en) 2004-06-17
ATE324021T1 (en) 2006-05-15
JP2006507727A (en) 2006-03-02
EP1576847B1 (en) 2006-04-19
JP4620468B2 (en) 2011-01-26
DE50303069D1 (en) 2006-05-24
DE10254404B4 (en) 2004-11-18

Similar Documents

Publication Publication Date Title
DE10254404B4 (en) Audio reproduction system and method for reproducing an audio signal
EP1671516B1 (en) Device and method for producing a low-frequency channel
EP1844628B1 (en) Device and method for activating an electromagnetic field synthesis renderer device with audio objects
DE10328335B4 (en) Wavefield syntactic device and method for driving an array of loud speakers
EP2080411B1 (en) Device and method for generating a number of loudspeaker signals for a loudspeaker array which defines a reproduction area
EP1782658B1 (en) Device and method for controlling a plurality of loudspeakers by means of a dsp
EP1872620B9 (en) Apparatus and method for controlling a plurality of loudspeakers by means of a graphic user interface
EP1525776B1 (en) Device for correcting the level in a wave field synthesis system
EP1972181B1 (en) Device and method for simulating wfs systems and compensating sound-influencing wfs characteristics
EP1723825B1 (en) Apparatus and method for controlling a wave field synthesis rendering device
DE10321980B4 (en) Apparatus and method for calculating a discrete value of a component in a loudspeaker signal
DE10254470A1 (en) Apparatus and method for determining an impulse response and apparatus and method for presenting an audio piece

Legal Events

Date Code Title Description
PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

Free format text: ORIGINAL CODE: 0009012

17P Request for examination filed

Effective date: 20050223

AK Designated contracting states

Kind code of ref document: A1

Designated state(s): AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IT LI LU MC NL PT RO SE SI SK TR

AX Request for extension of the european patent

Extension state: AL LT LV MK

GRAP Despatch of communication of intention to grant a patent

Free format text: ORIGINAL CODE: EPIDOSNIGR1

GRAS Grant fee paid

Free format text: ORIGINAL CODE: EPIDOSNIGR3

GRAA (expected) grant

Free format text: ORIGINAL CODE: 0009210

DAX Request for extension of the european patent (deleted)
RBV Designated contracting states (corrected)

Designated state(s): AT CH DE FR GB LI

AK Designated contracting states

Kind code of ref document: B1

Designated state(s): AT CH DE FR GB LI

REG Reference to a national code

Ref country code: GB

Ref legal event code: FG4D

Free format text: NOT ENGLISH

REF Corresponds to:

Ref document number: 50303069

Country of ref document: DE

Date of ref document: 20060524

Kind code of ref document: P

GBT Gb: translation of ep patent filed (gb section 77(6)(a)/1977)

Effective date: 20060605

ET Fr: translation filed
PLBE No opposition filed within time limit

Free format text: ORIGINAL CODE: 0009261

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: NO OPPOSITION FILED WITHIN TIME LIMIT

26N No opposition filed

Effective date: 20070122

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: AT

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20061121

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: LI

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20071130

Ref country code: CH

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20071130

REG Reference to a national code

Ref country code: CH

Ref legal event code: PL

REG Reference to a national code

Ref country code: FR

Ref legal event code: PLFP

Year of fee payment: 13

REG Reference to a national code

Ref country code: FR

Ref legal event code: PLFP

Year of fee payment: 14

REG Reference to a national code

Ref country code: FR

Ref legal event code: PLFP

Year of fee payment: 15

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: GB

Payment date: 20221123

Year of fee payment: 20

Ref country code: FR

Payment date: 20221118

Year of fee payment: 20

Ref country code: DE

Payment date: 20221121

Year of fee payment: 20

P01 Opt-out of the competence of the unified patent court (upc) registered

Effective date: 20230524

REG Reference to a national code

Ref country code: DE

Ref legal event code: R071

Ref document number: 50303069

Country of ref document: DE

REG Reference to a national code

Ref country code: GB

Ref legal event code: PE20

Expiry date: 20231120

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: GB

Free format text: LAPSE BECAUSE OF EXPIRATION OF PROTECTION

Effective date: 20231120

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: GB

Free format text: LAPSE BECAUSE OF EXPIRATION OF PROTECTION

Effective date: 20231120