EP2901717B2 - Procede et dispositif de generation de signaux audio destines a etre fournis a un systeme de restitution sonore - Google Patents

Procede et dispositif de generation de signaux audio destines a etre fournis a un systeme de restitution sonore Download PDF

Info

Publication number
EP2901717B2
EP2901717B2 EP13779301.4A EP13779301A EP2901717B2 EP 2901717 B2 EP2901717 B2 EP 2901717B2 EP 13779301 A EP13779301 A EP 13779301A EP 2901717 B2 EP2901717 B2 EP 2901717B2
Authority
EP
European Patent Office
Prior art keywords
loudspeakers
sound
audio signal
signals
input audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
EP13779301.4A
Other languages
German (de)
English (en)
Other versions
EP2901717A1 (fr
EP2901717B1 (fr
Inventor
Etienne Corteel
Khoa-Van NGUYEN
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sennheiser Electronic GmbH and Co KG
Original Assignee
Sennheiser Electronic GmbH and Co KG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=47505066&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=EP2901717(B2) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Sennheiser Electronic GmbH and Co KG filed Critical Sennheiser Electronic GmbH and Co KG
Publication of EP2901717A1 publication Critical patent/EP2901717A1/fr
Publication of EP2901717B1 publication Critical patent/EP2901717B1/fr
Application granted granted Critical
Publication of EP2901717B2 publication Critical patent/EP2901717B2/fr
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R27/00Public address systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/323Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only for loudspeakers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2201/00Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
    • H04R2201/40Details of arrangements for obtaining desired directional characteristic by combining a number of identical transducers covered by H04R1/40 but not provided for in any of its subgroups
    • H04R2201/4012D or 3D arrays of transducers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2201/00Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
    • H04R2201/40Details of arrangements for obtaining desired directional characteristic by combining a number of identical transducers covered by H04R1/40 but not provided for in any of its subgroups
    • H04R2201/405Non-uniform arrays of transducers or a plurality of uniform arrays with different transducer spacing

Definitions

  • the invention relates to the general field of acoustic treatments.
  • the sound reinforcement techniques are commonly used for the sound system of large rooms, such as for example a concert hall or an auditorium, in order to obtain a uniform restored sound level signal throughout the room.
  • PA Public Address
  • the placement of the speakers on the stage can prove to be problematic, with a view to respecting certain practical and aesthetic constraints (limited space requirement of the stage, visual rendering for the listener, etc.).
  • WFS Wave Field Synthesis
  • the attenuation of the sound level of the signals reproduced as a function of the distance to the stage is relatively rapid and therefore requires a substantial increase in the sound level reproduced by the line of speakers, which can cause discomfort for the listeners. close to the scene.
  • the figure 1A illustrates in solid lines the variations in the sound level expressed in decibels, of a signal reproduced using a WFS type technique by a set of 16 omnidirectional speakers positioned on a stage, these speakers having a sensitivity of 92 dB and being powered by 250 W (watt) amplifiers.
  • the invention responds in particular to this need by proposing a generation method according to claim 1.
  • the invention also relates to a generation device according to claim 11.
  • the invention thus applies in a privileged but not limiting manner to the reproduction of audio signals in a large room, such as a performance hall or an auditorium equipped with a stage.
  • the first set of speakers is placed on or in front of the stage of the room, while the second set of speakers is placed above the stage (aligned vertically or slightly offset from the first set of speakers).
  • the loudspeakers of the set positioned highest (second set) are more directional (on average) than the speakers of the set positioned lowest (first set).
  • the invention offers the possibility for this purpose of vertically orienting the loudspeakers of the second set towards the back of the room, while the loudspeakers of the first set can be oriented towards the part of the room located at near the stage.
  • the invention offers the possibility for this purpose of vertically orienting the loudspeakers of the second set towards the back of the room, while the loudspeakers of the first set can be oriented towards the part of the room located at near the stage.
  • the vertical directivity of the loudspeakers of the second set and its positioning in height makes it possible to limit the sound level reproduced close to the stage while guaranteeing a good sound level for the listeners placed in the back of the room.
  • the loudspeakers of the second set therefore play the role of reminder loudspeakers for the reproduction of the input audio signal.
  • the presence of directional booster speakers above the stage advantageously makes it possible to reduce the power of the speakers used for the first set. Therefore, one can use for the first set of speakers less bulky because of their reduced power or more limited.
  • the invention makes it possible to more easily overcome the practical and aesthetic constraints linked to the positioning of the loudspeakers in the room to restore the signals.
  • the limitation of the sound level restored by the second set of loudspeakers near the stage authorized by the invention makes it possible to favor the vertical localization of the sound objects of the signal at the level of the first set of loudspeakers, by benefiting an effect known as the "Haas effect".
  • the location of a sound object is given by the direction from which the sound that comes first to the ear (or first wavefront) comes from, even if the intensity of the sounds arriving in a second beat to the ear coming from another direction, is greater than the intensity of the first wavefront.
  • the delays and gains applied in accordance with the invention are advantageously chosen so that the combination of the first signals reproduced by the first set of loudspeakers and the second signals restored by the second set of loudspeakers verifies an effect of sound reproduction determined at a spatial reference position defined in the room for the first and second sets of speakers.
  • This determined sound restitution effect is for example the coherence (of phase) of the signals restored by the first and second sets of loudspeakers at the spatial reference position.
  • the delays applied during the generation of the first and second audio signals are chosen so that the first signals reproduced by the first set of speakers and the second signals reproduced by the second set of speakers arrive simultaneously at the reference spatial position.
  • This time difference between the signals is then chosen to be short enough to benefit from the Haas effect (that is to say typically less than 30-35 ms, for example of the order of 15 to 20 ms), and does not not generate an echo feeling for the audience in the room.
  • the accentuation of the Haas effect through the choice of delays applied to the first and second signals offers the possibility of further reducing the power of the loudspeakers of the first set, and therefore of using high frequencies. - less bulky speakers or in an even more limited number.
  • the gains are chosen so as to guarantee a sufficient sound level at the back of the room while optimizing the vertical location at the reference position.
  • the invention therefore makes it possible, on the one hand, to improve the quality of the signal reproduction compared with the state of the art, and to respond more effectively to the aesthetic and practical constraints imposed when positioning the speakers in the room. .
  • the input audio signal is a multichannel audio signal and, during at least one of the generation steps, the same delay and / or the same gain is applied to each channel of the signal input audio.
  • This embodiment facilitates the implementation of the invention, in particular by limiting the complexity linked to the choice of gains and / or delays to be applied.
  • said at least one delay and / or gain is applied to the input signal before the sound spatialization technique, it is also possible to reverse these two treatments.
  • the input audio signal is a multichannel signal comprising a number of channels lower than the number of speakers of the first and / or of the second set
  • the application of the same delay and / or of the same gain to all channels of the input audio signal is independent of the channel and the position of the sound objects of the input audio signal.
  • the sound spatialization techniques applied during the generation of the first and second power signals from the loudspeakers are linear (this is the case, for example, of techniques of the WFS type or more generally of techniques based on on the use of linear filtering) and that the gains and / or delays applied to the input signal are independent of the channels of this input signal, the first and second signals generated by first applying the gains and the delays and then the sound spatialization technique are equivalent to the first and the second signals generated by first applying the sound spatialization technique then the gains and delays.
  • a distinct delay and / or gain is applied to at least two distinct channels of the input audio signal.
  • This embodiment proposes to add a set of additional booster speakers to improve the sound reinforcement of the room.
  • Such an embodiment can prove to be very relevant for rooms of very large dimensions or having elements acoustically masking the signals reproduced by the loudspeakers (eg presence of balconies in a concert hall).
  • the invention is not limited to a system comprising three sets of speakers but it is also possible to add a fourth, a fifth, etc., set of speakers, the choice of delays and / or gains applied during the generation of the signals intended to supply these sets of speakers being preferably carried out by considering the sets of speakers two by two (eg second and third sets, third and fourth sets, etc.).
  • the different steps of the generation method according to the invention are determined by instructions from computer programs.
  • the invention also relates to a program on an information medium, this program being capable of being implemented in a generation device or more generally in a computer, this program comprising instructions adapted to the implementation. steps of a generation method as described above.
  • This program can use any programming language, and be in the form of source code, object code, or intermediate code between source code and object code, such as in a partially compiled form, or in any other desirable form.
  • the invention also relates to an information medium readable by a computer or by a microprocessor, and comprising instructions of a program as mentioned above.
  • the information medium can be any entity or device capable of storing the program.
  • the support may include a storage means, such as a ROM, for example a CD ROM or a microelectronic circuit ROM, or else a magnetic recording means, for example a floppy disc or a disc. hard.
  • the information medium can be a transmissible medium such as an electrical or optical signal, which can be routed via an electrical or optical cable, by radio or by other means.
  • the program according to the invention can in particular be downloaded from a network of the Internet type.
  • the information medium can be an integrated circuit in which the program is incorporated, the circuit being adapted to execute or to be used in the execution of the process in question.
  • the restitution assembly benefits from the same advantages as those mentioned above for the device and the generation process.
  • the figure 2 represents, in its environment, a set 1 of sound reproduction of an input audio signal S, according to the invention, in a first embodiment.
  • the audio signal S is a multi-channel signal resulting from a sound capture (ie of a recording) of a signal played on a SCENE stage of a performance hall R , performed by microphones placed on the SCENE stage or distributed in various places in this room, in a manner known per se.
  • the audio signal S possibly being in a variant a prerecorded audio signal or comprising prerecorded elements.
  • the audio signal S is intended to be reproduced in the theater using the sound reproduction assembly 1 according to the invention.
  • the format of the signal S can be either a signal composed of individual takes (eg for a performance hall, coming from a microphone by musician, singer or actor for a live sound recording), of a stereo signal, than of a signal in 5.1, 7.1, or 10.2 format, or of a signal in HOA (Higher Order Ambisonics) format, etc., or finally a combination of these techniques.
  • the speakers HP1-1, HP1-2, ..., HP1-P of the first set E1 are positioned at a height h1 called the reference.
  • the speakers HP1-1, HP1-2, ..., HP1-P of the first set E1 are arranged so as to form a horizontal line of speakers positioned on the SCENE stage of the R. performance hall. reference height h1 therefore corresponding here to the height of the SCENE scene.
  • the loudspeakers HP2-1, HP2-2, ..., HP2-N of the second set E2 are positioned at a height h2 greater than the position h1. In the example of the figure 2 , they are arranged so as to form a horizontal line of loudspeakers positioned at height h2.
  • the speakers of the second set E2 are not necessarily aligned vertically with (i.e. in the same vertical plane as) the speakers of the first set E1, relative to the SCENE scene. They can in particular be offset with respect to the loudspeakers of the first set E1 in the direction of the AUDIT part of the performance hall R where the audience is located.
  • the invention thus also applies to other speaker configurations, such as for example speaker arrays, or to configurations distinct from a linear configuration, such as for example a configuration adapted to the shape of the scene (e.g. in an arc).
  • the positioning of the loudspeakers of each set, relative to each other can be diverse and varied: it will thus be possible to envisage loudspeakers distributed uniformly within the set of loudspeakers, or distributed according to several groups placed at the ends and at the optical center of the stage, etc.
  • the invention advantageously offers the possibility of having a number N of speakers of the second set E2 smaller than the number P of speakers of the first set E1.
  • the number of speakers required for each set of speakers can therefore be determined by setting the desired aliasing frequency and the position of a reference listener in the room relative to the stage.
  • the loudspeakers of the second set E2 being more distant from the reference listener than the loudspeakers of the first set E1, because of their height positioning, it is possible through this to fix a more limited number of loudspeakers. speakers for the E2 set as for the E1 set.
  • the speakers HP2-1, HP2-2, ..., HP2-N of the second set E2 are more vertically directive than the speakers HP1-1, HP1-2, ..., HP1-N of the first set E1.
  • the expression “the speakers HP2-1, HP2-2, ..., HP2-N of the second set E2 is more vertically directive than the speakers HP1-1, HP1-2 , ..., HP1-N of the first set E1 "that the average directivity of the speakers of the second set is greater than the average directivity of the speakers of the first set.
  • omnidirectional speakers can be used for the first set E1, while the speakers of the second set E2 are chosen with a vertical opening of between 10 ° and 60 °.
  • the speakers HP2-1, HP2-2, ..., HP2-N of the second set E2 are essentially intended to ensure the sound coverage of the part of the performance hall, or at least of the audience, the furthest from the stage. To this end, they are oriented vertically towards the EXT end of the audience (which corresponds on the figure 3 at the back of the theater for the sake of simplification).
  • the loudspeakers HP1-1, HP1-2, ..., HP1-P of the first set E1 are essentially intended to ensure the sound coverage of the part of the performance hall, or at least of the audience, placed near the stage. To this end, they are therefore mounted on the stage or just in front of the stage.
  • loudspeakers of the first set E1 can be either omnidirectional or vertically directive.
  • they are oriented towards the front of the AUDIT part of the room, that is to say, towards the part located near the stage.
  • the various loudspeakers of the sets E1 and E2 are supplied by multi-channel audio signals, denoted respectively S1-1, S1-2, ..., S1-P and S2-1, S2-2, ..., S2- N, generated according to the invention by the device 3 for generating from the input audio signal S.
  • the generation device 3 here has the hardware architecture of a computer, as illustrated schematically in the figure 4 .
  • processor or microprocessor 4
  • random access memory a read-only memory 6
  • non-volatile flash memory 7 as well as communication means 8 capable of transmitting and receiving audio signals.
  • the communication means 8 comprise on the one hand, means for receiving the input audio signal S, and on the other hand, an interface (wired or wireless) with the speakers HP1-1, HP1-2, ..., HP1-P from set E1 and with speakers HP2-1, HP2-2, ..., HP2-N from set E2 to supply them with audio signals S1-1, S1- 2, ..., S1-P and S2-1, S2-2, ..., S2-N.
  • an interface wireless or wireless
  • the ROM 6 of the generation device 3 constitutes a recording medium in accordance with the invention, readable by the (micro) processor 4 and on which a computer program in accordance with the invention is recorded, comprising instructions for the execution of the steps of a generation process described later with reference to the figure 5 .
  • the generation device 3 can be in the form of a computer as illustrated in the figure 4 , or as a variant of an electronic chip or an integrated circuit, into which the computer program comprising the instructions for carrying out the generation method according to the invention is incorporated.
  • modules 3A, 3B1, 3B2, 3C1 and 3C2 on which the generation device 3 is based may alternatively be modules DSP (Digital Signal Processor) or FPGA (Field Programmable Gate Array).
  • the generation device 3 receives the multi-channel input audio signal S via its communication means 8 (step E10).
  • the audio signal S is generated nor to its format itself.
  • the generation device 3 is supplied, via a suitable interface, with the POS positions (OBJ) of the sound objects OBJ included in the signal S and that we want to restore. These positions are identified in a horizontal plane, namely in the horizontal plane in which the loudspeakers of the first set are located (i.e. the scene plane SCENE here, S being obtained by capturing the signals played on stage S), in terms of angle and distance from a determined and predefined point of origin.
  • This interface is for example a graphical interface developed for this purpose allowing a user to interact with the device 3, or a communication interface developed with a mixer operating on the signal S.
  • step E20 Obtaining these positions by the generation device 3 constitutes a step of identifying (step E20) the position of at least one sound object of the input audio signal S within the meaning of the invention.
  • the positions POS (OBJ) of the sound objects OBJ are identified directly by the generation device 3 and more specifically by the module 3A.
  • the module 3A can use a position tracking device (or “tracking” in English) of the sound objects present on the scene, known per se, and operating using optical and / or electromagnetic signals, and / or acoustic, etc.
  • a position tracking device or “tracking” in English
  • the module 3A of the generation device 3 implements a spatial analysis method known per se, based on a decomposition of the signal S into sub- frequency bands.
  • module 3A Various methods of spatial analysis can be used by module 3A.
  • the module 3A can use a spatial analysis method based on the evaluation of correlations and level differences between the channels of the audio signal S.
  • the module 3A can use a spatial analysis method based on the determination of a Gerzon vector representative of the input audio signal S, as described in the document US 2007/0269063 .
  • the Gerzon vector of a multichannel audio signal indeed in a known manner reflects the spatial location of the multichannel audio signal as it is perceived by the listener from a determined position.
  • the module 3A can implement a spatial decomposition of the multichannel signal into spherical harmonics, as described in the document WO 2012/025580 .
  • This decomposition allows a very precise spatial analysis of the multichannel audio signal and the sound objects composing it. Thus, in particular, several sound objects can be identified for the same frequency sub-band.
  • two types of processing are also applied by the generation device 3 to the input audio signal S to generate the signals intended to supply the two sets E1 and E2 of loudspeakers.
  • processing operations are applied independently for each set of loudspeakers, via two separate signal processing chains comprising for one the module 3B1 and the module 3C1, and for the other the module 3B2 and the module 3C2. These two chains of treatment preferably operate simultaneously.
  • the module 3B1 first applies to the input signal S, the delay T1 and the gain G1 mentioned previously (step E30).
  • This delay T1 and this gain G1 were chosen and supplied to the module 3B1 during a preliminary configuration or calibration step (step E_CALIB) described later.
  • the signal S1 resulting from the application of the delay T1 and the gain G1 on the signal S is then supplied by the module 3B1 to the module 3C1.
  • the module 3C1 applies the sound spatialization technique T1 to the signal S1, and thus generates the plurality of signals S1-1, S1-2, ..., S1-P (step E40).
  • the T1 technique is for example a holophonic technique of the wavefront synthesis type, also known as the WFS technique (Wave Field Synthesis in English), as described in the document. EP 2 206 365 or in the document of E. Corteel cited above.
  • WFS Wide Field Synthesis in English
  • the POS positions (OBJ) of the sound objects identified and supplied by the module 3A and on the other hand, the position of the speakers HP1-1, HP1-2, ..., HP1-P of the E1 set, to create virtual sources from the speakers HP1-1, HP1-2, ..., HP1-P of the E1 set at the POS (OBJ) positions.
  • the position of the speakers HP1-1, HP1-2, ..., HP1-P of the assembly E1 can be determined by the generation device 3 itself, automatically or semi-automatically, using for example a position tracking device as described above.
  • the signals S1-1, S1-2, ..., S1-P generated by the 3C1 module are then supplied to the speakers HP1-1, HP1-2, ..., HP1-P of the set E1 (step E50) to be returned.
  • the module 3B2 applies to the input signal S, the delay T2 and the gain G2 mentioned previously (step E60), determined and supplied to the module 3B2 during the configuration step E_CALIB also.
  • the same gain G2 and the same delay T2 are applied here to all the channels of the input signal SIG.
  • the signal S2 resulting from this operation is supplied by the module 3B2 to the module 3C2.
  • the latter applies to signal S2 the sound spatialization technique T2, and thus generates the plurality of signals S2-1, S2-2, ..., S2-N (step E70).
  • the T2 technique is for example also a holophonic technique of the WFS type as described in the document.
  • EP 2 206 365 It takes into account on the one hand, the positions POS (OBJ) of the sound objects identified and supplied by the module 3A, and on the other hand, the position of the speakers HP2-1, HP2-2, ..., HP2-N of the E2 assembly, to create virtual sources from the speakers HP2-1, HP2-2, ..., HP2-N of the E2 assembly at the POS (OBJ) positions.
  • POS POS
  • modules 3C1 and 3C2 apply distinct sound spatialization techniques T1 and T2 to the signals S1 and S2 to generate the signals intended to supply the two sets E1 and E2 of loudspeakers.
  • the position of the speakers HP2-1, HP2-2, ..., HP2-N of the assembly E2 has, in the first embodiment described here, been supplied to the generation device 3 also during the step E_CALIB preliminary configuration, by the installer of the restitution unit 1 via the aforementioned user interface.
  • the signals S2-1, S2-2, ..., S2-N generated by the 3C2 module are supplied to the speakers HP2-1, HP2-2, ..., HP2-N of the set E2 (step E80), to be returned.
  • the delays and gains (T1, G1) and (T2, G2), applied to the input audio signal S by the modules 3B1 and 3B2 to generate the signals S1-1, S1-2 respectively, ..., S1-P and S2-1, S2-2, ..., S2-N, were chosen during the preliminary configuration step E_CALIB, so as to guarantee that the combination, at a position of Pref reference (E1, E2) defined for the sets of speakers E1 and E2, signals reproduced by the first set E1 of the speakers powered by the signals S1-1, S1-2, ..., S1-P , and signals reproduced by the second set E2 of loudspeakers supplied by signals S2-1, S2-2, ..., S2-N, checks a determined sound restitution effect (in other words, desired, chosen).
  • spatial position is meant here both a point in space characterizing the position of a target listener in the room, as well as a larger area of space in which is (are) susceptible (s) find one or more listeners.
  • Pref reference position (E1, E2) naturally depends on several criteria, such as in particular the depth of the room in which the audio signal S is reproduced. It is preferably chosen around the middle of the room, slightly offset towards the stage.
  • the figure 3 illustrates an example of the choice of the reference position Pref (E1, E2) for room R.
  • the delays and gains applied to the input signal depend on the sound reproduction effect that one wishes to obtain at the reference position Pref (E1, E2) for the combination of the signals reproduced by the first set. E1 and by the second set E2.
  • the desired sound reproduction effect may be the arrival in phase coherence, at the spatial reference position Pref (E1, E2), of the signals reproduced by the first set E1 and of the signals restored by the second set E2.
  • This phase coherence is ensured when the signals reproduced by the first set E1 and the signals restored by the second set E2 arrive simultaneously at the reference position Pref (E1, E2) with a similar sound level.
  • the figure 6 represents the variations in the propagation time of the signals broadcast by omnidirectional loudspeakers (the propagation time being independent of the vertical directivity of the loudspeakers), as a function of the distance to the scene, for a set of loudspeakers positioned at stage level (solid line curve) and 6.0 m above the stage (dashed line curve).
  • This figure illustrates the natural Haas effect, described above, which benefits the system 2 of restitution near the scene (offset of the propagation times near the scene).
  • G1 and G2 gains are chosen so as to guarantee a sufficient sound level at the back of the room, while optimizing the vertical location of the sound objects returned to the reference position.
  • the delays and gains (T1, G1) and (T2, G2) making it possible to obtain such a desired sound reproduction effect at the reference position Pref (E1, E2) are chosen (ie set) at during the E_CALIB configuration step.
  • This choice or adjustment can be carried out manually (for example experimentally, using physical sound level measurements) or automatically via digital simulations.
  • this second adjustment phase can be carried out by simulation.
  • the step E_CALIB can also include an ultimate phase of more precise adjustment of the delays and gains determined during the second phase, using known signals, via new physical measurements and / or by digital simulation.
  • the adjustment of the delays and of the gains can be carried out either globally, or independently on each frequency band of a set of predefined frequency bands. In this case, a gain and a delay are determined per frequency band studied. This advantageously makes it possible to take into account the frequency dependence of the directivity of the loudspeakers of the second set E2.
  • the figure 7 illustrates various advantages provided by the restitution unit 1, in terms of variations in the sound level as a function of the distance of the listener from the scene.
  • the speakers of the E2 assembly are vertically directional speakers with a vertical opening of 90 °.
  • the figure 7 shows that thanks to the use of directional loudspeakers for the E2 set, the sound level of the signal reproduced by the E2 set perceived near the stage is less important (cf. curve in dashed lines).
  • the difference in sound levels between the signals reproduced by the E1 assembly (represented by the curve in solid line) and the signals reproduced by the E2 assembly is almost constant for distances to the stage greater than 8 m (setting coherence of the sound levels reached by the invention), so that it is possible by an appropriate choice of the delays T1 and T2 to benefit from a Haas effect up to the back of the room.
  • the restitution unit 1 comprises two sets of loudspeakers E1 and E2.
  • the restitution unit 1 further comprises another set of speakers of the subwoofer type or “subwoofers”, to add an additional effect during the sound restitution of the input audio signal.
  • the delay and / or gain thus applied are chosen so that the combination of the signals reproduced by the set of loudspeakers of subwoofer type and the signals reproduced by one of the sets E1 and E2 verifies a restitution effect. sound determined at a reference spatial position defined for this set and for the set of subwoofer type speakers.
  • the number P of speakers of the set E1 is greater than or equal to the number N of speakers of the set E2.
  • the modules 3C1 and 3C2 use WFS type sound spatialization techniques T1 and T2 allowing the creation of virtual sources at the positions of the sound objects of the signal S identified by the module 3A. These positions are provided in Example 1 to module 3A via a graphical user interface.
  • the modules 3B1 and 3B2 are configured so as to apply a non-zero delay to the signal S and to attenuate it (gains G1, G2 less than 1).
  • Gains and delays (T1, G1) and (T2, G2) applied respectively by the modules 3B1 and 3B2 are chosen so that the signals restored by the sets E1 and E2 at the reference position Pref (E1, E2) arrive with a similar sound level (more or less 3 decibels), and simultaneously or almost simultaneously (with a tolerance of more or less 5 ms).
  • the number P of speakers of the set E1 and the spacing between them depends on the width of the stage, and on the distance separating the speakers of the first set E1 from the speakers of the second set E2: P varies typically between 4 and 30 speakers, spaced 50 cm to 3 m apart.
  • the module 3C1 uses a sound spatialization technique T1 of the WFS type allowing the creation of virtual sources at the positions of the sources identified in the signal S by the module 3A. These positions are supplied in example 2 to module 3A via a mixer operating on signal S.
  • the module 3C2 uses a sound spatialization technique T2 of the dynamic matrix mixing type taking the form of a stereophonic panoramic of intensity as a function of the position of the sound objects of the signal S identified by the module 3A.
  • the modules 3B1 and 3B2 are configured so as to apply a non-zero delay to the signal S and to attenuate it (gains G1, G2 less than 1).
  • the gains and delays (T1, G1) and (T2, G2) applied respectively by the modules 3B1 and 3B2 are chosen so that the signals restored by the sets E1 and E2 at the reference position Pref (E1, E2) arrive with a similar sound level (within plus or minus 3 decibels), and simultaneously or almost simultaneously (with a tolerance of plus or minus 5 ms).
  • the restitution set 1 further comprises in this example a set designated by Elow of L speakers HPlow-1, ..., HPlow-L low-frequency (subwoofers) arranged on or below the scene SCENE.
  • the number P of speakers of the set E1 and the spacing between them depends on the width of the stage, and on the distance separating the speakers of the first set E1 from the speakers of the second set E2: P varies typically between 4 and 30 speakers, spaced 50 cm to 3 m apart.
  • the 3C1 module uses a WFS type sound spatialization technique T1 allowing the creation of virtual sources at the positions of the sound objects identified in the signal S by the module 3A.
  • the 3C2 module uses a T2 sound spatialization technique of the WFS type also allowing the creation of virtual sources at the positions of objects sound identified in signal S by module 3A.
  • the T2 technique is for example a WFS technique as described in the document by E. Corteel cited above, so as to compensate for the horizontal directivity characteristics of the line array speakers of the E2 assembly.
  • the positions of the sound objects of the signal S are identified directly here by the module 3A by means of a device for monitoring the positions of the sound objects present on the SCENE scene (eg instruments or characters, etc.).
  • the generation device 3 further comprises a 3Blow module capable of applying gain and delay to the input audio signal S, and a 3Clow module capable of applying low-pass filtering to the signal from the 3Blow module for generate signals intended to supply the speakers of the Elow assembly.
  • the modules 3B1, 3B2 and 3Blow are configured so as to apply a non-zero delay to the signal S and to attenuate it (gains less than 1).
  • the gains and delays (T1, G1) and (T2, G2) applied respectively by the modules 3B1 and 3B2 are chosen so that the signals reproduced by the set E2 arrive with an offset of 10 or 20 ms compared to the signals restored by the E1 assembly at the Pref reference position (E1, E2), with a similar sound level (within plus or minus 3 decibels), so as to benefit from the Haas effect described in the document by Blauert et al. cited above.
  • the delay and gain applied by the 3Blow module are chosen so that the signals reproduced by the Elow and E1 sets at a spatial reference position Pref (E1ow, E1) defined for the Elow and E1 sets (similarly to the position Pref (E1, E2)) arrive with a similar sound level (within plus or minus 3 decibels) in their respective frequency bands, and simultaneously or almost simultaneously (with a tolerance of plus or minus 5 ms).
  • figure 8 represents, in its environment, a set 1 'of sound reproduction, according to the invention, in this second embodiment.
  • the 2 'sound reproduction system differs from the sound reproduction system 2 illustrated in figures 2 and 3 in that it further comprises a third set E3 of K loudspeakers, denoted HP3-1, HP3-2, ..., HP3-K, K being a positive integer greater than 1.
  • the speakers HP3-1, HP3-2, ..., HP3-K are positioned at a height h3 greater than the reference height h1, in a vertical plane located closer to the back of the room than the vertical plane in which the speakers of the E2 assembly are positioned.
  • the loudspeakers of the E3 assembly can be chosen omnidirectional, if the E3 assembly is intended to compensate for the presence of masking elements such as balconies for example, or on the contrary they can be chosen to be more directional on average vertically than the speakers of set E1, and be oriented, similar to the speakers of set E2 towards the back of the room.
  • the number K of loudspeakers in the third set E3 can be equal to or distinct from the numbers P and N of loudspeakers in the sets E1 and E2.
  • the various loudspeakers of the set E3 are supplied by multichannel audio signals, denoted respectively S3-1, S3-2, ..., S3-K generated by the device 3 'for generation from the audio signal of entrance S.
  • the generation device 3 ′ has here the hardware architecture of a computer, similar to that of the generation device 3 described previously with reference to the figure 4 .
  • the communication means of the generation device 3 ′ differ from the communication means of the generation device 3 in that they further comprise an interface (wired or wireless) with the loudspeakers HP3-1, HP3-2 , ..., HP3-K of the E3 assembly.
  • the ROM of the 3 ′ generation device constitutes a recording medium in accordance with the invention, readable by the (micro) processor of the device 3 ′ and on which a computer program in accordance with the invention is recorded, comprising instructions for carrying out the steps of a generation process described now with reference to the figure 10 .
  • the figure 10 illustrates the main steps of a generation method according to the invention, as implemented, in the second embodiment, by the device 3 'for generating on reception of the input audio signal S, to generate and supply the signals S1-1, S1-2, ..., S1-P, S2-1, S2-2, ..., S2-N and S3-1, S3-2, ..., S3- K to sets E1, E2 and E3 of speakers respectively.
  • step E10 the generation device 3 'receives the multi-channel input audio signal S via its communication means.
  • the generation device 3 is supplied, via a suitable interface, the positions designated by POS (OBJ) of the sound objects OBJ included in the signal S and which one wishes to restore (step E20).
  • different processing operations are applied by the device 3 'for generating the signal S to generate the signals intended to supply the three sets E1, E2 and E3 of loudspeakers.
  • modules 3B1, 3C1, 3B2 and 3C2 proceed in a similar manner to the first embodiment to generate the signals S1-1, S1-2, ..., S1-P intended to supply the assembly E1 and the signals S2-1, S2-2, ..., S2-N intended to supply the E2 assembly (steps E30 to E80 illustrated in the figure 5 ).
  • the module 3B3 applies to the signal S the delay T3 and the gain G3 mentioned previously (step E90), thus generating a signal S3.
  • This delay T3 and this gain G3 were determined and supplied to the module 3B3 during a preliminary configuration step E_CALIB 'described later.
  • the module 3C3 then applies to the signal S3 supplied at the output of the module, the sound spatialization technique T3 (step E100), thus generating the plurality of signals S3-1, S3-2, ..., S3-K.
  • the T3 technique is for example a holophonic technique of the WFS type as described in the document. EP 2 206 365 . It takes into account on the one hand, the POS positions (OBJ) of the sound objects identified and supplied by the module 3A, and on the other hand, the position of the speakers HP3-1, HP3-2, ..., HP3-K of the E3 assembly, to create virtual sources from the speakers HP3-1, HP3-2, ..., HP3-K of the E3 assembly at the POS (OBJ) positions.
  • OBJ POS positions
  • the signals S3-1, S3-2, ..., S3-K generated by the 3C3 module are supplied to the speakers HP3-1, HP3-2, ..., HP3-K of the set E3 (step E110), to be returned.
  • the preliminary configuration step E_CALIB takes place in two stages, during which the sets E1 and E2 are considered respectively on the one hand, and the sets E2 and E3 on the other hand.
  • the final adjustment phase can on the other hand take into account the signals restored by the three sets in order to be more precise in the estimation of the delays T1, T2 and T3 and of the gains G1, G2, and G3.
  • step E_CALIB the delays and gains can be adjusted either globally or independently on each frequency band of a set of predefined frequency bands. In this case, a gain and a delay are determined per frequency band studied. This advantageously makes it possible to take into account the frequency dependence of the directivity of the loudspeakers of the second set E2 and, where appropriate, of the third set E3.
  • the restitution assembly 1 ′ comprises three sets E1, E2 and E3, two of which play the role of set of reminder loudspeakers for room R.
  • the invention is not limited to two sets of booster speakers, and it is possible, within the framework of the invention, to add other sets E4, E5, ... of speakers call back in the room.
  • the delays and / or gains applied by the 3 ′ generation device to generate the signals intended to supply these assemblies will be chosen in a similar manner to the delay and the gain applied by the 3B3 module, that is to say, considering loudspeaker sets of the playback system two by two (eg E1 with E2, then E2 with E3, then E3 with E4, etc.).
  • the K speakers HP3-1, ..., HP3-K of the set E3 are also on average more vertically directive than the speakers HP1-1, ..., HP1 -P of the set E1. They have a vertical opening varying from 60 ° to 90 °, and are also oriented towards the back of the room (part of the audience furthest from the stage).
  • the modules 3C1, 3C2 and 3C3 use WFS type sound spatialization techniques T1, T2 and T3 allowing the creation of virtual sources at the positions of the objects identified in the signal S by the module 3A. These positions are provided in Example 4 to module 3A via a graphical user interface.
  • the modules 3B1, 3B2 and 3B3 are configured so as to apply a non-zero delay to the signal S and to attenuate it (gains G1, G2 and G3 less than 1).
  • the gains and delays (T1, G1) and (T2, G2) applied respectively by the modules 3B1 and 3B2 are chosen so that the signals restored by the sets E1 and E2 at the reference position Pref (E1, E2) arrive with a similar sound level (within plus or minus 3 decibels), and simultaneously or almost simultaneously (with a tolerance of plus or minus 5 ms).
  • the delay and gain (T3, G3) applied by the 3B3 module are chosen so that the signals reproduced by the E2 and E3 assemblies at the Pref reference position (E2, E3) arrive with a similar sound level (at plus or minus minus 3 decibels) in their respective frequency bands, and simultaneously or almost simultaneously (with a tolerance of plus or minus 5 ms).
  • the Pref position (E2, E3) is chosen further from the SCENE scene than the Pref position (E1, E2), towards the back of the room.
  • the application of the gain / delay and the application of the sound spatialization technique on the input audio signal are implemented in separate steps by separate modules.
  • these two treatments can be carried out simultaneously by the same module (i.e. by the modules 3C1, 3C2 and if necessary 3C3 respectively), during the application of the sound spatialization technique.

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Stereophonic System (AREA)
  • Circuit For Audible Band Transducer (AREA)

Description

    Arrière-plan de l'invention
  • L'invention se rapporte au domaine général des traitements acoustiques.
  • Elle concerne plus particulièrement une technique de renforcement sonore.
  • De façon connue, les techniques de renforcement sonore sont couramment utilisées pour la sonorisation de salles étendues, telles que par exemple une salle de concert ou un auditorium, afin d'obtenir un signal restitué uniforme en niveau sonore sur l'ensemble de la salle.
  • Ces techniques doivent vérifier une double contrainte, à savoir assurer un niveau sonore suffisamment important pour les auditeurs situés au fond de la salle sans pour autant augmenter outre mesure ce niveau sonore, afin de limiter notamment la gêne des auditeurs situés à proximité de la scène ou des enceintes.
  • A cet effet, des systèmes connus de renforcement sonore s'appuient sur des systèmes de diffusion sonore Public Address (P.A.) permettant d'émettre vers des auditeurs placés au fond de la salle à distance de la scène, éventuellement combinés à des lignes de haut-parleurs de renfort ou de rappel (« front fill » en anglais) de faible puissance placées au bord de la scène et destinées aux auditeurs situés devant et dans l'axe de la scène.
  • Ces systèmes souffrent toutefois de divers inconvénients.
  • Ainsi, notamment, le placement des haut-parleurs sur la scène peut s'avérer problématique, en vue de respecter certaines contraintes pratiques et esthétiques (encombrement limité de la scène, rendu visuel pour l'auditeur, etc.).
  • Par ailleurs, ces systèmes n'offrent généralement pas la possibilité d'avoir une restitution sonore spatialisée des signaux dans la salle.
  • Il existe également dans l'état de la technique, des systèmes de renforcement sonore qui s'appuient sur des techniques holophoniques dites de synthèse de front d'ondes ou Wave Field Synthesis (WFS) en anglais, et offrent une restitution sonore spatialisée des signaux dans la salle.
  • Ces systèmes utilisent des lignes horizontales de haut-parleurs omnidirectionnels, placées sur la scène, qui permettent de restituer les objets sonores des signaux à diverses positions précises dans la salle (i.e. bonne localisation horizontale des objets sonores), de sorte à créer chez les auditeurs une perception d'enveloppement dans la scène sonore, ainsi qu'une cohérence entre les informations visuelles et auditives perçues par ces auditeurs, et une meilleure intelligibilité des objets sonores.
  • Un tel système est présenté par exemple dans le document EP2206365 ainsi que dans le document "Practical 3 dimensional sound reproduction using Wave Field Synthesis, theory and perceptual validation", ETIENNE CORTEEL, PROCEEDINGS OF THE ACOUSTICS 2012, 23 avril 2012 (2012-04-23), pages 901-906, XP055067658.
  • Cependant, si l'utilisation de tels systèmes pour le renforcement sonore permet une bonne localisation à la fois horizontale et verticale des objets sonores des signaux, elle se heurte toutefois à certaines limites.
  • En effet, l'atténuation du niveau sonore des signaux restitués en fonction de la distance à la scène est relativement rapide et nécessite donc une augmentation substantielle du niveau sonore restitué par la ligne de haut-parleurs, ce qui peut occasionner une gêne pour les auditeurs proches de la scène.
  • A titre d'exemple, la figure 1A illustre en trait plein les variations du niveau sonore exprimé en décibel, d'un signal restitué en utilisant une technique de type WFS par un ensemble de 16 haut-parleurs omnidirectionnels positionnés sur une scène, ces haut-parleurs ayant une sensibilité de 92 dB et étant alimentés par des amplificateurs de 250 W (watts).
  • En outre, un tel système requiert généralement l'utilisation d'un nombre important de haut-parleurs, ce qui peut s'avérer problématique pour des raisons pratiques et esthétiques, comme mentionné précédemment.
  • Une solution pour pallier en partie à ces inconvénients consiste à placer les lignes horizontales de haut-parleurs omnidirectionnels au-dessus de la scène.
  • Comme illustré en traits interrompus à la figure 1A pour une ligne de haut-parleurs constituée de 9 haut-parleurs placés à une hauteur de 6m de la scène (sensibilité de 97 dB et amplificateurs de 250 W), une telle solution permet de restituer un meilleur niveau sonore pour les auditeurs situés au fond de la salle tout en limitant le niveau sonore diffusé à proximité des auditeurs situés près de la scène.
  • Toutefois cette solution présente l'inconvénient d'une mauvaise perception par l'auditeur de la localisation verticale des objets sonores du signal restitué, notamment lorsque celui-ci se trouve à proximité de la scène.
  • La figure 1B illustre à titre d'exemple (sur la base d'hypothèses similaires à celles décrites précédemment pour la figure 1A) :
    • en trait plein, l'élévation (aussi appelée site) perçue en fonction de la distance par un auditeur pour une ligne de haut-parleurs omnidirectionnels placée au niveau de la scène ; et
    • en traits interrompus, l'élévation perçue en fonction de la distance par un auditeur pour une ligne de haut-parleurs omnidirectionnels placée à une hauteur de 6m par rapport au niveau de la scène.
  • Le document "The Influence of the Directional Radiation Performance of the Individual Speaker Module, and Overall Array, on the Tonal Balance, Quality and Consistency of Sound Reinforcement Systems", Mochimaru Akira et Al., 131 st AES Convention, 20.10.2011, XP040567544, propose d'augmenter la directivité avec la hauteur de la ligne de haut-parleurs. Toutefois, la méthode décrite ne s'applique pas aux techniques de restitution holophonique.
  • Il existe donc un besoin d'une technique et d'un dispositif de renforcement sonore ne présentant pas les divers inconvénients précités.
  • Objet et résumé de l'invention
  • L'invention répond notamment à ce besoin en proposant un procédé de génération, selon la revendication 1.
  • Corrélativement, l'invention vise également un dispositif de génération selon la revendication 11.
  • Autrement dit, l'invention propose, pour optimiser la restitution du signal audio d'entrée dans une salle ou dans une pièce, d'allier deux techniques avantageuses, à savoir :
    • une technique de renforcement sonore, s'appuyant sur un système de restitution composé de deux ensembles de haut-parleurs distincts, positionnés à des hauteurs différentes et ayant des directivités verticales différentes ; et
    • une technique de spatialisation sonore utilisée pour générer, à partir du signal audio d'entrée, les signaux audio destinés à alimenter ces deux ensembles de haut-parleurs.
  • L'invention s'applique ainsi de façon privilégiée mais non limitative à la restitution de signaux audio dans une salle de grandes dimensions, telle une salle de spectacle ou un auditorium doté(e) d'une scène.
  • Préférentiellement, pour optimiser la restitution du signal audio d'entrée, le premier ensemble de haut-parleurs est placé sur ou devant la scène de la salle, tandis que le deuxième ensemble de haut-parleurs est placé au-dessus de la scène (aligné verticalement ou légèrement décalé par rapport au premier ensemble de haut-parleurs).
  • Conformément à l'invention, les haut-parleurs de l'ensemble positionné le plus haut (deuxième ensemble) sont plus directifs (en moyenne) que les haut-parleurs de l'ensemble positionné le plus bas (premier ensemble).
  • Il est donc possible d'orienter verticalement le deuxième ensemble de haut-parleurs différemment du premier ensemble, de sorte que le son restitué par ces deux ensembles de haut-parleurs couvre la salle de façon uniforme en termes de niveau sonore.
  • Plus précisément, l'invention offre la possibilité à cet effet d'orienter verticalement les haut-parleurs du deuxième ensemble vers le fond de la salle, tandis que les haut-parleurs du premier ensemble peuvent être orientés vers la partie de la salle située à proximité la scène. Ainsi il est possible de diffuser le signal audio d'entrée avec un niveau sonore uniforme, y compris à une grande distance de la scène, sans augmenter de façon trop importante ce niveau sonore.
  • Autrement dit, la directivité verticale des haut-parleurs du deuxième ensemble et son positionnement en hauteur permet de limiter le niveau sonore restitué à proximité de la scène tout en garantissant un bon niveau sonore pour les auditeurs placés dans le fond de la salle.
  • Les haut-parleurs du deuxième ensemble joue donc un rôle de haut-parleurs de rappel pour la restitution du signal audio d'entrée.
  • En outre, la présence de haut-parleurs de rappel directifs au-dessus de la scène permet avantageusement de réduire la puissance des haut-parleurs utilisés pour le premier ensemble. De ce fait, on peut utiliser pour le premier ensemble des haut-parleurs moins encombrants du fait de leur puissance réduite ou en nombre plus limité. L'invention permet de s'affranchir plus aisément des contraintes pratiques et esthétiques liées au positionnement des haut-parleurs dans la salle pour restituer les signaux.
  • Par ailleurs, la limitation du niveau sonore restitué par le deuxième ensemble de haut-parleurs à proximité de la scène autorisée par l'invention permet de favoriser la localisation verticale des objets sonores du signal au niveau du premier ensemble de haut-parleurs, en bénéficiant d'un effet connu sous le nom « d'effet Haas ».
  • Cet effet Haas, qui concerne la perception des sons par le cerveau humain, est décrit notamment dans le document de J. Blauert intitulé « Spatial Hearing - Revised Edition : The Psychophysics of Human Sound Localization », MIT Press, Rev. Sub. Edition, 2 octobre 1996.
  • Selon cet effet, la localisation d'un objet sonore est donnée par la direction d'où provient le son qui arrive en premier à l'oreille (ou premier front d'onde), et ce même si l'intensité des sons arrivant dans un deuxième temps à l'oreille en provenance d'une autre direction, est supérieure à l'intensité du premier front d'onde. On parle « d'effet de précédence ». Cet effet n'est cependant pas absolu et fonctionne d'autant mieux que le niveau sonore des fronts d'onde suivants est faible.
  • De plus, l'utilisation de deux ensembles de haut-parleurs pour restituer le signal audio d'entrée et la directivité des haut-parleurs du deuxième ensemble combinée à l'utilisation d'une technique de spatialisation sonore sont pris en compte, conformément à l'invention, via l'application de retards et/ou de gains sur le signal audio d'entrée lors de la génération des signaux destinés à alimenter les premier et deuxième ensembles de haut-parleurs.
  • Ces retards et ces gains sont appliqués de façon indépendante pour chaque ensemble de haut-parleurs, de même qu'un espace de spatialisation sonore est envisagé pour chaque ensemble de haut-parleurs séparément.
  • Toutefois, les retards et les gains appliqués conformément à l'invention sont avantageusement choisis de sorte que la combinaison des premiers signaux restitués par le premier ensemble de haut-parleurs et des seconds signaux restitués par le deuxième ensemble de haut-parleurs vérifie un effet de restitution sonore déterminé à une position spatiale de référence définie dans la salle pour les premier et second ensembles de haut-parleurs.
  • Cet effet de restitution sonore déterminé est par exemple la cohérence (de phase) des signaux restitués par les premier et deuxième ensembles de haut-parleurs à la position spatiale de référence. A cette fin, les retards appliqués lors de la génération des premiers et des seconds signaux audio sont choisis de sorte que les premiers signaux restitués par le premier ensemble de haut-parleurs et les deuxièmes signaux restitués par le deuxième ensemble de haut-parleurs arrivent simultanément à la position spatiale de référence.
  • En variante, on peut choisir d'accentuer l'effet « Haas » naturel précédemment décrit, occasionné par le positionnement en hauteur et la directivité verticale du deuxième ensemble de haut-parleurs, en appliquant lors de la génération des premiers et des seconds signaux audio, des retards choisis de sorte que les deuxièmes signaux restitués par le deuxième ensemble de haut-parleurs arrivent avec un décalage prédéterminé à la position spatiale de référence par rapport aux premiers signaux restitués par le premier ensemble.
  • Ce décalage temporel entre les signaux est alors choisi suffisamment court pour pouvoir bénéficier de l'effet Haas (c'est-à-dire typiquement inférieur à 30-35 ms, par exemple de l'ordre de 15 à 20 ms), et ne pas générer une sensation d'échos pour les auditeurs de la salle.
  • Grâce à l'effet Haas ainsi accentué, un auditeur entendra en premier lieu les signaux restitués par les haut-parleurs du premier ensemble placé à la hauteur de référence (par exemple sur scène), ce qui permet d'améliorer davantage la localisation verticale des objets sonores perçue par l'auditeur.
  • En outre, l'accentuation de l'effet Haas par le biais du choix des retards appliqués aux premiers et aux deuxièmes signaux offre la possibilité de réduire davantage la puissance des haut-parleurs du premier ensemble, et de ce fait d'utiliser des haut-parleurs moins encombrants ou en un nombre encore plus limité.
  • Les gains, dans l'une ou l'autre des variantes envisagées pour le réglage des retards, sont choisis de sorte à garantir un niveau sonore suffisant en fond de salle tout en optimisant la localisation verticale à la position de référence.
  • L'invention permet donc d'une part d'améliorer la qualité de la restitution du signal par rapport à l'état de la technique, et de répondre plus efficacement aux contraintes esthétiques et pratiques imposées lors du positionnement des haut-parleurs dans la salle.
  • Dans un mode particulier de réalisation, au moins l'une des techniques de spatialisation sonore appliquées lors de la génération des premiers et des deuxièmes signaux audio est :
    • une technique holophonique de spatialisation sonore de type WFS, telle que par exemple la technique de spatialisation sonore décrite dans le document EP 2 206 365 , ou la technique décrite dans le document de E. Corteel intitulé « Equalization in an Extended Area using Multichannel Inversion and Wave Field Synthesis », J. Audio Eng. Soc. Vol. 54, n°12, décembre 2006 : une telle technique permet avantageusement d'envelopper les auditeurs de la salle dans la scène sonore et offrent une bonne qualité de restitution du signal audio ; ou
    • une technique de mixage matriciel dynamique. Cette technique peut prendre la forme par exemple d'un panoramique stéréophonique d'intensité sur les haut-parleurs, relativement facile à mettre en oeuvre, ou en variante d'un panoramique d'intensité de type VBAP (Vector Based Amplitude Panning) ou DBAP (Distance Based Amplitude Panning) connus en soi.
  • En variante, on peut bien entendu envisager d'autres techniques de spatialisation sonore.
  • Dans un mode particulier de réalisation, le signal audio d'entrée est un signal audio multicanal et, au cours d'au moins l'une des étapes de génération, le même retard et/ou le même gain est appliqué sur chaque canal du signal audio d'entrée.
  • Ce mode de réalisation facilite la mise en oeuvre de l'invention, notamment en limitant la complexité liée au choix des gains et/ou retards à appliquer.
  • Bien que préférentiellement au cours d'au moins l'une des étapes de génération, ledit au moins un retard et/ou gain est appliqué sur le signal d'entrée avant la technique de spatialisation sonore, il est également possible d'inverser ces deux traitements.
  • Dans ce cas, et lorsque le signal audio d'entrée est un signal multicanal comprenant un nombre de canaux inférieurs au nombre de haut-parleurs du premier et/ou du deuxième ensemble, on privilégiera l'application d'un même retard et/ou d'un même gain à tous les canaux du signal audio d'entrée (autrement dit, le retard et le gain appliqué au signal audio d'entrée est indépendant du canal et de la position des objets sonores du signal audio d'entrée).
  • Par ailleurs, lorsque l'application dudit au moins un gain et/ou retard est mise en oeuvre après la technique de spatialisation sonore, l'utilisation d'un gain et/ou d'un retard indépendants des canaux du signaux (et donc identiques pour tous les canaux) permet de préserver la répartition des gains et des retards affectée entre les haut-parleurs par la technique de spatialisation sonore.
  • Il convient de noter que lorsque les techniques de spatialisation sonores appliquées lors de la génération des premiers et des deuxièmes signaux d'alimentation des haut-parleurs sont linéaires (c'est le cas par exemple de techniques de type WFS ou plus généralement de techniques basées sur l'utilisation d'un filtrage linéaire) et que les gains et/ou retards appliqués au signal d'entrée sont indépendants des canaux de ce signal d'entrée, les premiers et les seconds signaux générés en appliquant d'abord les gains et les retards puis la technique de spatialisation sonore sont équivalents aux premiers et les seconds signaux générés en appliquant d'abord la technique de spatialisation sonore puis les gains et les retards.
  • Dans un autre mode de réalisation, on peut envisager qu'au cours d'au moins l'une des étapes de génération, un retard et/ou un gain distinct est appliqué sur au moins deux canaux distincts du signal audio d'entrée.
  • Dans un mode particulier de réalisation, le système de restitution sonore comprend en outre au moins un troisième ensemble de haut-parleurs positionnés à une hauteur supérieure à la hauteur de référence, et le procédé de génération comprend une étape de génération d'une pluralité de troisièmes signaux audio destinés à alimenter le troisième ensemble de haut-parleurs en appliquant au signal audio entrée :
    • au moins un retard et/ou un gain ; et
    • une technique de spatialisation sonore tenant compte de la position identifiée dudit au moins un objet sonore du signal audio d'entrée et d'une position des haut-parleurs du troisième ensemble ;
    ledit au moins un retard et/ou un gain étant choisi de sorte qu'une combinaison des troisièmes signaux restitués par le troisième ensemble de haut-parleurs et des signaux restitués par l'un des autres ensembles de haut-parleurs du système de restitution vérifie un effet de restitution sonore déterminé à une position spatiale de référence définie pour cet autre ensemble et pour le troisième ensemble de haut-parleurs.
  • Ce mode de réalisation propose d'ajouter un ensemble de haut-parleurs de rappel supplémentaire pour améliorer le renforcement sonore de la salle.
  • Un tel mode de réalisation peut s'avérer très pertinent pour des salles de très grandes dimensions ou disposant d'éléments masquant acoustiquement les signaux restitués par les haut-parleurs (ex. présence de balcons dans une salle de concert).
  • On notera que l'invention ne se limite pas à un système comprenant trois ensembles de haut-parleurs mais on peut également ajouter un quatrième, un cinquième, etc., ensemble de haut-parleurs, le choix des retards et/ou des gains appliqués lors de la génération des signaux destinés à alimenter ces ensembles de haut-parleurs étant préférentiellement effectué en considérant les ensembles de haut-parleurs deux à deux (ex. deuxième et troisième ensembles, troisième et quatrième ensembles, etc.).
  • Dans un autre mode de réalisation, on peut envisager d'ajouter également au système de restitution un autre ensemble de haut-parleurs de type caissons de grave (ou « subwoofers » en anglais), pour ajouter un effet supplémentaire lors de la restitution sonore du signal audio d'entrée. De façon similaire, dans ce mode de réalisation, le procédé de génération comprend une étape de génération d'une pluralité de signaux audio destinés à alimenter l'ensemble de haut-parleurs de type caissons de grave en appliquant au signal audio entrée :
    • au moins un retard et/ou un gain ; et
    • un filtrage de type passe-bas ;
    ledit au moins un retard et/ou un gain étant choisi de sorte que la combinaison des signaux restitués par l'ensemble de haut-parleurs de type caissons de grave et des signaux restitués par l'un des autres ensembles de haut-parleurs du système de restitution vérifie un effet de restitution sonore déterminé à une position spatiale de référence définie pour cet autre ensemble et pour l'ensemble de haut-parleurs de type caissons de grave.
  • Dans un mode particulier de réalisation, les différentes étapes du procédé de génération selon l'invention sont déterminées par des instructions de programmes d'ordinateurs.
  • En conséquence, l'invention vise aussi un programme sur un support d'informations, ce programme étant susceptible d'être mis en oeuvre dans un dispositif de génération ou plus généralement dans un ordinateur, ce programme comportant des instructions adaptées à la mise en oeuvre des étapes d'un procédé de génération tel que décrit ci-dessus.
  • Ce programme peut utiliser n'importe quel langage de programmation, et être sous la forme de code source, code objet, ou de code intermédiaire entre code source et code objet, tel que dans une forme partiellement compilée, ou dans n'importe quelle autre forme souhaitable.
  • L'invention vise aussi un support d'informations lisible par un ordinateur ou par un microprocesseur, et comportant des instructions d'un programme tel que mentionné ci-dessus.
  • Le support d'informations peut être n'importe quelle entité ou dispositif capable de stocker le programme. Par exemple, le support peut comporter un moyen de stockage, tel qu'une ROM, par exemple un CD ROM ou une ROM de circuit microélectronique, ou encore un moyen d'enregistrement magnétique, par exemple une disquette (floppy disc) ou un disque dur.
  • D'autre part, le support d'informations peut être un support transmissible tel qu'un signal électrique ou optique, qui peut être acheminé via un câble électrique ou optique, par radio ou par d'autres moyens. Le programme selon l'invention peut être en particulier téléchargé sur un réseau de type Internet.
  • Alternativement, le support d'informations peut être un circuit intégré dans lequel le programme est incorporé, le circuit étant adapté pour exécuter ou pour être utilisé dans l'exécution du procédé en question.
  • L'invention vise également un ensemble de restitution d'un signal audio d'entrée comprenant :
    • un système de restitution sonore comprenant un premier ensemble de haut-parleurs positionnés à une hauteur de référence, et un deuxième ensemble de haut-parleurs positionnés à une hauteur supérieure à la hauteur de référence, les haut-parleurs du deuxième ensemble étant plus directifs verticalement que les haut-parleurs du premier ensemble ; et
    • un dispositif de génération de signaux audio selon l'invention pour alimenter les haut-parleurs du premier ensemble et les haut-parleurs du deuxième ensemble du système de restitution sonore.
  • L'ensemble de restitution bénéficie des mêmes avantages que ceux cités précédemment pour le dispositif et le procédé de génération.
  • On peut également envisager, dans d'autres modes de réalisation, que le procédé de génération, le dispositif de génération et l'ensemble de restitution selon l'invention présentent en combinaison tout ou partie des caractéristiques précitées.
  • Brève description des dessins
  • D'autres caractéristiques et avantages de la présente invention ressortiront de la description faite ci-dessous, en référence aux dessins annexés qui en illustrent des exemples de réalisation dépourvus de tout caractère limitatif. Sur les figures :
    • les figures 1A et 1B, déjà décrites, illustrent respectivement des inconvénients des systèmes de renforcement sonore de l'état de la technique ;
    • la figure 2 représente, de façon schématique, un ensemble de restitution et un dispositif de génération conformes à l'invention, dans un premier mode de réalisation ;
    • la figure 3 illustre un exemple de positionnement des deux ensembles de haut-parleurs de l'ensemble de restitution de la figure 2 dans une salle ;
    • la figure 4 illustre, de façon schématique, l'architecture matérielle du dispositif de génération de la figure 2, dans le premier mode de réalisation ;
    • la figure 5 représente, sous forme d'ordinogramme, les principales étapes d'un procédé de génération selon l'invention telles qu'elles sont mises en oeuvre dans le premier mode de réalisation, par le dispositif de génération de la figure 2 ;
    • la figure 6 représente les variations du temps de propagation des signaux émis par des haut-parleurs omnidirectionnels situés sur et au-dessus de la scène, en fonction de la distance d'un auditeur par rapport à la scène ;
    • la figure 7 illustre divers avantages procurés par l'invention, en termes de variations du niveau sonore des signaux en fonction de la distance d'un auditeur par rapport à la scène ;
    • la figure 8 représente, de façon schématique, un ensemble de restitution et un dispositif de génération conformes à l'invention, dans un second mode de réalisation ;
    • la figure 9 illustre un exemple de positionnement des trois ensembles de haut-parleurs de l'ensemble de restitution de la figure 8 dans une salle ; et
    • la figure 10 représente, sous forme d'ordinogramme, les principales étapes d'un procédé de génération selon l'invention telles qu'elles sont mises en oeuvre dans le second mode de réalisation, par le dispositif de génération de la figure 8.
    Description détaillée de l'invention
  • La figure 2 représente, dans son environnement, un ensemble 1 de restitution sonore d'un signal audio d'entrée S, conforme à l'invention, dans un premier mode de réalisation.
  • Dans l'exemple envisagé ici, on suppose à titre illustratif que le signal audio S est un signal multicanal résultant d'une capture (i.e. d'un enregistrement) sonore d'un signal joué sur une scène SCENE d'une salle de spectacle R, réalisée par des microphones placés sur la scène SCENE ou répartis à divers endroits de cette salle, de façon connue en soi.
  • Cette hypothèse n'est cependant pas limitative, le signal audio S pouvant être en variante un signal audio préenregistré ou comportant des éléments préenregistrés.
  • On suppose par ailleurs que le signal audio S est destiné à être restitué dans la salle de spectacle en utilisant l'ensemble 1 de restitution sonore conforme à l'invention.
  • Aucune limitation n'est attachée à proprement parler au format du signal S : ainsi, il peut s'agir aussi bien d'un signal composé de prises individuelles (ex. pour une salle de spectacle, provenant d'un microphone par musicien, chanteur ou acteur pour une prise de son en direct), d'un signal stéréo, que d'un signal au format 5.1, 7.1, ou 10.2, ou encore d'un signal dans un format HOA (Higher Order Ambisonics), etc., ou enfin d'une combinaison de ces techniques.
  • Conformément à l'invention, l'ensemble 1 de restitution sonore utilisé pour la restitution du signal audio S comprend :
    • un système 2 de restitution sonore comprenant une pluralité de haut-parleurs ; et
    • un dispositif 3 de génération de signaux audio destinés à alimenter les haut-parleurs du système 2 de restitution sonore.
  • Plus précisément, dans le premier mode de réalisation illustré à la figure 2, le système 2 de restitution sonore comprend :
    • un premier ensemble E1 de P haut-parleurs, notés HP1-1, HP1-2, ..., HP1-P, P étant un entier positif supérieur à 1 ; et
    • un deuxième ensemble E2 de N haut-parleurs, notés HP2-1, HP2-2, ..., HP2-N, N étant un entier positif supérieur à 1.
  • Les nombres entiers P et N peuvent être égaux ou distincts.
  • Comme illustré à la figure 3 , les haut-parleurs HP1-1, HP1-2, ..., HP1-P du premier ensemble E1 sont positionnés à une hauteur h1 dite de référence.
  • Plus précisément, dans l'exemple de la figure 2, les haut-parleurs HP1-1, HP1-2, ..., HP1-P du premier ensemble E1 sont arrangés de sorte à former une ligne horizontale de haut-parleurs positionnés sur la scène SCENE de la salle de spectacle R. La hauteur de référence h1 correspondant donc ici à la hauteur de la scène SCENE.
  • Conformément à l'invention, les haut-parleurs HP2-1, HP2-2, ..., HP2-N du deuxième ensemble E2 sont positionnés à une hauteur h2 supérieure à la position de référence h1. Dans l'exemple de la figure 2, ils sont arrangés de sorte à former une ligne horizontale de haut-parleurs positionnée à la hauteur h2.
  • Il convient de noter que les haut-parleurs du deuxième ensemble E2 ne sont pas nécessairement alignés verticalement avec (i.e. dans le même plan vertical que) les haut-parleurs du premier ensemble E1, par rapport à la scène SCENE. Ils peuvent être notamment décalés par rapport aux haut-parleurs du premier ensemble E1 en direction de la partie AUDIT de la salle de spectacle R où se trouve l'auditoire.
  • Par ailleurs, aucune limitation n'est attachée à proprement parler à l'arrangement des haut-parleurs au sein du premier ensemble E1 et du deuxième ensemble E2. L'invention s'applique ainsi également à d'autres configurations de haut-parleurs, telles que par exemple à des matrices de haut-parleurs, ou à des configurations distinctes d'une configuration linéaire, comme par exemple à une configuration adaptée à la forme de la scène (ex. en arc de cercle).
  • De même, le positionnement des haut-parleurs de chaque ensemble, les uns par rapport aux autres, peut être divers et varié : on pourra ainsi envisager des haut-parleurs répartis uniformément au sein de l'ensemble de haut-parleurs, ou répartis selon plusieurs groupes placés aux extrémités et au centre optique de la scène, etc.
  • Plusieurs exemples d'arrangement de haut-parleurs seront décrits ultérieurement pour illustrer l'invention.
  • On notera que l'invention offre avantageusement la possibilité d'avoir un nombre N de haut-parleurs du deuxième ensemble E2 plus petit que le nombre P de haut-parleurs du premier ensemble E1.
  • En effet, de façon connue en soi, l'utilisation d'ensembles de haut-parleurs de taille finie induit un phénomène de repliement (« aliasing » en anglais) de spectre spatial. Ce phénomène se produit à partir d'une fréquence de repliement ou fréquence « d'aliasing » qui, comme mentionné dans le document EP 2 206 365 , augmente en fonction de la distance de l'auditeur par rapport à la scène.
  • Le nombre de haut-parleurs nécessaires pour chaque ensemble de haut-parleurs peut donc être déterminé en fixant la fréquence d'aliasing désirée et la position d'un auditeur de référence dans la salle par rapport à la scène. Les haut-parleurs du deuxième ensemble E2 étant plus éloignés de l'auditeur de référence que les haut-parleurs du premier ensemble E1, du fait de leur positionnement en hauteur, il est possible par ce biais de fixer un nombre plus limité de haut-parleurs pour l'ensemble E2 que pour l'ensemble E1.
  • Conformément à l'invention, les haut-parleurs HP2-1, HP2-2, ..., HP2-N du deuxième ensemble E2 sont plus directifs verticalement que les haut-parleurs HP1-1, HP1-2, ..., HP1-N du premier ensemble E1.
  • Au sens de l'invention, on entend par « les haut-parleurs HP2-1, HP2-2, ..., HP2-N du deuxième ensemble E2 sont plus directifs verticalement que les haut-parleurs HP1-1, HP1-2, ..., HP1-N du premier ensemble E1 » que la directivité moyenne des haut-parleurs du deuxième ensemble est plus grande que la directivité moyenne des haut-parleurs du premier ensemble.
  • Ainsi, à titre illustratif, on peut utiliser pour le premier ensemble E1 des haut-parleurs omnidirectionnels, tandis que les haut-parleurs du deuxième ensemble E2 sont choisis avec une ouverture verticale comprise entre 10° et 60°.
  • Comme mentionné précédemment, les haut-parleurs HP2-1, HP2-2, ..., HP2-N du deuxième ensemble E2 sont essentiellement destinés à assurer la couverture sonore de la partie de la salle de spectacle, ou tout du moins de l'auditoire, la plus éloignée de la scène. A cette fin, ils sont orientés verticalement vers l'extrémité EXT de l'auditoire (qui correspond sur la figure 3 au fond de la salle de spectacle par souci de simplification).
  • Au contraire, les haut-parleurs HP1-1, HP1-2, ..., HP1-P du premier ensemble E1 sont essentiellement destinés à assurer la couverture sonore de la partie de la salle de spectacle, ou tout du moins de l'auditoire, placée à proximité de la scène. A cette fin, ils sont donc montés sur la scène ou juste devant la scène.
  • Ils peuvent être indifféremment omnidirectionnels ou directifs verticalement. Lorsque les haut-parleurs du premier ensemble E1 sont directifs verticalement, ils sont orientés vers l'avant de la partie AUDIT de la salle, c'est-à-dire, vers la partie située à proximité de la scène.
  • Les différents haut-parleurs des ensembles E1 et E2 sont alimentés par des signaux audio multicanaux, notés respectivement S1-1, S1-2,..., S1-P et S2-1, S2-2, ..., S2-N, générés conformément à l'invention par le dispositif 3 de génération à partir du signal audio d'entrée S.
  • Pour générer ces signaux, dans le premier mode de réalisation décrit ici, le dispositif 3 de génération s'appuie sur différents modules logiciels, à savoir :
    • un module 3A, apte à identifier les positions des différents objets OBJ (ou sources) sonores compris dans le signal d'entrée S ;
    • des modules 3B1 et 3B2 aptes à appliquer indépendamment sur le signal d'entrée S, un retard T1 et un gain G1, et un retard T2 et un gain G2 respectivement. Les retards T1 et T2 peuvent être positifs, négatifs ou nuls, et les gains G1 et G2 peuvent être inférieurs, supérieurs ou égaux à 1 ; et
    • des modules 3C1 et 3C2 aptes à appliquer indépendamment sur les signaux issus respectivement des modules 3B1 et 3B2, des techniques de spatialisation sonore notées respectivement T1 et T2.
  • Les caractéristiques de ces modules seront décrites plus en détail ultérieurement.
  • Le dispositif 3 de génération dispose ici de l'architecture matérielle d'un ordinateur, telle qu'illustrée schématiquement à la figure 4 .
  • Il comporte notamment un processeur (ou micro-processeur) 4, une mémoire vive 5, une mémoire morte 6, une mémoire flash non volatile 7 ainsi que des moyens de communication 8 aptes à émettre et à recevoir des signaux audio.
  • Les moyens de communication 8 comprennent d'une part, des moyens de réception du signal audio d'entrée S, et d'autre part, une interface (filaire ou sans fil) avec les haut-parleurs HP1-1, HP1-2, ..., HP1-P de l'ensemble E1 et avec les haut-parleurs HP2-1, HP2-2, ..., HP2-N de l'ensemble E2 pour leur fournir les signaux audio S1-1, S1-2,..., S1-P et S2-1, S2-2, ..., S2-N. Ces moyens sont connus de l'homme du métier et ne seront pas décrits davantage ici.
  • La mémoire morte 6 du dispositif 3 de génération constitue un support d'enregistrement conforme à l'invention, lisible par le (micro-)processeur 4 et sur lequel est enregistré un programme d'ordinateur conforme à l'invention, comportant des instructions pour l'exécution des étapes d'un procédé de génération décrites ultérieurement en référence à la figure 5.
  • Il convient de noter qu'aucune limitation n'est attachée à la nature à proprement parler du dispositif 3 de génération.
  • Ainsi, notamment, le dispositif 3 de génération peut se présenter sous la forme d'un ordinateur comme illustré à la figure 4, ou en variante d'une puce électronique ou d'un circuit intégré, dans lequel le programme d'ordinateur comprenant les instructions pour l'exécution du procédé de génération selon l'invention est incorporé.
  • De façon similaire, les modules 3A, 3B1, 3B2, 3C1 et 3C2 sur lesquels s'appuient le dispositif 3 de génération peuvent être en variante des modules DSP (Digital Signal Processor) ou FPGA (Field Programmable Gate Array).
  • Nous allons maintenant décrire, en référence à la figure 5 , les principales étapes d'un procédé de génération selon l'invention, telles qu'elles sont mises en oeuvre, dans le premier mode de réalisation, par le dispositif 3 de génération, sur réception du signal audio d'entrée S, pour générer et fournir les signaux S1-1, S1-2,..., S1-P et S2-1, S2-2, ..., S2-N aux ensembles E1 et E2 de haut-parleurs respectivement.
  • On suppose donc ici que le dispositif 3 de génération reçoit le signal audio d'entrée multicanal S via ses moyens de communication 8 (étape E10). Comme mentionné précédemment, aucune limitation n'est attachée à la façon dont le signal audio S est généré ni à son format à proprement parler.
  • Dans le premier mode de réalisation décrit ici, on suppose par ailleurs qu'on fournit au dispositif 3 de génération, par l'intermédiaire d'une interface adaptée, les positions POS(OBJ) des objets sonores OBJ compris dans le signal S et que l'on souhaite restituer. Ces positions sont identifiées dans un plan horizontal, à savoir dans le plan horizontal dans lequel se situent les haut-parleurs du premier ensemble (c'est-à-dire le plan de la scène SCENE ici, S étant obtenu par capture des signaux joués sur la scène S), en termes d'angle et de distance par rapport à un point d'origine déterminé et prédéfini.
  • Cette interface est par exemple une interface graphique développée à cet effet permettant à un utilisateur d'interagir avec le dispositif 3, ou une interface de communication développée avec une table de mixage opérant sur le signal S.
  • L'obtention de ces positions par le dispositif 3 de génération constitue une étape d'identification (étape E20) de la position d'au moins un objet sonore du signal audio d'entrée S au sens de l'invention.
  • Dans un autre mode de réalisation, les positions POS(OBJ) des objets sonores OBJ sont identifiées directement par le dispositif 3 de génération et plus spécifiquement par le module 3A.
  • A cette fin, le module 3A peut utiliser un dispositif de suivi de position (ou « tracking » en anglais) des objets sonores présents sur la scène, connu en soi, et fonctionnant à l'aide de signaux optiques et/ou électromagnétiques, et/ou acoustiques, etc.
  • Dans un autre mode de réalisation encore, pour déterminer la position des objets sonores du signal S, le module 3A du dispositif 3 de génération met en oeuvre une méthode d'analyse spatiale connue en soi, basée sur une décomposition du signal S en sous-bandes fréquentielles.
  • Diverses méthodes d'analyse spatiale peuvent être utilisées par le module 3A.
  • Ainsi par exemple, le module 3A peut utiliser une méthode d'analyse spatiale basée sur l'évaluation de corrélations et de différences de niveaux entre les canaux du signal audio S.
  • En variante, le module 3A peut utiliser une méthode d'analyse spatiale basée sur la détermination d'un vecteur de Gerzon représentatif du signal audio d'entrée S, telle que décrite dans le document US 2007/0269063 . Le vecteur de Gerzon d'un signal audio multicanal reflète en effet de façon connue la localisation spatiale du signal audio multicanal telle qu'elle est perçue par l'auditeur depuis une position déterminée.
  • Selon une autre variante, le module 3A peut mettre en oeuvre une décomposition spatiale du signal multicanal en harmoniques sphériques, telle que décrite dans le document WO 2012/025580 . Cette décomposition permet une analyse spatiale très précise du signal audio multicanal et des objets sonores le composant. Ainsi, notamment, plusieurs objets sonores peuvent être identifiés pour une même sous-bande fréquentielle.
  • Conformément à l'invention, deux types de traitement sont par ailleurs appliqués par le dispositif 3 de génération au signal audio d'entrée S pour générer les signaux destinés à alimenter les deux ensembles E1 et E2 de haut-parleurs.
  • Ces traitements sont appliqués indépendamment pour chaque ensemble de haut-parleurs, via deux chaînes de traitement du signal distinctes comprenant pour l'une le module 3B1 et le module 3C1, et pour l'autre le module 3B2 et le module 3C2. Ces deux chaînes de traitement opèrent préférentiellement simultanément.
  • Ainsi, plus précisément, dans le premier mode de réalisation décrit ici, le module 3B1 applique tout d'abord au signal d'entrée S, le retard T1 et le gain G1 mentionnés précédemment (étape E30). Ce retard T1 et ce gain G1 ont été choisis et fournis au module 3B1 au cours d'une étape de configuration ou de calibrage préliminaire (étape E_CALIB) décrite ultérieurement.
  • Par souci de simplification, on suppose ici que le même gain G1 et le même retard T1 sont appliqués par le module 3B1 à l'ensemble des canaux du signal d'entrée S.
  • Cette hypothèse n'est toutefois pas limitative et dans un autre mode de réalisation, on peut envisager d'appliquer un gain et un retard distincts aux différents canaux constituant le signal d'entrée S.
  • Le signal S1 résultant de l'application du retard T1 et du gain G1 sur le signal S est ensuite fourni par le module 3B1 au module 3C1.
  • Le module 3C1 applique au signal S1 la technique de spatialisation sonore T1, et génère ainsi la pluralité de signaux S1-1, S1-2,..., S1-P (étape E40).
  • La technique T1 est par exemple une technique holophonique de type synthèse de front d'ondes, aussi connue sous l'appellation de technique WFS (Wave Field Synthesis en anglais), telle que décrite dans le document EP 2 206 365 ou dans le document d'E. Corteel cité précédemment.
  • Elle prend en compte d'une part, les positions POS(OBJ) des objets sonores identifiées et fournies par le module 3A, et d'autre part, la position des haut-parleurs HP1-1, HP1-2, ..., HP1-P de l'ensemble E1, pour créer des sources virtuelles à partir des haut-parleurs HP1-1, HP1-2, ..., HP1-P de l'ensemble E1 aux positions POS(OBJ).
  • On suppose dans le premier mode de réalisation décrit ici, que la position des haut-parleurs HP1-1, HP1-2, ..., HP1-P de l'ensemble E1 utilisée par le module 3C1 pour appliquer la technique de spatialisation sonore T1 a été fournie au dispositif 3 de génération lors de l'étape préliminaire E_CALIB, par exemple par un installateur de l'ensemble 1 de restitution, via une interface utilisateur adaptée.
  • En variante, la position des haut-parleurs HP1-1, HP1-2, ..., HP1-P de l'ensemble E1 peut être déterminée par le dispositif 3 de génération lui-même, de façon automatique ou semi-automatique, à l'aide par exemple d'un dispositif de suivi de position tel que décrit précédemment.
  • Les signaux S1-1, S1-2,..., S1-P générés par le module 3C1 sont ensuite fournis aux haut-parleurs HP1-1, HP1-2, ..., HP1-P de l'ensemble E1 (étape E50) pour être restitués.
  • Parallèlement, et de façon similaire, le module 3B2 applique au signal d'entrée S, le retard T2 et le gain G2 mentionnés précédemment (étape E60), déterminés et fournis au module 3B2 au cours de l'étape de configuration E_CALIB également.
  • Le même gain G2 et le même retard T2 sont appliqués ici à l'ensemble des canaux du signal d'entrée SIG.
  • Le signal S2 résultant de cette opération est fourni par le module 3B2 au module 3C2.
  • Ce dernier applique au signal S2 la technique de spatialisation sonore T2, et génère ainsi la pluralité de signaux S2-1, S2-2,..., S2-N (étape E70).
  • La technique T2 est par exemple également une technique holophonique de type WFS telle que décrite dans le document EP 2 206 365 . Elle prend en compte d'une part, les positions POS(OBJ) des objets sonores identifiées et fournies par le module 3A, et d'autre part, la position des haut-parleurs HP2-1, HP2-2, ..., HP2-N de l'ensemble E2, pour créer des sources virtuelles à partir des haut-parleurs HP2-1, HP2-2, ..., HP2-N de l'ensemble E2 aux positions POS(OBJ).
  • Par ailleurs, on peut envisager également que les modules 3C1 et 3C2 appliquent des techniques de spatialisation sonore T1 et T2 distinctes aux signaux S1 et S2 pour générer les signaux destinés à alimenter les deux ensembles E1 et E2 de haut-parleurs.
  • La position des haut-parleurs HP2-1, HP2-2, ..., HP2-N de l'ensemble E2 a, dans le premier mode de réalisation décrit ici, été fournie au dispositif 3 de génération également lors de l'étape de configuration préliminaire E_CALIB, par l'installateur de l'ensemble 1 de restitution via l'interface utilisateur précitée.
  • Les signaux S2-1, S2-2,..., S2-N générés par le module 3C2 sont fournis aux haut-parleurs HP2-1, HP2-2, ..., HP2-N de l'ensemble E2 (étape E80), pour être restitués.
  • Conformément à l'invention, les retards et les gains (T1,G1) et (T2,G2), appliqués au signal audio d'entrée S par les modules 3B1 et 3B2 pour générer respectivement les signaux S1-1, S1-2,..., S1-P et S2-1, S2-2,..., S2-N, ont été choisis, lors de l'étape préliminaire de configuration E_CALIB, de sorte à garantir que la combinaison, à une position de référence Pref(E1,E2) définie pour les ensembles de haut-parleurs E1 et E2, des signaux restitués par le premier ensemble E1 des haut-parleurs alimentés par les signaux S1-1, S1-2,..., S1-P, et des signaux restitués par le deuxième ensemble E2 de haut-parleurs alimentés par les signaux S2-1, S2-2,..., S2-N, vérifie un effet de restitution sonore déterminé (autrement dit, souhaité, choisi).
  • Ceci permet avantageusement de tenir compte de la directivité verticale des haut-parleurs du deuxième ensemble E2, et de s'assurer que la combinaison des signaux à la position spatiale de référence choisie est harmonieuse pour l'auditeur (pas de cacophonie ou d'écho non souhaité).
  • Par position spatiale de référence, on entend ici aussi bien un point de l'espace caractérisant la position d'un auditeur cible dans la salle, qu'une zone plus étendue de l'espace dans laquelle est (sont) susceptible(s) de se trouver un ou plusieurs auditeurs.
  • Le choix de la position de référence Pref(E1,E2) dépend bien entendu de plusieurs critères, comme notamment de la profondeur de la salle dans laquelle le signal audio S est restitué. Elle est choisie préférentiellement aux alentours du milieu de la salle, légèrement décalée en direction de la scène.
  • La figure 3 illustre un exemple du choix de la position de référence Pref(E1,E2) pour la salle R.
  • D'autres critères peuvent être pris en compte pour le choix de la position spatiale de référence Pref(E1,E2), comme par exemple :
    • la position Pref(E1,E2) peut être choisie de sorte à garantir que la position verticale du deuxième ensemble E2 de haut-parleurs perçue à cette position Pref(E1,E2), soit approximativement égale à un angle (par exemple 45°), sélectionné afin de limiter l'erreur de perception verticale ;
    • la position Pref(E1,E2) peut coïncider avec la position spatiale à laquelle le niveau sonore « naturellement » restitué (c'est-à-dire sans appliquer de gains aux signaux) par chaque ensemble de haut-parleurs E1 et E2 est similaire ;
    • la position Pref(E1,E2) peut également dépendre de la configuration de la salle, et notamment de l'implantation le cas échéant des sièges destinés aux auditeurs dans la salle (ex. existence de couloirs dans la salle, etc.).
  • Il convient de noter que dans le premier mode de réalisation décrit ici, on se limite à prendre en compte une seule position de référence dans la salle pour choisir les retards et/ou les gains appliqués sur le signal d'entrée S. Toutefois en variante, on pourrait envisager de prendre en compte plusieurs positions de référence réparties sur une zone spécifique de la salle.
  • Comme mentionné précédemment, les retards et les gains appliqués au signal d'entrée dépendent de l'effet de restitution sonore que l'on souhaite obtenir à la position de référence Pref(E1,E2) pour la combinaison des signaux restitués par le premier ensemble E1 et par le deuxième ensemble E2.
  • Ainsi, par exemple, l'effet de restitution sonore désiré peut être l'arrivée en cohérence de phase, à la position spatiale de référence Pref(E1,E2), des signaux restitués par le premier ensemble E1 et des signaux restitués par le deuxième ensemble E2. Cette cohérence de phase est assurée lorsque les signaux restitués par le premier ensemble E1 et les signaux restitués par le deuxième ensemble E2 arrivent simultanément à la position de référence Pref(E1,E2) avec un niveau sonore similaire.
  • Selon un autre exemple, on peut au contraire choisir de décaler dans le temps l'arrivée des signaux restitués par le deuxième ensemble E2 par rapport à l'arrivée des signaux restitués par le premier ensemble E1 de sorte à bénéficier de l'effet Haas décrit précédemment (ou plus précisément à accentuer l'effet Haas naturel dont bénéficie déjà le système 2 de restitution à proximité de la scène).
  • A titre illustratif, la figure 6 représente les variations du temps de propagation des signaux diffusés par des haut-parleurs omnidirectionnels (le temps de propagation étant indépendant de la directivité verticale des haut-parleurs), en fonction de la distance à la scène, pour un ensemble de haut-parleurs positionné au niveau de la scène (courbe en trait plein) et à 6.0 m au-dessus de la scène (courbe en traits interrompus).
  • Cette figure illustre l'effet Haas naturel, décrit précédemment, dont bénéficie le système 2 de restitution à proximité de la scène (décalage des temps de propagation à proximité de la scène).
  • Pour maintenir cet effet sur une distance à la scène plus importante, et permettre une bonne localisation verticale des objets sonores sur le premier ensemble de haut-parleurs, on peut, à la lumière de la figure 6, tenter de « relever » la courbe en traits interrompus de sorte à l'éloigner de la courbe en trait plein, en retardant les deuxièmes signaux par rapport aux premiers signaux à la position de référence.
  • Les gains G1 et G2 sont quant à eux choisis de sorte à garantir un niveau sonore suffisant au fond de la salle, tout en optimisant la localisation verticale des objets sonores restitués à la position de référence.
  • Comme décrit précédemment, les retards et les gains (T1,G1) et (T2,G2) permettant d'obtenir un tel effet de restitution sonore souhaité à la position de référence Pref(E1,E2), sont choisis (i.e. réglés) au cours de l'étape de configuration E_CALIB. Ce choix ou réglage peut être réalisé de façon manuelle (par exemple expérimentalement, à l'aide de mesures physiques de niveau sonore) ou automatique via des simulations numériques.
  • Ainsi, dans le premier mode de réalisation décrit ici, l'étape de configuration E_CALIB comprend une première phase au cours de laquelle on réalise des mesures physiques, à la position de référence Pref(E1,E2), d'une part, du niveau sonore « naturellement » restitué par l'ensemble E1 (i.e. ceci revient à appliquer un gain T1 nul, un retard G1=1, et un gain G2 nul), et d'autre part, du niveau sonore « naturellement » restitué par l'ensemble E2 (i.e. ceci revient à appliquer un gain T2 nul, un retard G2=1, et un gain G1 nul).
  • A partir de ces mesures physiques, on détermine et on règle de façon empirique, lors d'une deuxième phase, les retards T1 et T2, et les gains G1 et G2, à appliquer sur le signal audio d'entrée S pour obtenir l'effet de restitution sonore désiré. Ces retards T1 et T2, et ces gains G1 et G2 peuvent faire l'objet de plusieurs tests, et être ajustés à chaque test, par tâtonnement.
  • En variante, cette deuxième phase de réglage peut être réalisée par simulation.
  • L'étape E_CALIB peut en outre comporter une phase ultime d'ajustement plus précis des retards et des gains déterminés lors de la deuxième phase, en utilisant des signaux connus, via de nouvelles mesures physiques et/ou par simulation numérique.
  • On notera qu'au cours de l'étape E_CALIB, le réglage des retards et des gains peut s'effectuer soit de façon globale, soit de façon indépendante sur chaque bande de fréquences d'un ensemble de bandes de fréquences prédéfini. Dans ce cas, on détermine un gain et un retard par bande de fréquences étudiée. Ceci permet avantageusement de prendre en compte la dépendance en fréquence de la directivité des haut-parleurs du deuxième ensemble E2.
  • La figure 7 illustre divers avantages procurés par l'ensemble 1 de restitution, en termes de variations du niveau sonore en fonction de la distance de l'auditeur par rapport à la scène. Dans l'exemple de la figure 7, les haut-parleurs de l'ensemble E2 sont des haut-parleurs directifs verticalement disposant d'une ouverture verticale de 90°.
  • Plus spécifiquement, la figure 7 montre que grâce à l'utilisation de haut-parleurs directifs pour l'ensemble E2, le niveau sonore du signal restitué par l'ensemble E2 perçu à proximité de la scène est moins important (cf. courbe en traits interrompus).
  • Par ailleurs, on s'assure un niveau sonore quasi-uniforme jusqu'au fond de la salle.
  • En outre, la différence de niveaux sonores entre les signaux restitués par l'ensemble E1 (représenté par la courbe en trait continu) et les signaux restitués par l'ensemble E2 est quasiment constante pour des distances à la scène supérieures à 8 m (mise en cohérence des niveaux sonores atteinte par l'invention), de sorte qu'il est possible par un choix approprié des retards T1 et T2 de bénéficier d'un effet Haas jusqu'au fond de la salle.
  • Dans l'exemple illustré à la figure 2, l'ensemble de restitution 1 comprend deux ensembles de haut-parleurs E1 et E2.
  • Dans une variante, l'ensemble de restitution 1 comprend en outre un autre ensemble de haut-parleurs de type caissons de basse ou « subwoofers », pour ajouter un effet supplémentaire lors de la restitution sonore du signal audio d'entrée.
  • De façon similaire, dans cette variante, une pluralité de signaux audio destinés à alimenter cet ensemble de haut-parleurs de type caissons de grave est généré par le dispositif 3 de génération en appliquant au signal audio entrée :
    • au moins un retard et/ou un gain ; et
    • un filtrage de type passe-bas.
  • Le retard et/ou le gain ainsi appliqués sont choisis de sorte que la combinaison des signaux restitués par l'ensemble de haut-parleurs de type caissons de grave et des signaux restitués par l'un des ensembles E1 et E2 vérifie un effet de restitution sonore déterminé à une position spatiale de référence définie pour cet ensemble et pour l'ensemble de haut-parleurs de type caissons de grave.
  • Nous allons maintenant illustrer la mise en oeuvre de ce premier mode de réalisation par la description de trois exemples.
  • Exemple 1 : Dans l'exemple 1 :
    • l'ensemble E1 est une ligne de P haut-parleurs HP1-1, ..., HP1-P situés sur la scène SCENE, à la hauteur h1 ;
    • l'ensemble E2 est une ligne de N haut-parleurs HP2-1, ..., HP2-N situés au-dessus de la scène SCENE, à la hauteur h2. Le nombre N de haut-parleurs ainsi que leur espacement dépendent de la largeur de la scène : N varie typiquement entre 4 et 12 haut-parleurs, espacés de 80 cm à 5 m.
  • Le nombre P de haut-parleurs de l'ensemble E1 est supérieur ou égal au nombre N de haut-parleurs de l'ensemble E2.
  • Conformément à l'invention, les haut-parleurs HP2-1, ..., HP2-N sont en moyenne plus directifs verticalement que les haut-parleurs HP1-1, ..., HP1-P de l'ensemble E1. Plus précisément, dans cet exemple 1 :
    • les P haut-parleurs HP1-1, ..., HP1-P de l'ensemble E1 présentent une ouverture verticale variant de 80° à 120°, et sont orientés vers l'avant de la scène (i.e. vers l'avant de l'auditoire) ;
    • les N haut-parleurs HP2-1, ..., HP2-N de l'ensemble E2 présentent une ouverture verticale variant de 60° à 90°, et sont orientés vers le fond de la salle (partie de l'auditoire la plus éloignée de la scène).
  • Les modules 3C1 et 3C2 utilisent des techniques T1 et T2 de spatialisation sonore de type WFS permettant la création de sources virtuelles aux positions des objets sonores du signal S identifiées par le module 3A. Ces positions sont fournies dans l'exemple 1 au module 3A par l'intermédiaire d'une interface utilisateur graphique.
  • Les modules 3B1 et 3B2 sont configurés de sorte à appliquer un retard non nul au signal S et à l'atténuer (gains G1, G2 inférieurs à 1). Les gains et retards (T1,G1) et (T2,G2) appliqués respectivement par les modules 3B1 et 3B2 sont choisis de sorte que les signaux restitués par les ensembles E1 et E2 à la position de référence Pref(E1,E2) arrivent avec un niveau sonore similaire (à plus ou moins 3 décibels près), et simultanément ou quasi-simultanément (avec une tolérance de plus ou moins 5 ms).
  • Exemple 2 (non couvert par l'invention) : Dans l'exemple 2 :
    • l'ensemble E1 est une ligne de P haut-parleurs HP1-1, ..., HP1-P situés sur la scène SCENE, à la hauteur h1 ;
    • l'ensemble E2 comprend N haut-parleurs HP2-1, ..., HP2-N de type « line array » en anglais (source ligne) situés au-dessus de la scène SCENE, à la hauteur h2, et répartis le long de la scène. Par exemple pour N=3, on dispose un haut-parleur de part et d'autre de la scène et un au centre de la scène. De tels haut-parleurs sont de façon connue particulièrement puissants et présentent une directivité verticale importante et ainsi une faible ouverture.
  • Le nombre P de haut-parleurs de l'ensemble E1 et l'espacement entre eux dépendent de la largeur de la scène, et de la distance séparant les haut-parleurs du premier ensemble E1 des haut-parleurs du deuxième ensemble E2 : P varie typiquement entre 4 et 30 haut-parleurs, espacés de 50 cm à 3 m.
  • Conformément à l'invention, les haut-parleurs HP2-1, ..., HP2-N sont en moyenne plus directifs verticalement que les haut-parleurs HP1-1, ..., HP1-P de l'ensemble E1. Plus précisément, dans ce premier exemple :
    • les P haut-parleurs HP1-1, ..., HP1-P de l'ensemble E1 présentent une ouverture verticale variant de 80° à 120°, et sont orientés vers l'avant de la scène (i.e. vers l'avant de l'auditoire) ;
    • les N haut-parleurs HP2-1, ..., HP2-N de l'ensemble E2 présentent une ouverture verticale variant de 10° à 60°, et sont orientés vers le fond de la salle (partie de l'auditoire la plus éloignée de la scène).
  • Le module 3C1 utilise une technique T1 de spatialisation sonore de type WFS permettant la création de sources virtuelles aux positions des sources identifiées dans le signal S par le module 3A. Ces positions sont fournies dans l'exemple 2 au module 3A par l'intermédiaire d'une table de mixage opérant sur le signal S.
  • Le module 3C2 utilise une technique T2 de spatialisation sonore de type mixage matriciel dynamique prenant la forme d'un panoramique stéréophonique d'intensité en fonction de la position des objets sonores du signal S identifiées par le module 3A.
  • Les modules 3B1 et 3B2 sont configurés de sorte à appliquer un retard non nul au signal S et à l'atténuer (gains G1, G2 inférieurs à 1). Les gains et retards (T1,G1) et (T2,G2) appliqués respectivement par les modules 3B1 et 3B2 sont choisis de sorte que les signaux restitués par les ensembles E1 et E2 à la position de référence Pref(E1,E2) arrivent avec un niveau sonore similaire (à plus ou moins 3 décibels près), et simultanément ou quasi-simultanément (avec une tolérance de plus ou moins 5 ms).
  • Exemple 3 : Dans cet exemple 3 :
    • l'ensemble E1 comprend P haut-parleurs HP1-1, ..., HP1-P situés sur la scène SCENE, à la hauteur h1 ;
    • l'ensemble E2 comprend N haut-parleurs HP2-1, ..., HP2-N de type « line array », situés au-dessus de la scène SCENE, à la hauteur h2. Le nombre N de haut-parleurs ainsi que leur espacement dépendent de la largeur de la scène : N varie typiquement entre 4 et 12 haut-parleurs, espacés de 80 cm à 5 m.
  • L'ensemble de restitution 1 comprend en outre dans cet exemple un ensemble désigné par Elow de L haut-parleurs HPlow-1, ..., HPlow-L basse-fréquence (subwoofers) disposés sur ou en dessous de la scène SCENE.
  • Le nombre P de haut-parleurs de l'ensemble E1 et l'espacement entre eux dépendent de la largeur de la scène, et de la distance séparant les haut-parleurs du premier ensemble E1 des haut-parleurs du deuxième ensemble E2 : P varie typiquement entre 4 et 30 haut-parleurs, espacés de 50 cm à 3 m.
  • Conformément à l'invention, les haut-parleurs HP2-1, ..., HP2-N sont en moyenne plus directifs verticalement que les haut-parleurs HP1-1, ..., HP1-P de l'ensemble E1. Plus précisément, dans ce premier exemple :
    • les P haut-parleurs HP1-1, ..., HP1-P de l'ensemble E1 présentent une dispersion verticale variant de 80° à 120°, et sont orientés vers l'avant de la scène (i.e. vers l'avant de l'auditoire) ;
    • les N haut-parleurs HP2-1, ..., HP2-N de l'ensemble E2 présentent une dispersion verticale variant de 10° à 60°, et sont orientés vers le fond de la salle (partie de l'auditoire la plus éloignée de la scène).
  • Le module 3C1 utilise une technique T1 de spatialisation sonore de type WFS permettant la création de sources virtuelles aux positions des objets sonores identifiées dans le signal S par le module 3A.
  • Le module 3C2 utilise une technique T2 de spatialisation sonore de type WFS permettant également la création de sources virtuelles aux positions des objets sonores identifiées dans le signal S par le module 3A. La technique T2 est par exemple une technique WFS telle que décrite dans le document d'E. Corteel cité précédemment, de sorte à compenser les caractéristiques de directivité horizontale des haut-parleurs « line array » de l'ensemble E2.
  • Les positions des objets sonores du signal S sont identifiées directement ici par le module 3A par l'intermédiaire d'un dispositif de suivi des positions des objets sonores présents sur la scène SCENE (ex. instruments ou personnages, etc.).
  • Le dispositif 3 de génération comporte en outre selon cet exemple, un module 3Blow apte à appliquer un gain et un retard au signal audio d'entrée S, et un module 3Clow apte à appliquer un filtrage passe-bas au signal issu du module 3Blow pour générer des signaux destinés à alimenter les haut-parleurs de l'ensemble Elow.
  • Les modules 3B1, 3B2 et 3Blow sont configurés de sorte à appliquer un retard non nul au signal S et à l'atténuer (gains inférieurs à 1).
  • Les gains et retards (T1,G1) et (T2,G2) appliqués respectivement par les modules 3B1 et 3B2 sont choisis de sorte que les signaux restitués par l'ensemble E2 arrivent avec un décalage de 10 ou 20 ms par rapport aux signaux restitués par l'ensemble E1 à la position de référence Pref(E1,E2), avec un niveau sonore similaire (à plus ou moins 3 décibels près), de sorte à bénéficier de l'effet Haas décrit dans le document de Blauert et al. cité précédemment.
  • Le retard et le gain appliqués par le module 3Blow sont choisis de sorte que les signaux restitués par les ensembles Elow et E1 à une position spatiale de référence Pref(E1ow,E1) définie pour les ensembles Elow et E1 (de façon similaire à la position Pref(E1,E2)) arrivent avec un niveau sonore similaire (à plus ou moins 3 décibels près) dans leurs bandes de fréquences respectives, et simultanément ou quasi-simultanément (avec une tolérance de plus ou moins 5 ms).
  • Nous allons maintenant décrire, en référence aux figures 8 à 10, un second mode de réalisation de l'invention dans lequel on considère, pour la restitution du signal audio d'entrée S, un ensemble de restitution sonore comprenant trois ensembles de haut-parleurs E1, E2 et E3, les ensembles E2 et E3 jouant le rôle d'ensembles de haut-parleurs de rappel.
  • Ainsi, la figure 8 représente, dans son environnement, un ensemble 1' de restitution sonore, conforme à l'invention, dans ce second mode de réalisation.
  • Les éléments similaires au premier mode de réalisation décrits en référence aux figures 2 à 5 sont référencés de façon identique sur les figures 8 à 10.
  • Conformément au second mode de réalisation, l'ensemble 1' de restitution sonore comprend :
    • un système 2' de restitution sonore comprenant une pluralité de haut-parleurs ; et
    • un dispositif 3' de génération de signaux audio destinés à alimenter les haut-parleurs du système 2' de restitution sonore.
  • Le système 2' de restitution sonore se distingue du système 2 de restitution sonore illustré aux figures 2 et 3 en ce qu'il comprend en outre un troisième ensemble E3 de K haut-parleurs, notés HP3-1, HP3-2, ..., HP3-K, K étant un entier positif supérieur à 1.
  • Comme illustre à la figure 9 , les haut-parleurs HP3-1, HP3-2, ..., HP3-K sont positionnés à une hauteur h3 supérieure à la hauteur de référence h1, dans un plan vertical situé plus proche du fond de la salle que le plan vertical dans lequel sont positionnés les haut-parleurs de l'ensemble E2.
  • Les haut-parleurs de l'ensemble E3 peuvent être choisis omnidirectionnels, si l'ensemble E3 est destiné à compenser la présence d'éléments masquant tels que des balcons par exemple, ou au contraire ils peuvent être choisis plus directifs en moyenne verticalement que les haut-parleurs de l'ensemble E1, et être orientés, de façon similaire aux haut-parleurs de l'ensemble E2 vers le fond de la salle.
  • Le nombre K de haut-parleurs dans le troisième ensemble E3 peut être égal ou distinct des nombres P et N de haut-parleurs dans les ensembles E1 et E2.
  • Les différents haut-parleurs de l'ensemble E3 sont alimentés par des signaux audio multicanaux, notés respectivement S3-1, S3-2,..., S3-K générés par le dispositif 3' de génération à partir du signal audio d'entrée S.
  • Pour générer ces signaux, le dispositif 3' de génération s'appuie :
    • sur le module logiciel 3A décrit précédemment, et apte à identifier les positions POS(OBJ) des différents objets sonores OBJ compris dans le signal d'entrée S ;
    • le module 3B3 apte à appliquer sur le signal S, un retard T3 et un gain G3, identiques ici sur chaque canal du signal S ;
    • le module 3C3 apte à appliquer sur le signal issu du module 3B3 une technique de spatialisation sonore T3.
  • Le dispositif 3' de génération dispose ici de l'architecture matérielle d'un ordinateur, similaire à celle du dispositif 3 de génération décrite précédemment en référence à la figure 4. Les moyens de communication du dispositif 3' de génération se distinguent toutefois des moyens de communication du dispositif 3 de génération en ce qu'ils comprennent en outre une interface (filaire ou sans fil) avec les haut-parleurs HP3-1, HP3-2, ..., HP3-K de l'ensemble E3.
  • La mémoire morte du dispositif 3' de génération constitue un support d'enregistrement conforme à l'invention, lisible par le (micro-)processeur du dispositif 3' et sur lequel est enregistré un programme d'ordinateur conforme à l'invention, comportant des instructions pour l'exécution des étapes d'un procédé de génération décrites maintenant en référence à la figure 10.
  • La figure 10 illustre les principales étapes d'un procédé de génération selon l'invention, telles qu'elles sont mises en oeuvre, dans le second mode de réalisation, par le dispositif 3' de génération sur réception du signal audio d'entrée S, pour générer et fournir les signaux S1-1, S1-2,..., S1-P, S2-1, S2-2, ..., S2-N et S3-1, S3-2, ..., S3-K aux ensembles E1, E2 et E3 de haut-parleurs respectivement.
  • Les étapes similaires aux étapes mises en oeuvre par le dispositif 3 de génération et illustrées à la figure 5 sont référencées de manière identique et ne sont pas décrites de nouveau en détail ici.
  • On suppose donc que le dispositif 3' de génération reçoit le signal audio d'entrée multicanal S via ses moyens de communication (étape E10).
  • On suppose par ailleurs qu'on fournit au dispositif 3' de génération, par l'intermédiaire d'une interface adaptée, les positions désignées par POS(OBJ) des objets sonores OBJ compris dans le signal S et que l'on souhaite restituer (étape E20).
  • Conformément à l'invention, différents traitements sont appliqués par le dispositif 3' de génération au signal S pour générer les signaux destinés à alimenter les trois ensembles E1, E2 et E3 de haut-parleurs.
  • Ces traitements sont appliqués indépendamment pour chaque ensemble de haut-parleurs, via trois chaînes de traitement du signal distinctes comprenant pour la première, le module 3B1 et le module 3C1, pour la deuxième, le module 3B2 et le module 3C2, et pour la troisième, le module 3B3 et le module 3C3. Ces trois chaînes de traitement opèrent préférentiellement simultanément.
  • Plus spécifiquement, les modules 3B1, 3C1, 3B2 et 3C2 procèdent de manière similaire au premier mode de réalisation pour générer les signaux S1-1, S1-2,..., S1-P destinés à alimenter l'ensemble E1 et les signaux S2-1, S2-2,..., S2-N destinés à alimenter l'ensemble E2 (étapes E30 à E80 illustrées à la figure 5).
  • Par ailleurs, en parallèle, le module 3B3 applique au signal S le retard T3 et le gain G3 mentionnés précédemment (étape E90), générant ainsi un signal S3. Ce retard T3 et ce gain G3 ont été déterminés et fournis au module 3B3 au cours d'une étape de configuration préliminaire E_CALIB' décrite ultérieurement.
  • Le module 3C3 applique ensuite au signal S3 fourni en sortie du module, la technique de spatialisation sonore T3 (étape E100), générant ainsi la pluralité de signaux S3-1, S3-2,..., S3-K.
  • La technique T3 est par exemple une technique holophonique de type WFS telle que décrite dans le document EP 2 206 365 . Elle prend en compte d'une part, les positions POS(OBJ) des objets sonores identifiées et fournies par le module 3A, et d'autre part, la position des haut-parleurs HP3-1, HP3-2, ..., HP3-K de l'ensemble E3, pour créer des sources virtuelles à partir des haut-parleurs HP3-1, HP3-2, ..., HP3-K de l'ensemble E3 aux positions POS(OBJ).
  • Bien entendu, cette hypothèse n'est pas limitative et d'autres techniques de spatialisation sonore peuvent être envisagées dans le cadre de l'invention, telles que les techniques de mixage matriciel dynamique cités précédemment.
  • Les signaux S3-1, S3-2,..., S3-K générés par le module 3C3 sont fournis aux haut-parleurs HP3-1, HP3-2, ..., HP3-K de l'ensemble E3 (étape E110), pour être restitués.
  • Dans ce second mode de réalisation, les retards T1, T2 et T3, et les gains G1, G2 et G3 sont choisis en considérant les ensembles de haut-parleurs E1, E2 et E3 deux à deux. Plus précisément, ils sont choisis de sorte à vérifier :
    • d'une part, que la combinaison des signaux restitués par l'ensemble E1 et des signaux restitués par l'ensemble E2 vérifie un effet de restitution sonore déterminé à la position spatiale de référence Pref(E1,E2) définie pour les ensembles E1 et E2 ; et
    • d'autre part, que la combinaison des signaux restitués par l'ensemble E2 et des signaux restitués par l'ensemble E3 vérifie un effet de restitution sonore déterminé à une position spatiale de référence Pref (E2,E3) définie pour les ensembles E2 et E3. Cette position spatiale Pref(E2,E3) peut être définie selon des critères similaires à ceux adoptés pour définir la position spatiale Pref(E1,E2) décrits précédemment.
  • En variante, on peut considérer la combinaison des signaux restitués par les ensembles E1 et E3 au lieu des ensembles E2 et E3.
  • Ainsi, l'étape préliminaire de configuration E_CALIB' se déroule en deux temps, au cours duquel on considère respectivement les ensembles E1 et E2 d'une part, et les ensembles E2 et E3 d'autre part. Une procédure similaire à celle décrite précédemment pour l'étape de configuration E_CALIB, se basant sur des mesures physiques de niveau sonore et/ou des simulations numériques, est appliquée à chaque couple d'ensembles de haut-parleurs considéré (i.e. au couple (E1,E2) en prenant en compte la position de référence Pref(E1,E2), puis au couple (E2,E3) en prenant en compte la position de référence Pref(E2,E3)).
  • La phase ultime d'ajustement peut en revanche prendre en compte les signaux restitués par les trois ensembles afin d'être plus précis dans l'estimation des retards T1, T2 et T3 et des gains G1, G2, et G3.
  • Comme pour l'étape E_CALIB, le réglage des retards et des gains peut s'effectuer soit de façon globale, soit de façon indépendante sur chaque bande de fréquences d'un ensemble de bandes de fréquences prédéfini. Dans ce cas, on détermine un gain et un retard par bande de fréquences étudiée. Ceci permet avantageusement de prendre en compte la dépendance en fréquence de la directivité des haut-parleurs du deuxième ensemble E2 et le cas échéant, du troisième ensemble E3.
  • Il convient de noter que dans le second mode de réalisation décrit ici, l'ensemble de restitution 1' comprend trois ensembles E1, E2 et E3, dont deux ensembles jouent le rôle d'ensemble de haut-parleurs de rappel pour la salle R. Toutefois, l'invention ne se limite pas à deux ensembles de haut-parleurs de rappel, et on peut envisager, dans le cadre de l'invention, d'ajouter d'autres ensembles E4, E5,... de haut-parleurs de rappel dans la salle. Les retards et/ou les gains appliqués par le dispositif 3' de génération pour générer les signaux destinés à alimenter ces ensembles seront choisis de manière similaire au retard et au gain appliqué par le module 3B3, c'est-à-dire, en considérant les ensembles de haut-parleurs du système de restitution deux à deux (ex. E1 avec E2, puis E2 avec E3, puis E3 avec E4, etc.).
  • Nous allons maintenant illustrer la mise en oeuvre de ce second mode de réalisation par la description de l'exemple 4.
  • Exemple 4 : Dans cet exemple 4 :
    • l'ensemble E1 comprend P haut-parleurs HP1-1, ..., HP1-P situés sur la scène SCENE, à la hauteur h1 ;
    • l'ensemble E2 comprend N haut-parleurs HP2-1, ..., HP2-N situés au-dessus de la scène SCENE, à la hauteur h2. Le nombre N de haut-parleurs ainsi que leur espacement dépendent de la largeur de la scène : N varie typiquement entre 4 et 12 haut-parleurs, espacés de 80 cm à 5 m;
    • l'ensemble E3 comprend K haut-parleurs HP3-1, ..., HP3-K disposés dans la salle, au-dessus de l'auditoire, au milieu de la partie AUDIT. Le nombre K de haut-parleurs ainsi que leur espacement dépendent de la largeur de la scène : K varie typiquement entre 4 et 12 haut-parleurs, espacés de 80 cm à 5 m.
  • Dans cet exemple 4, les haut-parleurs HP2-1, ..., HP2-N sont en moyenne plus directifs verticalement que les haut-parleurs HP1-1, ..., HP1-P de l'ensemble E1. Plus précisément, dans cet exemple 4 :
    • les P haut-parleurs HP1-1, ..., HP1-P de l'ensemble E1 présentent une ouverture verticale variant de 80° à 120°, et sont orientés vers l'avant de la scène (i.e. vers l'avant de l'auditoire) ;
    • les N haut-parleurs HP2-1, ..., HP2-N de l'ensemble E2 présentent une ouverture verticale variant de 60° à 90°, et sont orientés vers le fond de la salle (partie de l'auditoire la plus éloignée de la scène).
  • Par ailleurs, dans cet exemple 4, les K haut-parleurs HP3-1, ..., HP3-K de l'ensemble E3 sont également en moyenne plus directifs verticalement que les haut-parleurs HP1-1, ..., HP1-P de l'ensemble E1. Ils présentent une ouverture verticale variant de 60° à 90°, et sont orientés également vers le fond de la salle (partie de l'auditoire la plus éloignée de la scène).
  • Les modules 3C1, 3C2 et 3C3 utilisent des techniques T1, T2 et T3 de spatialisation sonore de type WFS permettant la création de sources virtuelles aux positions des objets identifiées dans le signal S par le module 3A. Ces positions sont fournies dans l'exemple 4 au module 3A par l'intermédiaire d'une interface utilisateur graphique.
  • Les modules 3B1, 3B2 et 3B3 sont configurés de sorte à appliquer un retard non nul au signal S et à l'atténuer (gains G1, G2 et G3 inférieurs à 1).
  • Les gains et retards (T1,G1) et (T2,G2) appliqués respectivement par les modules 3B1 et 3B2 sont choisis de sorte que les signaux restitués par les ensembles E1 et E2 à la position de référence Pref(E1,E2) arrivent avec un niveau sonore similaire (à plus ou moins 3 décibels près), et simultanément ou quasi-simultanément (avec une tolérance de plus ou moins 5 ms).
  • Le retard et le gain (T3,G3) appliqués par le module 3B3 sont choisis de sorte que les signaux restitués par les ensembles E2 et E3 à la position de référence Pref(E2,E3) arrivent avec un niveau sonore similaire (à plus ou moins 3 décibels près) dans leurs bandes de fréquences respectives, et simultanément ou quasi-simultanément (avec une tolérance de plus ou moins 5 ms). La position Pref(E2,E3) est choisie plus éloignée de la scène SCENE que la position Pref(E1,E2), en direction du fond de la salle.
  • Dans les deux modes de réalisation décrits ici, l'application des gain/retard et l'application de la technique de spatialisation sonore sur le signal audio d'entrée sont mises en oeuvre lors d'étapes distinctes par des modules distincts.
  • Dans un autre mode de réalisation, ces deux traitements peuvent être réalisés simultanément par un même module (i.e. par les modules 3C1, 3C2 et le cas échéant 3C3 respectivement), lors de l'application de la technique de spatialisation sonore.

Claims (12)

  1. Procédé de génération, à partir d'un signal audio d'entrée (S), de signaux audio destinés à être fournis à un système de restitution sonore (2,2') dans une salle dotée d'une scène, ce système de restitution sonore comprenant un premier ensemble (E1) de haut-parleurs (HP1_1,...,HP1_P) positionnés à une hauteur (h1) de référence, et un deuxième ensemble (E2) de haut-parleurs (HP2_1,...,HP2_N) positionnés à une hauteur (h2) supérieure à la hauteur de référence (h1), les haut-parleurs du deuxième ensemble étant plus directifs verticalement que les haut-parleurs du premier ensemble, le premier ensemble de haut-parleurs étant placé sur ou devant la scène de la salle,
    tandis que le deuxième ensemble de haut-parleurs étant placé au-dessus de la scène,
    les haut-parleurs du deuxième ensemble étant orientés vers le fond de la salle et les haut-parleurs du premier ensemble étant orientés vers la partie de la salle située à proximité de la scène, tel qu'il est possible de diffuser le signal audio d'entrée avec un niveau sonore uniforme, y compris à une grande distance de la scène, sans augmenter de façon trop importante ce niveau sonore,
    ce procédé comprenant :
    - une étape (E20) d'identification d'une position (POS(OBJ)) d'au moins un objet sonore du signal audio d'entrée (S) ;
    - une étape de génération (E30,E40) d'une pluralité de premiers signaux audio (S1_1.... S1_P) destines à alimenter le premier ensemble (E1) de haut-parleurs, en appliquant au signal audio d'entrée (S) :
    o au moins un retard (T1) et un gain (G1) ; et de plus
    o une technique (T1) de spatialisation sonore tenant compte de la position identifiée dudit au moins un objet sonore du signal audio d'entrée et d'une position des haut-parleurs du premier ensemble ;
    - une étape de génération (E60, E70) d'une pluralité de deuxièmes signaux audio (S2_1 ,...,S2_N) destinés à alimenter le deuxième ensemble (E2) de haut-parleurs, en appliquant au signal audio d'entrée (S) :
    o au moins un retard (T2) et un gain (G2) ; et de plus
    o une technique (T2) de spatialisation sonore tenant compte de la position identifiée dudit au moins un objet sonore du signal audio d'entrée et d'une position des haut-parleurs du deuxième ensemble ;
    lesdites techniques de spatialisation sonore appliquées lors de la génération des premiers et des seconds signaux audio étant des techniques holophoniques ; et
    les retards et les gains appliqués lors de la génération des premiers et des seconds signaux audio étant choisis de sorte que la combinaison des premiers signaux restitués par le premier ensemble de haut-parleurs et des seconds signaux restitués par le deuxième ensemble de haut-parleurs vérifie un effet de restitution sonore déterminé à au moins une position spatiale de référence (Pref(E1,E2)) définie pour les premier et second ensembles de haut-parleurs, tel que le niveau sonore est suffisamment important pour les auditeurs situés au fond de la salle sans pour autant augmenter outre mesure ce niveau sonore, afin de limiter notamment la gêne des auditeurs situés à proximité de la scène.
  2. Procédé selon la revendication 1 dans lequel les retards appliqués lors de la génération des premiers et des seconds signaux audio sont choisis de sorte que les premiers signaux restitués par le premier ensemble de haut-parleurs et les deuxièmes signaux restitués par le deuxième ensemble de haut-parleurs arrivent simultanément à la position spatiale de référence.
  3. Procédé selon la revendication 1 dans lequel les retards appliqués lors de la génération des premiers et des seconds signaux audio sont choisis de sorte que les deuxièmes signaux restitués par le deuxième ensemble de haut-parleurs arrivent avec un décalage prédéterminé à la position spatiale de référence par rapport aux premiers signaux restitués par le premier ensemble.
  4. Procédé selon l'une quelconque des revendications 1 à 3 dans lequel au moins une dite technique de spatialisation sonore appliquée lors de la génération des premiers et des deuxièmes signaux audio est :
    - une technique holophonique de spatialisation sonore de type WPS
  5. Procédé selon l'une quelconque des revendications 1 à 4 dans lequel, au cours d'au moins une dite étape de génération, ledit au moins un retard et/ou gain est appliqué sur le signal d'entrée avant la technique de spatialisation sonore.
  6. Procédé selon l'une quelconque des revendications 1 à 5 dans lequel le signal audio d'entrée est un signal audio multicanal et, au cours d'au moins une dite étape de génération, le même retard et/ou le même gain est appliqué sur chaque canal du signal audio d'entrée.
  7. Procédé selon l'une quelconque des revendications 1 à 5 dans lequel le signal audio d'entrée est un signal audio multicanal et, au cours d'au moins une dite étape de génération, un retard et/ou un gain distinct est appliqué sur au moins deux canaux distincts du signal audio d'entrée.
  8. Procédé selon l'une quelconque des revendications 1 à 7 dans lequel le système de restitution sonore comprend en outre au moins un troisième ensemble (E3) de haut-parleurs (HP3-1.HP3-2....HP3-K) positionnés à une hauteur (h3) supérieure à la hauteur de référence (h1), ledit procédé comprenant une étape (E90,E100) de génération d'une pluralité de troisièmes signaux audio (S3-1, S3-2,..., S3-K) destinés à alimenter le troisième ensemble de haut-parleurs en appliquant au signal audio entrée (S) :
    - au moins un retard (T3) et/ou un gain (G3) ; et
    - une technique de spatialisation sonore (T3) tenant compte de la position identifiée dudit au moins un objet sonore du signal audio d'entrée et d'une position des haut-parleurs du troisième ensemble ;
    ledit au moins un retard et/ou un gain étant choisi de sorte qu'une combinaison des troisièmes signaux restitues par le troisième ensemble de haut-parleurs et des signaux restitues par un autre (E2) desdits ensembles de haut-parleurs du système de restitution vérifie un effet de restitution sonore détermine a une position spatiale de référence définie pour cet autre ensemble et pour le troisième ensemble de haut-parleurs.
  9. Programme d'ordinateur comportant des instructions pour l'exécution des étapes du procède de génération selon l'une quelconque des revendications 1 à 8 lorsque ledit programme est exécuté par un ordinateur.
  10. Support d'enregistrement lisible par un ordinateur sur lequel est enregistré un programme d'ordinateur comprenant des instructions pour l'exécution des étapes du procédé de génération selon l'une quelconque des revendications 1 à 8.
  11. Dispositif (3,3') de génération de signaux audio destinés a un système (2,2') de restitution sonore dans une salle dotée d'une scène a partir d'un signal audio d'entrée, ce système de restitution sonore comprenant un premier ensemble (E1) de haut-parleurs positionnés à une hauteur de référence (h1), et un deuxième ensemble (E2) de haut-parleurs positionnés à une hauteur supérieure (h2) à la hauteur de référence, les haut-parleurs du deuxième ensemble étant plus directifs verticalement que les haut-parleurs du premier ensemble, le premier ensemble de haut-parleurs étant placé sur ou devant la scène de la salle, tandis que le deuxième ensemble de haut-parleurs étant placé au-dessus de la scène, les haut-parleurs du deuxième ensemble étant orientés vers le fond de la salle et les haut-parleurs du premier ensemble étant orientés vers la partie de la salle située à proximité de la scène, tel qu'il est possible de diffuser le signal audio d'entrée avec un niveau sonore uniforme, y compris à une grande distance de la scène, sans augmenter de façon trop importante ce niveau sonore, le dispositif de génération (3,3') comprenant :
    - des moyens d'identification (3A) d'une position d'au moins un objet sonore du signal audio d'entrée ;
    - des moyens de génération (3B1) d'une pluralité de premiers signaux audio destinés à alimenter le premier ensemble de haut-parleurs, aptes à appliquer au signal audio d'entrée :
    ∘ au moins un retard et un gain ; et de plus
    ∘ une technique (T1) de spatialisation sonore tenant compte de la position identifiée dudit au moins un objet sonore du signal audio d'entrée et d'une position des haut-parleurs du premier ensemble ;
    - des moyens de génération (3B2) d'une pluralité de deuxièmes signaux audio destinés à alimenter le deuxième ensemble de haut-parleurs, aptes à appliquer au signal audio d'entrée :
    ∘ au moins un retard et un gain ; et de plus
    ∘ une technique (T2) de spatialisation sonore tenant compte de la position identifiée dudit au moins un objet sonore du signal audio d'entrée et d'une position des haut-parleurs du deuxième ensemble ;
    lesdites techniques de spatialisation sonore appliquées par les moyens de génération des premiers et des seconds signaux audio étant des techniques holophoniques ; et
    les gains et retards appliqués par les moyens de génération des premiers et des seconds signaux audio étant choisis de sorte que la combinaison des premiers signaux restitués par le premier ensemble de haut-parleurs et des seconds signaux restitués par le deuxième ensemble de haut-parleurs vérifie un effet de restitution sonore déterminé à au moins une position spatiale de référence définie pour les premier et second ensembles de haut-parleurs, tel que le niveau sonore est suffisamment important pour les auditeurs situés au fond de la salle sans pour autant augmenter outre mesure ce niveau sonore, afin de limiter notamment la gêne des auditeurs situés à proximité de la scène.
  12. Ensemble (1,1') de restitution d'un signal audio d'entrée comprenant :
    - un système (2,2') de restitution sonore comprenant un premier ensemble (E1) de haut-parleurs positionnés à une hauteur de référence, et un deuxième ensemble (E2) de haut-parleurs positionnés à une hauteur supérieure à la hauteur de référence, les haut-parleurs du deuxième ensemble étant plus directifs verticalement que les haut-parleurs du premier ensemble ; et
    - un dispositif (3,3') de génération de signaux audio selon la revendication 11 destinés à alimenter les haut-parleurs du premier ensemble et les haut-parleurs du deuxième ensemble du système de restitution sonore.
EP13779301.4A 2012-09-27 2013-09-25 Procede et dispositif de generation de signaux audio destines a etre fournis a un systeme de restitution sonore Active EP2901717B2 (fr)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR1259126A FR2996095B1 (fr) 2012-09-27 2012-09-27 Procede et dispositif de generation de signaux audio destines a etre fournis a un systeme de restitution sonore
PCT/FR2013/052256 WO2014049268A1 (fr) 2012-09-27 2013-09-25 Procede et dispositif de generation de signaux audio destines a etre fournis a un systeme de restitution sonore

Publications (3)

Publication Number Publication Date
EP2901717A1 EP2901717A1 (fr) 2015-08-05
EP2901717B1 EP2901717B1 (fr) 2016-10-26
EP2901717B2 true EP2901717B2 (fr) 2019-12-25

Family

ID=47505066

Family Applications (1)

Application Number Title Priority Date Filing Date
EP13779301.4A Active EP2901717B2 (fr) 2012-09-27 2013-09-25 Procede et dispositif de generation de signaux audio destines a etre fournis a un systeme de restitution sonore

Country Status (3)

Country Link
EP (1) EP2901717B2 (fr)
FR (1) FR2996095B1 (fr)
WO (1) WO2014049268A1 (fr)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2056621A2 (fr) 2007-10-31 2009-05-06 Yamaha Corporation Système de réseau de haut-parleurs

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102004057500B3 (de) 2004-11-29 2006-06-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Ansteuerung einer Beschallungsanlage und Beschallungsanlage
US8379868B2 (en) 2006-05-17 2013-02-19 Creative Technology Ltd Spatial audio coding based on universal spatial cues
EP2056627A1 (fr) 2007-10-30 2009-05-06 SonicEmotion AG Procédé et dispositif pour améliorer la précision de rendu de champ sonore dans une région d'écoute préférée
ES2922639T3 (es) 2010-08-27 2022-09-19 Sennheiser Electronic Gmbh & Co Kg Método y dispositivo para la reproducción mejorada de campo sonoro de señales de entrada de audio codificadas espacialmente

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2056621A2 (fr) 2007-10-31 2009-05-06 Yamaha Corporation Système de réseau de haut-parleurs

Non-Patent Citations (15)

* Cited by examiner, † Cited by third party
Title
"Datenblatt JBL 4892", October 1996 (1996-10-01)
Article de presse daté du 22.07.2011
BRIX, S. ET AL: "Wave Field Synthesis for Virtual Prototyping in VR Systems", ICED '09, August 2009 (2009-08-01), pages 1 - 9
COBOS MAXIMO ET AL: "Influence of the Listening Position in the Perception of Elevated Sources in Wave-Field Synthesis", CONFERENCE: 40TH INTERNATIONAL CONFERENCE: SPATIAL AUDIO: SENSE THE SOUND OF SPACE; OCTOBER 2010, October 2010 (2010-10-01), pages 437 - 443, XP040567110
CORTEEL, E. ET AL: "Equalization in an Extended Area Using Multichannel Inversion and Wave Field Synthesis", JAES, vol. 54, no. 12, December 2006 (2006-12-01), pages 1140 - 1161, XP040507980
CORTEEL, E. ET AL: "Practical 3 dimensional sound reproduction using Wave Field Synthesis, theory and perceptual validation", PROCEEDINGS OF THE ACOUSTICS 2012, April 2012 (2012-04-01), Nantes, pages 901 - 906, XP055067658
'Dolby Atmos Next-generation Audio for Cinema', White Paper
HÖHNE, G. ET AL: "Virtual Prototyping of Technical Products using a new Audio Visual VR System", PROCEEDINGS OF COBEM 2007, November 2007 (2007-11-01), pages 5 - 9
KLING&FREITAG: " Benutzerhandbuch CA 408P2", 2004
KONECNY, G.: "Der Troubadour in Bregenz - Neues Beschallungskonzept für die Seebühne", PROPECT THEATER, October 2005 (2005-10-01), pages 6 - 9
Photographie (Foto der Seebühne), 2005
Retrieved from the Internet <URL:http://www.resy.waldsoft.at/page_pool/200404812458/datacenter/Brengenzer_Festspiele_2005.pdf,2005>
RODIGAST, R.: "A New Method for Sound Production and Reinforcement in Planetarium", IPS 2008 CONFERENCE PROCEEDINGS, 1 January 2008 (2008-01-01), pages 220 - 222, XP055303696
RODIGAST, R.: "Innovative sound in Dome Theaters", IPS 2006, MELBOURNE, pages 154 - 158
WEBER, C. ET AL: "Auralisation of Accoustical Products Properties for Technical Systems in Virtual Environments", 56TH INT. SCIENTIFIC COLLOQUIM, September 2011 (2011-09-01), pages 12 - 16

Also Published As

Publication number Publication date
EP2901717A1 (fr) 2015-08-05
EP2901717B1 (fr) 2016-10-26
FR2996095A1 (fr) 2014-03-28
WO2014049268A1 (fr) 2014-04-03
FR2996095B1 (fr) 2015-10-16

Similar Documents

Publication Publication Date Title
US11178503B2 (en) System for rendering and playback of object based audio in various listening environments
EP2901718B1 (fr) Procede et systeme de restitution d&#39;un signal audio
KR20200015662A (ko) 빔 형성 라우드스피커 어레이를 통해 생성된 오디오의 공간적 더킹
US20180098172A1 (en) Spatial Audio Rendering for Beamforming Loudspeaker Array
US8755531B2 (en) Audio system and method of operation therefor
BR112015004288B1 (pt) sistema para renderizar som com o uso de elementos de som refletidos
JP2015530043A (ja) 個々に指定可能なドライバへの上方混合されたコンテンツの反射されたおよび直接的なレンダリング
FR2790634A1 (fr) Procede de synthese d&#39;un champ sonore tridimensionnel
EP2709380B1 (fr) Enceinte acoustique active monobloc configurable pour être utilisée isolément ou par paire, avec renforcement de l&#39;image stéréo
EP2901717B2 (fr) Procede et dispositif de generation de signaux audio destines a etre fournis a un systeme de restitution sonore
FR3065137A1 (fr) Procede de spatialisation sonore
WO2017191384A1 (fr) Procédé de diffusion sonore prenant en compte les particularités individuelles
FR3106461A3 (fr) Barre de son
WO2013060761A1 (fr) Enceinte acoustique comprenant un haut-parleur coaxial a directivite controlee et variable
EP2957110B1 (fr) Procede et dispositif de generation de signaux d&#39;alimentation destines a un systeme de restitution sonore
US20200045419A1 (en) Stereo unfold technology
Pfanzagl-Cardone The Art and Science of 3D Audio Recording
EP3108670B1 (fr) Procédé et dispositif de restitution d&#39;un signal audio multicanal dans une zone d&#39;écoute
FR3114209A1 (fr) Systeme de reproduction de sons avec virtualisation du champ reverbere
FR3040253B1 (fr) Procede de mesure de filtres phrtf d&#39;un auditeur, cabine pour la mise en oeuvre du procede, et procedes permettant d&#39;aboutir a la restitution d&#39;une bande sonore multicanal personnalisee
FR3127858A1 (fr) Systeme de generation d’ondes sonores pour au moins deux zones distinctes d’un meme espace et procede associe
FR3072840A1 (fr) Arrangement spatial de dispositifs de diffusion sonore

Legal Events

Date Code Title Description
PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

Free format text: ORIGINAL CODE: 0009012

17P Request for examination filed

Effective date: 20150312

AK Designated contracting states

Kind code of ref document: A1

Designated state(s): AL AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HR HU IE IS IT LI LT LU LV MC MK MT NL NO PL PT RO RS SE SI SK SM TR

AX Request for extension of the european patent

Extension state: BA ME

RIN1 Information on inventor provided before grant (corrected)

Inventor name: NGUYEN, KHOA-VAN

Inventor name: CORTEEL, ETIENNE

DAX Request for extension of the european patent (deleted)
GRAJ Information related to disapproval of communication of intention to grant by the applicant or resumption of examination proceedings by the epo deleted

Free format text: ORIGINAL CODE: EPIDOSDIGR1

GRAP Despatch of communication of intention to grant a patent

Free format text: ORIGINAL CODE: EPIDOSNIGR1

GRAP Despatch of communication of intention to grant a patent

Free format text: ORIGINAL CODE: EPIDOSNIGR1

INTG Intention to grant announced

Effective date: 20160504

GRAS Grant fee paid

Free format text: ORIGINAL CODE: EPIDOSNIGR3

GRAA (expected) grant

Free format text: ORIGINAL CODE: 0009210

AK Designated contracting states

Kind code of ref document: B1

Designated state(s): AL AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HR HU IE IS IT LI LT LU LV MC MK MT NL NO PL PT RO RS SE SI SK SM TR

REG Reference to a national code

Ref country code: GB

Ref legal event code: FG4D

Free format text: NOT ENGLISH

REG Reference to a national code

Ref country code: CH

Ref legal event code: EP

REG Reference to a national code

Ref country code: AT

Ref legal event code: REF

Ref document number: 840749

Country of ref document: AT

Kind code of ref document: T

Effective date: 20161115

REG Reference to a national code

Ref country code: IE

Ref legal event code: FG4D

Free format text: LANGUAGE OF EP DOCUMENT: FRENCH

REG Reference to a national code

Ref country code: DE

Ref legal event code: R096

Ref document number: 602013013292

Country of ref document: DE

REG Reference to a national code

Ref country code: LT

Ref legal event code: MG4D

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: LV

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20161026

REG Reference to a national code

Ref country code: NL

Ref legal event code: MP

Effective date: 20161026

REG Reference to a national code

Ref country code: AT

Ref legal event code: MK05

Ref document number: 840749

Country of ref document: AT

Kind code of ref document: T

Effective date: 20161026

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: NO

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20170126

Ref country code: LT

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20161026

Ref country code: SE

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20161026

Ref country code: GR

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20170127

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: HR

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20161026

Ref country code: PT

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20170227

Ref country code: PL

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20161026

Ref country code: RS

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20161026

Ref country code: NL

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20161026

Ref country code: IS

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20170226

Ref country code: FI

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20161026

Ref country code: ES

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20161026

Ref country code: AT

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20161026

REG Reference to a national code

Ref country code: FR

Ref legal event code: PLFP

Year of fee payment: 5

REG Reference to a national code

Ref country code: DE

Ref legal event code: R026

Ref document number: 602013013292

Country of ref document: DE

PLBI Opposition filed

Free format text: ORIGINAL CODE: 0009260

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: RO

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20161026

Ref country code: CZ

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20161026

Ref country code: DK

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20161026

Ref country code: EE

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20161026

Ref country code: SK

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20161026

26 Opposition filed

Opponent name: STEFANIE KREMER

Effective date: 20170726

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: SM

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20161026

Ref country code: BG

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20170126

Ref country code: IT

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20161026

PLAX Notice of opposition and request to file observation + time limit sent

Free format text: ORIGINAL CODE: EPIDOSNOBS2

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: GB

Payment date: 20170914

Year of fee payment: 5

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: SI

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20161026

PLAF Information modified related to communication of a notice of opposition and request to file observations + time limit

Free format text: ORIGINAL CODE: EPIDOSCOBS2

PLBB Reply of patent proprietor to notice(s) of opposition received

Free format text: ORIGINAL CODE: EPIDOSNOBS3

RAP2 Party data changed (patent owner data changed or rights of a patent transferred)

Owner name: SENNHEISER ELECTRONIC GMBH & CO. KG

REG Reference to a national code

Ref country code: CH

Ref legal event code: PL

REG Reference to a national code

Ref country code: DE

Ref legal event code: R082

Ref document number: 602013013292

Country of ref document: DE

Representative=s name: EISENFUEHR SPEISER PATENTANWAELTE RECHTSANWAEL, DE

Ref country code: DE

Ref legal event code: R081

Ref document number: 602013013292

Country of ref document: DE

Owner name: SENNHEISER ELECTRONIC GMBH & CO. KG, DE

Free format text: FORMER OWNER: SONIC EMOTION LABS, PARIS, FR

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: MC

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20161026

REG Reference to a national code

Ref country code: IE

Ref legal event code: MM4A

REG Reference to a national code

Ref country code: BE

Ref legal event code: MM

Effective date: 20170930

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: LU

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20170925

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: LI

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20170930

Ref country code: CH

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20170930

Ref country code: IE

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20170925

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: BE

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20170930

REG Reference to a national code

Ref country code: FR

Ref legal event code: PLFP

Year of fee payment: 6

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: MT

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20161026

REG Reference to a national code

Ref country code: FR

Ref legal event code: TP

Owner name: SENNHEISER ELECTRONIC GMBH & CO. KG, DE

Effective date: 20180823

GBPC Gb: european patent ceased through non-payment of renewal fee

Effective date: 20180925

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: HU

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT; INVALID AB INITIO

Effective date: 20130925

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: CY

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20161026

Ref country code: GB

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20180925

PUAH Patent maintained in amended form

Free format text: ORIGINAL CODE: 0009272

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: PATENT MAINTAINED AS AMENDED

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: MK

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20161026

27A Patent maintained in amended form

Effective date: 20191225

AK Designated contracting states

Kind code of ref document: B2

Designated state(s): AL AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HR HU IE IS IT LI LT LU LV MC MK MT NL NO PL PT RO RS SE SI SK SM TR

REG Reference to a national code

Ref country code: DE

Ref legal event code: R102

Ref document number: 602013013292

Country of ref document: DE

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: TR

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20161026

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: AL

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20161026

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: FR

Payment date: 20230918

Year of fee payment: 11

Ref country code: DE

Payment date: 20230906

Year of fee payment: 11