WO2014049268A1 - Procede et dispositif de generation de signaux audio destines a etre fournis a un systeme de restitution sonore - Google Patents
Procede et dispositif de generation de signaux audio destines a etre fournis a un systeme de restitution sonore Download PDFInfo
- Publication number
- WO2014049268A1 WO2014049268A1 PCT/FR2013/052256 FR2013052256W WO2014049268A1 WO 2014049268 A1 WO2014049268 A1 WO 2014049268A1 FR 2013052256 W FR2013052256 W FR 2013052256W WO 2014049268 A1 WO2014049268 A1 WO 2014049268A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- speakers
- sound
- loudspeakers
- audio signal
- signals
- Prior art date
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R27/00—Public address systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/002—Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/323—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only for loudspeakers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2201/00—Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
- H04R2201/40—Details of arrangements for obtaining desired directional characteristic by combining a number of identical transducers covered by H04R1/40 but not provided for in any of its subgroups
- H04R2201/401—2D or 3D arrays of transducers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2201/00—Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
- H04R2201/40—Details of arrangements for obtaining desired directional characteristic by combining a number of identical transducers covered by H04R1/40 but not provided for in any of its subgroups
- H04R2201/405—Non-uniform arrays of transducers or a plurality of uniform arrays with different transducer spacing
Definitions
- the invention relates to the general field of acoustic treatments.
- sound reinforcement techniques are commonly used for the sound of extended rooms, such as for example a concert hall or an auditorium, in order to obtain a uniform sound level signal over the entire room.
- PA Public Address
- the placement of loudspeakers on the stage can be problematic, in order to respect certain practical and aesthetic constraints (limited space of the stage, visual rendering for the listener, etc.).
- FIG. 1A illustrates in full line the variations of the sound level expressed in decibel, of a signal rendered using a WFS type technique by a set of 16 omnidirectional loudspeakers positioned on a stage, these high speakers having a sensitivity of 92 dB and being powered by amplifiers of 250 W (watts).
- FIG. 1B illustrates by way of example (on the basis of assumptions similar to those described above for FIG. 1A):
- the elevation also called site
- the elevation perceived as a function of distance by a listener for a row of omnidirectional loudspeakers placed at the stage level
- the invention responds in particular to this need by proposing a method of generating, from an audio input signal, audio signals intended to be supplied to a sound reproduction system, this sound reproduction system comprising a first set of loudspeakers positioned at a reference height, and a second set of loudspeakers positioned at a height greater than the reference height, the loudspeakers of the second together being more directional vertically than the speakers of the first set.
- This generation method comprises:
- a sound spatialization technique taking into account the identified position of said at least one sound object of the input audio signal and a position of the speakers of the first set;
- a sound spatialization technique taking into account the identified position of said at least one sound object of the input audio signal and a position of the speakers of the second set;
- At least one of the sound spatialization techniques applied during the generation of the first and second audio signals being a holophonic technique
- the delays and / or gains applied during the generation of the first and second audio signals being chosen so that the combination of the first signals output by the first set of loudspeakers and the second signals output by the second set of loudspeakers; speakers verifies a determined sound reproduction effect at at least one reference spatial position defined for the first and second sets of speakers.
- the invention also relates to a device for generating audio signals intended for a sound reproduction system from an input audio signal, this sound reproduction system comprising a first set of loudspeakers positioned at a height of reference, and a second set of speakers positioned at a height greater than the reference height, the speakers of the second set being more vertically oriented than the speakers of the first set.
- This generation device comprises:
- a sound spatialization technique taking into account the identified position of said at least one sound object of the input audio signal and a position of the speakers of the first set;
- a sound spatialization technique taking into account the identified position of said at least one sound object of the input audio signal and a position of the speakers of the second set;
- At least one of the sound spatialization techniques applied by the means for generating the first and second audio signals being a holophonic technique
- the gains and / or delays applied by the means for generating the first and second audio signals being chosen so that the combination of the first signals output by the first set of loudspeakers and the second signals output by the second set of loudspeakers; speakers verifies a determined sound reproduction effect at at least one reference spatial position defined for the first and second sets of speakers.
- the invention proposes, in order to optimize the reproduction of the audio input signal in a room or a room, to combine two advantageous techniques, namely:
- a sound spatialization technique used to generate, from the input audio signal, the audio signals intended to supply these two sets of loudspeakers.
- the invention thus applies in a preferred but non-limiting manner to the restitution of audio signals in a large room, such as a theater or an auditorium with a stage.
- the first set of speakers is placed on or in front of the stage of the room, while the second set of speakers is placed above the stage (aligned vertically or slightly offset from the first set of speakers).
- the loudspeakers of the highest set are more directional (on average) than the speakers of the lowest set (first set).
- the invention provides the possibility for this purpose to vertically orient the speakers of the second set towards the back of the room, while the speakers of the first set can be directed to the part of the room located at near the scene.
- the vertical directivity of the speakers of the second set and its positioning in height limits the sound level restored close to the scene while ensuring a good sound level for listeners placed in the back of the room.
- the speakers of the second set therefore acts as a booster speaker for the return of the input audio signal.
- the presence of directional booster speakers above the stage advantageously reduces the power of the speakers used for the first set. Therefore, one can use for the first set of speakers less bulky because of their reduced power or more limited number.
- the invention makes it possible to overcome more easily practical and aesthetic constraints related to the positioning of the speakers in the room to restore the signals.
- the limitation of the sound level reproduced by the second set of speakers in the vicinity of the scene authorized by the invention makes it possible to favor the vertical localization of the sound objects of the signal at the level of the first set of loudspeakers, benefiting from them. an effect known as "Haas effect”.
- the location of a sound object is given by the direction from which the sound comes first to the ear (or first wavefront), even if the intensity of the sounds arriving in a second ear delay from another direction is greater than the intensity of the first wavefront.
- effect of precedence This effect, however, is not absolute and works all the better as the sound level of the following wavefronts is low.
- the delays and the gains applied in accordance with the invention are advantageously chosen so that the combination of the first signals output by the first set of loudspeakers and the second signals output by the second set of loudspeakers verifies a signal effect.
- This effect of sound restitution determined is for example the coherence (of phase) of the signals restored by the first and second sets of loudspeakers at the reference spatial position.
- the delays applied during the generation of the first and second audio signals are chosen so that the first signals output by the first set of loudspeakers and the second signals output by the second set of loudspeakers arrive simultaneously. at the reference spatial position.
- This time shift between the signals is then chosen short enough to be able to benefit from the Haas effect (that is to say typically less than 30-35 ms, for example of the order of 15 to 20 ms), and not not generate a feeling of echoes for the audience of the room.
- the gains are chosen so as to guarantee a sufficient sound level at the bottom of the room while optimizing the vertical localization with the reference position.
- the invention therefore makes it possible, on the one hand, to improve the quality of the signal reproduction compared to the state of the art, and to respond more effectively to the aesthetic and practical constraints imposed when positioning the loudspeakers in the room. .
- At least one of the sound spatialization techniques applied during the generation of the first and second audio signals is:
- a holophonic sound spatialization technique of the WFS type such as, for example, the sound spatialization technique described in document EP 2 206 365, or the technique described in the E. Corteel document titled Equalization in an Extended Area using
- Such a technique advantageously makes it possible to envelop the audience of the room in the sound stage and offer a good quality of reproduction of the audio signal; or - a dynamic matrix mixing technique.
- This technique can take the form of, for example, a stereophonic loudspeaker panning on the loudspeakers, relatively easy to implement, or alternatively a VBAP (Vector Based Amplitude Panning) or DBAP type of intensity panning. (Distance Based Amplitude Panning) known per se.
- the input audio signal is a multichannel audio signal and, during at least one of the generation steps, the same delay and / or the same gain is applied to each channel of the signal input audio.
- This embodiment facilitates the implementation of the invention, in particular by limiting the complexity associated with the choice of gains and / or delays to be applied.
- said at least one delay and / or gain is applied to the input signal before the sound spatialization technique, it is also possible to invert these two treatments.
- the input audio signal is a multichannel signal comprising a number of channels smaller than the number of loudspeakers of the first and / or second set
- the use of a gain and / or delay independent of the signal channels allows to preserve the distribution of the gains and delays affected between the loudspeakers by the sound spatialization technique.
- the first and the second signals generated by applying the gains and the delays and the sound spatialization technique are equivalent to the first and second signals generated by first applying the sound spatialization technique and then the gains and delays.
- a delay and / or a distinct gain is applied to at least two distinct channels of the input audio signal.
- the sound reproduction system further comprises at least a third set of loudspeakers positioned at a height greater than the reference height, and the generation method comprises a step of generating a loudspeaker.
- At least one delay and / or gain At least one delay and / or gain
- a sound spatialization technique taking into account the identified position of said at least one sound object of the input audio signal and a position of the loudspeakers of the third set;
- said at least one delay and / or gain being chosen so that a combination of the third signals output by the third set of speakers and signals output by one of the other speaker sets of the playback system checks a sound reproduction effect determined at a reference spatial position defined for this other set and for the third set of speakers.
- This embodiment proposes to add a set of additional booster speakers to enhance the sound reinforcement of the room.
- Such an embodiment can be very relevant for rooms of very large dimensions or having elements acoustically masking the signals returned by the loudspeakers (eg presence of balconies in a concert hall).
- the invention is not limited to a system comprising three sets of loudspeakers but it is also possible to add a fourth, a fifth, etc., set of loudspeakers, the choice of delays and / or gains applied. during the generation of the signals intended to supply these sets of loudspeakers being preferentially carried out by considering the sets of loudspeakers in pairs (eg second and third sets, third and fourth sets, etc.).
- the generating method comprises a step of generating a plurality of audio signals for supplying the set of subwoofer loudspeakers by applying to the input audio signal:
- At least one delay and / or gain At least one delay and / or gain
- said at least one delay and / or gain being selected so that the combination of the signals output by the set of subwoofer type speakers and signals output by one of the other sets of speakers of the system of restitution verifies a determined sound reproduction effect at a reference spatial position defined for this other set and for the set of speakers of the subwoofer type.
- the different steps of the generation method according to the invention are determined by instructions of computer programs.
- the invention also relates to a program on an information medium, this program being capable of being implemented in a generation device or more generally in a computer, this program comprising instructions adapted to the implementation steps of a generation method as described above.
- This program can use any programming language, and be in the form of source code, object code, or intermediate code between source code and object code, such as in a partially compiled form, or in any other form desirable shape.
- the invention also relates to a computer-readable or microprocessor-readable information medium, and comprising instructions of a program as mentioned above.
- the information carrier may be any entity or device capable of storing the program.
- the medium may comprise storage means, such as a ROM, for example a CD ROM or a microelectronic circuit ROM, or a magnetic recording medium, for example a floppy disk or a disk. hard.
- the information medium may be a transmissible medium such as an electrical or optical signal, which may be conveyed via an electrical or optical cable, by radio or by other means.
- the program according to the invention can be downloaded in particular on an Internet type network.
- the information carrier may be an integrated circuit in which the program is incorporated, the circuit being adapted to execute or to be used in the execution of the method in question.
- the invention also relates to a set of reproduction of an input audio signal comprising:
- a sound reproduction system comprising a first set of loudspeakers positioned at a reference height, and a second set of loudspeakers positioned at a height greater than the reference height, the loudspeakers of the second set being more directive vertically as the speakers of the first set;
- a device for generating audio signals according to the invention for supplying the loudspeakers of the first set and the loudspeakers of the second set of the sound reproduction system.
- the reproduction unit has the same advantages as those mentioned above for the device and the generation method.
- FIGS. 1A and 1B already described, respectively illustrate the disadvantages of sound reinforcement systems of the state of the art
- FIG. 2 schematically represents a reproduction assembly and a generating device according to the invention, in a first embodiment
- FIG. 3 illustrates an example of positioning of the two sets of loudspeakers of the restitution assembly of FIG. 2 in a room
- FIG. 4 schematically illustrates the hardware architecture of the generation device of FIG. 2, in the first embodiment
- FIG. 5 represents, in the form of a flow chart, the main steps of a generation method according to the invention as implemented in the first embodiment, by the generation device of FIG. 2;
- FIG. 6 shows the variations in the propagation time of the signals emitted by omnidirectional loudspeakers situated on and above the stage, as a function of the distance of a listener with respect to the scene;
- FIG. 7 illustrates various advantages provided by the invention, in terms of variations in the sound level of the signals as a function of the distance of a listener with respect to the scene;
- FIG. 8 schematically represents a reproduction assembly and a generation device according to the invention, in a second embodiment
- FIG. 9 illustrates an example of positioning of the three sets of loudspeakers of the rendering assembly of FIG. 8 in a room.
- FIG. 10 represents, in the form of a flow chart, the main steps of a generation method according to the invention as implemented in the second embodiment, by the generation device of FIG. 8.
- FIG. 2 represents, in its environment, a set 1 of sound reproduction of an input audio signal S, according to the invention, in a first embodiment.
- the audio signal S is a multichannel signal resulting from a sound capture (ie recording) of a signal played on a scene SCENE of a theater R , performed by microphones placed on the SCENE stage or distributed in various places of this room, in a manner known per se.
- the audio signal S possibly being a pre-recorded audio signal or having prerecorded elements. It is furthermore assumed that the audio signal S is intended to be reproduced in the theater by using the sound reproduction assembly 1 according to the invention.
- the format of the S signal may be a signal composed of individual sockets (eg for a theater, from a microphone per musician, singer or actor for live sound recording), a stereo signal, a 5.1, 7.1, or 10.2 format signal, or a signal in HOA (Higher Order Ambisonics) format, etc., or finally a combination of these techniques.
- the set 1 of sound reproduction used for the reproduction of the audio signal S comprises:
- a sound reproduction system 2 comprising a plurality of loudspeakers
- the sound reproduction system 2 comprises:
- a first set E1 of P loudspeakers denoted HP1-1, HP1-2, HP1-P, P being a positive integer greater than 1;
- a second set E2 of N loudspeakers denoted HP2-1, HP2-2,..., HP2-N, N being a positive integer greater than 1.
- the integers P and N can be equal or distinct.
- the loudspeakers HP1-1, HP1-2, HP1-P of the first set El are positioned at a height h1 referred to as reference.
- the loudspeakers HP1-1, HP1-2, HP1-P of the first set El are arranged so as to form a horizontal line of loudspeakers positioned on the SCENE stage of R.
- the reference height hl corresponding here to the height of the SCENE scene.
- the loudspeakers HP2-1, HP2-2,..., HP2-N of the second set E2 are positioned at a height h2 greater than the reference position h1. In the example of Figure 2, they are arranged to form a horizontal line of speakers positioned at height h2.
- the loudspeakers of the second set E2 are not necessarily vertically aligned with (i.e. in the same vertical plane as) the speakers of the first set El, with respect to the scene SCENE. They can be shifted in particular with respect to the speakers of the first set El in the direction of the AUDIT part of the auditorium R where the audience is.
- the invention thus also applies to other configurations of loudspeakers, such as for example to matrices speakers, or configurations distinct from a linear configuration, such as a configuration adapted to the shape of the scene (eg in an arc).
- the positioning of the loudspeakers of each set, relative to each other can be varied and varied: it will be possible to consider speakers distributed uniformly within the set of speakers, or distributed according to several groups placed at the ends and at the optical center of the scene, etc.
- the invention advantageously offers the possibility of having a number N of loudspeakers of the second set E2 smaller than the number P of loudspeakers of the first set El.
- the number of speakers required for each set of speakers can therefore be determined by setting the desired aliasing frequency and the position of a reference listener in the room relative to the scene. Since the loudspeakers of the second set E2 are further away from the reference listener than the loudspeakers of the first set E1, because of their positioning in height, it is possible by this means to set a more limited number of loudspeakers. speakers for the set E2 that for the set El.
- the speakers HP2-1, HP2-2, ..., HP2-N of the second set E2 are more vertically oriented than the speakers HP1-1, HP1-2, HP1-N of the first set El.
- the “speakers HP2-1, HP2-2, ..., HP2-N of the second set E2 are more vertically oriented than the speakers HP1-1, HP1-2 , HP1-N of the first set El "that the average directivity of the speakers of the second set is greater than the average directivity of the speakers of the first set.
- omnidirectional loudspeakers for the first set E1
- the loudspeakers of the second set E2 are chosen with a vertical opening of between 10 ° and 60 °.
- the speakers HP2-1, HP2-2, ..., HP2-N of the second set E2 are primarily intended to provide the sound coverage of the part of the theater, or at least the audience, the farthest from the stage. To this end, they are oriented vertically towards the EXT end of the audience (which corresponds in Figure 3 at the back of the theater for the sake of simplification).
- the speakers HP1-1, HP1-2, HP1-P of the first set El are primarily intended to provide the sound coverage of the part of the theater, or at least the audience, placed at near the stage. To this end, they are mounted on the stage or just in front of the stage.
- They can be indifferently omnidirectional or directional vertically.
- the speakers of the first set El are directional vertically, they are oriented towards the front of the AUDIT part of the room, that is to say, towards the part located near the scene.
- the different loudspeakers of the sets E1 and E2 are powered by multichannel audio signals, denoted respectively Sl-1, Sl-2,..., Sl-P and S2-1, S2-2, S2-N, generated according to to the invention by the generation device 3 from the input audio signal S.
- the generation device 3 relies on various software modules, namely:
- a module 3A able to identify the positions of the different objects OBJ (or sources) sound included in the input signal S;
- Modules 3B1 and 3B2 capable of independently applying on the input signal S, a delay ⁇ 1 and a gain G1, and a delay ⁇ 2 and a gain G2 respectively.
- the delays ⁇ and ⁇ 2 can be positive, negative or zero, and the gains G1 and G2 can be lower, greater than or equal to 1; and
- Modules 3C1 and 3C2 capable of independently applying on the signals coming respectively from the modules 3B1 and 3B2, sound spatialization techniques noted respectively T1 and T2.
- the generation device 3 here has the hardware architecture of a computer, as schematically illustrated in FIG. 4.
- It comprises in particular a processor (or microprocessor) 4, a random access memory 5, a read-only memory 6, a non-volatile flash memory 7 as well as communication means 8 able to transmit and receive audio signals.
- the communication means 8 comprise, on the one hand, means for receiving the input audio signal S, and, on the other hand, an interface (wired or wireless) with the loudspeakers HP1-1, HP1-2, HP1-P of the set El and with the loudspeakers HP2-1, HP2-2, ..., HP2-N of the set E2 to provide them with the audio signals Sl-1, Sl-2, .. ., Sl-P and S2-1, S2-2, S2-N.
- These means are known to those skilled in the art and will not be described further here.
- the read-only memory 6 of the generation device 3 constitutes a recording medium in accordance with the invention, readable by the (micro) processor 4 and on which is recorded a computer program according to the invention, comprising instructions for performing the steps of a generation method described later with reference to Figure 5. It should be noted that no limitation is attached to the nature itself of the generation device 3.
- the generation device 3 may be in the form of a computer as illustrated in FIG. 4, or alternatively of an electronic chip or of an integrated circuit, in which the computer program comprising the instructions for carrying out the generation method according to the invention is incorporated.
- modules 3A, 3B1, 3B2, 3C1 and 3C2 on which the generation device 3 is based can alternatively be DSP (Digital Signal Processor) or FPGA (Field Programmable Gate Array) modules.
- DSP Digital Signal Processor
- FPGA Field Programmable Gate Array
- the generation device 3 receives the multichannel input audio signal S via its communication means 8 (step E10).
- the audio signal S is generated nor to its actual format.
- the generating device 3 is supplied, via a suitable interface, with the POS positions (OBJ) of the sound objects OBJ included in the signal S and that we want to restore.
- OBJ POS positions
- These positions are identified in a horizontal plane, namely in the horizontal plane in which the speakers of the first set are located (ie the scene plane SCENE here, S being obtained by capturing the played signals on the scene S), in terms of angle and distance with respect to a predetermined and predetermined point of origin.
- This interface is for example a graphical interface developed for this purpose allowing a user to interact with the device 3, or a communication interface developed with a mixer operating on the signal S.
- step E20 Obtaining these positions by the generation device 3 constitutes an identification step (step E20) of the position of at least one sound object of the input audio signal S within the meaning of the invention.
- the POS (OBJ) positions of the OBJ sound objects are identified directly by the generation device 3 and more specifically by the module 3A.
- the module 3A can use a position tracking device (or “tracking" in English) of sound objects present on the scene, known per se, and operating with optical and / or electromagnetic signals, and / or acoustic, etc.
- a position tracking device or "tracking" in English
- the module 3A of the generation device 3 implements a method of spatial analysis known per se, based on a decomposition of the signal S in sub-phase. frequency bands.
- module 3A Various spatial analysis methods can be used by module 3A.
- the module 3A can use a spatial analysis method based on the evaluation of correlations and level differences between the channels of the audio signal S.
- the module 3A may use a spatial analysis method based on the determination of a Gerzon vector representative of the input audio signal S, as described in US 2007/0269063.
- the Gerzon vector of a multichannel audio signal reflects in a known manner the spatial location of the multichannel audio signal as perceived by the listener from a given position.
- the module 3A can implement a spatial decomposition of the multichannel signal in spherical harmonics, as described in the document WO 2012/025580.
- This decomposition allows a very precise spatial analysis of the multichannel audio signal and the sound objects composing it.
- several sound objects can be identified for the same frequency subband.
- two types of processing are also applied by the generating device 3 to the input audio signal S to generate the signals intended to supply the two sets E1 and E2 of loudspeakers.
- the module 3B1 first applies to the input signal S, the delay ⁇ and the gain G1 previously mentioned (step E30). This delay ⁇ and this gain G1 have been chosen and supplied to the module 3B1 during a preliminary configuration or calibration step (step E_CALIB) described later.
- the signal SI resulting from the application of the delay ⁇ and the gain G1 on the signal S is then supplied by the module 3B1 to the module 3C1.
- the module 3C1 applies the sound spatialization technique T1 to the signal SI, and thus generates the plurality of signals Sl-1, Sl-2,..., Sl-P (step E40).
- the T1 technique is for example a holophonic technique of the wavefront synthesis type, also known under the name of Wave Field Synthesis (WFS) technique, as described in document EP 2 206 365 or in the document D E. Corteel cited above.
- WFS Wave Field Synthesis
- the position of the loudspeakers HP1-1, HP1-2, HP1-P of the set E1 can be determined by the generating device 3 itself, automatically or semi-automatically, using for example a position tracking device as described above.
- the signals Sl-1, Sl-2,..., Sl-P generated by the module 3C1 are then supplied to the loudspeakers HP1-1, HP1-2, HP1-P of the set El (step E50) for to be returned.
- the module 3B2 applies to the input signal S, the delay ⁇ 2 and gain G2 mentioned above (step E60), determined and supplied to the module 3B2 during the configuration step E_CALIB also.
- the same gain G2 and the same delay ⁇ 2 are applied here to all the channels of the input signal SIG.
- the signal S2 resulting from this operation is provided by the module 3B2 to the module 3C2.
- the latter applies to the signal S2 the sound spatialization technique T2, and thus generates the plurality of signals S2-1, S2-2, ..., S2-N (step E70).
- the T2 technique is for example also a holophonic technique of the WFS type as described in the document EP 2 206 365. It takes into account on the one hand the POS (OBJ) positions of the sound objects identified and provided by the module 3A. and on the other hand, the position of the speakers HP2-1, HP2-2, ..., HP2-N of the set E2, to create virtual sources from the loudspeakers HP2-1, HP2- 2, ..., HP2-N from the set E2 to the POS (OBJ) positions.
- POS POS
- modules 3C1 and 3C2 apply separate sound spatialization techniques T1 and T2 to the signals S1 and S2 for generating the signals intended to supply the two sets E1 and E2 of loudspeakers.
- the position of the speakers HP2-1, HP2-2, ..., HP2-N of the set E2 has, in the first embodiment described here, been provided to the device 3 of generation also during the step of preliminary configuration E_CALIB, by the installer of the set 1 rendering via the aforementioned user interface.
- the signals S2-1, S2-2, ..., S2-N generated by the module 3C2 are supplied to the loudspeakers HP2-1, HP2-2, ..., HP2-N of the set E2 (step E80), to be restored.
- the delays and the gains (T1, G1) and (T2, G2) applied to the input audio signal S by the modules 3B1 and 3B2 for respectively generating the signals Sl-1, Sl-2, ..., S1-P and S2-1, S2-2, ..., S2-N have been chosen, during the preliminary configuration step E_CALIB, so as to ensure that the combination, at a position of reference Pref (E1, E2) defined for the sets of speakers E1 and E2, signals restored by the first set E1 of the loudspeakers supplied by the signals S1-1, S1-2, ..., S1-P , and signals output by the second set E2 of loudspeakers fed by the signals S2-1, S2-2, ..., S2-N, verify a determined sound effect (in other words, desired, chosen).
- spatial position here we mean both a point in the space characterizing the position of a target listener in the room, and a wider area of the space in which is (are) likely to find one or more listeners.
- the choice of the reference position Pref (E1, E2) depends of course on several criteria, such as in particular the depth of the room in which the audio signal S is restored. It is chosen preferentially around the middle of the room, slightly shifted towards the stage.
- FIG. 3 illustrates an example of the choice of reference position Pref (E1, E2) for room R.
- the position Pref (E1, E2) can be chosen so as to guarantee that the vertical position of the second set E2 of loudspeakers perceived at this position Pref (E1, E2) is approximately equal to an angle (for example 45 °), selected to limit the vertical perception error;
- the position Pref (E1, E2) may coincide with the spatial position at which the sound level "naturally" restored (that is to say without applying gains to the signals) by each set of speakers E1 and E2 is similar;
- the position Pref (E1, E2) can also depend on the configuration of the room, and in particular the location, if necessary, of the seats intended for the listeners in the room (eg existence of corridors in the room, etc.).
- the delays and the gains applied to the input signal depend on the sound reproduction effect that it is desired to obtain at the reference position Pref (E1, E2) for the combination of the signals restored by the first set El and by the second set E2.
- the desired sound reproduction effect may be the arrival in phase coherence, at the reference spatial position Pref (E1, E2), of the signals restored by the first set El and of the signals restored by the second together E2.
- This phase coherence is ensured when the signals restored by the first set E1 and the signals restored by the second set E2 simultaneously arrive at the reference position Pref (E1, E2) with a similar sound level.
- FIG. 6 represents the variations in the propagation time of the signals broadcast by omnidirectional loudspeakers (the propagation time being independent of the vertical directivity of the loudspeakers), as a function of the distance to the scene, for a set of loudspeakers positioned at the stage level (solid line curve) and 6.0 m above the stage (dashed line curve).
- This figure illustrates the natural Haas effect, described above, which benefits the system 2 of restitution near the scene (delay offset near the scene).
- the gains Gl and G2 are chosen in order to ensure a sufficient sound level at the back of the room, while optimizing the vertical location of the sound objects restored to the reference position.
- the delays and the gains (T1, G1) and (T2, G2) making it possible to obtain such a desired sound reproduction effect at the reference position Pref (E1, E2) are chosen (ie adjusted) at the during the E_CALIB configuration step.
- This choice or adjustment can be made manually (for example experimentally, using sound level measurements) or automatically via numerical simulations.
- the delays ⁇ and ⁇ 2, and the gains G1 and G2, to be applied to the input audio signal S are determined and adjusted empirically in a second phase to obtain the desired sound reproduction effect.
- These delays ⁇ and ⁇ 2, and these gains Gl and G2 can be the subject of several tests, and be adjusted to each test, by trial and error.
- this second adjustment phase can be performed by simulation.
- the step E_CALIB may further comprise an ultimate phase of more precise adjustment of the delays and gains determined during the second phase, by using known signals, via new physical measurements and / or by numerical simulation.
- the setting of delays and gains can be made either globally or independently on each frequency band of a set of predefined frequency bands.
- a gain and a delay are determined per frequency band studied. This advantageously makes it possible to take into account the frequency dependence of the directivity of the loudspeakers of the second set E2.
- FIG. 7 illustrates various advantages provided by the set 1 of reproduction, in terms of variations of the sound level as a function of the distance of the listener with respect to the scene.
- the loudspeakers of the set E2 are directional loudspeakers vertically having a vertical opening of 90 °.
- FIG. 7 shows that, thanks to the use of directional loudspeakers for the set E2, the sound level of the signal restored by the set E2 perceived near the scene is less important (see curve in lines discontinued).
- the difference in sound levels between the signals restored by the set E1 (represented by the curve in solid line) and the signals restored by the set E2 is almost constant for distances to the scene greater than 8 m (setting in coherence of the sound levels reached by the invention), so that it is possible by appropriate choice delays ⁇ and ⁇ 2 to benefit from a Haas effect to the bottom of the room.
- the reproduction unit 1 comprises two sets of speakers E1 and E2.
- the reproduction unit 1 further comprises another set of speakers of the subwoofer or subwoofer type, to add an additional effect during the sound reproduction of the input audio signal.
- a plurality of audio signals for supplying this set of subwoofer type loudspeakers is generated by the generation device 3 by applying to the input audio signal:
- At least one delay and / or gain At least one delay and / or gain
- the delay and / or the gain thus applied are chosen so that the combination of the signals reproduced by the set of speakers of the subwoofer type and the signals restored by one of the sets E1 and E2 verify a restitution effect. sound determined at a reference spatial position defined for this set and for the set of speakers subwoofers type.
- the set El is a row of loudspeakers HP1-1, HP1-P located on the scene SCENE, at the height h1;
- the set E2 is a line of N loudspeakers HP2-1,..., HP2-N situated above the scene SCENE, at the height h2.
- the number N of speakers and their spacing depend on the width of the scene: N typically varies between 4 and 12 speakers, spaced from 80 cm to 5 m.
- the number P of loudspeakers of the set E1 is greater than or equal to the number N of loudspeakers of the set E2.
- the speakers HP2-1, ..., HP2-N are on average more vertically oriented than the speakers HP1-1, HP1-P of the set El. More precisely, in this example 1:
- the loudspeakers HP1-1, HP1-P of the set El have a vertical opening varying from 80 ° to 120 °, and are oriented towards the front of the stage (ie towards the front of the audience );
- the N loudspeakers HP2-1, ..., ⁇ 2- ⁇ of the set E2 have a vertical opening varying from 60 ° to 90 °, and are oriented towards the bottom of the room (part of the audience the further away from the scene).
- the modules 3C1 and 3C2 use techniques T1 and T2 of sound spatialization of the WFS type enabling the creation of virtual sources at the positions of the sound objects of the signal S identified by the module 3A. These positions are provided in Example 1 to Module 3A via a graphical user interface.
- the modules 3B1 and 3B2 are configured so as to apply a non-zero delay to the signal S and to attenuate it (gains G1, G2 less than 1).
- the gains and delays (T1, G1) and (T2, G2) respectively applied by the modules 3B1 and 3B2 are chosen so that the signals restored by the sets E1 and E2 at the reference position Pref (E1, E2) arrive with a similar sound level (within plus or minus 3 decibels), and simultaneously or almost simultaneously (with a tolerance of plus or minus 5 ms).
- the set El is a row of loudspeakers HP1-1, HP1-P located on the scene SCENE, at the height h1;
- the set E2 comprises N loudspeakers HP2-1,..., HP2-N of type "line array" in English (line source) located above the SCENE scene, at the height h2, and distributed on the along the stage.
- N 3
- loudspeakers are in a known manner particularly powerful and have a significant vertical directivity and thus a small opening.
- the number P of loudspeakers of the set El and the spacing between them depend on the width of the scene, and the distance separating the loudspeakers of the first set El from the loudspeakers of the second set E2: P varies typically between 4 and 30 speakers, spaced from 50 cm to 3 m.
- the loudspeakers HP2-1,..., HP2-N are on average more vertically oriented than the loudspeakers HP1-1, HP1-P of the set El. More precisely, in this case first example:
- the loudspeakers HP1-1, HP1-P of the set El have a vertical opening varying from 80 ° to 120 °, and are oriented towards the front of the stage (ie towards the front of the audience );
- the N loudspeakers HP2-1, ..., HP2-N of the set E2 have a vertical opening varying from 10 ° to 60 °, and are oriented towards the back of the room (part of the audience the further away from the scene).
- the 3C1 module uses a WFS type sound spatialization technique allowing the creation of virtual sources at the positions of the sources identified in the signal S by module 3A. These positions are provided in example 2 to module 3A via a mixer operating on the signal S.
- the module 3C2 uses a dynamic matrix mixing sound spatialization T2 technique in the form of a stereophonic intensity panning as a function of the position of the sound objects of the signal S identified by the module 3A.
- the modules 3B1 and 3B2 are configured so as to apply a non-zero delay to the signal S and to attenuate it (gains G1, G2 less than 1).
- the gains and delays (T1, G1) and (T2, G2) respectively applied by the modules 3B1 and 3B2 are chosen so that the signals restored by the sets E1 and E2 at the reference position Pref (E1, E2) arrive with a similar sound level (within plus or minus 3 decibels), and simultaneously or almost simultaneously (with a tolerance of plus or minus 5 ms).
- the set E comprises P loudspeakers HP1-1, HP1-P situated on the SCENE stage, at the height h1;
- the set E2 comprises N loudspeakers HP2-1,..., HP2-N of the "line array” type, located above the SCENE stage, at the height h2.
- the number N of loudspeakers and their spacing depend on the width of the scene: N typically varies between 4 and 12 loudspeakers, spaced from 80 cm to 5 m.
- the playback assembly 1 further comprises in this example a set designated by Elow of L speakers HPIow-1, HPlow-L low-frequency (subwoofers) arranged on or below the scene SCENE.
- the number P of loudspeakers of the set El and the spacing between them depend on the width of the scene, and the distance separating the loudspeakers of the first set El from the loudspeakers of the second set E2: P varies typically between 4 and 30 speakers, spaced from 50 cm to 3 m.
- the loudspeakers HP2-1,..., HP2-N are on average more vertically oriented than the loudspeakers HP1-1, HP1-P of the set El. More precisely, in this case first example:
- the loudspeakers HP1-1, HP1-P of the set El have a vertical dispersion varying from 80 ° to 120 °, and are oriented towards the front of the stage (ie towards the front of the audience );
- the N loudspeakers HP2-1,..., HP2-N of the set E2 have a vertical dispersion ranging from 10 ° to 60 °, and are oriented toward the back of the room (part of the audience the further away from the scene).
- the module 3C1 uses a sound spatialization technique T1 of the WFS type enabling the creation of virtual sources at the positions of the sound objects identified in the signal S by the module 3A.
- the module 3C2 uses a technique T2 of sound spatialization of WFS type also allowing the creation of virtual sources at the positions of the sound objects identified in the signal S by the module 3A.
- the T2 technique is for example a WFS technique as described in the document E. Corteel cited above, so as to compensate for the horizontal directivity characteristics of the line array loudspeakers of the E2 set.
- the positions of the sound objects of the signal S are identified directly here by the module 3A by means of a device for tracking the positions of the sound objects present on the SCENE stage (eg instruments or characters, etc.).
- the generation device 3 further comprises, according to this example, a 3Blow module adapted to apply a gain and a delay to the input audio signal S, and a 3Clow module capable of applying a low-pass filtering to the signal from the 3Blow module for generate signals to power the Elow speakers.
- a 3Blow module adapted to apply a gain and a delay to the input audio signal S
- a 3Clow module capable of applying a low-pass filtering to the signal from the 3Blow module for generate signals to power the Elow speakers.
- the modules 3B1, 3B2 and 3Blow are configured so as to apply a non-zero delay to the signal S and attenuate it (gains lower than 1).
- the gains and delays (T1, G1) and (T2, G2) respectively applied by the modules 3B1 and 3B2 are chosen so that the signals restored by the set E2 arrive with an offset of 10 or 20 ms with respect to the restored signals.
- the set E1 at the reference position Pref (E1, E2) with a similar sound level (within plus or minus 3 decibels), so as to benefit from the Haas effect described in the document by Blauert et al. cited previously.
- the delay and gain applied by the 3Blow module are chosen so that the signals restored by the Elow and El sets at a reference spatial position Pref (Elow, El) defined for the Elow and El sets (similar to the position Pref (El, E2)) arrive with a similar sound level (within plus or minus 3 decibels) in their respective frequency bands, and simultaneously or almost simultaneously (with a tolerance of plus or minus 5 ms).
- FIGS. 8 to 10 a second embodiment of the invention in which, for the reproduction of the input audio signal S, a sound reproduction assembly comprising three sets of loudspeakers is considered. El, E2 and E3, the sets E2 and E3 acting as sets of booster speakers.
- FIG. 8 represents, in its environment, a set 1 of sound reproduction, according to the invention, in this second embodiment.
- FIGS. 8 to 10 The elements similar to the first embodiment described with reference to FIGS. 2 to 5 are referenced identically in FIGS. 8 to 10.
- the set of sound reproduction comprises:
- a sound reproduction system 2 ' comprising a plurality of loudspeakers; and A device 3 'for generating audio signals intended to supply the loudspeakers of the sound reproduction system 2'.
- the sound reproduction system 2 'differs from the sound reproduction system 2 illustrated in FIGS. 2 and 3 in that it also comprises a third set E3 of K loudspeakers, denoted HP3-1, HP3-2, .. ., HP3-K, where K is a positive integer greater than 1.
- the loudspeakers HP3-1, HP3-2,..., HP3-K are positioned at a height h3 greater than the reference height h1, in a vertical plane located closer to the bottom of the room as the vertical plane in which are positioned the speakers of the set E2.
- the loudspeakers of the set E3 can be omnidirectional chosen, if the set E3 is intended to compensate for the presence of masking elements such as balconies for example, or on the contrary they can be chosen more directive on average vertically than the El set loudspeakers, and be oriented, similar to the speakers of the set E2 to the bottom of the room.
- the number K of loudspeakers in the third set E3 may be equal to or distinct from the numbers P and N of loudspeakers in the sets E1 and E2.
- the various loudspeakers of the set E3 are powered by multichannel audio signals, denoted respectively S3-1, S3-2,..., S3-K generated by the device 3 'of generation from the audio signal of entrance S.
- the device 3 'of generation is based on:
- the module 3B3 adapted to apply on the signal S, a delay ⁇ 3 and a gain G3, identical here on each channel of the signal S;
- the module 3C3 capable of applying to the signal from the module 3B3 a sound spatialization technique T3.
- the device 3 'of generation here has the hardware architecture of a computer, similar to that of the generation device 3 described above with reference to FIG. 4.
- the means of communication of the device 3' of generation are however distinguished from the means communication device of the generation device 3 further comprising an interface (wired or wireless) with the speakers HP3-1, HP3-2, ..., HP3- of the assembly E3.
- the ROM of the device 3 'of generation constitutes a recording medium according to the invention, readable by the (micro) processor of the device 3' and on which is recorded a computer program according to the invention, comprising instructions for performing the steps of a generation method now described with reference to FIG.
- FIG. 10 illustrates the main steps of a generation method according to the invention, as implemented, in the second embodiment, by the device 3 'for generating on reception of the input audio signal S , to generate and provide the signals S1-1, S1-2, ..., S1-P, S2-1, S2-2, S2-N and S3-1, S3-2, S3-K to the sets E1, E2 and E3 of high- speakers respectively.
- step E10 the generation device 3 'receives the multichannel input audio signal S via its communication means.
- the device 3 'of generation via a suitable interface, the positions designated by POS (OBJ) of the sound objects OBJ included in the signal S and which it is desired to restore (step E20).
- These treatments are applied independently for each set of loudspeakers, via three distinct signal processing chains comprising for the first, the module 3B1 and the module 3C1, for the second, the module 3B2 and the module 3C2, and for the third , module 3B3 and module 3C3. These three treatment chains preferentially operate simultaneously.
- modules 3B1, 3C1, 3B2 and 3C2 proceed in a manner similar to the first embodiment to generate the signals Sl-1, Sl-2,..., Sl-P intended to feed the set E1 and the signals S2-1, S2-2, ..., S2-N for supplying the set E2 (steps E30 to E80 illustrated in Figure 5).
- the module 3B3 applies to the signal S the delay ⁇ 3 and the gain G3 mentioned above (step E90), thereby generating a signal S3.
- This delay ⁇ 3 and this gain G3 have been determined and supplied to the module 3B3 during a preliminary configuration step E_CALIB 'described later.
- the module 3C3 then applies to the signal S3 supplied at the output of the module, the sound spatialization technique T3 (step E100), thereby generating the plurality of signals S3-1, S3-2, ..., S3-K.
- the technique T3 is for example a holophonic technique of the WFS type as described in document EP 2 206 365. It takes into account firstly the POS positions (OBJ) of the sound objects identified and provided by the module 3A, and on the other hand, the position of the HP3-1, HP3-2, ..., HP3-K speakers in the E3 set, to create virtual sources from the HP3-1, HP3-2 loudspeakers , ..., HP3-K from the E3 set to the POS (OBJ) positions.
- OBJ POS positions
- the signals S3-1, S3-2, ..., S3-K generated by the module 3C3 are supplied to the speakers HP3-1, HP3-2, ..., HP3-K of the set E3 (step E110), to be restored.
- the delays ⁇ , ⁇ 2 and ⁇ 3, and the gains Gl, G2 and G3 are chosen by considering the sets of speakers El, E2 and E3 two by two. More precisely, they are chosen so as to verify:
- This spatial position Pref (E2, E3) can be defined according to criteria similar to those adopted to define the spatial position Pref (E1, E2) described above.
- the combination of the signals restored by the sets E1 and E3 may be considered instead of the sets E2 and E3.
- the preliminary configuration step E_CALIB takes place in two stages, during which we consider the sets E1 and E2 respectively, and the sets E2 and E3 on the other hand.
- the final phase of adjustment can, on the other hand, take into account the signals restored by the three sets in order to be more precise in the estimation of the delays ⁇ , ⁇ 2 and ⁇ 3 and of the gains Gl, G2, and G3.
- the setting of delays and gains can be made either globally or independently on each frequency band of a set of predefined frequency bands.
- a gain and a delay are determined per frequency band studied. This advantageously makes it possible to take into account the frequency dependence of the directivity of the loudspeakers of the second set E2 and, if appropriate, of the third set E3.
- the restitution unit comprises three sets E1, E2 and E3, two sets of which act as a set of return speakers for room R.
- the invention is not limited to two sets of booster speakers, and it is possible, within the context of the invention, to consider adding other sets E4, E5, ... of loudspeakers. recall in the room.
- the delays and / or the gains applied by the device 3 'of generation to generate the signals intended to supply these sets will be chosen in a manner similar to the delay and the gain applied by the module 3B3, that is to say, considering the sets of speakers of the reproduction system in pairs (eg El with E2, then E2 with E3, then E3 with E4, etc.).
- the set E comprises P loudspeakers HP1-1, HP1-P situated on the SCENE stage, at the height h1;
- the set E2 comprises N loudspeakers HP2-1,..., HP2-N situated above the scene SCENE, at the height h2.
- the number N of loudspeakers and their spacing depend on the width of the scene: N typically varies between 4 and 12 loudspeakers, spaced from 80 cm to 5 m;
- the E3 set includes K speakers HP3-1, ..., HP3-K arranged in the room, above the audience, in the middle of the AUDIT part.
- the number K of loudspeakers and their spacing depend on the width of the scene: K typically varies between 4 and 12 loudspeakers, spaced from 80 cm to 5 m.
- the speakers HP2-1, ..., HP2-N are on average more directional vertically than the speakers HP1-1, HP1-P of the set El. More precisely, in this example 4:
- the loudspeakers HP1-1, HP1-P of the set El have a vertical opening varying from 80 ° to 120 °, and are oriented towards the front of the stage (ie towards the front of the audience );
- the N loudspeakers HP2-1, ..., HP2-N of the set E2 have a vertical opening varying from 60 ° to 90 °, and are oriented towards the back of the room (part of the audience the further away from the scene).
- the K loudspeakers HP3-1,..., HP3-K of the set E3 are also on average more directional vertically than the loudspeakers HP1-1, HP1-P of the El set. They have a vertical opening varying from 60 ° to 90 °, and are also directed towards the back of the room (part of the audience furthest away from the stage).
- the modules 3C1, 3C2 and 3C3 use techniques T1, T2 and T3 for sound spatialization of the WFS type enabling the creation of virtual sources at the positions of the objects identified in the signal S by the module 3A. These positions are provided in Example 4 to Module 3A via a graphical user interface.
- the modules 3B1, 3B2 and 3B3 are configured so as to apply a non-zero delay to the signal S and attenuate it (gains G1, G2 and G3 less than 1).
- the gains and delays (T1, G1) and (T2, G2) respectively applied by the modules 3B1 and 3B2 are chosen so that the signals restored by the sets E1 and E2 at the reference position Pref (E1, E2) arrive with a similar sound level (within plus or minus 3 decibels), and simultaneously or almost simultaneously (with a tolerance of plus or minus 5 ms).
- the delay and the gain (T3, G3) applied by the module 3B3 are chosen so that the signals restored by the sets E2 and E3 at the reference position Pref (E2, E3) arrive with a similar sound level (within plus or minus 3 decibels) in their respective frequency bands, and simultaneously or almost simultaneously (with a tolerance of plus or minus 5 ms).
- the position Pref (E2, E3) is chosen farther from the SCENE scene than the position Pref (E1, E2), towards the back of the room.
- the gain / delay application and the application of the sound spatialization technique on the input audio signal are implemented in separate steps by separate modules.
- these two processes can be performed simultaneously by the same module (i.e. by the modules 3C1, 3C2 and optionally 3C3 respectively), during the application of the sound spatialization technique.
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Stereophonic System (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
Le procédé de génération, à partir d'un signal audio d'entrée, de signaux audio destinés à être fournis à un système de restitution sonore comprenant un premier ensemble de haut-parleurs à une hauteur de référence, et un deuxième ensemble de haut-parleurs à une hauteur supérieure à la hauteur de référence, plus directifs verticalement que les haut-parleurs du premier ensemble, comprend : — l'identification d'une position d'au moins un objet sonore du signal audio d'entrée; — la génération de premiers signaux audio d'alimentation du premier ensemble en appliquant au signal audio d'entrée au moins un retard et/ou un gain et une technique de spatialisation sonore tenant compte de la position identifiée et d'une position des haut-parleurs du premier ensemble; — la génération de deuxièmes signaux audio d'alimentation du deuxième ensemble en appliquant au signal audio d'entrée au moins un retard et/ou un gain et une technique de spatialisation sonore tenant compte de la position identifiée et d'une position des haut-parleurs du deuxième ensemble; au moins une technique de spatialisation sonore étant une technique holophonique et les retards et/ou les gains étant choisis de sorte que la combinaison des premiers signaux restitués par le premier ensemble et des seconds signaux restitués par le deuxième ensemble vérifie un effet de restitution sonore déterminé à au moins une position spatiale de référence.
Description
Procédé et dispositif de génération de signaux audio destinés à être fournis à un système de restitution sonore.
Arrière-plan de l'invention
L'invention se rapporte au domaine général des traitements acoustiques.
Elle concerne plus particulièrement une technique de renforcement sonore. De façon connue, les techniques de renforcement sonore sont couramment utilisées pour la sonorisation de salles étendues, telles que par exemple une salle de concert ou un auditorium, afin d'obtenir un signal restitué uniforme en niveau sonore sur l'ensemble de la salle.
Ces techniques doivent vérifier une double contrainte, à savoir assurer un niveau sonore suffisamment important pour les auditeurs situés au fond de la salle sans pour autant augmenter outre mesure ce niveau sonore, afin de limiter notamment la gêne des auditeurs situés à proximité de la scène ou des enceintes.
A cet effet, des systèmes connus de renforcement sonore s'appuient sur des systèmes de diffusion sonore Public Address (P.A.) permettant d'émettre vers des auditeurs placés au fond de la salle à distance de la scène, éventuellement combinés à des lignes de haut-parleurs de renfort ou de rappel (« front fill » en anglais) de faible puissance placées au bord de la scène et destinées aux auditeurs situés devant et dans l'axe de la scène.
Ces systèmes souffrent toutefois de divers inconvénients.
Ainsi, notamment, le placement des haut-parleurs sur la scène peut s'avérer problématique, en vue de respecter certaines contraintes pratiques et esthétiques (encombrement limité de la scène, rendu visuel pour l'auditeur, etc.).
Par ailleurs, ces systèmes n'offrent généralement pas la possibilité d'avoir une restitution sonore spatialisée des signaux dans la salle.
II existe également dans l'état de la technique, des systèmes de renforcement sonore qui s'appuient sur des techniques holophoniques dites de synthèse de front d'ondes ou Wave Field Synthesis (WFS) en anglais, et offrent une restitution sonore spatialisée des signaux dans la salle.
Ces systèmes utilisent des lignes horizontales de haut-parleurs omnidirectionnels, placées sur la scène, qui permettent de restituer les objets sonores des signaux à diverses positions précises dans la salle (i.e. bonne localisation horizontale des objets sonores), de sorte à créer chez les auditeurs une perception d'enveloppement dans la scène sonore, ainsi qu'une cohérence entre les informations visuelles et auditives perçues par ces auditeurs, et une meilleure intelligibilité des objets sonores.
Un tel système est présenté par exemple dans le document EP 2 206 365. Cependant, si l'utilisation de tels systèmes pour le renforcement sonore permet une bonne localisation à la fois horizontale et verticale des objets sonores des signaux, elle se heurte toutefois à certaines limites.
En effet, l'atténuation du niveau sonore des signaux restitués en fonction de la distance à la scène est relativement rapide et nécessite donc une augmentation substantielle du niveau sonore restitué par la ligne de haut-parleurs, ce qui peut occasionner une gêne pour les auditeurs proches de la scène.
A titre d'exemple, la figure 1A illustre en trait plein les variations du niveau sonore exprimé en décibel, d'un signal restitué en utilisant une technique de type WFS par un ensemble de 16 haut-parleurs omnidirectionnels positionnés sur une scène, ces haut-parleurs ayant une sensibilité de 92 dB et étant alimentés par des amplificateurs de 250 W (watts).
En outre, un tel système requiert généralement l'utilisation d'un nombre important de haut-parleurs, ce qui peut s'avérer problématique pour des raisons pratiques et esthétiques, comme mentionné précédemment.
Une solution pour pallier en partie à ces inconvénients consiste à placer les lignes horizontales de haut-parleurs omnidirectionnels au-dessus de la scène.
Comme illustré en traits interrompus à la figure 1A pour une ligne de haut-parleurs constituée de 9 haut-parleurs placés à une hauteur de 6m de la scène (sensibilité de 97 dB et amplificateurs de 250 W), une telle solution permet de restituer un meilleur niveau sonore pour les auditeurs situés au fond de la salle tout en limitant le niveau sonore diffusé à proximité des auditeurs situés près de la scène.
Toutefois cette solution présente l'inconvénient d'une mauvaise perception par l'auditeur de la localisation verticale des objets sonores du signal restitué, notamment lorsque celui-ci se trouve à proximité de la scène.
La figure 1B illustre à titre d'exemple (sur la base d'hypothèses similaires à celles décrites précédemment pour la figure 1A) :
— en trait plein, l'élévation (aussi appelée site) perçue en fonction de la distance par un auditeur pour une ligne de haut-parleurs omnidirectionnels placée au niveau de la scène ; et
— en traits interrompus, l'élévation perçue en fonction de la distance par un auditeur pour une ligne de haut-parleurs omnidirectionnels placée à une hauteur de 6m par rapport au niveau de la scène.
Il existe donc un besoin d'une technique et d'un dispositif de renforcement sonore ne présentant pas les divers inconvénients précités.
Objet et résumé de l'invention
L'invention répond notamment à ce besoin en proposant un procédé de génération, à partir d'un signal audio d'entrée, de signaux audio destinés à être fournis à un système de restitution sonore, ce système de restitution sonore comprenant un premier ensemble de haut- parleurs positionnés à une hauteur de référence, et un deuxième ensemble de haut-parleurs positionnés à une hauteur supérieure à la hauteur de référence, les haut-parleurs du deuxième
ensemble étant plus directifs verticalement que les haut-parleurs du premier ensemble. Ce procédé de génération comprend :
— une étape d'identification d'une position d'au moins un objet sonore du signal audio d'entrée ;
— une étape de génération d'une pluralité de premiers signaux audio destinés à alimenter le premier ensemble de haut-parleurs, en appliquant au signal audio d'entrée :
o au moins un retard et/ou un gain ; et
o une technique de spatialisation sonore tenant compte de la position identifiée dudit au moins un objet sonore du signal audio d'entrée et d'une position des haut-parleurs du premier ensemble ;
— une étape de génération d'une pluralité de deuxièmes signaux audio destinés à alimenter le deuxième ensemble de haut-parleurs, en appliquant au signal audio d'entrée :
o au moins un retard et/ou un gain ; et
o une technique de spatialisation sonore tenant compte de la position identifiée dudit au moins un objet sonore du signal audio d'entrée et d'une position des haut-parleurs du deuxième ensemble ;
au moins l'une des techniques de spatialisation sonore appliquées lors de la génération des premiers et des seconds signaux audio étant une technique holophonique ; et
les retards et/ou les gains appliqués lors de la génération des premiers et des seconds signaux audio étant choisis de sorte que la combinaison des premiers signaux restitués par le premier ensemble de haut-parleurs et des seconds signaux restitués par le deuxième ensemble de haut- parleurs vérifie un effet de restitution sonore déterminé à au moins une position spatiale de référence définie pour les premier et second ensembles de haut-parleurs.
Corrélativement, l'invention vise également un dispositif de génération de signaux audio destinés à un système de restitution sonore à partir d'un signal audio d'entrée, ce système de restitution sonore comprenant un premier ensemble de haut-parleurs positionnés à une hauteur de référence, et un deuxième ensemble de haut-parleurs positionnés à une hauteur supérieure à la hauteur de référence, les haut-parleurs du deuxième ensemble étant plus directifs verticalement que les haut-parleurs du premier ensemble. Ce dispositif de génération comprend :
— des moyens d'identification d'une position d'au moins un objet sonore du signal audio d'entrée ;
— des moyens de génération d'une pluralité de premiers signaux audio destinés à alimenter le premier ensemble de haut-parleurs, aptes à appliquer au signal audio entrée :
o au moins un retard et/ou un gain ; et
o une technique de spatialisation sonore tenant compte de la position identifiée dudit au moins un objet sonore du signal audio d'entrée et d'une position des haut-parleurs du premier ensemble ;
— des moyens de génération d'une pluralité de deuxièmes signaux audio destinés à alimenter le deuxième ensemble de haut-parleurs, aptes à appliquer au signal audio entrée :
o au moins un retard et/ou un gain ; et
o une technique de spatial isation sonore tenant compte de la position identifiée dudit au moins un objet sonore du signal audio d'entrée et d'une position des haut-parleurs du deuxième ensemble ;
au moins l'une des techniques de spatialisation sonore appliquées par les moyens de génération des premiers et des seconds signaux audio étant une technique holophonique ; et
les gains et/ou retards appliqués par les moyens de génération des premiers et des seconds signaux audio étant choisis de sorte que la combinaison des premiers signaux restitués par le premier ensemble de haut-parleurs et des seconds signaux restitués par le deuxième ensemble de haut-parleurs vérifie un effet de restitution sonore déterminé à au moins une position spatiale de référence définie pour les premier et second ensembles de haut-parleurs.
Autrement dit, l'invention propose, pour optimiser la restitution du signal audio d'entrée dans une salle ou dans une pièce, d'allier deux techniques avantageuses, à savoir :
— une technique de renforcement sonore, s'appuyant sur un système de restitution composé de deux ensembles de haut-parleurs distincts, positionnés à des hauteurs différentes et ayant des directivités verticales différentes ; et
— une technique de spatialisation sonore utilisée pour générer, à partir du signal audio d'entrée, les signaux audio destinés à alimenter ces deux ensembles de haut-parleurs.
L'invention s'applique ainsi de façon privilégiée mais non limitative à la restitution de signaux audio dans une salle de grandes dimensions, telle une salle de spectacle ou un auditorium doté(e) d'une scène.
Préférentiellement, pour optimiser la restitution du signal audio d'entrée, le premier ensemble de haut-parleurs est placé sur ou devant la scène de la salle, tandis que le deuxième ensemble de haut-parleurs est placé au-dessus de la scène (aligné verticalement ou légèrement décalé par rapport au premier ensemble de haut-parleurs).
Conformément à l'invention, les haut-parleurs de l'ensemble positionné le plus haut (deuxième ensemble) sont plus directifs (en moyenne) que les haut-parleurs de l'ensemble positionné le plus bas (premier ensemble).
Il est donc possible d'orienter verticalement le deuxième ensemble de haut-parleurs différemment du premier ensemble, de sorte que le son restitué par ces deux ensembles de haut- parleurs couvre la salle de façon uniforme en termes de niveau sonore.
Plus précisément, l'invention offre la possibilité à cet effet d'orienter verticalement les haut-parleurs du deuxième ensemble vers le fond de la salle, tandis que les haut-parleurs du premier ensemble peuvent être orientés vers la partie de la salle située à proximité la scène. Ainsi il est possible de diffuser le signal audio d'entrée avec un niveau sonore uniforme, y compris à une grande distance de la scène, sans augmenter de façon trop importante ce niveau sonore.
Autrement dit, la directivité verticale des haut-parleurs du deuxième ensemble et son positionnement en hauteur permet de limiter le niveau sonore restitué à proximité de la scène tout en garantissant un bon niveau sonore pour les auditeurs placés dans le fond de la salle.
Les haut-parleurs du deuxième ensemble joue donc un rôle de haut-parleurs de rappel pour la restitution du signal audio d'entrée.
En outre, la présence de haut-parleurs de rappel directifs au-dessus de la scène permet avantageusement de réduire la puissance des haut-parleurs utilisés pour le premier ensemble. De ce fait, on peut utiliser pour le premier ensemble des haut-parleurs moins encombrants du fait de leur puissance réduite ou en nombre plus limité. L'invention permet de s'affranchir plus aisément des contraintes pratiques et esthétiques liées au positionnement des haut-parleurs dans la salle pour restituer les signaux.
Par ailleurs, la limitation du niveau sonore restitué par le deuxième ensemble de haut- parleurs à proximité de la scène autorisée par l'invention permet de favoriser la localisation verticale des objets sonores du signal au niveau du premier ensemble de haut-parleurs, en bénéficiant d'un effet connu sous le nom « d'effet Haas ».
Cet effet Haas, qui concerne la perception des sons par le cerveau humain, est décrit notamment dans le document de J. Blauert intitulé « Spatial Hearing - Revised Edition : The Psychophysics of Human Sound Localization », MIT Press, Rev. Sub. Edition, 2 octobre 1996.
Selon cet effet, la localisation d'un objet sonore est donnée par la direction d'où provient le son qui arrive en premier à l'oreille (ou premier front d'onde), et ce même si l'intensité des sons arrivant dans un deuxième temps à l'oreille en provenance d'une autre direction, est supérieure à l'intensité du premier front d'onde. On parle « d'effet de précédence ». Cet effet n'est cependant pas absolu et fonctionne d'autant mieux que le niveau sonore des fronts d'onde suivants est faible.
De plus, l'utilisation de deux ensembles de haut-parleurs pour restituer le signal audio d'entrée et la directivité des haut-parleurs du deuxième ensemble combinée à l'utilisation d'une technique de spatialisation sonore sont pris en compte, conformément à l'invention, via l'application de retards et/ou de gains sur le signal audio d'entrée lors de la génération des signaux destinés à alimenter les premier et deuxième ensembles de haut-parleurs.
Ces retards et ces gains sont appliqués de façon indépendante pour chaque ensemble de haut-parleurs, de même qu'un espace de spatialisation sonore est envisagé pour chaque ensemble de haut-parleurs séparément.
Toutefois, les retards et les gains appliqués conformément à l'invention sont avantageusement choisis de sorte que la combinaison des premiers signaux restitués par le premier ensemble de haut-parleurs et des seconds signaux restitués par le deuxième ensemble de haut-parleurs vérifie un effet de restitution sonore déterminé à une position spatiale de référence définie dans la salle pour les premier et second ensembles de haut-parleurs.
Cet effet de restitution sonore déterminé est par exemple la cohérence (de phase) des signaux restitués par les premier et deuxième ensembles de haut-parleurs à la position spatiale de référence. A cette fin, les retards appliqués lors de la génération des premiers et des seconds signaux audio sont choisis de sorte que les premiers signaux restitués par le premier ensemble de haut-parleurs et les deuxièmes signaux restitués par le deuxième ensemble de haut-parleurs arrivent simultanément à la position spatiale de référence.
En variante, on peut choisir d'accentuer l'effet « Haas » naturel précédemment décrit, occasionné par le positionnement en hauteur et la directivité verticale du deuxième ensemble de haut-parleurs, en appliquant lors de la génération des premiers et des seconds signaux audio, des retards choisis de sorte que les deuxièmes signaux restitués par le deuxième ensemble de haut- parleurs arrivent avec un décalage prédéterminé à la position spatiale de référence par rapport aux premiers signaux restitués par le premier ensemble.
Ce décalage temporel entre les signaux est alors choisi suffisamment court pour pouvoir bénéficier de l'effet Haas (c'est-à-dire typiquement inférieur à 30-35 ms, par exemple de l'ordre de 15 à 20 ms), et ne pas générer une sensation d'échos pour les auditeurs de la salle.
Grâce à l'effet Haas ainsi accentué, un auditeur entendra en premier lieu les signaux restitués par les haut-parleurs du premier ensemble placé à la hauteur de référence (par exemple sur scène), ce qui permet d'améliorer davantage la localisation verticale des objets sonores perçue par l'auditeur.
En outre, l'accentuation de l'effet Haas par le biais du choix des retards appliqués aux premiers et aux deuxièmes signaux offre la possibilité de réduire davantage la puissance des haut- parleurs du premier ensemble, et de ce fait d'utiliser des haut-parleurs moins encombrants ou en un nombre encore plus limité.
Les gains, dans l'une ou l'autre des variantes envisagées pour le réglage des retards, sont choisis de sorte à garantir un niveau sonore suffisant en fond de salle tout en optimisant la localisation verticale à la position de référence.
L'invention permet donc d'une part d'améliorer la qualité de la restitution du signal par rapport à l'état de la technique, et de répondre plus efficacement aux contraintes esthétiques et pratiques imposées lors du positionnement des haut-parleurs dans la salle.
Dans un mode particulier de réalisation, au moins l'une des techniques de spatialisation sonore appliquées lors de la génération des premiers et des deuxièmes signaux audio est :
— une technique holophonique de spatialisation sonore de type WFS, telle que par exemple la technique de spatialisation sonore décrite dans le document EP 2 206 365, ou la technique décrite dans le document de E. Corteel intitulé « Equalization in an Extended Area using
Multichannel Inversion and Wave Field Synthesis », J. Audio Eng. Soc. Vol. 54, n°12, décembre 2006 : une telle technique permet avantageusement d'envelopper les auditeurs de la salle dans la scène sonore et offrent une bonne qualité de restitution du signal audio ; ou
— une technique de mixage matriciel dynamique. Cette technique peut prendre la forme par exemple d'un panoramique stéréophonique d'intensité sur les haut-parleurs, relativement facile à mettre en œuvre, ou en variante d'un panoramique d'intensité de type VBAP (Vector Based Amplitude Panning) ou DBAP (Distance Based Amplitude Panning) connus en soi.
En variante, on peut bien entendu envisager d'autres techniques de spatialisation sonore.
Dans un mode particulier de réalisation, le signal audio d'entrée est un signal audio multicanal et, au cours d'au moins l'une des étapes de génération, le même retard et/ou le même gain est appliqué sur chaque canal du signal audio d'entrée.
Ce mode de réalisation facilite la mise en œuvre de l'invention, notamment en limitant la complexité liée au choix des gains et/ou retards à appliquer.
Bien que préférentiellement au cours d'au moins l'une des étapes de génération, ledit au moins un retard et/ou gain est appliqué sur le signal d'entrée avant la technique de spatialisation sonore, il est également possible d'inverser ces deux traitements.
Dans ce cas, et lorsque le signal audio d'entrée est un signal multicanal comprenant un nombre de canaux inférieurs au nombre de haut-parleurs du premier et/ou du deuxième ensemble, on privilégiera l'application d'un même retard et/ou d'un même gain à tous les canaux du signal audio d'entrée (autrement dit, le retard et le gain appliqué au signal audio d'entrée est indépendant du canal et de la position des objets sonores du signal audio d'entrée).
Par ailleurs, lorsque l'application dudit au moins un gain et/ou retard est mise en œuvre après la technique de spatialisation sonore, l'utilisation d'un gain et/ou d'un retard indépendants des canaux du signaux (et donc identiques pour tous les canaux) permet de préserver la répartition des gains et des retards affectée entre les haut-parleurs par la technique de spatialisation sonore.
II convient de noter que lorsque les techniques de spatialisation sonores appliquées lors de la génération des premiers et des deuxièmes signaux d'alimentation des haut-parleurs sont linéaires (c'est le cas par exemple de techniques de type WFS ou plus généralement de techniques basées sur l'utilisation d'un filtrage linéaire) et que les gains et/ou retards appliqués au signal d'entrée sont indépendants des canaux de ce signal d'entrée, les premiers et les seconds signaux générés en appliquant d'abord les gains et les retards puis la technique de spatialisation sonore sont équivalents aux premiers et les seconds signaux générés en appliquant d'abord la technique de spatialisation sonore puis les gains et les retards.
Dans un autre mode de réalisation, on peut envisager qu'au cours d'au moins l'une des étapes de génération, un retard et/ou un gain distinct est appliqué sur au moins deux canaux distincts du signal audio d'entrée.
Dans un mode particulier de réalisation, le système de restitution sonore comprend en outre au moins un troisième ensemble de haut-parleurs positionnés à une hauteur supérieure à la hauteur de référence, et le procédé de génération comprend une étape de génération d'une
pluralité de troisièmes signaux audio destinés à alimenter le troisième ensemble de haut-parleurs en appliquant au signal audio entrée :
— au moins un retard et/ou un gain ; et
— une technique de spatialisation sonore tenant compte de la position identifiée dudit au moins un objet sonore du signal audio d'entrée et d'une position des haut-parleurs du troisième ensemble ;
ledit au moins un retard et/ou un gain étant choisi de sorte qu'une combinaison des troisièmes signaux restitués par le troisième ensemble de haut-parleurs et des signaux restitués par l'un des autres ensembles de haut-parleurs du système de restitution vérifie un effet de restitution sonore déterminé à une position spatiale de référence définie pour cet autre ensemble et pour le troisième ensemble de haut-parleurs.
Ce mode de réalisation propose d'ajouter un ensemble de haut-parleurs de rappel supplémentaire pour améliorer le renforcement sonore de la salle.
Un tel mode de réalisation peut s'avérer très pertinent pour des salles de très grandes dimensions ou disposant d'éléments masquant acoustiquement les signaux restitués par les haut- parleurs (ex. présence de balcons dans une salle de concert).
On notera que l'invention ne se limite pas à un système comprenant trois ensembles de haut-parleurs mais on peut également ajouter un quatrième, un cinquième, etc., ensemble de haut-parleurs, le choix des retards et/ou des gains appliqués lors de la génération des signaux destinés à alimenter ces ensembles de haut-parleurs étant préférentiellement effectué en considérant les ensembles de haut-parleurs deux à deux (ex. deuxième et troisième ensembles, troisième et quatrième ensembles, etc.).
Dans un autre mode de réalisation, on peut envisager d'ajouter également au système de restitution un autre ensemble de haut-parleurs de type caissons de grave (ou « subwoofers » en anglais), pour ajouter un effet supplémentaire lors de la restitution sonore du signal audio d'entrée. De façon similaire, dans ce mode de réalisation, le procédé de génération comprend une étape de génération d'une pluralité de signaux audio destinés à alimenter l'ensemble de haut- parleurs de type caissons de grave en appliquant au signal audio entrée :
— au moins un retard et/ou un gain ; et
— un filtrage de type passe-bas ;
ledit au moins un retard et/ou un gain étant choisi de sorte que la combinaison des signaux restitués par l'ensemble de haut-parleurs de type caissons de grave et des signaux restitués par l'un des autres ensembles de haut-parleurs du système de restitution vérifie un effet de restitution sonore déterminé à une position spatiale de référence définie pour cet autre ensemble et pour l'ensemble de haut-parleurs de type caissons de grave.
Dans un mode particulier de réalisation, les différentes étapes du procédé de génération selon l'invention sont déterminées par des instructions de programmes d'ordinateurs.
En conséquence, l'invention vise aussi un programme sur un support d'informations, ce programme étant susceptible d'être mis en œuvre dans un dispositif de génération ou plus généralement dans un ordinateur, ce programme comportant des instructions adaptées à la mise en œuvre des étapes d'un procédé de génération tel que décrit ci-dessus.
Ce programme peut utiliser n'importe quel langage de programmation, et être sous la forme de code source, code objet, ou de code intermédiaire entre code source et code objet, tel que dans une forme partiellement compilée, ou dans n'importe quelle autre forme souhaitable.
L'invention vise aussi un support d'informations lisible par un ordinateur ou par un microprocesseur, et comportant des instructions d'un programme tel que mentionné ci-dessus.
Le support d'informations peut être n'importe quelle entité ou dispositif capable de stocker le programme. Par exemple, le support peut comporter un moyen de stockage, tel qu'une ROM, par exemple un CD ROM ou une ROM de circuit microélectronique, ou encore un moyen d'enregistrement magnétique, par exemple une disquette (floppy dise) ou un disque dur.
D'autre part, le support d'informations peut être un support transmissible tel qu'un signal électrique ou optique, qui peut être acheminé via un câble électrique ou optique, par radio ou par d'autres moyens. Le programme selon l'invention peut être en particulier téléchargé sur un réseau de type Internet.
Alternativement, le support d'informations peut être un circuit intégré dans lequel le programme est incorporé, le circuit étant adapté pour exécuter ou pour être utilisé dans l'exécution du procédé en question.
L'invention vise également un ensemble de restitution d'un signal audio d'entrée comprenant :
— un système de restitution sonore comprenant un premier ensemble de haut-parleurs positionnés à une hauteur de référence, et un deuxième ensemble de haut-parleurs positionnés à une hauteur supérieure à la hauteur de référence, les haut-parleurs du deuxième ensemble étant plus directifs verticalement que les haut-parleurs du premier ensemble ; et
— un dispositif de génération de signaux audio selon l'invention pour alimenter les haut-parleurs du premier ensemble et les haut-parleurs du deuxième ensemble du système de restitution sonore.
L'ensemble de restitution bénéficie des mêmes avantages que ceux cités précédemment pour le dispositif et le procédé de génération.
On peut également envisager, dans d'autres modes de réalisation, que le procédé de génération, le dispositif de génération et l'ensemble de restitution selon l'invention présentent en combinaison tout ou partie des caractéristiques précitées.
Brève description des dessins
D'autres caractéristiques et avantages de la présente invention assortiront de la description faite ci-dessous, en référence aux dessins annexés qui en illustrent des exemples de réalisation dépourvus de tout caractère limitatif. Sur les figures :
— les figures 1A et 1B, déjà décrites, illustrent respectivement des inconvénients des systèmes de renforcement sonore de l'état de la technique ;
— la figure 2 représente, de façon schématique, un ensemble de restitution et un dispositif de génération conformes à l'invention, dans un premier mode de réalisation ;
— la figure 3 illustre un exemple de positionnement des deux ensembles de haut-parleurs de l'ensemble de restitution de la figure 2 dans une salle ;
— la figure 4 illustre, de façon schématique, l'architecture matérielle du dispositif de génération de la figure 2, dans le premier mode de réalisation ;
— la figure 5 représente, sous forme d'ordinogramme, les principales étapes d'un procédé de génération selon l'invention telles qu'elles sont mises en uvre dans le premier mode de réalisation, par le dispositif de génération de la figure 2 ;
— la figure 6 représente les variations du temps de propagation des signaux émis par des haut- parleurs omnidirectionnels situés sur et au-dessus de la scène, en fonction de la distance d'un auditeur par rapport à la scène ;
— la figure 7 illustre divers avantages procurés par l'invention, en termes de variations du niveau sonore des signaux en fonction de la distance d'un auditeur par rapport à la scène ;
— la figure 8 représente, de façon schématique, un ensemble de restitution et un dispositif de génération conformes à l'invention, dans un second mode de réalisation ;
— la figure 9 illustre un exemple de positionnement des trois ensembles de haut-parleurs de l'ensemble de restitution de la figure 8 dans une salle ; et
— la figure 10 représente, sous forme d'ordinogramme, les principales étapes d'un procédé de génération selon l'invention telles qu'elles sont mises en œuvre dans le second mode de réalisation, par le dispositif de génération de la figure 8.
Description détaillée de l'invention
La figure 2 représente, dans son environnement, un ensemble 1 de restitution sonore d'un signal audio d'entrée S, conforme à l'invention, dans un premier mode de réalisation.
Dans l'exemple envisagé ici, on suppose à titre illustratif que le signal audio S est un signal multicanal résultant d'une capture (i.e. d'un enregistrement) sonore d'un signal joué sur une scène SCENE d'une salle de spectacle R, réalisée par des microphones placés sur la scène SCENE ou répartis à divers endroits de cette salle, de façon connue en soi.
Cette hypothèse n'est cependant pas limitative, le signal audio S pouvant être en variante un signal audio préenregistré ou comportant des éléments préenregistrés.
On suppose par ailleurs que le signal audio S est destiné à être restitué dans la salle de spectacle en utilisant l'ensemble 1 de restitution sonore conforme à l'invention.
Aucune limitation n'est attachée à proprement parler au format du signal S : ainsi, il peut s'agir aussi bien d'un signal composé de prises individuelles (ex. pour une salle de spectacle, provenant d'un microphone par musicien, chanteur ou acteur pour une prise de son en direct), d'un signal stéréo, que d'un signal au format 5.1, 7.1, ou 10.2, ou encore d'un signal dans un format HOA (Higher Order Ambisonics), etc., ou enfin d'une combinaison de ces techniques.
Conformément à l'invention, l'ensemble 1 de restitution sonore utilisé pour la restitution du signal audio S comprend :
— un système 2 de restitution sonore comprenant une pluralité de haut-parleurs ; et
— un dispositif 3 de génération de signaux audio destinés à alimenter les haut-parleurs du système 2 de restitution sonore.
Plus précisément, dans le premier mode de réalisation illustré à la figure 2, le système 2 de restitution sonore comprend :
— un premier ensemble El de P haut-parleurs, notés HP1-1, HP1-2, HP1-P, P étant un entier positif supérieur à 1 ; et
— un deuxième ensemble E2 de N haut-parleurs, notés HP2-1, HP2-2, ..., HP2-N, N étant un entier positif supérieur à 1.
Les nombres entiers P et N peuvent être égaux ou distincts.
Comme illustré à la figure 3, les haut-parleurs HP1-1, HP1-2, HP1-P du premier ensemble El sont positionnés à une hauteur hl dite de référence.
Plus précisément, dans l'exemple de la figure 2, les haut-parleurs HP1-1, HP1-2, HP1-P du premier ensemble El sont arrangés de sorte à former une ligne horizontale de haut- parleurs positionnés sur la scène SCENE de la salle de spectacle R. La hauteur de référence hl correspondant donc ici à la hauteur de la scène SCENE.
Conformément à l'invention, les haut-parleurs HP2-1, HP2-2, ..., HP2-N du deuxième ensemble E2 sont positionnés à une hauteur h2 supérieure à la position de référence hl. Dans l'exemple de la figure 2, ils sont arrangés de sorte à former une ligne horizontale de haut-parleurs positionnée à la hauteur h2.
II convient de noter que les haut-parleurs du deuxième ensemble E2 ne sont pas nécessairement alignés verticalement avec (i.e. dans le même plan vertical que) les haut-parleurs du premier ensemble El, par rapport à la scène SCENE. Ils peuvent être notamment décalés par rapport aux haut-parleurs du premier ensemble El en direction de la partie AUDIT de la salle de spectacle R où se trouve l'auditoire.
Par ailleurs, aucune limitation n'est attachée à proprement parler à l'arrangement des haut-parleurs au sein du premier ensemble El et du deuxième ensemble E2. L'invention s'applique ainsi également à d'autres configurations de haut-parleurs, telles que par exemple à des matrices
de haut-parleurs, ou à des configurations distinctes d'une configuration linéaire, comme par exemple à une configuration adaptée à la forme de la scène (ex. en arc de cercle).
De même, le positionnement des haut-parleurs de chaque ensemble, les uns par rapport aux autres, peut être divers et varié : on pourra ainsi envisager des haut-parleurs répartis uniformément au sein de l'ensemble de haut-parleurs, ou répartis selon plusieurs groupes placés aux extrémités et au centre optique de la scène, etc.
Plusieurs exemples d'arrangement de haut-parleurs seront décrits ultérieurement pour illustrer l'invention.
On notera que l'invention offre avantageusement la possibilité d'avoir un nombre N de haut-parleurs du deuxième ensemble E2 plus petit que le nombre P de haut-parleurs du premier ensemble El.
En effet, de façon connue en soi, l'utilisation d'ensembles de haut-parleurs de taille finie induit un phénomène de repliement (« aliasing » en anglais) de spectre spatial. Ce phénomène se produit à partir d'une fréquence de repliement ou fréquence « d'aliasing » qui, comme mentionné dans le document EP 2 206 365, augmente en fonction de la distance de l'auditeur par rapport à la scène.
Le nombre de haut-parleurs nécessaires pour chaque ensemble de haut-parleurs peut donc être déterminé en fixant la fréquence d'aliasing désirée et la position d'un auditeur de référence dans la salle par rapport à la scène. Les haut-parleurs du deuxième ensemble E2 étant plus éloignés de l'auditeur de référence que les haut-parleurs du premier ensemble El, du fait de leur positionnement en hauteur, il est possible par ce biais de fixer un nombre plus limité de haut- parleurs pour l'ensemble E2 que pour l'ensemble El.
Conformément à l'invention, les haut-parleurs HP2-1, HP2-2, ..., HP2-N du deuxième ensemble E2 sont plus directifs verticalement que les haut-parleurs HP1-1, HP1-2, HP1-N du premier ensemble El.
Au sens de l'invention, on entend par « les haut-parleurs HP2-1, HP2-2, ..., HP2-N du deuxième ensemble E2 sont plus directifs verticalement que les haut-parleurs HP1-1, HP1-2, HP1-N du premier ensemble El » que la directivité moyenne des haut-parleurs du deuxième ensemble est plus grande que la directivité moyenne des haut-parleurs du premier ensemble.
Ainsi, à titre illustratif, on peut utiliser pour le premier ensemble El des haut-parleurs omnidirectionnels, tandis que les haut-parleurs du deuxième ensemble E2 sont choisis avec une ouverture verticale comprise entre 10° et 60°.
Comme mentionné précédemment, les haut-parleurs HP2-1, HP2-2, ..., HP2-N du deuxième ensemble E2 sont essentiellement destinés à assurer la couverture sonore de la partie de la salle de spectacle, ou tout du moins de l'auditoire, la plus éloignée de la scène. A cette fin, ils sont orientés verticalement vers l'extrémité EXT de l'auditoire (qui correspond sur la figure 3 au fond de la salle de spectacle par souci de simplification).
Au contraire, les haut-parleurs HP1-1, HP1-2, HP1-P du premier ensemble El sont essentiellement destinés à assurer la couverture sonore de la partie de la salle de spectacle, ou tout du moins de l'auditoire, placée à proximité de la scène. A cette fin, ils sont donc montés sur la scène ou juste devant la scène.
Ils peuvent être indifféremment omnidirectionnels ou directifs verticalement. Lorsque les haut-parleurs du premier ensemble El sont directifs verticalement, ils sont orientés vers l'avant de la partie AUDIT de la salle, c'est-à-dire, vers la partie située à proximité de la scène.
Les différents haut-parleurs des ensembles El et E2 sont alimentés par des signaux audio multicanaux, notés respectivement Sl-1, Sl-2,..., Sl-P et S2-1, S2-2, S2-N, générés conformément à l'invention par le dispositif 3 de génération à partir du signal audio d'entrée S.
Pour générer ces signaux, dans le premier mode de réalisation décrit ici, le dispositif 3 de génération s'appuie sur différents modules logiciels, à savoir :
— un module 3A, apte à identifier les positions des différents objets OBJ (ou sources) sonores compris dans le signal d'entrée S ;
— des modules 3B1 et 3B2 aptes à appliquer indépendamment sur le signal d'entrée S, un retard τ1 et un gain Gl, et un retard τ2 et un gain G2 respectivement. Les retards τΐ et τ2 peuvent être positifs, négatifs ou nuls, et les gains Gl et G2 peuvent être inférieurs, supérieurs ou égaux à 1 ; et
— des modules 3C1 et 3C2 aptes à appliquer indépendamment sur les signaux issus respectivement des modules 3B1 et 3B2, des techniques de spatialisation sonore notées respectivement Tl et T2.
Les caractéristiques de ces modules seront décrites plus en détail ultérieurement. Le dispositif 3 de génération dispose ici de l'architecture matérielle d'un ordinateur, telle qu'illustrée schématiquement à la figure 4.
II comporte notamment un processeur (ou micro-processeur) 4, une mémoire vive 5, une mémoire morte 6, une mémoire flash non volatile 7 ainsi que des moyens de communication 8 aptes à émettre et à recevoir des signaux audio.
Les moyens de communication 8 comprennent d'une part, des moyens de réception du signal audio d'entrée S, et d'autre part, une interface (filaire ou sans fil) avec les haut-parleurs HP1-1, HP1-2, HP1-P de l'ensemble El et avec les haut-parleurs HP2-1, HP2-2, ..., HP2-N de l'ensemble E2 pour leur fournir les signaux audio Sl-1, Sl-2,..., Sl-P et S2-1, S2-2, S2-N. Ces moyens sont connus de l'homme du métier et ne seront pas décrits davantage ici.
La mémoire morte 6 du dispositif 3 de génération constitue un support d'enregistrement conforme à l'invention, lisible par le (micro-)processeur 4 et sur lequel est enregistré un programme d'ordinateur conforme à l'invention, comportant des instructions pour l'exécution des étapes d'un procédé de génération décrites ultérieurement en référence à la figure 5.
Il convient de noter qu'aucune limitation n'est attachée à la nature à proprement parler du dispositif 3 de génération.
Ainsi, notamment, le dispositif 3 de génération peut se présenter sous la forme d'un ordinateur comme illustré à la figure 4, ou en variante d'une puce électronique ou d'un circuit intégré, dans lequel le programme d'ordinateur comprenant les instructions pour l'exécution du procédé de génération selon l'invention est incorporé.
De façon similaire, les modules 3A, 3B1, 3B2, 3C1 et 3C2 sur lesquels s'appuient le dispositif 3 de génération peuvent être en variante des modules DSP (Digital Signal Processor) ou FPGA (Field Programmable Gâte Array).
Nous allons maintenant décrire, en référence à la figure 5, les principales étapes d'un procédé de génération selon l'invention, telles qu'elles sont mises en œuvre, dans le premier mode de réalisation, par le dispositif 3 de génération, sur réception du signal audio d'entrée S, pour générer et fournir les signaux Sl-1, Sl-2,..., Sl-P et S2-1, S2-2, S2-N aux ensembles El et E2 de haut-parleurs respectivement.
On suppose donc ici que le dispositif 3 de génération reçoit le signal audio d'entrée multicanal S via ses moyens de communication 8 (étape E10). Comme mentionné précédemment, aucune limitation n'est attachée à la façon dont le signal audio S est généré ni à son format à proprement parler.
Dans le premier mode de réalisation décrit ici, on suppose par ailleurs qu'on fournit au dispositif 3 de génération, par l'intermédiaire d'une interface adaptée, les positions POS(OBJ) des objets sonores OBJ compris dans le signal S et que l'on souhaite restituer. Ces positions sont identifiées dans un plan horizontal, à savoir dans le plan horizontal dans lequel se situent les haut- parleurs du premier ensemble (c'est-à-dire le plan de la scène SCENE ici, S étant obtenu par capture des signaux joués sur la scène S), en termes d'angle et de distance par rapport à un point d'origine déterminé et prédéfini.
Cette interface est par exemple une interface graphique développée à cet effet permettant à un utilisateur d'interagir avec le dispositif 3, ou une interface de communication développée avec une table de mixage opérant sur le signal S.
L'obtention de ces positions par le dispositif 3 de génération constitue une étape d'identification (étape E20) de la position d'au moins un objet sonore du signal audio d'entrée S au sens de l'invention.
Dans un autre mode de réalisation, les positions POS(OBJ) des objets sonores OBJ sont identifiées directement par le dispositif 3 de génération et plus spécifiquement par le module 3A.
A cette fin, le module 3A peut utiliser un dispositif de suivi de position (ou « tracking » en anglais) des objets sonores présents sur la scène, connu en soi, et fonctionnant à l'aide de signaux optiques et/ou électromagnétiques, et/ou acoustiques, etc.
Dans un autre mode de réalisation encore, pour déterminer la position des objets sonores du signal S, le module 3A du dispositif 3 de génération met en oeuvre une méthode d'analyse spatiale connue en soi, basée sur une décomposition du signal S en sous-bandes fréquentielles.
Diverses méthodes d'analyse spatiale peuvent être utilisées par le module 3A.
Ainsi par exemple, le module 3A peut utiliser une méthode d'analyse spatiale basée sur l'évaluation de corrélations et de différences de niveaux entre les canaux du signal audio S.
En variante, le module 3A peut utiliser une méthode d'analyse spatiale basée sur la détermination d'un vecteur de Gerzon représentatif du signal audio d'entrée S, telle que décrite dans le document US 2007/0269063. Le vecteur de Gerzon d'un signal audio multicanal reflète en effet de façon connue la localisation spatiale du signal audio multicanal telle qu'elle est perçue par l'auditeur depuis une position déterminée.
Selon une autre variante, le module 3A peut mettre en œuvre une décomposition spatiale du signal multicanal en harmoniques sphériques, telle que décrite dans le document WO 2012/025580. Cette décomposition permet une analyse spatiale très précise du signal audio multicanal et des objets sonores le composant. Ainsi, notamment, plusieurs objets sonores peuvent être identifiés pour une même sous-bande fréquentielle.
Conformément à l'invention, deux types de traitement sont par ailleurs appliqués par le dispositif 3 de génération au signal audio d'entrée S pour générer les signaux destinés à alimenter les deux ensembles El et E2 de haut-parleurs.
Ces traitements sont appliqués indépendamment pour chaque ensemble de haut- parleurs, via deux chaînes de traitement du signal distinctes comprenant pour l'une le module 3B1 et le module 3C1, et pour l'autre le module 3B2 et le module 3C2. Ces deux chaînes de traitement opèrent préférentiellement simultanément.
Ainsi, plus précisément, dans le premier mode de réalisation décrit ici, le module 3B1 applique tout d'abord au signal d'entrée S, le retard τΐ et le gain Gl mentionnés précédemment (étape E30). Ce retard τΐ et ce gain Gl ont été choisis et fournis au module 3B1 au cours d'une étape de configuration ou de calibrage préliminaire (étape E_CALIB) décrite ultérieurement.
Par souci de simplification, on suppose ici que le même gain Gl et le même retard τΐ sont appliqués par le module 3B1 à l'ensemble des canaux du signal d'entrée S.
Cette hypothèse n'est toutefois pas limitative et dans un autre mode de réalisation, on peut envisager d'appliquer un gain et un retard distincts aux différents canaux constituant le signal d'entrée S.
Le signal SI résultant de l'application du retard τΐ et du gain Gl sur le signal S est ensuite fourni par le module 3B1 au module 3C1.
Le module 3C1 applique au signal SI la technique de spatialisation sonore Tl, et génère ainsi la pluralité de signaux Sl-1, Sl-2,..., Sl-P (étape E40).
La technique Tl est par exemple une technique holophonique de type synthèse de front d'ondes, aussi connue sous l'appellation de technique WFS (Wave Field Synthesis en anglais), telle que décrite dans le document EP 2 206 365 ou dans le document d'E. Corteel cité précédemment.
Elle prend en compte d'une part, les positions POS(OBJ) des objets sonores identifiées et fournies par le module 3A, et d'autre part, la position des haut-parleurs HP1-1, HP1-2, HP1-P de l'ensemble El, pour créer des sources virtuelles à partir des haut-parleurs HP1-1, HP1-2, HP1-P de l'ensemble El aux positions POS(OBJ).
Bien entendu, cette hypothèse n'est pas limitative et d'autres techniques de spatialisation sonore peuvent être envisagées dans le cadre de l'invention, telles que des techniques de mixage matriciel dynamique prenant la forme par exemple d'un panoramique stéréophonique d'intensité sur les haut-parleurs, ou d'un panoramique d'intensité de type VBAP ou DBAP connus de l'homme du métier.
On suppose dans le premier mode de réalisation décrit ici, que la position des haut- parleurs HP1-1, HP1-2, HP1-P de l'ensemble El utilisée par le module 3C1 pour appliquer la technique de spatialisation sonore Tl a été fournie au dispositif 3 de génération lors de l'étape préliminaire E_CALIB, par exemple par un installateur de l'ensemble 1 de restitution, via une interface utilisateur adaptée.
En variante, la position des haut-parleurs HP1-1, HP1-2, HP1-P de l'ensemble El peut être déterminée par le dispositif 3 de génération lui-même, de façon automatique ou semi- automatique, à l'aide par exemple d'un dispositif de suivi de position tel que décrit précédemment.
Les signaux Sl-1, Sl-2,..., Sl-P générés par le module 3C1 sont ensuite fournis aux haut-parleurs HP1-1, HP1-2, HP1-P de l'ensemble El (étape E50) pour être restitués.
Parallèlement, et de façon similaire, le module 3B2 applique au signal d'entrée S, le retard τ2 et le gain G2 mentionnés précédemment (étape E60), déterminés et fournis au module 3B2 au cours de l'étape de configuration E_CALIB également.
Le même gain G2 et le même retard τ2 sont appliqués ici à l'ensemble des canaux du signal d'entrée SIG.
Le signal S2 résultant de cette opération est fourni par le module 3B2 au module 3C2. Ce dernier applique au signal S2 la technique de spatialisation sonore T2, et génère ainsi la pluralité de signaux S2-1, S2-2,..., S2-N (étape E70).
La technique T2 est par exemple également une technique holophonique de type WFS telle que décrite dans le document EP 2 206 365. Elle prend en compte d'une part, les positions POS(OBJ) des objets sonores identifiées et fournies par le module 3A, et d'autre part, la position des haut-parleurs HP2-1, HP2-2, ..., HP2-N de l'ensemble E2, pour créer des sources virtuelles à partir des haut-parleurs HP2-1, HP2-2, ..., HP2-N de l'ensemble E2 aux positions POS(OBJ).
Bien entendu, cette hypothèse n'est pas limitative et d'autres techniques de spatialisation sonore peuvent être envisagées dans le cadre de l'invention, telles que les techniques de mixage matriciel dynamique cités précédemment.
Par ailleurs, on peut envisager également que les modules 3C1 et 3C2 appliquent des techniques de spatialisation sonore Tl et T2 distinctes aux signaux SI et S2 pour générer les signaux destinés à alimenter les deux ensembles El et E2 de haut-parleurs.
La position des haut-parleurs HP2-1, HP2-2, ..., HP2-N de l'ensemble E2 a, dans le premier mode de réalisation décrit ici, été fournie au dispositif 3 de génération également lors de l'étape de configuration préliminaire E_CALIB, par l'installateur de l'ensemble 1 de restitution via l'interface utilisateur précitée.
Les signaux S2-1, S2-2,..., S2-N générés par le module 3C2 sont fournis aux haut- parleurs HP2-1, HP2-2, ..., HP2-N de l'ensemble E2 (étape E80), pour être restitués.
Conformément à l'invention, les retards et les gains (T1,G1) et (T2,G2), appliqués au signal audio d'entrée S par les modules 3B1 et 3B2 pour générer respectivement les signaux Sl-1, Sl-2,..., Sl-P et S2-1, S2-2,..., S2-N, ont été choisis, lors de l'étape préliminaire de configuration E_CALIB, de sorte à garantir que la combinaison, à une position de référence Pref(El,E2) définie pour les ensembles de haut-parleurs El et E2, des signaux restitués par le premier ensemble El des haut-parleurs alimentés par les signaux Sl-1, Sl-2,..., Sl-P, et des signaux restitués par le deuxième ensemble E2 de haut-parleurs alimentés par les signaux S2-1, S2-2,..., S2-N, vérifie un effet de restitution sonore déterminé (autrement dit, souhaité, choisi).
Ceci permet avantageusement de tenir compte de la directivité verticale des haut- parleurs du deuxième ensemble E2, et de s'assurer que la combinaison des signaux à la position spatiale de référence choisie est harmonieuse pour l'auditeur (pas de cacophonie ou d'écho non souhaité).
Par position spatiale de référence, on entend ici aussi bien un point de l'espace caractérisant la position d'un auditeur cible dans la salle, qu'une zone plus étendue de l'espace dans laquelle est (sont) susceptible(s) de se trouver un ou plusieurs auditeurs.
Le choix de la position de référence Pref(El,E2) dépend bien entendu de plusieurs critères, comme notamment de la profondeur de la salle dans laquelle le signal audio S est restitué. Elle est choisie préférentiellement aux alentours du milieu de la salle, légèrement décalée en direction de la scène.
La figure 3 illustre un exemple du choix de la position de référence Pref(El,E2) pour la salle R.
D'autres critères peuvent être pris en compte pour le choix de la position spatiale de référence Pref(El,E2), comme par exemple :
— la position Pref(El,E2) peut être choisie de sorte à garantir que la position verticale du deuxième ensemble E2 de haut-parleurs perçue à cette position Pref(El,E2), soit
approximativement égale à un angle (par exemple 45°), sélectionné afin de limiter l'erreur de perception verticale ;
— la position Pref(El,E2) peut coïncider avec la position spatiale à laquelle le niveau sonore « naturellement » restitué (c'est-à-dire sans appliquer de gains aux signaux) par chaque ensemble de haut-parleurs El et E2 est similaire ;
— la position Pref(El,E2) peut également dépendre de la configuration de la salle, et notamment de l'implantation le cas échéant des sièges destinés aux auditeurs dans la salle (ex. existence de couloirs dans la salle, etc.).
Il convient de noter que dans le premier mode de réalisation décrit ici, on se limite à prendre en compte une seule position de référence dans la salle pour choisir les retards et/ou les gains appliqués sur le signal d'entrée S. Toutefois en variante, on pourrait envisager de prendre en compte plusieurs positions de référence réparties sur une zone spécifique de la salle.
Comme mentionné précédemment, les retards et les gains appliqués au signal d'entrée dépendent de l'effet de restitution sonore que l'on souhaite obtenir à la position de référence Pref(El,E2) pour la combinaison des signaux restitués par le premier ensemble El et par le deuxième ensemble E2.
Ainsi, par exemple, l'effet de restitution sonore désiré peut être l'arrivée en cohérence de phase, à la position spatiale de référence Pref(El,E2), des signaux restitués par le premier ensemble El et des signaux restitués par le deuxième ensemble E2. Cette cohérence de phase est assurée lorsque les signaux restitués par le premier ensemble El et les signaux restitués par le deuxième ensemble E2 arrivent simultanément à la position de référence Pref(El,E2) avec un niveau sonore similaire.
Selon un autre exemple, on peut au contraire choisir de décaler dans le temps l'arrivée des signaux restitués par le deuxième ensemble E2 par rapport à l'arrivée des signaux restitués par le premier ensemble El de sorte à bénéficier de l'effet Haas décrit précédemment (ou plus précisément à accentuer l'effet Haas naturel dont bénéficie déjà le système 2 de restitution à proximité de la scène).
A titre illustratif, la figure 6 représente les variations du temps de propagation des signaux diffusés par des haut-parleurs omnidirectionnels (le temps de propagation étant indépendant de la directivité verticale des haut-parleurs), en fonction de la distance à la scène, pour un ensemble de haut-parleurs positionné au niveau de la scène (courbe en trait plein) et à 6.0 m au-dessus de la scène (courbe en traits interrompus).
Cette figure illustre l'effet Haas naturel, décrit précédemment, dont bénéficie le système 2 de restitution à proximité de la scène (décalage des temps de propagation à proximité de la scène).
Pour maintenir cet effet sur une distance à la scène plus importante, et permettre une bonne localisation verticale des objets sonores sur le premier ensemble de haut-parleurs, on peut, à la lumière de la figure 6, tenter de « relever » la courbe en traits interrompus de sorte à
l'éloigner de la courbe en trait plein, en retardant les deuxièmes signaux par rapport aux premiers signaux à la position de référence.
Les gains Gl et G2 sont quant à eux choisis de sorte à garantir un niveau sonore suffisant au fond de la salle, tout en optimisant la localisation verticale des objets sonores restitués à la position de référence.
Comme décrit précédemment, les retards et les gains (T1,G1) et (T2,G2) permettant d'obtenir un tel effet de restitution sonore souhaité à la position de référence Pref(El,E2), sont choisis (i.e. réglés) au cours de l'étape de configuration E_CALIB. Ce choix ou réglage peut être réalisé de façon manuelle (par exemple expérimentalement, à l'aide de mesures physiques de niveau sonore) ou automatique via des simulations numériques.
Ainsi, dans le premier mode de réalisation décrit ici, l'étape de configuration E_CALIB comprend une première phase au cours de laquelle on réalise des mesures physiques, à la position de référence Pref(El,E2), d'une part, du niveau sonore « naturellement » restitué par l'ensemble El (i.e. ceci revient à appliquer un gain τΐ nul, un retard Gl=l, et un gain G2 nul), et d'autre part, du niveau sonore « naturellement » restitué par l'ensemble E2 (i.e. ceci revient à appliquer un gain T2 nul, un retard G2=l, et un gain Gl nul).
A partir de ces mesures physiques, on détermine et on règle de façon empirique, lors d'une deuxième phase, les retards τΐ et τ2, et les gains Gl et G2, à appliquer sur le signal audio d'entrée S pour obtenir l'effet de restitution sonore désiré. Ces retards τΐ et τ2, et ces gains Gl et G2 peuvent faire l'objet de plusieurs tests, et être ajustés à chaque test, par tâtonnement.
En variante, cette deuxième phase de réglage peut être réalisée par simulation.
L'étape E_CALIB peut en outre comporter une phase ultime d'ajustement plus précis des retards et des gains déterminés lors de la deuxième phase, en utilisant des signaux connus, via de nouvelles mesures physiques et/ou par simulation numérique.
On notera qu'au cours de l'étape E_CALIB, le réglage des retards et des gains peut s'effectuer soit de façon globale, soit de façon indépendante sur chaque bande de fréquences d'un ensemble de bandes de fréquences prédéfini. Dans ce cas, on détermine un gain et un retard par bande de fréquences étudiée. Ceci permet avantageusement de prendre en compte la dépendance en fréquence de la directivité des haut-parleurs du deuxième ensemble E2.
La figure 7 illustre divers avantages procurés par l'ensemble 1 de restitution, en termes de variations du niveau sonore en fonction de la distance de l'auditeur par rapport à la scène. Dans l'exemple de la figure 7, les haut-parleurs de l'ensemble E2 sont des haut-parleurs directifs verticalement disposant d'une ouverture verticale de 90°.
Plus spécifiquement, la figure 7 montre que grâce à l'utilisation de haut-parleurs directifs pour l'ensemble E2, le niveau sonore du signal restitué par l'ensemble E2 perçu à proximité de la scène est moins important (cf. courbe en traits interrompus).
Par ailleurs, on s'assure un niveau sonore quasi-uniforme jusqu'au fond de la salle.
En outre, la différence de niveaux sonores entre les signaux restitués par l'ensemble El (représenté par la courbe en trait continu) et les signaux restitués par l'ensemble E2 est quasiment constante pour des distances à la scène supérieures à 8 m (mise en cohérence des niveaux sonores atteinte par l'invention), de sorte qu'il est possible par un choix approprié des retards τΐ et τ2 de bénéficier d'un effet Haas jusqu'au fond de la salle.
Dans l'exemple illustré à la figure 2, l'ensemble de restitution 1 comprend deux ensembles de haut-parleurs El et E2.
Dans une variante, l'ensemble de restitution 1 comprend en outre un autre ensemble de haut-parleurs de type caissons de basse ou « subwoofers », pour ajouter un effet supplémentaire lors de la restitution sonore du signal audio d'entrée.
De façon similaire, dans cette variante, une pluralité de signaux audio destinés à alimenter cet ensemble de haut-parleurs de type caissons de grave est généré par le dispositif 3 de génération en appliquant au signal audio entrée :
— au moins un retard et/ou un gain ; et
— un filtrage de type passe-bas.
Le retard et/ou le gain ainsi appliqués sont choisis de sorte que la combinaison des signaux restitués par l'ensemble de haut-parleurs de type caissons de grave et des signaux restitués par l'un des ensembles El et E2 vérifie un effet de restitution sonore déterminé à une position spatiale de référence définie pour cet ensemble et pour l'ensemble de haut-parleurs de type caissons de grave.
Nous allons maintenant illustrer la mise en œuvre de ce premier mode de réalisation par la description de trois exemples.
Exemple 1 :
Dans l'exemple 1 :
— l'ensemble El est une ligne de P haut-parleurs HP1-1, HP1-P situés sur la scène SCENE, à la hauteur hl ;
— l'ensemble E2 est une ligne de N haut-parleurs HP2-1, ..., HP2-N situés au-dessus de la scène SCENE, à la hauteur h2. Le nombre N de haut-parleurs ainsi que leur espacement dépendent de la largeur de la scène : N varie typiquement entre 4 et 12 haut-parleurs, espacés de 80 cm à 5 m.
Le nombre P de haut-parleurs de l'ensemble El est supérieur ou égal au nombre N de haut-parleurs de l'ensemble E2.
Conformément à l'invention, les haut-parleurs HP2-1, ..., HP2-N sont en moyenne plus directifs verticalement que les haut-parleurs HP1-1, HP1-P de l'ensemble El. Plus précisément, dans cet exemple 1 :
— les P haut-parleurs HP1-1, HP1-P de l'ensemble El présentent une ouverture verticale variant de 80° à 120°, et sont orientés vers l'avant de la scène (i.e. vers l'avant de l'auditoire) ;
— les N haut-parleurs HP2-1, ..., ΗΡ2-Ν de l'ensemble E2 présentent une ouverture verticale variant de 60° à 90°, et sont orientés vers le fond de la salle (partie de l'auditoire la plus éloignée de la scène).
Les modules 3C1 et 3C2 utilisent des techniques Tl et T2 de spatialisation sonore de type WFS permettant la création de sources virtuelles aux positions des objets sonores du signal S identifiées par le module 3A. Ces positions sont fournies dans l'exemple 1 au module 3A par l'intermédiaire d'une interface utilisateur graphique.
Les modules 3B1 et 3B2 sont configurés de sorte à appliquer un retard non nul au signal S et à l'atténuer (gains Gl, G2 inférieurs à 1). Les gains et retards (T1,G1) et (T2,G2) appliqués respectivement par les modules 3B1 et 3B2 sont choisis de sorte que les signaux restitués par les ensembles El et E2 à la position de référence Pref(El,E2) arrivent avec un niveau sonore similaire (à plus ou moins 3 décibels près), et simultanément ou quasi-simultanément (avec une tolérance de plus ou moins 5 ms). Exemple 2 :
Dans l'exemple 2 :
— l'ensemble El est une ligne de P haut-parleurs HP1-1, HP1-P situés sur la scène SCENE, à la hauteur hl ;
— l'ensemble E2 comprend N haut-parleurs HP2-1, ..., HP2-N de type « line array » en anglais (source ligne) situés au-dessus de la scène SCENE, à la hauteur h2, et répartis le long de la scène. Par exemple pour N=3, on dispose un haut-parleur de part et d'autre de la scène et un au centre de la scène. De tels haut-parleurs sont de façon connue particulièrement puissants et présentent une directivité verticale importante et ainsi une faible ouverture.
Le nombre P de haut-parleurs de l'ensemble El et l'espacement entre eux dépendent de la largeur de la scène, et de la distance séparant les haut-parleurs du premier ensemble El des haut-parleurs du deuxième ensemble E2 : P varie typiquement entre 4 et 30 haut-parleurs, espacés de 50 cm à 3 m.
Conformément à l'invention, les haut-parleurs HP2-1, ..., HP2-N sont en moyenne plus directifs verticalement que les haut-parleurs HP1-1, HP1-P de l'ensemble El. Plus précisément, dans ce premier exemple :
— les P haut-parleurs HP1-1, HP1-P de l'ensemble El présentent une ouverture verticale variant de 80° à 120°, et sont orientés vers l'avant de la scène (i.e. vers l'avant de l'auditoire) ;
— les N haut-parleurs HP2-1, ..., HP2-N de l'ensemble E2 présentent une ouverture verticale variant de 10° à 60°, et sont orientés vers le fond de la salle (partie de l'auditoire la plus éloignée de la scène).
Le module 3C1 utilise une technique Tl de spatialisation sonore de type WFS permettant la création de sources virtuelles aux positions des sources identifiées dans le signal S
par le module 3A. Ces positions sont fournies dans l'exemple 2 au module 3A par l'intermédiaire d'une table de mixage opérant sur le signal S.
Le module 3C2 utilise une technique T2 de spatialisation sonore de type mixage matriciel dynamique prenant la forme d'un panoramique stéréophonique d'intensité en fonction de la position des objets sonores du signal S identifiées par le module 3A.
Les modules 3B1 et 3B2 sont configurés de sorte à appliquer un retard non nul au signal S et à l'atténuer (gains Gl, G2 inférieurs à 1). Les gains et retards (T1,G1) et (T2,G2) appliqués respectivement par les modules 3B1 et 3B2 sont choisis de sorte que les signaux restitués par les ensembles El et E2 à la position de référence Pref(El,E2) arrivent avec un niveau sonore similaire (à plus ou moins 3 décibels près), et simultanément ou quasi-simultanément (avec une tolérance de plus ou moins 5 ms).
Exemple 3 :
Dans cet exemple 3 :
— l'ensemble El comprend P haut-parleurs HP1-1, HP1-P situés sur la scène SCENE, à la hauteur hl ;
— l'ensemble E2 comprend N haut-parleurs HP2-1, ..., HP2-N de type « line array », situés au- dessus de la scène SCENE, à la hauteur h2. Le nombre N de haut-parleurs ainsi que leur espacement dépendent de la largeur de la scène : N varie typiquement entre 4 et 12 haut- parleurs, espacés de 80 cm à 5 m.
L'ensemble de restitution 1 comprend en outre dans cet exemple un ensemble désigné par Elow de L haut-parleurs HPIow-1, HPlow-L basse-fréquence (subwoofers) disposés sur ou en dessous de la scène SCENE.
Le nombre P de haut-parleurs de l'ensemble El et l'espacement entre eux dépendent de la largeur de la scène, et de la distance séparant les haut-parleurs du premier ensemble El des haut-parleurs du deuxième ensemble E2 : P varie typiquement entre 4 et 30 haut-parleurs, espacés de 50 cm à 3 m.
Conformément à l'invention, les haut-parleurs HP2-1, ..., HP2-N sont en moyenne plus directifs verticalement que les haut-parleurs HP1-1, HP1-P de l'ensemble El. Plus précisément, dans ce premier exemple :
— les P haut-parleurs HP1-1, HP1-P de l'ensemble El présentent une dispersion verticale variant de 80° à 120°, et sont orientés vers l'avant de la scène (i.e. vers l'avant de l'auditoire) ;
— les N haut-parleurs HP2-1, ..., HP2-N de l'ensemble E2 présentent une dispersion verticale variant de 10° à 60°, et sont orientés vers le fond de la salle (partie de l'auditoire la plus éloignée de la scène).
Le module 3C1 utilise une technique Tl de spatialisation sonore de type WFS permettant la création de sources virtuelles aux positions des objets sonores identifiées dans le signal S par le module 3A.
Le module 3C2 utilise une technique T2 de spatialisation sonore de type WFS permettant également la création de sources virtuelles aux positions des objets sonores identifiées dans le signal S par le module 3A. La technique T2 est par exemple une technique WFS telle que décrite dans le document d'E. Corteel cité précédemment, de sorte à compenser les caractéristiques de directivité horizontale des haut-parleurs « line array » de l'ensemble E2.
Les positions des objets sonores du signal S sont identifiées directement ici par le module 3A par l'intermédiaire d'un dispositif de suivi des positions des objets sonores présents sur la scène SCENE (ex. instruments ou personnages, etc.).
Le dispositif 3 de génération comporte en outre selon cet exemple, un module 3Blow apte à appliquer un gain et un retard au signal audio d'entrée S, et un module 3Clow apte à appliquer un filtrage passe-bas au signal issu du module 3Blow pour générer des signaux destinés à alimenter les haut-parleurs de l'ensemble Elow.
Les modules 3B1, 3B2 et 3Blow sont configurés de sorte à appliquer un retard non nul au signal S et à l'atténuer (gains inférieurs à 1).
Les gains et retards (T1,G1) et (T2,G2) appliqués respectivement par les modules 3B1 et 3B2 sont choisis de sorte que les signaux restitués par l'ensemble E2 arrivent avec un décalage de 10 ou 20 ms par rapport aux signaux restitués par l'ensemble El à la position de référence Pref(El,E2), avec un niveau sonore similaire (à plus ou moins 3 décibels près), de sorte à bénéficier de l'effet Haas décrit dans le document de Blauert et al. cité précédemment.
Le retard et le gain appliqués par le module 3Blow sont choisis de sorte que les signaux restitués par les ensembles Elow et El à une position spatiale de référence Pref(Elow,El) définie pour les ensembles Elow et El (de façon similaire à la position Pref(El,E2)) arrivent avec un niveau sonore similaire (à plus ou moins 3 décibels près) dans leurs bandes de fréquences respectives, et simultanément ou quasi-simultanément (avec une tolérance de plus ou moins 5 ms).
Nous allons maintenant décrire, en référence aux figures 8 à 10, un second mode de réalisation de l'invention dans lequel on considère, pour la restitution du signal audio d'entrée S, un ensemble de restitution sonore comprenant trois ensembles de haut-parleurs El, E2 et E3, les ensembles E2 et E3 jouant le rôle d'ensembles de haut-parleurs de rappel.
Ainsi, la figure 8 représente, dans son environnement, un ensemble l' de restitution sonore, conforme à l'invention, dans ce second mode de réalisation.
Les éléments similaires au premier mode de réalisation décrits en référence aux figures 2 à 5 sont référencés de façon identique sur les figures 8 à 10.
Conformément au second mode de réalisation, l'ensemble l' de restitution sonore comprend :
— un système 2' de restitution sonore comprenant une pluralité de haut-parleurs ; et
— un dispositif 3' de génération de signaux audio destinés à alimenter les haut-parleurs du système 2' de restitution sonore.
Le système 2' de restitution sonore se distingue du système 2 de restitution sonore illustré aux figures 2 et 3 en ce qu'il comprend en outre un troisième ensemble E3 de K haut- parleurs, notés HP3-1, HP3-2, ..., HP3-K, K étant un entier positif supérieur à 1.
Comme illustre à la figure 9, les haut-parleurs HP3-1, HP3-2, ..., HP3-K sont positionnés à une hauteur h3 supérieure à la hauteur de référence hl, dans un plan vertical situé plus proche du fond de la salle que le plan vertical dans lequel sont positionnés les haut-parleurs de l'ensemble E2.
Les haut-parleurs de l'ensemble E3 peuvent être choisis omnidirectionnels, si l'ensemble E3 est destiné à compenser la présence d'éléments masquant tels que des balcons par exemple, ou au contraire ils peuvent être choisis plus directifs en moyenne verticalement que les haut-parleurs de l'ensemble El, et être orientés, de façon similaire aux haut-parleurs de l'ensemble E2 vers le fond de la salle.
Le nombre K de haut-parleurs dans le troisième ensemble E3 peut être égal ou distinct des nombres P et N de haut-parleurs dans les ensembles El et E2.
Les différents haut-parleurs de l'ensemble E3 sont alimentés par des signaux audio multicanaux, notés respectivement S3-1, S3-2,..., S3-K générés par le dispositif 3' de génération à partir du signal audio d'entrée S.
Pour générer ces signaux, le dispositif 3' de génération s'appuie :
— sur le module logiciel 3A décrit précédemment, et apte à identifier les positions POS(OBJ) des différents objets sonores OBJ compris dans le signal d'entrée S ;
— le module 3B3 apte à appliquer sur le signal S, un retard τ3 et un gain G3, identiques ici sur chaque canal du signal S ;
— le module 3C3 apte à appliquer sur le signal issu du module 3B3 une technique de spatialisation sonore T3.
Le dispositif 3' de génération dispose ici de l'architecture matérielle d'un ordinateur, similaire à celle du dispositif 3 de génération décrite précédemment en référence à la figure 4. Les moyens de communication du dispositif 3' de génération se distinguent toutefois des moyens de communication du dispositif 3 de génération en ce qu'ils comprennent en outre une interface (filaire ou sans fil) avec les haut-parleurs HP3-1, HP3-2, ..., HP3- de l'ensemble E3.
La mémoire morte du dispositif 3' de génération constitue un support d'enregistrement conforme à l'invention, lisible par le (micro-)processeur du dispositif 3' et sur lequel est enregistré un programme d'ordinateur conforme à l'invention, comportant des instructions pour l'exécution des étapes d'un procédé de génération décrites maintenant en référence à la figure 10.
La figure 10 illustre les principales étapes d'un procédé de génération selon l'invention, telles qu'elles sont mises en œuvre, dans le second mode de réalisation, par le dispositif 3' de génération sur réception du signal audio d'entrée S, pour générer et fournir les
signaux Sl-1, Sl-2,..., Sl-P, S2-1, S2-2, S2-N et S3-1, S3-2, S3-K aux ensembles El, E2 et E3 de haut-parleurs respectivement.
Les étapes similaires aux étapes mises en œuvre par le dispositif 3 de génération et illustrées à la figure 5 sont référencées de manière identique et ne sont pas décrites de nouveau en détail ici.
On suppose donc que le dispositif 3' de génération reçoit le signal audio d'entrée multicanal S via ses moyens de communication (étape E10).
On suppose par ailleurs qu'on fournit au dispositif 3' de génération, par l'intermédiaire d'une interface adaptée, les positions désignées par POS(OBJ) des objets sonores OBJ compris dans le signal S et que l'on souhaite restituer (étape E20).
Conformément à l'invention, différents traitements sont appliqués par le dispositif 3' de génération au signal S pour générer les signaux destinés à alimenter les trois ensembles El, E2 et E3 de haut-parleurs.
Ces traitements sont appliqués indépendamment pour chaque ensemble de haut- parleurs, via trois chaînes de traitement du signal distinctes comprenant pour la première, le module 3B1 et le module 3C1, pour la deuxième, le module 3B2 et le module 3C2, et pour la troisième, le module 3B3 et le module 3C3. Ces trois chaînes de traitement opèrent préférentiellement simultanément.
Plus spécifiquement, les modules 3B1, 3C1, 3B2 et 3C2 procèdent de manière similaire au premier mode de réalisation pour générer les signaux Sl-1, Sl-2,..., Sl-P destinés à alimenter l'ensemble El et les signaux S2-1, S2-2,..., S2-N destinés à alimenter l'ensemble E2 (étapes E30 à E80 illustrées à la figure 5).
Par ailleurs, en parallèle, le module 3B3 applique au signal S le retard τ3 et le gain G3 mentionnés précédemment (étape E90), générant ainsi un signal S3. Ce retard τ3 et ce gain G3 ont été déterminés et fournis au module 3B3 au cours d'une étape de configuration préliminaire E_CALIB' décrite ultérieurement.
Le module 3C3 applique ensuite au signal S3 fourni en sortie du module, la technique de spatialisation sonore T3 (étape E100), générant ainsi la pluralité de signaux S3-1, S3-2,..., S3-K.
La technique T3 est par exemple une technique holophonique de type WFS telle que décrite dans le document EP 2 206 365. Elle prend en compte d'une part, les positions POS(OBJ) des objets sonores identifiées et fournies par le module 3A, et d'autre part, la position des haut- parleurs HP3-1, HP3-2, ..., HP3-K de l'ensemble E3, pour créer des sources virtuelles à partir des haut-parleurs HP3-1, HP3-2, ..., HP3-K de l'ensemble E3 aux positions POS(OBJ).
Bien entendu, cette hypothèse n'est pas limitative et d'autres techniques de spatialisation sonore peuvent être envisagées dans le cadre de l'invention, telles que les techniques de mixage matriciel dynamique cités précédemment.
Les signaux S3-1, S3-2,..., S3-K générés par le module 3C3 sont fournis aux haut- parleurs HP3-1, HP3-2, ..., HP3-K de l'ensemble E3 (étape E110), pour être restitués.
Dans ce second mode de réalisation, les retards τΐ, τ2 et τ3, et les gains Gl, G2 et G3 sont choisis en considérant les ensembles de haut-parleurs El, E2 et E3 deux à deux. Plus précisément, ils sont choisis de sorte à vérifier :
— d'une part, que la combinaison des signaux restitués par l'ensemble El et des signaux restitués par l'ensemble E2 vérifie un effet de restitution sonore déterminé à la position spatiale de référence Pref(El,E2) définie pour les ensembles El et E2 ; et
— d'autre part, que la combinaison des signaux restitués par l'ensemble E2 et des signaux restitués par l'ensemble E3 vérifie un effet de restitution sonore déterminé à une position spatiale de référence Pref (E2,E3) définie pour les ensembles E2 et E3. Cette position spatiale Pref(E2,E3) peut être définie selon des critères similaires à ceux adoptés pour définir la position spatiale Pref(El,E2) décrits précédemment.
En variante, on peut considérer la combinaison des signaux restitués par les ensembles El et E3 au lieu des ensembles E2 et E3.
Ainsi, l'étape préliminaire de configuration E_CALIB' se déroule en deux temps, au cours duquel on considère respectivement les ensembles El et E2 d'une part, et les ensembles E2 et E3 d'autre part. Une procédure similaire à celle décrite précédemment pour l'étape de configuration E_CALIB, se basant sur des mesures physiques de niveau sonore et/ou des simulations numériques, est appliquée à chaque couple d'ensembles de haut-parleurs considéré (i.e. au couple (E1,E2) en prenant en compte la position de référence Pref(El,E2), puis au couple (E2,E3) en prenant en compte la position de référence Pref(E2,E3)).
La phase ultime d'ajustement peut en revanche prendre en compte les signaux restitués par les trois ensembles afin d'être plus précis dans l'estimation des retards τΐ, τ2 et τ3 et des gains Gl, G2, et G3.
Comme pour l'étape E_CALIB, le réglage des retards et des gains peut s'effectuer soit de façon globale, soit de façon indépendante sur chaque bande de fréquences d'un ensemble de bandes de fréquences prédéfini. Dans ce cas, on détermine un gain et un retard par bande de fréquences étudiée. Ceci permet avantageusement de prendre en compte la dépendance en fréquence de la directivité des haut-parleurs du deuxième ensemble E2 et le cas échéant, du troisième ensemble E3.
II convient de noter que dans le second mode de réalisation décrit ici, l'ensemble de restitution l' comprend trois ensembles El, E2 et E3, dont deux ensembles jouent le rôle d'ensemble de haut-parleurs de rappel pour la salle R. Toutefois, l'invention ne se limite pas à deux ensembles de haut-parleurs de rappel, et on peut envisager, dans le cadre de l'invention, d'ajouter d'autres ensembles E4, E5,... de haut-parleurs de rappel dans la salle. Les retards et/ou les gains appliqués par le dispositif 3' de génération pour générer les signaux destinés à alimenter ces ensembles seront choisis de manière similaire au retard et au gain appliqué par le module 3B3, c'est-à-dire, en considérant les ensembles de haut-parleurs du système de restitution deux à deux (ex. El avec E2, puis E2 avec E3, puis E3 avec E4, etc.).
Nous allons maintenant illustrer la mise en œuvre de ce second mode de réalisation par la description de l'exemple 4.
Exemple 4 :
Dans cet exemple 4 :
— l'ensemble El comprend P haut-parleurs HP1-1, HP1-P situés sur la scène SCENE, à la hauteur hl ;
— l'ensemble E2 comprend N haut-parleurs HP2-1, ..., HP2-N situés au-dessus de la scène SCENE, à la hauteur h2. Le nombre N de haut-parleurs ainsi que leur espacement dépendent de la largeur de la scène : N varie typiquement entre 4 et 12 haut-parleurs, espacés de 80 cm à 5 m ;
— l'ensemble E3 comprend K haut-parleurs HP3-1, ..., HP3-K disposés dans la salle, au-dessus de l'auditoire, au milieu de la partie AUDIT. Le nombre K de haut-parleurs ainsi que leur espacement dépendent de la largeur de la scène : K varie typiquement entre 4 et 12 haut- parleurs, espacés de 80 cm à 5 m.
Dans cet exemple 4, les haut-parleurs HP2-1, ..., HP2-N sont en moyenne plus directifs verticalement que les haut-parleurs HP1-1, HP1-P de l'ensemble El. Plus précisément, dans cet exemple 4 :
— les P haut-parleurs HP1-1, HP1-P de l'ensemble El présentent une ouverture verticale variant de 80° à 120°, et sont orientés vers l'avant de la scène (i.e. vers l'avant de l'auditoire) ; — les N haut-parleurs HP2-1, ..., HP2-N de l'ensemble E2 présentent une ouverture verticale variant de 60° à 90°, et sont orientés vers le fond de la salle (partie de l'auditoire la plus éloignée de la scène).
Par ailleurs, dans cet exemple 4, les K haut-parleurs HP3-1, ..., HP3-K de l'ensemble E3 sont également en moyenne plus directifs verticalement que les haut-parleurs HP1-1, HP1-P de l'ensemble El. Ils présentent une ouverture verticale variant de 60° à 90°, et sont orientés également vers le fond de la salle (partie de l'auditoire la plus éloignée de la scène).
Les modules 3C1, 3C2 et 3C3 utilisent des techniques Tl, T2 et T3 de spatialisation sonore de type WFS permettant la création de sources virtuelles aux positions des objets identifiées dans le signal S par le module 3A. Ces positions sont fournies dans l'exemple 4 au module 3A par l'intermédiaire d'une interface utilisateur graphique.
Les modules 3B1, 3B2 et 3B3 sont configurés de sorte à appliquer un retard non nul au signal S et à l'atténuer (gains Gl, G2 et G3 inférieurs à 1).
Les gains et retards (T1,G1) et (T2,G2) appliqués respectivement par les modules 3B1 et 3B2 sont choisis de sorte que les signaux restitués par les ensembles El et E2 à la position de référence Pref(El,E2) arrivent avec un niveau sonore similaire (à plus ou moins 3 décibels près), et simultanément ou quasi-simultanément (avec une tolérance de plus ou moins 5 ms).
Le retard et le gain (T3,G3) appliqués par le module 3B3 sont choisis de sorte que les signaux restitués par les ensembles E2 et E3 à la position de référence Pref(E2,E3) arrivent avec
un niveau sonore similaire (à plus ou moins 3 décibels près) dans leurs bandes de fréquences respectives, et simultanément ou quasi-simultanément (avec une tolérance de plus ou moins 5 ms). La position Pref(E2,E3) est choisie plus éloignée de la scène SCENE que la position Pref(El,E2), en direction du fond de la salle.
Dans les deux modes de réalisation décrits ici, l'application des gain/retard et l'application de la technique de spatialisation sonore sur le signal audio d'entrée sont mises en œuvre lors d'étapes distinctes par des modules distincts.
Dans un autre mode de réalisation, ces deux traitements peuvent être réalisés simultanément par un même module (i.e. par les modules 3C1, 3C2 et le cas échéant 3C3 respectivement), lors de l'application de la technique de spatialisation sonore.
Claims
1. Procédé de génération, à partir d'un signal audio d'entrée (S), de signaux audio destinés à être fournis à un système de restitution sonore (2,2'), ce système de restitution sonore comprenant un premier ensemble (El) de haut-parleurs (HP1_1,...,HP1_P) positionnés à une hauteur (hl) de référence, et un deuxième ensemble (E2) de haut-parleurs (HP2_1,...,HP2_N) positionnés à une hauteur (h2) supérieure à la hauteur de référence (hl), les haut-parleurs du deuxième ensemble étant plus directifs verticalement que les haut-parleurs du premier ensemble, ce procédé comprenant :
— une étape (E20) d'identification d'une position (POS(OBJ)) d'au moins un objet sonore du signal audio d'entrée (S) ;
— une étape de génération (E30,E40) d'une pluralité de premiers signaux audio (S1_1,...,S1_P) destinés à alimenter le premier ensemble (El) de haut-parleurs, en appliquant au signal audio d'entrée (S) :
o au moins un retard (τΐ) et/ou un gain (Gl) ; et
o une technique (Tl) de spatialisation sonore tenant compte de la position identifiée dudit au moins un objet sonore du signal audio d'entrée et d'une position des haut- parleurs du premier ensemble ;
— une étape de génération (E60,E70) d'une pluralité de deuxièmes signaux audio (S2_1,...,S2_N) destinés à alimenter le deuxième ensemble (E2) de haut-parleurs, en appliquant au signal audio d'entrée (S) :
o au moins un retard (τ2) et/ou un gain (G2) ; et
o une technique (T2) de spatialisation sonore tenant compte de la position identifiée dudit au moins un objet sonore du signal audio d'entrée et d'une position des haut- parleurs du deuxième ensemble ;
au moins une dite technique de spatialisation sonore appliquée lors de la génération des premiers et des seconds signaux audio étant une technique holophonique ; et
les retards et/ou les gains appliqués lors de la génération des premiers et des seconds signaux audio étant choisis de sorte que la combinaison des premiers signaux restitués par le premier ensemble de haut-parleurs et des seconds signaux restitués par le deuxième ensemble de haut- parleurs vérifie un effet de restitution sonore déterminé à au moins une position spatiale de référence (Pref(El,E2)) définie pour les premier et second ensembles de haut-parleurs.
2. Procédé selon la revendication 1 dans lequel les retards appliqués lors de la génération des premiers et des seconds signaux audio sont choisis de sorte que les premiers signaux restitués par le premier ensemble de haut-parleurs et les deuxièmes signaux restitués par le deuxième ensemble de haut-parleurs arrivent simultanément à la position spatiale de référence.
3. Procédé selon la revendication 1 dans lequel les retards appliqués lors de la génération des premiers et des seconds signaux audio sont choisis de sorte que les deuxièmes signaux restitués par le deuxième ensemble de haut-parleurs arrivent avec un décalage prédéterminé à la position spatiale de référence par rapport aux premiers signaux restitués par le premier ensemble.
4. Procédé selon l'une quelconque des revendications 1 à 3 dans lequel au moins une dite technique de spatialisation sonore appliquée lors de la génération des premiers et des deuxièmes signaux audio est :
— une technique holophonique de spatialisation sonore de type WFS ; ou
— une technique de mixage matriciel dynamique.
5. Procédé selon l'une quelconque des revendications 1 à 4 dans lequel, au cours d'au moins une dite étape de génération, ledit au moins un retard et/ou gain est appliqué sur le signal d'entrée avant la technique de spatialisation sonore.
6. Procédé selon l'une quelconque des revendications 1 à 5 dans lequel le signal audio d'entrée est un signal audio multicanal et, au cours d'au moins une dite étape de génération, le même retard et/ou le même gain est appliqué sur chaque canal du signal audio d'entrée.
7. Procédé selon l'une quelconque des revendications 1 à 5 dans lequel le signal audio d'entrée est un signal audio multicanal et, au cours d'au moins une dite étape de génération, un retard et/ou un gain distinct est appliqué sur au moins deux canaux distincts du signal audio d'entrée.
8. Procédé selon l'une quelconque des revendications 1 à 7 dans lequel le système de restitution sonore comprend en outre au moins un troisième ensemble (E3) de haut-parleurs (HP3- 1,HP3-2,...,HP3-K) positionnés à une hauteur (h3) supérieure à la hauteur de référence (hl), ledit procédé comprenant une étape (E90,E100) de génération d'une pluralité de troisièmes signaux audio (S3-1, S3-2,..., S3-K) destinés à alimenter le troisième ensemble de haut-parleurs en appliquant au signal audio entrée (S) :
— au moins un retard (τ3) et/ou un gain (G3) ; et
— une technique de spatialisation sonore (T3) tenant compte de la position identifiée dudit au moins un objet sonore du signal audio d'entrée et d'une position des haut-parleurs du troisième ensemble ;
ledit au moins un retard et/ou un gain étant choisi de sorte qu'une combinaison des troisièmes signaux restitués par le troisième ensemble de haut-parleurs et des signaux restitués par un autre (E2) desdits ensembles de haut-parleurs du système de restitution vérifie un effet de restitution
sonore déterminé à une position spatiale de référence définie pour cet autre ensemble et pour le troisième ensemble de haut-parleurs.
9. Programme d'ordinateur comportant des instructions pour l'exécution des étapes du procédé de génération selon l'une quelconque des revendications 1 à 8 lorsque ledit programme est exécuté par un ordinateur.
10. Support d'enregistrement lisible par un ordinateur sur lequel est enregistré un programme d'ordinateur comprenant des instructions pour l'exécution des étapes du procédé de génération selon l'une quelconque des revendications 1 à 8.
11. Dispositif (3,3') de génération de signaux audio destinés à un système (2,2') de restitution sonore à partir d'un signal audio d'entrée, ce système de restitution sonore comprenant un premier ensemble (El) de haut-parleurs positionnés à une hauteur de référence (hl), et un deuxième ensemble (E2) de haut-parleurs positionnés à une hauteur supérieure (h2) à la hauteur de référence, les haut-parleurs du deuxième ensemble étant plus directifs verticalement que les haut-parleurs du premier ensemble,
le dispositif de génération (3,3') comprenant :
— des moyens d'identification (3A) d'une position d'au moins un objet sonore du signal audio d'entrée ;
— des moyens de génération (3B1) d'une pluralité de premiers signaux audio destinés à alimenter le premier ensemble de haut-parleurs, aptes à appliquer au signal audio d'entrée :
o au moins un retard et/ou un gain ; et
o une technique (Tl) de spatialisation sonore tenant compte de la position identifiée dudit au moins un objet sonore du signal audio d'entrée et d'une position des haut- parleurs du premier ensemble ;
— des moyens de génération (3B2) d'une pluralité de deuxièmes signaux audio destinés à alimenter le deuxième ensemble de haut-parleurs, aptes à appliquer au signal audio d'entrée :
o au moins un retard et/ou un gain ; et
o une technique (T2) de spatialisation sonore tenant compte de la position identifiée dudit au moins un objet sonore du signal audio d'entrée et d'une position des haut- parleurs du deuxième ensemble ;
au moins une dite technique de spatialisation sonore appliquée par les moyens de génération des premiers et des seconds signaux audio étant une technique holophonique ; et
les gains et/ou retards appliqués par les moyens de génération des premiers et des seconds signaux audio étant choisis de sorte que la combinaison des premiers signaux restitués par le premier ensemble de haut-parleurs et des seconds signaux restitués par le deuxième ensemble de
haut-parleurs vérifie un effet de restitution sonore déterminé à au moins une position spatiale de référence définie pour les premier et second ensembles de haut-parleurs.
12. Ensemble (Ι, ) de restitution d'un signal audio d'entrée comprenant : — un système (2,2') de restitution sonore comprenant un premier ensemble (El) de haut- parleurs positionnés à une hauteur de référence, et un deuxième ensemble (E2) de haut- parleurs positionnés à une hauteur supérieure à la hauteur de référence, les haut-parleurs du deuxième ensemble étant plus directifs verticalement que les haut-parleurs du premier ensemble ; et
— un dispositif (3,3') de génération de signaux audio selon la revendication 11 destinés à alimenter les haut-parleurs du premier ensemble et les haut-parleurs du deuxième ensemble du système de restitution sonore.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP13779301.4A EP2901717B2 (fr) | 2012-09-27 | 2013-09-25 | Procede et dispositif de generation de signaux audio destines a etre fournis a un systeme de restitution sonore |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR1259126A FR2996095B1 (fr) | 2012-09-27 | 2012-09-27 | Procede et dispositif de generation de signaux audio destines a etre fournis a un systeme de restitution sonore |
FR1259126 | 2012-09-27 |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2014049268A1 true WO2014049268A1 (fr) | 2014-04-03 |
Family
ID=47505066
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/FR2013/052256 WO2014049268A1 (fr) | 2012-09-27 | 2013-09-25 | Procede et dispositif de generation de signaux audio destines a etre fournis a un systeme de restitution sonore |
Country Status (3)
Country | Link |
---|---|
EP (1) | EP2901717B2 (fr) |
FR (1) | FR2996095B1 (fr) |
WO (1) | WO2014049268A1 (fr) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070269063A1 (en) | 2006-05-17 | 2007-11-22 | Creative Technology Ltd | Spatial audio coding based on universal spatial cues |
EP2056621A2 (fr) * | 2007-10-31 | 2009-05-06 | Yamaha Corporation | Système de réseau de haut-parleurs |
EP2206365A1 (fr) | 2007-10-30 | 2010-07-14 | SonicEmotion AG | Procédé et dispositif permettant une meilleure précision de rendu de champ sonore à l'intérieur d'une zone d'écoute préférée |
WO2012025580A1 (fr) | 2010-08-27 | 2012-03-01 | Sonicemotion Ag | Procédé et dispositif de reproduction de champ sonore améliorée de signaux d'entrée audio spatialement codés |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102004057500B3 (de) | 2004-11-29 | 2006-06-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zur Ansteuerung einer Beschallungsanlage und Beschallungsanlage |
-
2012
- 2012-09-27 FR FR1259126A patent/FR2996095B1/fr not_active Expired - Fee Related
-
2013
- 2013-09-25 EP EP13779301.4A patent/EP2901717B2/fr active Active
- 2013-09-25 WO PCT/FR2013/052256 patent/WO2014049268A1/fr active Application Filing
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070269063A1 (en) | 2006-05-17 | 2007-11-22 | Creative Technology Ltd | Spatial audio coding based on universal spatial cues |
EP2206365A1 (fr) | 2007-10-30 | 2010-07-14 | SonicEmotion AG | Procédé et dispositif permettant une meilleure précision de rendu de champ sonore à l'intérieur d'une zone d'écoute préférée |
EP2056621A2 (fr) * | 2007-10-31 | 2009-05-06 | Yamaha Corporation | Système de réseau de haut-parleurs |
WO2012025580A1 (fr) | 2010-08-27 | 2012-03-01 | Sonicemotion Ag | Procédé et dispositif de reproduction de champ sonore améliorée de signaux d'entrée audio spatialement codés |
Non-Patent Citations (6)
Title |
---|
"Dolby Atmos Next-Generation Audio for Cinema", 1 April 2012 (2012-04-01), XP055067682, Retrieved from the Internet <URL:http://www.dolby.com/uploadedFiles/Assets/US/Doc/Professional/Dolby-Atmos-Next-Generation-Audio-for-Cinema.pdf> [retrieved on 20130621] * |
COBOS MAXIMO ET AL: "Influence of the Listening Position in the Perception of Elevated Sources in Wave-Field Synthesis", CONFERENCE: 40TH INTERNATIONAL CONFERENCE: SPATIAL AUDIO: SENSE THE SOUND OF SPACE; OCTOBER 2010, AES, 60 EAST 42ND STREET, ROOM 2520 NEW YORK 10165-2520, USA, 8 October 2010 (2010-10-08), XP040567110 * |
CORTEEL ET AL: "Equalization in an Extended Area Using Multichannel Inversion and Wave Field Synthesis", JAES, AES, 60 EAST 42ND STREET, ROOM 2520 NEW YORK 10165-2520, USA, vol. 54, no. 12, 1 December 2006 (2006-12-01), pages 1140 - 1161, XP040507980 * |
E. CORTEEL: "Equalization in an Extended Area using Multichannel Inversion and Wave Field Synthesis", J. AUDIO ENG. SOC., vol. 54, no. 12, December 2006 (2006-12-01) |
ETIENNE CORTEEL: "Practical 3 dimensional sound reproduction using Wave Field Synthesis, theory and perceptual validation", PROCEEDINGS OF THE ACOUSTICS 2012, 23 April 2012 (2012-04-23), pages 901 - 906, XP055067658 * |
J. BLAUERT: "The Psychophysics of Human Sound Localization", 2 October 1996, MIT PRESS, article "Spatial Hearing" |
Also Published As
Publication number | Publication date |
---|---|
FR2996095A1 (fr) | 2014-03-28 |
EP2901717B2 (fr) | 2019-12-25 |
EP2901717B1 (fr) | 2016-10-26 |
FR2996095B1 (fr) | 2015-10-16 |
EP2901717A1 (fr) | 2015-08-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2901718B1 (fr) | Procede et systeme de restitution d'un signal audio | |
JP5767406B2 (ja) | スピーカー・アレイの等化 | |
US8755531B2 (en) | Audio system and method of operation therefor | |
BR112015004288B1 (pt) | sistema para renderizar som com o uso de elementos de som refletidos | |
FR2790634A1 (fr) | Procede de synthese d'un champ sonore tridimensionnel | |
JP2015530043A (ja) | 個々に指定可能なドライバへの上方混合されたコンテンツの反射されたおよび直接的なレンダリング | |
EP1886535B1 (fr) | Procede pour produire une pluralite de signaux temporels | |
EP3475943A1 (fr) | Procede de conversion, d'encodage stereophonique, de decodage et de transcodage d'un signal audio tridimensionnel | |
EP2709380B1 (fr) | Enceinte acoustique active monobloc configurable pour être utilisée isolément ou par paire, avec renforcement de l'image stéréo | |
EP2901717B1 (fr) | Procede et dispositif de generation de signaux audio destines a etre fournis a un systeme de restitution sonore | |
FR3065137A1 (fr) | Procede de spatialisation sonore | |
WO2020079377A1 (fr) | Enceinte acoustique et procédé de modulation pour une enceinte acoustique | |
EP3440847A1 (fr) | Procédé de diffusion sonore prenant en compte les particularités individuelles | |
FR3106461A3 (fr) | Barre de son | |
EP3701730A1 (fr) | Arrangement spatial de dispositifs de diffusion sonore | |
EP2957110B1 (fr) | Procede et dispositif de generation de signaux d'alimentation destines a un systeme de restitution sonore | |
US20200045419A1 (en) | Stereo unfold technology | |
FR2982111A1 (fr) | Enceinte acoustique comprenant un haut-parleur coaxial a directivite controlee et variable. | |
EP3108670B1 (fr) | Procédé et dispositif de restitution d'un signal audio multicanal dans une zone d'écoute | |
WO2022053588A1 (fr) | Systeme de reproduction de sons avec virtualisation du champ reverbere | |
FR3127858A1 (fr) | Systeme de generation d’ondes sonores pour au moins deux zones distinctes d’un meme espace et procede associe | |
FR2901448A1 (fr) | Dispositif et procede de filtrage d'un signal d'activation destine a alimenter un haut-parleur a membranes coaxiales, enceinte acoustique,programme informatique et moyen de stockage correspondants. | |
WO2016071586A1 (fr) | Nouveau procédé d'amélioration de la restitution des modulations stéréophoniques en automobile | |
FR3040253B1 (fr) | Procede de mesure de filtres phrtf d'un auditeur, cabine pour la mise en oeuvre du procede, et procedes permettant d'aboutir a la restitution d'une bande sonore multicanal personnalisee | |
WO2024156849A1 (fr) | Procédé de contrôle d'un champ acoustique, système de contrôle et programme d'ordinateur associés |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 13779301 Country of ref document: EP Kind code of ref document: A1 |
|
REEP | Request for entry into the european phase |
Ref document number: 2013779301 Country of ref document: EP |
|
WWE | Wipo information: entry into national phase |
Ref document number: 2013779301 Country of ref document: EP |
|
NENP | Non-entry into the national phase |
Ref country code: DE |