WO2010004155A1 - Synthese spatiale de signaux audio multicanaux - Google Patents

Synthese spatiale de signaux audio multicanaux Download PDF

Info

Publication number
WO2010004155A1
WO2010004155A1 PCT/FR2009/051146 FR2009051146W WO2010004155A1 WO 2010004155 A1 WO2010004155 A1 WO 2010004155A1 FR 2009051146 W FR2009051146 W FR 2009051146W WO 2010004155 A1 WO2010004155 A1 WO 2010004155A1
Authority
WO
WIPO (PCT)
Prior art keywords
signal
synthesis
decorrelated
matrix
spatialization
Prior art date
Application number
PCT/FR2009/051146
Other languages
English (en)
Inventor
Florent Jaillet
David Virette
Original Assignee
France Telecom
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by France Telecom filed Critical France Telecom
Priority to ES09794018T priority Critical patent/ES2387867T3/es
Priority to US12/996,406 priority patent/US8583424B2/en
Priority to AT09794018T priority patent/ATE557386T1/de
Priority to EP09794018A priority patent/EP2304721B1/fr
Priority to CN200980124551.6A priority patent/CN102077276B/zh
Priority to JP2011515543A priority patent/JP5366104B2/ja
Publication of WO2010004155A1 publication Critical patent/WO2010004155A1/fr

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Definitions

  • the present invention relates to the field of coding / decoding multichannel digital audio signals. More particularly, the present invention relates to the parametric encoding / decoding of multichannel audio signals.
  • This type of coding / decoding is based on the extraction of spatialization parameters so that at decoding, the spatial perception of the listener can be reconstituted.
  • Such a coding technique is known as "Binaural Cue
  • Coding in English (BCC) which aims on the one hand to extract and then code the auditory spatialization indices and on the other hand to code a monophonic or stereophonic signal from a mastering of the original multi-channel signal.
  • This parametric approach is a low rate coding.
  • the main advantage of this coding approach is to allow a better compression rate than conventional multi-channel digital audio compression methods while ensuring the backward compatibility of the compressed format obtained with the existing coding formats and broadcasting systems.
  • the invention relates more particularly to the spatial decoding of a sound scene 3 D from a reduced number of transmitted channels.
  • FIG. 1 describes such a coding / decoding system in which the encoder
  • 100 builds a signal sum ("downmix" in English) S s by matrixing in 110 of the channels of the original multi-channel signal S and provides via a module of extraction of parameters 120, a reduced set of parameters P which characterize the spatial content of the original multi-channel signal.
  • the multichannel signal is reconstructed (S ') by a synthesis module 160 which takes into account both the sum signal and the transmitted parameters P.
  • the sum signal has a reduced number of channels. These channels can be encoded by a conventional audio encoder before transmission or storage. Typically, the sum signal has two channels and is compatible with conventional stereo broadcasting. Before transmission or storage, this sum signal can thus be encoded by any conventional stereo encoder. The signal thus coded is then compatible with the devices comprising the corresponding decoder which reconstruct the sum signal while ignoring the spatial data.
  • the MPEG Surround standard has adopted a specific structure for the representation of spatial data: the encoder relies on a coding tree structure constructed from a reduced number of elementary coding blocks, each of which makes it possible to extract spatial parameters on a single space. reduced number of channels.
  • FIG. 2 illustrates a first example of a coding structure or code tree using TTO blocks (TTO 0 , TTO 1 , TTO 2 , TTO 3 and TTO 4 ) to obtain a monophonic signal S from a multi-channel signal.
  • channel 5.1 with 6 channels (L, R, C, LFE, Ls and Rs).
  • FIG. 3 illustrates a second example of a coding structure using both TTO blocks and TTT blocks to obtain a stereo signal Sl and Sr from the signal 5.1.
  • the decoding of the monophonic or stereophonic signals thus received is carried out using a decoding tree symmetrical to those represented in FIGS. 2 and 3.
  • the decoding can be seen as a succession of reconstruction step.
  • the first decoding step consists in reconstructing the signals corresponding to the input signals of the block TTOo from the sum signal S and the spatial parameters extracted by the block TTOo
  • the next step then consists in reconstructing the signals corresponding to the input signals of the block TTOi from the signal reconstructed in the previous step and spatial parameters extracted by the block
  • the decoding is then continued in a similar manner until the reconstruction of all the channels of the coded multi-channel signal.
  • the decoder constructs a matrix making it possible to go directly from the monophonic sum signal to the 6 reconstructed channels by combining the smaller size matrices of the different blocks TTO and TTT.
  • This technique consists, as represented with reference to FIG. 4, in performing a decorrelation step at 410 by filtering the sum signal to obtain a decorrelated signal d.
  • the sum signal and the decorrelated signal thus obtained are then processed by a synthesis module 420 via a synthesis matrix M, as a function of the spatial parameters R and I to create the two signals 1 and r respecting the specified spatial parameters.
  • the parameters R and I are respectively the energy ratio between the channels of the multi-channel signal and an inter-channel correlation index of the multi-channel signal channels.
  • the waveform of the reconstructed signal is not controlled since it totally depends on the decorrelation experienced by the signal s.
  • the signals of these different channels which have similar waveforms will interact in the rendering zone by creating constructive and destructive interferences which will make it possible to reconstruct the desired sound field.
  • each TTO block decoder involved in the decoding tree uses a different decorrelation filter, the deformation of the waveform will not be the same for the different channels.
  • the reconstructed channels then no longer have, as in the original signal, near waveforms and the interferences that allowed the reconstruction of the sound field during the restitution, are then no longer as in the original signal. This leads, on the one hand, to a bad spatial reconstruction of the sound stage, and on the other hand to the creation of audible artifacts, the differences in waveforms leading to the creation of perceptible noisy components.
  • the present invention improves the situation.
  • the present invention proposes a method of spatial synthesis of a sum signal to obtain at least two output signals, the sum signal as well as spatialization parameters resulting from parametric encoding by mastering a multi signal. - original channel.
  • the method comprises the steps of:
  • the method according to the invention thus makes it possible to handle the cases where a spatialization parameter situated in a predetermined value range causes such a situation.
  • the quantitative function is such that the increase in absolute value of the coefficients of the synthesis matrix applied to the decorrelated signal increases the value of said function applied to these same coefficients.
  • such a quantitative function may be a decorrelated signal energy function.
  • I q (x, y) u ⁇ P + y P y with p integer greater than or equal to 1.
  • the spatialization parameters are a parameter (R) of energy ratio between the channels of the multi-channel signal and a interchannel correlation parameter (I) of the multi-channel signal, a range of values being the range in which the inter-channel correlation parameter is negative.
  • the invention applies more particularly to multichannel signals having negative interchannel correlations. It can therefore be implemented only for the values of the negative inter-channel correlation parameter or for any value of this parameter.
  • a different quantitative function is chosen by value range of the spatialization parameters.
  • the invention also relates to a device for spatially synthesizing a sum signal generating at least two output signals, the sum signal as well as spatialization parameters coming from a parametric coding device implementing a matrix mastering. an original multichannel signal.
  • the device comprising:
  • synthesis matrix M Minq
  • M Minq synthesis matrix whose coefficients depend on the spatialization parameters, the decorrelated signal and the sum signal to obtain said output signals, characterized in that for at least one value range of at least one spatialization parameter, the coefficients of the synthesis matrix are determined according to a criterion for minimizing a quantitative function, relating to the quantity of signal decorrelated in each of the output signals obtained by the application means of the synthesis matrix.
  • It relates to a decoder comprising a synthesis device as described above.
  • the invention also relates to multimedia equipment comprising a decoder as described above.
  • such equipment may be for example a mobile phone, an electronic organizer or digital content player, a computer, a set-top box ("set-top box").
  • the invention is directed to a computer program comprising code instructions for implementing the steps of the method as described above, when these instructions are executed by a processor.
  • FIG. 1 illustrates a conventional parametric coding / decoding system of the state of the art as previously described
  • FIGS. 2 and 3 illustrate examples of encoding trees as described above, according to the MPEG Surround standard in the case of a 5.1 type multi-channel signal
  • FIG. 4 illustrates a decoding system of the state of the art of a TTO block as previously described
  • FIG. 5 illustrates a synthesis device according to the invention for decoding a TTO block
  • FIG. 6 illustrates a synthesis device for decoding a TTO block according to a particular embodiment
  • FIG. 7 illustrates a decoder according to the invention in the case of multichannel signals of type 5.1; and FIG. 8 illustrates an example of multimedia equipment comprising at least one synthesis device according to the invention.
  • FIG. 5 illustrates an embodiment of the invention. It illustrates a synthesis device for decoding a TTO block (TTO "1 ) .
  • This device comprises a decorrelation module 510, capable of performing a decorrelation step of the received signal s which is a sum signal obtained by coding by a multi-channel signal matrixing.
  • This decorrelation step is for example that described in the MPEG Surround standard mentioned above.
  • This decorrelated signal d and the sum signal s are taken into account in a synthesis module 520 using a matrix M Minq whose coefficients depend on spatialization parameters R and I received and producing output signals 1 and r. More precisely, the signals 1 and r are generated by the following matrixing:
  • I is chosen according to one embodiment of the invention so as to limit the amount of decorrelated signal d introduced into the reconstructed signals regardless of the correlation values I, including for negative values.
  • the choice of the value ⁇ can be formalized by introducing a quantitative function q relating to the quantity of decorrelated signal taken into account in the matrixing for the reconstruction of the signals.
  • the quantitative function q is such that the increase in absolute value of the coefficients of the synthesis matrix applied to the decorrelated signal increases the value of the function q applied to these same coefficients.
  • this quantitative function q is such that it satisfies the following conditions: for all real x, x 1 , y if x'j ⁇ x then q (x ', y) ⁇ q (x, y) and symmetrically for all real x, y, y 'if y'
  • the value of ⁇ is then chosen by minimizing the function:
  • the function q can for example be of type:
  • the quantitative function q is a function of energy of the decorrelated signal.
  • FIG. 5 represents a synthesis device for decoding a TTO block, here called TTO "1 comprising a decorrelation module 510 of the sum signal, a synthesis module 520 able to apply a synthesis matrix to the decorrelated signal and to the sum signal
  • the coefficients of this synthesis matrix are determined according to a criterion of minimization of a quantitative function q relative to the amount of decorrelated signal as described above.
  • FIG. 5 also illustrates the steps of the spatial synthesis method according to the invention in which, starting from a sum signal, at least two output signals 1 and r are obtained.
  • the sum signal comes from a parametric encoding by mastering a multi-channel signal also providing spatialization parameters.
  • the method implemented by the synthesis device comprises the steps of:
  • the spatialization parameters are parameters designating the energy ratio R between the channels of the original multichannel signal and an interchanal correlation measurement of this same signal.
  • parameters derived from parametric coding can also be chosen. These parameters may for example be parameters designating the phase shift between the channels of the multi-channel signal, or time envelope parameters of the audio channels.
  • FIG. 6 illustrates another embodiment of the invention in which, as a function of a value range of at least one of the spatialization parameters received, here the interchannel correlation parameter I, a different synthesis matrix is chosen. .
  • the example shown in Figure 6 shows two types of synthesis matrix.
  • the first synthesis matrix M is for example that described in the state of the art in the MPEG Surround standard.
  • the corresponding synthesis module is illustrated in 630. This synthesis matrix is applied here to the sum signal and the decorrelated signal d when the parameter I is positive. When the parameter I is negative, the synthesis matrix M Minq is that described with reference to FIG. 5. The corresponding synthesis module is represented at 620.
  • the method implemented by this embodiment makes it possible to effectively process multi-channel signals that exhibit negative interchannel correlations.
  • This type of multi-channel signal is for example a surround-type signal. Indeed, this type of signal has channels in phase opposition.
  • This characteristic element of the signals from surround sound is illustrated in the articles by M. Gerzon entitled “Hierarchical System of Surround Sound Transmission for HDTV “or” Ambisonic Decoders for HDTV ".
  • synthesis matrices can be provided for ranges of different values of the spatialization parameters.
  • Compatibility with existing systems within a certain operating range is then maintained.
  • An improvement in the quality of the synthesis in a particular range of spatialization parameter value is then provided in this embodiment.
  • the possibility of using several synthesis matrices obtained according to different criteria makes it possible to optimize the overall quality of the synthesis for the entire operating range.
  • the decoder shown in this figure is typically provided for decoding 5.1 type multi-channel signals.
  • this decoder comprises a plurality of device TTO “1 (TTO 0 " 1 , TTOf 1 , TTO 2 "1 , TTO 3 “ 1 , TTO 4 "1 ) according to the invention for, from a received signal S , obtain a multi-channel signal with 6 channels (L, R, C,
  • the decoding module 730 comprising this plurality of synthesis devices may, of course, be differently configured depending on the coding tree that has been used for the original multi-channel signal.
  • the decoder as represented in FIG. 7 comprises a QMF analysis module (for "Quadrature Mirror Filter” in English) capable of performing a transformation of the sum (or downmix) signal S from the encoder into a frequency signal per subband. .
  • the signal per frequency band is then supplied to the input of the decoding module 730.
  • the processed signals enter the QMF synthesis module 720 able to perform an inverse transformation and to bring back the multi-channel signal obtained. in the time domain.
  • QMF analysis and QMF synthesis modules may for example be those as described in the MPEG Surround standard.
  • the decoder as represented in FIG. 7 receives from the encoder spatialization parameters P which are derived from the parametric coding of the original multi-channel signal.
  • these parameters may be energy ratio parameters between the channels, correlation measurement between the channels or else phase shift between the channels or finally time envelope.
  • This decoder 700 can be integrated with multimedia equipment of the set-top box type, computer or mobile phone, digital content player, personal electronic organizer, etc.
  • FIG. 8 represents an example of such a multimedia equipment which comprises in particular an input module E able to receive multi-channel audio signals compressed either by a communication network for example or by means of a multi-audio recording. -channel.
  • These multi-channel signals have been compressed by a parametric coding method which, by mastering the original signal, generates a sum signal S and spatialization parameters P.
  • This coding may in an alternative mode be provided in the multimedia equipment.
  • This equipment comprises one or more synthesis devices according to the invention, represented here physically by a processor PROC cooperating with a memory block BM comprising a memory storage and / or working MEM.
  • the memory block can advantageously comprise a computer program comprising code instructions for implementing the steps of the method in the sense of the invention, when these instructions are executed by the processor PROC, and in particular a step of decorrelation of a signal.
  • a computer program comprising code instructions for implementing the steps of the method in the sense of the invention, when these instructions are executed by the processor PROC, and in particular a step of decorrelation of a signal.
  • the synthesis matrix is such that, for at least one value range of at least one spatialization parameter, its coefficients are determined according to a criterion of minimization of a quantitative function, relative to the quantity of decorrelated signal taken into account in the step of applying the synthesis matrix.
  • FIG. 5 repeats the steps of an algorithm of such a computer program.
  • the computer program can also be stored on a memory medium readable by a reader of the device or downloadable in the memory space of the equipment.
  • the memory block thus comprises the coefficients of the synthesis matrix as defined above.
  • This memory block may comprise in another embodiment of the invention as described with reference to FIG. 6, defining coefficients several synthesis matrices which are applied to the sum signal and to the decorrelated signal as a function of the range of values of the spatialization parameters received.
  • the equipment processor may also include instructions for implementing the decoder analysis and synthesis steps as described with reference to FIG. 7.
  • the multimedia equipment as illustrated also comprises an output S for delivering the reconstructed multi-channel signal S 'either by speaker-type reproduction means or by communication means capable of transmitting this multi-channel signal.

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

L'invention se rapporte à un procédé de synthèse spatiale d'un signal somme pour obtenir au moins deux signaux de sortie, le signal somme ainsi que des paramètres de spatialisation étant issus d'un codage paramétrique par matriçage d'un signal multi-canal original. Le procédé comporte les étapes de: - décorrélation (Decorr.) du signal somme (s) pour obtenir un signal décorrélé (d); - application (synth.) d'une matrice de synthèse (M Minq) dont les coefficients dépendent des paramètres de spatialisation (R, I), au signal décorrélé et au signal somme pour obtenir lesdits signaux de sortie, et est tel que pour au moins une plage de valeur d'au moins un paramètre de spatialisation, les coefficients de la matrice de synthèse sont déterminés selon un critère de minimisation d'une fonction quantitative (q), relative à la quantité de signal décorrélé dans chacun des signaux de sortie obtenus par l'étape d'application de la matrice de synthèse. L'invention s'applique également à un dispositif de synthèse, à un décodeur comportant au moins un dispositif de synthèse et à un équipement multimédia comportant un tel décodeur.

Description

Synthèse spatiale de signaux audio multicanaux
La présente invention se rapporte au domaine du codage/décodage de signaux audio numériques multicanaux. Plus particulièrement, la présente invention se rapporte au codage/décodage paramétrique de signaux audio multicanaux.
Ce type de codage/décodage se base sur l'extraction de paramètres de spatialisation pour qu'au décodage, la perception spatiale de l'auditeur puisse être reconstituée. Une telle technique de codage est connu sous le nom de "Binaural Cue
Coding" en anglais (BCC) qui vise d'une part à extraire puis à coder les indices de spatialisation auditive et d'autre part à coder un signal monophonique ou stéréophonique issu d'un matriçage du signal multi-canal original.
Cette approche paramétrique est un codage à bas débit. Le principal intérêt de cette approche de codage est de permettre un taux de compression meilleur que les méthodes classiques de compression de signaux audionumériques multicanaux tout en assurant la rétrocompatibilité du format compressé obtenu avec les formats de codage et les systèmes de diffusions déjà existants.
Ainsi, l'invention porte plus particulièrement sur le décodage spatial d'une scène sonore 3 D à partir d'un nombre réduit de canaux transmis.
La norme MPEG Surround décrite dans le document de la norme MPEG ISO/IEC 23003-1:2007 et dans le document de "Breebaart, J. and Hotho, G. and Koppens, J. and Schuijers, E. and Oomen, W. and van de Par, S.," intitulé "Background, concept, and architecture for the récent MPEG surround standard on multichannel audio compression" dans Journal of the Audio Engineering Society 55- 5 (2007) 331-351, décrit une structure spécifique de codage/décodage du signal audio multi-canal.
La figure 1 décrit un tel système de codage/décodage dans lequel l'encodeur
100 construit un signal somme ("downmix" en anglais) Ss par matriçage en 110 des canaux du signal multi-canal original S et fournit via un module d'extraction de paramètres 120, un ensemble réduit de paramètres P qui caractérisent le contenu spatial du signal multi-canal original.
Au décodeur 150, le signal multicanal est reconstruit (S') par un module de synthèse 160 qui prend en compte à la fois le signal somme et les paramètres P transmis.
Le signal somme comporte un nombre réduit de canaux. Ces canaux peuvent être codés par un codeur audio classique avant transmission ou stockage. Typiquement, le signal somme comporte deux canaux et est compatible avec une diffusion stéréo classique. Avant transmission ou stockage, ce signal somme peut ainsi être codé par n'importe quel codeur stéréo classique. Le signal ainsi codé est alors compatible avec les dispositifs comportant le décodeur correspondant qui reconstruisent le signal somme en ignorant les données spatiales.
La norme MPEG Surround a retenu une structure spécifique pour la représentation des données spatiales : le codeur s'appuie sur une structure arborescente de codage construite à partir d'un nombre réduit de blocs élémentaires de codage permettant chacun d'extraire des paramètres spatiaux sur un nombre réduit de canaux. Il existe deux types de bloc élémentaires de codage : les blocs TTO (pour "Two To One" en anglais) qui permettent d'extraire les paramètres spatiaux entre deux canaux et de construire un signal somme monophonique à partir de ces deux canaux, les blocs TTT (pour "Three To Two" en anglais) qui permettent d'extraire les paramètres spatiaux entre trois canaux et de construire un signal somme contenant deux canaux à partir de ces trois canaux.
La figure 2 illustre un premier exemple d'une structure de codage ou arbre de codage utilisant des blocs TTO (TTO0, TTOi, TTO2, TTO3 et TTO4) pour obtenir un signal monophonique S à partir d'un signal multi-canal 5.1 comportant 6 canaux (L, R, C, LFE, Ls et Rs).
La figure 3 illustre un deuxième exemple de structure de codage utilisant à la fois des blocs TTO et des blocs TTT pour obtenir un signal stéréophonique Sl et Sr à partir du signal 5.1. Le décodage des signaux monophoniques ou stéréophoniques ainsi reçus s'effectue en utilisant un arbre de décodage symétrique à ceux représentés aux figures 2 et 3.
Ainsi, pour le décodage d'un signal encodé selon l'arbre de la figure 2, le décodage peut être vu comme une succession d'étape de reconstruction.
Dans ce cas la première étape de décodage consiste à reconstruire les signaux correspondant aux signaux d'entrée du bloc TTOo à partir du signal somme S et des paramètres spatiaux extraits par le bloc TTOo, l'étape suivante consiste alors à reconstruire les signaux correspondant aux signaux d'entrée du bloc TTOi à partir du signal reconstruit à l'étape précédente et des paramètres spatiaux extraits par le bloc
TTOJ, le décodage se poursuit ensuite de manière similaire jusqu'à la reconstruction de l'ensemble des canaux du signal multi-canal codé. En pratique, le décodeur construit une matrice permettant de passer directement du signal somme monophonique aux 6 canaux reconstruits par combinaison des matrices de taille inférieure des différents blocs TTO et TTT.
La technique retenue dans la norme MPEG Surround pour le décodage des blocs TTO impose cependant une limitation très pénalisante pour le codage de signaux multicanaux comportant des canaux en opposition de phase.
Cette technique de décodage est plus précisément décrite dans la demande de brevet intitulée "signal synthesizing" publiée sous le numéro WO 03/090206 Al le 30 octobre 2003 (Applicant : Koninklijke Philips Electronics N. V., Inventor : Dirk J. Breebaart).
Cette technique consiste, comme représenté en référence à la figure 4, à effectuer une étape de décorrélation en 410 par filtrage du signal somme s pour obtenir un signal décorrélé d. Le signal somme et le signal décorrélé ainsi obtenu sont ensuite traités par un module de synthèse 420 via une matrice de synthèse M, en fonction des paramètres spatiaux R et I pour créer les deux signaux 1 et r respectant les paramètres spatiaux spécifiés. Les paramètres R et I sont ici respectivement le rapport d'énergie entre les canaux du signal multi-canal et un indice de corrélation intercanal des canaux du signal multi-canal. - A -
Le matriçage des signaux s et d se fait suivant les relations suivantes
Figure imgf000006_0001
) (D
avec et / o? =
Figure imgf000006_0002
Figure imgf000006_0003
Or ce matriçage présente la limitation mentionnée ci-dessus et qui rend cette méthode inadaptée au codage des signaux audio multicanaux présentant des corrélations intercanal négatives.
En particulier, une telle technique n'est pas adaptée pour le décodage des signaux ambiophoniques qui comportent des oppositions de phase entre canaux.
En effet, lorsque la corrélation intercanal I est négative, et en particulier lorsqu'elle est proche de -1, la proportion de signal décorrélé utilisée pour synthétiser les signaux 1 et r devient très importante, dépassant dans certains cas de figure nettement la quantité de signal somme s utilisée. Dans le cas le plus problématique, on peut constater que pour une différence intercanal de niveau de OdB, c'est à dire pour R=I, lorsque la corrélation intercanal I tend vers -1, la matrice de mixage tend vers la matrice suivante :
Figure imgf000006_0004
Cette matrice correspond à des signaux reconstruits / = — 4ï d et
Figure imgf000006_0005
r - d qui ne font pas intervenir le signal somme dans leur expression, mais
utilisent uniquement le signal décorrélé. Ainsi, la forme d'onde du signal reconstruit n'est pas contrôlée puisqu'elle dépend totalement de Ia décorrélation subie par le signal s.
Le problème de reconstruction illustré dans l'exemple précédent dans un cas extrême se présente également pour d'autres valeurs de R et I, et est d'autant plus marqué que I est proche de -1. Ainsi, la forme d'onde des canaux reconstruits n'est dans ces cas pas aussi proche qu'elle pourrait l'être des signaux originaux, ce qui limite inutilement la qualité des signaux reconstruits.
L'effet de cette limitation est encore plus marqué lorsque le signal présente plusieurs canaux ayant des corrélations intercanal proches de -1. Dans ce cas, plus de deux canaux ont des formes d'onde proches, mais certains d'entre eux sont en opposition de phase.
Lors de la restitution du signal multi-canal original, les signaux de ces différents canaux qui ont des formes d'ondes proches vont interagir dans la zone de restitution en créant des interférences constructives et destructives qui vont permettre de reconstruire le champ sonore souhaité.
Après décodage, la forme d'onde des canaux sera fortement déformée en raison du problème évoqué précédemment.
De plus comme chaque décodeur de bloc TTO intervenant dans l'arbre de décodage, utilise un filtre de décorrélation différent, la déformation de la forme d'onde ne sera pas la même pour les différents canaux.
Les canaux reconstruits n'ont alors plus, comme dans le signal original, des formes d'onde proches et les interférences qui permettaient la reconstruction du champ sonore lors de la restitution, ne se font alors plus comme dans le signal original. Ceci aboutit d'une part à une mauvaise reconstruction spatiale de la scène sonore, et d'autre part à la création d'artefacts audibles, les différences de forme d'onde entraînant la création de composantes bruitées perceptibles.
La présente invention vient améliorer la situation.
A cet effet, la présente invention propose un procédé de synthèse spatiale d'un signal somme pour obtenir au moins deux signaux de sortie, le signal somme ainsi que des paramètres de spatialisation étant issus d'un codage paramétrique par matriçage d'un signal multi-canal original. Le procédé comporte les étapes de:
- décorrélation du signal somme pour obtenir un signal décorrélé; - application d'une matrice de synthèse dont les coefficients dépendent des paramètres de spatialisation, au signal décorrélé et au signal somme pour obtenir lesdits signaux de sortie, caractérisé en ce que pour au moins une plage de valeur d'au moins un paramètre de spatialisation, les coefficients de la matrice de synthèse sont déterminés selon un critère de minimisation d'une fonction quantitative (q), relative à la quantité de signal décorrélé dans chacun des signaux de sortie obtenus par l'étape d'application de la matrice de synthèse.
Ainsi, la prise en compte de la quantité de signal décorrélé dans chacun des signaux et donc dans l'étape de synthèse du signal, permet de s'affranchir du cas de figure mentionné précédemment où seul le signal décorrélé intervient dans le matriçage de synthèse. Le procédé selon l'invention permet ainsi de traiter les cas où un paramètre de spatialisation situé dans une plage de valeur prédéterminée entraine une telle situation. Dans un mode particulier de réalisation, la fonction quantitative est telle que l'augmentation en valeur absolu des coefficients de la matrice de synthèse appliqués au signal décorrélé fait augmenter la valeur de ladite fonction appliquée à ces mêmes coefficients.
La minimisation une telle fonction quantitative permet de définir des coefficients de la matrice de synthèse qui permettent d'assurer un bon respect de la forme d'onde du signal d'entrée dans les signaux de sortie.
Plus particulièrement et de façon simple, une telle fonction quantitative peut-être une fonction d'énergie du signal décorrélé.
Cette fonction respecte bien les caractéristiques mentionnée précédemment. D'une façon plus générale, la fonction quantitative est du type:
I q(x, y) = uχ P + y P y avec p entier supérieur ou égal à 1.
Dans un mode particulier de réalisation, les paramètres de spatialisation sont un paramètre (R) de rapport d'énergie entre les canaux du signal multi-canal et un paramètre (I) de corrélation intercanal du signal multi-canal, une plage de valeur étant la plage dans laquelle le paramètre de corrélation intercanal est négatif.
Ainsi, l'invention s'applique plus particulièrement pour les signaux multi- canaux présentant des corrélations intercanal négatives. Elle peut donc être mise en œuvre uniquement pour les valeurs du paramètre de corrélation intercanal négative ou pour toute valeur de ce paramètre.
Dans un autre mode de réalisation, une fonction quantitative différente est choisie par plage de valeur des paramètres de spatialisation.
Il est alors possible de moduler l'importance relative que l'on veut donner aux différentes matrices de synthèse. Il est ainsi possible de donner un poids important à une matrice telle que définie dans l'état de l'art, pour une plage particulière de paramètres et inversement de donner un poids important à la matrice de synthèse au sens de l'invention pour une autre plage de paramètre. Ainsi, on peut conserver une compatibilité avec les systèmes existants dans une certaine plage de fonctionnement et améliorer la qualité du système dans une plage particulière. De plus, la possibilité d'utiliser plusieurs matrices de synthèse obtenues selon différents critères permet d'optimiser la qualité globale du système pour toute la plage de fonctionnement.
L'invention se rapporte également à un dispositif de synthèse spatiale d'un signal somme générant au moins deux signaux de sortie, le signal somme ainsi que des paramètres de spatialisation étant issus d'un dispositif de codage paramétrique mettant en œuvre un matriçage d'un signal multi-canal original. Le dispositif comportant:
- des moyens de décorrélation (510) du signal somme pour obtenir un signal décorrélé;
- des moyens d'application (520) d'une matrice de synthèse (M Minq) dont les coefficients dépendent des paramètres de spatialisation, au signal décorrélé et au signal somme pour obtenir lesdits signaux de sortie, caractérisé en ce que pour au moins une plage de valeur d'au moins un paramètre de spatialisation, les coefficients de la matrice de synthèse sont déterminés selon un critère de minimisation d'une fonction quantitative, relative à la quantité de signal décorrélé dans chacun des signaux de sortie obtenus par les moyens d'application de la matrice de synthèse.
Elle se rapporte à un décodeur comportant un dispositif de synthèse tel que décrit ci-dessus.
L'invention vise aussi un équipement multimédia comportant un décodeur tel que décrit ci-dessus.
De façon non limitative, un tel équipement peut-être par exemple un téléphone mobile, un agenda électronique ou lecteur de contenu numérique, un ordinateur, un décodeur de salon ("set-top box").
Enfin, l'invention vise un programme informatique comportant des instructions de code pour la mise en œuvre des étapes du procédé tel que décrit ci- dessus, lorsque ces instructions sont exécutées par un processeur.
D'autres caractéristiques et avantages de l'invention apparaîtront plus clairement à la lecture de la description suivante, donnée uniquement à titre d'exemple non limitatif, et faite en référence aux dessins annexés, sur lesquels:
- la figure 1 illustre un système de codage/décodage paramétrique classique de l'état de l'art tel que décrit précédemment; - les figures 2 et 3 illustrent des exemples d'arbres de codage tels que décrits précédemment, selon la norme MPEG Surround dans le cas d'un signal multi-canal de type 5.1;
- la figure 4 illustre un système de décodage de l'état de l'art d'un bloc TTO tel que décrit précédemment; - la figure 5 illustre un dispositif de synthèse selon l'invention pour le décodage d'un bloc TTO;
- la figure 6 illustre un dispositif de synthèse pour le décodage d'un bloc TTO selon un mode particulier de réalisation;
- la figure 7 illustre un décodeur selon l'invention dans le cas de signaux multicanaux de type 5.1; et - la figure 8 illustre un exemple d'équipement multimédia comportant au moins un dispositif de synthèse selon l'invention.
La figure 5 illustre un mode de réalisation de l'invention. Elle illustre un dispositif de synthèse pour le décodage d'un bloc TTO (TTO"1). Ce dispositif comprend un module de décorrélation 510, apte à effectuer une étape de décorrélation du signal reçu s qui est un signal somme obtenu au codage par un matriçage de signaux multicanaux.
Cette étape de décorrélation est par exemple celle décrite dans la norme MPEG Surround citée précédemment.
Ce signal décorrélé d et le signal somme s sont pris en compte dans un module de synthèse 520 utilisant une matrice M Minq dont les coefficients dépendent de paramètres de spatialisation R et I reçus et produisant des signaux de sortie 1 et r. Plus précisément, les signaux 1 et r sont générés par le matriçage suivant:
(3)
It21 H22 en respectant les conditions suivantes :
- l'énergie totale est conservée, c'est-à-dire:
Figure imgf000011_0001
- le rapport d'énergie entre 1 et r vaut R, c'est-à-dire: H1 2 + It12 2 = R(h2i 2 + H12 1 ) (5)
- l'intercorrélation normalisée entre 1 et r vaut I, c'est-à-dire:
Figure imgf000011_0002
En utilisant les deux premières conditions, on a h T , 2 + r 2 R , 2 t ~> 1
1 1 Zz 1172 = R + ι et h -2,,1 + O "27S2 = R + ι (7)
Les solutions peuvent donc s'écrire sous la forme
K cos (α) , A12 = Sm(U) , A21 = cos(fc) , A22 s m (*) (8)
Figure imgf000011_0003
Figure imgf000011_0004
Figure imgf000011_0005
Figure imgf000011_0006
La troisième condition, s'écrit alors : cos(α) cos(b) + sin(α) sin(£>) = / (9) c'est-à-dire cos(a -b) = I .
On voit donc que les matrices solutions du problème sont l'ensemble des matrices paramétrées par/?e [0,2;r) de la forme :
Figure imgf000012_0001
arccos(/) avec a = ± — .
2 Ainsi, deux valeurs de α sont possibles. La valeur de β est fonction de R et
I et est choisi selon un mode de réalisation de l'invention de manière à limiter la quantité du signal décorrélé d introduite dans les signaux reconstruits quelque soit les valeurs de corrélation I, y compris pour des valeurs négatives.
Ainsi, le choix de la valeur β peut être formalisé en introduisant une fonction quantitative q relative à la quantité de signal décorrélé pris en compte dans le matriçage pour la reconstruction des signaux.
D'une façon générale, la fonction quantitative q est telle que l'augmentation en valeur absolu des coefficients de la matrice de synthèse appliqués au signal décorrélé, fait augmenter la valeur de la fonction q appliquée à ces mêmes coefficients.
Ainsi, cette fonction quantitative q est telle qu'elle vérifie les conditions suivantes : pour tous réels x, x1, y si x'j ≥ x alors q(x', y) ≥ q(x, y) et symétriquement pour tous réels x, y, y' si y '| ≥ y alors q(x, y ') ≥ q(x, y) . Pour I et R fixés, la valeur de β est alors choisie par minimisation de la fonction :
f {β) = (11)
Figure imgf000013_0001
De nombreuses fonctions quantitative respectant les conditions décrites ci- dessus peuvent être choisies et permettront d'effectuer un choix satisfaisants de β . Ainsi, la fonction q peut-être par exemple de type:
q{x, y) = (\) + (12)
avec p un entier supérieur ou égal à 1.
Dans un mode particulier de réalisation, la fonction quantitative q est une fonction d'énergie du signal décorrélé.
La fonction q est donc telle que: q(x, y) = x2 + y2 (13) Ainsi, les valeurs de β garantissant une reconstruction satisfaisante selon le mode de réalisation de l'invention décrit ici sont choisies de façon à minimiser l'énergie totale du signal décorrélé d dans les signaux reconstruits. On cherche alors β minimisant :
Figure imgf000013_0002
c'est-à-dire
Figure imgf000013_0003
ce qui revient à maximiser :
Figure imgf000013_0004
La dérivée de g est : g W = -2| ^sm(2/?+ 2Or) + -^sin(2/?-2α)
\ K + l K + [ J (γη^
g \β) = -2(^sm(2a)cos (2β) + ^-cos(2a)sm(2β))
Elle s'annule lorsque: tan(2/?) = — -tan(2α) (19)
R + 1 La valeur de β retenue est donc choisie parmi les valeurs vérifiant
υ „ = — 1 arctan fl-R tan ( ,2_a Λ) \ mod J — πλ et correspond ,ant bien a une val ,eur d ,e
H 2 U + l V ') \ 2 ) maximum de g.
Ainsi, la figure 5 représente un dispositif de synthèse pour le décodage d'un bloc TTO, appelé ici TTO"1 comportant un module de décorrélation 510 du signal somme, un module de synthèse 520 apte à appliquer une matrice de synthèse au signal décorrélé et au signal somme. Les coefficients de cette matrice de synthèse sont déterminés selon un critère de minimisation d'une fonction quantitative q relative à la quantité de signal décorrélé tel que décrit ci-dessus.
La figure 5, illustre également les étapes du procédé de synthèse spatiale selon l'invention dans lequel à partir d'un signal somme s, on obtient au moins deux signaux de sortie 1 et r. Le signal somme est issu d'un codage paramétrique par matriçage d'un signal multi-canal fournissant également des paramètres de spatialisation.
Le procédé mis en œuvre par le dispositif de synthèse comporte les étapes de:
-décorrélation (Décorr.) du signal somme pour obtenir un signal décorrélé d;
-application (Synth.) d'une matrice de synthèse (M Minq) dont les coefficients dépendent des paramètres de spatialisation (I, R), au signal décorrélé (d) et au signal somme (s) pour obtenir lesdits signaux de sortie. Ce procédé est tel que pour au moins une plage de valeur d'au moins un paramètre de spatialisation, les coefficients de la matrice de synthèse sont déterminés selon un critère de minimisation d'une fonction quantitative, relative à la quantité de signal décorrélé pris en compte dans l'étape d'application de la matrice de synthèse.
Dans le mode de réalisation décrit précédemment en référence à la figure 5, les paramètres de spatialisation sont des paramètres désignant le rapport d'énergie R entre les canaux du signal multi-canal original et une mesure de corrélation intercanal de ce même signal.
D'autres paramètres de spatialisation issus du codage paramétrique peuvent également être choisis. Ces paramètres peuvent par exemple être des paramètres désignant le déphasage entre les canaux du signal multi-canal, ou des paramètres d'enveloppe temporelle des canaux audio.
La figure 6 illustre un autre mode de réalisation de l'invention dans lequel, en fonction d'une plage de valeur d'au moins un des paramètres de spatialisation reçus, ici le paramètre de corrélation intercanal I, une matrice de synthèse différente est choisi. L'exemple illustré à la figure 6 montre deux types de matrice de synthèse.
La première matrice de synthèse M est par exemple celle décrite dans l'état de l'art dans la norme MPEG Surround. Le module de synthèse correspondant est illustré en 630. Cette matrice de synthèse est appliquée ici au signal somme s et au signal décorrélé d lorsque le paramètre I est positif. Lorsque le paramètre I est négatif, la matrice de synthèse M Minq est celle décrite en référence à la figure 5. Le module de synthèse correspondant est représenté en 620.
Ainsi, le procédé mis en œuvre par ce mode de réalisation permet de traiter efficacement des signaux multi-canaux qui présentent des corrélations intercanal négatives.
Ce type de signal multi-canal est par exemple un signal de type ambiophonique. En effet, ce type de signal présente des canaux en opposition de phase. Cet élément caractéristique des signaux issus d'une prise de son ambiophonique est illustré dans les articles de M. Gerzon intitulés "Hierarchical System of Surround Sound Transmission for HDTV" ou "Ambisonic Decoders for HDTV".
Dans une variante de réalisation, plusieurs matrices de synthèse peuvent être prévues pour des plages de valeurs différentes des paramètres de spatialisation. Ainsi, on peut moduler l'importance relative que l'on veut donner aux différentes matrices de synthèse en fonction des valeurs de paramètres reçus.
Par exemple, il est ainsi possible de donner un poids important à une matrice M telle que décrite dans l'état de l'art pour une plage particulière de paramètres et inversement de donner un poids important à la matrice de synthèse MMinq au sens de l'invention pour une autre plage de paramètre.
La compatibilité avec les systèmes existants dans une certaine plage de fonctionnement est alors conservée. Une amélioration de la qualité de la synthèse dans une plage particulière de valeur de paramètres de spatialisation est alors apportée dans ce mode de réalisation. De plus, la possibilité d'utiliser plusieurs matrices de synthèse obtenues selon différents critères permet d'optimiser la qualité globale de la synthèse pour toute la plage de fonctionnement.
On peut par exemple utiliser différentes matrices de synthèse selon que la valeur d'au moins un paramètre de spatialisation est faible ou au contraire importante. Ainsi dans cette variante du mode de réalisation, on utilisera deux matrices de synthèse telles que pour des valeurs positives de l'indice de corrélation I, on utilisera la matrice M telle que décrit dans l'état de l'art, et pour des valeurs négative de l'indice de corrélation I, on utilisera la matrice MMinq.
On pourra aussi définir différentes plages de fonctionnement comme par exemple:
• pour I > 0, on utilise une matrice Minter = M
• pour 0> I>-0.25, on utilisera une interpolation des deux matrices
Minter = α M + (1- α) MMinq
• pour -0.25> I>-1, on utilisera la matrice Minter = MMinq Ce type de dispositif TTO"1 tel que représenté en figure 5 ou en figure 6 est par exemple intégré dans un décodeur de signal numérique. Un tel type de décodeur est par exemple illustré en référence à la figure 7.
Le décodeur représenté sur cette figure est typiquement prévu pour décoder des signaux multi-canaux de type 5.1. Ainsi, ce décodeur comporte une pluralité de dispositif TTO"1 (TTO0 "1, TTOf1, TTO2 "1, TTO3 "1, TTO4 "1) selon l'invention pour, à partir d'un signal S reçu, obtenir un signal multi-canal comportant 6 canaux (L, R, C,
LFE, Ls, Rs).
Le module de décodage 730 comportant cette pluralité de dispositif de synthèse peut, bien évidemment, être configuré de façon différente selon l'arbre de codage qui a été utilisé pour le signal multi-canal original.
Le décodeur tel que représenté en figure 7 comporte un module d'analyse QMF (pour "quadrature Mirror Filter" en anglais) apte à effectuer une transformation du signal temporel somme (ou downmix) S issu du codeur en un signal fréquentiel par sous-bande. Le signal par bande de fréquence est alors fourni en entrée du module de décodage 730. A la sortie du module de décodage, les signaux traités entrent dans le module de synthèse QMF 720 apte à effectuer une transformation inverse et ramener le signal multi-canal obtenu dans le domaine temporel.
Ces modules d'analyse QMF et de synthèse QMF peuvent par exemple être ceux tels que décrits dans la norme MPEG Surround.
Le décodeur tel que représenté en figure 7 reçoit en provenance du codeur des paramètres P de spatialisation qui sont issus du codage paramétrique du signal multi-canal original.
Typiquement, ces paramètres peuvent être des paramètres de rapport d'énergie entre les canaux, de mesure de corrélation entre les canaux ou encore de déphasage entre les canaux ou enfin d'enveloppe temporelle.
Ce décodeur 700 peut être intégré à un équipement multimédia de type décodeur de salon ou "set-top box", ordinateur ou encore téléphone mobile, lecteur de contenu numérique, agenda électronique personnel, etc.. La figure 8 représente un exemple d'un tel équipement multimédia qui comporte notamment un module d'entrée E apte à recevoir des signaux sonores multi-canaux compressés soit par un réseau de communication par exemple ou par le biais d'une prise de son multi-canal. Ces signaux multi-canaux ont été compressés par une méthode de codage paramétrique qui par matriçage du signal original génère un signal somme S et des paramètres de spatialisation P. Ce codage peut dans un mode alternatif être prévu dans l'équipement multimédia.
Cet équipement comporte un ou plusieurs dispositifs de synthèse selon l'invention représentés matériellement ici par un processeur PROC coopérant avec un bloc mémoire BM comportant une mémoire de stockage et/ou de travail MEM.
Le bloc mémoire peut avantageusement comporter un programme informatique comportant des instructions de code pour la mise en œuvre des étapes du procédé au sens de l'invention, lorsque ces instructions sont exécutées par le processeur PROC, et notamment une étape de décorrélation d'un signal somme reçu pour obtenir un signal décorrélé et une étape d'application d'une matrice de synthèse dont les coefficients dépendent des paramètres de spatialisation, au signal décorrélé et au signal somme pour obtenir au moins deux signaux de sortie. La matrice de synthèse est telle que , pour au moins une plage de valeur d'au moins un paramètre de spatialisation, ses coefficients sont déterminés selon un critère de minimisation d'une fonction quantitative, relative à la quantité de signal décorrélé pris en compte dans l'étape d'application de la matrice de synthèse.
Typiquement, la description de la figure 5 reprend les étapes d'un algorithme d'un tel programme informatique. Le programme informatique peut également être stocké sur un support mémoire lisible par un lecteur du dispositif ou téléchargeable dans l'espace mémoire de l'équipement.
Le bloc mémoire comporte ainsi les coefficients de la matrice de synthèse telle que définie ci-dessus.
Ce bloc mémoire peut comporter dans un autre mode de réalisation de l'invention tel que décrit en référence à la figure 6, des coefficients définissants plusieurs matrices de synthèse qui sont appliqués au signal somme et au signal décorrélé en fonction de plage de valeurs des paramètres de spatialisation reçus.
De même le processeur de l'équipement peut également comporter des instructions pour la mise en œuvre des étapes d'analyse et de synthèse du décodeur tel que décrit en référence à la figure 7.
L'équipement multimédia tel qu'illustré comporte également une sortie S pour délivrer le signal multi-canal reconstruit S' soit par des moyens de restitution de type haut-parleur soit par des moyens de communication apte à transmettre ce signal multi-canal.

Claims

REVENDICATIONS
1. Procédé de synthèse spatiale d'un signal somme pour obtenir au moins deux signaux de sortie, le signal somme ainsi que des paramètres de spatialisation étant issus d'un codage paramétrique par matriçage d'un signal multi-canal original, le procédé comportant les étapes de:
- décorrélation (Decorr.) du signal somme (s) pour obtenir un signal décorrélé (d);
- application (Synth.) d'une matrice de synthèse (M Minq) dont les coefficients dépendent des paramètres de spatialisation (R, I), au signal décorrélé et au signal somme pour obtenir lesdits signaux de sortie, caractérisé en ce que pour au moins une plage de valeur d'au moins un paramètre de spatialisation, les coefficients de la matrice de synthèse sont déterminés selon un critère de minimisation d'une fonction quantitative (q), relative à la quantité de signal décorrélé dans chacun des signaux de sortie obtenus par l'étape d'application de la matrice de synthèse.
2. Procédé selon la revendication 1, caractérisé en ce que la fonction quantitative est telle que l'augmentation en valeur absolu des coefficients de la matrice de synthèse appliqués au signal décorrélé fait augmenter la valeur de ladite fonction appliquée à ces mêmes coefficients.
3. Procédé selon la revendication 1, caractérisé en ce que la fonction quantitative est une fonction d'énergie du signal décorrélé.
4. Procédé selon la revendication 1, caractérisé en ce que la fonction quantitative est du type:
g (x, y) = (Ix P + , y PP y avec p entier supérieur ou égal à 1.
5. Procédé selon la revendication 1, caractérisé en ce que les paramètres de spatialisation sont un paramètre (R) de rapport d'énergie entre les canaux du signal multi-canal et un paramètre (I) de corrélation intercanal du signal multi-canal, une plage de valeur étant la plage dans laquelle le paramètre de corrélation intercanal est négatif.
6. Procédé selon la revendication 1, caractérisé en ce qu'une fonction quantitative différente est choisie par plage de valeur des paramètres de spatialisation.
7. Dispositif de synthèse spatiale d'un signal somme générant au moins deux signaux de sortie, le signal somme ainsi que des paramètres de spatialisation étant issus d'un dispositif de codage paramétrique mettant en œuvre un matriçage d'un signal multi-canal original, le dispositif comportant: - des moyens de décorrélation (510) du signal somme pour obtenir un signal décorrélé;
- des moyens d'application (520) d'une matrice de synthèse (M Minq) dont les coefficients dépendent des paramètres de spatialisation, au signal décorrélé et au signal somme pour obtenir lesdits signaux de sortie, caractérisé en ce que pour au moins une plage de valeur d'au moins un paramètre de spatialisation, les coefficients de la matrice de synthèse sont déterminés selon un critère de minimisation d'une fonction quantitative, relative à la quantité de signal décorrélé dans chacun des signaux de sortie obtenus par les moyens d'application de la matrice de synthèse.
8. Décodeur de signal audio numérique comportant au moins un dispositif de synthèse selon la revendication 7.
9. Equipement multimédia comportant un décodeur selon la revendication 8.
10. Programme informatique comportant des instructions de code pour la mise en œuvre des étapes du procédé selon l'une des revendications 1 à 6, lorsque ces instructions sont exécutées par un processeur.
PCT/FR2009/051146 2008-06-26 2009-06-16 Synthese spatiale de signaux audio multicanaux WO2010004155A1 (fr)

Priority Applications (6)

Application Number Priority Date Filing Date Title
ES09794018T ES2387867T3 (es) 2008-06-26 2009-06-16 Síntesis espacial de señales de audio multicanal
US12/996,406 US8583424B2 (en) 2008-06-26 2009-06-16 Spatial synthesis of multichannel audio signals
AT09794018T ATE557386T1 (de) 2008-06-26 2009-06-16 Raumsynthese mehrkanaliger tonsignale
EP09794018A EP2304721B1 (fr) 2008-06-26 2009-06-16 Synthese spatiale de signaux audio multicanaux
CN200980124551.6A CN102077276B (zh) 2008-06-26 2009-06-16 多声道音频信号的空间合成
JP2011515543A JP5366104B2 (ja) 2008-06-26 2009-06-16 マルチチャネル・オーディオ信号の空間合成

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR0854282 2008-06-26
FR0854282 2008-06-26

Publications (1)

Publication Number Publication Date
WO2010004155A1 true WO2010004155A1 (fr) 2010-01-14

Family

ID=40328191

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/FR2009/051146 WO2010004155A1 (fr) 2008-06-26 2009-06-16 Synthese spatiale de signaux audio multicanaux

Country Status (7)

Country Link
US (1) US8583424B2 (fr)
EP (1) EP2304721B1 (fr)
JP (1) JP5366104B2 (fr)
CN (1) CN102077276B (fr)
AT (1) ATE557386T1 (fr)
ES (1) ES2387867T3 (fr)
WO (1) WO2010004155A1 (fr)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2362376A3 (fr) * 2010-02-26 2011-11-02 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Dispositif et procédé de modification d'un signal audio par mise en forme de son envelope
EP2369861B1 (fr) * 2010-03-25 2016-07-27 Nxp B.V. Traitement de signal audio multi-canal
KR101756838B1 (ko) 2010-10-13 2017-07-11 삼성전자주식회사 다채널 오디오 신호를 다운 믹스하는 방법 및 장치
KR101842257B1 (ko) * 2011-09-14 2018-05-15 삼성전자주식회사 신호 처리 방법, 그에 따른 엔코딩 장치, 및 그에 따른 디코딩 장치
CN104885150B (zh) * 2012-08-03 2019-06-28 弗劳恩霍夫应用研究促进协会 用于多声道缩混/上混情况的通用空间音频对象编码参数化概念的解码器和方法
EP2717263B1 (fr) 2012-10-05 2016-11-02 Nokia Technologies Oy Procédé, appareil et produit de programme informatique pour analyse-synthèse spatiale par catégorie sur le spectre d'un signal audio multi-canaux
EP2830333A1 (fr) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Décorrélateur multicanal, décodeur audio multicanal, codeur audio multicanal, procédés et programme informatique utilisant un prémélange de signaux d'entrée de décorrélateur
CA2919080C (fr) * 2013-07-22 2018-06-05 Sascha Disch Decodeur audio multivoie, codeur audio multivoie, procedes, programme informatique et representation audio codee utilisant une decorrelation de signaux audio rendus
TWI713018B (zh) 2013-09-12 2020-12-11 瑞典商杜比國際公司 多聲道音訊系統中之解碼方法、解碼裝置、包含用於執行解碼方法的指令之非暫態電腦可讀取的媒體之電腦程式產品、包含解碼裝置的音訊系統
KR20160081844A (ko) * 2014-12-31 2016-07-08 한국전자통신연구원 다채널 오디오 신호의 인코딩 방법 및 상기 인코딩 방법을 수행하는 인코딩 장치, 그리고, 다채널 오디오 신호의 디코딩 방법 및 상기 디코딩 방법을 수행하는 디코딩 장치
WO2016108655A1 (fr) 2014-12-31 2016-07-07 한국전자통신연구원 Procédé de codage de signal audio multicanal, et dispositif de codage pour exécuter le procédé de codage, et procédé de décodage de signal audio multicanal, et dispositif de décodage pour exécuter le procédé de décodage
FR3048808A1 (fr) * 2016-03-10 2017-09-15 Orange Codage et decodage optimise d'informations de spatialisation pour le codage et le decodage parametrique d'un signal audio multicanal
CN111407268B (zh) * 2020-03-27 2021-05-14 华南理工大学 一种基于相关函数的多通道脑电信号压缩方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003090206A1 (fr) * 2002-04-22 2003-10-30 Koninklijke Philips Electronics N.V. Synthese de signaux

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US5835375A (en) * 1996-01-02 1998-11-10 Ati Technologies Inc. Integrated MPEG audio decoder and signal processor
DE19632734A1 (de) * 1996-08-14 1998-02-19 Thomson Brandt Gmbh Verfahren und Vorrichtung zum Generieren eines Mehrton-Signals aus einem Mono-Signal
US6199039B1 (en) * 1998-08-03 2001-03-06 National Science Council Synthesis subband filter in MPEG-II audio decoding
US7006636B2 (en) * 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis
DK1527655T3 (da) * 2002-08-07 2007-01-29 Dolby Lab Licensing Corp Rumlig translation af audiokanal
KR100923297B1 (ko) * 2002-12-14 2009-10-23 삼성전자주식회사 스테레오 오디오 부호화 방법, 그 장치, 복호화 방법 및그 장치

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003090206A1 (fr) * 2002-04-22 2003-10-30 Koninklijke Philips Electronics N.V. Synthese de signaux

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
BREEBAART J ET AL: "Background, concept, and architecture for the recent MPEG surround standard on multichannel audio compression", JOURNAL OF THE AUDIO ENGINEERING SOCIETY, AUDIO ENGINEERING SOCIETY, NEW YORK, NY, US, vol. 55, no. 5, 1 May 2007 (2007-05-01), pages 331 - 351, XP008099918, ISSN: 0004-7554 *
BREEBAART J., VAN DE PAR S. KOHLRAUSCH A. SCHUIJERS E: "Parametric Coding of Stereo Audio", EURASIP JOURNAL ON APPLIED SIGNAL PROCESSING, no. 2005:9, 1 June 2005 (2005-06-01), pages 1305 - 1322, XP002514252, Retrieved from the Internet <URL:http://www.jeroenbreebaart.com/papers/jasp/jasp2005.pdf> [retrieved on 20090210] *

Also Published As

Publication number Publication date
CN102077276A (zh) 2011-05-25
US20110106543A1 (en) 2011-05-05
EP2304721A1 (fr) 2011-04-06
US8583424B2 (en) 2013-11-12
ES2387867T3 (es) 2012-10-03
JP5366104B2 (ja) 2013-12-11
EP2304721B1 (fr) 2012-05-09
CN102077276B (zh) 2014-04-09
ATE557386T1 (de) 2012-05-15
JP2011525999A (ja) 2011-09-29

Similar Documents

Publication Publication Date Title
EP2304721B1 (fr) Synthese spatiale de signaux audio multicanaux
EP2374123B1 (fr) Codage perfectionne de signaux audionumeriques multicanaux
EP2374124B1 (fr) Codage perfectionne de signaux audionumériques multicanaux
EP2005420B1 (fr) Dispositif et procede de codage par analyse en composante principale d&#39;un signal audio multi-canal
EP2002424B1 (fr) Dispositif et procede de codage scalable d&#39;un signal audio multi-canal selon une analyse en composante principale
EP2539892B1 (fr) Compression de flux audio multicanal
EP2042001B1 (fr) Spatialisation binaurale de donnees sonores encodees en compression
FR2966634A1 (fr) Codage/decodage parametrique stereo ameliore pour les canaux en opposition de phase
EP2168121B1 (fr) Quantification apres transformation lineaire combinant les signaux audio d&#39;une scene sonore, codeur associe
FR2875351A1 (fr) Procede de traitement de donnees par passage entre domaines differents de sous-bandes
EP2489039A1 (fr) Codage/décodage paramétrique bas débit optimisé
FR3045915A1 (fr) Traitement de reduction de canaux adaptatif pour le codage d&#39;un signal audio multicanal
WO2020177981A1 (fr) Codage audio spatialisé avec interpolation et quantification de rotations
EP2126905B1 (fr) Procédés et dispositifs d&#39;encodage et décodage de signaux audio, signal audio encodé
EP1362344A1 (fr) Procede et dispositif de reconstruction spectrale de signaux a plusieurs voies
EP4042418B1 (fr) Détermination de corrections à appliquer a un signal audio multicanal, codage et décodage associés
EP1582022B1 (fr) Systeme d&#39;embrouillage securise de flux audio
WO2023232823A1 (fr) Titre: codage audio spatialisé avec adaptation d&#39;un traitement de décorrélation
FR3118266A1 (fr) Codage optimisé de matrices de rotations pour le codage d’un signal audio multicanal
FR2990551A1 (fr) Codage/decodage parametrique d&#39;un signal audio multi-canal, en presence de sons transitoires
FR2980619A1 (fr) Codage/decodage parametrique d&#39;un signal audio multi-canal, en presence de sons transitoires

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 200980124551.6

Country of ref document: CN

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 09794018

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2011515543

Country of ref document: JP

Kind code of ref document: A

WWE Wipo information: entry into national phase

Ref document number: 12996406

Country of ref document: US

NENP Non-entry into the national phase

Ref country code: DE

WWE Wipo information: entry into national phase

Ref document number: 2009794018

Country of ref document: EP