EP2198425A1 - Procede, module et programme d'ordinateur avec quantification en fonction des vecteurs de gerzon - Google Patents

Procede, module et programme d'ordinateur avec quantification en fonction des vecteurs de gerzon

Info

Publication number
EP2198425A1
EP2198425A1 EP08840014A EP08840014A EP2198425A1 EP 2198425 A1 EP2198425 A1 EP 2198425A1 EP 08840014 A EP08840014 A EP 08840014A EP 08840014 A EP08840014 A EP 08840014A EP 2198425 A1 EP2198425 A1 EP 2198425A1
Authority
EP
European Patent Office
Prior art keywords
components
function
quantization
module
vectors
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
EP08840014A
Other languages
German (de)
English (en)
Inventor
Adil Mouhssine
Abdellatif Benjelloun Touimi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Orange SA
Original Assignee
France Telecom SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by France Telecom SA filed Critical France Telecom SA
Publication of EP2198425A1 publication Critical patent/EP2198425A1/fr
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing

Definitions

  • the present invention relates to audio signal coding devices comprising quantization modules and intended in particular to take place in applications for transmission or storage of digitized and compressed audio signals.
  • a 3D sound scene also called spatialized sound, comprises a plurality of audio channels each corresponding to monophonic signals.
  • each monophonic signal is encoded independently of other signals based on perceptual criteria for reducing the bit rate by minimizing the perceptual distortion of the monophonic coded signal relative to the original monophonic signal.
  • Audio encoders of the state of the art MPEG 2/4 AAC encoder type provide rate reduction techniques that minimize perceptual distortion of the signal.
  • the coding of the multichannel signals of a sound scene includes, in certain cases, the introduction of a transformation (KLT, Ambiophonic, DCT, etc.) making it possible to better take into account the interactions that may exist between the different signals of the sound scene. to code.
  • KLT KLT, Ambiophonic, DCT, etc.
  • the present invention improves this situation by proposing, in a first aspect, a method of encoding components of an audio scene comprising N signals with N> 1, comprising a step of quantizing at least some of the components.
  • the method is characterized in that the quantization is defined as a function of at least one energy vector and / or a velocity vector associated with Gerzon criteria and function of the components.
  • a method according to the invention thus proposes a quantization which takes into account the interactions between the signals of a sound scene and which thus makes it possible to reduce the spatial distortion of the sound stage and thus to respect its original aspect.
  • the allocation of bits to the spatial components is performed by considering the spatial accuracy and spatial stability of the restored sound scene.
  • the audio quality of the decoded global sound stage is improved for a given coding rate.
  • the quantization is defined as a function of variations of at least one of said energy and velocity vectors during component variations.
  • the allocation of bits to the various components is thus performed as a function of the impact of their respective variations on the spatial accuracy and / or the spatial stability of the decoded sound scene.
  • component variations corresponding to the minimization, or limitation, of variations of at least one of the energy and velocity vectors are determined and, based on said component variations, values are derived. quantization errors to define the quantification of components. This arrangement makes it possible to determine the quantization function which will give rise to a minimum or limited disturbance of the restored sound scene.
  • a method according to the invention further comprises a step of detecting a transition frequency for determining which of the vectors among the energy vector or the velocity vector to be taken into account to define the quantization. components.
  • the components are components obtained by spatial transformation, for example of the ambiophonic type.
  • the transformation is a time / frequency transformation, for example a DCT, or a transformation combination.
  • the energy vector is calculated based on an inverse spatial transformation on said spatial components and / or the velocity vector is calculated based on an inverse spatial transformation on said spatial components.
  • the invention proposes a component processing module originating from an audio scene comprising N signals with N> 1, comprising means for determining elements for defining a quantization step of at least some of the components. , based at least on the energy vectors and / or the velocity vector associated with Gerzon criteria and function of the components.
  • the invention provides an audio coder adapted to encode components of an audio scene comprising N signals with N> 1, comprising: a component processing module according to the second aspect of the invention; and a quantization module adapted to define quantization indices associated with components as a function of at least elements determined by the processing module.
  • the invention proposes a computer program to be installed in a processing module, said program comprising instructions for implementing, during a program execution by means of processing said module, the steps of a method according to the first aspect of the invention.
  • FIG. 1 represents an encoder in one embodiment of the invention
  • Figure 2 illustrates the propagation of a plane wave in space
  • FIG. 3 represents a device for restoring a sound stage, comprising loudspeakers.
  • Gerzon's criteria are generally used to characterize the location of synthesized virtual sound sources when rendering signals from a 3D sound stage from the speakers of a given sound rendering system.
  • the velocity vector V, of polar coordinates (r v , ⁇ v ) is then defined as
  • the energy vector É, of polar coordinates (r E , ⁇ E ) is defined as follows:
  • the encoder described below in one embodiment of the invention utilizes the velocity and energy vectors associated with the Gerzon criteria in an application other than that of searching for the best angles ⁇ p t characterizing the position of the speakers. speakers of a sound rendering system considered.
  • Figure 1 shows an audio coder 1 in one embodiment of the invention.
  • the encoder 1 comprises a time / frequency transformation module 3, a spatial transformation module 4, a quantization module 6 and a module 7 for constituting a binary sequence.
  • a 3D sound stage to be coded includes
  • N channels (with N> 1) on each of which a respective signal Si, ..., S N is delivered.
  • the time / frequency conversion module 3 of the encoder 1 receives as input the N signals Si,..., S N of the 3D sound scene to be encoded.
  • An MDCT coefficient Y 1 k thus represents the element of the spectrum of the signal Si for the frequency F k .
  • the spatial transformation module 4 is adapted to perform a spatial transformation of the input signals provided, that is to say to determine the spatial components of these signals resulting from the projection on a spatial repository depending on the order of the transformation. .
  • the order of a spatial transformation is related to the angular frequency according to which it "scans" the sound field.
  • the spatial transformation considered is the ambiophonic transformation.
  • the sound scene is then represented by a set of signals called ambiophonic components, which make it possible to store the sound information relative to the acoustic field. This representation facilitates the manipulation of the acoustic field (rotation of the sound stage, distortion of perspective i.e. possibility of tightening the frontal scene and dilating the back scene) and the extraction of relevant parameters for a reproduction on a given device.
  • Another advantage of the surround transformation is that, in the case where the number N of signals of the sound stage is large, it is possible to represent them by a number L of ambiophonic components much lower than N, degrading very little the quality space of the sound stage. The volume of data to be transmitted is reduced and this without significant degradation of the audio quality of the sound scene.
  • the spatial transformation module 4 performs an ambiophonic transformation, which gives a compact spatial representation of a 3D sound scene, by producing projections of the sound field on the associated spherical or cylindrical harmonic functions.
  • ambiophonic transformations For more information on the ambiophonic transformations, one can refer to the following documents: "Representation of acoustic fields, application to the transmission and the reproduction of complex sound scenes in a multimedia context", Thesis of doctorate of the university Paris 6, Jerome DANIEL, July 31, 2001, "A highly scalable spherical array based microphone on an orthonormal decomposition of the sound field," Jens Meyer - Gary Elko, Vol. He - pp. 1781-1784 in Proc. ICASSP 2002.
  • the ambiophonic transform of a signal Si expressed in the time domain then comprises the following 2p + 1 components: (Pi, Pi. cos ⁇ i, Pi.sin ⁇ i, Pi.cos2 ⁇ i, Pi.sin2 ⁇ i, Pi.cos3 ⁇ i, Pi.sin3 ⁇ i, ..., Pi.cosp ⁇ i,
  • A (A i ⁇ ⁇ ⁇ L be the ambiophonic transformation matrix of order pl ⁇ J ⁇ N for the 3D scene.
  • yf2 cos p ⁇ N
  • X (x ⁇ k ⁇ ⁇ t ⁇ L
  • the matrix X of the surround components is determined using the following equation:
  • the method exploits relationships between variations in velocity and energy vectors used in Gerzon criteria and variations in surround components.
  • the quantization function thus defined is then applied to the ambiophonic components received by the quantization module 6.
  • D be the p-order ambiophonic decoding matrix for a regular loudspeaker audio rendering system (i.e., the loudspeakers are arranged regularly around a point).
  • ambiophonic components of order p with L Ip + 1 and ⁇ [k] is the vector of the powers of the respective signals delivered to the loudspeakers Q 'after surround decoding.
  • a variation of the values taken by the ambiophonic components therefore implies a corresponding variation or displacement of the Gerzon vectors around their original position.
  • the processing module 5 seeks to determine the quantization error h of the surround components with the Deb flow rate, which optimizes the displacement of the vectors. of Gerzon.
  • the optimization sought is the minimization, or the limitation within a given threshold, of the displacement of the Gerzon vectors around their position corresponding to a zero error. This amounts to looking for the value of the error vector h which allows the Gerzon vectors to keep an orientation and a module fairly close to the calculated Gerzon vectors without quantization.
  • Gerzon's vectors make it possible to control the degree of spatial fidelity (stability and accuracy of the sound image restored) during the rendering of a sound scene on a given device.
  • This vector (10) represents the variations of the Gerzon vectors for a displacement h of the values of the ambiophonic components (X n ) 1 ⁇ n ⁇ L -
  • the quantization module 6 is a high resolution quantizer
  • the optimization problem to be solved can be written as follows: r ⁇ d ⁇ v ⁇ (hf
  • Element ⁇ is a vector indicating a given threshold of spatial perception. This threshold vector ⁇ can be determined statistically by calculating for different rendering systems and for different ambiophonic transformation orders the threshold at which the change in the values taken by the surround components becomes perceptible.
  • this optimization problem is solved by the processing module using the Lagrangian method and gradient descent methods, for example using a computer program implementing the steps of the algorithm described below.
  • Lagrangian and gradient descent methods are known.
  • step b / it is determined, with respect to the frequency Fk,
  • This determination is made by searching the coordinates of
  • step d / the flow is determined Dj ( ⁇ allocated for coding the j ⁇ eme surround component in the frequency F k equal to
  • the value D (1> is then compared to the Deb value of the desired overall flow rate.
  • step d / an iteration (l ⁇ , the value of the flow D (l /> obtained
  • the coordinates h (//) of the vector h '''calculated during the iteration (l f ) for a frequency Fk are those of the error minimizing the displacement of the Gerzon vectors in the frequency F k .
  • the quantization function is thus defined for each surround component in each frequency F k: the coordinate h ⁇ (lf) (k) calculated for the frequency Fk represents the quantization error of the j ⁇ eme surround component in the frequency Fk.
  • the module 6 determines the corresponding quantization indices for each ambiophonic spectral component and supplies these data to the module 7 for constituting a binary sequence.
  • additional processing on the received data for example an entropy coding
  • the invention thus proposes a novel quantization technique applicable to multichannel signals, which takes into account spatial characteristics of the scene to be encoded.
  • the quantization defined by the allocation of the bits, by the quantization steps or by an index characterizing a quantizer among a set, is determined so as to cause a limited deviation of the Gerzon vectors, and thus to guarantee during the restitution of the Quantized signals an acoustic scene true to the original acoustic scene.
  • the velocity and energy vectors are two mathematical tools introduced by Gerzon whose objective is to translate the effect of the localization, in the low and high frequency domains respectively, of a synthesized sound source. For a listener placed in the center of a reproduction device, the velocity vector V and the energy vector E are respectively associated with the location effects at low and high frequencies.
  • a transition frequency is determined which determines the preponderance domains of the V and E criteria.
  • the prediction of the location is carried out thanks to the energy vector É and for the frequencies below this transition frequency, the location is based on the velocity vector V.
  • the transition frequency corresponds to the frequency beyond which the wavefront is smaller than the size of the head. In the case of first-order surround systems, this transition frequency is of the order of 700 Hz.
  • the first problem corresponds to seeking to optimize the position of the source reconstructed after quantization in the low frequency domain
  • the second problem corresponds to seeking to optimize it in the high frequency domain.
  • the invention is implemented using an inverse spatial transformation of a spatial transformation used during coding.
  • the Gerzon vectors are computed and used independently of a transform possibly used during coding, ie the invention may be implemented when the signals are or are not spatial transformation or other.
  • Gerzon vectors are physical parameters that make it possible to characterize the wavefront reconstructed by the superposition of the waves emitted by the different loudspeakers (see “Representation of acoustic fields, application to the transmission and reproduction of scenes”. complex sounds in a multimedia context ", Doctoral thesis of the Paris 6 University, July 31, 2001, Jércons Daniel).
  • Gerzon vectors can be computed without the prior use of surround encoding.

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Procédé de codage de composantes ( Xi,k ) d'une scène audio comprenant N signaux (S1,..., SN) avec N>1, comportant une étape de quantification de certaines au moins des composantes, selon lequel la quantification est définie en fonction au moins d'un vecteur d'énergie et/ou d'un vecteur de vélocité associé(s) à des critères de Gerzon et fonction desdites composantes.

Description

PROCEDE, MODULE ET PROGRAMME D'ORDINATEUR AVEC QUANTIFICATION EN FONCTION DES VECTEURS DE GERZON
La présente invention concerne les dispositifs de codage de signaux audio comprenant des modules de quantification et destinés notamment à prendre place dans des applications de transmission ou de stockage de signaux audio numérisés et compressés.
L'invention concerne plus particulièrement le codage de scènes sonores 3D. Une scène sonore 3D, encore appelée son spatialisé, comprend une pluralité de canaux audio correspondant chacun à des signaux monophoniques.
Dans des techniques de codage de signaux d'une scène sonore, chaque signal monophonique est codé indépendamment des autres signaux sur la base de critères perceptuels visant à réduire le débit en minimisant la distorsion perceptuelle du signal monophonique codé par rapport au signal monophonique d'origine. Les codeurs audio de l'état de l'art de type codeur MPEG 2/4 AAC offrent des techniques de réduction du débit qui minimisent la distorsion perceptuelle du signal.
Une autre technique de codage de signaux d'une scène sonore, utilisée dans le codeur « MPEG Audio Surround » (cf. « Text of ISO/IEC FDIS 23003-1 , MPEG Surround », ISO/IEC JTC1 / SC29 / WG11 N8324, JuIy 2006, Klagenfurt,
Austria), comprend l'extraction et le codage de paramètres spatiaux à partir de l'ensemble des signaux audio monophoniques sur les différents canaux. Ces signaux sont ensuite mélangés pour obtenir un signal monophonique ou stéréophonique, qui est alors comprimé par un codeur mono ou stéréo classique (par exemple de type MPEG-4 AAC, HE-AAC, etc). Au niveau du décodeur, la synthèse de la scène sonore 3D restituée se fait à partir des paramètres spatiaux et du signal mono ou stéréo décodé.
Le codage des signaux multicanaux d'une scène sonore comprend dans certains cas l'introduction d'une transformation (KLT, Ambiophonique, DCT...) permettant de mieux prendre en compte les interactions qui peuvent exister entre les différents signaux de la scène sonore à coder.
Pour ces nouveaux types de codeurs, se pose alors le problème d'offrir une réduction du débit qui respecte l'aspect spatial de la scène sonore. La présente invention vient améliorer cette situation en proposant, suivant un premier aspect, un procédé de codage de composantes d'une scène audio comprenant N signaux avec N>1 , comportant une étape de quantification de certaines au moins des composantes. Le procédé est caractérisé en ce que la quantification est définie en fonction au moins d'un vecteur d'énergie et/ou d'un vecteur de vélocité associé(s) à des critères de Gerzon et fonction des composantes.
Un procédé selon l'invention propose ainsi une quantification qui prend en compte les interactions entre les signaux d'une scène sonore et qui permet ainsi de réduire la distorsion spatiale de la scène sonore et donc de respecter son aspect original. L'allocation de bits aux composantes spatiales est réalisée en considérant la précision spatiale et la stabilité spatiale de la scène sonore restituée.
La qualité audio de la scène sonore globale décodée est améliorée pour un débit de codage donné.
Dans un mode de réalisation, la quantification est définie en fonction de variations d'au moins un desdits vecteurs d'énergie et de vélocité lors de variations de composantes. L'allocation de bits aux différentes composantes est ainsi réalisée en fonction de l'impact de leurs variations respectives sur la précision spatiale et/ou la stabilité spatiale de la scène sonore décodée.
Dans un mode de réalisation, on détermine des variations de composantes correspondant à la minimisation, ou à la limitation, de variations d'au moins un des vecteurs d'énergie et de vélocité et on déduit, en fonction desdites variations des composantes, des valeurs d'erreurs de quantification permettant de définir la quantification des composantes. Cette disposition permet de déterminer la fonction de quantification qui donnera lieu à une perturbation minimum, ou limitée, de la scène sonore restituée.
Dans un mode de réalisation, un procédé selon l'invention comporte en outre une étape de détection d'une fréquence de transition permettant de déterminer celui des vecteurs parmi le vecteur d'énergie ou le vecteur de vélocité à prendre en compte pour définir la quantification des composantes. Une telle disposition permet d'augmenter la qualité du codage tout en limitant le volume de calcul à réaliser. Dans un mode de réalisation, les composantes sont des composantes obtenues par transformation spatiale, par exemple de type ambiophonique.
Dans d'autres modes de réalisation, la transformation est une transformation de type temps/fréquence, par exemple une DCT, ou encore une combinaison de transformation.
Dans un mode de réalisation, le vecteur d'énergie est calculé en fonction d'une transformation spatiale inverse sur lesdites composantes spatiales et/ou le vecteur de vélocité est calculé en fonction d'une transformation spatiale inverse sur lesdites composantes spatiales. Suivant un second aspect, l'invention propose un module de traitement de composantes provenant d'une scène audio comprenant N signaux avec N>1 , comprenant des moyens pour déterminer des éléments de définition d'une étape de quantification de certaines au moins des composantes, en fonction au moins du vecteurs d'énergie et/ou du vecteur de vélocité associé(s) à des critères de Gerzon et fonction des composantes.
Suivant un troisième aspect, l'invention propose un codeur audio adapté pour coder des composantes d'une scène audio comprenant N signaux avec N>1 , comportant : un module de traitement de composantes suivant le deuxième aspect de l'invention ; et un module de quantification adapté pour définir des indices de quantification associés à des composantes en fonction au moins d'éléments déterminés par le module de traitement.
Suivant un quatrième aspect, l'invention propose un programme d'ordinateur à installer dans un module de traitement, ledit programme comprenant des instructions pour mettre en œuvre, lors d'une exécution du programme par des moyens de traitement dudit module, les étapes d'un procédé suivant le premier aspect de l'invention.
D'autres caractéristiques et avantages de l'invention apparaîtront encore à la lecture de la description qui va suivre. Celle-ci est purement illustrative et doit être lue en regard des dessins annexés sur lesquels : la figure 1 représente un codeur dans un mode de réalisation de l'invention ; la figure 2 illustre la propagation d'une onde plane dans l'espace ; la figure 3 représente un dispositif de restitution d'une scène sonore, comprenant des haut-parleurs.
Les critères de Gerzon sont généralement utilisés pour caractériser la localisation des sources sonores virtuelles synthétisées lors de la restitution de signaux d'une scène sonore 3D depuis les haut-parleurs d'un système de rendu sonore donné.
Ces critères reposent sur l'étude des vecteurs de vélocité et d'énergie des pressions acoustiques générées par le système de rendu sonore utilisé.
Lorsqu'un système de rendu sonore comprend n haut-parleurs, les n signaux générés par ces haut-parleurs, sont définis par une pression acoustique Pi et un angle de propagation acoustique <pt , i=1 à n.
Le vecteur de vélocité V , de coordonnées polaires (rvv) est alors défini ainsi
Le vecteur d'énergie É , de coordonnées polaires (rEE) est défini ainsi :
Les conditions nécessaires pour que la localisation des sources sonores virtuelles soit optimale se définissent en cherchant les angles <pt , caractérisant la position des haut-parleurs du système de rendu sonore considéré, qui vérifient les critères ci-dessous, dits critères de Gerzon, qui sont les critères suivants : - critère 1 , relatif à la précision de l'image sonore de la source S en basses fréquences : θv = θ ; où θ est l'angle de propagation de la source S réelle qu'on cherche à atteindre.
- critère 2, relatif à la stabilité de l'image sonore de la source S en basses fréquences : rv = 1 ;
- critère 3, relatif à la précision de l'image sonore de la source S en hautes fréquences : ΘE = Θ ;
- critère 4, relatif à la stabilité de l'image sonore de la source S en hautes fréquences : rE = 1.
Le codeur décrit ci-dessous dans un mode de réalisation de l'invention utilise les vecteurs de vélocité et d'énergie associés aux critères de Gerzon dans une application autre que celle consistant à rechercher les meilleurs angles <pt caractérisant la position des haut-parleurs d'un système de rendu sonore considéré.
La figure 1 représente un codeur audio 1 dans un mode de réalisation de l'invention.
Le codeur 1 comprend un module 3 de transformation temps/fréquence, un module 4 de transformation spatiale, un module 6 de quantification et un module 7 de constitution d'une séquence binaire.
Une scène sonore 3D à coder, considérée à titre d'illustration, comprend
N canaux (avec N >1 ) sur chacun desquels un signal respectif Si, ..., SN est délivré. Le module 3 de transformation temps/fréquence du codeur 1 reçoit en entrée les N signaux Si,..., SN de la scène sonore 3D à coder.
Chaque signal Si, i = 1 à N, est représenté par la variation de sa pression omnidirectionnelle acoustique Pi et l'angle θj de propagation, dans l'espace de la scène 3D, de l'onde acoustique associée. Sur chaque trame temporelle de chacun de ces signaux indiquant les différentes valeurs prises au cours du temps par la pression acoustique Pi, le module 3 de transformation temps/fréquence effectue une transformation temps/fréquence. Il détermine, dans le cas présent, pour chacun des signaux Si, i=1 à N, sa représentation spectrale caractérisée par M coefficients MDCT Y1 k , avec k= 0 à M-1. Un coefficient MDCT Y1 k représente ainsi l'élément du spectre du signal Si pour la fréquence Fk. Les représentations spectrales Y1 k , k= 0 à M-1 , des signaux Si, i= 1 à N, sont fournies en entrée du module 4 de transformation spatiale, qui reçoit en outre en entrée les angles θi de propagation acoustique caractérisant les signaux d'entrée Si.
Le module 4 de transformation spatiale est adapté pour effectuer une transformation spatiale des signaux d'entrée fournies, c'est-à-dire déterminer les composantes spatiales de ces signaux résultant de la projection sur un référentiel spatial dépendant de l'ordre de la transformation.
L'ordre d'une transformation spatiale se rattache à la fréquence angulaire selon laquelle elle « scrute » le champ sonore. Dans un mode de réalisation, la transformation spatiale considérée est la transformation ambiophonique. La scène sonore est alors représentée par un ensemble de signaux appelés composantes ambiophoniques, qui permettent de stocker l'information sonore relative au champ acoustique. Cette représentation facilite la manipulation du champ acoustique (rotation de la scène sonore, distorsion de perspectif i.e. possibilité de resserrer la scène frontale et dilater la scène arrière) et l'extraction des paramètres pertinents pour une reproduction sur un dispositif donné.
Un autre avantage de la transformation ambiophonique est que, dans le cas où le nombre N de signaux de la scène sonore est grand, il est possible de les représenter par un nombre L de composantes ambiophoniques bien inférieur à N, en dégradant très peu la qualité spatiale de la scène sonore. Le volume de données à transmettre est donc réduit et ceci sans dégradation importante de la qualité audio de la scène sonore.
Ainsi, dans le cas considéré, le module 4 de transformation spatiale effectue une transformation ambiophonique, qui donne une représentation spatiale compacte d'une scène sonore 3D, en réalisant des projections du champ sonore sur les fonctions harmoniques sphériques ou cylindriques associées. Pour plus d'information sur les transformations ambiophoniques, on pourra se référer aux documents suivants : « Représentation de champs acoustiques, application à la transmission et à la reproduction de scènes sonores complexes dans un contexte multimédia », Thèse de doctorat de l'université Paris 6, Jérôme DANIEL, 31 juillet 2001 , « A highly scalable spherical microphone array based on an orthonormal décomposition of the sound field », Jens Meyer - Gary Elko, Vol. Il - pp. 1781-1784 in Proc. ICASSP 2002.
En référence à la figure 2, la formule suivante donne la décomposition en harmoniques cylindriques à un ordre infini d'un signal Si de la scène sonore : Sj(r, φ) = Pi.[J0(kr) + ^ 2.jmJm(kr).(cosm.θrcosm.φ + smm.θrsmm.φ) ] l≤m≤∞ où (Jm) représentent les fonctions de Bessel, r la distance entre le centre du repère et la position d'un auditeur placé en un point M, Pi la pression acoustique du signal Si, θi l'angle de propagation de l'onde acoustique correspondant au signal Si et φ l'angle entre la position de l'auditeur et l'axe du repère.
Si la transformation ambiophonique est d'ordre fini p, pour une transformation ambiophonique 2D (selon le plan horizontal), la transformée ambiophonique d'un signal Si exprimée dans le domaine temporel comprend alors les 2p+1 composantes suivantes : (Pi, Pi.cosθi, Pi.sinθi, Pi.cos2θi, Pi.sin2θi, Pi.cos3θi, Pi.sin3θi, ..., Pi.cospθi,
Pi.sinpθi).
Dans ce qui suit, il a été considéré une transformation ambiophonique 2D. Néanmoins l'invention peut être mise en œuvre avec une transformation ambiophonique 3D (dans un tel cas, on considère que les haut-parleurs sont disposés sur une sphère).
Par ailleurs, l'invention peut être mise en œuvre avec un ordre p de transformation ambiophonique quelconque, par exemple p=2 ou plus.
Soit A = (Ai }\≤ι≤L la matrice de transformation ambiophonique d'ordre p l≤J≤N pour la scène 3D.
Ï - 1
Alors A1 ; = 1 , Kr Jî COS θ} si i pair et A1 } = Vïssiin θ ;, si i
impair, soit : 1 1
V2 cos 6> yjï COS 6>2 . yfïcosθN
V2 sin 6> 4l ήn θ2 . yfïsmθN yfïcos 2θ1 yfïcos2θ2 . V2 cos2#w
A = ^Jî SJn W1 T/Î sin W2 . 4ïήn2θN
V2 COS pU1 yJ2 cos pθ2 . yf2 cos pθN
Soit Y la matrice des composantes fréquentielles des signaux Si, i= 1 à
Soit X la matrice des composantes ambiophoniques : X = (xι k\≤t≤L
O≤k≤M-l
La matrice X des composantes ambiophoniques est déterminée à l'aide de l'équation suivante :
X = A . Y (3)
Le module 4 de transformation spatiale est ainsi adapté pour déterminer la matrice X , à l'aide de l'équation (3) en fonction des données Y1 k et θi (i=1 à N, k= 0 à M-1 ) qui lui sont fournies en entrée.
Les valeurs X1 k (i=1 à L, k= 0 à M-1 ), qui sont les éléments à coder par le codeur 1 dans une séquence binaire, sont fournies en entrée du module 6 de quantification.
Le module 6 de quantification comprend un module 5 de traitement adapté pour mettre en œuvre un procédé pour définir la fonction de quantification à appliquer à des composantes ambiophoniques X1 k (i=1 à L, k= 0 à M-1 ) reçues. Le procédé exploite des relations entre les variations des vecteurs vélocité et énergie utilisés dans les critères de Gerzon et les variations des composantes ambiophoniques. La fonction de quantification ainsi définie est ensuite appliquée aux composantes ambiophoniques reçues par le module 6 de quantification.
Les étapes de définition de la fonction de quantification mises en œuvre par le module 5 de traitement sont basées sur les principes décrits ci-dessous, relativement aux valeurs obtenues X1 k (i=1 à L, k= 0 à M-1 ), des composantes ambiophoniques à quantifier.
Considérons D la matrice de décodage ambiophonique d'ordre p pour un système régulier de rendu audio à Q' haut-parleurs (c'est-à-dire que les haut- parleurs sont disposés régulièrement autour d'un point).
χ[*] = est le vecteur pour la fréquence Fk (k=0 à M-1 ) des
composantes ambiophoniques d'ordre p avec L = Ip + 1 et τ[k] est le vecteur des puissances des signaux respectifs délivrés aux Q' hauts parleurs après décodage ambiophonique.
On a alors τ[fc] = D.X[fc] (4)
Si [φv---,φQ^ est le vecteur des angles de propagation acoustique depuis les Q' hauts parleurs respectifs, alors la matrice D de décodage ambiophonique d'ordre p s'écrit de la manière suivante :
Q, On notera que le choix d'un système régulier a été fait parce que la matrice de décodage présente alors une complexité de calcul réduite (soit D' la matrice ambiophonique d'ordre p adaptée pour coder L signaux, alors la matrice de décodage Vdécodage =—D'τ ). Toutefois une autre matrice de décodage ambiophonique peut être utilisée par le module 5 de traitement.
Les coordonnées des vecteurs de vélocité V et d'énergie E , qu'on nommera ci-après vecteurs de Gerzon, vérifient pour la fréquence Fk , k=0 à M-1 :
rv cosθv [k]
rE sin θE [k] =
et par conséquent on obtient (équations (5)) :
Σi≤ι≤β{∑i<-j<-L<rXj,k ) cos^
Ce dernier système d'équations (5) définit la relation qui existe entre les composantes ambiophoniques et les vecteurs de Gerzon V et É , définis par leurs coordonnées polaires respectives (rvv) et (rEE) .
Une variation des valeurs prises par les composantes ambiophoniques implique donc une variation ou un déplacement correspondant(e) des vecteurs de Gerzon autour de leur position originale.
Or, dans le cas où les composantes ambiophoniques sont quantifiées, leurs valeurs quantifiées ne sont autres que des valeurs approchées de leurs vraies valeurs.
Il va maintenant être déterminé l'influence sur les vecteurs de Gerzon d'un déplacement élémentaire h autour des valeurs des composantes ambiophoniques.
Par définition de la différentielle d'une fonction composée, on peut écrire que : d tm(θv [k](h)) = (l + tm2v [k](h))).dθv [k](h) d tan(θE [k](h)) = (l + tan2E [k](h))).dθE [k](h)
(6) dr2 (h) = 2rv (h).drv drE (h) = 2rE (h).drE
On peut déduire de ces équations (6) que la connaissance des variations des fonctions tan(6^ [fc]) , tan(0£ [fc]) , r2 et r2 permet de déterminer la variation correspondante des vecteurs de Gerzon autour du vecteur h .
Le vecteur h = représente l'erreur de quantification pour une fréquence Fk des composantes ambiophoniques X1 k (i=1 à L) considérées.
La différentielle de la fonction tanj^ [&]) autour du vecteur h peut s'écrire comme suit :
d tm(θv [k](h)) = ∑hn. AJlUZ , (7).
H=I dX. En calculant alors, à l'aide des équations (5), les dérivées partielles des fonctions tan(#v[fc]) et ry 2 par rapport à la variation (K)ι<n<L de chaque composante ambiophonique on obtient pour «e[l,L], fce [O5Af-I], (équations (8)) :
De même on calcule les dérivées partielles des fonctions tan(0g[fc]) et ri (équations (9)), pour we[l,L] et ke [0,Af-I] :
Dans le paragraphe ci-dessus ont ainsi été déterminées les relations (8) et (9) qui lient les variations des vecteurs de Gerzon aux variations des composantes ambiophoniques. L'erreur que les vecteurs de Gerzon subissent est donc fonction de l'erreur introduite sur les composantes ambiophoniques. Dans ce qui suit, ces relations sont exploitées par le module 5 de traitement pour déterminer un nouveau type de quantification se basant sur les critères de spatialisation.
Dans un mode de réalisation de l'invention, étant donné un débit de valeur Deb octroyé pour la quantification, le module 5 de traitement cherche à déterminer l'erreur h de quantification des composantes ambiophoniques avec le débit Deb , qui optimise le déplacement des vecteurs de Gerzon.
Dans un mode de réalisation, l'optimisation recherchée est la minimisation, ou encore la limitation en-deçà d'un seuil donné, du déplacement des vecteurs de Gerzon autour de leur position correspondant à une erreur nulle. Cela revient à chercher la valeur du vecteur d'erreur h qui permet aux vecteurs de Gerzon de garder une orientation et un module assez proche des vecteurs de Gerzon calculés sans quantification.
En effet, les vecteurs de Gerzon permettent de contrôler le degré de fidélité spatiale (stabilité et précision de l'image sonore restituée) lors de la restitution d'une scène sonore sur un dispositif donné.
Considérons le vecteur de fonctions suivantes:
Ce vecteur (10) représente les variations des vecteurs de Gerzon pour un déplacement h des valeurs des composantes ambiophoniques (Xn)1<n<L -
Soit Deb le débit global alloué au module 6 de quantification pour quantifier les composantes ambiophoniques. Le débit global Deb est égal à la somme des débits D ;>s alloués à chaque fréquence Fs, s= 0 à M-1 , de chaque composante ambiophonique (Xn)1<n<L , M représentant le nombre de bandes spectrales des composantes ambiophoniques
L M -I
Ainsi Deb = ∑ ∑ D] s .
Dans le cas où le module 6 de quantification est un quantificateur à haute résolution, on peut écrire que :
X J,k
Dj,k = cte + -loèw (11 )
Ainsi, dans un mode de réalisation, le problème d'optimisation à résoudre peut être écrit comme suit : r\dθv\(hf
« Déterminer h minimisant κ(h) selon la norme de D
L M-I dans chaque fréquence Fk, sous la contrainte du débit global Deb = ∑ ∑ D] s ».
/=1 k=0
La résolution de ce problème peut être faite à la place en considérant le problème dual : « Déterminer h minimisant dans chaque fréquence Fk le débit global Deb sous la contrainte |K(h)|2 < |δ|2 », une condition suffisante pour minimiser le débit global Deb consistant à minimiser le débit élémentaire dans chaque fréquence.
L'élément δ est un vecteur indiquant un seuil de perception spatiale donné. Ce vecteur seuil δ peut être déterminé de façon statistique en calculant pour différents systèmes de rendu et pour différents ordres de transformation ambiophoniques le seuil à partir duquel le changement des valeurs prises par les composantes ambiophonique devient perceptible.
Dans un mode de réalisation, ce problème d'optimisation est résolu par le module 5 de traitement en utilisant la méthode lagrangienne et des méthodes de descente du gradient, à l'aide par exemple d'un programme d'ordinateur mettant en œuvre les étapes de l'algorithme décrit ci-dessous. Les méthodes lagrangienne et de descente du gradient sont connues. Lors d'une itération de l'algorithme, chaque étape a/, b/ ou c/ est mise en œuvre en parallèle pour chaque fréquence Fk,, k=0 à M.
L'étape d/ utilise les résultats déterminés pour l'ensemble des fréquences Fk> k =0 à M-1.
Soit la fonction lagrangienne suivante : L(X, λ) = D; jt -λ(κ(x)-δ) . • Dans une première étape a/ pour une fréquence Fk, les coordonnées du vecteur de Lagrange λ sont initialisées : λ = λ(0) .
Puis les étapes b/ à d/ sont réalisées successivement pour (Z) = (0) :
Dans l'étape b/, on détermine, relativement à la fréquence Fk,
Cette détermination est effectuée en recherchant les coordonnées de
X tel que les dérivées partielles fixe) sont nulles, à l'aide des équations (6), (7), (8) et (9).
Dans l'étape c/, on calcule, relativement à la fréquence Fk, λ(/+7) = max|λ(/) + α.g(/i(/)j,θ| , où g représente la fonction gradient.
E (til) )
On a s(hw) = drv (h«> )
A l'aide des équations (6), (7) et (8) et (9), on détermine la valeur de • Dans l'étape d/, on détermine le débit Dj( \ alloué pour le codage de la jιeme composante ambiophonique dans la fréquence Fk, égal à
selon l'équation (11 ).
L M-I
Puis on calcule la somme D(l) = V /—i V /—i D j(lk) des débits D( ιl-k), .
On compare ensuite la valeur D(l> à la valeur Deb du débit global souhaité.
Si la valeur du débit obtenu D(l) est supérieure à la valeur Deb souhaitée, on incrémente (Z) de 1 et on réitère les étapes b/ à d/.
Sinon, on stoppe les itérations.
Lorsque à l'étape d/ d'une itération (lΛ , la valeur du débit D(l/> obtenu
est inférieure à la valeur Deb souhaitée, les coordonnées h(//) du vecteur h''" calculée lors de l'itération (lf ) pour une fréquence Fk sont celles de l'erreur minimisant le déplacement des vecteurs de Gerzon dans la fréquence Fk.
La fonction de quantification est ainsi définie pour chaque composante ambiophonique dans chaque fréquence Fk : la coordonnée h} (lf ) (k) calculée pour la fréquence Fk représente l'erreur de quantification de la jιeme composante ambiophonique dans la fréquence Fk.
Une fois la quantification à opérer ainsi définie par le module 5 de traitement, Le module 6 détermine les indices de quantification correspondant pour chaque composante spectrale ambiophonique et fournit ces données au module 7 de constitution d'une séquence binaire. Ce dernier, après avoir effectué le cas échéant un traitement supplémentaire sur les données reçues (par exemple un codage entropique), constitue, en fonction de ces données, une séquence binaire destinée par exemple à être transmise dans un flux binaire Φ.
L'invention propose ainsi une nouvelle technique de quantification applicable aux signaux multicanaux, qui prend en compte des caractéristiques spatiales de la scène à coder. La quantification, définie par l'allocation des bits, par les pas de quantification ou encore par un indice caractérisant un quantificateur parmi un ensemble, est déterminée de manière à provoquer une déviation limitée des vecteurs de Gerzon, et ainsi garantir lors de la restitution des signaux quantifiés une scène acoustique fidèle à la scène acoustique originale. Les vecteurs vélocité et énergie sont deux outils mathématiques introduits par Gerzon dont l'objectif est de traduire l'effet de la localisation, dans les domaines basse et haute fréquences respectivement, d'une source sonore synthétisée. Pour un auditeur placé au centre d'un dispositif de reproduction, le vecteur vélocité V et le vecteur d'énergie É sont associés respectivement aux effets de localisation en basse et haute fréquences.
Dans un mode de réalisation, en pratique, on détermine une fréquence de transition qui détermine les domaines de prépondérance des critères V et E .
Ainsi, pour les fréquences supérieures à cette fréquence de transition, la prédiction de la localisation est effectuée grâce au vecteur d'énergie É et pour les fréquences en-dessous de cette fréquence de transition, la localisation se base sur le vecteur de vélocité V .
Physiquement, la fréquence de transition correspond à la fréquence au delà de laquelle le front d'onde est plus petit que la dimension de la tête. Dans le cas des systèmes ambiophoniques du premier ordre, cette fréquence de transition est de l'ordre de 700 Hz.
A partir de ces données, il est possible alors de scinder le problème d'optimisation en deux problèmes. Le premier problème correspond à chercher à optimiser la position de la source reconstruite après quantification dans le domaine des basses fréquences, et le deuxième problème correspond à chercher à l'optimiser dans le domaine des hautes fréquences. Ainsi, il est possible de réduire le nombre de contraintes à deux. On va f\dθv\(h)\ donc utiliser dans l'algorithme d'optimisation juste le couple ou le
couple selon qu'on se trouve dans le domaine basse fréquences ou haute fréquences.
Dans le mode de réalisation décrit ci-dessus, l'invention est mise en œuvre en utilisant une transformation spatiale inverse d'une transformation spatiale utilisée lors du codage.
Dans un mode de réalisation, les vecteurs de Gerzon sont calculés et utilisés indépendamment d'une transformée éventuellement utilisée lors du codage, c'est-à-dire que l'invention peut être mise en œuvre lorsque les signaux subissent, ou non, une transformation spatiale ou autre.
En effet, ces vecteurs de Gerzon sont des paramètres physiques qui permettent de caractériser le front d'onde reconstruit par la superposition des ondes émises par les différents hauts parleurs (voir « Représentation de champs acoustiques, application à la transmission et à la reproduction de scènes sonores complexes dans un contexte multimédia », Thèse de doctorat de l'université Paris 6, 31 juillet 2001 , Jérôme Daniel).
En référence à la figure 3 représentant un dispositif de restitution 10 comprenant N hauts parleurs Hj (i=1 à N) (dont seuls les haut-parleurs Hi, Hn et Hp sont représentés), on considère un point d'écoute E dans l'espace qui représente le centre du dispositif de restitution sonore 10 (figure 1 ).
Il est possible dans ce cas de calculer les vecteurs vélocité et énergie relatif à ce point d'écoute E en utilisant les formules suivantes :
- ∑ G1 2U1 où (G1,- -,G^) sont les gains des différents haut-parleurs Hj, i=1 à N constituant la scène sonore et les vecteurs U1 sont des vecteurs unitaires partant du point E vers les haut-parleurs Hj.
A partir de cette formule, les vecteurs de Gerzon peuvent être calculés sans l'utilisation préalable de l'encodage ambiophonique.
Dans le cadre de la réalisation d'un quantificateur spatial basé sur les vecteurs de Gerzon, il est possible alors de définir le problème de quantification comme suit :
Pour un débit Deb donné, il faut minimiser la variation des vecteurs vélocité Ay = IIv -Vl et énergie ΔE = ||Ê' -Ê| , avec V et Ε représentant
II II2 II II2 respectivement le vecteur vélocité et le vecteur énergie calculés après quantification. La résolution de ce problème se fait de façon similaire à la résolution décrite ci-dessus avec l'utilisation de la transformée ambiophonique, basée sur la résolution du problème lagrangien.

Claims

REVENDICATIONS
1. Procédé de codage de composantes ( X1 k ) d'une scène audio comprenant N signaux (Si,..., SN) avec N>1 , comportant une étape de quantification de certaines au moins des composantes, caractérisé en ce que ladite quantification est définie en fonction au moins d'un vecteur d'énergie (E ) et/ou d'un vecteur de vélocité (y ) associé(s) à des critères de Gerzon et fonction desdites composantes.
2. Procédé selon la revendication 1 , selon lequel la quantification est définie en fonction de variations d'au moins un desdits vecteurs (y , E) lors de variations dé composantes ( X ι k ).
3. Procédé selon la revendication précédente, selon lequel on détermine des variations de composantes ( X1 k ) correspondant à la minimisation, ou à la limitation, de variations d'au moins un des vecteurs (V , E ) et on déduit, en fonction desdites variations déterminées des composantes, des valeurs d'erreurs de quantification permettant de définir la quantification des composantes.
4. Procédé selon l'une des revendications 1 à 3, caractérisé en ce qu'il comporte une étape de détection d'une fréquence de transition permettant de déterminer celui des vecteurs parmi le vecteur d'énergie ou le vecteur de vélocité à prendre en compte pour définir la quantification des composantes.
5. Procédé selon l'une des revendications précédentes, caractérisé en ce que les composantes sont des composantes obtenues par transformation spatiale.
6. Procédé selon la revendication 5, caractérisé en ce que les composantes spatiales sont des composantes ambiophoniques, déterminées par une transformation spatiale ambiophonique.
7. Procédé selon la revendication 5 ou 6, selon lequel le vecteur d'énergie (E ) est calculé en fonction d'une transformation spatiale inverse (D ) sur lesdites composantes spatiales et/ou le vecteur de vélocité (y ) est calculé en fonction d'une transformation spatiale inverse (D) sur lesdites composantes spatiales.
8. Module (5) de traitement de composantes ( X1 k ) provenant d'une scène audio comprenant N signaux (Si,..., SN) avec N>1 , comprenant des moyens pour déterminer des éléments de définition d'une étape de quantification de certains au moins des composantes, en fonction au moins du vecteur d'énergie (E ) et/ou du vecteur de vélocité (V ) associés à des critères de Gerzon et fonction desdites composantes.
9. Codeur (1 ) audio adapté pour coder des composantes ( X1 k ) d'une scène audio comprenant N signaux (Si,..., SN) avec N>1 , comportant : un module de traitement (5) de composantes selon la revendication 8 ; un module de quantification adapté pour définir des données de quantification associés à des composantes en fonction au moins d'éléments déterminés par le module de traitement.
10. Programme d'ordinateur à installer dans un module de traitement (5), ledit programme comprenant des instructions pour mettre en œuvre, lors d'une exécution du programme par des moyens de traitement dudit module, les étapes d'un procédé selon l'une quelconque des revendications 1 à 7.
EP08840014A 2007-10-01 2008-09-30 Procede, module et programme d'ordinateur avec quantification en fonction des vecteurs de gerzon Withdrawn EP2198425A1 (fr)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR0757972 2007-10-01
PCT/FR2008/051764 WO2009050409A1 (fr) 2007-10-01 2008-09-30 Procede, module et programme d'ordinateur avec quantification en fonction des vecteurs de gerzon

Publications (1)

Publication Number Publication Date
EP2198425A1 true EP2198425A1 (fr) 2010-06-23

Family

ID=39295969

Family Applications (1)

Application Number Title Priority Date Filing Date
EP08840014A Withdrawn EP2198425A1 (fr) 2007-10-01 2008-09-30 Procede, module et programme d'ordinateur avec quantification en fonction des vecteurs de gerzon

Country Status (3)

Country Link
US (1) US20100241439A1 (fr)
EP (1) EP2198425A1 (fr)
WO (1) WO2009050409A1 (fr)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9338552B2 (en) 2014-05-09 2016-05-10 Trifield Ip, Llc Coinciding low and high frequency localization panning
US11363402B2 (en) 2019-12-30 2022-06-14 Comhear Inc. Method for providing a spatialized soundfield

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8379868B2 (en) * 2006-05-17 2013-02-19 Creative Technology Ltd Spatial audio coding based on universal spatial cues
US8345899B2 (en) * 2006-05-17 2013-01-01 Creative Technology Ltd Phase-amplitude matrixed surround decoder
US8712061B2 (en) * 2006-05-17 2014-04-29 Creative Technology Ltd Phase-amplitude 3-D stereo encoder and decoder

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See references of WO2009050409A1 *

Also Published As

Publication number Publication date
WO2009050409A1 (fr) 2009-04-23
US20100241439A1 (en) 2010-09-23

Similar Documents

Publication Publication Date Title
EP2143102B1 (fr) Procede de codage et decodage audio, codeur audio, decodeur audio et programmes d&#39;ordinateur associes
EP2374123B1 (fr) Codage perfectionne de signaux audionumeriques multicanaux
EP2374124B1 (fr) Codage perfectionne de signaux audionumériques multicanaux
EP2168121B1 (fr) Quantification apres transformation lineaire combinant les signaux audio d&#39;une scene sonore, codeur associe
EP2002424B1 (fr) Dispositif et procede de codage scalable d&#39;un signal audio multi-canal selon une analyse en composante principale
JP2009524108A (ja) 拡張帯域周波数コーディングによる複素変換チャネルコーディング
EP2145167B1 (fr) Procédé de codage audio, codeur audio, signal codé et programme d&#39;ordinateur associés
EP1600042A1 (fr) Procede de traitement de donnees sonores compressees, pour spatialisation
EP2005420A1 (fr) Dispositif et procede de codage par analyse en composante principale d&#39;un signal audio multi-canal
JP7419388B2 (ja) 回転の補間と量子化による空間化オーディオコーディング
FR3049084A1 (fr)
EP2198425A1 (fr) Procede, module et programme d&#39;ordinateur avec quantification en fonction des vecteurs de gerzon
US8948403B2 (en) Method of processing signal, encoding apparatus thereof, decoding apparatus thereof, and signal processing system
EP4042418B1 (fr) Détermination de corrections à appliquer a un signal audio multicanal, codage et décodage associés
FR3112015A1 (fr) Codage optimisé d’une information représentative d’une image spatiale d’un signal audio multicanal
EP4371108A1 (fr) Quantification vectorielle spherique optimisee
EP4268374A1 (fr) Codage optimise de matrices de rotations pour le codage d&#39;un signal audio multicanal
WO2023232823A1 (fr) Titre: codage audio spatialisé avec adaptation d&#39;un traitement de décorrélation

Legal Events

Date Code Title Description
PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

Free format text: ORIGINAL CODE: 0009012

17P Request for examination filed

Effective date: 20100329

AK Designated contracting states

Kind code of ref document: A1

Designated state(s): AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HR HU IE IS IT LI LT LU LV MC MT NL NO PL PT RO SE SI SK TR

AX Request for extension of the european patent

Extension state: AL BA MK RS

DAX Request for extension of the european patent (deleted)
17Q First examination report despatched

Effective date: 20110110

GRAP Despatch of communication of intention to grant a patent

Free format text: ORIGINAL CODE: EPIDOSNIGR1

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: THE APPLICATION IS DEEMED TO BE WITHDRAWN

18D Application deemed to be withdrawn

Effective date: 20120327