FR2980619A1 - Codage/decodage parametrique d'un signal audio multi-canal, en presence de sons transitoires - Google Patents

Codage/decodage parametrique d'un signal audio multi-canal, en presence de sons transitoires Download PDF

Info

Publication number
FR2980619A1
FR2980619A1 FR1158639A FR1158639A FR2980619A1 FR 2980619 A1 FR2980619 A1 FR 2980619A1 FR 1158639 A FR1158639 A FR 1158639A FR 1158639 A FR1158639 A FR 1158639A FR 2980619 A1 FR2980619 A1 FR 2980619A1
Authority
FR
France
Prior art keywords
transient
audio signal
parameters
sets
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
FR1158639A
Other languages
English (en)
Inventor
Gregory Pallone
Julien Capobianco
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Orange SA
Original Assignee
France Telecom SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by France Telecom SA filed Critical France Telecom SA
Priority to FR1158639A priority Critical patent/FR2980619A1/fr
Publication of FR2980619A1 publication Critical patent/FR2980619A1/fr
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • G10L19/025Detection of transients or attacks for time/frequency resolution switching
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

L'invention de rapporte à un procédé de décodage paramétrique d'un signal audio multi-canal comportant une étape d'obtention d'ensembles de paramètres spatiaux décodés, de détermination, à partir de ces paramètres spatiaux décodés, de coefficients d'une matrice d'augmentation de canaux à appliquer à un signal audio réduit décodé. Le procédé est tel qu'il comporte en outre les étapes d'obtention (Ti) de positions temporelles de débuts de sons transitoires dans une représentation temps-fréquence du signal audio réduit décodé, de détermination (Fp) des fenêtres d'estimation des ensembles de paramètres décodés, en fonction des positions de transitoires obtenues, d'application d'une discontinuité (disc.) pour les coefficients de la matrice d'augmentation, à la position temporelle d'un transitoire, la discontinuité étant déterminée par la différence entre la valeur du coefficient déterminé à partir de l'ensemble de paramètres estimé pour la fenêtre d'estimation incluant le transitoire et la valeur du coefficient déterminé à partir de l'ensemble de paramètres estimés par la fenêtre d'estimation précédant le transitoire. L'invention se rapporte également à un procédé de codage permettant d'estimer des paramètres en fonction de transitoires détectés. L'invention vise un dispositif de décodage et un dispositif de codage mettant en oeuvre respectivement les procédés de décodage et de codage.

Description

Codage/décodage paramétrique d'un signal audio multi-canal, en présence de sons transitoires La présente invention se rapporte au codage et décodage paramétrique de signaux audio multicanaux (stéréo ou supérieur, comme 5.1, 7.1...). Ce type de codage/décodage se base sur l'extraction de paramètres d'information spatiale qui sont utilisés au décodage pour que les caractéristiques spatiales puissent être restituées. Le codage paramétrique se décompose généralement en 2 étapes : Une étape d'analyse au niveau du codeur, générant un ensemble de paramètres spatiaux (typiquement ICLD de l'anglais "Inter-Channel Level Difference", ICTD de l'anglais "Inter-Channel Time Difference", ICC de l'anglais "Inter-Channel Coherence"), et un signal réduit ("downmix" en anglais) obtenu après un traitement de réduction de canaux appliqué au signal audio multicanal d'origine.
Par exemple, un signal réduit ou signal "downmix" est composé d'un seul canal lorsqu'il est créé à partir d'un signal stéréo (de 2 canaux). Au décodage, une étape de synthèse permet alors la reconstruction de l'image spatiale (i.e des canaux originaux) à partir des paramètres spatiaux et du signal "downmix". Le signal "downmix" est généralement transmis du codeur au décodeur après avoir été compressé par un codeur audio générique habituellement appelé « codeur coeur », et les paramètres spatiaux sont transmis après avoir été également compressés. Une adéquation entre ces deux étapes est à assurer, les étapes étant toutes les deux réalisées dans la même représentation temps-fréquence du signal, par exemple le domaine PQMF (de l'anglais "Pseudo Quadrature Mirror Filter"), le domaine MDCT (de l'anglais "Modified Discrete Cosine Transform") ou d'autres types de représentation temps-fréquence. Pour permettre un gain de codage significatif, les paramètres spatiaux transmis ont une résolution fréquentielle et/ou temporelle inférieure à celles du signal audio dans le domaine temps-fréquence utilisé. Cette baisse de résolution est couramment obtenue par intégration temporelle et/ou fréquentielle.
Lors de la synthèse, pour la reconstruction de l'image spatiale, on dispose alors de paramètres spatiaux sous échantillonnés à la fois en fréquence et en temps par rapport au signal qu'on souhaite reconstruire. Dans un premier temps, ces paramètres spatiaux sous-échantillonnés sont utilisés pour calculer une matrice de traitement d'augmentation de canaux ou "upmix" en anglais, à partir du signal réduit ("downmix") reçu. On peut par exemple passer de un à deux canaux dans le cas du décodage d'un signal stéréo. Pour être appliquée au signal "downmix", les coefficients de la matrice, issus de ces paramètres spatiaux, doivent être interpolés à la fois en temps et en fréquence pour être compatibles avec le domaine temps-fréquence du signal "downmix".
Dans les recommandations MPEG "Parametric Stereo", MPEG Surround ou encore MPEG USAC (pour "Unified speech and audio Coding" en anglais), la dimension fréquentielle est interpolée en dupliquant la valeur des coefficients de la matrice de traitement "upmix" sur chacune des fréquences d'intégration qui ont servi à calculer les paramètres spatiaux correspondants. Pour la dimension temporelle, pour chaque fréquence, une interpolation linéaire est réalisée entre la valeur du coefficient de la matrice de traitement "upmix" courant et précédent. Cette interpolation linéaire est effectuée pour éviter le phénomène de sauts de spatialisation et autres artéfacts qui peuvent être perceptibles dans le cas où on interpolerait la dimension temporelle de la même manière que la dimension fréquentielle. L'interpolation linéaire supprime ainsi les discontinuités des coefficients de la matrice de traitement "upmix". Ainsi, dans les méthodes de l'état de l'art, le codeur estime des ensembles de paramètres spatiaux selon un échantillonnage déterminé, selon le plan KpxNp avec KiDK (Kp étant le nombre de bandes fréquentielles de la représentation temps-fréquence des paramètres spatiaux et K le nombre de bandes fréquentielles de la représentation temps fréquence des signaux audio) et NIDN (Np étant le nombre d'échantillons temporels de la représentation temps-fréquence des paramètres spatiaux et N le nombre d'échantillons temporels de la représentation temps-fréquence des signaux audio). Ainsi, à une colonne temporelle d'une trame de signal, est assignée un ensemble de paramètres estimés sur une fenêtre d'estimation de taille généralement constante mais qui selon certaines méthodes de l'état de l'art, peut être variable. Le codeur transmet alors au décodeur l'indice de la colonne temporelle où se situe l'ensemble de paramètres estimés. La figure 1 illustre un exemple de réalisation d'une méthode de l'état de l'art, où on peut voir une représentation de plusieurs ensembles de paramètres estimés (sous forme de rond) Pl, P2, P3 et P4, sur des colonnes temporelles définies dans plusieurs trames de signal.
Dans cette figure, un ensemble de paramètres par trame de signal est représenté. Au décodeur, connaissant l'indice I des colonnes temporelles assignées à des ensembles de paramètres, il est possible de reconstruire la matrice "upmix", d'augmentation de canaux en effectuant des interpolations des valeurs des coefficients de la matrice "upmix" obtenues à partir des paramètres aux indices I, pour que la matrice obtenue soit compatible avec le domaine temps-fréquence du signal "downmix". Pour éviter des discontinuités entre les valeurs des coefficients de la matrice "upmix" obtenues à partir des paramètres, une interpolation linéaire est réalisée entre ces coefficients. Cette interpolation linéaire des coefficients de la matrice "upmix" est représentée sur la figure 1 par un trait continu entre les coefficients représentés aux mêmes colonnes temporelles que les ensembles de paramètres qui ont permis de les déterminer. Cette figure représente également les fenêtres d'estimations F des paramètres qui sont utilisées au codeur pour déterminer les différents ensembles de paramètres, sous forme d'accolades. Ces fenêtres sont ici de taille constante et sont centrées sur la colonne temporelle assignée à l'ensemble de paramètres. On peut remarquer que lors de l'analyse, une pré-exploration du signal futur est nécessaire, induisant une latence supplémentaire lors de l'étape d'encodage. On peut voir également sur cette figure 1 que la présence de sons transitoires représentés ici en T1, T2 ou T3, n'influence pas la méthode d'estimation des paramètres, ni d'interpolation. Or une interpolation linéaire systématique peut provoquer des artéfacts, par exemple des erreurs de spatialisation, une perte de netteté de restitution sonore ou une dégradation du timbre sur des signaux transitoires qui représentent un brusque changement sonore ou attaque dans le signal audio multi-canal. En effet, lorsque le signal audio multi-canal a pour sources différents instruments de musique, il se peut par exemple qu'une soudaine intervention de la batterie à une position spatiale différente d'un autre instrument comme le piano, engendre une brusque variation qui ne sera alors pas représentée nettement à la restitution si une interpolation linéaire est effectuée. Plus les évènements de la scène sonore sont latéralisés, c'est-à-dire que les sources sont espacées spatialement, plus ces artefacts peuvent être importants. Il existe donc un besoin de pouvoir restituer de façon la plus nette possible, en évitant les erreurs de spatialisation et avec la même soudaineté, le signal audio multi-canal lorsque celui-ci comporte des sons transitoires.
La présente invention vient améliorer la situation. Elle propose à cet effet, un procédé de décodage paramétrique d'un signal audio multi-canal comportant une étape d'obtention d'ensembles de paramètres spatiaux décodés, de détermination, à partir de ces paramètres spatiaux décodés, de coefficients d'une matrice d'augmentation de canaux à appliquer à un signal audio réduit décodé. Le procédé est tel qu'il comporte en outre les étapes suivantes: obtention de positions temporelles de débuts de sons transitoires dans une représentation temps-fréquence du signal audio réduit décodé; en fonction des positions de transitoires obtenues, détermination des fenêtres d'estimation des ensembles de paramètres décodés; application d'une discontinuité pour les coefficients de la matrice d'augmentation, à la position temporelle d'un transitoire, la discontinuité étant déterminée par la différence entre la valeur du coefficient déterminé à partir de l'ensemble de paramètres estimé pour la fenêtre d'estimation incluant le transitoire et la valeur du coefficient déterminé à partir de l'ensemble de paramètres estimés par la fenêtre d'estimation précédant le transitoire. Ainsi, la discontinuité introduite à la position temporelle d'un transitoire permet de reconstruire une matrice d'augmentation de canaux qui puisse spatialiser de façon nette le canal qui a brusquement changé dans la scène sonore. La discontinuité introduite n'engendre pas d'artefacts gênants puisque ceux-ci sont inaudibles grâce au phénomène de masquage dû au transitoire. Les différents modes particuliers de réalisation mentionnés ci-après peuvent être ajoutés indépendamment ou en combinaison les uns avec les autres, aux étapes du procédé de décodage défini ci-dessus. Dans un mode de réalisation de l'invention, les coefficients de la matrice d'augmentation appliquées aux positions temporelles postérieures à la position temporelle d'un transitoire sont obtenus par interpolation au moins sur la longueur correspondant à la fenêtre d'estimation des paramètres incluant le transitoire.
Pour déterminer les coefficients de la matrice "upmix" avec le même échantillonnage temps-fréquence que le signal audio réduit décodé, les coefficients appliqués aux positions temporelles postérieures au transitoire sont interpolés. Une interpolation linéaire ou encore curviligne est possible. Elle peut s'appliquer par exemple jusqu'au prochain coefficient déterminé par l'ensemble de paramètres décodé 15 correspondant. Dans un mode de réalisation de l'invention, l'interpolation s'effectue de manière constante avec la valeur du coefficient défini par la discontinuité à la position temporelle du transitoire. Ainsi l'interpolation constante permet de conserver la même valeur de spatialisation 20 sur une largeur de fenêtre qui correspond à une durée moyenne d'un son transitoire. Le contexte spatial est donc constant durant l'attaque. Selon un mode de réalisation de l'invention, l'obtention de positions de transitoire s'effectue par détection de transitoires dans le signal audio réduit décodé. Ainsi, le décodeur retrouve les positions temporelles des transitoires directement sur 25 le signal audio réduit décodé et n'a pas besoin d'informations spécifiques sur les transitoires de la part du codeur. Dans un mode de réalisation particulier, un son transitoire est détecté si le rapport de l'énergie du transitoire sur l'énergie du bruit de fond est supérieur à un seuil prédéterminé. Un transitoire est donc pris en compte seulement si son rapport d'énergie avec 30 l'énergie du bruit de fond est suffisamment élevé. La discontinuité introduite dans le bruit de fond pourra alors être masquée perceptivement par les transitoires. Dans le cas contraire, les discontinuités seraient audibles et provoqueraient des hachures dans le son. Dans une variante de réalisation, l'obtention de positions temporelles de transitoire s'effectue à partir de la réception d'information sur la distance temporelle séparant deux 35 ensembles de paramètres spatiaux. L'information sur la distance temporelle entre deux ensembles de paramètres permet de retrouver les fenêtres d'estimation de ces paramètres et d'en déduire la position temporelle des transitoires. Ainsi, il n'est plus nécessaire au décodeur de détecter explicitement les positions de transitoires. Dans encore une autre variante de réalisation, la position temporelle des transitoires est obtenue par une information du codeur.
L'information explicite en provenance du codeur est également possible, évitant ainsi des opérations de détection ou de calculs au décodeur. L'invention se rapporte également à un procédé de codage paramétrique d'un signal audio multi-canal comportant une étape d'estimation des paramètres spatiaux associés au signal audio-multi-canal et une étape de réduction de canaux du signal audio multi-canal pour obtenir un signal audio réduit. Le procédé est tel qu'il comporte en outre les étapes suivantes: détection dans le signal audio réduit représenté dans un domaine temps-fréquence, de positions temporelles de débuts de sons transitoires; détermination des fenêtres d'analyse à appliquer au signal audio réduit pour estimer les ensembles de paramètres spatiaux, une fenêtre d'analyse précédant le transitoire détecté, se terminant à la position temporelle précédent celle du transitoire et une fenêtre d'analyse comprenant le transitoire détecté commençant à partir de la position temporelle de la transition détectée; codage des ensembles de paramètres déterminés.
L'estimation des paramètres est ainsi effectuée en fonction des transitoires détectés. Les fenêtres d'estimation de ces ensembles de paramètres sont adaptés à la présence de sons transitoires et permettent au décodage de reconstruire les coefficients de la matrice d'augmentation de canaux en tenant compte des transitoires. La construction de la matrice de traitement d'augmentation des canaux du décodage est alors rendu possible par des interpolations adéquates, par la connaissance des fenêtres d'analyse utilisées lors du codage pour estimer les paramètres spatiaux. Le codage de ces paramètres ainsi obtenus peut être suffisant pour que le décodeur retrouve la position des transitoires dans le signal transmis. Il n'est donc pas nécessaire de transmettre en même temps que les paramètres codés, d'informations sur les transitoires. Les différents modes particuliers de réalisation mentionnés ci-après peuvent être ajoutés indépendamment ou en combinaison les uns avec les autres, aux étapes du procédé de codage défini ci-dessus. Dans un mode de réalisation particulier, un son transitoire est détecté si le rapport de l'énergie du transitoire sur l'énergie du bruit de fond est supérieur à un seuil prédéterminé. Un transitoire est donc pris en compte seulement si son rapport d'énergie avec l'énergie du bruit de fond est suffisamment élevé. Cette détection effectuée au codage permettra au décodage d'apporter une discontinuité qui sera masquée perceptivement par les transitoires. Dans un mode de réalisation avantageux, la taille d'une fenêtre d'analyse dépend des positions des transitoires détectés et d'une longueur maximale prédéterminée.
Ainsi, les ensembles de paramètres sont estimés en tenant compte des transitoires du signal pour que lors du décodage, on puisse reconstruire précisément la matrice de "upmix" adéquate. La présente invention vise également un dispositif de décodage paramétrique d'un signal audio multi-canal comportant un module d'obtention d'ensembles de paramètres spatiaux décodés, un module de détermination, à partir de ces paramètres spatiaux décodés, de coefficients d'une matrice d'augmentation de canaux à appliquer à un signal audio réduit décodé. Le dispositif est tel qu'il comporte en outre: un module d'obtention de positions de débuts de sons transitoires dans une représentation temps-fréquence du signal audio réduit décodé; un module de détermination des fenêtres d'estimation des ensembles de paramètres reçus en fonction des positions de transitoires obtenues; un module d'application d'une discontinuité pour les coefficients de la matrice d'augmentation, à la position temporelle d'un transitoire, la discontinuité étant déterminée par la différence entre la valeur du coefficient déterminé à partir de l'ensemble de paramètres estimé pour la fenêtre d'estimation incluant le transitoire et la valeur du coefficient déterminé à partir de l'ensemble de paramètres estimés par la fenêtre d'estimation précédant le transitoire. Elle vise un dispositif de codage paramétrique d'un signal audio multi-canal comportant un module d'estimation des paramètres spatiaux associés au signal audio-multi- canal et un module de réduction de canaux du signal audio multi-canal pour obtenir un signal audio réduit. Le dispositif est tel qu'il comporte en outre: un module de détection dans le signal audio réduit représenté dans un domaine temps-fréquence, de positions de débuts de sons transitoires; un module de détermination des fenêtres d'analyse à appliquer au signal audio réduit pour estimer les ensembles de paramètres spatiaux, une fenêtre d'analyse précédant le transitoire détecté se terminant avant la position temporelle du transitoire et une fenêtre d'analyse comprenant le transitoire détecté commençant à partir de la position temporelle de la transition détectée; un module de codage des ensembles de paramètres déterminés.
Ces dispositifs présentent les mêmes avantages que les procédés décrits précédemment, qu'ils mettent en oeuvre.
L'invention vise un programme informatique comportant des instructions de code pour la mise en oeuvre des étapes du procédé de décodage ou de codage tel que décrit, lorsque ces instructions sont exécutées par un processeur. Enfin l'invention se rapporte à un support de stockage, lisible par un processeur, intégré ou non au dispositif de décodage ou de codage, éventuellement amovible, mémorisant un programme informatique mettant en oeuvre un procédé de décodage ou de codage tels que décrits précédemment. D'autres caractéristiques et avantages de l'invention apparaîtront plus clairement à la lecture de la description suivante, donnée uniquement à titre d'exemple non limitatif, et faite en référence aux dessins annexés, sur lesquels : la figure 1 illustre une méthode de l'état de l'art décrite précédemment pour estimer des paramètres spatiaux et interpoler des coefficients de la matrice "upmix"; la figure 2 illustre sous forme de bloc diagramme à la fois le dispositif de codage et le dispositif de décodage selon un mode de réalisation de l'invention, ainsi que les procédés de codage et de décodage respectivement mis en oeuvre selon un mode de réalisation de l'invention; les figures 3a, 3b et 3c illustrent plusieurs exemples de réalisation possibles pour mettre en oeuvre selon l'invention, l'estimation des paramètres spatiaux au codage et l'interpolation au décodage des coefficients de la matrice d'augmentation de canaux déterminés à partir de ces paramètres ; la figure 4 illustre sous forme d'organigramme, les étapes mises en oeuvre pour déterminer au codage les ensembles de paramètres spatiaux par rapport aux transitoires du signal; la figure 5 illustre sous forme d'organigramme, les étapes mises en oeuvre au codage pour déterminer les fenêtres d'analyses utilisées pour estimer les paramètres spatiaux; la figure 6 illustre sous forme d'organigramme les étapes mises en oeuvre au décodage pour déterminer l'interpolation à appliquer aux coefficients de la matrice d'augmentation du nombre de canaux; et la figure 7 illustre un exemple de réalisation matérielle d'un dispositif de codage ou d'un dispositif de décodage selon un mode de réalisation de l'invention. La figure 2 décrite maintenant, représente à la fois la partie codage et la partie décodage selon un mode de réalisation de l'invention. Ainsi, au codage représenté en 200, le signal multi-canal représenté ici comme un signal stéréo à deux canaux, x1 et x2, est transformé par un module de transformation temps-fréquence 201. Les signaux en sortie X1 et X2 sont donc représentés dans le domaine temps-fréquence sur un nombre prédéterminé de bandes fréquentielles, par exemple K bandes fréquentielles et sur un nombre d'échantillons temporels (par exemple N). Ce codage peut bien évidemment s'appliquer à des signaux multi-canaux avec un nombre de canaux supérieur à deux. Dans ce cas, les signaux en entrée sont des signaux xi, représentés sous forme de matrice dans le domaine temps-fréquence par des matrices Xi de dimension K*N. Ces signaux X1 et X2 sont ensuite traités par un module de traitement de réduction de canaux 202, encore appelé "downmix". Le nombre de canaux résultant est donc inférieur au nombre de canaux en entrée de ce module. Dans cet exemple illustré à la figure 2, le nombre de canaux en sortie du "downmix" est égal à 1 (D). Ce signal audio réduit D est ensuite codé en 206 par un codeur coeur classique comme par exemple un codeur de type normalisé à l'ITU-T G.722. A partir de ce signal audio réduit D, une étape (Ti) de détection de sons transitoires est effectué par le module de détection 203. Pour détecter la présence de transitoires dans le signal, plusieurs méthodes sont possibles. Cette détection peut par exemple être basée sur un seuil statique appliqué à une mesure de « contenu haute fréquence » (« High Frequency Content » en anglais). Cette mesure peut être définie comme une intégration fréquentielle de l'énergie du spectre pondéré par une fonction proportionnelle à la fréquence. La fonction résultante (p[n] est définie selon la formule suivante, avec E l'énergie d'un point temps- fréquence du spectre: ep [n] = 11-(EL , k . E [n][k] Ainsi, si cette fonction est supérieure à un seuil prédéterminé, le module 203 détecte la position temporelle d'un début de son transitoire dans le signal. Dans un mode particulier de réalisation, la détection de transitoires peut également prendre en compte le bruit de fond présent dans le signal audio. Pour cela, le rapport entre l'énergie du transitoire détecté et celui du bruit de fond, est comparé à un seuil. La mesure de « contenu haute fréquence » tel que défini ci-dessus, est sensible au rapport de l'énergie du transitoire sur l'énergie du bruit de fond. Si le bruit de fond est élevé, la mesure reste faible en présence de transitoire et le seuil de détection n'est pas dépassé.
Ainsi, selon ce mode de réalisation, les transitoires détectés se différencient suffisamment du bruit de fond. A partir des positions temporelles définies pour ces transitoires, une étape de détermination (Fi) des fenêtres d'analyse pour estimer des ensembles de paramètres spatiaux en fonction des transitoires, est effectué par le module 204.
En effet, la position temporelle d'un début de transitoire va conditionner la position et la taille d'une fenêtre d'analyse. Ainsi, la fenêtre d'analyse qui précède la position d'un transitoire, se terminera à la position temporelle précédant la position du transitoire et la fenêtre d'analyse qui comporte le transitoire commencera à la position temporelle du transitoire. La taille d'une fenêtre d'analyse est par défaut de taille prédéfinie, par exemple NmaX- Cette taille de fenêtre correspond par exemple à la largeur moyenne d'un transitoire. Dans un mode de réalisation particulier, cette largeur peut correspondre à la longueur d'une trame de signal mais ceci n'est pas obligatoire. A partir des fenêtres d'analyse ainsi définies, une étape d'estimation des paramètres spatiaux (Pi) est effectuée par le module 205. Ces ensembles de paramètres spatiaux sont ainsi estimés et peuvent être assignés à des positions temporelles pour être codés (cod.) en 207. Le module de codage 207 peut coder ainsi les ensembles de paramètres Pi avec un échantillonnage (P) inférieur à l'échantillonnage (N) utilisé pour représenter le signal réduit dans le domaine temps fréquence. Les indices des positions temporelles des ensembles de paramètres peuvent êtres codés également mais pas nécessairement. De même une information sur les positions temporelles des transitoires peut également être codée pour être transmise à un décodeur. Ceci n'est en rien obligatoire puisque le décodeur pourra lui même retrouver cette information. Le codage de ces ensembles de paramètres peut s'effectuer par quantification scalaire classique ou toute autre méthode de codage d'informations. La figure 4 représente un algorithme détaillé des étapes possibles mises en oeuvre pour déterminer le nombre d'ensembles de paramètres à coder et le découpage des régions concernées par ces ensembles de paramètres, en fonction des transitoires détectés. Ainsi une étape E401 initialise les indices idx (indice courant d'un ensemble de paramètres spatiaux à déterminer) et n (indice courant de position temporelle) à 0. Tant que le signal audio n'est pas entièrement analysé (E402), l'étape E403 détermine si un transitoire a été détecté sur une largeur prédéfinie Nmax correspondant généralement à la largeur moyenne d'un transitoire. Dans l'exemple de réalisation ici, on considère que Nmax est aussi égal à la longueur d'une trame. Si un transitoire est détecté sur cette largeur prédéfinie (état 1 de l'étape E403), l'étape E404 est mise en oeuvre. A cette étape, on définit la région concernée par l'ensemble de paramètres courant comme allant jusqu'à l'indice temporel précédent le transitoire, tel que PS[idx]=pt(n) -1. PS[idx] représente la distance entre deux ensembles de paramètres spatiaux et pt(n) représente la position temporelle du transitoire détecté. La figure 3a illustre parfaitement ces cas de figures. Ainsi, sur cette figure, au début de la première trame, on voit qu'un transitoire T1 est présent sur une largeur inférieure à Nmax , la région concernée par l'ensemble de paramètres P1 s'arrête donc avant le transitoire Ti. De même si on se place juste après l'ensemble de paramètres P3, on voit qu'un transitoire existe sur une fenêtre inférieure à Nmax, en T2, la région concernée par P4 s'arrête donc juste avant ce transitoire.
A l'étape E404 de la figure 4, on indique que l'ensemble de paramètres suivant sera dans une zone comportant un transitoire (T[idx+1]=1) La position temporelle correspondante à la position du transitoire, fait alors partie de la région décrite par l'ensemble de paramètres suivant. L'étape E404 incrémente de 1 l'indice des ensembles de paramètres (idx=idx+1) et place l'indice temporel courant à la position temporelle du transitoire (n=n+pt(n)). Dans le cas où aucun transitoire n'a été détecté dans une largeur Nmax (E403 à 0), l'étape E405 est mise en oeuvre. Elle détermine la région concernée par l'ensemble de paramètres courant comme étant de largeur Nmax (PS[idx]= Nmax). L'indice courant d'ensemble de paramètres est incrémenté de 1 (idx=idx+1) et l'indice temporel courant est placé à l'indice temporel précédant celui défini par la largeur Nmax (n=n+ Nmax -1). On est ici dans l'exemple illustré à la figure 3a dans le cas où l'indice temporel est placé sur le transitoire T1. Dans une largeur de Nmax, il n'y a pas de transitoire. La région pris en compte par P2 est donc de largeur Nmax.
La figure 5 illustre en détails les étapes mises en oeuvre dans un mode de réalisation possible, pour déterminer les fenêtres d'analyse qui permettent d'estimer ces ensembles de paramètres. Ainsi une étape E501 initialise les indices idx (indice courant d'un ensemble de paramètres spatiaux à déterminer) et n (indice courant de position temporelle) à O. Tant que le signal audio n'est pas entièrement analysé (E502), l'étape E503 détermine si l'ensemble de paramètres courant ou l'ensemble de paramètres suivant est dans une zone comportant un transitoire (T[idx] OU T[idx+1] = 1). Dans la positive (1 en E503), l'étape E504 est mise en oeuvre. Dans cette étape, on détermine le début de la fenêtre d'analyse à la position temporelle courante (winstart=n) et la fin de la fenêtre à la position temporelle correspondant à la largeur de la région concernée par l'ensemble de paramètres courant, tel que défini par l'algorithme de la figure 4 (winstop=PS(idx)-1). Ce cas de figure se retrouve sur la figure 3a dans le cas où l'ensemble de paramètres courant est par exemple P4. La région concernée par P4 ne contient pas de transitoire mais celle concernée par l'ensemble de paramètres suivant (P5), contient un transitoire T2. Ainsi, la fenêtre d'analyse F4 pour P4 est définie par le début à l'indice temporel courant, c'est-à-dire juste après l'indice temporel de l'ensemble de paramètres précédent (P3) et se termine juste avant le transitoire T2, région déterminée par l'étape E404 de la figure 4. Dans le cas où l'indice courant de l'ensemble de paramètres ne fait pas partie d'une zone comportant un transitoire (0 en E503), l'étape E505 est mise en oeuvre. Cette étape vérifie que la largeur de la région concernée par l'ensemble de paramètres suivant est inférieure à la moitié de la largeur de la région concernée par l'ensemble de paramètres courant.
Dans la positive (1 à E505), l'étape E506 est mise en oeuvre. A cette étape, le début de la fenêtre d'analyse est positionné avec un décalage correspondant à la largeur de la région du paramètre suivant (winstart=n+PS[idx+1]) et la fin de la fenêtre est définie par la largeur de la région concernée par l'ensemble de paramètres courant (winstop=n+PS[idx]+PS[idx+1]-1). Sur la figure 3a, ce cas se retrouve pour l'ensemble de paramètres courant P3. La largeur de la région concernée par P4 est inférieure à la moitié de la région concernée par P3 (Nmax). La fenêtre d'analyse F3 de P3 commence donc avec un décalage par rapport à l'indice temporel situé juste derrière P2. Le décalage correspond à la largeur de la région concernée par P4, c'est-à-dire la distance entre P3 et P4. La fenêtre d'analyse est de largeur Nmax et se termine alors à la position temporelle précédant le transitoire. Dans la négative (0 en E505), l'étape E507 est mise en oeuvre. Cette étape positionne le début de la fenêtre d'analyse avec un décalage correspondant à une moitié de largeur de la région concernée par l'ensemble de paramètres (winstart=n+PS[ide2) et la fin de la fenêtre est définie par la largeur de la région de l'ensemble de paramètres courant (winstop=n+PS[idx]+PS[idx]/2-1). La fenêtre permettant d'estimer le paramètre courant est alors centrée sur la position temporelle du paramètre courant. Ce cas n'est pas illustré sur la figure 3. Enfin, l'étape E508 décale l'indice temporel courant de la distance correspondant à la largeur de la région concernée par l'ensemble de paramètres courant, incrémente l'ensemble de paramètres courant de 1 et effectue une estimation des paramètres spatiaux dans les fenêtres d'analyse ainsi déterminées. Les figures 3a, 3b et 3c illustrent donc des exemples de réalisation pour la détermination de fenêtres d'analyse (F1 à F6) par rapport aux transitoires T1 à T3 détectés.
On voit ainsi que la fenêtre d'analyse Fl précédent un transitoire, se termine à la position temporelle précédente de celle du transitoire T1. La fenêtre d'analyse F2 commence à la position du transitoire T1 et à une largeur prédéfinie de Nmax puisqu'aucun transitoire n'est présent dans cette largeur. La fenêtre F3 se termine avant la position du transitoire T2 ainsi que la fenêtre F4. Ces deux fenêtres permettent d'estimer deux ensembles de paramètres P3 et P4, P3 étant déterminé non pas en fonction de la position d'un transitoire mais ici de façon périodique puisque l'ensemble de paramètres précédent a une distance de Nmax- La fenêtre F5 débute à partir du transitoire T2 et se termine avant le transitoire T3. La fenêtre F6 débute à la position temporelle du transitoire T3. De retour à la figure 2, nous allons à présent décrire les étapes mises en oeuvre au décodeur 210. Au décodage, le signal réduit, encore appelé "Downmix", est décodé en 206 par un décodage correspondant au codage (par exemple G.722). Le signal réduit décodé D est mis en entrée d'un module 211 de traitement d'augmentation de canaux ou "upmix". Les signaux (fi et f2) issus de ce module de traitement sont ensuite transformés par le module de transformation inverse temps-fréquence 212 pour donner des signaux temporels (xl et x2). Pour pouvoir effectuer ce traitement "upmix", les coefficients de cette matrice sont obtenus à partir des paramètres Pi décodés en 207 par un décodage correspondant à celui utilisé pour le codage de ces paramètres. En sortie du bloc 207, les valeurs des ensembles de paramètres qui ont été codés sont obtenues. Les distances séparant les ensembles de paramètres entre eux peuvent également avoir été codées et sont alors décodées en 207. De même, les positions temporelles des ensembles de paramètres peuvent également avoir été codées et sont ainsi obtenues au décodeur. Enfin, une information concernant les positions temporelles des transitoires détectés lors du codage peuvent également être obtenus dans le bloc 207. Dans tous les cas, une étape d'obtention des positions temporelles de débuts de sons transitoires dans la représentation temps-fréquence du signal audio réduit décodé est effectué dans le module 215 du dispositif de décodage. Dans le cas où seules les valeurs des ensembles de paramètres sont décodés, les transitoires sont obtenus par une étape de détection identique à celle effectuée au codage et expliquée à cette occasion.
Dans le cas où les distances temporelles entre deux ensembles de paramètres, sont décodés, une déduction des positions temporelles des transitoires est alors effectuée, connaissant l'algorithme mis en oeuvre pour déterminer ces ensembles de paramètres et les fenêtres d'analyses associées comme par exemple les algorithmes décrits en référence aux figures 4 et 5.
Dans le cas, bien sûr où l'information sur les positions temporelles des transitoires est transmise, l'obtention de ces positions est alors immédiate, par simple lecture de l'information. Ce module 215 obtient également les positions temporelles des ensembles de paramètres.
A partir de ces informations, une étape (fp) de détermination des fenêtres d'estimation des ensembles de paramètres est effectuée par le module 214. Cette étape utilise la même méthode de détermination de fenêtre que celle effectuée au codage, à partir des positions de transitoires. Ainsi, les algorithmes illustrés aux figures 4 et 5 s'appliquent également au décodage dans ce mode de réalisation.
A partir des paramètres décodés Pi, aux positions temporelles retrouvées, des coefficients pour la matrice d'augmentation de canaux ("upmix") sont obtenus, aux mêmes positions temporelles.
La façon d'obtenir ces coefficients de matrice à partir des paramètres décodés est bien connu de l'homme de l'art et ne sera pas décrit ici plus en détails. A partir des informations sur les fenêtres d'estimation, une étape d'application d'une discontinuité (disc.) pour les coefficients de la matrice d'augmentation, est effectuée à la position temporelle d'un transitoire détecté. En effet, à cette position, indiquant le début d'un son transitoire, on souhaite qu'à la restitution spatiale, le changement soudain de la scène sonore soit rétablie avec le plus de netteté possible. Ainsi, les coefficients de la matrice d'augmentation des canaux doivent révéler cette transition avec netteté. La discontinuité introduite est donc égale à la différence entre la valeur du coefficient déterminé à partir de l'ensemble de paramètres estimé pour la fenêtre d'estimation incluant le transitoire et la valeur du coefficient déterminé à partir de l'ensemble de paramètres estimés par la fenêtre d'estimation précédant le transitoire. Cette discontinuité est illustrée en référence aux figures 3a, 3b et 3c, par exemple aux positions temporelles des transitoires T1, T2 et T3. On y voit en effet un saut entre la valeur du coefficient précédent la position temporelle d'un transitoire et celle du coefficient défini pour la position temporelle du transitoire. Cette discontinuité introduite n'est alors pas perceptible puisqu'elle est masquée par le transitoire lui-même. A partir de cette discontinuité, une étape d'interpolation (Int) est effectuée par le module 213 qui interpole donc les coefficients de la matrice "upmix" sur les positions temporelles pour lesquelles aucun coefficient n'a été assigné. L'interpolation dépend également de la présence ou non d'un transitoire. L'interpolation va permettre de ramener la matrice "upmix" au même échantillonnage temps-fréquence que le signal audio réduit décodé.
Les figures 3a, 3b et 3c représentent différents modes de réalisation pour ces interpolations. Sur les figures 3b et 3c, un ensemble de paramètres est assigné à chaque position temporelle d'un transitoire, par exemple P2, P5 et P6, aux transitoires T1, T2 et T3. Des coefficients définissant la matrice d'"upmix" sont obtenus sur ces positions temporelles de façon à obtenir une discontinuité avec le coefficient défini avant le transitoire.
Pour les positions temporelles situées entre deux positions pour lesquelles des coefficients ont été assignés, on effectue une interpolation. Dans le cas où le transitoire n'est pas suivi d'un autre, une interpolation linéaire jusqu'au prochain coefficient, peut être réalisée, comme illustrée par exemple en référence à la figure 3b entre le coefficient défini par P2 et le coefficient défini par P3.
Il est également possible d'effectuer une interpolation curviligne en définissant une courbe entre le coefficient défini sur la position temporelle du transitoire et le coefficient suivant. Ce cas de figure est illustré en référence à la figure 3c entre les coefficients définis par P2 et P3. Dans cet exemple, la courbe est relativement constante sur une largeur de Nmax correspondant par exemple à la longueur moyenne d'un transitoire et elle varie ensuite rapidement vers la valeur du coefficient suivant. Dans le mode de réalisation décrit à la figure 3a, l'ensemble de paramètres défini par la fenêtre incluant le transitoire, n'est pas assigné à la position temporelle du transitoire mais à la position temporelle distante de Nmax ou encore dans le cas où un transitoire est détecté sur Nmax à la position temporelle précédant un autre transitoire. Dans ce mode de réalisation, l'interpolation à partir du transitoire, est constante jusqu'à la position temporelle du coefficient déterminé par l'ensemble de paramètres estimé par la fenêtre incluant le transitoire.
La valeur interpolée est donc celle du coefficient défini par la discontinuité appliquée à la position temporelle du transitoire. Ensuite, une interpolation linéaire est réalisée jusqu'à la position temporelle du prochain coefficient. Ce cas de figure est illustré en référence à la figure 3a entre les coefficients définis par P2 et P3, puis P4 et P5 et également à partir du coefficient défini par P6.
Dans le cas où un second transitoire suit un premier transitoire à une distance temporelle inférieure à Nmax, alors on a vu que les fenêtres d'estimations de paramètres étaient raccourcies et s'arrêtaient juste avant la position temporelle du second transitoire. Dans cet intervalle, une interpolation constante est avantageusement réalisée avec la valeur introduite par la discontinuité à la position temporelle du premier transitoire. Cette interpolation constante permet de garder le même contexte de spatialisation provoquée par le premier transitoire, jusqu'au second. Cette interpolation constante est illustrée en trait pointillé entre les coefficients définis par P5 et P6 des figures 3a, 3b et 3c. Dans les cas où les coefficients sont issus des ensembles de paramètres estimés à partir de fenêtres ne comportant pas de transitoire, la fenêtre d'estimation étant alors soit juste avant un transitoire, soit de longueur maximale sans qu'il n'y ait de transitoire, alors une interpolation classique linéaire peut être faite pour calculer les coefficients de la matrice d'"upmix" correspondants. Ces interpolations linéaires sont illustrées par des traits continus entre les ensembles de paramètres P3 et P4 et avant l'ensemble de paramètres Pl, sur les figures 3a, 3b et 3c.
Un algorithme détaillé d'un mode de réalisation de l'interpolation est illustré en référence à la figure 6. Cet algorithme explique le mode de réalisation illustré à la figure 3a. Une première étape E601, initialise les valeurs idx (indice de l'ensemble de paramètres courant) et n (indice temporel courant) à O. Tant que l'ensemble du signal audio n'est pas traité, (E602), l'étape E603 vérifie que l'ensemble de paramètres courant à partir duquel un coefficient de la matrice d'"upmix" a été déterminé, appartient à une zone comportant un transitoire (si la fenêtre d'estimation contient un transitoire).
Si c'est le cas (E603 à1), alors l'étape E605 effectue une interpolation constante avec la valeur du coefficient défini par l'ensemble de paramètres courant, sur une longueur de Nmax (interp_const(W,U[...][idx],n,PS[idx])). Si l'ensemble de paramètres courant à partir duquel un coefficient de la matrice d'"upmix" a été déterminé, n'appartient pas à une zone comportant un transitoire (E603 à 0), alors l'étape E606 est mise en oeuvre. Cette étape effectue une interpolation linéaire entre le coefficient défini par l'ensemble de paramètres précédent et le coefficient défini par l'ensemble de paramètres courant (interpiin(U,U[...][idx],U[...](idx-1),n,PS[idx])). A l'étape E607, l'indice temporel courant est décalé d'une largeur de fenêtre et l'indice d'ensemble de paramètres courant est incrémenté de 1. La figure 7 illustre à présent un exemple de réalisation matérielle d'un dispositif de codage ou de décodage selon un mode de réalisation de l'invention. Ces dispositifs peuvent être intégrés dans des équipements multimédia de type décodeur de salon, "set top box" ou lecteur de contenu audio ou vidéo. Ils peuvent également être intégrés dans des équipements de communication de type téléphone mobile ou passerelle de communication. Ce type de dispositif comporte un processeur PROC coopérant avec un bloc mémoire BM comportant une mémoire de stockage et/ou de travail MEM. Dans le cas d'un dispositif de décodage, le bloc mémoire peut avantageusement comporter un programme informatique comportant des instructions de code pour la mise en oeuvre des étapes du procédé de décodage au sens de l'invention, lorsque ces instructions sont exécutées par le processeur PROC, et notamment les étapes d'obtention de positions temporelles de débuts de sons transitoires dans une représentation temps-fréquence du signal audio réduit décodé, de détermination des fenêtres d'estimation des ensembles de paramètres décodés, en fonction des positions de transitoires obtenues, d'application d'une discontinuité pour les coefficients de la matrice d'augmentation, à la position temporelle d'un transitoire, la discontinuité étant déterminée par la différence entre la valeur du coefficient déterminé à partir de l'ensemble de paramètres estimé pour la fenêtre d'estimation incluant le transitoire et la valeur du coefficient déterminé à partir de l'ensemble de paramètres estimés par la fenêtre d'estimation précédant le transitoire. Typiquement, la description de la figure 2 reprend les étapes d'un algorithme d'un tel programme informatique. Le programme informatique peut également être stocké sur un support mémoire lisible par un lecteur du dispositif ou téléchargeable dans l'espace mémoire de celui-ci.
Dans le cas d'un dispositif de codage, le bloc mémoire peut avantageusement comporter un programme informatique comportant des instructions de code pour la mise en oeuvre des étapes du procédé de codage au sens de l'invention, lorsque ces instructions sont exécutées par le processeur PROC, et notamment les étapes de détection dans le signal audio réduit représenté dans un domaine temps-fréquence, de positions de débuts de sons transitoires, de détermination des fenêtres d'analyse à appliquer au signal audio réduit pour estimer les ensembles de paramètres spatiaux, une fenêtre d'analyse précédant le transitoire détecté se terminant avant la position temporelle du transitoire et une fenêtre d'analyse comprenant le transitoire détecté commençant à partir de la position temporelle de la transition détectée et de codage des ensembles de paramètres déterminés. Typiquement, la description de la figure 2 reprend les étapes d'un algorithme d'un tel programme informatique. Le programme informatique peut également être stocké sur un support mémoire lisible par un lecteur du dispositif ou téléchargeable dans l'espace mémoire de celui-ci. La mémoire MEM enregistre de manière générale, toutes les données nécessaires à la mise en oeuvre du procédé de décodage ou du procédé de codage. Un tel dispositif comporte un module d'entrée E apte à recevoir un signal multi-canal (xi et x2) et à partir d'un signal audio réduit D d'obtenir des ensembles de paramètres Pi qui seront codés et transmis par le module de sortie S, en même temps que le signal réduit D. Dans le cas d'un dispositif de décodage, le module d'entrée E reçoit à la fois le signal audio réduit D codé et les paramètres Pi codés pour obtenir en sortie, un signal multi- canal (x1 et x2).

Claims (14)

  1. REVENDICATIONS1. Procédé de décodage paramétrique d'un signal audio multi-canal comportant une étape d'obtention d'ensembles de paramètres spatiaux décodés, de détermination, à partir de ces paramètres spatiaux décodés, de coefficients d'une matrice d'augmentation de canaux à appliquer à un signal audio réduit décodé, caractérisé en ce qu'il comporte en outre les étapes suivantes: obtention (Ti) de positions temporelles de débuts de sons transitoires dans une représentation temps-fréquence du signal audio réduit décodé; en fonction des positions de transitoires obtenues, détermination (Fp) des fenêtres d'estimation des ensembles de paramètres décodés; application d'une discontinuité (disc.) pour les coefficients de la matrice d'augmentation, à la position temporelle d'un transitoire, la discontinuité étant déterminée par la différence entre la valeur du coefficient déterminé à partir de l'ensemble de paramètres estimé pour la fenêtre d'estimation incluant le transitoire et la valeur du coefficient déterminé à partir de l'ensemble de paramètres estimés par la fenêtre d'estimation précédant le transitoire.
  2. 2. Procédé selon la revendication 1, caractérisé en ce que les coefficients de la matrice d'augmentation appliqués aux positions temporelles postérieures à la position temporelle d'un transitoire sont obtenus par interpolation au moins sur la longueur correspondant à la fenêtre d'estimation des paramètres incluant le transitoire.
  3. 3. Procédé selon la revendication 2, caractérisé en ce que l'interpolation s'effectue de manière constante avec la valeur du coefficient défini par la discontinuité à la position temporelle du transitoire.
  4. 4. Procédé selon la revendication 1, caractérisé en ce que l'obtention de positions de transitoire s'effectue par détection de transitoires dans le signal audio réduit décodé.
  5. 5. Procédé selon la revendication 2, caractérisé en ce qu'un son transitoire est détecté si le rapport de l'énergie du transitoire sur l'énergie du bruit de fond est supérieur à un seuil prédéterminé.
  6. 6. Procédé selon la revendication 1, caractérisé en ce que l'obtention de positions temporelles de transitoire s'effectue à partir de la réception d'information sur la distance temporelle séparant deux ensembles de paramètres spatiaux.
  7. 7. Procédé selon la revendication 1, caractérisé en ce que la position temporelle des transitoires est obtenue par une information du codeur.
  8. 8. Procédé de codage paramétrique d'un signal audio multi-canal comportant une étape d'estimation des paramètres spatiaux associés au signal audio-multi-canal et une étape de réduction de canaux (Downmix) du signal audio multi-canal pour obtenir un signal audio réduit (D), caractérisé en ce qu'il comporte en outre les étapes suivantes: Détection (Ti) dans le signal audio réduit représenté dans un domaine temps-fréquence, de positions temporelles de débuts de sons transitoires; Détermination (Fi) des fenêtres d'analyse à appliquer au signal audio réduit pour estimer (Pi) les ensembles de paramètres spatiaux, une fenêtre d'analyse précédant le transitoire détecté, se terminant à la position temporelle précédent celle du transitoire et une fenêtre d'analyse comprenant le transitoire détecté commençant à partir de la position temporelle de la transition détectée; Codage (Cod.Pi) des ensembles de paramètres déterminés.
  9. 9. Procédé selon la revendication 8, caractérisé en ce qu'un son transitoire est détecté si le rapport de l'énergie du transitoire sur l'énergie du bruit de fond est supérieur à un seuil prédéterminé.
  10. 10. Procédé selon la revendication 8, caractérisé en ce que la taille d'une fenêtre d'analyse dépend des positions des transitoires détectés et d'une longueur maximale prédéterminée.
  11. 11. Dispositif de décodage paramétrique d'un signal audio multi-canal comportant un module d'obtention d'ensembles de paramètres spatiaux décodés (207), un module de détermination, à partir de ces paramètres spatiaux décodés, de coefficients d'une matrice d'augmentation de canaux à appliquer à un signal audio réduit décodé, caractérisé en ce qu'il comporte en outre: un module d'obtention (215) de positions de débuts de sons transitoires dans une représentation temps-fréquence du signal audio réduit décodé; un module de détermination (214) des fenêtres d'estimation des ensembles de paramètres reçus en fonction des positions de transitoires obtenues;un module d'application d'une discontinuité (214) pour les coefficients de la matrice d'augmentation, à la position temporelle d'un transitoire, la discontinuité étant déterminée par la différence entre la valeur du coefficient déterminé à partir de l'ensemble de paramètres estimé pour la fenêtre d'estimation incluant le transitoire et la valeur du coefficient déterminé à partir de l'ensemble de paramètres estimés par la fenêtre d'estimation précédant le transitoire.
  12. 12. Dispositif de codage paramétrique d'un signal audio multi-canal comportant un module d'estimation des paramètres spatiaux associés au signal audio multi-canal et un module de réduction de canaux (202) du signal audio multi-canal pour obtenir un signal audio réduit, caractérisé en ce qu'il comporte en outre: un module de détection (203) dans le signal audio réduit représenté dans un domaine temps-fréquence, de positions de débuts de sons transitoires; un module de détermination (204) des fenêtres d'analyse à appliquer au signal audio réduit pour estimer les ensembles de paramètres spatiaux, une fenêtre d'analyse précédant le transitoire détecté se terminant avant la position temporelle du transitoire et une fenêtre d'analyse comprenant le transitoire détecté commençant à partir de la position temporelle de la transition détectée; un module de codage (207) des ensembles de paramètres déterminés.
  13. 13. Programme informatique comportant des instructions de code pour la mise en oeuvre des étapes du procédé de décodage selon l'une des revendications 1 à 7, lorsque ces instructions sont exécutées par un processeur.
  14. 14. Programme informatique comportant des instructions de code pour la mise en oeuvre des étapes du procédé de codage selon l'une des revendications 8 à 10, lorsque ces instructions sont exécutées par un processeur.30
FR1158639A 2011-09-27 2011-09-27 Codage/decodage parametrique d'un signal audio multi-canal, en presence de sons transitoires Pending FR2980619A1 (fr)

Priority Applications (1)

Application Number Priority Date Filing Date Title
FR1158639A FR2980619A1 (fr) 2011-09-27 2011-09-27 Codage/decodage parametrique d'un signal audio multi-canal, en presence de sons transitoires

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR1158639A FR2980619A1 (fr) 2011-09-27 2011-09-27 Codage/decodage parametrique d'un signal audio multi-canal, en presence de sons transitoires

Publications (1)

Publication Number Publication Date
FR2980619A1 true FR2980619A1 (fr) 2013-03-29

Family

ID=45319297

Family Applications (1)

Application Number Title Priority Date Filing Date
FR1158639A Pending FR2980619A1 (fr) 2011-09-27 2011-09-27 Codage/decodage parametrique d'un signal audio multi-canal, en presence de sons transitoires

Country Status (1)

Country Link
FR (1) FR2980619A1 (fr)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006058590A1 (fr) * 2004-11-02 2006-06-08 Coding Technologies Ab Interpolation et signalisation de parametres de reconstruction spatiale pour codage et decodage multivoies de sources audio
US20110182432A1 (en) * 2009-07-31 2011-07-28 Tomokazu Ishikawa Coding apparatus and decoding apparatus

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006058590A1 (fr) * 2004-11-02 2006-06-08 Coding Technologies Ab Interpolation et signalisation de parametres de reconstruction spatiale pour codage et decodage multivoies de sources audio
US20110182432A1 (en) * 2009-07-31 2011-07-28 Tomokazu Ishikawa Coding apparatus and decoding apparatus

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
LIU CHI-MIN ET AL: "Spatial Parameter Decision by Least Squared Error in Parametric Stereo Coding and MPEG Surround", AES CONVENTION 126; MAY 2009, AES, 60 EAST 42ND STREET, ROOM 2520 NEW YORK 10165-2520, USA, 1 May 2009 (2009-05-01), XP040509013 *

Similar Documents

Publication Publication Date Title
EP2374124B1 (fr) Codage perfectionne de signaux audionumériques multicanaux
EP2374123B1 (fr) Codage perfectionne de signaux audionumeriques multicanaux
EP2691952B1 (fr) Allocation par sous-bandes de bits de quantification de paramètres d'information spatiale pour un codage paramétrique
EP2304721B1 (fr) Synthese spatiale de signaux audio multicanaux
FR2966634A1 (fr) Codage/decodage parametrique stereo ameliore pour les canaux en opposition de phase
EP3330964B1 (fr) Ré-échantillonnage d'un signal audio pour un codage /décodage à bas retard
CA2917795A1 (fr) Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences
EP2277172A1 (fr) Dissimulation d'erreur de transmission dans un signal audionumerique dans une structure de decodage hierarchique
FR3045915A1 (fr) Traitement de reduction de canaux adaptatif pour le codage d'un signal audio multicanal
EP0906613B1 (fr) Procede et dispositif de codage d'un signal audiofrequence par analyse lpc "avant" et "arriere"
WO2010012927A1 (fr) Reconstruction de donnees audio multicanal
EP1875465A1 (fr) Procede d'adaptation pour une interoperabilite entre modeles de correlation a cout terme de signaux numeriques
EP2347411B1 (fr) Attenuation de pre-echos dans un signal audionumerique
WO2013093291A1 (fr) Procédé de détection d'une bande de fréquence prédéterminée dans un signal de données audio, dispositif de détection et programme d'ordinateur correspondant
EP3138095A1 (fr) Correction de perte de trame perfectionnée avec information de voisement
FR2980619A1 (fr) Codage/decodage parametrique d'un signal audio multi-canal, en presence de sons transitoires
FR2973923A1 (fr) Evaluation de la qualite vocale d'un signal de parole code
FR3023646A1 (fr) Mise a jour des etats d'un post-traitement a une frequence d'echantillonnage variable selon la trame
WO2011073600A1 (fr) Codage/decodage parametrique stereo avec optimisation du traitement de reduction des canaux
FR2990551A1 (fr) Codage/decodage parametrique d'un signal audio multi-canal, en presence de sons transitoires
EP2589045A1 (fr) Codage/décodage prédictif linéaire adaptatif
FR3018942A1 (fr) Estimation d'un bruit de codage introduit par un codage en compression de type micda
WO2023232823A1 (fr) Titre: codage audio spatialisé avec adaptation d'un traitement de décorrélation
WO2014199055A1 (fr) Controle du traitement d'attenuation d'un bruit de quantification introduit par un codage en compresssion
FR2997250A1 (fr) Detection d'une bande de frequence predeterminee dans un contenu audio code par sous-bandes selon un codage de type modulation par impulsions