EP1989706A2 - Dispositif de ponderation perceptuelle en codage/decodage audio - Google Patents

Dispositif de ponderation perceptuelle en codage/decodage audio

Info

Publication number
EP1989706A2
EP1989706A2 EP07731586A EP07731586A EP1989706A2 EP 1989706 A2 EP1989706 A2 EP 1989706A2 EP 07731586 A EP07731586 A EP 07731586A EP 07731586 A EP07731586 A EP 07731586A EP 1989706 A2 EP1989706 A2 EP 1989706A2
Authority
EP
European Patent Office
Prior art keywords
perceptual weighting
filter
band
gain compensation
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
EP07731586A
Other languages
German (de)
English (en)
Other versions
EP1989706B1 (fr
Inventor
Stéphane RAGOT
Romain Trilling
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Orange SA
Original Assignee
France Telecom SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by France Telecom SA filed Critical France Telecom SA
Publication of EP1989706A2 publication Critical patent/EP1989706A2/fr
Application granted granted Critical
Publication of EP1989706B1 publication Critical patent/EP1989706B1/fr
Not-in-force legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

DISPOSITIF DE PONDERATION PERCEPTUELLE EN CODAGE/DECODAGE AUDIO
La présente invention concerne un dispositif de pondération perceptuelle pour le codage/décodage d'un signal audio dans une bande de fréquence donnée. Elle concerne également un codeur et un décodeur audio hiérarchiques comprenant un dispositif de codage/décodage conforme à l'invention.
L'invention trouve une application particulièrement avantageuse dans le domaine de la transmission et du stockage de signaux numériques, tels que les signaux audio-fréquences de parole, de musique, etc.
Différentes techniques existent aujourd'hui pour convertir sous forme numérique et pour compresser un signal audio-fréquences de parole, de musique, etc. Les méthodes les plus courantes sont :
- les méthodes de « codage de forme d'onde », telles que le codage MIC ou MICDA (PCM ou ADPCM en anglais),
- les méthodes de « codage paramétrique par analyse par synthèse » comme le codage CELP (« Code Excited Linear Prédiction »),
- les méthodes de « codage perceptuel en sous-bandes ou par transformée ».
Ces techniques classiques de codage de signaux audio-fréquences sont décrites par exemple dans WB. Kleijn et K.K. Paliwal Editors, Speech Coding and Synthesis, Elsevier, 1995. Dans ce contexte, l'invention s'adresse plus spécialement aux méthodes de codage du type « codage prédictif par transformée » (ou « Prédictive Transform Coding ») intégrant les techniques du codage CELP et du codage par transformée.
On rappellera d'abord qu'en codage de parole conventionnel, le codeur génère un flux binaire à débit fixe. Cette contrainte de débit fixe simplifie la mise en œuvre et l'utilisation du codeur et du décodeur, communément désigné ensemble sous le terme de « codée ». Des exemples de tels systèmes sont : le codage UIT-T G.711 à 64 kbit/s, le codage UIT-T G.729 à 8 kbit/s ou le système GSM-EFR à 12,2 kbit/s.
Cependant, dans certaines applications comme la téléphonie mobile, la voix sur IP ou les communications sur réseaux ad hoc, il est préférable de générer un flux binaire à débit variable, les valeurs du débit étant prises dans un ensemble pré-défini. On peut ainsi distinguer plusieurs techniques de codage multi-débits, plus flexible que le codage à débit fixe :
- le codage multi-modes contrôlé par la source et/ou le canal tel que mis en œuvre dans les systèmes AMR-NB, AMR-WB, SMV, ou VMR-WB, - le codage hiérarchique, ou codage "scalable", qui génère un flux binaire dit hiérarchique car il comprend un débit cœur et une ou plusieurs couche(s) d'amélioration. Le système G.722 à 48, 56 et 64 kbit/s est un exemple simple de codage scalable en débit. Le codée MPEG-4 CELP est quant à lui scalable en débit et en largeur de bande ; on trouve d'autres exemples de tels codeurs dans l'article de B. Kovesi, D. Massaloux, A. Sollaud, "A Scalable Speech and Audio Coding Scheme with Continuous Bitrate Flexibility", ICASSP 2004.
- le codage à descriptions multiples.
L'invention s'intéresse ici plus particulièrement au codage hiérarchique.
Le concept de base du codage audio hiérarchique, ou "scalable", est par exemple illustré dans l'article de Y. Hiwasaki, T. Mori, H. Ohmuro, J. Ikedo, D. Tokumoto, and A. Kataoka, Scalable Speech Coding Technology for High- Quality Ubiquitous Communications, NTT Technical Review, March 2004.
Dans ce type de codage, le flux binaire comprend une couche de base, ou de cœur, et une ou plusieurs couches d'amélioration. La couche de base est générée par un codée à bas débit fixe, qualifié de « codée cœur », garantissant la qualité minimale du codage ; cette couche doit être reçue par le décodeur pour maintenir un niveau de qualité acceptable.
Les couches d'amélioration servent à améliorer la qualité ; il peut arriver qu'elles ne soient pas toutes reçues par le décodeur. L'intérêt principal du codage hiérarchique est qu'il permet une adaptation du débit par simple troncature du flux binaire. Le nombre de couches, à savoir le nombre de troncatures possibles du flux binaire, définit la granularité du codage : on parle de codage à granularité forte si le flux binaire comprend peu de couches (de l'ordre de 2 à 4), tandis qu'un codage à granularité fine permet par exemple un pas de l'ordre de 1 kbit/s.
L'invention se rapporte plus particulièrement aux techniques de codage scalable en débit et en largeur de bande avec un codeur cœur de type CELP en bande téléphonique et une ou plusieurs couche d'amélioration en bande élargie par rapport à la bande téléphonique proprement dite. Des exemples de tels systèmes sont donnés dans l'article de H. Taddéi et al, A Scalable Three Bitrate (8, 14,2 and 24 kbit/s) Audio Coder; 107th Convention AES, 199, avec une granularité forte 8, 14,2 et 24 kbit/s, et avec granularité fine de 6,4 à 32 kbit/s dans l'article de B. Kovesi et al précité.
L1UIT-T a lancé en 2004 un projet de codeur hiérarchique à cœur normalisé. Ce codeur, appelé G.729EV (EV pour « Embedded Variable bitrate ») est une annexe du codeur G.729 connu. L'objectif de la normalisation G.729EV est d'obtenir un codeur hiérarchique à cœur G.729, produisant un signal dont la bande s'étend de la bande étroite (300-3400 Hz) à la bande élargie (50-7000 Hz) à un débit de 8 à 32 kbit/s pour les services conversationnels. Ce codeur est par nature inter-opérable avec la recommandation G.729, ce qui assure la compatibilité avec les équipements de voix sur IP existants. En réponse à ce projet, il a été proposé le codeur audio hiérarchique de
8 à 32 kbit/s représenté sur la figure 1 et décrit dans le document UIT-T, COM 16, D135 (WP 3/16), « France Telecom G.729EV Candidate : High level description and complexity évaluation », Q.10/16, Study Period 2005-2008, Geneva, 26 JuIy - 5 August 2005 ». Il s'agit d'un codage à trois couches comprenant un codage CELP en cascade, une extension de bande par codage prédictif linéaire (LPC) pleine bande et un codage prédictif par transformée. Le codage TDAC par transformée (« Time Domain Aliasing Cancellation ») est appliqué après transformation en cosinus discrets modifiée (MDCT). La couche de codage prédictif par transformée utilise un filtre de pondération perceptuelle pleine bande WWB(Z).
Le concept de mise en forme du bruit de codage par filtrage de pondération perceptuelle est expliqué dans l'ouvrage de WB. Kleijn et al précité. En substance, le filtrage de pondération perceptuelle permet de mettre en forme le bruit de codage en atténuant le signal aux fréquences où son intensité est forte et où le bruit peut être plus facilement masqué.
Les filtres de pondération perceptuelle les plus couramment utilisés en codage CELP en bande étroite sont de la forme Â(z/yι)/Â(z/y2) où 0 < γ2 ≤ γi < 1 et Â(z) représente le spectre LPC d'un segment de signal de longueur 5 à 30 ms. L'analyse par synthèse en codage CELP revient ainsi à minimiser l'erreur quadratique dans un domaine de signal pondéré perceptuellement par ce type de filtre.
Cependant, cette technique proposée dans le cadre de la normalisation G.729EV présente l'inconvénient d'utiliser un filtre de pondération perceptuelle pleine bande. Le filtrage associé est en effet relativement complexe en terme de quantité de calcul.
Aussi, le problème technique à résoudre par l'objet de la présente invention est de proposer un dispositif de pondération perceptuelle pour le codage/décodage d'un signal audio dans une bande de fréquence donnée, qui permettrait de réaliser un filtrage de pondération perceptuelle pleine bande, c'est-à-dire sur la totalité de ladite bande de fréquence donnée, en particulier la bande élargie 0-8000 Hz d'un codeur audio hiérarchique, sans que cette opération n'entraîne des calculs longs et coûteux en ressources. La solution au problème technique posé consiste, selon la présente invention en ce que, ledit codage/décodage étant effectué dans une pluralité de sous-bandes adjacentes dans ladite bande de fréquence donnée, ledit dispositif comprend, dans au moins une sous-bande, un filtre de pondération perceptuelle avec compensation de gain apte à réaliser la continuité spectrale entre le signal en sortie dudit filtre de pondération perceptuelle avec compensation de gain et les signaux dans les sous-bandes adjacentes à ladite sous-bande.
Ainsi, le dispositif de pondération perceptuelle conforme à l'invention réalise le filtrage recherché dans une ou plusieurs sous-bandes et non pas dans la bande de codage/décodage dans son ensemble, ce qui limite la complexité des calculs. Par ailleurs, l'éventuelle disparité des gains du filtrage de pondération perceptuelle d'une sous-bande à une autre est résolue grâce à une compensation de gain qui assure la continuité spectrale sur toute la largeur de la bande de fréquence. L'invention permet donc d'obtenir une bande homogène en sortie du filtrage de pondération perceptuelle même si les sous-bandes qui la constituent ont été traitées séparément de ce point de vue.
Il en résulte l'avantage particulièrement important qu'un codage par transformée peut être appliqué pleine bande sur des sous-bandes qui autrement seraient inhomogènes du fait de leur filtrage séparé.
Bien entendu, chaque sous-bande peut être filtrée ou non par pondération perceptuelle. La continuité spectrale peut donc être assurée entre une sous-bande filtrée et une autre non filtrée, ou entre deux sous-bandes filtrées.
Selon un mode de réalisation, ledit filtre de pondération perceptuelle à compensation de gain comprend un filtre de pondération perceptuelle et un module de compensation de gain.
Selon un autre mode de réalisation, ledit filtre de pondération perceptuelle avec compensation de gain comprend un filtre de pondération perceptuelle intégrant ladite compensation de gain.
On peut alors prévoir que ledit filtre de pondération perceptuelle dans la première sous-bande est de la forme Â(z/yι)/Â(z/y^ où Â(z) représente un filtre de prédiction linéaire. Dans ce cas, l'invention propose que ladite compensation de gain effectue une multiplication par un facteur/αc égal à :
où les â, sont les coefficients du filtre Â(z) de prédiction linéaire.
On rappelle ici qu'un filtre Â(z) de prédiction linéaire d'ordre p et de coefficients â, est donné par :
Â(z) = âo + â1 z'1 + â2 z'2 + ... + âp z'p L'invention concerne également un codeur audio hiérarchique dans une bande de fréquence décomposée en une première et une deuxième sous- bandes adjacentes, ledit codeur comprenant : - un codeur cœur destiné à coder un signal original dans la première sous- bande de ladite bande de fréquence,
- un étage de calcul d'un signal résiduel à partir dudit signal original et du signal issu dudit codeur cœur, - un dispositif de pondération perceptuelle dudit signal résiduel, remarquable en ce que ledit dispositif de pondération perceptuelle comprend un filtre de pondération perceptuelle avec compensation de gain apte à réaliser la continuité spectrale entre le signal en sortie dudit filtre de pondération perceptuelle avec compensation de gain et le signal dans la deuxième sous-bande.
Dans ce mode de réalisation, seule la première sous-bande est soumise à un filtrage de pondération perceptuelle, la deuxième sous-bande n'étant pas filtrée.
Par ailleurs, lorsque ledit filtre de pondération perceptuelle à compensation de gain comprend un filtre de pondération perceptuelle dans la première sous-bande, l'invention prévoit que ledit filtre de pondération perceptuelle dans la première sous-bande est de la forme Âι(z/yι)/Âι(z/y2) où A1(Z) représente un filtre de prédiction linéaire. Dans ce cas, ladite compensation de gain dans la première sous-bande effectue une multiplication par un facteur/αc^ égal à :
où les â, sont les coefficients du filtre A1(Z) de prédiction linéaire.
Avantageusement, le signal issu du dispositif de pondération perceptuelle dans la première sous-bande et le signal original dans la deuxième sous-bande sont appliqués respectivement à des modules d'analyse par transformée, et lesdits modules d'analyse par transformée sont reliés à un codeur par transformée dans ladite bande de fréquence.
Selon une variante de réalisation du codeur audio hiérarchique conforme à l'invention, ledit codeur comprend également un dispositif de pondération perceptuelle du signal original dans la deuxième sous-bande, comprenant un filtre de pondération perceptuelle avec compensation de gain apte à réaliser la continuité spectrale entre le signal en sortie dudit filtre de pondération perceptuelle avec compensation de gain et le signal en sortie du dispositif de pondération perceptuelle dans la première sous-bande.
Il s'agit donc là d'un codeur pour lequel un filtrage de pondération perceptuelle est effectué séparément dans les deux sous-bandes.
Il est alors prévu que, lorsque ledit filtre de pondération perceptuelle avec compensation de gain comprend un filtre de pondération perceptuelle dans la deuxième bande, ledit filtre de pondération perceptuelle dans la deuxième sous-bande est de la forme Â2(z/y'i)/Â2(z/y'$ où Â2(z) représente un filtre de prédiction linéaire. Dans ce cas, ladite compensation de gain dans la deuxième sous-bande effectue une multiplication par un facteur/αc2 égal à :
où les â\ sont les coefficients du filtre Â2(z) de prédiction linéaire.
Avantageusement, le signal issu du dispositif de pondération perceptuelle dans la première sous-bande et le signal issu du dispositif de pondération perceptuelle dans la deuxième sous-bande sont appliqués respectivement à des modules d'analyse par transformée, et lesdits modules d'analyse par transformée sont reliés à un codeur par transformée dans ladite bande de fréquence.
L'invention concerne en outre un décodeur audio hiérarchique dans une bande de fréquence décomposée en une première et une deuxième sous- bandes adjacentes, ledit décodeur comprenant : - un décodeur cœur destiné à décoder dans la première sous-bande de ladite bande de fréquence un signal reçu codé par le codeur selon l'invention, - un dispositif de pondération perceptuelle inverse d'un signal représentatif du signal résiduel pondéré dans la première sous-bande par le dispositif de pondération perceptuelle dudit codeur, remarquable en ce que ledit dispositif de pondération perceptuelle inverse comprend un filtre de pondération perceptuelle avec compensation de gain, inverse du filtre de pondération perceptuelle avec compensation de gain du codeur dans la première sous-bande. En variante, l'invention propose que ledit décodeur comprend également un dispositif de pondération perceptuelle inverse du signal décodé dans la deuxième sous-bande, comprenant un filtre de pondération perceptuelle avec compensation de gain, inverse du filtre de pondération perceptuelle avec compensation de gain du codeur dans la deuxième sous- bande.
Dans ce dernier cas, on prévoit que, lorsque ledit filtre de pondération perceptuelle avec compensation de gain comprend un filtre de pondération perceptuelle dans la deuxième bande, ledit filtre de pondération perceptuelle inverse avec compensation de gain comprend un filtre de pondération perceptuelle inverse dans la deuxième sous-bande. En particulier, ledit filtre de pondération perceptuelle inverse dans la deuxième sous-bande est de la forme Dans ce cas, les coefficients du filtre Â2(z) de prédiction linéaire sont fournis par un module d'extension de bande.
L'invention concerne par ailleurs un procédé de pondération perceptuelle pour le codage d'un signal audio dans une bande de fréquence donnée, remarquable en ce que, ledit codage étant effectué dans une pluralité de sous-bandes adjacentes dans ladite bande de fréquence donnée, ledit procédé comprend, dans au moins une sous-bande, une étape de pondération perceptuelle avec compensation de gain apte à réaliser la continuité spectrale entre le signal issu de ladite étape de pondération perceptuelle avec compensation de gain et les signaux dans les sous-bandes adjacentes à ladite sous-bande.
Enfin, l'invention concerne un procédé de pondération perceptuelle pour le décodage d'un signal audio codé dans une bande de fréquence donnée conformément au procédé de pondération perceptuelle pour le codage dudit signal, remarquable en ce que, ledit procédé comprend, dans ladite sous- bande, une étape de pondération perceptuelle avec compensation de gain, inverse de ladite étape de pondération perceptuelle avec compensation de gain.
La description qui va suivre en regard des dessins annexés, donnés à titre d'exemples non limitatifs, fera bien comprendre en quoi consiste l'invention et comment elle peut être réalisée.
La figure 1 est un schéma d'un codeur audio hiérarchique de l'art antérieur, comprenant un filtrage de pondération perceptuelle pleine bande avant codage par transformée.
La figure 2 est un schéma de haut niveau d'un codeur audio hiérarchique selon l'invention.
La figure 3 est un schéma du dispositif de pondération perceptuelle du codeur de la figure 2.
La figure 4 est un spectre donnant l'amplitude d'un signal filtré puis compensé en gain selon l'invention dans une première sous-bande et l'amplitude d'un signal non filtré dans une deuxième sous-bande.
La figure 5 est un schéma de haut niveau d'un décodeur audio hiérarchique selon l'invention.
La figure 6 est un schéma d'une variante du codeur audio hiérarchique de la figure 2. La figure 7 est un schéma d'une variante du décodeur audio hiérarchique de la figure 5.
La figure 8 est un spectre donnant l'amplitude d'un signal filtré puis compensé en gain selon l'invention dans une première sous-bande et l'amplitude d'un signal filtré puis égalisé selon l'invention dans une deuxième sous-bande.
Sur la figure 2 est représenté un codeur audio hiérarchique en sous- bandes à des débits allant de 8 à 32 kbit/s. Cette figure donne les différentes étapes du procédé de codage correspondant.
Le signal d'entrée dans une bande de fréquence utile 50 à 7000 Hz, dite « élargie », échantillonné à 16 kHz, est d'abord décomposé en 2 sous-bandes adjacentes par filtrage miroir en quadrature QMF (« Quadrature Mirror
Filter »). La première sous-bande, ou bande basse, de 0 à 4000 Hz est obtenue par filtrage passe-bas L 300 et décimation 301 , et la deuxième sous- bande, ou bande haute, de 4000 à 8000 Hz par filtrage passe-haut H 302 et décimation 303. Dans un mode de réalisation préféré, les filtres L 300 et H 302 sont de longueur 64 et conformes à ceux décrits dans l'article de J. Johnston, A filter family designed for use in quadrature mirror filter banks, ICASSP, vol. 5, pp. 291 - 294, 1980.
La première sous-bande est pré-traitée par un filtre passe-haut 304 éliminant les composantes en dessous de 50 Hz avant codage par un codeur cœur CELP 305 en bande étroite. Le filtrage passe-haut tient compte du fait que la bande élargie est définie comme couvrant l'intervalle 50-7000 Hz. Dans ce mode de réalisation, le codage CELP en bande étroite correspond à celui décrit à la figure 1 ; il s'agit d'un codage CELP en cascade comprenant comme premier étage un codage G.729 modifié (ITU-T G.729 Recommandation, Coding of Speech at 8 kbit/s using Conjugate Structure Algebraic Code Excited Linear Prédiction (CS-ACELP), March 1996) sans filtre de pré- traitement, et comme deuxième étage un dictionnaire fixe supplémentaire. Le signal résiduel e lié à l'erreur due au codage CELP est calculé par l'étage 306 puis pondéré perceptuellement par un dispositif 307 comprenant un filtre de pondération perceptuelle pour obtenir le signal x!o dans le domaine temporel. Ce signal est analysé par transformée en cosinus discrets modifiée (MDCT) 308 pour obtenir le spectre discret Xιo dans le domaine fréquentiel.
Le dispositif 307 de pondération perceptuelle est montré à la figure 3. Ce dispositif W1(Z) comprend un filtre de pondération perceptuelle Âι(z/yι)/Âι(z/y2) comprenant les étages 501 et 502 de filtrage respectivement par A1(ZZy1) et 1/A1(ZZy2). Comme le montre la figure 2, le filtre A1(Z) de prédiction linéaire est issu du codage CELP en bande étroite. Le dispositif 307 de pondération perceptuelle comprend également un module 503 de compensation de gain destiné à multiplier le signal pondéré perceptuellement issu du filtre 501 , 502 par le facteur/αci défini par :
où les â, sont les coefficients du filtre A1(Z) :
Dans un mode de réalisation préféré, les coefficients â( sont mis à jour à chaque sous-trame de 5 ms, et γi = 0,96 et γ2 = 0,6.
Une définition équivalente du facteur/αci correspond à l'inverse du gain du filtre Âi(z/γi)/Âi(z/γ2) pris à la fréquence de Nyquist (4 kHz) soit :
/OC1 = 1Z\ A1(ZZy1)ZA1(ZZy2)I pour z = -1.
La deuxième sous-bande, ou bande haute, est d'abord dépliée spectralement 309 pour compenser le repliement dû au filtre passe-haut 302 combiné avec la décimation 303. Cette bande haute est ensuite pré-traitée par un filtre passe-bas 310 éliminant les composantes entre 7000 et 8000 Hz dans le signal original. Le signal résultant xu dans le domaine temporel est transformé par MDCT 311 pour obtenir le spectre discret s dans le domaine fréquentiel. Une extension de bande 312 est réalisée à partir de xMelXM. Les signaux xιo et xu sont découpés en trames de N échantillons et la transformation MDCT de longueur L=2N analyse les trames courante et future. Dans un mode de réalisation préféré, χïo et xu sont des signaux en bande étroite échantillonné à 8 kHz et N = 160 (soit 20 ms). Les transformées MDCT Xio et Xu comprennent donc N = 160 coefficients, chaque coefficient représentant une bande fréquentielle de 4000/160 = 25 Hz. Dans un mode de réalisation préféré, la transformation MDCT est implantée au moyen de l'algorithme de P. Duhamel, Y. Mahieux, J. P. Petit, A fast algorithm for the implementation of filter banks based on lime domain aliasing cancellation', ICASSP, vol. 3, pp.2209-2212, 1991. Les spectres MDCT bande basse et bande haute Xιo et Xu sont codés dans le module 313 de codage par transformée.
Les différents flux binaires générés par les modules de codage 305, 312 et 313 sont multiplexes et structurés en un train binaire hiérarchique dans le multiplexeur 314. Le codage est réalisé par blocs d'échantillons (ou trames) de 20 ms, soit 320 échantillons. Le débit de codage est de 8, 12, 14 à 32 kbit/s.
L'intérêt de l'étape de pondération perceptuelle avec compensation de gain par le facteur/αc/ est maintenant expliqué à l'aide de la figure 4. Cette figure montre la décomposition de la bande de fréquence totale en une première sous-bande, la bande basse entre 0 et 4 kHz, et une deuxième sous-bande, la bande haute entre 4 et 8 kHz. Dans un mode de réalisation préféré, le codeur MDCT 313 s'applique à ces deux sous-bandes avec :
- un filtrage W1(Z) de pondération perceptuelle et compensation en gain avant transformation MDCT en bande basse,
- une transformation MDCT directe en bande haute sans filtrage de pondération perceptuelle. Ces deux opérations en sous-bandes sont schématisées respectivement sur la figure 4 par la réponse en amplitude de Âi(z/γi)/Âi(z/γ2) en bande basse et une réponse plate à 0 dB en bande haute. Cette réponse plate montre qu'aucun traitement n'est appliqué à la bande haute avant transformation MDCT. La compensation de gain par le facteur faci permet de décaler la réponse en amplitude de Âι(z/yι)/Âι(z/y2) afin d'assurer la continuité à
4 kHz. Cette continuité est très importante car elle permet ensuite de coder conjointement les deux spectres discrets Xιo et Xh, de façon homogène en un seul vecteur X Le vecteur X représente donc un spectre discret pleine bande.
Il est important de noter que la valeur 0 dB utilisée ici pour définir la continuité entre bandes basse et haute n'est qu'indicative.
Le décodeur audio hiérarchique associé au codeur qui vient d'être décrit en regard des figures 2, 3 et 4 est représenté à la figure 5. Cette figure illustre les étapes de décodage du signal codé par ledit codeur.
Les bits décrivant chaque trame de 20 ms sont démultiplexés dans le démultiplexeur 700. Dans la suite, on présente un décodage fonctionnant de 8 à 32 kbit/s, bien qu'en pratique le flux binaire peut être tronqué à 8, 12, 14 ou entre 14 et 32 kbit/s.
Le flux binaire des couches à 8 et 12 kbit/s est utilisé par le décodeur CELP 701 pour générer une première synthèse dans la première sous-bande, ou bande étroite, entre 0 et 4000 Hz. La portion du flux binaire associé à la couche à 14 kbit/s est décodée par le module 702 d'extension de bande et le signal obtenu dans la deuxième sous-bande, ou bande haute, entre 4000 et 7000 Hz est transformé par MDCT 703 en un spectre X . Le décodage MDCT 704 génère à partir du flux binaire associé aux débits de 14 à 32 kbit/s un spectre reconstruit X10Qn bande basse et un spectre reconstruit Xh, en bande haute. Ces deux spectres sont ramenés à des signaux temporels xlo et xh par MDCT inverse dans les blocs 705 et 706. Le signal x/oest ajouté à la synthèse CELP par l'additionneur 708 après filtrage par un dispositif 707 de pondération perceptuelle inverse. Le résultat est ensuite post-filtré en 709.
Le signal de sortie en bande élargie, échantillonné à 16 kHz, est obtenu par l'intermédiaire d'un banc de filtres QMF de synthèse qui effectuent les opérations de sur-échantillonnage 710 et 712, de filtrage passe-bas 711 et passe-haut 713 et addition 714.
Une étape de décodage perceptuelle avec compensation de gain est effectuée par le dispositif 707 de pondération perceptuelle inverse Wi(z) comprenant un filtre de pondération perceptuelle inverse Âi(z/γ2)/Âi(z/γi) et un module de compensation de gain destiné à multiplier le signal issu dudit filtre de pondération perceptuelle inverse par le facteur 1/faci avec :
llfac,
où les ât sont les coefficients du filtre A1(Z) issu du codage CELP en bande étroite. Comme au codeur, les coefficients â, sont maintenus constants dans chaque sous-trame de 5 ms.
Une variante du mode de réalisation du codeur de la figure 2 est représentée sur la figure 6.
Sur cette figure, on retrouve le banc de filtres 900 à 903 d'analyse, le traitement de la bande basse par les blocs 904 à 908, le pré-traitement de la bande haute par les blocs 909 à 910, le codeur MDCT 913 et le multiplexeur 915. La différence principale entre cette variante et le mode de réalisation de la figure 2 consiste en l'incorporation d'une analyse et d'une quantification par prédiction linéaire (LPC) dans la deuxième sous-bande, ou bande haute. Les coefficients LPC quantifiés dans la bande haute, Â2(z), sont donnés par le module 911 d'extension de bande. Les détails de l'extension de bande à base de LPC ne sont pas décrits ici car ils dépassent le cadre de l'invention. Ces coefficients LPC permettent d'appliquer un filtrage de pondération perceptuelle avec compensation de gain W2(z) dans le dispositif 912 avant MDCT 913. Ainsi, cette variante revient à pondérer perceptuellement le signal de différence e en bande basse et le signal x en bande haute, alors que le mode de réalisation décrit précédemment ne pondère perceptuellement que le signal de différence e en bande basse.
Dans cette variante, le dispositif 912 de pondération perceptuelle avec compensation de gain W2(z) en bande haute prend la même forme que le filtre W1(Z) dans la bande basse. Il s'agit donc d'un filtre de type Â2(z/y' JZA2(ZZy' 2) suivi d'un facteur de compensation de gain fac2 défini comme :
où les â\ sont les coefficients du filtre Â2(z) :
Â2(z) = â O + â 'i z 1 + â 2 z 2 + ... + â 'p z'p eï γ'i = 0,96 et y 2 = 0,6.
Ce facteur correspond à : fac2 = IAA2(ZZf1)ZA2(ZZf2)I pour z = 1 , soit la fréquence 0 Hz ou composante continue dans le bande haute qui correspond en fait à 4 kHz une fois que cette fréquence est ramenée au signal d'entrée avant filtrage QMF.
L'intérêt de l'étape de pondération perceptuelle avec compensation de gain dans les deux sous-bandes est expliqué à la figure 8. On retrouve la décomposition entre bande basse (0 à 4 kHz) et bande haute (4 à 8 kHz).
Dans la variante considérée ici, le codeur MDCT s'applique à ces deux sous- bandes avec :
- un filtrage W1(Z) avant MDCT en bande basse,
- un filtrage W2(z) avant MDCT en bande haute. Ces deux opérations en sous-bandes sont schématisées respectivement par la réponse en amplitude de A1(ZZy1)ZA1(ZZy2) en bande basse et la réponse en amplitude de Â2(zZγ'1)ZÂ2(zZγ'2) en bande haute.
Les compensations de gain en bandes basse et haute par les facteurs fac] etfac2 respectivement assurent une continuité des réponses des filtres à 4 kHz. C'est cette continuité qui permet ensuite de coder les deux spectres discrets Xιo et Xh, en un seul vecteur X Là encore, il est important de noter que la valeur 0 dB utilisée ici pour définir la continuité entre bandes basse et haute n'est qu'indicative. Le décodeur audio hiérarchique correspondant à cette variante est décrit à la figure 7. Par rapport au décodeur du mode de réalisation précédent, la seule différence consiste en la récupération des coefficients LPC quantifiés, Â2(z), utilisés par le module 1002 d'extension de bande et à l'application d'un filtre de pondération perceptuelle inverse W2(Z)'1 sur le signal x . Le filtre inverse W2(Z)'1 en bande haute est de type Â2(z/y'2)/Â2(z/y'i) suivi par le facteur de compensation de gain l/fac2 oùfac2a été défini plus haut.
L'invention couvre en outre un programme d'ordinateur comportant une suite d'instructions mémorisées sur un support pour exécution par un ordinateur ou un dispositif dédié, remarquable en ce que lors de l'exécution de ces instructions, ce dernier exécute le procédé de pondération perceptuelle objet de l'invention pour le codage et/ou le décodage.
Le programme d'ordinateur précité est par exemple un programme directement exécutable implanté dans un dispositif de pondération perceptuelle objet de l'invention. II est bien entendu que l'invention n'est pas limitée aux seuls modes de réalisation qui viennent d'être décrits. En particulier, on notera que
- les valeurs numériques des paramètres ajustables γlt γ2, γ'i et y'2 peuvent être différentes de celles choisies ci-dessus,
- le facteur de compensation fac] peut être appliqué avant filtrage par A(ZZy1)ZA(ZZy2) ou entre les filtres A(ZZy1) et Â(zZγ2) ou encore intégré dans l'un des filtres A(ZZy1) ou Â(zZy2). Il en est de même pour le facteur/αc2 et les filtres inverses correspondants, - le filtre de pondération perceptuelle n'est pas nécessairement de la forme Â(z/γi)/Â(z/γ2),
- le nombre de sous-bandes définies dans la bande de fréquence totale peut être supérieur à 2.

Claims

REVENDICATIONS
1. Dispositif de pondération perceptuelle pour le codage/décodage d'un signal audio dans une bande de fréquence donnée, caractérisé en ce que, ledit codage/décodage étant effectué dans une pluralité de sous-bandes adjacentes dans ladite bande de fréquence donnée, ledit dispositif comprend, dans au moins une sous-bande, un filtre (307) de pondération perceptuelle avec compensation de gain apte à réaliser la continuité spectrale entre le signal en sortie dudit filtre de pondération perceptuelle avec compensation de gain et les signaux dans les sous-bandes adjacentes à ladite sous-bande.
2. Dispositif selon la revendication 1 , caractérisé en ce que ledit filtre (307) de pondération perceptuelle avec compensation de gain comprend un filtre (501 , 502) de pondération perceptuelle et un module (503) de compensation de gain.
3. Dispositif selon la revendication 2, caractérisé en ce que ledit module (503) de compensation de gain est disposé à la sortie dudit filtre (501 , 502) de pondération perceptuelle.
4. Dispositif selon la revendication 2, caractérisé en ce que ledit module de compensation de gain est disposé à l'entrée dudit filtre de pondération perceptuelle.
5. Dispositif selon la revendication 1 , caractérisé en ce que ledit filtre de pondération perceptuelle avec compensation de gain comprend un filtre de pondération perceptuelle intégrant ladite compensation de gain.
6. Dispositif selon l'une quelconque des revendications 2 à 5, caractérisé en ce que ledit filtre de pondération perceptuelle est de la forme Â(z/yι)/Â(z/y2) où Â(z) représente un filtre de prédiction linéaire, avec 0 < γ2 ≤1 et 0 < γi ≤ 1.
7. Dispositif selon la revendication 6, caractérisé en ce que ladite compensation de gain effectue une multiplication par un facteur fac égal à :
où les ât sont les coefficients dudit filtre Â(z) = â0 + ai z'1 + â2 z'2 +... + âp z'p de prédiction linéaire.
8. Codeur audio hiérarchique dans une bande de fréquence décomposée en une première et une deuxième sous-bandes adjacentes, ledit codeur comprenant :
- un codeur cœur (305 ; 905) destiné à coder un signal original dans la première sous-bande de ladite bande de fréquence,
- un étage (306 ; 906) de calcul d'un signal résiduel (e) à partir dudit signal original et du signal issu dudit codeur cœur, - un dispositif de pondération perceptuelle dudit signal résiduel (e), caractérisé en ce que ledit dispositif de pondération perceptuelle comprend un filtre (307 ; 907) de pondération perceptuelle avec compensation de gain apte à réaliser la continuité spectrale entre le signal en sortie dudit filtre de pondération perceptuelle avec compensation de gain et le signal dans la deuxième sous-bande.
9. Codeur selon la revendication 8, caractérisé en ce que ledit filtre (307) de pondération perceptuelle à compensation de gain comprend un filtre (501 , 502) de pondération perceptuelle dans la première sous-bande.
10. Codeur selon la revendication 9, caractérisé en ce que ledit filtre (501 , 502) de pondération perceptuelle dans la première sous-bande est de la forme
Âι(z/yι)/Âι(z/y2) où A1(Z) représente un filtre de prédiction linéaire , avec 0 < γ2 ≤'\ et θ ≤ γ] ≤ '\ .
11. Codeur selon la revendication 10, caractérisé en ce que la compensation de gain dans la première sous-bande effectue une multiplication par un facteur
où les â, sont les coefficients dudit filtre A1(Z) = âo + U1Z'1 + â2 z'2 +...+ âp z'p de prédiction linéaire.
12. Codeur selon l'une des revendications 10 ou 11 , caractérisé en ce que les coefficients dudit filtre de prédiction linéaire sont fournis par ledit codeur cœur
(305).
13. Codeur selon l'une quelconque des revendications 8 à 12, caractérisé en ce que le signal issu du dispositif (307) de pondération perceptuelle dans la première sous-bande et le signal original dans la deuxième sous-bande sont appliqués respectivement à des modules (308, 311 ) d'analyse par transformée, et en ce que lesdits modules d'analyse par transformée sont reliés à un codeur (313) par transformée dans ladite bande de fréquence.
14. Codeur selon l'une quelconque des revendications 8 à 13, caractérisé en ce que ledit codeur comprend également un dispositif de pondération perceptuelle du signal original dans la deuxième sous-bande, comprenant un filtre (912) de pondération perceptuelle avec compensation de gain apte à réaliser la continuité spectrale entre le signal en sortie dudit filtre (912) de pondération perceptuelle avec compensation de gain et le signal en sortie du dispositif (907) de pondération perceptuelle dans la première sous-bande.
15. Codeur selon la revendication 14, caractérisé en ce que ledit filtre (912) de pondération perceptuelle avec compensation de gain comprend un filtre de pondération perceptuelle dans la deuxième sous-bande.
16. Codeur selon la revendication 15, caractérisé en ce que ledit filtre de pondération perceptuelle dans la deuxième sous-bande est de la forme où Â2(z) représente un filtre de prédiction linéaire, avec 0 < y '2 <1 et O .S y'7 ≤ 1.
17. Codeur selon la revendication 16, caractérisé en ce que ladite compensation de gain dans la deuxième sous-bande effectue une multiplication par un facteur/αc2 égal à :
où les â\ sont les coefficients dudit filtre Â2(z) = â'0 + â'iz'1 + â'2 z'2 +...+ â'p z'p de prédiction linéaire.
18. Codeur selon l'une des revendications 16 ou 17, caractérisé en ce que les coefficients dudit filtre de prédiction linéaire sont fournis par un module (911 ) d'extension de bande.
19. Codeur selon l'une quelconque des revendications 14 à 18, caractérisé en ce que le signal issu du dispositif (907) de pondération perceptuelle dans la première sous-bande et le signal issu du dispositif (912) de pondération perceptuelle dans la deuxième sous-bande sont appliqués respectivement à des modules (908, 913) d'analyse par transformée, et en ce que lesdits modules d'analyse par transformée sont reliés à un codeur (914) par transformée dans ladite bande de fréquence.
20. Codeur selon l'une quelconque des revendications 8 à 19, caractérisé en ce que ledit codeur cœur (305 ; 905) est un codeur à base de prédiction linéaire.
21. Codeur selon la revendication 20, caractérisé en ce que ledit codeur cœur (305 ; 905) est un codeur CELP.
22. Décodeur audio hiérarchique dans une bande de fréquence décomposée en une première et une deuxième sous-bandes adjacentes, ledit décodeur comprenant :
- un décodeur cœur (701 ; 1001 ) destiné à décoder dans la première sous- bande de ladite bande de fréquence un signal reçu codé par le codeur selon l'une quelconque des revendications 8 à 21 , - un dispositif de pondération perceptuelle inverse d'un signal représentatif du signal résiduel (e) pondéré dans la première sous-bande par le dispositif (307 ; 907) de pondération perceptuelle dudit codeur, caractérisé en ce que ledit dispositif (707 ; 1008) de pondération perceptuelle inverse comprend un filtre de pondération perceptuelle avec compensation de gain, inverse du filtre (307) de pondération perceptuelle avec compensation de gain du codeur dans la première sous-bande.
23. Décodeur selon la revendication 22, caractérisé en ce que ledit décodeur comprend également un dispositif (1007) de pondération perceptuelle inverse du signal décodé dans la deuxième sous-bande, comprenant un filtre de pondération perceptuelle avec compensation de gain, inverse du filtre de pondération perceptuelle avec compensation de gain du codeur dans la deuxième sous-bande.
24. Décodeur selon la revendication 23, caractérisé en ce que ledit filtre de pondération perceptuelle inverse à compensation de gain comprend un filtre de pondération perceptuelle inverse dans la deuxième sous-bande.
25. Décodeur selon la revendication 24, caractérisé en ce que ledit filtre de pondération perceptuelle inverse dans la deuxième sous-bande est de la forme Â2(z/y '2)/Â2(z/y V , avec 0 < y '2 ≤1 et 0 < y 'j ≤ 1.
26. Décodeur selon la revendication 25, caractérisé en ce que les coefficients du filtre Â2(z) de prédiction linéaire sont fournis par un module (1002) d'extension de bande.
27. Procédé de pondération perceptuelle pour le codage d'un signal audio dans une bande de fréquence donnée, caractérisé en ce que, ledit codage étant effectué dans une pluralité de sous-bandes adjacentes dans ladite bande de fréquence donnée, ledit procédé comprend, dans au moins une sous- bande, une étape de pondération perceptuelle avec compensation de gain apte à réaliser la continuité spectrale entre le signal issu de ladite étape de pondération perceptuelle avec compensation de gain et les signaux dans les sous-bandes adjacentes à ladite sous-bande.
28. Procédé de pondération perceptuelle pour le décodage d'un signal audio codé dans une bande de fréquence donnée conformément au procédé selon la revendication 27, caractérisé en ce que, ledit procédé comprend, dans ladite sous-bande, une étape de pondération perceptuelle avec compensation de gain, inverse de ladite étape de pondération perceptuelle avec compensation de gain.
29. Programme d'ordinateur comportant une suite d'instructions mémorisées sur un support pour exécution par un ordinateur ou un dispositif dédié, caractérisé en ce que lors de l'exécution desdites instructions, celui-ci met en œuvre le procédé de pondération perceptuelle selon la revendication 27 et/ou la revendication 28.
EP07731586A 2006-02-14 2007-02-07 Dispositif de ponderation perceptuelle en codage/decodage audio Not-in-force EP1989706B1 (fr)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR0650538 2006-02-14
PCT/FR2007/050760 WO2007093726A2 (fr) 2006-02-14 2007-02-07 Dispositif de ponderation perceptuelle en codage/decodage audio

Publications (2)

Publication Number Publication Date
EP1989706A2 true EP1989706A2 (fr) 2008-11-12
EP1989706B1 EP1989706B1 (fr) 2011-10-26

Family

ID=36952401

Family Applications (1)

Application Number Title Priority Date Filing Date
EP07731586A Not-in-force EP1989706B1 (fr) 2006-02-14 2007-02-07 Dispositif de ponderation perceptuelle en codage/decodage audio

Country Status (7)

Country Link
US (1) US8260620B2 (fr)
EP (1) EP1989706B1 (fr)
JP (1) JP5117407B2 (fr)
KR (1) KR101366124B1 (fr)
CN (1) CN101385079B (fr)
AT (1) ATE531037T1 (fr)
WO (1) WO2007093726A2 (fr)

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7461106B2 (en) * 2006-09-12 2008-12-02 Motorola, Inc. Apparatus and method for low complexity combinatorial coding of signals
GB2448201A (en) * 2007-04-04 2008-10-08 Zarlink Semiconductor Inc Cancelling non-linear echo during full duplex communication in a hands free communication system.
US8576096B2 (en) * 2007-10-11 2013-11-05 Motorola Mobility Llc Apparatus and method for low complexity combinatorial coding of signals
US8209190B2 (en) * 2007-10-25 2012-06-26 Motorola Mobility, Inc. Method and apparatus for generating an enhancement layer within an audio coding system
US20090234642A1 (en) * 2008-03-13 2009-09-17 Motorola, Inc. Method and Apparatus for Low Complexity Combinatorial Coding of Signals
US8639519B2 (en) * 2008-04-09 2014-01-28 Motorola Mobility Llc Method and apparatus for selective signal coding based on core encoder performance
ES2539304T3 (es) * 2008-07-11 2015-06-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Un aparato y un método para generar datos de salida por ampliación de ancho de banda
MX2011000370A (es) * 2008-07-11 2011-03-15 Fraunhofer Ges Forschung Un aparato y un metodo para decodificar una señal de audio codificada.
KR101170466B1 (ko) 2008-07-29 2012-08-03 한국전자통신연구원 Mdct 영역에서의 후처리 방법, 및 장치
ES2671711T3 (es) * 2008-09-18 2018-06-08 Electronics And Telecommunications Research Institute Aparato de codificación y aparato de decodificación para transformar entre codificador basado en transformada de coseno discreta modificada y hetero codificador
FR2938688A1 (fr) * 2008-11-18 2010-05-21 France Telecom Codage avec mise en forme du bruit dans un codeur hierarchique
US8175888B2 (en) * 2008-12-29 2012-05-08 Motorola Mobility, Inc. Enhanced layered gain factor balancing within a multiple-channel audio coding system
US8219408B2 (en) * 2008-12-29 2012-07-10 Motorola Mobility, Inc. Audio signal decoder and method for producing a scaled reconstructed audio signal
US8140342B2 (en) * 2008-12-29 2012-03-20 Motorola Mobility, Inc. Selective scaling mask computation based on peak detection
US8200496B2 (en) * 2008-12-29 2012-06-12 Motorola Mobility, Inc. Audio signal decoder and method for producing a scaled reconstructed audio signal
EP2502229B1 (fr) * 2009-11-19 2017-08-09 Telefonaktiebolaget LM Ericsson (publ) Procédés et agencements de compensation du volume et de la netteté dans des codecs audio
US8423355B2 (en) * 2010-03-05 2013-04-16 Motorola Mobility Llc Encoder for audio signal including generic audio and speech frames
US8428936B2 (en) * 2010-03-05 2013-04-23 Motorola Mobility Llc Decoder for audio signal including generic audio and speech frames
CN102223527B (zh) * 2010-04-13 2013-04-17 华为技术有限公司 频带加权量化编解码方法和装置
KR101747917B1 (ko) 2010-10-18 2017-06-15 삼성전자주식회사 선형 예측 계수를 양자화하기 위한 저복잡도를 가지는 가중치 함수 결정 장치 및 방법
FR2969360A1 (fr) * 2010-12-16 2012-06-22 France Telecom Codage perfectionne d'un etage d'amelioration dans un codeur hierarchique
US9037456B2 (en) * 2011-07-26 2015-05-19 Google Technology Holdings LLC Method and apparatus for audio coding and decoding
JP5737077B2 (ja) * 2011-08-30 2015-06-17 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム
US8712076B2 (en) 2012-02-08 2014-04-29 Dolby Laboratories Licensing Corporation Post-processing including median filtering of noise suppression gains
US9173025B2 (en) 2012-02-08 2015-10-27 Dolby Laboratories Licensing Corporation Combined suppression of noise, echo, and out-of-location signals
US9129600B2 (en) 2012-09-26 2015-09-08 Google Technology Holdings LLC Method and apparatus for encoding an audio signal
FR3008533A1 (fr) * 2013-07-12 2015-01-16 Orange Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences
CN105493182B (zh) * 2013-08-28 2020-01-21 杜比实验室特许公司 混合波形编码和参数编码语音增强
FR3011408A1 (fr) * 2013-09-30 2015-04-03 Orange Re-echantillonnage d'un signal audio pour un codage/decodage a bas retard
CN113206773B (zh) 2014-12-23 2024-01-12 杜比实验室特许公司 与语音质量估计相关的改进方法和设备
WO2017050398A1 (fr) 2015-09-25 2017-03-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codeur, décodeur et procédés pour la commutation avec adaptation au signal du rapport de chevauchement dans le codage audio par transformation
EP3288031A1 (fr) 2016-08-23 2018-02-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Appareil et procédé pour coder un signal audio à l'aide d'une valeur de compensation
US20190051286A1 (en) * 2017-08-14 2019-02-14 Microsoft Technology Licensing, Llc Normalization of high band signals in network telephony communications
WO2020146867A1 (fr) * 2019-01-13 2020-07-16 Huawei Technologies Co., Ltd. Codage audio à haute résolution

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5371853A (en) * 1991-10-28 1994-12-06 University Of Maryland At College Park Method and system for CELP speech coding and codebook for use therewith
JP3139602B2 (ja) * 1995-03-24 2001-03-05 日本電信電話株式会社 音響信号符号化方法及び復号化方法
FR2734389B1 (fr) * 1995-05-17 1997-07-18 Proust Stephane Procede d'adaptation du niveau de masquage du bruit dans un codeur de parole a analyse par synthese utilisant un filtre de ponderation perceptuelle a court terme
US5778335A (en) * 1996-02-26 1998-07-07 The Regents Of The University Of California Method and apparatus for efficient multiband celp wideband speech and music coding and decoding
KR100261253B1 (ko) * 1997-04-02 2000-07-01 윤종용 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치
US6182031B1 (en) * 1998-09-15 2001-01-30 Intel Corp. Scalable audio coding system
EP1052622B1 (fr) * 1999-05-11 2007-07-11 Nippon Telegraph and Telephone Corporation Sélection d'un filtre de synthèse pour le codage de type CELP de signaux audio à large bande passante
US6691082B1 (en) 1999-08-03 2004-02-10 Lucent Technologies Inc Method and system for sub-band hybrid coding
US6446037B1 (en) * 1999-08-09 2002-09-03 Dolby Laboratories Licensing Corporation Scalable coding method for high quality audio
CA2290037A1 (fr) * 1999-11-18 2001-05-18 Voiceage Corporation Dispositif amplificateur a lissage du gain et methode pour codecs de signaux audio et de parole a large bande
US20010047310A1 (en) 2000-03-27 2001-11-29 Russell Randall A. School commerce system and method
AU2001245418A1 (en) 2000-03-28 2001-10-08 Tellabs Operations, Inc. Perceptual spectral weighting of frequency bands for adaptive noise cancellation
US6523003B1 (en) * 2000-03-28 2003-02-18 Tellabs Operations, Inc. Spectrally interdependent gain adjustment techniques
EP1467350B1 (fr) * 2001-12-25 2009-01-14 NTT DoCoMo, Inc. Codage de signaux
US7283966B2 (en) * 2002-03-07 2007-10-16 Microsoft Corporation Scalable audio communications utilizing rate-distortion based end-to-end bit allocation
KR100711989B1 (ko) * 2002-03-12 2007-05-02 노키아 코포레이션 효율적으로 개선된 스케일러블 오디오 부호화
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
US20040098255A1 (en) * 2002-11-14 2004-05-20 France Telecom Generalized analysis-by-synthesis speech coding method, and coder implementing such method
US7392195B2 (en) * 2004-03-25 2008-06-24 Dts, Inc. Lossless multi-channel audio codec
US7676043B1 (en) * 2005-02-28 2010-03-09 Texas Instruments Incorporated Audio bandwidth expansion
US7177804B2 (en) * 2005-05-31 2007-02-13 Microsoft Corporation Sub-band voice codec with multi-stage codebooks and redundant coding

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See references of WO2007093726A2 *

Also Published As

Publication number Publication date
WO2007093726A2 (fr) 2007-08-23
KR20080093450A (ko) 2008-10-21
ATE531037T1 (de) 2011-11-15
US20090076829A1 (en) 2009-03-19
CN101385079A (zh) 2009-03-11
EP1989706B1 (fr) 2011-10-26
WO2007093726A3 (fr) 2007-10-18
US8260620B2 (en) 2012-09-04
JP5117407B2 (ja) 2013-01-16
CN101385079B (zh) 2012-08-29
JP2009527017A (ja) 2009-07-23
KR101366124B1 (ko) 2014-02-21

Similar Documents

Publication Publication Date Title
EP1989706B1 (fr) Dispositif de ponderation perceptuelle en codage/decodage audio
EP1905010B1 (fr) Codage/décodage audio hiérarchique
EP2452337B1 (fr) Allocation de bits dans un codage/décodage d&#39;amélioration d&#39;un codage/décodage hiérarchique de signaux audionumériques
EP1907812B1 (fr) Procede de commutation de debit en decodage audio scalable en debit et largeur de bande
EP2452336B1 (fr) Codage/décodage perfectionne de signaux audionumériques
EP2366177B1 (fr) Codage de signal audionumerique avec mise en forme du bruit dans un codeur hierarchique
EP2115741A1 (fr) Codage/decodage perfectionnes de signaux audionumeriques
WO2007096551A2 (fr) Procede de codage binaire d&#39;indices de quantification d&#39;une enveloppe d&#39;un signal, procede de decodage d&#39;une enveloppe d&#39;un signal et modules de codage et decodage correspondants
EP2239731B1 (fr) Dispositif de codage, dispositif de décodage et procédé pour ceux-ci
EP2104936B1 (fr) Codage par transformee, utilisant des fenetres de ponderation et a faible retard
FR2897733A1 (fr) Procede de discrimination et d&#39;attenuation fiabilisees des echos d&#39;un signal numerique dans un decodeur et dispositif correspondant
EP2005424A2 (fr) Procede de post-traitement d&#39;un signal dans un decodeur audio
EP2652735B1 (fr) Codage perfectionne d&#39;un etage d&#39;amelioration dans un codeur hierarchique
WO2011144863A1 (fr) Codage avec mise en forme du bruit dans un codeur hierarchique
FR2737360A1 (fr) Procedes de codage et de decodage de signaux audiofrequence, codeur et decodeur pour la mise en oeuvre de tels procedes
FR2980620A1 (fr) Traitement d&#39;amelioration de la qualite des signaux audiofrequences decodes
WO2013135997A1 (fr) Modification des caractéristiques spectrales d&#39;un filtre de prédiction linéaire d&#39;un signal audionumérique représenté par ses coefficients lsf ou isf

Legal Events

Date Code Title Description
PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

Free format text: ORIGINAL CODE: 0009012

17P Request for examination filed

Effective date: 20080911

AK Designated contracting states

Kind code of ref document: A2

Designated state(s): AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IS IT LI LT LU LV MC NL PL PT RO SE SI SK TR

17Q First examination report despatched

Effective date: 20100924

GRAP Despatch of communication of intention to grant a patent

Free format text: ORIGINAL CODE: EPIDOSNIGR1

DAX Request for extension of the european patent (deleted)
GRAS Grant fee paid

Free format text: ORIGINAL CODE: EPIDOSNIGR3

GRAA (expected) grant

Free format text: ORIGINAL CODE: 0009210

AK Designated contracting states

Kind code of ref document: B1

Designated state(s): AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IS IT LI LT LU LV MC NL PL PT RO SE SI SK TR

REG Reference to a national code

Ref country code: GB

Ref legal event code: FG4D

Free format text: NOT ENGLISH

REG Reference to a national code

Ref country code: CH

Ref legal event code: EP

REG Reference to a national code

Ref country code: IE

Ref legal event code: FG4D

REG Reference to a national code

Ref country code: DE

Ref legal event code: R096

Ref document number: 602007018217

Country of ref document: DE

Effective date: 20111222

REG Reference to a national code

Ref country code: NL

Ref legal event code: VDEP

Effective date: 20111026

LTIE Lt: invalidation of european patent or patent extension

Effective date: 20111026

REG Reference to a national code

Ref country code: AT

Ref legal event code: MK05

Ref document number: 531037

Country of ref document: AT

Kind code of ref document: T

Effective date: 20111026

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: LT

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20111026

Ref country code: IS

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20120226

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: PL

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20111026

Ref country code: SI

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20111026

Ref country code: PT

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20120227

Ref country code: NL

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20111026

Ref country code: LV

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20111026

Ref country code: GR

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20120127

Ref country code: SE

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20111026

REG Reference to a national code

Ref country code: IE

Ref legal event code: FD4D

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: CY

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20111026

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: DK

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20111026

Ref country code: BG

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20120126

Ref country code: IE

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20111026

Ref country code: SK

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20111026

Ref country code: CZ

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20111026

Ref country code: EE

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20111026

BERE Be: lapsed

Owner name: FRANCE TELECOM

Effective date: 20120228

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: IT

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20111026

Ref country code: RO

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20111026

PLBE No opposition filed within time limit

Free format text: ORIGINAL CODE: 0009261

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: NO OPPOSITION FILED WITHIN TIME LIMIT

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: MC

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20120229

REG Reference to a national code

Ref country code: CH

Ref legal event code: PL

26N No opposition filed

Effective date: 20120727

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: CH

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20120229

Ref country code: LI

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20120229

REG Reference to a national code

Ref country code: DE

Ref legal event code: R097

Ref document number: 602007018217

Country of ref document: DE

Effective date: 20120727

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: BE

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20120228

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: AT

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20111026

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: ES

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20120206

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: FI

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20111026

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: TR

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20111026

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: LU

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20120207

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: HU

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20070207

REG Reference to a national code

Ref country code: FR

Ref legal event code: PLFP

Year of fee payment: 10

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: DE

Payment date: 20160121

Year of fee payment: 10

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: GB

Payment date: 20160127

Year of fee payment: 10

Ref country code: FR

Payment date: 20160121

Year of fee payment: 10

REG Reference to a national code

Ref country code: DE

Ref legal event code: R119

Ref document number: 602007018217

Country of ref document: DE

GBPC Gb: european patent ceased through non-payment of renewal fee

Effective date: 20170207

REG Reference to a national code

Ref country code: FR

Ref legal event code: ST

Effective date: 20171031

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: DE

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20170901

Ref country code: FR

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20170228

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: GB

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20170207