EP0782128A1 - Procédé d'analyse par prédiction linéaire d'un signal audiofréquence, et procédés de codage et de décodage d'un signal audiofréquence en comportant application - Google Patents

Procédé d'analyse par prédiction linéaire d'un signal audiofréquence, et procédés de codage et de décodage d'un signal audiofréquence en comportant application Download PDF

Info

Publication number
EP0782128A1
EP0782128A1 EP96402715A EP96402715A EP0782128A1 EP 0782128 A1 EP0782128 A1 EP 0782128A1 EP 96402715 A EP96402715 A EP 96402715A EP 96402715 A EP96402715 A EP 96402715A EP 0782128 A1 EP0782128 A1 EP 0782128A1
Authority
EP
European Patent Office
Prior art keywords
signal
stage
coefficients
transfer function
filter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
EP96402715A
Other languages
German (de)
English (en)
Other versions
EP0782128B1 (fr
Inventor
Catherine Quinquis
Alain Le Guyader
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Orange SA
Original Assignee
France Telecom SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by France Telecom SA filed Critical France Telecom SA
Publication of EP0782128A1 publication Critical patent/EP0782128A1/fr
Application granted granted Critical
Publication of EP0782128B1 publication Critical patent/EP0782128B1/fr
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients

Abstract

Le procédé d'analyse par prédiction linéaire est utilisé pour déterminer des paramètres spectraux représentatifs de l'enveloppe spectrale du signal audiofréquence. Ce procédé comprend q étages de prédiction successifs (5p), q étant un entier supérieur à 1. A chaque étage de prédiction p (1<=p<=q), on détermine des paramètres représentant un nombre prédéfini Mp de coefficients a1<p>,..., aMp<p> de prédiction linéaire d'un signal d'entrée dudit étage. Le signal audiofréquence à analyser constitue le signal d'entrée du premier étage. Le signal d'entrée (s<p>(n)) d'un étage p+1 est constitué par le signal d'entrée (s<p-1>(n)) de l'étage p filtré par un filtre de fonction de transfert <IMAGE> Utilisation notamment dans des codeurs audio en bande élargie. <IMAGE>

Description

  • La présente invention concerne un procédé d'analyse par prédiction linéaire d'un signal audiofréquence. Ce procédé trouve une application particulière, mais non exclusive, dans des codeurs audio à prédiction, notamment dans des codeurs à analyse par synthèse, dont le type le plus répandu est le codeur CELP ("Code-Excited Linear Prediction").
  • Les techniques de codage prédictif à analyse par synthèse sont actuellement très répandues pour le codage de la parole en bande téléphonique (300-3400 Hz) à des débits pouvant descendre jusqu'à 8 kbit/s, tout en conservant une qualité téléphonique. Pour la bande audio (de l'ordre de 20 kHz), les techniques de codage par transformée sont utilisées pour des applications de diffusion et de stockage de signaux vocaux et musicaux. Cependant, ces techniques impliquent des retards de codage relativement importants (plus grands que 100 ms), ce qui produit en particulier des difficultés de participation dans les communications de groupe où l'interactivité est très importante. Les techniques prédictives produisent un retard plus faible, dépendant essentiellement de la longueur des trames d'analyse par prédiction linéaire (typiquement 10 à 20 ms), et trouvent pour cette raison des applications même pour le codage de signaux vocaux et/ou musicaux ayant une largeur de bande supérieure à la bande téléphonique.
  • Les codeurs prédictifs utilisés pour la compression de débit réalisent une modélisation de l'enveloppe spectrale du signal. cette modélisation résulte d'une analyse par prédiction linéaire d'ordre M (M≃10 typiquement en bande étroite), consistant à déterminer M coefficients ai de prédiction linéaire du signal d'entrée. Ces coefficients caractérisent un filtre de synthèse utilisé au décodeur, dont la fonction de transfert est de la forme 1/A(z) avec
    Figure imgb0001
  • L'analyse par prédiction linéaire a un domaine d'application général plus large que celui du codage de la parole. Dans certaines applications, l'ordre M de la prédiction constitue l'une des variables que l'analyse par prédiction linéaire vise à obtenir, cette variable étant influencée par le nombre de pics présents dans le spectre du signal analysé (voir US-A-5 142 581).
  • Le filtre calculé par l'analyse par prédiction linéaire peut avoir diverses structures, conduisant à différents choix de paramètres pour la représentation des coefficients (les coefficients ai eux-mêmes, les paramètres LAR, LSF, LSP, les coefficients de réflexion ou PARCOR...). Avant l'avènement des processeurs de signal numérique (DSP), il était courant d'employer des structures récursives pour le filtre calculé, par exemple des structures faisant appel aux coefficients PARCOR du type décrit dans l'article de F. ITAKURA et S. SAITO "Digital Filtering Techniques for Speech Analysis and Synthesis", Proc. of the 7th International Congress on Acoustics, Budapest 1971, pages 261-264 (voir FR-A-2 284 946 ou US-A-3 975 587).
  • Dans les codeurs à analyse par synthèse, les coefficients ai servent également à construire un filtre de pondération perceptuelle utilisé par le codeur pour déterminer le signal d'excitation à appliquer au filtre de synthèse à court terme pour obtenir un signal synthétique représentatif du signal de parole. Cette pondération perceptuelle accentue les portions du spectre où les erreurs de codage sont les plus perceptibles, c'est-à-dire les zones interformantiques. La fonction de transfert W(z) du filtre de pondération perceptuelle est habituellement de la forme W ( z ) = A z 1 A z 2
    Figure imgb0002
    où γ1 et γ2 sont deux coefficients d'expansion spectrale tels que 0≤γ2≤γ1≤1. Une amélioration du masquage du bruit a été apportée par E. Ordentlich et Y. Shoham, dans leur article "Low-Delay Code-Excited Linear Predictive Coding of Wideband Speech at 32 kbps", Proc. ICASSP, Toronto, Mai 1991, pages 9-12. Cette amélioration consiste à combiner pour la pondération perceptuelle le filtre W(z) avec un autre filtre modélisant la pente du spectre. Cette amélioration est particulièrement appréciable dans le cas de codage de signaux à forte dynamique spectrale (bande élargie ou bande audio) pour lesquels les auteurs ont montré une importante amélioration de la qualité subjective du signal reconstruit.
  • Dans la plupart des décodeurs CELP actuels, les coefficients de prédiction linéaire ai sont également utilisés pour définir un post-filtre servant à atténuer les zones fréquentielles entre les formants et les harmoniques du signal de parole, sans modifier la pente du spectre du signal. Une forme habituelle de la fonction de transfert de ce post-filtre est : H PF ( z ) = G P A z 1 A z 2 (1-µ r 1 z -1 )
    Figure imgb0003
    où GP est un facteur de gain compensant l'atténuation des filtres, β1 et β2 sont des coefficients tels que 0≤β1≤β2≤1, µ est une constante positive et r1 désigne le premier coefficient de réflexion dépendant des coefficients ai.
  • La modélisation de l'enveloppe spectrale du signal par les coefficients ai constitue donc un élément essentiel du processus de codage et de décodage, en ce sens qu'elle doit représenter le contenu spectral du signal à reconstituer au décodeur et qu'elle pilote aussi bien le masquage du bruit de quantification que le post-filtrage au décodeur.
  • Pour des signaux à forte dynamique spectrale, l'analyse par prédiction linéaire habituellement pratiquée ne parvient pas à modéliser fidèlement l'enveloppe du spectre. Souvent, les signaux de parole sont sensiblement plus énergétiques aux basses fréquences qu'aux fréquences élevées, de sorte que l'analyse par prédiction linéaire conduit certes à une modélisation précise aux basses fréquences, mais au détriment de la modélisation du spectre aux fréquences plus élevées. Cet inconvénient devient particulièrement gênant dans le cas du codage en bande élargie.
  • Un but de la présente invention est d'améliorer la modélisation du spectre d'un signal audiofréquence dans un système faisant appel à un procédé d'analyse par prédiction linéaire. Un autre but est de rendre les performances d'un tel système plus homogènes pour des signaux d'entrée différents (parole, musique, sinusoïdes, signaux DTMF...), des largeurs de bande différentes (bande téléphonique, bande élargie, bande hifi...), des conditions différentes d'enregistrement (microphone directif, antenne acoustique...) et de filtrage.
  • L'invention propose ainsi un procédé d'analyse par prédiction linéaire d'un signal audiofréquence, pour déterminer des paramètres spectraux dépendant d'un spectre à court terme du signal audiofréquence, comprenant q étages de prédiction successifs, q étant un entier supérieur à 1. A chaque étage de prédiction p (1≤p≤q), on détermine des paramètres représentant un nombre prédéfini Mp de coefficients a 1 p ,...a Mp p de prédiction linéaire d'un signal d'entrée dudit étage, le signal audiofréquence analysé constituant le signal d'entrée du premier étage, et le signal d'entrée d'un étage p+1 étant constitué par le signal d'entrée de l'étage p filtré par un filtre de fonction de transfert
    Figure imgb0004
  • Le nombre Mp de coefficients de prédiction linéaire peut notamment augmenter d'un étage au suivant. Ainsi, le premier étage pourra rendre compte assez fidèlement de la pente générale du spectre ou du signal, tandis que les étages suivants affineront la représentation des formants du signal. On évite ainsi, dans le cas de signaux à forte dynamique, de trop privilégier les zones les plus énergétiques au risque d'une modélisation médiocre des autres zones fréquentielles pouvant être perceptuellement importantes.
  • Un second aspect de l'invention concerne une application de ce procédé d'analyse par prédiction linéaire dans un codeur audiofréquence à analyse par synthèse à adaptation "forward". L'invention propose ainsi un procédé de codage d'un signal audiofréquence comprenant les étapes suivantes :
    • analyse par prédiction linéaire d'un signal audiofréquence numérisé en trames successives pour déterminer des paramètres définissant un filtre de synthèse à court terme ;
    • détermination de paramètres d'excitation définissant un signal d'excitation à appliquer au filtre de synthèse à court terme pour produire un signal synthétique représentatif du signal audiofréquence ; et
    • production de valeurs de quantification des paramètres définissant le filtre de synthèse à court terme et des paramètres d'excitation,
       dans lequel l'analyse par prédiction linéaire est un processus à q étages successifs tel que défini ci-dessus, et dans lequel le filtre de prédiction à court terme a une fonction de transfert de la forme 1/A(z) avec
    Figure imgb0005
  • La fonction de transfert A(z) ainsi obtenue peut également être utilisée pour définir selon la formule (2) la fonction de transfert du filtre de pondération perceptuelle lorsque le codeur est un codeur à analyse par synthèse avec détermination en boucle fermée du signal d'excitation. Une autre possibilité intéressante est d'adopter des coefficients d'expansion spectrale γ1 et γ2 pouvant varier d'un étage au suivant, c'est-à-dire de donner au filtre de pondération perceptuelle une fonction de transfert de la forme
    Figure imgb0006
    où γ1 p, γ2 p désignent des paires de coefficients d'expansion spectrale tels que 0≤γ2 p≤γ1 p≤1 pour 1≤p≤q.
  • L'invention est également applicable au niveau d'un décodeur associé. Le procédé de décodage ainsi mis en oeuvre selon l'invention comprend les étapes suivantes :
    • on reçoit des valeurs de quantification de paramètres définissant un filtre de synthèse à court terme et des paramètres d'excitation, les paramètres définissant le filtre de synthèse à court terme comprenant un nombre q>1 de jeux de coefficients de prédiction linéaire, chaque jeu comportant un nombre prédéfini de coefficients ;
    • on produit un signal d'excitation sur la base des valeurs de quantification des paramètres d'excitation ;
    • on produit un signal audiofréquence synthétique en filtrant le signal d'excitation par un filtre de synthèse ayant une fonction de transfert de la forme 1/A(z) avec
      Figure imgb0007
      où les coefficients a1 p,...,aMp p correspondent au p-ième jeu de coefficients de prédiction linéaire pour 1≤p≤q.
  • Cette fonction de transfert A(z) peut également être utilisée pour définir un post-filtre dont la fonction de transfert comporte, comme dans la formule (3) ci-dessus, un terme de la forme A(z/β1)/A(z/β2), où β1 et β2 désignent des coefficients tels que 0≤β1≤β2≤1.
  • Une variante intéressante consiste à remplacer ce terme de la fonction de transfert du post-filtre par :
    Figure imgb0008
    où β1 p, β2 p désignent des paires de coefficients tels que 0≤β1 p≤β2 p≤1 pour 1≤p≤q.
  • L'invention s'applique également à des codeurs audiofréquence à adaptation "backward". L'invention propose ainsi un procédé de codage d'un premier signal audiofréquence numérisé en trames successives, comprenant les étapes suivantes :
    • analyse par prédiction linéaire d'un second signal audiofréquence pour déterminer des paramètres définissant un filtre de synthèse à court terme ;
    • détermination de paramètres d'excitation définissant un signal d'excitation à appliquer au filtre de synthèse à court terme pour produire un signal synthétique représentatif du premier signal audiofréquence, ce signal synthétique constituant ledit second signal audiofréquence pour au moins une trame suivante ; et
    • production de valeurs de quantification des paramètres d'excitation,
       dans lequel l'analyse par prédiction linéaire est un processus à q étages successifs tel que défini ci-dessus, et dans lequel le filtre de prédiction à court terme a une fonction de transfert de la forme 1/A(z) avec
    Figure imgb0009
  • Pour une mise en oeuvre dans un décodeur associé, l'invention propose un procédé de décodage d'un flux binaire pour construire en trames successives un signal audiofréquence codé par ledit flux binaire, comprenant les étapes suivantes :
    • on reçoit des valeurs de quantification de paramètres d'excitation ;
    • on produit un signal d'excitation sur la base des valeurs de quantification des paramètres d'excitation ;
    • on produit un signal audiofréquence synthétique en filtrant le signal d'excitation par un filtre de synthèse à court terme ;
    • on effectue une analyse par prédiction linéaire du signal synthétique pour obtenir des coefficients du filtre de synthèse à court terme pour au moins une trame suivante,
       dans lequel l'analyse par prédiction linéaire est un processus à q étages successifs tel que défini ci-dessus, et dans lequel le filtre de prédiction à court terme a une fonction de transfert de la forme 1/A(z) avec
    Figure imgb0010
  • L'invention permet encore de réaliser des codeurs/décodeurs audiofréquence mixtes, c'est-à-dire faisant appel à la fois à des schémas d'adaptation "forward" et "backward", le ou les premiers étages de prédiction linéaire correspondant à une analyse "forward" et le ou les derniers étages à une analyse "backward". L'invention propose ainsi un procédé de codage d'un premier signal audiofréquence numérisé en trames successives, comprenant les étapes suivantes :
    • analyse par prédiction linéaire du premier signal audiofréquence pour déterminer des paramètres définissant une première composante d'un filtre de synthèse à court terme ;
    • détermination de paramètres d'excitation définissant un signal d'excitation à appliquer au filtre de synthèse à court terme pour produire un signal synthétique représentatif du premier signal audio-fréquence ;
    • production de valeurs de quantification des paramètres définissant la première composante du filtre de synthèse à court terme et des paramètres d'excitation ;
    • filtrage du signal synthétique par un filtre de fonction de transfert correspondant à l'inverse de la fonction de transfert de la première composante du filtre de synthèse à court terme ; et
    • analyse par prédiction linéaire du signal synthétique filtré pour obtenir des coefficients d'une seconde composante du filtre de synthèse à court terme pour au moins une trame suivante,
       dans lequel l'analyse par prédiction linéaire du premier signal audiofréquence est un processus à qF étages successifs, qF étant un entier au moins égal à 1, ledit processus à qF étages comportant, à chaque étage de prédiction p (1≤p≤qF), la détermination de paramètres représentant un nombre prédéfini MFp de coefficients a 1 F , p ,...,a MFp F,p de prédiction linéaire d'un signal d'entrée dudit étage, le premier signal audiofréquence constituant le signal d'entrée du premier étage, et le signal d'entrée d'un étage p+1 étant constitué par le signal d'entrée de l'étage p filtré par un filtre de fonction de transfert
    Figure imgb0011
    la première composante du filtre de synthèse à court terme ayant une fonction de transfert de la forme 1/AF(z) avec
    Figure imgb0012
       et dans lequel l'analyse par prédiction linéaire du signal synthétique filtré est un processus à qB étages successifs, qB étant un entier au moins égal à 1, ledit processus à qB étages comportant, à chaque étage de prédiction p (1≤p≤qB), la détermination de paramètres représentant un nombre prédéfini MBp de coefficients a 1 B,p ,...,a MBp B,p de prédiction linéaire d'un signal d'entrée dudit étage, le signal synthétique filtré constituant le signal d'entrée du premier étage, et le signal d'entrée d'un étage p+1 étant constitué par le signal d'entrée de l'étage p filtré par un filtre de fonction de transfert
    Figure imgb0013
    la seconde composante du filtre de synthèse à court terme ayant une fonction de transfert de la forme 1/AB(z) avec
    Figure imgb0014
    et le filtre de synthèse à court terme ayant une fonction de transfert de la forme 1/A(z) avec A(z)=AF(z).AB(z).
  • Pour une mise en oeuvre dans un décodeur mixte associé, l'invention propose un procédé de décodage d'un flux binaire pour construire en trames successives un signal audiofréquence codé par ledit flux binaire, comprenant les étapes suivantes :
    • on reçoit des valeurs de quantification de paramètres définissant une première composante d'un filtre de synthèse à court terme et de paramètres d'excitation, les paramètres définissant la première composante du filtre de synthèse à court terme représentant un nombre qF au moins égal à 1 de jeux de coefficients de prédiction linéaire a 1 F,p ,...,a MFp F,p pour 1≤p≤qF, chaque jeu p comportant un nombre prédéfini MFp de coefficients, la première composante du filtre de synthèse à court terme ayant une fonction de transfert de la forme 1/AF(z) avec
      Figure imgb0015
    • on produit un signal d'excitation sur la base des valeurs de quantification des paramètres d'excitation ;
    • on produit un signal audiofréquence synthétique en filtrant le signal d'excitation par un filtre de synthèse à court terme de fonction de transfert 1/A(z) avec A(z)=AF(z).AB(z), 1/AB(z) représentant la fonction de transfert d'une seconde composante du filtre de synthèse à court terme ;
    • on filtre le signal synthétique par un filtre de fonction de transfert AF(z) ; et
    • on effectue une analyse par prédiction linéaire du signal synthétique filtré pour obtenir des coefficients de la seconde composante du filtre de synthèse à court terme pour au moins une trame suivante,
       dans lequel l'analyse par prédiction linéaire du signal synthétique filtré est un processus à qB étages tel que défini ci-dessus, et dans lequel le filtre de synthèse à court terme a une fonction de transfert de la forme 1/A(z)=1/[AF(z).AB(z)] avec
    Figure imgb0016
  • Bien qu'on accorde une importance particulière aux applications de l'invention dans le domaine du codage/ décodage à analyse par synthèse, il convient d'observer que le procédé d'analyse par prédiction linéaire à étages multiples proposé selon l'invention comporte de nombreuses autres applications dans le traitement de signaux audio, par exemple dans les codeurs prédictifs par transformée, dans des systèmes de reconnaissance de parole, dans des systèmes d'accentuation de parole (speech enhancement) ...
  • D'autres particularités et avantages de la présente invention apparaîtront dans la description ci-après d'exemples de réalisation préférés mais non limitatifs, en référence aux dessins annexés, dans lesquels :
    • la figure 1 est un organigramme d'un procédé d'analyse par prédiction linéaire selon l'invention ;
    • la figure 2 est un diagramme spectral comparant les résultats d'un procédé selon l'invention avec ceux d'un procédé conventionnel d'analyse par prédiction linéaire ;
    • les figures 3 et 4 sont des schémas synoptiques d'un décodeur et d'un codeur CELP pouvant mettre en oeuvre l'invention ;
    • les figures 5 et 6 sont des schémas synoptiques de variantes de décodeur et de codeur CELP pouvant mettre en oeuvre l'invention ; et
    • les figures 7 et 8 sont des schémas synoptiques d'autres variantes de décodeur et de codeur CELP pouvant mettre en oeuvre d'invention.
  • Le signal audiofréquence à analyser dans le procédé illustré par la figure 1 est noté s0(n). Il est supposé disponible sous forme d'échantillons numériques, l'entier n désignant les instants d'échantillonnage successifs. Le procédé d'analyse par prédiction linéaire comprend q étages successifs 51,...,5p,...,5q. A chaque étage de prédiction 5p (1≤p≤q), on effectue une prédiction linéaire d'ordre Mp d'un signal d'entrée sp-1(n). Le signal d'entrée du premier étage 51 est constitué par le signal audiofréquence à analyser s0(n), tandis que le signal d'entrée d'un étage 5p+1 (1≤p<q) est constitué par le signal sp(n), obtenu à une étape notée 6p en appliquant au signal d'entrée sp-1(n) du p-ième étage 5p un filtrage au moyen d'un filtre de fonction de transfert
    Figure imgb0017
    où les coefficients aip (1≤i≤Mp) sont les coefficients de prédiction linéaire obtenus à l'étage 5p.
  • Les méthodes d'analyse par prédiction linéaire pouvant être mises en oeuvre dans les différents étages 51,...,5q sont bien connues dans la technique.
  • On pourra par exemple se reporter aux ouvrages "Digital Processing of Speech Signals" de L.R. Rabiner et R.W. Shafer, Prentice-Hall Int., 1978 et "Linear Prediction of Speech" de J.D. Markel et A.H. Gray, Springer Verlag Berlin Heidelberg, 1976. On peut notamment utiliser l'algorithme de Levinson-Durbin, qui comporte les étapes suivantes (pour chaque étage 5p) :
    • évaluation de Mp autocorrélations R(i) (0≤i≤Mp) du signal d'entrée sp-1(n) de l'étage sur une fenêtre d'analyse de Q échantillons :
      Figure imgb0018
      avec s*(n)=sp-1(n).f(n), f(n) désignant une fonction de fenêtrage de longueur Q, par exemple une fonction rectangulaire ou une fonction de Hamming ;
    • évaluation récursive des coefficients ai p: E(0) = R(0)
      Figure imgb0019
      Pour i allant de 1 à Mp, faire
      Figure imgb0020
      Pour j allant de 1 à i-1, faire a j p,i = a j p,i-1 - r i p . a i-j p,i-1
      Figure imgb0021
  • Les coefficients ai p (i=1,...,Mp) sont pris égaux aux ai p,Mp obtenus à la dernière itération. La quantité E(Mp) est l'énergie de l'erreur résiduelle de prédiction de l'étage p. Les coefficients ri p, compris entre -1 et 1, sont appelés coefficients de réflexion. Ils peuvent être représentés par les rapports logarithmiques (log-area-ratios) LARi p=LAR(ri p), la fonction LAR étant définie par LAR(r)= log10[(1-r)/(1+r)].
  • Dans un certain nombre d'applications, on a besoin d'opérer une quantification des coefficients de prédiction obtenus. La quantification peut être effectuée sur les coefficients ai p directement, sur les coefficients de réflexion associés ri p ou sur les rapports logarithmiques LARi p. Une autre possibilité est de quantifier des paramètres de raie spectrale (LSP pour "line spectrum pairs", ou LSF pour "line spectrum frequencies"). Les Mp fréquences de raie spectrale ωi p(1≤i≤Mp), normalisées entre 0 et π, sont telles que les nombres complexes 1, exp(jω2 p), exp(jω4 p),...,exp(jωMp p), soient les racines du polynôme Pp(z)=Ap(z)-z-(Mp+1)Ap(z-1) et que les nombres complexes exp(jω1 p), exp(jω3 p),...,exp(jωp Mp-1), et -1 soient les racines du polynôme Qp(z)=Ap(z)+z-(Mp+1)Ap(z-1). La quantification peut porter sur les fréquences normalisées ωi p ou sur leurs cosinus.
  • L'analyse peut être effectuée à chaque étage de prédiction 5p selon l'algorithme classique de Levinson-Durbin ci-dessus rappelé. D'autres algorithmes fournissant les mêmes résultats, développés plus récemment, peuvent être utilisés avantageusement, notamment l'algorithme de Levinson éclaté (voir "A new Efficient Algorithm to Compute the LSP Parameters for Speech Coding", par S. Saoudi, J.M. Boucher et A. Le Guyader, Signal Processing, Vol.28, 1992, pages 201-212), ou l'utilisation des polynômes de Chebyshev (voir "The Computation of Line Spectrum Frequencies Using Chebyshev Polynomials, par P. Kabal et R.P. Ramachandran, IEEE Trans. on Acoustics, Speech, and Signal Processing, Vol. ASSP-34, n°6, pages 1419-1426, décembre 1986).
  • Lorsque l'analyse multi-étages représentée sur la figure 1 est réalisée pour définir un filtre de prédiction à court terme du signal audiofréquence s0(n), on donne à la fonction de transfert A(z) de ce filtre, la forme
    Figure imgb0022
  • On note que cette fonction de transfert obéit à la forme générale classique donnée par la formule (1), avec M=M1+...+Mq. Toutefois, les coefficients ai de la fonction A(z) obtenus avec le processus de prédiction multi-étages diffèrent en général de ceux que procure le processus classique de prédiction en un seul étage.
  • Les ordres Mp des prédictions linéaires effectuées augmentent de préférence d'un étage au suivant : M1<M2<...<Mq. Ainsi, l'allure de l'enveloppe spectrale du signal analysé est modélisée relativement grossièrement au premier étage 51(M1=2 par exemple), et cette modélisation s'affine d'étage en étage sans perdre l'information globale fournie par le premier étage. On évite ainsi que soient insuffisamment pris en compte des paramètres comme la pente générale du spectre qui sont perceptuellement importants, particulièrement dans le cas de signaux en bande élargie et/ou à forte dynamique spectrale.
  • Dans une réalisation typique, le nombre q d'étages de prédiction successifs est égal à 2. Si on a pour objectif un filtre de synthèse d'ordre M, on peut alors prendre M1=2 et M2=M-2, les coefficients ai du filtre (équation (1)) étant donnés par : · a 1 = a 1 1 + a 1 2
    Figure imgb0023
    · a 2 = a 2 1 + a 1 1 a 1 2 + a 2 2
    Figure imgb0024
    · a k = a 2 1 a k-2 2 + a 1 1 a k-1 2 + a k 2 pour 2<k≤M-2
    Figure imgb0025
    · a M-1 = a 2 1 a M-3 2 + a 1 1 a M-2 2
    Figure imgb0026
    · a M = a 2 1 a M-2 2
    Figure imgb0027
  • Pour la représentation et éventuellement la quantification du spectre à court terme, il est possible d'adopter l'un des jeux de paramètres spectraux précédemment évoqués (ai p, ri p, LARi p, ωi p ou cos ωi p pour 1≤i≤Mp) pour chacun des étages (1≤p≤q), ou encore les mêmes paramètres spectraux mais pour le filtre composé calculé selon les relations (9) à (13) (ai, ri, LARi, ωi ou cos ωi pour 1≤i≤M). Le choix entre ces paramètres de représentation, ou d'autres encore, dépend des contraintes de chaque application particulière.
  • Le graphique de la figure 2 montre une comparaison des enveloppes spectrales d'une portion voisée de 30 ms d'un signal de parole, modélisées par un processus classique de prédiction linéaire à un étage avec M=15 (courbe II) et par un processus selon l'invention de prédiction linéaire en q=2 étages avec M1=2 et M2=13 (courbe III). La fréquence d'échantillonnage Fe du signal était de 16 kHz. Le spectre du signal (module de sa transformée de Fourier) est représenté par la courbe I. Ce spectre est représentatif des signaux audiofréquence qui ont, en moyenne, plus d'énergie aux basses fréquences qu'aux hautes fréquences. La dynamique spectrale est parfois supérieure à celle de la figure 2 (60 dB). Les courbes (II) et (III) correspondent aux enveloppes spectrales modélisées | 1/A(e2jπf/Fe)| . On voit que le procédé d'analyse selon l'invention améliore sensiblement la modélisation du spectre, particulièrement aux hautes fréquences (f>4 kHz). La pente générale du spectre et ses formants en haute fréquence sont mieux respectés par le processus d'analyse en plusieurs étages.
  • L'invention est décrite ci-après dans son application à un codeur de parole de type CELP.
  • Le processus de synthèse de parole mis en oeuvre dans un codeur et un décodeur CELP est illustré sur la figure 3. Un générateur d'excitation 10 délivre un code d'excitation ck appartenant à un répertoire prédéterminé en réponse à un index k. Un amplificateur 12 multiplie ce code d'excitation par un gain d'excitation β, et le signal résultant est soumis à un filtre 14 de synthèse à long terme. Le signal de sortie u du filtre 14 est à son tour soumis à un filtre 16 de synthèse à court terme, dont la sortie s constitue ce qu'on considère ici comme le signal de parole synthétique. Ce signal synthétique est appliqué à un post-filtre 17 destiné à améliorer la qualité subjective de la parole reconstruite. Les techniques de post-filtrage sont bien connues dans le domaine du codage de parole (voir J.H. Chen et A. Gersho : "Adaptive postfiltering for quality enhancement of coded speech", IEEE Trans. on Speech and Audio Processing, Vol. 3-1, pages 59-71, janvier 1995). Dans l'exemple représenté, les coefficients du post-filtre 17 sont obtenus à partir des paramètres LPC caractérisant le filtre de synthèse à court terme 16. On comprendra que, comme dans certains décodeurs CELP actuels, le post-filtre 17 pourrait également comporter une composante de post-filtrage à long terme.
  • Les signaux précités sont des signaux numériques représentés par exemple par des mots de 16 bits à une cadence d'échantillonnage Fe égale par exemple à 16 kHz pour un codeur en bande élargie (50-7000 Hz). Les filtres de synthèse 14, 16 sont en général des filtres purement récursifs. Le filtre 14 de synthèse à long terme a typiquement une fonction de transfert de la forme 1/B(z) avec B(z)=1-Gz-T. Le retard T et le gain G constituent des paramètres de prédiction à long terme (LTP) qui sont déterminés d'une manière adaptative par le codeur. Les paramètres LPC définissant le filtre 16 de synthèse à court terme sont déterminés au codeur par un procédé d'analyse par prédiction linéaire du signal de parole. Dans les codeurs et décodeurs CELP habituels, la fonction de transfert du filtre 16 est généralement de la forme 1/A(z) avec A(z) de la forme (1). La présente invention propose d'adopter une forme semblable de la fonction de transfert, dans laquelle A(z) est décomposée selon (7) comme indiqué précédemment. A titre d'exemple, les paramètres des différents étages peuvent être q=2, M1=2, M2=13 (M=M1+M2=15).
  • On désigne ici par "signal d'excitation" le signal u(n) appliqué au filtre de synthèse à court terme 14. Ce signal d'excitation comporte une composante LTP G.u(n-T) et une composante résiduelle, ou séquence d'innovation, βck(n). Dans un codeur à analyse par synthèse, les paramètres caractérisant la composante résiduelle et, optionnellement, la composante LTP sont évalués en boucle fermée, en utilisant un filtre de pondération perceptuelle.
  • La figure 4 montre le schéma d'un codeur CELP. Le signal de parole s(n) est un signal numérique, par exemple fourni par un convertisseur analogique-numérique 20 traitant le signal de sortie amplifié et filtré d'un microphone 22. Le signal s(n) est numérisé en trames successives de Λ échantillons elles-mêmes divisées en sous-trames, ou trames d'excitation, de L échantillons (par exemple Λ=160, L=32).
  • Les paramètres LPC, LTP et EXC (index k et gain d'excitation β) sont obtenus au niveau du codeur par trois modules d'analyse respectifs 24, 26, 28. Ces paramètres sont ensuite quantifiés de façon connue en vue d'une transmission numérique efficace, puis soumis à un multiplexeur 30 qui forme le signal de sortie du codeur. Ces paramètres sont également fournis à un module 32 de calcul d'états initiaux de certains filtres du codeur. Ce module 32 comprend essentiellement une chaîne de décodage telle que celle représentée sur la figure 3. Comme le décodeur, le module 32 opère sur la base des paramètres LPC, LTP et EXC quantifiés. Si une interpolation des paramètres LPC est effectuée au décodeur, comme il est courant, la même interpolation est effectuée par le module 32. Le module 32 permet de connaître au niveau du codeur les états antérieurs des filtres de synthèse 14, 16 du décodeur, déterminés en fonction des paramètres de synthèse et d'excitation antérieurs à la sous-trame considérée.
  • Dans une première étape du processus de codage, le module 24 d'analyse à court terme détermine les paramètres LPC définissant le filtre de synthèse à court terme, en analysant les corrélations à court terme du signal de parole s(n). Cette détermination est effectuée par exemple une fois par trame de Λ échantillons, de manière à s'adapter à l'évolution du contenu spectral du signal de parole. Elle consiste selon l'invention à mettre en oeuvre le procédé d'analyse illustré par la figure 1 avec s0(n)=s(n).
  • L'étape suivante du codage consiste en la détermination des paramètres LTP de prédiction à long terme. Ceux-ci sont par exemple déterminés une fois par sous-trame de L échantillons. Un soustracteur 34 soustrait du signal de parole s(n) la réponse à un signal d'entrée nul du filtre de synthèse à court terme 16. Cette réponse est déterminée par un filtre 36 de fonction de transfert 1/A(z) dont les coefficients sont donnés par les paramètres LPC qui ont été déterminés par le module 24, et dont les états initiaux ŝ sont fournis par le module 32 de façon à correspondre aux M=M1+ ...+Mq derniers échantillons du signal synthétique. Le signal de sortie du soustracteur 34 est soumis à un filtre 38 de pondération perceptuelle dont le rôle est d'accentuer les portions du spectre où les erreurs sont les plus perceptibles, c'est-à-dire les zones inter-formantiques.
  • La fonction de transfert W(z) du filtre de pondération perceptuelle 38 est de la forme W(z)=AN(z)/AP(z) où AN(z) et AP(z) sont des fonctions de transfert d'ordre M de type RIF (réponse impulsionnelle finie). Les coefficients respectifs bi et ci (1≤i≤M) des fonctions AN(z) et AP(z) sont calculés pour chaque trame par un module 39 d'évaluation de la pondération perceptuelle qui les fournit au filtre 38. Une première possibilité est de prendre AN(z)=A(z/γ1) et AP(z)=A(z/γ2) avec 0≤γ2≤γ1≤1, ce qui revient à la forme habituelle (2) avec A(z) de la forme (7). Dans le cas d'un signal en bande élargie avec q=2, M1=2 et M2=13, on a trouvé que le choix γ1=0,92 et γ2=0,6 fournissait de bons résultats.
  • L'invention permet toutefois, avec une surcharge de calculs très faible, d'avoir une plus grande souplesse quant à la mise en forme du bruit de quantification, en adoptant la forme (6) pour W(z), soit :
    Figure imgb0028
    Figure imgb0029
  • Dans le cas d'un signal en bande élargie avec q=2, M1=2 et M2=13, on a trouvé que le choix γ1 1=0,9, γ2 1=0,65, y1 2=0,95 et γ2 2=0,75 fournissait de bons résultats. Le terme A1(z/γ1 1)/A1(z/γ2 1) permet de régler la pente générale du filtre 38, tandis que le terme A2(z/γ1 2)/A2(z/γ2 2) permet de régler le masquage au niveau des formants.
  • L'analyse LTP en boucle fermée effectuée par le module 26 consiste, de façon classique, à sélectionner pour chaque sous-trame le retard T qui maximise la corrélation normalisée:
    Figure imgb0030
    où x'(n) désigne le signal de sortie du filtre 38 pendant la sous-trame considérée, et yT(n) désigne le produit de convolution u(n-T)*h'(n). Dans l'expression ci-dessus, h'(0), h' (1)...,h'(L-1) désigne la réponse impulsionnelle du filtre de synthèse pondéré, de fonction de transfert W(z)/A(z). Cette réponse impulsionnelle h' est obtenue par un module 40 de calcul de réponses impulsionnelles, en fonction des coefficients bi et ci fournis par le module 39 et des paramètres LPC qui ont été déterminés pour la sous-trame, le cas échéant après quantification et interpolation. Les échantillons u(n-T) sont les états antérieurs du filtre 14 de synthèse à long terme, fournis par le module 32. Pour les retards T inférieurs à la longueur d'une sous-trame, les échantillons manquants u(n-T) sont obtenus par interpolation sur la base des échantillons antérieurs, ou à partir du signal de parole. Les retards T, entiers ou fractionnaires, sont sélectionnés dans une fenêtre déterminée. Pour réduire la plage de recherche en boucle fermée, et donc pour réduire le nombre de convolutions yT(n) à calculer, on peut d'abord déterminer un retard T' en boucle ouverte par exemple une fois par trame, puis sélectionner les retards en boucle fermée pour chaque sous-trame dans un intervalle réduit autour de T'. La recherche en boucle ouverte consiste plus simplement à déterminer le retard T' qui maximise l'autocorrélation du signal de parole s(n) éventuellement filtré par le filtre inverse de fonction de transfert A(z). Une fois que le retard T a été déterminé, le gain G de prédiction à long terme est obtenu par :
    Figure imgb0031
  • Pour rechercher l'excitation CELP relative à une sous-trame, le signal GyT(n), qui a été calculé par le module 26 pour le retard optimal T, est d'abord soustrait du signal x'(n) par le soustracteur 42. Le signal résultant x(n) est soumis à un filtre à rebours 44 qui fournit un signal D(n) donné par :
    Figure imgb0032
       où h(0), h(1),..., h(L-1) désigne la réponse impulsionnelle du filtre composé des filtres de synthèse et du filtre de pondération perceptuelle, calculée par le module 40. En d'autres termes, le filtre composé a pour fonction de transfert W(z)/[A(z).B(z)]. En notation matricielle, on a donc : D = (D(0), D(1),..., D(L-1)) = x.H
    Figure imgb0033
    avec x = (x(0), x(1),..., x(L-1))
    Figure imgb0034
       et
    Figure imgb0035
  • Le vecteur D constitue un vecteur-cible pour le module 28 de recherche de l'excitation. Ce module 28 détermine un mot de code du répertoire qui maximise la corrélation normalisée P k 2 k 2 dans laquelle : P k = D.c k T
    Figure imgb0036
    α k 2 = c k .H T .H.c k T = c k . U.c k T
    Figure imgb0037
  • L'indice k optimal ayant été déterminé, le gain d'excitation β est pris égal à β = Pkk2.
  • En référence à la figure 3, le décodeur CELP comprend un démultiplexeur 8 recevant le flux binaire issu du codeur. Les valeurs quantifiées des paramètres d'excitation EXC et des paramètres de synthèse LTP et LPC sont fournies au générateur 10, à l'amplificateur 12 et aux filtres 14, 16 pour reconstituer le signal synthétique ŝ, qui est soumis au post-filtre 17 puis converti en analogique par le convertisseur 18 avant d'être amplifié puis appliqué à un haut-parleur 19 pour restituer la parole originale.
  • Dans le cas du décodeur de la figure 3, les paramètres LPC sont par exemple constitués par des index de quantification des coefficients de réflexion r i p (également appelés coefficients de corrélation partielle ou PARCOR) relatifs aux différents étages de prédiction linéaire. Un module 15 récupère les valeurs quantifiées des r i p à partir des index de quantification, et les convertit pour fournir les q jeux de coefficients de prédiction linéaire. Cette conversion est par exemple effectuée par la même méthode récursive que dans l'algorithme de Levinson-Durbin.
  • Les jeux de coefficients a i p sont fournis au filtre 16 de synthèse à court terme constitué par une succession de q filtres/étages de fonctions de transfert 1/A1(z),..., 1/Aq(z) données par la relation (4). Le filtre 16 pourrait également être en un seul étage de fonction de transfert 1/A(z) donnée par la relation (1) dans laquelle les coefficients ai ont été calculés selon les relations (9) à (13).
  • Les jeux de coefficients a i p sont également fournis au post-filtre 17 qui, dans l'exemple considéré, a une fonction de transfert de la forme H PF ( z ) = G P APN z APP z (1-µ r 1 z -1 )
    Figure imgb0038
    où APN(z) et APP(z) sont des fonctions de transfert d'ordre M de type RIF, GP est un facteur de gain constant, µ est une constante positive et r1 désigne le premier coefficient de réflexion. Le coefficient de réflexion r1 peut être celui associé aux coefficients ai du filtre de synthèse composé, qu'il est alors nécessaire de calculer. On peut également prendre pour r1 le premier coefficient de réflexion du premier étage de prédiction (r 1 =r 1 1 ) moyennant un éventuel ajustement de la constante µ. Pour le terme APN(z)/APP(z), une première possibilité est de prendre APN(z)=A(z/β1) et APP(z)=A(z/β2) avec 0≤β1≤β2≤1, ce qui revient à la forme habituelle (3) avec A(z) de la forme (7).
  • Comme dans le cas du filtre de pondération perceptuelle du codeur, l'invention permet d'adopter des coefficients β1 et β2 différents d'un étage au suivant (formule (8)), soit :
    Figure imgb0039
    Figure imgb0040
  • Dans le cas d'un signal en bande élargie avec q=2, M1=2 et M2=13, on a trouvé que le choix β 1 1 =0,7, β 2 1 =0,9, β 1 2 =0,95 et β 2 2 =0,97 fournissait de bons résultats.
  • L'invention a été décrite ci-dessus dans son application à un codeur prédictif à adaptation "forward", c'est-à-dire dans lequel le signal audiofréquence faisant l'objet de l'analyse par prédiction linéaire est le signal d'entrée du codeur. L'invention s'applique également à des codeurs/décodeurs prédictifs à adaptation "backward", dans lesquels le signal synthétique fait l'objet de l'analyse par prédiction linéaire au codeur et au décodeur (voir J.H. Chen et al: "A Low-Delay CELP Coder for the CCITT 16 kbit/s Speech Coding Standard", IEEE J.SAC, Vol.10, n°5, pages 830-848, juin 1992). Les figures 5 et 6 montrent respectivement un décodeur CELP et un codeur CELP à adaptation "backward" mettant en oeuvre la présente invention. Des références numériques identiques à celles des figures 3 et 4 ont été utilisées pour désigner des éléments analogues.
  • Le décodeur à adaptation "backward" reçoit seulement les valeurs de quantification des paramètres définissant le signal d'excitation u(n) à appliquer au filtre de synthèse à court terme 16. Dans l'exemple considéré, ces paramètres sont l'index k et le gain associé β ainsi que les paramètres LTP. Le signal synthétique ŝ(n) est traité par un module 124 d'analyse par prédiction linéaire multi-étages identique au module 24 de la figure 3. Le module 124 fournit les paramètres LPC au filtre 16 pour une ou plusieurs trames suivantes du signal d'excitation, et au post-filtre 17 dont les coefficients sont obtenus comme décrit précédemment.
  • Le codeur correspondant, représenté sur la figure 6, effectue l'analyse par prédiction linéaire multi-étages sur le signal synthétique généré localement et non sur le signal audio s(n). Il comprend ainsi un décodeur local 132 consistant essentiellement en les éléments notés 10, 12, 14, 16 et 124 du décodeur de la figure 5. Outre les échantillons u du dictionnaire adaptatif et les états initiaux ŝ du filtre 36, le décodeur local 132 fournit les paramètres LPC obtenus par analyse du signal synthétique, qui sont utilisés par le module 39 d'évaluation de la pondération perceptuelle et le module 40 de calcul des réponses impulsionnelles h et h'. Pour le reste, le fonctionnement du codeur est identique à celui du codeur décrit en référence à la figure 4, sauf que le module d'analyse LPC 24 n'est plus nécessaire. Seuls les paramètres EXC et LTP sont envoyés vers le décodeur.
  • Les figures 7 et 8 sont des schémas synoptiques d'un décodeur CELP et d'un codeur CELP à adaptation mixte. Les coefficients de prédiction linéaire du ou des premiers étages résultent d'une analyse "forward" du signal audiofréquence effectuée par le codeur, tandis que les coefficients de prédiction linéaire du ou des derniers étages résultent d'une analyse "backward" du signal synthétique effectuée par le décodeur (et par un décodeur local prévu dans le codeur). Des références numériques identiques à celles des figures 3 à 6 ont été utilisée pour désigner des éléments analogues.
  • Le décodeur mixte illustré sur la figure 7 reçoit les valeurs de quantification des paramètres EXC, LTP définissant le signal d'excitation u(n) à appliquer au filtre de synthèse à court terme 16, et les valeurs de quantification des paramètres LPC/F déterminés par l'analyse "forward" effectuée par le codeur. Ces paramètres LPC/F représentent qF jeux de coefficients de prédiction linéaire a1F,p,..., aMFpF,p pour 1≤p≤qF, et définissent une première composante 1/AF(z) de la fonction de transfert 1/A(z) du filtre 16 :
    Figure imgb0041
  • Pour l'obtention de ces paramètres LPC/F, le codeur mixte représenté sur la figure 8 comporte un module 224/F qui analyse le signal audiofréquence à coder s(n) de la manière décrite en référence à la figure 1 si qF>1, ou en un seul étage si qF=1.
  • L'autre composante 1/AB(z) du filtre de synthèse à court terme 16 de fonction de transfert 1/A(z)=1/[AF(z).AB(z)] est donnée par
    Figure imgb0042
  • Pour déterminer les coefficients aiB,P, le décodeur mixte comporte un filtre inverse 200 de fonction de transfert AF(z) qui filtre le signal synthétique
    Figure imgb0043
    (n) produit par le filtre de synthèse à court terme 16 pour produire un signal synthétique filtré
    Figure imgb0044
    0(n). Un module 224/B effectue l'analyse par prédiction linéaire de ce signal
    Figure imgb0045
    0(n) de la manière décrite en référence à la figure 1 si qB>1, ou en un seul étage si qB=1. Les coefficients LPC/B ainsi obtenus sont fournis au filtre de synthèse 16 pour définir sa seconde composante pour la trame suivante. Ils sont également fournis, de même que les coefficients LPC/F au post-filtre 17, dont les composantes APN(z) et APP(z) sont soit de la forme APN(z)=A(z/β1), APP(z)=A(z/β2), soit de la forme :
    Figure imgb0046
    Figure imgb0047
    les paires de coefficient β 1 F,p , β 2 F,p et β 1 B,p , β 2 B,P étant optimisables séparément avec 0≤β 1 F,p ≤β 2 F,p 1 et 0≤β 1 B , p ≤β 2 B , p 1.
  • Le décodeur local 232 prévu dans le codeur mixte consiste essentiellement en les éléments notés 10, 12, 14, 16, 200 et 224/B du décodeur de la figure 7. Outre les échantillons u du dictionnaire adaptatif et les états initiaux ŝ du filtre 36, le décodeur local 232 fournit les paramètres LPC/B qui sont utilisés, avec les paramètres LPC/F fournis par le module d'analyse 224/F, par le module 39 d'évaluation de la pondération perceptuelle et le module 40 de calcul des réponses impulsionnelles h et h'.
  • La fonction de transfert du filtre de pondération perceptuelle 38 évaluée par le module 39 est soit de la forme W(z)=A(z/γ1)/A(z/γ2), soit de la forme
    Figure imgb0048
    les paires de coefficients γ1F,p, γ2F,p, et γ1B,p, γ2B,p étant optimisables séparément avec 0≤γ2F,p≤γ2F,p≤1 et 0≤γ2B,p≤γ1B,p≤1.
  • Pour le reste, le fonctionnement du codeur mixte est identique à celui du codeur décrit en référence à la figure 4. Seuls les paramètres EXC, LTP et LPC/F sont envoyés vers le décodeur.

Claims (22)

  1. Procédé d'analyse par prédiction linéaire d'un signal audiofréquence (s0(n)), pour déterminer des paramètres spectraux dépendant d'un spectre à court terme du signal audiofréquence, le procédé comprenant q étages de prédiction successifs (5p), q étant un entier supérieur à 1, caractérisé en ce qu'à chaque étage de prédiction p (1≤p≤q), on détermine des paramètres représentant un nombre Mp, prédéfini pour chaque étage p, de coefficients a 1 p ,..., a Mp p de prédiction linéaire d'un signal d'entrée dudit étage, le signal audiofréquence à analyser constituant le signal d'entrée (s0(n)) du premier étage, et le signal d'entrée (sp(n)) d'un étage p+1 étant constitué par le signal d'entrée (sp-1(n)) de l'étage p filtré par un filtre de fonction de transfert
    Figure imgb0049
  2. Procédé d'analyse selon la revendication 1, caractérisé en ce que le nombre Mp de coefficients de prédiction linéaire augmente d'un étage au suivant.
  3. Procédé de codage d'un signal audiofréquence, comprenant les étapes suivantes :
    - analyse par prédiction linéaire du signal audiofréquence (s(n)) numérisé en trames successives pour déterminer des paramètres (LPC) définissant un filtre de synthèse à court terme (16) ;
    - détermination de paramètres d'excitation (k,β,LTP) définissant un signal d'excitation (u(n)) à appliquer au filtre de synthèse à court terme (16) pour produire un signal synthétique (ŝ(n)) représentatif du signal audiofréquence ; et
    - production de valeurs de quantification des paramètres définissant le filtre de synthèse à court terme et des paramètres d'excitation,
       caractérisé en ce que l'analyse par prédiction linéaire est un processus à q étages successifs (5p), q étant un entier supérieur à 1, ledit processus comportant, à chaque étage de prédiction p (1≤p≤q), la détermination de paramètres représentant un nombre Mp, prédéfini pour chaque étage p, de coefficients a 1 p ,..., a Mp p de prédiction linéaire d'un signal d'entrée dudit étage, le signal audiofréquence à coder (s(n)) constituant le signal d'entrée (s0(n)) du premier étage, et le signal d'entrée (sp(n)) d'un étage p+1 étant constitué par le signal d'entrée (sp-1(n)) de l'étage p filtré par un filtre de fonction de transfert
    Figure imgb0050
    le filtre de synthèse à court terme (16) ayant une fonction de transfert de la forme 1/A(z) avec
    Figure imgb0051
  4. Procédé de codage selon la revendication 3, caractérisé en ce que le nombre Mp de coefficients de prédiction linéaire augmente d'un étage au suivant.
  5. Procédé de codage selon la revendication 3 ou 4, caractérisé en ce que certains au moins des paramètres d'excitation sont déterminés en minimisant l'énergie d'un signal d'erreur résultant du filtrage de la différence entre le signal audiofréquence (s(n)) et le signal synthétique (ŝ(n)) par au moins un filtre de pondération perceptuelle (38) dont la fonction de transfert est de la forme W(z)=A(z/γ1)/A(z/γ2) où γ1 et γ2 désignent des coefficients d'expansion spectrale tels que 0≤γ2≤γ1≤ 1.
  6. Procédé de codage selon la revendication 3 ou 4, caractérisé en ce que certains au moins des paramètres d'excitation sont déterminés en minimisant l'énergie d'un signal d'erreur résultant du filtrage de la différence entre le signal audiofréquence (s(n)) et le signal synthétique (ŝ(n)) par au moins un filtre de pondération perceptuelle (38) dont la fonction de transfert est de la forme
    Figure imgb0052
    où γ 1 p , γ 2 p désignent des paires de coefficients d'expansion spectrale tels que 0≤ γ 2 p ≤ γ 1 p 1 pour 1≤p≤q.
  7. Procédé de décodage d'un flux binaire pour construire un signal audiofréquence codé par ledit flux binaire, caractérisé en ce que :
    - on reçoit des valeurs de quantification de paramètres (LPC) définissant un filtre de synthèse à court terme (16) et de paramètres d'excitation (k,β,LTP), les paramètres définissant le filtre de synthèse représentant un nombre q plus grand que 1 de jeux de coefficients de prédiction linéaire (a i p ), chaque jeu p comportant un nombre prédéfini Mp de coefficients ;
    - on produit un signal d'excitation (u(n)) sur la base des valeurs de quantification des paramètres d'excitation ; et
    - on produit un signal audiofréquence synthétique (ŝ(n)) en filtrant le signal d'excitation par un filtre de synthèse (16) ayant une fonction de transfert de la forme 1/A(z) avec
    Figure imgb0053
    où les coefficients a1p,...,aMpp correspondent au p-ième jeu de coefficients de prédiction linéaire pour 1≤p≤q.
  8. Procédé de décodage selon la revendication 7, caractérisé en ce que ledit signal audiofréquence synthétique (ŝ(n)) est appliqué à un post-filtre (17) dont la fonction de transfert (HPF(z)) comporte un terme de la forme A(z/β1)/A(z/β2), où β1 et β2 désignent des coefficients tels que 0≤β1≤β2≤1.
  9. Procédé de décodage selon la revendication 7, caractérisé en ce que ledit signal audiofréquence synthétique (ŝ(n)) est appliqué à un post-filtre (17) dont la fonction de transfert (HPF(z)) comporte un terme de la forme
    Figure imgb0054
    où β 1 p , β 2 p désignent des paires de coefficients tels que 0≤β 1 p ≤β 2 p 1 pour 1≤p≤q, et Ap(z) représente, pour le p-ième jeu de coefficients de prédiction linéaire, la fonction
    Figure imgb0055
  10. Procédé de codage d'un premier signal audiofréquence numérisé en trames successives, comprenant les étapes suivantes :
    - analyse par prédiction linéaire d'un second signal audiofréquence (ŝ(n)) pour déterminer des paramètres (LPC) définissant un filtre de synthèse à court terme (16) ;
    - détermination de paramètres d'excitation (k,β,LTP) définissant un signal d'excitation (u(n)) à appliquer au filtre de synthèse à court terme (16) pour produire un signal synthétique (ŝ(n)) représentatif du premier signal audiofréquence, ce signal synthétique constituant ledit second signal audiofréquence pour au moins une trame suivante ; et
    - production de valeurs de quantification des paramètres d'excitation,
       caractérisé en ce que l'analyse par prédiction linéaire est un processus à q étages successifs (5p), q étant un entier supérieur à 1, ledit processus comportant, à chaque étage de prédiction p (1≤p≤q), la détermination de paramètres représentant un nombre Mp, prédéfini pour chaque étage p, de coefficients a 1 p ,...,a Mp P de prédiction linéaire d'un signal d'entrée dudit étage, le second signal audiofréquence (ŝ(n)) constituant le signal d'entrée (s0(n)) du premier étage, et le signal d'entrée (sp(n)) d'un étage p+1 étant constitué par le signal d'entrée (sp-1(n)) de l'étage p filtré par un filtre de fonction de transfert
    Figure imgb0056
    le filtre de synthèse à court terme (16) ayant une fonction de transfert de la forme 1/A(z) avec
    Figure imgb0057
  11. Procédé de codage selon la revendication 10, caractérisé en ce que le nombre Mp de coefficients de prédiction linéaire augmente d'un étage au suivant.
  12. Procédé de codage selon la revendication 10 ou 11, caractérisé en ce que certains au moins des paramètres d'excitation sont déterminés en minimisant l'énergie d'un signal d'erreur résultant du filtrage de la différence entre le premier signal audiofréquence (s(n)) et le signal synthétique (ŝ(n)) par au moins un filtre de pondération perceptuelle (38) dont la fonction de transfert est de la forme W(z)=A(z/γ1)/A(z/γ2) où γ1 et γ2 désignent des coefficients d'expansion spectrale tels que 0≤γ2≤γ1≤ 1.
  13. Procédé de codage selon la revendication 10 ou 11, caractérisé en ce que certains au moins des paramètres d'excitation sont déterminés en minimisant l'énergie d'un signal d'erreur résultant du filtrage de la différence entre le premier signal audiofréquence (s(n)) et le signal synthétique (ŝ(n)) par au moins un filtre de pondération perceptuelle (38) dont la fonction de transfert est de la forme
    Figure imgb0058
    où γ 1 p , γ 2 p désignent des paires de coefficients d'expansion spectrale tels que 0≤ γ 2 p ≤ γ 1 p 1 pour 1≤p≤q.
  14. Procédé de décodage d'un flux binaire pour construire en trames successives un signal audiofréquence codé par ledit flux binaire, caractérisé en ce que :
    - on reçoit des valeurs de quantification de paramètres d'excitation (k,β,LTP) ;
    - on produit un signal d'excitation (u(n)) sur la base des valeurs de quantification des paramètres d'excitation ;
    - on produit un signal audiofréquence synthétique (ŝ(n)) en filtrant le signal d'excitation par un filtre de synthèse à court terme (16) ;
    - on effectue une analyse par prédiction linéaire du signal synthétique (ŝ(n)) pour obtenir des coefficients du filtre de synthèse à court terme (16) pour au moins une trame suivante,
       et en ce que l'analyse par prédiction linéaire est un processus à q étages successifs (5p), q étant un entier supérieur à 1, ledit processus comportant, à chaque étage de prédiction p (1≤p≤q), la détermination de paramètres représentant un nombre Mp, prédéfini pour chaque étage p, de coefficients a1p,...,aMpp de prédiction linéaire d'un signal d'entrée dudit étage, le signal synthétique (ŝ(n)) constituant le signal d'entrée (s0(n)) du premier étage, et le signal d'entrée (sp(n)) d'un étage p+1 étant constitué par le signal d'entrée (sp-1(n)) de l'étage p filtré par un filtre de fonction de transfert
    Figure imgb0059
    le filtre de synthèse à court terme (16) ayant une fonction de transfert de la forme 1/A(z) avec
    Figure imgb0060
  15. Procédé de décodage selon la revendication 14, caractérisé en ce que ledit signal audiofréquence synthétique (ŝ(n)) est appliqué à un post-filtre (17) dont la fonction de transfert (HPF(z)) comporte un terme de la forme A(z/β1)/A(z/β2), où β1 et β2 désignent des coefficients tels que 0≤β1≤β2≤1.
  16. Procédé de décodage selon la revendication 14, caractérisé en ce que ledit signal audiofréquence synthétique (ŝ(n)) est appliqué à un post-filtre (17) dont la fonction de transfert (HPF(z)) comporte un terme de la forme
    Figure imgb0061
    où β 1 p , β 2 p désignent des paires de coefficients tels que 0≤ β 1 p ≤ β 2 p 1 pour 1≤p≤q.
  17. Procédé de codage d'un premier signal audiofréquence numérisé en trames successives, caractérisé en ce qu'il comprend les étapes suivantes :
    - analyse par prédiction linéaire du premier signal audiofréquence (s(n)) pour déterminer des paramètres (LPC/F) définissant une première composante d'un filtre de synthèse à court terme (16) ;
    - détermination de paramètres d'excitation (k,β,LTP) définissant un signal d'excitation (u(n)) à appliquer au filtre de synthèse à court terme (16) pour produire un signal synthétique (ŝ(n)) représentatif du premier signal audiofréquence ;
    - production de valeurs de quantification des paramètres définissant la première composante du filtre de synthèse à court terme et des paramètres d'excitation ;
    - filtrage du signal synthétique (ŝ(n)) par un filtre de fonction de transfert correspondant à l'inverse de la fonction de transfert de la première composante du filtre de synthèse à court terme ; et
    - analyse par prédiction linéaire du signal synthétique filtré ((ŝ0(n)) pour obtenir des coefficients d'une seconde composante du filtre de synthèse à court terme pour au moins une trame suivante,
       en ce que l'analyse par prédiction linéaire du premier signal audiofréquence (s(n)) est un processus à qF étages successifs (5p), qF étant un entier au moins égal à 1, ledit processus à qF étages comportant, à chaque étage de prédiction p (1≤p≤qF), la détermination de paramètres représentant un nombre MFp, prédéfini pour chaque étage p, de coefficients a 1 F,p ,...,a MFp F , p de prédiction linéaire d'un signal d'entrée dudit étage, le premier signal audiofréquence (s(n)) constituant le signal d'entrée (s0(n)) du premier étage du processus à qF étages, et le signal d'entrée (sp(n)) d'un étage p+1 du processus à qF étages étant constitué par le signal d'entrée (sp-1(n)) de l'étage p du processus à qF étages filtré par un filtre de fonction de transfert
    Figure imgb0062
    la première composante du filtre de synthèse à court terme (16) ayant une fonction de transfert de la forme 1/AF(z) avec
    Figure imgb0063
       et en ce que l'analyse par prédiction linéaire du signal synthétique filtré est un processus à qB étages successifs (5p), qB étant un entier au moins égal à 1, ledit processus à qB étages comportant, à chaque étage de prédiction p (1≤p≤qB), la détermination de paramètres représentant un nombre MBp, prédéfini pour chaque étage p, de coefficients a 1 B,p ,...,a MBp B , p de prédiction linéaire d'un signal d'entrée dudit étage, le signal synthétique filtré (ŝ0(n)) constituant le signal d'entrée (s0(n)) du premier étage du processus à qB étages, et le signal d'entrée (sp(n)) d'un étage p+1 du processus à qB étages étant constitué par le signal d'entrée (sp-1(n)) de l'étage p du processus à qB étages filtré par un filtre de fonction de transfert
    Figure imgb0064
    la seconde composante du filtre de synthèse à court terme (16) ayant une fonction de transfert de la forme 1/AB(z) avec
    Figure imgb0065
    et le filtre de synthèse à court terme (16) ayant une fonction de transfert de la forme 1/A(z) avec A(z)=AF(z).AB(z).
  18. Procédé de codage selon la revendication 17, caractérisé en ce que certains au moins des paramètres d'excitation sont déterminés en minimisant l'énergie d'un signal d'erreur résultant du filtrage de la différence entre le premier signal audiofréquence (s(n)) et le signal synthétique (ŝ(n)) par au moins un filtre de pondération perceptuelle (38) dont la fonction de transfert est de la forme W(z)=A(z/γ1)/A(z/γ2) où γ1 et γ2 désignent des coefficients d'expansion spectrale tels que 0≤γ2≤γ1≤ 1.
  19. Procédé de codage selon la revendication 17, caractérisé en ce que certains au moins des paramètres d'excitation sont déterminés en minimisant l'énergie d'un signal d'erreur résultant du filtrage de la différence entre le premier signal audiofréquence (s(n)) et le signal synthétique (ŝ(n)) par au moins un filtre de pondération perceptuelle (38) dont la fonction de transfert est de la forme
    Figure imgb0066
    où γ 1 F,p , γ 2 F,p désignent des paires de coefficients d'expansion spectrale tels que 0≤ γ2 F,p ≤ γ 1 F,p 1 pour 1≤p≤qF, et γ 1 B,p , γ 2 B, p désignent des paires de coefficients d'expansion spectrale tels que 0≤ γ 2 B, p≤ γ 1 B, p1 pour 1≤p≤qB.
  20. Procédé de décodage d'un flux binaire pour construire en trames successives un signal audiofréquence codé par ledit flux binaire, caractérisé en ce que :
    - on reçoit des valeurs de quantification de paramètres (LPC/F) définissant une première composante d'un filtre de synthèse à court terme (16) et de paramètres d'excitation (k,β,LTP), les paramètres définissant la première composante du filtre de synthèse à court terme représentant un nombre qF au moins égal à 1 de jeux de coefficients de prédiction linéaire a 1 F,p ,...,a MFp F,p pour 1≤p≤qF, chaque jeu p comportant un nombre prédéfini MFp de coefficients, la première composante du filtre de synthèse à court terme (16) ayant une fonction de transfert de la forme 1/AF(z) avec
    Figure imgb0067
    - on produit un signal d'excitation (u(n)) sur la base des valeurs de quantification des paramètres d'excitation ;
    - on produit un signal audiofréquence synthétique (ŝ(n)) en filtrant le signal d'excitation par un filtre de synthèse à court terme (16) de fonction de transfert 1/A(z) avec A(z)=AF(z).AB(z), 1/AB(z) représentant la fonction de transfert d'une seconde composante du filtre de synthèse à court terme (16) ;
    - on filtre le signal synthetique (ŝ(n)) par un filtre de fonction de transfert AF(z) ; et
    - on effectue une analyse par prédiction linéaire du signal synthétique filtré (ŝ0(n)) pour obtenir des coefficients de la seconde composante du filtre de synthèse à court terme (16) pour au moins une trame suivante,
       et en ce que l'analyse par prédiction linéaire du signal synthétique filtré est un processus à qB étages successifs (5p), qB étant un entier au moins égal à 1, ledit processus comportant, à chaque étage de prédiction p (1≤p≤qB), la détermination de paramètres représentant un nombre MBp, prédéfini pour chaque étage p, de coefficients a1 B,p,...,aMBpB,p de prédiction linéaire d'un signal d'entrée dudit étage, le signal synthétique filtré (ŝ0(n)) constituant le signal d'entrée (s0(n)) du premier étage, et le signal d'entrée (sp(n)) d'un étage p+1 étant constitué par le signal d'entrée (sp-1(n)) de l'étage p filtré par un filtre de fonction de transfert
    Figure imgb0068
    la seconde composante du filtre de synthèse à court terme (16) ayant une fonction de transfert de la forme 1/AB(z) avec
    Figure imgb0069
  21. Procédé de décodage selon la revendication 20, caractérisé en ce que ledit signal audiofréquence synthétique (ŝ(n)) est appliqué à un post-filtre (17) dont la fonction de transfert (HPF(z)) comporte un terme de la forme A(z/β1)/A(z/β2), où β1 et β2 désignent des coefficients tels que 0≤β1≤β2≤1.
  22. Procédé de décodage selon la revendication 20, caractérisé en ce que ledit signal audiofréquence synthétique (ŝ(n)) est appliqué à un post-filtre (17) dont la fonction de transfert (HPF(z)) comporte un terme de la forme
    Figure imgb0070
    où β 1 F,p , β 2 F,p désignent des paires de coefficients tels que 0≤β 1 F,p ≤β 2 F,p 1 pour 1≤p≤qF, et β 1 B,p , β 2 B,p désignent des paires de coefficients tels que 0≤β 1 B,p ≤β 2 B,p ≤1 pour 1≤p≤qB.
EP96402715A 1995-12-15 1996-12-12 Procédé d'analyse par prédiction linéaire d'un signal audiofréquence, et procédés de codage et de décodage d'un signal audiofréquence en comportant application Expired - Lifetime EP0782128B1 (fr)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR9514925 1995-12-15
FR9514925A FR2742568B1 (fr) 1995-12-15 1995-12-15 Procede d'analyse par prediction lineaire d'un signal audiofrequence, et procedes de codage et de decodage d'un signal audiofrequence en comportant application

Publications (2)

Publication Number Publication Date
EP0782128A1 true EP0782128A1 (fr) 1997-07-02
EP0782128B1 EP0782128B1 (fr) 2000-06-21

Family

ID=9485565

Family Applications (1)

Application Number Title Priority Date Filing Date
EP96402715A Expired - Lifetime EP0782128B1 (fr) 1995-12-15 1996-12-12 Procédé d'analyse par prédiction linéaire d'un signal audiofréquence, et procédés de codage et de décodage d'un signal audiofréquence en comportant application

Country Status (7)

Country Link
US (1) US5787390A (fr)
EP (1) EP0782128B1 (fr)
JP (1) JP3678519B2 (fr)
KR (1) KR100421226B1 (fr)
CN (1) CN1159691A (fr)
DE (1) DE69608947T2 (fr)
FR (1) FR2742568B1 (fr)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0867862A2 (fr) * 1997-03-26 1998-09-30 Nec Corporation Système de codage et décodage de la parole et de sons musicaux
US8027242B2 (en) 2005-10-21 2011-09-27 Qualcomm Incorporated Signal coding and decoding based on spectral dynamics
US8392176B2 (en) 2006-04-10 2013-03-05 Qualcomm Incorporated Processing of excitation in audio coding and decoding
US8428957B2 (en) 2007-08-24 2013-04-23 Qualcomm Incorporated Spectral noise shaping in audio coding based on spectral dynamics in frequency sub-bands

Families Citing this family (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5621852A (en) 1993-12-14 1997-04-15 Interdigital Technology Corporation Efficient codebook structure for code excited linear prediction coding
FR2729247A1 (fr) * 1995-01-06 1996-07-12 Matra Communication Procede de codage de parole a analyse par synthese
FR2729246A1 (fr) * 1995-01-06 1996-07-12 Matra Communication Procede de codage de parole a analyse par synthese
JPH10124088A (ja) * 1996-10-24 1998-05-15 Sony Corp 音声帯域幅拡張装置及び方法
FI973873A (fi) * 1997-10-02 1999-04-03 Nokia Mobile Phones Ltd Puhekoodaus
FR2774827B1 (fr) 1998-02-06 2000-04-14 France Telecom Procede de decodage d'un flux binaire representatif d'un signal audio
US6223157B1 (en) * 1998-05-07 2001-04-24 Dsc Telecom, L.P. Method for direct recognition of encoded speech data
US6148283A (en) * 1998-09-23 2000-11-14 Qualcomm Inc. Method and apparatus using multi-path multi-stage vector quantizer
US6778953B1 (en) * 2000-06-02 2004-08-17 Agere Systems Inc. Method and apparatus for representing masked thresholds in a perceptual audio coder
KR100865860B1 (ko) * 2000-11-09 2008-10-29 코닌클리케 필립스 일렉트로닉스 엔.브이. 보다 높은 지각의 품질을 위한 전화 음성의 광대역 확장
KR100852610B1 (ko) 2000-12-06 2008-08-18 코닌클리케 필립스 일렉트로닉스 엔.브이. 필터 장치들 및 방법들
WO2002067246A1 (fr) * 2001-02-16 2002-08-29 Centre For Signal Processing, Nanyang Technological University Procede de determination des coefficients de prediction lineaire optimale
US6590972B1 (en) * 2001-03-15 2003-07-08 3Com Corporation DTMF detection based on LPC coefficients
US7062429B2 (en) * 2001-09-07 2006-06-13 Agere Systems Inc. Distortion-based method and apparatus for buffer control in a communication system
US6934677B2 (en) 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
US7240001B2 (en) * 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US20030216921A1 (en) * 2002-05-16 2003-11-20 Jianghua Bao Method and system for limited domain text to speech (TTS) processing
EP1383109A1 (fr) * 2002-07-17 2004-01-21 STMicroelectronics N.V. Procédé et dispositif d'encodage de la parole à bande élargie
US7299190B2 (en) * 2002-09-04 2007-11-20 Microsoft Corporation Quantization and inverse quantization for audio
JP4676140B2 (ja) * 2002-09-04 2011-04-27 マイクロソフト コーポレーション オーディオの量子化および逆量子化
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
US7254533B1 (en) * 2002-10-17 2007-08-07 Dilithium Networks Pty Ltd. Method and apparatus for a thin CELP voice codec
US20040260540A1 (en) * 2003-06-20 2004-12-23 Tong Zhang System and method for spectrogram analysis of an audio signal
US7539612B2 (en) * 2005-07-15 2009-05-26 Microsoft Corporation Coding and decoding scale factor information
US8417185B2 (en) * 2005-12-16 2013-04-09 Vocollect, Inc. Wireless headset and method for robust voice data communication
US7885419B2 (en) * 2006-02-06 2011-02-08 Vocollect, Inc. Headset terminal with speech functionality
US7773767B2 (en) 2006-02-06 2010-08-10 Vocollect, Inc. Headset terminal with rear stability strap
CN101114415B (zh) * 2006-07-25 2011-01-12 元太科技工业股份有限公司 双稳态显示器的驱动装置及其方法
EP2063418A4 (fr) * 2006-09-15 2010-12-15 Panasonic Corp Dispositif de codage audio et procédé de codage audio
CN101536311B (zh) 2007-01-25 2012-09-26 夏普株式会社 脉冲输出电路、使用该脉冲输出电路的显示装置的驱动电路、显示装置及脉冲输出方法
TWI346465B (en) * 2007-09-04 2011-08-01 Univ Nat Central Configurable common filterbank processor applicable for various audio video standards and processing method thereof
USD605629S1 (en) 2008-09-29 2009-12-08 Vocollect, Inc. Headset
FR2938688A1 (fr) 2008-11-18 2010-05-21 France Telecom Codage avec mise en forme du bruit dans un codeur hierarchique
CN102067211B (zh) * 2009-03-11 2013-04-17 华为技术有限公司 一种线性预测分析方法、装置及系统
US8160287B2 (en) 2009-05-22 2012-04-17 Vocollect, Inc. Headset with adjustable headband
US8438659B2 (en) 2009-11-05 2013-05-07 Vocollect, Inc. Portable computing device and headset interface
CN102812512B (zh) * 2010-03-23 2014-06-25 Lg电子株式会社 处理音频信号的方法和装置
KR101257776B1 (ko) * 2011-10-06 2013-04-24 단국대학교 산학협력단 상태-체크 코드를 이용한 부호화 방법 및 부호화 장치
CN102638846B (zh) * 2012-03-28 2015-08-19 浙江大学 一种基于最优量化策略的wsn通信负载降低方法
CN110299146B (zh) * 2014-01-24 2023-03-24 日本电信电话株式会社 线性预测分析装置、方法以及记录介质
EP3462453B1 (fr) * 2014-01-24 2020-05-13 Nippon Telegraph and Telephone Corporation Appareil d'analyse prédictive linéaire, procédé, programme et support d'enregistrement
US9626983B2 (en) * 2014-06-26 2017-04-18 Qualcomm Incorporated Temporal gain adjustment based on high-band signal characteristic
CN107852511B (zh) * 2015-07-16 2020-09-22 杜比实验室特许公司 用于hdr和宽色域信号的信号整形和编码

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2284946A1 (fr) * 1974-09-13 1976-04-09 Int Standard Electric Corp Vocodeur numerique
WO1983002346A1 (fr) * 1981-12-22 1983-07-07 Motorola Inc Filtre numerique d'ordre n a multiplexage temporel
US5142581A (en) * 1988-12-09 1992-08-25 Oki Electric Industry Co., Ltd. Multi-stage linear predictive analysis circuit

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA1245363A (fr) * 1985-03-20 1988-11-22 Tetsu Taguchi Vocodeur a reconnaissance de formes
US4868867A (en) * 1987-04-06 1989-09-19 Voicecraft Inc. Vector excitation speech or audio coder for transmission or storage
GB2235354A (en) * 1989-08-16 1991-02-27 Philips Electronic Associated Speech coding/encoding using celp
US5307441A (en) * 1989-11-29 1994-04-26 Comsat Corporation Wear-toll quality 4.8 kbps speech codec
FI98104C (fi) * 1991-05-20 1997-04-10 Nokia Mobile Phones Ltd Menetelmä herätevektorin generoimiseksi ja digitaalinen puhekooderi
IT1257065B (it) * 1992-07-31 1996-01-05 Sip Codificatore a basso ritardo per segnali audio, utilizzante tecniche di analisi per sintesi.
US5706395A (en) * 1995-04-19 1998-01-06 Texas Instruments Incorporated Adaptive weiner filtering using a dynamic suppression factor
US5692101A (en) * 1995-11-20 1997-11-25 Motorola, Inc. Speech coding method and apparatus using mean squared error modifier for selected speech coder parameters using VSELP techniques

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2284946A1 (fr) * 1974-09-13 1976-04-09 Int Standard Electric Corp Vocodeur numerique
WO1983002346A1 (fr) * 1981-12-22 1983-07-07 Motorola Inc Filtre numerique d'ordre n a multiplexage temporel
US5142581A (en) * 1988-12-09 1992-08-25 Oki Electric Industry Co., Ltd. Multi-stage linear predictive analysis circuit

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
KWOK-WAH LAW ET AL: "A novel split residual vector quantization scheme for low bit rate speech coding", ICASSP-94. IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (CAT. NO.94CH3387-8), PROCEEDINGS OF ICASSP '94. IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING, ADELAIDE, SA, AUSTRALIA, 19-22 APRIL 1994, ISBN 0-7803-1775-0, 1994, NEW YORK, NY, USA, IEEE, USA, pages I/493 - 496 VOL., XP002013349 *
ORDENTLICH E ET AL: "LOW-DELAY CODE-EXCITED LINEAR-PREDICTIVE CODING OF WIDEBAND SPEECH AT 32 KBPS", SPEECH PROCESSING 1, TORONTO, MAY 14 - 17, 1991, vol. 1, 14 May 1991 (1991-05-14), INSTITUTE OF ELECTRICAL AND ELECTRONICS ENGINEERS, pages 9 - 12, XP000245155 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0867862A2 (fr) * 1997-03-26 1998-09-30 Nec Corporation Système de codage et décodage de la parole et de sons musicaux
EP0867862A3 (fr) * 1997-03-26 1999-06-09 Nec Corporation Système de codage et décodage de la parole et de sons musicaux
US6101464A (en) * 1997-03-26 2000-08-08 Nec Corporation Coding and decoding system for speech and musical sound
US8027242B2 (en) 2005-10-21 2011-09-27 Qualcomm Incorporated Signal coding and decoding based on spectral dynamics
US8392176B2 (en) 2006-04-10 2013-03-05 Qualcomm Incorporated Processing of excitation in audio coding and decoding
US8428957B2 (en) 2007-08-24 2013-04-23 Qualcomm Incorporated Spectral noise shaping in audio coding based on spectral dynamics in frequency sub-bands

Also Published As

Publication number Publication date
CN1159691A (zh) 1997-09-17
FR2742568B1 (fr) 1998-02-13
EP0782128B1 (fr) 2000-06-21
FR2742568A1 (fr) 1997-06-20
JP3678519B2 (ja) 2005-08-03
DE69608947T2 (de) 2001-02-01
KR970050107A (ko) 1997-07-29
KR100421226B1 (ko) 2004-07-19
DE69608947D1 (de) 2000-07-27
US5787390A (en) 1998-07-28
JPH09212199A (ja) 1997-08-15

Similar Documents

Publication Publication Date Title
EP0782128B1 (fr) Procédé d&#39;analyse par prédiction linéaire d&#39;un signal audiofréquence, et procédés de codage et de décodage d&#39;un signal audiofréquence en comportant application
US5845244A (en) Adapting noise masking level in analysis-by-synthesis employing perceptual weighting
EP1692689B1 (fr) Procede de codage multiple optimise
EP0801790B1 (fr) Procede de codage de parole a analyse par synthese
JP3357795B2 (ja) 音声符号化方法および装置
EP0801788A1 (fr) Procede de codage de parole a analyse par synthese
EP0801789A1 (fr) Procede de codage de parole a analyse par synthese
EP0616315A1 (fr) Dispositif de codage et de décodage numérique de la parole, procédé d&#39;exploration d&#39;un dictionnaire pseudo-logarithmique de délais LTP, et procédé d&#39;analyse LTP
EP2171713B1 (fr) Codage de signaux audionumériques
FR2783651A1 (fr) Dispositif et procede de filtrage d&#39;un signal de parole, recepteur et systeme de communications telephonique
EP1192619B1 (fr) Codage et decodage audio par interpolation
EP1192618B1 (fr) Codage audio avec liftrage adaptif
EP1192621B1 (fr) Codage audio avec composants harmoniques
EP1194923B1 (fr) Procedes et dispositifs d&#39;analyse et de synthese audio
WO2001003121A1 (fr) Codage et decodage audio avec composants harmoniques et phase minimale
EP0454552A2 (fr) ProcédÀ© et dispositif de codage bas débit de la parole
EP1192620A1 (fr) Codage et decodage audio incluant des composantes non harmoniques du signal
Ramachandran et al. Combined vector and scalar codebook for robust quantization of linear predictive coefficients (LPC) parameters
WO2013135997A1 (fr) Modification des caractéristiques spectrales d&#39;un filtre de prédiction linéaire d&#39;un signal audionumérique représenté par ses coefficients lsf ou isf
WO2002029786A1 (fr) Procede et dispositif de codage segmental d&#39;un signal audio
FR2737360A1 (fr) Procedes de codage et de decodage de signaux audiofrequence, codeur et decodeur pour la mise en oeuvre de tels procedes
FR2980620A1 (fr) Traitement d&#39;amelioration de la qualite des signaux audiofrequences decodes

Legal Events

Date Code Title Description
PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

Free format text: ORIGINAL CODE: 0009012

AK Designated contracting states

Kind code of ref document: A1

Designated state(s): DE GB IT

17P Request for examination filed

Effective date: 19970726

17Q First examination report despatched

Effective date: 19990511

GRAG Despatch of communication of intention to grant

Free format text: ORIGINAL CODE: EPIDOS AGRA

GRAG Despatch of communication of intention to grant

Free format text: ORIGINAL CODE: EPIDOS AGRA

GRAH Despatch of communication of intention to grant a patent

Free format text: ORIGINAL CODE: EPIDOS IGRA

RIC1 Information provided on ipc code assigned before grant

Free format text: 7G 10L 19/06 A

GRAH Despatch of communication of intention to grant a patent

Free format text: ORIGINAL CODE: EPIDOS IGRA

GRAA (expected) grant

Free format text: ORIGINAL CODE: 0009210

AK Designated contracting states

Kind code of ref document: B1

Designated state(s): DE GB IT

REF Corresponds to:

Ref document number: 69608947

Country of ref document: DE

Date of ref document: 20000727

ITF It: translation for a ep patent filed

Owner name: BARZANO' E ZANARDO MILANO S.P.A.

GBT Gb: translation of ep patent filed (gb section 77(6)(a)/1977)

Effective date: 20000821

PLBE No opposition filed within time limit

Free format text: ORIGINAL CODE: 0009261

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: NO OPPOSITION FILED WITHIN TIME LIMIT

26N No opposition filed
REG Reference to a national code

Ref country code: GB

Ref legal event code: IF02

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: IT

Payment date: 20151120

Year of fee payment: 20

Ref country code: DE

Payment date: 20151119

Year of fee payment: 20

Ref country code: GB

Payment date: 20151125

Year of fee payment: 20

REG Reference to a national code

Ref country code: DE

Ref legal event code: R082

Ref document number: 69608947

Country of ref document: DE

Representative=s name: WEICKMANN & WEICKMANN PATENTANWAELTE - RECHTSA, DE

Ref country code: DE

Ref legal event code: R081

Ref document number: 69608947

Country of ref document: DE

Owner name: 3G LICENSING S.A., LU

Free format text: FORMER OWNER: FRANCE TELECOM, S.A., PARIS, FR

Ref country code: DE

Ref legal event code: R081

Ref document number: 69608947

Country of ref document: DE

Owner name: ORANGE, FR

Free format text: FORMER OWNER: FRANCE TELECOM, S.A., PARIS, FR

REG Reference to a national code

Ref country code: DE

Ref legal event code: R082

Ref document number: 69608947

Country of ref document: DE

Representative=s name: WEICKMANN & WEICKMANN PATENTANWAELTE - RECHTSA, DE

Ref country code: DE

Ref legal event code: R081

Ref document number: 69608947

Country of ref document: DE

Owner name: 3G LICENSING S.A., LU

Free format text: FORMER OWNER: ORANGE, PARIS, FR

REG Reference to a national code

Ref country code: DE

Ref legal event code: R071

Ref document number: 69608947

Country of ref document: DE

REG Reference to a national code

Ref country code: GB

Ref legal event code: PE20

Expiry date: 20161211

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: GB

Free format text: LAPSE BECAUSE OF EXPIRATION OF PROTECTION

Effective date: 20161211