FR2759510A1 - Methode de codage audio et dispositif - Google Patents

Methode de codage audio et dispositif Download PDF

Info

Publication number
FR2759510A1
FR2759510A1 FR9801430A FR9801430A FR2759510A1 FR 2759510 A1 FR2759510 A1 FR 2759510A1 FR 9801430 A FR9801430 A FR 9801430A FR 9801430 A FR9801430 A FR 9801430A FR 2759510 A1 FR2759510 A1 FR 2759510A1
Authority
FR
France
Prior art keywords
spectral
value
values
signal
coefficients
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
FR9801430A
Other languages
English (en)
Inventor
Lin Yin
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nokia Oyj
Original Assignee
Nokia Mobile Phones Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Mobile Phones Ltd filed Critical Nokia Mobile Phones Ltd
Publication of FR2759510A1 publication Critical patent/FR2759510A1/fr
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients

Abstract

Un procédé de codage d'un signal électrique audio utilisant une prévision'adaptative retardée. Une première trame de temps du signal électrique audio devant être codée est reçue et transformée dans le domaine de fréquence en utilisant une transformée cosinus discrète modifiée (MDCT) . Le spectre de fréquence résultant comporte 1024 composantes spectrales. Les trames de temps suivantes du signal électrique audio sont alors reçues et la MDCT est appliquée à chacune tour à tour afin de générer un flux de valeurs de données spectrales pour chaque composante spectrale. Pour chaque flux, un ensemble de coefficient de prévision est calculé pour chaque valeur spectrale utilisant un nombre prédéterminé de valeur spectrale constitutive reçue précédemment du flux. En utilisant l'ensemble de coefficient de prévision linéaire, une valeur spectrale prédite est générée et l'erreur entre la valeur spectrale prédite et la valeur spectrale réelle correspondante est calculée. Les erreurs calculées fournissent une représentation codée du flux de valeur spectrale.

Description

I
METHODE DE CODAGE AUDIO ET DISPOSITIF
La présente invention concerne une méthode de codage et de décodage. de signaux électroniques et un dispositif pour mettre en oeuvre une telle méthode. Il est bien connu que la transmission de données sous forme numérique fournit des rapports signal sur bruit meilleurs et une capacité d'information plus grande le long du canal de transmission. Cependant, il est souhaitable d'augmenter encore plus la capacité de canal en compressant des signaux numériques. En ce qui concerne les signaux audio, deux principes de compression de base sont appliqués de façon conventionnelle. Le premier de ceux-ci consiste à éliminer les redondances déterministes ou statistiques dans le signal source tandis que le second principe consiste à supprimer ou éliminer du signal source des éléments qui sont redondants dans la mesure o la perception humaine est concernée. Récemment, le dernier principe est devenu prédominant dans des applications audio de haute qualité et concerne typiquement la séparation d'un signal audio en
composantes de fréquence (des fois appelée "sous-
bandes"), chacune d'elles est analysée et quantifiée avec une précision de quantification déterminée pour éliminer les données non pertinentes (pour l'auditeur). Le standard de codage audio ISO (International Standards Organisation) MPEG (Moving Pictures Expert Group) et d'autres standards de codage audio utilisent et définissent un peu plus ce principe. Cependant, MPEG (et d'autres standards) utilisent aussi une technique connue comme "prévision adaptative" pour produire une nouvelle
réduction dans le débit de données.
Une forme particulière de prévisions adaptatives est connue comme "prévision matricielle adaptative retardée". Le document intitulé "Improving MPEG Audio Coding by Backward Adaptative Linear Stereo Prediction", Convention AES, New York 4086, Octobre 1995 de Fuchs et al., décrit un tel algorithme de prévision matricielle adaptative retardée. Pour chaque valeur de spectre (la "valeur courante") de chaque composante de fréquence, la prévision matricielle adaptative retardée génère un ensemble de coefficients de prévision dans l'encodeur à partir des valeurs de spectre calculée précédemment de cette composante (via le calcul intermédiaire des valeurs spectrales quantifiées). Ces coefficients sont ensuite utilisés pour prévoir la valeur de la valeur spectrale courante. L'erreur entre la valeur spectrale courante et la valeur spectrale prédite est déterminée et c'est cette valeur d'erreur (après quantification) qui est transmise au récepteur. On appréciera qu'à tout instant, les coefficients de prévision courante ont effectivement été déduits de toutes les valeurs échantillonnées reçues précédemment. Au niveau du récepteur, les coefficients sont calculés de façon similaire et les valeurs spectrales reconstituées sont obtenues en combinant les valeurs spectrales prédites avec les valeurs d'erreur reçues. Dans certains algorithmes employant la prévision adaptative retardée, il arrive souvent qu'une mesure de la compression effectuée est déterminée durant le procédé de compression et les valeurs d'erreur envoyées seulement si le gain de compression positif est obtenu. Sinon, les signaux de composantes de fréquence quantifiées réelles
sont transmis à la place.
Le nouveau standard MPEG-2 AAC utilise un modèle psycho-acoustique et une prévision linéaire adaptative retardée avec 1024 composantes de fréquence. Il est envisagé que le nouveau standard MPEG-4 VM ait des exigences similaires. Cependant, un tel nombre de composantes de fréquence a pour conséquence une grande charge opérationnelle de calcul du fait de la complexité de l'algorithme de prévision et nécessite aussi la disponibilité d'une grande capacité de mémoire pour stocker les coefficients calculés. De plus, avec la prévision matricielle adaptative retardée, même lorsque les prévisions sont mises "off" (par exemple lorsqu'aucun avantage de compression ne peut être obtenu en transmettant les valeurs d'erreur), le décodeur doit continuer à déterminer les coefficients afin que les prévisions puissent être mises "on" à nouveau lorsque cela est nécessaire sans aucune dégradation temporaire dans la performance. Cela produit une charge de calcul additionnelle. Un objet de la présente invention est de dépasser ou au moins réduire un ou plus des inconvénients
mentionnés au-dessus.
Cet objet est réalisé en utilisant un algorithme de prédiction adaptative retardé qui agit sur un nombre relativement large de composantes de fréquence d'un signal audio devant être codé et qui calcule des coefficients de prévision pour une composante à partir d'un nombre prédéterminé de valeur d'échantillonnage
reçue précédemment de cette composante.
Selon un premier aspect de la présente invention, on propose une méthode de codage d'un signal électrique audio utilisant une telle prévision adaptative retardée, la méthode comportant les étapes de: (a) réception d'une première trame de temps d'un signal électrique audio devant être codé; (b) transformation de la trame de temps dans le domaine de fréquence pour générer un spectre de fréquence comportant 512 composantes spectrales ou plus; (c) réception des trames de temps suivantes dudit signal électrique audio et répétition de l'étape (b) pour ces trames de façon séquentielle pour générer un flux de valeurs de données spectrales pour chaque composante spectrale; (e) pour chaque flux, calcul d'un ensemble de coefficients de prévision pour chaque valeur spectrale en utilisant les covariances d'un nombre prédéterminé de valeurs spectrales reconstituées déterminées précédemment du flux, en utilisant ledit ensemble de coefficients de prévision pour générer une valeur spectrale prédite et calcul de l'erreur entre la valeur spectrale prédite et la valeur spectrale réelle correspondante, dans lequel les erreurs calculées produisent une représentation codée du flux de valeur spectrale et lesdites erreurs peuvent être recombinées avec les valeurs spectrales prédites
pour obtenir des valeurs spectrales reconstituées.
La méthode selon la présente invention ne calcule pas directement l'ensemble de coefficients de prévision à partir de toutes les composantes spectrales précédentes comme cela est le cas avec les algorithmes de prévision adaptatives retardées conventionnelles. C'est-à- dire que les coefficients de prévision sont recalculés pour chaque valeur spectrale et ne sont pas simplement adaptés à partir de l'ensemble calculé précédemment. Ainsi, durant des périodes pendant lesquelles la prévision est mise "off", il n'est pas besoin de continuer la mise à jour
des coefficients au niveau du décodeur.
On a ainsi découvert que, tandis que les algorithmes de prévision adaptative retardés qui calculent des coefficients de prévision à partir des covariances d'un nombre prédéterminé de valeurs spectrales précédentes, ne sont généralement pas adaptés pour le codage de signaux audio sous-divisé en un nombre relativement petit de sous-bandes de fréquence (par exemple 32), de tels algorithmes de prévision sont tout à fait appropriés lorsque le signal audio est sous-divisé en un nombre relativement important de sous-bandes de fréquence (par exemple 1024 comme défini dans la proposition de standard MPEG-4). Cela est dû au fait que lorsqu'un grand nombre de sous- bandes sont définies, l'ordre de l'algorithme de prévision (c'est-à-dire le nombre de coefficients de prévision) peut être bas et des algorithmes mettant en oeuvre la présente invention offrent une haute performance et sont efficaces d'un point de vue du calcul pour des ordres bas. De préférence, l'ordre de prévision est un ou deux. De
préférence, l'ordre de prévision est deux.
De préférence, ledit nombre prédéterminé de valeurs spectrales consécutives reçues précédemment sont utilisés pour déterminer un nombre correspondant de valeurs spectrales quantifiées. Ce sont ainsi les valeurs quantifiées qui sont utilisées pour calculer lesdits
coefficients de prévision.
De préférence, la fenêtre de temps prise à partir du signal audio se recouvre. Par exemple, chaque fenêtre peut contenir 2048 points échantillonnés avec la fenêtre adjacente comportant un recouvrement de 50 %. Cependant,
les fenêtres peuvent aussi être contiguës.
Dans certains modes de réalisation de l'invention, un nouvel ensemble de coefficients de prévision peut être calculé pour chacune et toutes les valeurs spectrales. Cependant, dans d'autres modes de réalisation il peut être plus efficace d'un point de vue du calcul de recalculer les coefficients de prévision pour seulement chaque secondes ou troisième (ou autre multiple) valeurs spectrales et d'utiliser les mêmes coefficients pour plusieurs valeurs spectrales consécutives. Il peut aussi être approprié de prévoir pour la commutation entre un taux de mise à jour de coefficient bas (par exemple chaque seconde valeur) et un temps de mise à jour haut (par exemple pour chaque valeur spectrale) immédiatement sur détection d'un transitoire
dans le signal audio.
La limite inférieure sur le nombre prédéterminé de points d'échantillonnage reçus précédemment utilisés pour calculer chaque ensemble de coefficients de prévision, est déterminée par la qualité de codage requise. Cependant, de préférence, le nombre est de quatre ou plus. La limite supérieure de ce nombre est
déterminée par la mémoire et les contraintes de calcul.
De préférence le nombre est dix ou moins.
Avantageusement, le nombre prédéterminé est six.
Toute méthode adaptée pour l'évaluation des coefficients de prévision peut être utilisée, par exemple une méthode d'auto-corrélation. Cependant, il a été trouvé que la "least squares method" est particulièrement avantageuse. De préférence, les coefficients de prévision utilisés pour calculer les valeurs spectrales prédites
sont des coefficients de prévision linéaires.
On appréciera que la présente invention peut être utilisée avec une compensation psycho-acoustique et que la quantification des signaux d'erreur peut être
commandée en conséquence.
Selon un second aspect de la présente invention, on propose une méthode de décodage d'un signal électrique audio codé en utilisant la méthode selon le premier aspect mentionné au-dessus, la méthode de décodage comportant les étapes de: réception comme signal d'entrée une séquence de valeurs d'erreur correspondant au signal audio codé et séparation de ces valeurs en flux de composante spectrale; pour chaque flux, détermination d'une valeur de composante spectrale prédite correspondante pour chaque valeur d'erreur utilisant l'ensemble des coefficients de prévision, des coefficients de prévision étant calculés en utilisant des covariances d'un nombre prédéterminé de valeur de composante spectrale prédite consécutive déterminé précédemment pour chaque flux, et combinaison de la valeur d'erreur et de la valeur spectrale prédite pour fournir une valeur spectrale reconstruite; et reconstitution du signe audio par combinaison et transformation de fréquence sur temps des valeurs
spectrales reconstituées de tous les flux.
On appréciera que les détails de la mise en oeuvre spécifique de la méthode de codage détermineront dans une large mesure les détails de mise en ouvre de la méthode
de décodage; par exemple l'ordre de prévision.
Selon un troisième aspect de la présente invention, il est proposé un dispositif pour le codage d'un signal électrique audio utilisant la prévision adaptative retardée le dispositif comportant: une entrée pour la réception d'un signal électrique audio devant être codé; un transformateur de domaine temps à fréquence pour la transformation de façon séquentielle des trames de temps reçues du signal reçu à partir du domaine de temps vers le domaine de fréquence pour fournir des spectres de fréquence comportant 512 composantes spectrales ou plus; un moyen de traitement du signal associé avec chaque composante spectrale pour la réception d'un flux de valeurs spectrales associées, pour le calcul pour chaque valeur spectrale d'un ensemble de coefficients de prévision en utilisant des covariances d'un nombre prédéterminé de valeurs spectrales reconstituées précédemment, pour utiliser ledit ensemble de coefficient de prévision pour générer une valeur spectrale prédite et pour le calcul de l'erreur entre la valeur prédite et les valeurs de spectres réelles correspondantes, les erreurs calculées fournissant une représentation codée du flux de valeurs spectrales reçues et dans lequel lesdites erreurs peuvent être combinées avec les valeurs spectrales prédites pour obtenir les valeurs spectrales reconstituées. Selon un quatrième aspect de la présente invention, on propose un dispositif pour décodage d'un signal électrique audio codé en utilisant le dispositif selon le troisième aspect mentionné au-dessus de la présente invention, le dispositif comportant: une entrée pour la réception d'une séquence de valeurs d'erreur correspondant au signal audio codé; et un moyen de traitement du signal pour séparer ladite séquence de valeur en des flux de composantes spectrales séparées et pour déterminer pour chaque valeur d'erreur une valeur spectrale prédite correspondante, un ensemble de coefficient de prévision, le moyen de traitement de signal étant disposé pour calculer les coefficients de prévision en utilisant les covariances d'un nombre prédéterminé de valeurs spectrales reconstituées consécutives déterminées précédemment, le moyen de traitement de signal étant en outre disposé pour combiner chaque valeur d'erreur avec la valeur spectrale prédite correspondante pour fournir une valeur spectrale reconstituée et pour reconstituer essentiellement ledit signal audio en combinant et en transformant des fréquences en temps les valeurs spectrales reconstituées
de toutes les sous-bandes.
Selon un cinquième aspect de la présente invention, on propose un système de communications comportant en combinaison les dispositifs des troisième
et quatrième aspects de la présente invention.
Selon un sixième aspect de la présente invention, on propose un dispositif de communications mobiles comportant un dispositif selon les troisième et quatrième
aspects de la présente invention.
Pour une meilleure compréhension de la présente invention, et afin de montrer comment cela peut être mis en oeuvre, référence sera maintenant faite au moyen d'exemple, aux figures jointes, dans lesquelles: La Figure 1 représente de façon schématique un dispositif pour le codage d'un signal audio utilisant la prévision adaptative retardée selon un mode de réalisation de la présente invention; La Figure 2 représente de façon schématique un dispositif pour le décodage d'un signal audio codé avec l'appareil de la Figure 1; et La Figure 3 représente un téléphone mobile
comportant les appareils des Figures 1 et 2.
En référence à la Figure 1, un signal d'entrée audio modulé par impulsions codées (PCM) g(t) devant être codé est fourni à l'entrée d'une première unité de traitement de signal 1 d'un dispositif de codage. Cette première unité 1 est disposée pour transformer le signal d'entrée g(t) du domaine du temps à celui de la fréquence sur une trame par base de trame, chaque trame n consistant en 2048 valeurs d'échantillonnage et les trames adjacentes ayant un recouvrement de 50 %. Plus particulièrement, l'unité 1 utilise une transformée de cosinus discrète modifiée (MDCT) pour transformer le signal dans le domaine des fréquences de façon à ce que la sortie de l'unité 1 consiste en 1024 flux séparés de valeurs spectrales xj(n), chaque flux j correspondant à une composante spectrale différente. Il est à noter que d'autres méthodes de transformation peuvent être
utilisées, par exemple une transformée de Fourier.
Chaque flux de valeurs de données xj(n) est fourni à l'entrée correspondante d'un dispositif de prévision adaptative retardée 2, dont l'opération est décrite en détail ci-dessous. En termes généraux, pour chaque valeur spectrale xj(n) de chaque flux, le dispositif de prédiction de calcul d'un ensemble de coefficients de prévision aj(n) utilisant des valeurs spectrales quantifiées reconstituées dérivées, à leur tourne dérivées des valeurs spectrales reçues précédemment de ce flux. Les coefficients de prévision sont à leur tour utilisés pour calculer une valeur d'erreur ej(n) pour la valeur spectrale. Les valeurs d'erreur pour chaque flux sont prévues à l'entrée d'un quantificateur 3 qui est disposé pour générer des erreurs quantifiées è(n) pour la transmission numérique suivante. Les erreurs quantifiées eè(n) sont fournies à un multiplexeur 4, qui génère un signal d'erreur multiplexé 9 pour la transmission, et
sont aussi renvoyées vers le dispositif de prévision 2.
Une nouvelle unité de traitement de signal 5 est aussi prévue pour commander le fonctionnement de l'unité de traitement de signal 1 et du quantificateur 3 en fonction des caractéristiques psycho- acoustiques du signal audio d'entrée g(t). Le fonctionnement de cette unité est bien connu et ne sera dons pas décrit en détail ici. Pour chaque composante spectrale j, x(n), x(n), et x(n) sont le signal d'entrée du dispositif de prévision 2, un signal de sortie du dispositif de prévision, et un signal quantifié reconstitué, et e(n) et e(n) sont un signal d'erreur de prévision et un signal d'erreur de prévision quantifié. L'ensemble des coefficients de prévision peut être représenté par: a(n) = [a, (n),a2(n),...,ap(n)]T qui dépend du temps et o l'exposant T représente la transposition. Le signal de sortie du dispositif de prévision 2 x(n) est calculé par: P x(n) = a(n)T (n)= Za,(n)x(n-i) i=1 dans laquelle x(n) = [x (n - 1), x(n- 2),.,3x(n- P)]T et P est l'ordre de prévision, c'est-à-dire le nombre de coefficients. L'erreur du dispositif de prévision est: e(n) = x(n) - x(n) et le signal quantifié reconstitué est: x(n) = x(n) + F(n) I1 Le calcul des coefficients du dispositif de prévision est basé sur la minimisation de l'erreur de prévision carrée moyenne. a(n) peut être exprimé comme: a(n) =R-'(n)r(n) o R(n) = E[î(n)îT(n)] et r(n) = E[1(n)î(n)] et le symbole E
représente l'anticipation.
Il sera apprécié qu'une fois que les fonctions d'auto-corrélation r(n) sont obtenues, les dispositifs de prévision linéaire peuvent être obtenus en résolvant l'équation normale. Cependant, ici, un algorithme au carré est présenté pour estimer les coefficients du dispositif de prévision linéaire échantillon par échantillon. La méthode carrée donne souvent une meilleure estimation de coefficient de prévision linéaire que la méthode d'auto- corrélation, particulièrement, lorsque le nombre de données disponibles est petit. On montrera par la suite que lorsque l'ordre du dispositif de prévision est bas, en particulier, lorsqu'il est seulement deux, la complexité de l'algorithme carré est comparable ou moins que celle de l'algorithme matriciel
adaptative de l'art antérieur.
En, considérant à nouveau que le signal quantifié reconstitué est représenté par x(n). Pour un ordre de prévision de deux ou une longueur de bloc de L, les covariances du signal reconstitué sont calculées par:
L-1 L-1 L-1
r.o = Z12(,_i), fr, = 2 (n.-i+1), r., = r,0 =Y 5-.(n-i+l)1(n-i) t=2 i=2 i=2 L-I L-l r. = '(n -i + 2)7(n -i), r2 = Z(n - i + 2)(n -i + 1) i=2 i=2 un algorithme efficace serait L-2 ten.p, = 3 2 (n - i), r.0 = 12 (n - L 1) + temp,. r11 = temtp, + 12 (n - 1) i=2 L-2 te,,p2 = ' (n - i + 1)1(n i), r,1 = ro = 1(n - L + 1)(n - L + 2) + tenp2 i=2 L-1 r2 = temp2 + x(n 1)3(n), r! = E (n - i + 2)x(n - i) i=2 Avec ces covariances, les deux coefficients du dispositif de prévision linéaire peuvent être calculés comme suit: rO,,r,-,,%rO r! 1rI -- r 1r2 1 2 rooil- r01r1 r,o0r2 - ril a2 -- %.oqi' -o,,, Il sera apprécié que les coefficients de prévision linéaire sont dérivés d'un nombre relativement petit prédéterminé ou fixe de valeurs spectrales précédentes. Le calcul des coefficients n'est pas dépendant de chacune des valeurs spectrales reçues précédemment. Afin d'améliorer la robustesse de la prévision adaptative retardée par rapport aux erreurs du canal et aux erreurs rendues numériques, l'espacement de largeur de bande peut être réalisé après que les coefficients de prévision linéaire aient été obtenus. Considérons que les coefficients de prévision linéaire calculés par les
équations mentionnées au-dessus soient a,,i=0,1,2. o ao=1.
Le fonctionnement de l'espacement de largeur de bande remplace chaque aparyiai, o y est une constante
légèrement inférieure à l'unité.
Comme on a pu le constater à partir de la partie précédente, les fonctions de covariance sont mis à jour échantillon par échantillon. Par conséquent, les coefficients de prévision linéaire peuvent être aussi obtenus échantillon par échantillon en résolvant l'équation normale. Cependant, afin de gagner en calcul, les coefficients de prévision linéaire peuvent calculés moins fréquemment. Par exemple, les coefficients de prévision linéaire peuvent être calculés une fois à chaque deux échantillons. La perte du gain de prévision moyenne est négligeable. Cependant, la perte du gain de prévision est clairement perceptible à l'occurrence d'un phénomène transitoire qui commute le dispositif de prévision d'un temps de mise à jour de coefficient bas normal (par exemple chaque secondes valeurs spectrales) vers un taux de mise à jour haut (par exemple chaque valeur spectrale) lorsqu'un phénomène transitoire est détecté. Le taux de mise à jour haut peut être maintenu pendant une courte période après la détection du
phénomène transitoire.
En considérant que G, représente le gain de prévision dans la bande d'échelle 1. Si G, >0, le dispositif de prévision dans cette sous-bande peut être commuté en fonction du gain de prévision total qui est calculé comme suit: N,
G= G,
1=1 & (G1 >O)
dans laquelle Ns est le nombre de bandes d'échelle. Si G compense le bit additionnel nécessaire pour la formation côté dispositif de prévision, c'est-à-dire G>T(dB) ou le gain de prévision ne chute pas de façon dramatique, c'est-à-dire Gprésent - Gprécédent <T2 (dB), l'information de côté complète est transmise et les dispositifs de prévision qui produisent des gains positifs sont activés: sinon, les dispositifs de prévision ne sont pas utilisés, ce qui veut aussi dire que le phénomène transitoire arrive. Après que les trames de phénomène transitoire aient été détectées, les coefficients des prévisions adaptatives retardés sont calculés échantillon par échantillon. Après un certain nombre d'échantillons, les coefficients de prévision sont calculés chaque second
échantillon.
La Figure 2 représente le dispositif de décodage d'un signal codé en utilisant la méthode décrite en détail au-dessus. Le signal d'erreur multiplexé reçu 9 est fourni à l'entrée d'un démultiplexeur 6 qui sépare le signal en 1024 flux de valeur spectrale ej(n). Ces flux sont alors transmis à une unité de traitement au signal 7. Pour chaque flux, cette unité 7 calcule pour chaque
valeur d'erreur une valeur spectrale prévue ou estimée.
Un nombre prédéterminé de ces valeurs prévues sont à leur tour utilisé pour calculer les coefficients de prévision linéaire pour permettre le calcul d'une valeur prédite pour un échantillon courant. Ce procédé est identique à celui décrit pour le procédé de codage. Une valeur spectrale reconstituée est obtenue en combinant le signal d'erreur reçu avec la valeur prédite correspondante. Les flux de valeurs spectrales reconstitués sont fournis à une autre unité de traitement 8 qui met en oeuvre un MDCT inverse sur les données pour régénérer globalement le
signal audio original.
La Figure 3 représente un téléphone mobile 11 comportant dans son émetteur, un dispositif 12 (correspondant au dispositif de la Figure 1, pour coder un signal de téléphone radio utilisant la méthode de codage décrite au-dessus. Le téléphone comporte aussi dans son récepteur, un dispositif 13 (correspondant au dispositif de la Figure 2) pour décoder un signal de
téléphone codé reçu.

Claims (9)

REVENDICATIONS
1 - Un procédé de codage d'un signal électrique audio utilisant une prévision adaptative retardée, le procédé comportant les étapes de: (a) réception d'une première trame de temps d'un signal électrique audio devant être codé; (b) transformation de la trame de temps dans le domaine de fréquence pour générer un spectre de fréquence comportant 512 composantes spectrales ou plus; (c) réception des trames de temps suivantes dudit signal électrique audio et répétition de l'étape (b) pour ces trames en séquence pour générer un flux de valeurs de données spectrales pour chaque composante spectrale; (e) pour chaque dit flux, calcul d'un ensemble de coefficients de prévision pour chaque valeur spectrale en utilisant les covariances d'un nombre prédéterminé des valeurs spectrales reconstituées déterminées précédemment du flux, l'utilisation dudit ensemble de coefficients de prévision pour générer une valeur spectrale prédite, et calcul de l'erreur entre la valeur spectrale prédite et la valeur spectrale réelle correspondante, dans lequel les erreurs calculées fournissent une représentation codée du flux de valeur spectrale et lesdites erreurs peuvent être recombinées avec lesdites valeurs spectrales prévues pour obtenir les valeurs spectrales reconstituées. 2 - Un procédé selon la revendication 1, dans
lequel l'ordre de prévision est deux.
3 - Un procédé selon la revendication 1 ou 2 et comportant un recalcul des coefficients de prévision seulement après réception des valeurs spectrales multiples et utilisation des mêmes coefficients pour
plusieurs valeurs spectrales consécutives.
4 - Un procédé selon la revendication 3, dans
lequel ledit multiple est deux.
- Un procédé selon la revendication 3 ou 4 et comportant une commutation entre un taux de mise à jour de coefficient bas et un taux de mise à jour haut immédiatement à partir de la détection d'un phénomène transitoire dans le signal audio devant être codé. 6 - Un procédé selon l'une quelconque des
revendications précédentes, dans lequel ledit nombre
prédéterminé de valeurs spectrales est quatre ou plus.
7 - Un procédé selon l'une quelconque des
revendications précédentes, dans lequel ledit nombre
prédéterminé de valeurs spectrales est dix ou moins.
8 - Un procédé selon l'une quelconque des
revendications précédentes, dans lequel une méthode de
plus petits carrés est utilisée pour l'évaluation des
coefficients de prévision.
9 - Un procédé selon la revendication 8 lorsqu'elle dépend de la revendication 2, dans lequel lesdites covariances sont déterminées comme:
L-1 L-1 L-1
r'o = x2(n-i), rl, = x2(n-i +1), ro, =50 = Y".(n-i+l)x(n-i) i=2 i=2 i=2
L-1 L-1
r = (n - i + 2)(n - i), r2 = (n - i + 2)(n - i + 1) i=2 i=2 L-2 temp, = L x 2 (n - i), r%.o = x 2 (n - L - 1) + tenp" r,". = temp, + x 2 (n - 1) i=2 L-2 tenp2 = Z(n - i + 1)(n - i), r. = r0 = (n - L + 1)(n- L + 2) + tenp2 i=2 L-1
r2 = te:p1 + (n - l)f(n), r = Z F(n - i + 2)x(n - i).
i=2 - Un procédé selon la revendication 9, dans lequel les coefficients de prévision sont déterminés selon: r,,r, - r,%r2 a, 2 r
- '0,1
rO,or2 - rO,1r 2 r00r1 -r021 %.o, O i o, I 11 - Un procédé de décodage d'un signal électrique audio codé, le procédé de décodage comportant les étapes de: réception comme signal d'entrée une séquence de valeurs d'erreur correspondant au signal audio codé et séparation de ces valeurs en flux de composante spectrale; pour chaque flux, détermination d'une valeur de composante spectrale prédite correspondante pour chaque valeur d'erreur utilisant un ensemble de coefficients de prévision, les coefficients de prévision étant calculés en utilisant des covariances d'un nombre prédéterminé de valeur de composante spectrale prévue consécutive déterminée pour ce flux, et combinaison de la valeur d'erreur et de la valeur spectrale prédite pour fournir une valeur spectrale reconstituée; et reconstitution globale dudit signal audio par combinaison et transformation de fréquence en temps des
valeurs spectrales reconstituées de tous les flux.
12 - Un dispositif pour le codage d'un signal électrique audio utilisant une prévision adaptative retardée, le dispositif comportant: une entrée pour la réception d'un signal électrique audio devant être codé; un dispositif de transformation de domaine temps à fréquence pour la transformation de façon séquentielle des trames de temps reçues du signal reçu du domaine de temps vers le domaine de fréquence pour fournir un spectre de fréquence comportant 512 composantes spectrales ou plus; un moyen de traitement du signal associé avec chaque composante spectrale pour la réception comme un flux des valeurs spectrales associées, pour le calcul pour chaque valeur spectrale d'un ensemble de coefficients de prévision utilisant des covariances d'un nombre prédéterminé de valeurs spectrales reconstituées précédemment, pour l'utilisation dudit ensemble de coefficient de prévision pour générer une valeur spectrale prédite, et pour le calcul de l'erreur entre la valeur prédite et la valeur spectrale réelle correspondante, les erreurs calculées fournissant une représentation codée du flux de valeurs spectrales reçues et dans lequel lesdites erreurs peuvent être combinées avec lesdites valeurs spectrales prédites pour obtenir
les valeurs spectrales reconstituées.
13 - Un dispositif pour décodage d'un signal électrique audio codé, le dispositif comportant: une entrée pour la réception d'une séquence de valeurs d'erreur correspondant au signal audio codé; et un moyen de traitement de signal pour la séparation de ladite séquence de valeur en flux de composantes spectrales séparées et pour la déterminer pour chaque valeur d'erreur d'une valeur spectrale prédite correspondante, un ensemble de coefficient de prévision, le moyen de traitement de signal étant disposé pour calculer les coefficients de prévision en utilisant des covariances d'un nombre prédéterminé de valeurs spectrales reconstituées consécutives déterminées précédemment, le moyen de traitement de signal étant en outre disposé pour combiner chaque valeur d'erreur avec la valeur spectrale prédite correspondante pour fournir une valeur spectrale reconstituée et pour reconstituer également ledit signal audio par combinaison et transformation de fréquences en temps de valeurs
spectrales reconstituées de toutes les sous-bandes.
14 - Un système de communication comportant en
combinaison les dispositifs des revendications 12 et 13.
- Un dispositif de communication mobile comportant en combinaison les dispositifs des
revendications 12 et 13.
FR9801430A 1997-02-07 1998-02-06 Methode de codage audio et dispositif Pending FR2759510A1 (fr)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FI970553A FI970553A (fi) 1997-02-07 1997-02-07 Audiokoodausmenetelmä ja -laite

Publications (1)

Publication Number Publication Date
FR2759510A1 true FR2759510A1 (fr) 1998-08-14

Family

ID=8548146

Family Applications (1)

Application Number Title Priority Date Filing Date
FR9801430A Pending FR2759510A1 (fr) 1997-02-07 1998-02-06 Methode de codage audio et dispositif

Country Status (9)

Country Link
JP (1) JPH10260699A (fr)
CN (1) CN1202513C (fr)
AU (1) AU5664898A (fr)
DE (1) DE19804584A1 (fr)
FI (1) FI970553A (fr)
FR (1) FR2759510A1 (fr)
GB (1) GB2322776B (fr)
SE (1) SE9800338L (fr)
WO (1) WO1998035447A2 (fr)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8332216B2 (en) * 2006-01-12 2012-12-11 Stmicroelectronics Asia Pacific Pte., Ltd. System and method for low power stereo perceptual audio coding using adaptive masking threshold
US7610195B2 (en) * 2006-06-01 2009-10-27 Nokia Corporation Decoding of predictively coded data using buffer adaptation
JP5337235B2 (ja) * 2009-03-10 2013-11-06 日本電信電話株式会社 符号化方法、復号方法、符号化装置、復号装置、プログラム及び記録媒体
CN103368682B (zh) * 2012-03-29 2016-12-07 华为技术有限公司 信号编码和解码的方法和设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0673014A2 (fr) * 1994-03-17 1995-09-20 Nippon Telegraph And Telephone Corporation Procédé de codage et décodage par transformation de signaux acoustiques
WO1997004621A1 (fr) * 1995-07-20 1997-02-06 Robert Bosch Gmbh Procede pour reduire la redondance lors du codage de signaux multicanaux et dispositif pour decoder des signaux multicanaux a redondance reduite

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02131038A (ja) * 1988-11-10 1990-05-18 Pioneer Electron Corp 信号伝送装置
JP3343965B2 (ja) * 1992-10-31 2002-11-11 ソニー株式会社 音声符号化方法及び復号化方法
US5774844A (en) * 1993-11-09 1998-06-30 Sony Corporation Methods and apparatus for quantizing, encoding and decoding and recording media therefor
GB2318029B (en) * 1996-10-01 2000-11-08 Nokia Mobile Phones Ltd Audio coding method and apparatus

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0673014A2 (fr) * 1994-03-17 1995-09-20 Nippon Telegraph And Telephone Corporation Procédé de codage et décodage par transformation de signaux acoustiques
WO1997004621A1 (fr) * 1995-07-20 1997-02-06 Robert Bosch Gmbh Procede pour reduire la redondance lors du codage de signaux multicanaux et dispositif pour decoder des signaux multicanaux a redondance reduite

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
AGUIAR S R M F ET AL: "BACKWARD ADAPTIVE LATTICE AND TRANSVERSAL PREDICTORS IN LOW-DELAY CELP CODERS", SIGNAL PROCESSING. EUROPEAN JOURNAL DEVOTED TO THE METHODS AND APPLICATIONS OF SIGNAL PROCESSING, ELSEVIER SCIENCE PUBLISHERS B.V. AMSTERDAM, NL, vol. 39, no. 1/2, 1 September 1994 (1994-09-01), pages 201 - 214, XP000556256, ISSN: 0165-1684 *
CAMBRIDGE P ET AL: "AUDIO DATA COMPRESSION TECHNIQUES", AMERICAN ENGINEERING SOCIETY CONVENTION, NEW YORK, NY, US, no. 94, 1 March 1993 (1993-03-01), pages 1 - 26, XP000607652 *
WONG W T K ET AL: "LOW RATE SPEECH CODING FOR TELECOMMUNICATIONS", BT TECHNOLOGY JOURNAL, BT LABORATORIES, GB, vol. 14, no. 1, 1996, pages 28 - 43, XP000554637, ISSN: 1358-3948 *

Also Published As

Publication number Publication date
GB9802611D0 (en) 1998-04-01
CN1202513C (zh) 2005-05-18
WO1998035447A2 (fr) 1998-08-13
FI970553A0 (fi) 1997-02-07
SE9800338L (sv) 1998-08-08
JPH10260699A (ja) 1998-09-29
CN1199959A (zh) 1998-11-25
GB2322776A (en) 1998-09-02
SE9800338D0 (sv) 1998-02-05
AU5664898A (en) 1998-08-26
GB2322776B (en) 2002-03-13
WO1998035447A3 (fr) 1998-11-19
FI970553A (fi) 1998-08-08
DE19804584A1 (de) 1998-08-13

Similar Documents

Publication Publication Date Title
FR2761801A1 (fr) Methode de codage audio et dispositif
RU2495502C2 (ru) Многоканальный аудиокодек без потерь, который использует адаптивную сегментацию с возможностями точек произвольного доступа (rap) и множества наборов параметров предсказания (mpps)
CA2512179C (fr) Procede de codage et de decodage audio a debit variable
KR101220621B1 (ko) 부호화 장치 및 부호화 방법
EP2104936B1 (fr) Codage par transformee, utilisant des fenetres de ponderation et a faible retard
FR2700632A1 (fr) Système de codage-décodage prédictif d&#39;un signal numérique de parole par transformée adaptative à codes imbriqués.
WO2015197989A1 (fr) Ré-échantillonnage par interpolation d&#39;un signal audio pour un codage /décodage à bas retard
WO2006032740A1 (fr) Procede de traitement de donnees par passage entre domaines differents de sous-bandes
EP3330964B1 (fr) Ré-échantillonnage d&#39;un signal audio pour un codage /décodage à bas retard
EP1989706A2 (fr) Dispositif de ponderation perceptuelle en codage/decodage audio
SE527670C2 (sv) Naturtrogenhetsoptimerad kodning med variabel ramlängd
EP0002998A1 (fr) Procédé de compression de données relatives au signal vocal et dispositif mettant en oeuvre ledit procédé
WO1992022985A1 (fr) Codeur-decodeur sous bandes de signaux de television a niveaux de compatibilite differents
MX2011001253A (es) Dispositivo de filtrado espectral, dispositivo de codificacion, dispositivo de decodificacion, dispositivo de terminal de comunicacion, dispositivo de estacion base y metodo de filtrado espectral.
WO2010012927A1 (fr) Reconstruction de donnees audio multicanal
EP0782339A1 (fr) Procédé et dispositif de compression de données numériques
EP1875465A1 (fr) Procede d&#39;adaptation pour une interoperabilite entre modeles de correlation a cout terme de signaux numeriques
WO2016016566A1 (fr) Détermination d&#39;un budget de codage d&#39;une trame de transition lpd/fd
EP2232489B1 (fr) Codage/decodage par transformee, a fenetres adaptatives
EP2769378A2 (fr) Codage hierarchique perfectionne
KR20160015280A (ko) 오디오 신호 인코더
FR2759510A1 (fr) Methode de codage audio et dispositif
US6012025A (en) Audio coding method and apparatus using backward adaptive prediction
WO2012080649A1 (fr) Codage perfectionne d&#39;un etage d&#39;amelioration dans un codeur hierarchique
FR2692091A1 (fr) Procédé et dispositif de dissimulation d&#39;erreurs de transmission de signaux audio-numériques codés par transformée fréquentielle.