FR2761801A1 - Methode de codage audio et dispositif - Google Patents

Methode de codage audio et dispositif Download PDF

Info

Publication number
FR2761801A1
FR2761801A1 FR9803135A FR9803135A FR2761801A1 FR 2761801 A1 FR2761801 A1 FR 2761801A1 FR 9803135 A FR9803135 A FR 9803135A FR 9803135 A FR9803135 A FR 9803135A FR 2761801 A1 FR2761801 A1 FR 2761801A1
Authority
FR
France
Prior art keywords
audio signal
frequency
quantized
generate
signals
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
FR9803135A
Other languages
English (en)
Other versions
FR2761801B1 (fr
Inventor
Lin Yin
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nokia Technologies Oy
Original Assignee
Nokia Mobile Phones Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Mobile Phones Ltd filed Critical Nokia Mobile Phones Ltd
Publication of FR2761801A1 publication Critical patent/FR2761801A1/fr
Application granted granted Critical
Publication of FR2761801B1 publication Critical patent/FR2761801B1/fr
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Telephone Function (AREA)

Abstract

Une méthode de codage d'un signal audio comporte la réception d'un signal audio x devant être codé, et la transformation du signal reçu du domaine de temps au domaine de fréquence. Un signal audio quantifié x est généré à partir du signal audio transformé x; ainsi qu'un ensemble de coefficients de prévision à long terme A, qui peut être utilisé pour prévoir une trame de temps courante du signal audio reçu, directement à partir d'une ou de plusieurs trames de temps précédentes du signal audio quantifié x. Un signal audio prévu x est généré en utilisant les coefficients de prévision A. Le signal audio prévu x est ensuite transformé du domaine de temps vers le domaine des fréquences, et le signal du domaine de fréquence résultant est comparé avec celui du signal audio reçu x, pour générer un signal d'erreur E(k) sont ensuite quantifiés pour générer un ensemble de signaux d'erreur quantifiés E(k) qui sont combinés avec les coefficients de prévision A, pour générer un signal audio codé.

Description

METHODE DE CODAGE AUDIO ET DISPOSITIF
La présente invention concerne une méthode et un dispositif de codage audio, ainsi qu'une méthode et un dispositif de décodage audio. Il est bien connu que la transmission de données sous forme digitale conduit à une augmentation des rapports signal/bruit et une augmentation des capacités d'information dans le canal de transmission. Il y a cependant une tendance constante à améliorer encore la capacité de canal, en compressant les signaux numériques à des taux toujours plus élevés. En ce qui concerne les signaux audio, deux principes de compression de base sont habituellement appliqués. Le premier de ceux-ci consiste à éliminer les redondances statistiques et déterministes dans le signal source, tandis que le second consiste à supprimer ou éliminer du signal source des éléments qui sont redondants dans la mesure o la perception humaine est concernée. Récemment, ce dernier principe est devenu prédominant dans des applications audio de haute qualité, et implique habituellement la séparation d'un signal audio en ses composantes de fréquence (appelées souvent "sous-bandes"), chacune desquelles est analysée et quantifiée avec une précision de quantification déterminée, pour retirer les données non pertinentes (à l'auditeur). Le standard de codage audio ISO (International Standards Organisation) MPEG (Moving Pictures Expert Group) ainsi que d'autres standards de
codage audio utilisent et définissent ce principe.
Cependant, le standard MPEG (et d'autres standards) utilisent aussi une technique connue comme "prévision adaptative" pour réaliser une nouvelle réduction du débit
de données.
Le fonctionnement d'un codeur selon le nouveau standard MPEG-2 AAC est décrit en détail dans le document
(provisoire) standard international ISO/IECC DIS 13818-7.
Ce nouveau standard MPEG-2 utilise une prévision linéaire de référence aux données antérieures ou "de retour" ("backward linear prediction"), avec 672 des 1024 composantes de fréquence. Il est envisagé que le nouveau standard MPEG-4 comporte des exigences similaires. Cependant, un tel nombre important de composantes de fréquence a pour conséquence une charge de calcul importante, du fait de la complexité de l'algorithme de prévision, et nécessite aussi la disponibilité d'une grande quantité de mémoire pour stocker les coefficients calculés et les coefficients intermédiaires. Il est bien connu que lorsque des dispositifs de prévision adaptative de retour de ce type sont utilisés dans le domaine de fréquence, il est difficile de réduire encore les charges de calcul et les exigences de mémoire. Cela est dû au fait que le nombre de dispositifs de prévision est si important dans le domaine des fréquences, que même un algorithme adaptatif très simple aura pour conséquence une grande complexité de calcul et des exigences de mémoire importantes. Bien qu'il soit connu d'éviter ce problème en utilisant des dispositifs de prévision adaptative avant qui sont mises à jour dans le codeur et transmises au décodeur, l'utilisation de dispositifs de prévision adaptative "avant" dans le domaine de fréquence a inévitablement pour conséquence une grande quantité d'informations "de côté" du fait du nombre de dispositifs
de prévision importants.
Un objet de la présente invention est d'éviter ou au moins de limiter, les inconvénients des méthodes de
prévision connues.
Cet objet ainsi que d'autres, sont réalisés par le codage d'un signal audio en utilisant des signaux
d'erreur pour éliminer la redondance dans chaque sous-
bande de la pluralité de sous-bandes de fréquence du signal audio, et, en addition, par la génération de coefficients de prévision à long terme dans le domaine de temps, qui permet à une trame courante du signal audio, d'être prévue à partir d'une ou de plusieurs trames précédentes. Selon un premier aspect de la présente invention, il est proposé une méthode de codage d'un signal audio, qui comporte les étapes de: réception d'un signal audio x devant être codé; génération d'un signal audio quantifié x à partir du signal audio reçu x; génération d'un ensemble de coefficients de prévision à long terme A qui peuvent être utilisés pour prévoir une trame de temps courante du signal audio reçu x, directement à partir d'au moins une trame de temps précédente du signal audio quantifié x; utilisation des coefficients de prévision A pour générer un signal audio prévu x; comparaison du signal audio reçu x avec le signal audio prévu x et génération d'un signal d'erreur E(k) pour chaque sous-bande de la pluralité de sous-bandes de fréquence; quantification des signaux d'erreur E(k) pour générer un ensemble de signaux d'erreur quantifié E(k); et combinaison du signal d'erreur quantifié È(k) et des coefficients de prévision A, pour générer un signal
audio codé.
La présente invention permet la composition d'un signal audio en utilisant un dispositif de prévision adaptative avant dans le domaine de temps. Pour chaque trame de temps d'un signal reçu, il est seulement nécessaire de générer et de transmettre un seul ensemble de coefficients de prévision adaptative avant pour la transmission au décodeur. Cela contraste avec les techniques de prévision adaptatives avant connues, qui nécessitent la génération d'un ensemble de coefficients de prévision pour chaque sous-bande de fréquence de chaque trame de temps. En comparaison aux gains de prévision obtenus par la présente invention, l'information de côté du dispositif de prévision à long
terme est négligeable.
Certains modes de réalisation de la présente invention permettent une réduction dans la complexité de calcul et dans les exigences de mémoire. En particulier, en comparaison à l'utilisation de prévision adaptative de retour, il n'y a aucune exigence de recalcul des coefficients de prévision dans le décodeur. Certains modes de réalisation de l'invention sont aussi capables de répondre plus rapidement aux changements des signaux, que les dispositifs de prévision adaptative de retour conventionnel. Dans un premier mode de réalisation de l'invention, le signal audio reçu x est transformé dans des trames xm du domaine de temps au domaine de
fréquence, pour fournir un ensemble de signaux de sous-
bande de fréquence X(k). Le signal audio prévu x est transformé de façon similaire, du domaine de temps au domaine de fréquence, pour générer un ensemble de signaux de sous-bande de fréquence prévue x(k), et la comparaison entre le signal audio reçu x et le signal audio prévu x, est effectuée dans le domaine de fréquence, en comparant les signaux de sous-bande respectifs les uns aux autres, pour générer les signaux d'erreur de sous-bande de fréquence E(k). Le signal audio quantifié x est généré en additionnant le signal prévu et le signal d'erreur quantifié, soit dans le domaine de
temps, soit dans le domaine de fréquence.
Dans un autre mode de réalisation de l'invention, la comparaison entre le signal audio reçu x et le signal audio prévu x, est effectuée dans le domaine de temps pour générer un signal d'erreur e aussi dans le domaine de temps. Ce signal d'erreur e est ensuite converti du domaine de temps au domaine de fréquence, pour générer ladite pluralité de signaux d'erreur de sous-bande de
fréquence E(k).
De préférence, la quantification des signaux
d'erreur est effectuée selon un modèle psycho-acoustique.
Selon un second aspect de la présente invention, il est proposé une méthode de décodage d'un signal audio codé, comportant les étapes de: réception d'un signal audio codé comportant un signal d'erreur quantifié E(k) pour chaque sous-bande de la pluralité de sous-bandes de fréquence du signal audio et, pour chaque trame de temps du signal audio, un ensemble de coefficients de prévision A qui peuvent être utilisés pour prévoir une trame de temps courante xm du signal audio reçu, directement à partir d'au moins une trame de temps précédente d'un signal audio quantifié reconstitué x; génération dudit signal audio quantifié reconstitué x, à partir des signaux d'erreur quantifié È(k); utilisation des coefficients de prévision A et du signal audio quantifié x, pour générer un signal audio A prévu x; transformation du signal audio prévu x, du domaine de temps au domaine de fréquence, pour générer un ensemble de signaux de sous-bande de fréquence prévu x(k) pour la combinaison avec les signaux d'erreur quantifiés (k) afin de générer un ensemble de signaux de sous-bande de fréquence reconstitué X(k); et application d'une transformation de domaine de
fréquence en domaine de temps, sur les signaux de sous-
bande de fréquence reconstitués x(k) afin de générer le
signal audio quantifié reconstitué x.
Des modes de réalisation selon ce second aspect de l'invention sont particulièrement bien adaptés lorsque seulement un sous-ensemble de tous les signaux d'erreur quantifiés possibles É(k) sont reçus, quelques données de sous-bande étant transmises directement par la transmission des signaux de sous-bande audio X(k). Les signaux X(k) et X(k) sont combinés de façon appropriée avant la mise en oeuvre de la transformation de fréquence
en temps.
Selon un troisième aspect de la présente invention, il est proposé un dispositif pour le codage d'un signal audio, le dispositif comportant: une entrée pour la réception d'un signal audio x devant être codé; un moyen de quantification couplé à ladite entrée pour générer, à partir du signal audio reçu x, un signal audio quantifié x; un moyen de prévision couplé audit moyen de quantification, pour générer un ensemble de coefficients de prévision à long terme A, pour prévoir une trame de temps courante xm du signal audio reçu x, directement à partir d'au moins une trame de temps précédente du signal audio quantifié x; un moyen de génération pour générer un signal audio prévu x en utilisant les coefficients de prévision A, et pour comparer le signal audio reçu x avec le signal audio prévu x, pour générer un signal d'erreur E(k) pour chaque sous-bande de la pluralité de sous-bandes de fréquence; un moyen de quantification pour quantifier les signaux d'erreur E(k), afin de générer un ensemble de signaux d'erreur quantifié E(k); et un moyen de combinaison pour combiner les signaux d'erreur quantifiée E(k) avec les coefficients de
prévision A, afin de générer un signal audio codé.
Dans un premier mode de réalisation, ledit moyen de génération comporte un premier moyen de transformation pour transformer le signal audio reçu x du domaine de temps au domaine de fréquence et un second moyen de transformation pour transformer le signal audio prévu x du domaine de temps au domaine de fréquence, et un moyen de comparaison prévu pour y comparer les signaux du domaine de fréquence résultant dans le domaine de fréquence. Dans un autre mode de réalisation de l'invention, le moyen de génération est prévu pour comparer le signal audio reçu x et le signal audio prévu x dans le domaine
de temps.
Selon un quatrième aspect de la présente invention, il est proposé un dispositif pour le décodage d'un signal audio codé x, dans lequel le signal audio codé comporte un signal d'erreur quantifié E(k) pour chaque sous-bande de la pluralité de sous-bandes de fréquence du signal audio, et un ensemble de coefficients de prévision A pour chaque trame de temps du signal audio, et dans lequel les coefficients de prévision A peuvent être utilisés pour prévoir une trame de temps courante xm du signal audio reçu, directement à partir d'au moins une trame de temps précédente d'un signal audio quantifié reconstitué x, le dispositif comportant: une entrée pour recevoir le signal audio codé; un moyen de génération pour générer ledit signal audio quantifié reconstitué x à partir des signaux d'erreur quantifié (k); et un moyen de traitement de signal, pour générer un signal audio prévu x à partir des coefficients de prévision A et dudit signal audio reconstitué x; dans lequel ledit moyen de génération comporte un premier moyen de transformation pour transformer le signal audio prévu x du domaine du temps au domaine de
fréquence, pour générer un ensemble de signaux de sous-
bande de fréquence prévus X(k), un moyen de combinaison pour combiner ledit ensemble de signaux de sous-bande de fréquence prévus x(k) avec les signaux d'erreur quantifiés (k), pour générer un ensemble de signaux de sous-bande de fréquence reconstitués X(k), et un second moyen de transformation pour appliquer une transformation du domaine de fréquence au domaine du temps, aux signaux de sous-bande de fréquence reconstitués X(k) pour générer
le signal audio quantifié reconstitué x.
Pour une meilleure compréhension de la présente invention, et afin de montrer comment elle peut être mise en oeuvre, référence sera maintenant faite aux figures accompagnantes au moyen d'exemples, dans lesquelles: La Figure 1 représente de façon schématique, un codeur pour le codage d'un signal audio reçu; La Figure 2 représente de façon schématique, un décodeur pour le décodage d'un signal audio codé par le codeur de la Figure 1; La Figure 3 représente en détail le codeur de la Figure 1, comportant un outil de prévision du codeur; La Figure 4 représente en détail le décodeur de la Figure 2, comportant un outil de prévision du décodeur; et La Figure 5 représente en détail une modification du codeur de la Figure 1 et qui utilise un outil de
prévision alternatif.
Sur la Figure 1 est représenté un bloc diagramme d'un codeur qui met en oeuvre la fonction de codage
définie en termes généraux dans le standard MPEG-2 AAC.
L'entrée du codeur est un signal monophasé échantillonné x, dont les points d'échantillon sont groupés en trames de temps ou blocs de 2N points, c'est-à-dire: Xm = (xm(O), Xm(l),..., Xm(2N - 1))T (1) dans laquelle m est l'indice de bloc et T représente la transposition. Le groupement des points d'échantillon est effectué par un outil d'assemblage de filtres 1 qui met aussi en oeuvre une transformée de cosinus discrète modifiée (MDCT) sur chaque trame individuelle du signal
audio, pour générer un ensemble de coefficients de sous-
bande de fréquence Xm = (Xm(O), Xm(1),..., Xm(N- 1))T (2)
Les sous-bandes sont définies dans le standard MPEG.
La MDCT avant est définie par: 2N-1 Xm(k)= f (i)xm (i)cos (N(2i+l+ N)(2k+l), (3) i=0 k = 0,..., N - 1 o f(i) est la fenêtre d'analyse-synthèse, qui est une fenêtre symétrique telle que son effet ajouté-recouvert
produit un gain unité dans le signal.
Les signaux de sous-bande de fréquence X(k) sont à leur tour appliqués à l'outil de prévision 2 (décrit plus en détail ci-après) qui cherche à éliminer la
redondance à long terme dans chacun des signaux de sous-
bande. Le résultat est un ensemble de signaux d'erreur de sous-bande de fréquence Em(k) = (Em(0), Em(1),..., Em(N - 1)) (4) qui sont représentatif des changements à long terme dans les sous- bandes respectives, et un ensemble de coefficient de prévision adaptative avant A pour chaque trame. Les signaux d'erreur de sous-bande E(k) sont appliqués à un quantificateur 3 qui quantifie chaque signal avec un nombre de bits déterminé par un modèle psycho-acoustique. Ce modèle est appliqué par un contrôleur 4. Tel que décrit, le modèle psycho-acoustique est utilisé pour modéliser le comportement de masquage du système auditif humain. Les signaux d'erreur quantifiés E(k) et les coefficients de prévision A, sont ensuite combinés dans un multiplexeur de flux de bits 5 pour être
transmis via un canal de transmission 6.
La Figure 2 représente la disposition générale d'un décodeur pour le décodage d'un signal audio codé avec le codeur de la Figure 1. Un démultiplexeur de flux de bits 7 sépare d'abord les coefficients de prévision A des signaux d'erreur quantifiés (k), et sépare les
signaux d'erreur dans les signaux de sous-bande séparés.
Les coefficients de prévision A et les signaux de sous-
bande d'erreur quantifié É(k) sont fournis à un outil de prévision 8 qui inverse le procédé de prévision effectué dans le codeur, c'est-à- dire l'outil de prévision réinsère la redondance extraite dans le codeur, pour générer des signaux de sous-bande quantifiés reconstitués X(k). Un outil d'assemblage de filtres 9 récupère ensuite le signal du domaine de temps x, par une transformation inverse sur la version reçu X(k), décrite par: Km(i) = um-l(i + N) + Um(i) i = 0,..., N - 1 (5) o uk(i), i = 0,..., 2N 1, sont la transformation inverse de N-1 um(i)= f(i) Xm(k)cos(4N (2i+l+N)(2k+1)), i=O i = 0,..., N - 1
et qui approxime le signal audio original x.
La Figure 3 représente avec plus de détails, la méthode de prévision du codeur de la Figure 1. En utilisant les signaux d'erreur de sous-bande de fréquence quantifiés E(k), un ensemble de signaux de sous- bande de fréquence quantifiés x(k) sont générés par une unité de traitement de signal 10. Les signaux X(k) sont appliqués à leur tour à un assemblage de filtres 11 qui applique Il aux signaux une transformation cosinus discrète modifiée inverse (IMDCT), pour générer un signal du domaine de temps quantifié x. Le signal x est ensuite appliqué à un outil de prévision à long terme 12 qui reçoit aussi le signal d'entrée audio x. L'outil de prévision 12 utilise un dispositif de prévision à long terme (LT) pour retirer la redondance dans le signal audio présent dans une trame courante m+1, sur la base des données précédemment quantifiées. La fonction de transfert P de ce dispositif de prévision est: m2 P(Z) Z bkZ'(+kI (5) k=-m1 o a représente un retard dans la gamme de 1 à 1024
échantillons, et bk sont des coefficients de prévision.
Pour ml = m2 = 0, le dispositif de prévision est d'ordre 1, tandis que pour ml = m2 = 1, le dispositif de
prévision est d'ordre trois.
Les paramètres a et bk sont déterminés en minimisant l'erreur carrée moyenne après la prévision LT sur une période de 2N échantillons. Pour un dispositif de prévision d'ordre un, le résidu de prévision LT r(i) est donné par: r(i) = x(i) - bx(i - 2N + 1 - a) (6) o x est le signal audio du domaine de temps, et x est le signal quantifié du domaine de temps. Le résidu carré moyen R est donné par:
2N-1 2N-1
R Z r2(i) = (x(i)- bx(i - 2N + 1 - a))2 (7) i=0 i=0 Considérant que aR/ab = 0, 2N-1 x(i(i - 2N + 1 - o) b= Yi-- (8) 2N-1 X( - 2N t i=O (xi-2N-a) (8) et en substituant b dans l'équation (7): R2N(i (2f-' x(i)g(i - 2N + 1-a)) -12 (Ywi--o(9) i-o La minimisation de R correspond à la minimisation du second terme du côté droit de l'équation (9). Ce terme est calculé pour toutes les valeurs possibles de a sur sa gamme spécifiée, et la valeur de a qui maximise ce terme, est choisie. L'énergie dans le dénominateur de l'équation (9), identifiée comme Q, peut être facilement mise à jour à partir du retard (a - 1) à a plutôt que de le recalculer à nouveau en utilisant: O = na+1 + x2 (-_) - X2 (-a + N) (10) Si un dispositif de prévision LT d'ordre un est utilisé, alors l'équation (8) est utilisée pour calculer le coefficient de prévision bj. Pour un dispositif de prévision d'ordre, le retard de prévision LT a est d'abord déterminé en maximisant le second terme de l'équation (9), puis un ensemble de j x j équations est
résolu pour calculer les coefficients de prévision j.
Les paramètres de prévision LT A sont le retard a et les coefficients de prévision bj. Le retard est quantifié avec de 9 à 11 bits, dépendant de la gamme utilisée. Plus communément 10 bits sont utilisés avec 1024 valeurs possibles dans la gamme de 1 à 1024. Pour réduire le nombre de bits, les retards de prévision LT peuvent être codés en delta dans des trames égales avec 5 bits. Des expériences montrent qu'il est suffisant de quantifier le gain avec de 3 à 6 bits. Du fait de la distribution non-uniforme du gain, une quantification
non-uniforme doit être utilisée.
Dans la méthode décrite au-dessus, la stabilité du filtre de synthèse LT l/P(z) n'est pas toujours garantie. Pour un dispositif de prévision d'ordre un, la condition de stabilité est Ibl< 1. Par conséquent, la stabilisation peut être facilement mise en euvre en ajustant Ibl= 1, tant que Ibl> 1. Pour un dispositif d'ordre trois, une autre procédure de stabilisation peut être utilisée telle que celle décrite dans "Stability and performance analysis of pitch filters in speech coders", de R.P. Ramachandran et P. Kabal, IEEE Trans. ASSP,
volume 35, n 7, pages 937 à 946, Juillet 1987.
Cependant, l'instabilité du filtre de synthèse LT n'est pas si nuisible à la qualité du signal reconstitué. Le filtre instable persistera pendant quelques trames (augmentant l'énergie), mais par la suite, des périodes de stabilité sont rencontrées et la sortie ne continue
donc pas à augmenter avec le temps.
Après que le coefficient du dispositif de prévision LT ait été déterminé, le signal prévu pour la (m+l)ième trame peut être déterminé: m2 x(i) = bjxk(i - 2N + 1 - j - c), (11) j =-m1 i = mN + 1, mN + 2,..., (m + 1)N Le signal de domaine de temps prévu x est ensuite appliqué à un assemblage de filtres 13 qui applique une MDCT au signal, pour générer des coefficients spectraux A prévus Xm+l(k) pour la (m+l)ième trame. Les coefficients spectraux prévus X(k) sont ensuite soustraits des
coefficients spectraux X(k) au niveau du soustracteur 14.
Afin de garantir que la prévision est utilisée seulement si elle résulte dans un gain de codage, un contrôle de dispositif de prévision approprié est nécessaire et une petite quantité d'information de contrôle du dispositif de prévision doit être transmis au décodeur. Cette fonction est effectuée dans le soustracteur 14. Le schéma de commande du dispositif de prévision est le même que le schéma de commande du dispositif de prévision adaptative de retour qui a été utilisé dans le standard MPEG-2 Advanced Audio Cooding (AAC). L'information de commande du dispositif de prévision pour chaque trame, qui est transmise comme
information de côté, est déterminée en deux étapes.
Premièrement, pour chaque bande de facteur de proportionnalité, il est déterminé si oui ou non la prévision mène à un gain de codage, et si oui, le bit utilisé par le dispositif de prévision pour ce facteur de proportionnalité est ajusté à zéro. Après que cela a été fait pour toutes les bandes de facteur de proportionnalité, il est déterminé si le gain de codage global par prévision dans cette trame, compense au moins la nécessité du bit additionnel pour l'information de côté du dispositif de prévision. Si oui, le bit présent de données du dispositif de prévision est ajusté à 1, et l'information de côté complète incluant celle nécessaire pour la mise à jour du dispositif de prévision, et transmise, et la valeur d'erreur de prévision est envoyée au quantificateur. Sinon, le bit présent des données du dispositif de prévision est ajusté à O, et les bits utilisés par le dispositif de prévision sont tous remis à zéro et ne sont pas transmis. Dans ce cas, la valeur de
composante spectrale est envoyée au quantificateur 3.
Comme cela est décrit au-dessus, la commande du dispositif de prévision agit d'abord sur tous les dispositifs de prévision d'une bande de facteur de proportionnalité, et est ensuite suivie par une seconde étape sur toutes les bandes de facteur de proportionnalité. Il est bien évident que le but de la prévision LT
est d'obtenir le gain de prévision complet le plus grand.
Soit G1 représentant le gain de prévision dans la 1-ième sous-bande de fréquence, le gain de prévision global dans une trame donnée peut être calculé comme suit: N.
G = 1 G. (12)
1-1 & (G >O)
Si le gain compense la nécessité du bit additionnel pour
l'information de côté du dispositif de prévision, c'est-
à-dire, G > T (dB), l'information de côté complète est transmise, et les dispositifs de prévision qui produisent des gains positifs sont activés. Sinon, les dispositifs
de prévision ne sont pas utilisés.
Les paramètres LP obtenus par la méthode utilisée au-dessus ne sont pas directement liés à la maximisation du gain. Cependant, en calculant le gain pour chaque bloc et pour chaque retard, dans la gamme sélectionnée (1 à 1024 dans cet exemple), et en sélectionnant ce retard qui produit le gain de prévision global le plus grand, le procédé de prévision est optimisé. Le retard sélectionné a et les coefficients correspondants b, sont transmis comme information de côté avec les signaux de sous-bande d'erreur quantifiés. Tandis que la complexité de calcul augmenté dans le codeur, il ne résulte pas d'augmentation
de complexité au niveau du décodeur.
La Figure 4 représente en détail le décodeur de la Figure 2. Le signal audio codé est reçu à partir du canal de transmission 6 par le démultiplexeur de flux de bits 7 comme cela est décrit au-dessus. Le démultiplexeur de trains de bits 7 sépare les coefficients de prévision A et les signaux d'erreur quantifié (k), et fournit ceux-ci à l'outil de prévision 8. Cet outil comporte un combineur 24 qui combine les signaux d'erreur quantifiés (k) et un signal audio prévu du domaine de fréquence X(k), pour générer un signal audio reconstitué X(k) aussi dans le domaine de fréquence. L'assemblage de filtres 9 convertit le signal reconstitué X(k) du domaine de fréquence au domaine de temps, pour générer un signal audio de domaine de temps reconstitué x. Ce signal est à son tour envoyé à un outil de prévision à long terme, qui reçoit aussi les coefficients de prévision A. L'outil de prévision à long terme 26 génère une trame de temps courante prévue à partir des trames de temps reconstituées précédentes, en utilisant les coefficients de prévision pour la trame courante. Un assemblage de
filtres 25 transforme le signal prévu x.
On appréciera que les informations de commande de dispositif de prévision, transmises à partir du codeur peuvent être utilisées au niveau du décodeur pour commander l'opération de décodage. En particulier, les bits utilisés par le dispositif de prévision peuvent être utilisés dans le combinateur 24 pour déterminer si oui ou non la prévision a été utilisée dans une quelconque bande
de fréquence donnée.
Sur la Figure 5, est représenté un autre mode de réalisation du codeur de signal audio de la Figure 1, dans lequel un signal audio x devant être codé est comparé avec le signal prévu x dans le domaine de temps par un comparateur 15, pour générer un signal d'erreur e aussi dans le domaine de temps. Un outil d'assemblage de filtres 16 transforme alors le signal d'erreur du domaine de temps au domaine de fréquence, pour générer un ensemble de signaux d'erreur de sous-bande de fréquence E(k). Ces signaux sont ensuite quantifiés par un quantificateur 17, pour générer un ensemble de signaux
d'erreur quantifié (k).
Un second assemblage de filtres 18 est alors utilisé pour convertir les signaux d'erreur quantifiés (k) à nouveau dans le domaine de temps, résultant en un signal e. Ce signal d'erreur quantifié du domaine de temps e est ensuite combiné au niveau d'une unité de traitement de signal 19, avec le signal audio du domaine de temps prévu x, pour générer un signal audio quantifié x. Un outil de prévision 20 met en oeuvre la même fonction que l'outil 12 du codeur de la Figure 3, générant le signal audio prévu x et les coefficients de prévision A. Les coefficients de prévision et lessignaux d'erreur quantifiés sont combinés au niveau d'un multiplexeur de train de bits 21, pour être transmis sur le canal de transmission 22. Comme cela est décrit au- dessus, les
signaux d'erreur sont quantifiés selon un modèle psycho-
acoustique par un contrôleur 23.
Les algorithmes de codage audio décrits au-dessus permettent la compression des signaux audio à des taux de bits bas. La technique est basée sur la prévision à long terme (LT). Comparées aux techniques de prévision adaptatives de retour connues, les techniques décrites ici délivrent des gains de prévision plus grands pour des signaux de musique d'instrument seuls, et des signaux de discours, tandis qu'ils nécessitent seulement une faible
complexité de calcul.

Claims (7)

REVENDICATIONS
1 - Une méthode de codage d'un signal audio, la méthode comportant les étapes de: réception d'un signal audio x devant être codé; génération d'un signal audio quantifié x à partir du signal audio reçu x; génération d'un ensemble de coefficients de prévision à long terme A, qui peut être utilisé pour prévoir une trame de temps courante du signal audio reçu, directement à partir d'au moins une trame de temps précédente du signal audio quantifié x; utilisation des coefficients de prévision A pour générer un signal audio prévu x; comparaison du signal audio reçu x avec le signal audio prévu x, et génération d'un signal d'erreur E(k) pour chaque sous-bande de la pluralité de sous- bandes de fréquence; quantification des signaux d'erreur E(k) pour générer un ensemble de signaux d'erreur quantifiés E(k); et combinaison des signaux d'erreur quantifiés E(k) et des coefficients de prévision A pour générer un signal
audio codé.
2 - Méthode selon la revendication 1 et comportant une transformation du signal audio reçu x dans des trames xm du domaine de temps vers le domaine de
fréquence, pour fournir un ensemble de signaux de sous-
bande de fréquence X(k), et une transformation du signal audio prévu x du domaine de temps au domaine de
fréquence, pour générer un ensemble de signaux de sous-
bande de fréquence prévu X(k), dans lequel la comparaison entre le signal audio reçu x et le signal audio prévu x est effectuée dans le domaine de fréquence, en comparant des signaux de sous-bande respective les uns aux autres, pour générer les signaux d'erreur de sous-bande de
fréquence E(k).
3 - Méthode selon la revendication 1 et comportant l'application de la comparaison entre le signal audio reçu x et le signal audio prévu x dans le domaine de temps, pour générer un signal d'erreur e aussi dans le domaine de temps, et la conversion du signal d'erreur e du domaine de temps au domaine de fréquence, pour générer ladite pluralité de signaux d'erreur de
sous-bande de fréquence E(k).
4 - Méthode de décodage d'un signal audio codé, la méthode comportant les étapes de: réception d'un signal audio codé comportant un signal d'erreur quantifié E(k) pour chaque sous-bande de la pluralité de sous-bandes de fréquence du signal audio, et, pour chaque trame de temps du signal audio, un ensemble de coefficients de prévision A qui peuvent être utilisés pour prévoir une trame de temps courante xm du signal audio reçu, directement à partir d'au moins une trame de temps précédente d'un signal audio quantifié reconstitué x; génération dudit signal audio quantifié reconstitué x à partir des signaux d'erreur quantifié È(k); utilisation des coefficients de prévision A et du signal audio quantifié x pour générer un signal audio prévu x; transformation du signal audio prévu x du domaine de temps au domaine de fréquence, pour générer un ensemble de signaux de sous-bande de fréquence prévus X(k), pour la combinaison avec les signaux d'erreur quantifiés È(k), pour générer un ensemble de signaux de sous-bande de fréquence reconstitués X(k); et application d'une transformation du domaine de
fréquence au domaine de temps sur les signaux de sous-
bande de fréquence reconstitués X(k), pour générer le
signal audio quantifié reconstitué x.
- Dispositif pour le codage d'un signal audio, le dispositif comportant: une entrée pour recevoir un signal audio x devant être codé; un moyen de traitement (2, 3; 15 à 19) couplé à ladite entrée, pour générer à partir du signal audio reçu x, un signal audio quantifié x; un moyen de prévision (12; 13) couplé audit moyen de traitement (3) pour générer un ensemble de coefficients de prévision à long terme A, pour prévoir une trame de temps courante xm du signal audio reçu x, directement à partir d'au moins une trame de temps précédente du signal audio quantifié x; un moyen de génération (10 à 14; 20, 15) pour générer un signal audio prévu x en utilisant les coefficients de prévision A, et pour comparer le signal audio reçu x avec le signal audio prévu x, pour générer un signal d'erreur E(k) pour chaque sous-bande de la pluralité de sous-bandes de fréquence; un moyen de quantification (3; 17) pour quantifier les signaux d'erreur E(k), pour générer un ensemble de signaux d'erreur quantifié E(k); et un moyen de combinaison (5; 21) pour combiner les signaux d'erreur quantifiés E(k) avec les coefficients de
prévision A, pour générer un signal audio codé.
6 - Dispositif selon la revendication 5, dans lequel ledit moyen de génération comporte un premier moyen de transformation (11), pour transformer le signal audio reçu x du domaine de temps au domaine de fréquence, et un second moyen de transformation (13), pour transformer le signal audio prévu x du domaine de temps au domaine de fréquence, et un moyen de comparaison (14), prévu pour comparer les signaux du domaine de fréquence
résultant dans le domaine de fréquence.
7 - Dispositif selon la revendication 6, dans lequel le moyen de génération est prévu pour comparer le signal audio reçu x et le signal audio prévu x dans le
domaine de temps.
8 - Dispositif pour le décodage d'un signal audio codé x, dans lequel le signal audio codé comporte un signal d'erreur quantifié (k) pour chaque sous-bande d'une pluralité de sous-bandes de fréquence du signal audio, et un ensemble de coefficients de prévision A pour chaque trame de temps du signal audio, et dans lequel les coefficients de prévision A peuvent être utilisés pour prévoir une trame de temps courante xm du signal audio reçu, directement à partir d'au moins une trame de temps précédente d'un signal audio quantifié reconstitué x, le dispositif comportant: une entrée pour recevoir le signal audio codé; un moyen de génération (24, 25, 9) pour générer ledit signal audio quantifié reconstitué x à partir des signaux d'erreur quantifié E(k); et un moyen de traitement de signal (26) pour générer un signal audio prévu x à partir des coefficients de prévision A et dudit signal audio reconstitué x; dans lequel ledit moyen de génération comporte un premier moyen de transformation (25) pour transformer le signal audio prévu x du domaine de temps au domaine de
fréquence, pour générer un ensemble de signaux de sous-
bande de fréquence prévus X(k), un moyen de combinaison (24) pour combiner ledit ensemble de signaux de sous-bande de fréquence prévus X(k) avec les signaux d'erreur quantifiés E(k), pour générer un ensemble de signaux de sous-bande de fréquence reconstitués X(k), et un second moyen de transformation (9) pour appliquer une transformation du domaine de
fréquence au domaine de temps, sur les signaux de sous-
bande de fréquence reconstitués X(k), pour générer le
signal audio quantifié reconstitué x.
FR9803135A 1997-03-14 1998-03-13 Methode de codage audio et dispositif Expired - Lifetime FR2761801B1 (fr)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FI971108A FI114248B (fi) 1997-03-14 1997-03-14 Menetelmä ja laite audiokoodaukseen ja audiodekoodaukseen

Publications (2)

Publication Number Publication Date
FR2761801A1 true FR2761801A1 (fr) 1998-10-09
FR2761801B1 FR2761801B1 (fr) 1999-12-31

Family

ID=8548401

Family Applications (1)

Application Number Title Priority Date Filing Date
FR9803135A Expired - Lifetime FR2761801B1 (fr) 1997-03-14 1998-03-13 Methode de codage audio et dispositif

Country Status (13)

Country Link
US (2) US6721700B1 (fr)
EP (1) EP0966793B1 (fr)
JP (2) JP3391686B2 (fr)
KR (1) KR100469002B1 (fr)
CN (1) CN1135721C (fr)
AU (1) AU733156B2 (fr)
DE (1) DE19811039B4 (fr)
ES (1) ES2164414T3 (fr)
FI (1) FI114248B (fr)
FR (1) FR2761801B1 (fr)
GB (1) GB2323759B (fr)
SE (1) SE521129C2 (fr)
WO (1) WO1998042083A1 (fr)

Families Citing this family (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2380640A (en) * 2001-08-21 2003-04-09 Micron Technology Inc Data compression method
US6934677B2 (en) 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
US7240001B2 (en) * 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US7016547B1 (en) 2002-06-28 2006-03-21 Microsoft Corporation Adaptive entropy encoding/decoding for screen capture content
US7502743B2 (en) 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
EP2282310B1 (fr) 2002-09-04 2012-01-25 Microsoft Corporation Codage entropique par adaptation du mode de codage entre le codage à longueur de plage et le codage par niveau
US7433824B2 (en) * 2002-09-04 2008-10-07 Microsoft Corporation Entropy coding by adapting coding between level and run-length/level modes
JP4676140B2 (ja) 2002-09-04 2011-04-27 マイクロソフト コーポレーション オーディオの量子化および逆量子化
US7299190B2 (en) * 2002-09-04 2007-11-20 Microsoft Corporation Quantization and inverse quantization for audio
KR100524065B1 (ko) * 2002-12-23 2005-10-26 삼성전자주식회사 시간-주파수 상관성을 이용한 개선된 오디오 부호화및/또는 복호화 방법과 그 장치
TWI220753B (en) * 2003-01-20 2004-09-01 Mediatek Inc Method for determining quantization parameters
US7782954B2 (en) 2003-09-07 2010-08-24 Microsoft Corporation Scan patterns for progressive video content
US7688894B2 (en) 2003-09-07 2010-03-30 Microsoft Corporation Scan patterns for interlaced video content
US7724827B2 (en) * 2003-09-07 2010-05-25 Microsoft Corporation Multi-layer run level encoding and decoding
CN1860787A (zh) * 2003-09-29 2006-11-08 手持娱乐公司 用于编码信息的方法和装置
TWI227866B (en) * 2003-11-07 2005-02-11 Mediatek Inc Subband analysis/synthesis filtering method
US7933767B2 (en) * 2004-12-27 2011-04-26 Nokia Corporation Systems and methods for determining pitch lag for a current frame of information
US7970605B2 (en) * 2005-01-12 2011-06-28 Nippon Telegraph And Telephone Corporation Method, apparatus, program and recording medium for long-term prediction coding and long-term prediction decoding
US7693709B2 (en) 2005-07-15 2010-04-06 Microsoft Corporation Reordering coefficients for waveform coding or decoding
US7599840B2 (en) * 2005-07-15 2009-10-06 Microsoft Corporation Selectively using multiple entropy models in adaptive coding and decoding
US7684981B2 (en) 2005-07-15 2010-03-23 Microsoft Corporation Prediction of spectral coefficients in waveform coding and decoding
US7539612B2 (en) * 2005-07-15 2009-05-26 Microsoft Corporation Coding and decoding scale factor information
US8599925B2 (en) 2005-08-12 2013-12-03 Microsoft Corporation Efficient coding and decoding of transform blocks
US7565018B2 (en) * 2005-08-12 2009-07-21 Microsoft Corporation Adaptive coding and decoding of wide-range coefficients
US7933337B2 (en) 2005-08-12 2011-04-26 Microsoft Corporation Prediction of transform coefficients for image compression
GB2436192B (en) * 2006-03-14 2008-03-05 Motorola Inc Speech communication unit integrated circuit and method therefor
DE102006022346B4 (de) * 2006-05-12 2008-02-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Informationssignalcodierung
RU2464650C2 (ru) * 2006-12-13 2012-10-20 Панасоник Корпорэйшн Устройство и способ кодирования, устройство и способ декодирования
US8184710B2 (en) 2007-02-21 2012-05-22 Microsoft Corporation Adaptive truncation of transform coefficient data in a transform-based digital media codec
US20100292986A1 (en) * 2007-03-16 2010-11-18 Nokia Corporation encoder
US7774205B2 (en) 2007-06-15 2010-08-10 Microsoft Corporation Coding of sparse digital media spectral data
CN101075436B (zh) * 2007-06-26 2011-07-13 北京中星微电子有限公司 带补偿的音频编、解码方法及装置
US20090048827A1 (en) * 2007-08-17 2009-02-19 Manoj Kumar Method and system for audio frame estimation
EP2077550B8 (fr) * 2008-01-04 2012-03-14 Dolby International AB Encodeur audio et décodeur
WO2009132662A1 (fr) * 2008-04-28 2009-11-05 Nokia Corporation Codage/décodage pour une réponse en fréquence améliorée
US8179974B2 (en) 2008-05-02 2012-05-15 Microsoft Corporation Multi-level representation of reordered transform coefficients
KR20090122143A (ko) * 2008-05-23 2009-11-26 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
US8406307B2 (en) 2008-08-22 2013-03-26 Microsoft Corporation Entropy coding/decoding of hierarchically organized data
WO2010032992A2 (fr) * 2008-09-18 2010-03-25 한국전자통신연구원 Appareil de codage et appareil de décodage permettant de passer d’un codeur basé sur une transformée en cosinus discrète modifiée à un hétérocodeur, et inversement
WO2010091554A1 (fr) * 2009-02-13 2010-08-19 华为技术有限公司 Procédé et dispositif de détection de période de pas
DE102010006573B4 (de) * 2010-02-02 2012-03-15 Rohde & Schwarz Gmbh & Co. Kg IQ-Datenkompression für Breitbandanwendungen
ES2613747T3 (es) 2013-01-08 2017-05-25 Dolby International Ab Predicción basada en modelo en un banco de filtros críticamente muestreado
US10638227B2 (en) 2016-12-02 2020-04-28 Dirac Research Ab Processing of an audio input signal
CN112564713B (zh) * 2020-11-30 2023-09-19 福州大学 高效率低时延的动觉信号编解码器及编解码方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4538234A (en) * 1981-11-04 1985-08-27 Nippon Telegraph & Telephone Public Corporation Adaptive predictive processing system
US5206884A (en) * 1990-10-25 1993-04-27 Comsat Transform domain quantization technique for adaptive predictive coding
WO1996019876A1 (fr) * 1994-12-20 1996-06-27 Dolby Laboratories Licensing Corporation Procede et appareil pour appliquer une prediction des formes d'onde a des sous-bandes d'un systeme de codage perceptif

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4969192A (en) 1987-04-06 1990-11-06 Voicecraft, Inc. Vector adaptive predictive coder for speech and audio
GB8803390D0 (en) 1988-02-13 1988-03-16 Univ Belfast Method and apparatus for electrical signal coding
FR2628589B1 (fr) * 1988-03-14 1994-03-04 Etat Francais Codeur differentiel a filtre predicteur auto-adaptatif et decodeur utilisable en liaison avec un tel codeur
EP0364647B1 (fr) * 1988-10-19 1995-02-22 International Business Machines Corporation Codeurs par quantification vectorielle
IT1232084B (it) * 1989-05-03 1992-01-23 Cselt Centro Studi Lab Telecom Sistema di codifica per segnali audio a banda allargata
FR2646978B1 (fr) 1989-05-11 1991-08-23 France Etat Procede et installation a codage de signaux sonores
US5115240A (en) * 1989-09-26 1992-05-19 Sony Corporation Method and apparatus for encoding voice signals divided into a plurality of frequency bands
US5754976A (en) * 1990-02-23 1998-05-19 Universite De Sherbrooke Algebraic codebook with signal-selected pulse amplitude/position combinations for fast coding of speech
CA2010830C (fr) 1990-02-23 1996-06-25 Jean-Pierre Adoul Regles de codage dynamique permettant un codage efficace des paroles au moyen de codes algebriques
JPH04119542A (ja) 1990-09-07 1992-04-21 Nikon Corp 光磁気記録媒体カートリッジ
FI95085C (fi) 1992-05-11 1995-12-11 Nokia Mobile Phones Ltd Menetelmä puhesignaalin digitaaliseksi koodaamiseksi sekä puhekooderi menetelmän suorittamiseksi
FI91345C (fi) 1992-06-24 1994-06-10 Nokia Mobile Phones Ltd Menetelmä kanavanvaihdon tehostamiseksi
SG47025A1 (en) * 1993-03-26 1998-03-20 Motorola Inc Vector quantizer method and apparatus
IT1270438B (it) * 1993-06-10 1997-05-05 Sip Procedimento e dispositivo per la determinazione del periodo del tono fondamentale e la classificazione del segnale vocale in codificatori numerici della voce
FI98163C (fi) * 1994-02-08 1997-04-25 Nokia Mobile Phones Ltd Koodausjärjestelmä parametriseen puheenkoodaukseen
EP0709981B1 (fr) * 1994-10-28 2002-01-09 RAI RADIOTELEVISIONE ITALIANA (S.p.A.) Codage de signaux en sous-bandes avec codage prédictif basé sur la hauteur du ton dans chaque sous-bande
US5706395A (en) * 1995-04-19 1998-01-06 Texas Instruments Incorporated Adaptive weiner filtering using a dynamic suppression factor
TW321810B (fr) * 1995-10-26 1997-12-01 Sony Co Ltd
JP3481027B2 (ja) * 1995-12-18 2003-12-22 沖電気工業株式会社 音声符号化装置
US5778335A (en) * 1996-02-26 1998-07-07 The Regents Of The University Of California Method and apparatus for efficient multiband celp wideband speech and music coding and decoding
FI964975A (fi) * 1996-12-12 1998-06-13 Nokia Mobile Phones Ltd Menetelmä ja laite puheen koodaamiseksi

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4538234A (en) * 1981-11-04 1985-08-27 Nippon Telegraph & Telephone Public Corporation Adaptive predictive processing system
US5206884A (en) * 1990-10-25 1993-04-27 Comsat Transform domain quantization technique for adaptive predictive coding
WO1996019876A1 (fr) * 1994-12-20 1996-06-27 Dolby Laboratories Licensing Corporation Procede et appareil pour appliquer une prediction des formes d'onde a des sous-bandes d'un systeme de codage perceptif

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
NAYEBI ET AL.: "Analysis of the self-excited subband coder: a new approach to medium band speech coding", 1988 INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING (ICASSP 88), vol. 1, 11 April 1988 (1988-04-11) - 14 April 1988 (1988-04-14), NEW YORK, NY, US, pages 390 - 393, XP002088698 *

Also Published As

Publication number Publication date
EP0966793A1 (fr) 1999-12-29
FI114248B (fi) 2004-09-15
AU733156B2 (en) 2001-05-10
KR20000076273A (ko) 2000-12-26
CN1135721C (zh) 2004-01-21
ES2164414T3 (es) 2002-02-16
GB2323759A (en) 1998-09-30
WO1998042083A1 (fr) 1998-09-24
EP0966793B1 (fr) 2001-09-19
US6721700B1 (en) 2004-04-13
GB9805294D0 (en) 1998-05-06
DE19811039B4 (de) 2005-07-21
SE521129C2 (sv) 2003-09-30
GB2323759B (en) 2002-01-16
DE19811039A1 (de) 1998-09-17
FR2761801B1 (fr) 1999-12-31
SE9800776D0 (sv) 1998-03-10
JP3391686B2 (ja) 2003-03-31
US7194407B2 (en) 2007-03-20
AU6216498A (en) 1998-10-12
JP2003140697A (ja) 2003-05-16
JPH10282999A (ja) 1998-10-23
FI971108A (fi) 1998-09-15
SE9800776L (sv) 1998-09-15
KR100469002B1 (ko) 2005-01-29
CN1195930A (zh) 1998-10-14
FI971108A0 (fi) 1997-03-14
US20040093208A1 (en) 2004-05-13

Similar Documents

Publication Publication Date Title
FR2761801A1 (fr) Methode de codage audio et dispositif
KR101220621B1 (ko) 부호화 장치 및 부호화 방법
EP0002998B1 (fr) Procédé de compression de données relatives au signal vocal et dispositif mettant en oeuvre ledit procédé
JP5215994B2 (ja) 損失エンコ−ドされたデータ列および無損失拡張データ列を用いた、原信号の無損失エンコードのための方法および装置
RU2402160C2 (ru) Масштабируемый сжатый битовый поток аудио и кодек, использующий иерархический набор фильтров и многоканальное совместное кодирование
KR101120911B1 (ko) 음성신호 복호화 장치 및 음성신호 부호화 장치
KR100986924B1 (ko) 정보 신호 인코딩
KR101397736B1 (ko) 유손실 인코딩 데이터 스트림 및 무손실 확장 데이터 스트림을 이용하는 소스 신호의 무손실 인코딩을 위한 방법및 장치
FR2938688A1 (fr) Codage avec mise en forme du bruit dans un codeur hierarchique
EP1905010A2 (fr) Dispositif de codage/decodage hierarchique
EP2171713B1 (fr) Codage de signaux audionumériques
FR2759510A1 (fr) Methode de codage audio et dispositif
AU2011205144B2 (en) Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding
JP2008026372A (ja) 符号化データの符号化則変換方法および装置
Feerick How much delay is too much delay?
FR2737360A1 (fr) Procedes de codage et de decodage de signaux audiofrequence, codeur et decodeur pour la mise en oeuvre de tels procedes
JP2008268792A (ja) オーディオ信号符号化装置およびそのビットレート変換装置

Legal Events

Date Code Title Description
PLFP Fee payment

Year of fee payment: 19

TP Transmission of property

Owner name: NOKIA CORPORATION, FI

Effective date: 20161118

TP Transmission of property

Owner name: NOKIA TECHNOLOGIES OY, FI

Effective date: 20170109

PLFP Fee payment

Year of fee payment: 20