EP2023339B1

EP2023339B1 - Codeur audio à faible retard

Info

Publication number: EP2023339B1
Application number: EP07113397A
Authority: EP
Inventors: Willem Bastiaan Kleijn; Li Minyue
Original assignee: Global IP Solutions GIPS AB; Global IP Solutions Inc
Current assignee: Global IP Solutions GIPS AB; Global IP Solutions Inc
Priority date: 2007-07-30
Filing date: 2007-07-30
Publication date: 2010-08-25
Anticipated expiration: 2027-07-30
Also published as: EP2023339A1; DE602007008717D1; ATE479182T1; WO2009015944A1

Claims

Procédé de codage d'un signal d'entrée (120), ledit procédé incluant les étapes consistant à :
générer un signal reconstruit (121) d'après des segments de signal codés anciens dudit signal d'entrée (120) ;

extraire des paramètres de modèle dudit signal reconstruit (121) ;

ajouter au moins un premier modèle de distribution auquel les paramètres de modèle extraits sont associés et au moins un modèle de distribution fixe, dans lequel des coefficients de pondération sont affectés à chacun de ces modèles de distribution, pour obtenir un modèle de distribution mixte ;

coder un segment de signal actuel dudit signal d'entrée (120) en une séquence de données codées en utilisant ledit modèle de distribution mixte ; et

générer un flux binaire (124) incluant ladite séquence de données codées et une information concernant ledit modèle de distribution mixte correspondant audit segment de signal actuel.
Procédé selon la revendication 1, dans lequel l'information concernant ledit modèle de distribution mixte est codée comme une information d'accompagnement sous la forme d'un index de modèle spécifiant au moins lesdits coefficients de pondération.
Procédé selon la revendication 1 ou 2, dans lequel les coefficients de pondération sont choisis afin de minimiser une longueur de code estimée dudit segment de signal actuel.
Procédé selon une quelconque des revendications précédentes, dans lequel l'étape de codage inclut les étapes consistant à :
quantifier ledit segment de signal actuel en utilisant ledit modèle de distribution mixte ; et

coder le segment de signal actuel quantifié en ladite séquence de données codées.
Procédé selon une quelconque des revendications 1 à 3, dans lequel l'étape de codage inclut les étapes consistant à :
quantifier ledit segment de signal actuel ; et

coder le segment de signal actuel quantifié dans ladite séquence de données codées en utilisant ledit modèle de distribution mixte.
Procédé selon la revendication 4 ou 5, dans lequel la taille de cellule de quantification utilisée pour l'étape de quantification d'un jeu d'échantillons particulier est constante.
Procédé selon une quelconque des revendications précédentes, dans lequel le modèle de distribution fixe est un modèle de distribution uniforme.
Procédé selon une quelconque des revendications précédentes, dans lequel le premier modèle de distribution est un modèle de distribution Gaussien et les paramètres de modèle extraits sont des paramètres dudit modèle de distribution Gaussien.
Procédé selon une quelconque des revendications précédentes, dans lequel ledit modèle de distribution mixte est un modèle de mélange incluant en outre au moins un modèle de distribution adaptatif choisi en réponse aux paramètres de modèle extraits, auquel modèle de distribution adaptatif un facteur de pondération est affecté, et lequel modèle de distribution adaptatif pondéré est ajouté au premier modèle et au modèle de distribution pondéré fixe pour obtenir le modèle de distribution mixte.
Procédé selon une quelconque des revendications précédentes, dans lequel le modèle de distribution mixte est choisi parmi une pluralité de modèles de distribution mixtes, en réponse à une longueur de code d'un sous-segment dudit segment de signal actuel et une longueur de code utilisée pour décrire le modèle de distribution dudit signal reconstruit.
Procédé selon une quelconque des revendications précédentes, dans lequel, avant l'étape de génération d'un signal reconstruit, le procédé inclut les étapes consistant à :
appliquer un filtre perceptuel à un segment de signal dudt signal d'entrée (120) ;

appliquer une transformée au segment de signal filtré ; et

quantifier le segment de signal filtré et transformé.
Procédé selon la revendication 11, dans lequel l'étape de génération d'un signal reconstruit inclut les étapes consistant :
appliquer une transformée inverse au segment de signal quantifié ; et

appliquer un filtre de pondération inverse au segment de signal transformé inversement.
Procédé selon une quelconque des revendications précédentes, dans lequel les coefficients de pondération sont biaisés pour minimiser la propagation d'erreur.
Procédé selon une quelconque des revendications précédentes, dans lequel le coefficient de pondération affecté au premier modèle de distribution est biaisé vers une valeur de zéro pour minimiser la propagation d'erreur.
Procédé selon une quelconque des revendications 1 à 13, dans lequel le coefficient de pondération affecté au premier modèle de distribution est comparé avec une valeur de seuil en dessous de laquelle le coefficient de pondération est fixé à zéro.
Appareil de codage d'un signal d'entrée (120), ledit appareil incluant :
un moyen de reconstruction (117) pour générer un signal reconstruit (121) d'après des segments de signal codés anciens dudit signal d'entrée (120) ;

un moyen d'extraction (118) pour extraire des paramètres de modèle dudit signal reconstruit (121) ;

un modélisateur (113) adapté afin d'ajouter au moins un premier modèle de distribution généré par au moins un premier générateur de distribution (303) avec lesdits paramètres de modèle et au moins un modèle de distribution fixe généré par au moins un second générateur de distribution (301), dans lequel un livre de code de pondération (304) affecte les coefficients de pondération à chacun de ces modèles de distribution, pour obtenir un modèle de distribution mixte ;

un codeur (119) pour coder un segment de signal actuel dudit signal d'entrée (120) en une séquence de données codées en utilisant le modèle de distribution mixte ; et

un multiplexeur (116) recevant l'information concernant le modèle de distribution mixte provenant du modélisateur (113) et la séquence de données codées provenant du codeur (119) pour générer un flux binaire (124) correspondant audit segment de signal actuel.
Appareil selon la revendication 16, dans lequel un second générateur de mot de code (100) code une information concernant le modèle de distribution mixte comme une information d'accompagnement sous la forme d'un index de modèle spécifiant au moins lesdits coefficients de pondération.
Appareil selon la revendication 16 ou 17, dans lequel ledit livre de code de pondération (304) sélectionne les coefficients de pondération pour minimiser une longueur de code estimée par un estimateur (305).
Appareil selon une quelconque des revendications 16 à 18, dans lequel le codeur (119) inclut :
un quantificateur (104) pour quantifier ledit segment de signal actuel en utilisant ledit modèle de distribution mixte ; et

un premier générateur de mot de code (109) pour coder le segment de signal actuel quantité en ladite séquence de données codées.
Appareil selon une quelconque des revendications 16 à 18, dans lequel le codeur (119) inclut :
un quantificateur (104) pour quantifier ledit segment de signal actuel ; et

un premier générateur de mot de code (109) pour coder le segment de signal actuel quantifié en ladite séquence de données codées en utilisant ledit modèle de distribution mixte.
Appareil selon la revendication 19 ou 20, dans lequel le quantificateur (104) est un quantificateur scalaire.
Appareil selon une quelconque des revendications 19 à 21, dans lequel la taille de cellule de quantification dudit quantificateur (104) est constante pour un jeu particulier d'échantillons.
Appareil selon une quelconque des revendications 16 à 22, dans lequel le modèle de distribution fixe du second générateur de distribution (301) est un modèle de distribution uniforme.
Appareil selon une quelconque des revendications 16 à 23, dans lequel le premier modèle de distribution du premier générateur de distribution (303) est un modèle de distribution Gaussien et les paramètres de modèle extraits sont des paramètres dudit modèle de distribution Gaussien.
Appareil selon une quelconque des revendications 16 à 24, dans lequel le modélisateur (113) inclut en outre au moins un générateur de distribution adaptatif (302) pour générer un modèle de distribution adaptatif choisi en réponse aux paramètres de modèle extraits, dans lequel ledit libre de code de pondération (304) affecte un coefficient de pondération audit modèle de distribution adaptatif, et dans lequel ledit modélisateur (113) obtient le modèle de distribution mixte en ajoutant, chacun des modèles de distribution étant multipliés par son coefficient de pondération correspondant, ledit modèle de distribution adaptatif auxdits modèles de distribution premier et fixe.
Appareil selon une quelconque des revendications 16 à 25, dans lequel le modélisateur (113) sélectionne le modèle de distribution mixte parmi une pluralité de modèles de distribution mixtes en réponse à une longueur de code d'un sous-segment dudit segment de signal actuel et une longueur de code utilisée pour décrite le modèle de distribution dudit signal reconstruit (121).
Appareil selon une quelconque des revendications 19 à 26, dans lequel, avant d'être soumis au moyen de reconstruction (117), le signal d'entrée (120) est soumis à :
un filtre de pondération perceptuel (101) pour filtrer un segment de signal ;

un transformateur (102) pour appliquer une transformée au segment de signal filtré ; et

le quantificateur (104) du codeur (119) pour quantifier le segment de signal transformé.
Appareil selon la revendication 27, dans lequel le moyen de reconstruction (117) inclut :
un transformateur inverse (106) pour appliquer une transformée inverse au segment de signal quantifié ; et

un filtre de pondération inverse (108) pour appliquer un filtre de pondération inverse au segment de signal transformé inversement.
Appareil selon la revendication 28, incluant en outre :
un premier moyen de correction (114) disposé entre ledit filtre de pondération perceptuel (101) et ledit transformateur (102) afin d'effectuer une soustraction de réponse d'entrée zéro sur le segment de signal filtré ; et

un second moyen de correction (115) disposé entre ledit transformateur inverse (106) et le filtre de pondération inverse (108) afin d'effectuer une addition de réponse d'entrée zéro au segment de signal transformé inversement.
Appareil selon la revendication 28 ou 29, incluant en outre :
un moyen de normalisation (103) disposé entre ledit transformateur (102)et ledit quantificateur (104) afin d'effecteur une normalisation du segment de signal transformé ; et

un moyen de dénormalisation (105) disposé entre ledit quantificateur (104) et ledit transformateur inverse (106) afin d'effectuer une dénormalisation du segment de signal transformé inversement.
Appareil selon la revendication 29 ou 30, incluant en outre un calculateur de réponse (107) pour fournir une réponse d'entrée zéro au moyen de correction (114, 115).
Appareil selon une quelconque des revendications 16 à 31, dans lequel ledit moyen d'extraction (118) inclut un analyseur prédictif linéaire (110).
Appareil selon une quelconque des revendications 16 à 32, dans lequel ledit modélisateur (113) biaise les coefficients de pondération pour minimiser la propagation d'erreur.
Appareil selon une quelconque des revendications 16 à 33, dans lequel ledit modélisateur (113) biaise la sélection des coefficients de pondération des modèles de distribution qui sont basés sur les signaux anciens reconstruits vers une valeur de zéro pour minimiser la propagation d'erreur.
Appareil selon une quelconque des revendications 16 à 34, dans lequel ledit modélisateur (113) compare le coefficient de pondération du premier modèle de distribution avec une valeur de seuil en dessous de laquelle il fixe le coefficient de pondération à zéro.
Procédé de décodage d'un flux binaire (124) de données codées, ledit procédé incluant les étapes consistant à :
extraire dudit flux binaire (124) une séquence actuelle de données codées et un index de modèle codé (223) incluant une information concernant un modèle de distribution mixte, laquelle information inclut des coefficients de pondération ;

extraire des paramètres de modèle d'une partie existante d'un signal reconstruit (221) correspondant aux séquences anciennes dudit flux binaire (124) ;

ajouter au moins un premier modèle de distribution auquel lesdits paramètres de modèle sont associés et au moins un modèle de distribution fixe, dans lequel les coefficients de pondération sont affectés aux modèles de distribution correspondants conformément à l'index de modèle (223), pour obtenir un modèle de distribution mixte ;

décoder ladite séquence actuelle de données codées en une séquence actuelle de données décodées en utilisant ledit modèle de distribution mixte ; et

générer une partie du signal reconstruit (221) d'après ladite séquence actuelle de données décodées.
Procédé selon la revendication 36, dans lequel l'index de modèle est reçu comme une information d'accompagnement.
Procédé selon la revendication 36 ou 37, dans lequel le modèle de distribution fixe est un modèle de distribution uniforme.
Procédé selon une quelconque des revendications 36 à 38, dans lequel le premier modèle de distribution est un modèle de distribution Gaussien.
Procédé selon une quelconque des revendications 36 à 39, dans lequel le modèle de distribution mixte est un modèle de mélange incluant au moins un modèle de distribution adaptatif choisi en réponse auxdits paramètres de modèle, auquel modèle de distribution adaptatif un facteur de pondération est affecté conformément audit index de modèle (223), et lequel modèle de distribution adaptatif pondéré est ajouté au premier modèle de distribution et au modèle de distribution fixe pondéré pour obtenir le modèle de distribution mixte.
Procédé selon une quelconque des revendications 36 à 40, dans lequel l'étape de décodage inclut les étapes consistant à :
interpréter un mot de code des données codées ; et

déquantifier les données décodées sur la base dudit mot de code.
Procédé selon une quelconque des revendications 36 à 41, incluant en outre une étape d'interprétation d'un mot de code de l'index de modèle codé pour extraire l'index de modèle.
Procédé selon une quelconque des revendications 41 ou 42, dans lequel l'étape de génération d'un signal reconstruit inclut les étapes consistant à :
appliquer une transformée inverse aux données déquantifiées ; et

appliquer un filtre de pondération inverse aux données transformées inversement.
Procédé selon la revendication 43, dans lequel, entre l'étape de déquantification et l'étape d'application d'une transformée inverse, l'étape de génération d'un signal reconstruit inclut en outre l'étape consistant à :
effectuer une dénormalisation des données déquantifiées.
Procédé selon la revendication 43 ou 44, dans lequel, entre l'étape d'application d'une transformée inverse et l'étape d'application d'un filtre de pondération inverse, l'étape de génération d'un signal reconstruit inclut en outre l'étape consistant à :
corriger les données en effectuant une addition de la réponse d'entrée zéro aux données transformées inversement.
Appareil de décodage d'un flux binaire (124) de données codées, ledit appareil incluant :
un démultiplexeur (214) pour démultiplexer ledit flux binaire (124) en une séquence actuelle de données codées et un index de modèle (223) incluant une information concernant un modèle de distribution mixte, laquelle information inclut des coefficients de pondération ;

un moyen d'extraction (218) pour extraire des paramètres de modèle d'une partie existante d'un signal reconstruit (221) correspondant aux séquences anciennes dudit flux binaire (124) ;

un modélisateur (213) adapté afin d'ajouter au moins un premier modèle de distribution généré avec les paramètres de modèle extraits par au moins un premier générateur (403) et au moins un modèle de distribution fixe généré par au moins un second générateur (401), dans lequel un livre de code de pondération (404) affecte les coefficients de pondération aux modèles de distribution conformément audit index de modèle (223), pour obtenir un modèle de distribution mixte ;

un décodeur (219) pour décoder ladite séquence actuelle de données codées en une séquence actuelle de données décodées en utilisant ledit modèle de distribution mixte ; et

un moyen de reconstruction (217) pour générer une partie du signal reconstruit (221) d'après ladite séquence actuelle de données décodées.
Appareil selon la revendication 46, dans lequel un démultiplexeur (214) reçoit l'index de modèle codé (223) comme une information d'accompagnement.
Appareil selon la revendication 46 ou 47, dans lequel le modèle de distribution fixe est un modèle de distribution uniforme.
Appareil selon une quelconque des revendications 46 à 48, dans lequel le premier modèle de distribution est un modèle de distribution Gaussien et les paramètres de modèle extraits sont des paramètres du modèle de distribution Gaussien.
Appareil selon une quelconque des revendications 46 à 49, dans lequel ledit modélisateur (213) inclut en outre au moins un troisième générateur (402) pour générer au moins un modèle de distribution adaptatif avec les paramètres de modèle extraits, dans lequel ledit livre de code de pondération affecte un coefficient de pondération audit modèle de distribution adaptatif conformément audit index de modèle (223), et dans lequel ledit modélisateur (213) obtient le modèle de distribution mixte en ajoutant, chacun des modèles de distribution étant multiplié par son coefficient de pondération correspondant, ledit modèle de distribution adaptatif auxdits modèles de distribution premier et fixe.
Appareil selon une quelconque des revendications 46 à 50, dans lequel ledit décodeur (219) inclut un premier interprète de mot de code (209) et un déquantificateur (204) pour décoder la séquence actuelle de données codées.
Appareil selon une quelconque des revendications 46 à 51, incluant en outre un second interprète de mot de code (200) pour interpréter un mot de code correspondant à l'index de modèle codé.
Appareil selon une quelconque des revendications 51 ou 52, dans lequel ledit moyen de reconstruction (217) inclut :
un transformateur inverse (206) pour appliquer une transformée inverse aux données déquantifiées ; et

un filtre de pondération inverse (208) pour appliquer une pondération inverse aux données transformées inversement.
Appareil selon la revendication 53, dans lequel un moyen de dénormalisation (205) est disposé entre ledit déquantificateur (204) et ledit transformateur inverse (206) pour effectuer une dénormalisation des données déquantifiées.
Appareil selon la revendication 53 ou 54, dans lequel un moyen de correction (215) est disposé entre ledit transformateur inverse (206) et ledit filtre de pondération inverse (208) pour effectuer une addition d'une réponse d'entrée zéro aux données transformées inversement.
Appareil selon la revendication 55, incluant en outre un prédicteur linaire (207) pour fournir la réponse d'entrée zéro audit moyen de correction (215).
Appareil selon une quelconque des revendications 46 à 56, dans lequel ledit moyen d'extraction (218) inclut un analyseur prédictif linéaire (210).
Support lisible par ordinateur comportant des instructions exécutables pour mettre en oeuvre chacune des étapes du procédé selon une quelconque des revendications 1 à 15 quand il est exécuté sur une unité de traitement.
Support lisible par ordinateur comportant des instructions exécutables pour mettre en oeuvre chacune des étapes du procédé selon une quelconque des revendications 36 à 45 quand il est exécuté sur une unité de traitement.