EP3872809B1

EP3872809B1 - Intégration rétrocompatible de techniques de reconstruction haute fréquence pour signaux audio

Info

Publication number: EP3872809B1
Application number: EP21164481.0A
Authority: EP
Inventors: Kristofer Kjoerling; Lars Villemoes; Heiko Purnhagen; Per Ekstrand
Original assignee: Dolby International AB
Current assignee: Dolby International AB
Priority date: 2018-01-26
Filing date: 2019-01-28
Publication date: 2022-07-27
Anticipated expiration: 2039-01-28
Also published as: EP4303870A3; DK4120261T3; PL3518233T3; ES2871872T3; EP4303869A3; EP3518233B1; DK3872809T3; HUE062211T2; DK3518233T3; EP4099325B1; FI4120261T3; EP4120261B1; HUE054531T2; EP4303870A2; EP4120261A1; ES2924955T3; ES2948839T3; EP3872809A1; DK4099325T3; FI4099325T3

Claims

Procédé pour effectuer une reconstruction haute fréquence d'un signal audio, le procédé comprenant les étapes consistant à :
recevoir un flux binaire audio encodé, le flux binaire audio encodé incluant des données audio représentant une portion à bande basse du signal audio et des métadonnées de reconstruction haute fréquence ;

décoder les données audio pour générer un signal audio à bande basse décodé ;

extraire, du flux binaire audio encodé, les métadonnées de reconstruction haute fréquence, les métadonnées de reconstruction haute fréquence incluant des paramètres de fonctionnement pour un processus de reconstruction haute fréquence, les paramètres de fonctionnement incluant un paramètre de mode de raccordement situé dans un récipient d'extension rétrocompatible du flux binaire audio encodé, dans lequel une première valeur du paramètre de mode de raccordement indique une translation spectrale et une seconde valeur du paramètre de mode de raccordement indique une transposition harmonique par propagation de fréquence de vocodeur de phase ;

filtrer le signal audio à basse bande décodé pour générer un signal audio à basse bande filtré ;

régénérer une portion à haute bande du signal audio en utilisant le signal audio à basse bande filtré et les métadonnées de reconstruction haute fréquence, dans lequel la régénération inclut la translation spectrale si le paramètre de mode de raccordement est la première valeur et la régénération inclut une transposition harmonique par propagation de fréquence de vocodeur de phase si le paramètre de mode de raccordement est la seconde valeur ; et

combiner le signal audio à basse bande filtré avec la portion à haute bande régénérée pour former un signal audio à large bande ;

dans lequel le flux binaire audio encodé inclut en outre un élément de remplissage avec un identifiant indiquant un début de l'élément de remplissage et des données de remplissage après l'identifiant, dans lequel les données de remplissage incluent le récipient d'extension rétrocompatible, dans lequel les données de remplissage incluent une charge utile d'extension, la charge utile d'extension inclut des données d'extension de reproduction de bande spectrale, et la charge utile d'extension est identifiée avec un bit le plus significatif transmis par un entier non signé de quatre bits en premier et présentant une valeur de « 1101 » ou « 1110 » ;

dans lequel le récipient d'extension rétrocompatible inclut des données de commande de filtrage inverse à utiliser lorsque le paramètre de mode de raccordement est égal à la seconde valeur.
Procédé selon la revendication 1, dans lequel le filtrage est effectué par un banc de filtres d'analyse qui incluent des filtres d'analyse, h_k(n), qui sont des versions modulées d'un filtre prototype, p₀(n), selon : $\begin{matrix} h_{k} (n) = p_{0} (n) \exp \{i \frac{π}{M} (k + \frac{1}{2}) (n - \frac{N}{2})\}, & 0 \leq n \leq N; 0 \leq k < M \end{matrix}$
où p₀(n) est un filtre prototype symétrique ou asymétrique à valeur réelle, M est un nombre de canaux dans le banc de filtres d'analyse et N est un ordre du filtre prototype.
Procédé selon la revendication 2, dans lequel le filtre prototype, po(n), est dérivé de coefficients du Tableau 4 dans le présent document.
Procédé selon la revendication 2, dans lequel le filtre prototype, po(n), est dérivé de coefficients du Tableau 4 dans le présent document par une ou plusieurs opérations mathématiques sélectionnées parmi le groupe consistant en l'arrondissement, le sous-échantillonnage, l'interpolation ou la décimation.
Procédé selon l'une quelconque des revendications 1-4, dans lequel un changement de phase est ajouté au signal audio à basse bande filtré après le filtrage et compensé avant la combinaison pour réduire une complexité du procédé.
Support non transitoire lisible sur ordinateur contenant des instructions qui, lorsqu'elles sont exécutées par un processeur, effectuent le procédé selon l'une quelconque des revendications 1 à 5.
Unité de traitement audio pour effectuer une reconstruction haute fréquence d'un signal audio, l'unité de traitement audio comprenant :
une interface d'entrée pour recevoir un flux binaire audio encodé, le flux binaire audio encodé incluant des données audio représentant une portion à basse bande du signal audio et des métadonnées de reconstruction haute fréquence ;

un décodeur audio principal (202) pour décoder les données audio pour générer un signal audio à basse bande décodé ;

un déformateur (205, 215) pour extraire, du flux binaire audio encodé, les métadonnées de reconstruction haute fréquence, les métadonnées de reconstruction haute fréquence incluant des paramètres de fonctionnement pour un processus de reconstruction haute fréquence, les paramètres de fonctionnement incluant un paramètre de mode de raccordement situé dans un récipient d'extension rétrocompatible du flux binaire audio encodé, dans lequel une première valeur du paramètre de mode de raccordement indique une translation spectrale et une seconde valeur du paramètre de mode de raccordement indique une transposition harmonique par propagation de fréquence de vocodeur de phase ;

un banc de filtres d'analyse (203, 213) pour filtrer le signal audio à basse bande décodé pour générer un signal audio à basse bande filtré ;

un régénérateur haute fréquence (203, 213) pour reconstruire une portion à haute bande du signal audio en utilisant le signal audio à basse bande filtré et les métadonnées de reconstruction haute fréquence, dans lequel la reconstruction inclut une translation spectrale si le paramètre de mode de raccordement est la première valeur et la reconstruction inclut une transposition harmonique par propagation de fréquence de vocodeur de phase si le paramètre de mode de raccordement est la seconde valeur; et

un banc de filtres de synthèse (203, 213) pour combiner le signal audio à basse bande filtré avec la portion à haute bande régénérée pour former un signal audio à large bande ;

dans lequel le flux binaire audio encodé inclut en outre un élément de remplissage avec un identifiant indiquant un début de l'élément de remplissage et des données de remplissage après l'identifiant, dans lequel les données de remplissage incluent le récipient d'extension rétrocompatible, dans lequel les données de remplissage incluent une charge utile d'extension, la charge utile d'extension inclut des données d'extension de reproduction de bande spectrale, et la charge utile d'extension est identifiée avec un bit le plus significatif transmis par un entier non signé de quatre bits en premier et présentant une valeur de « 1101 » ou « 1110 » ;

dans lequel le récipient d'extension rétrocompatible inclut des données de commande de filtrage inverse à utiliser lorsque le paramètre de mode de raccordement est égal à la seconde valeur.