EP3544005B1

EP3544005B1 - Codage audio avec de la quantification tramée

Info

Publication number: EP3544005B1
Application number: EP18187597.2A
Authority: EP
Inventors: Johannes Fischer; Tom BÄCKSTRÖM; Sneha DAS
Original assignee: Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Current assignee: Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date: 2018-03-22
Filing date: 2018-08-06
Publication date: 2021-12-15
Anticipated expiration: 2038-08-06
Also published as: EP3544005A1

Claims

Codeur audio pour coder un signal audio, dans lequel le signal audio est représenté dans un domaine spectral, dans lequel le codeur audio comprend:
un codeur d'enveloppe spectrale (110) configuré pour déterminer une enveloppe spectrale du signal audio et pour coder l'enveloppe spectrale, et

un codeur d'échantillons spectraux (120) configuré pour coder une pluralité d'échantillons spectraux du signal audio,

dans lequel le codeur d'échantillons spectraux (120) est configuré pour estimer un débit binaire estimé nécessaire pour coder chaque échantillon spectral parmi un ou plusieurs échantillons spectraux de la pluralité d'échantillons spectraux en fonction de l'enveloppe spectrale, et

dans lequel le codeur d'échantillons spectraux (120) est configuré pour coder chaque échantillon spectral de la pluralité d'échantillons spectraux, en fonction du débit binaire estimé nécessaire pour le codage des un ou plusieurs échantillons spectraux, selon une première règle de codage ou selon une deuxième règle de codage qui est différente de la première règle de codage,

dans lequel la deuxième règle de codage comprend le fait d'utiliser un codec entropique et de réaliser une quantification, et dans lequel la première règle de codage comprend le fait d'utiliser un codage tramé; et

dans lequel le codeur d'échantillons spectraux (120) est configuré pour coder les un ou plusieurs échantillons spectraux à l'aide d'un codage tramé si le débit binaire estimé est inférieur ou égal à une valeur de seuil; et dans lequel le codeur d'échantillons spectraux (120) est configuré pour coder les un ou plusieurs échantillons spectraux à l'aide d'un codage entropique et pour réaliser une quantification si le débit binaire estimé est supérieur à la valeur de seuil.
Codeur audio selon la revendication 1,
dans lequel la valeur de seuil est de 1 bit/échantillon.
Codeur audio selon la revendication 1 ou 2,
dans lequel le codeur d'échantillons spectraux (120) est configuré pour estimer le débit binaire estimé nécessaire pour coder chaque échantillon spectral des un ou plusieurs échantillons spectraux en fonction d'une variance estimée dudit échantillon spectral qui dépend de l'enveloppe spectrale.
Codeur audio selon la revendication 1 ou 2,
dans lequel le codeur d'échantillons spectraux (120) est configuré pour estimer le débit binaire estimé nécessaire pour coder chaque échantillon spectral des un ou plusieurs échantillons spectraux en fonction de l'équation $b_{k} = \frac{1}{2} \log_{2} (4.1159 σ_{k}^{2})$

où b_k est un k-ème échantillon spectral des un ou plusieurs échantillons spectraux,

où $σ_{k}^{2}$
est une variance estimée dudit échantillon spectral.
Codeur audio selon l'une des revendications précédentes,
dans lequel le codeur d'échantillons spectraux (120) est configuré pour coder les échantillons spectraux qui sont codés selon la deuxième règle de codage en quantifiant lesdits échantillons spectraux qui sont codés selon la deuxième règle de codage à l'aide d'une matrice orthogonale, et

dans lequel le codeur d'échantillons spectraux (120) est configuré pour coder les échantillons spectraux qui sont codés selon la première règle de codage en quantifiant lesdits échantillons spectraux qui sont codés selon la première règle de codage sans utiliser la matrice orthogonale.
Codeur audio selon la revendication 5,
dans lequel le codeur d'échantillons spectraux (120) est configuré pour coder les échantillons spectraux qui sont codés selon la deuxième règle de codage à l'aide de: $Q_{B} [Ax],$

où x est un vecteur comprenant les échantillons spectraux, avec $x \in ℝ^{N \times 1}$
, où N est un nombre de coefficients d'un spectre,

où Q_B [·] est un quantificateur défini comme $Q_{B} [y] : = γ [\begin{matrix} sign (y_{0}) \\ sign (y_{1}) \\ ⋮ \\ sign (y_{B} - 1) \\ 0 \\ ⋮ \\ 0 \end{matrix}]$

où y0, y1, yB-1 sont des valeurs quantifiées résultant de la quantification,

où B indique un débit binaire total,

où Υ est un coefficient de mise à échelle,

où A est la matrice orthogonale, avec $A \in ℝ^{N \times N}$
.
Décodeur audio pour décoder un signal audio codé, dans lequel le décodeur audio comprend:
une interface (130) configurée pour recevoir une enveloppe spectrale codée du signal audio et configurée pour recevoir une pluralité codée d'échantillons spectraux du signal audio, et

une unité de décodage (140) configurée pour décoder le signal audio codé en décodant l'enveloppe spectrale codée et en décodant la pluralité codée d'échantillons spectraux,

dans lequel l'unité de décodage (140) est configurée pour recevoir ou pour estimer un débit binaire estimé nécessaire pour le codage de chaque échantillon spectral des un ou plusieurs échantillons spectraux de la pluralité codée d'échantillons spectraux, et

dans lequel l'unité de décodage (140) est configurée pour décoder chaque échantillon spectral de la pluralité codée d'échantillons spectraux, en fonction du débit binaire estimé nécessaire pour coder les un ou plusieurs échantillons spectraux de la pluralité codée d'échantillons spectraux, selon une première règle de codage ou selon une deuxième règle de codage qui est différente de la première règle de codage,

dans lequel la deuxième règle de codage comprend le fait d"utiliser un codec entropique et de réaliser une quantification, et dans lequel la première règle de codage comprend le fait d'utiliser un codage tramé,

dans lequel l'unité de décodage (140) est configurée pour décoder les un ou plusieurs échantillons spectraux à l'aide du décodage du codage tramé si le débit binaire estimé est inférieur ou égal à une valeur de seuil; et dans lequel l'unité de décodage (140) est configurée pour décoder les un ou plusieurs échantillons spectraux à l'aide d'un décodage entropique et pour effectuer une déquantification si le débit binaire estimé est supérieur à la valeur de seuil.
Décodeur audio selon la revendication 7,
dans lequel la valeur de seuil est de 1 bit/échantillon.
Décodeur audio selon la revendication 7 ou 8,
dans lequel l'unité de décodage (140) est configurée pour estimer le débit binaire estimé nécessaire pour coder chaque échantillon spectral des un ou plusieurs échantillons spectraux en fonction d'une variance estimée dudit échantillon spectral qui dépend de l'enveloppe spectrale.
Décodeur audio selon la revendication 7 ou 8,
dans lequel l'unité de décodage (140) est configurée pour estimer le débit binaire estimé nécessaire pour coder chaque échantillon spectral des un ou plusieurs échantillons spectraux en fonction de l'équation $b_{k} = \frac{1}{2} \log_{2} (4.1159 σ_{k}^{2})$

où b_k est un k-ème échantillon spectral des un ou plusieurs échantillons spectraux,

où $σ_{k}^{2}$
est une variance estimée dudit échantillon spectral.
Décodeur audio selon l'une des revendications 7 à 10,
dans lequel l'unité de décodage (140) est configurée pour décoder les échantillons spectraux qui sont décodés selon la deuxième règle de codage à l'aide d'une matrice orthogonale, et

dans lequel l'unité de décodage (140) est configurée pour décoder les échantillons spectraux qui sont décodés selon la première règle de codage sans utiliser la matrice orthogonale.
Décodeur audio selon l'une des revendications 7 à 11,
dans lequel, si le débit binaire estimé nécessaire pour coder un échantillon spectral des un ou plusieurs échantillons spectraux est inférieur à une autre valeur de seuil, l'unité de décodage (140) est configurée pour utiliser une mise en forme spectrale de bruit pour décoder la pluralité codée d'échantillons spectraux.
Système comprenant:
un codeur audio (105) selon l'une des revendications 1 à 6, et

un décodeur audio (125) selon l'une des revendications 7 à 12,

dans lequel le codeur audio (105) est configuré pour alimenter une enveloppe spectrale codée d'un signal audio codé et une pluralité codée d'échantillons spectraux du signal audio codé vers le décodeur audio, et

dans lequel le décodeur audio (125) est configuré pour décoder le signal audio codé en décodant l'enveloppe spectrale codée et en décodant la pluralité codée d'échantillons spectraux.
Procédé de codage d'un signal audio, dans lequel le signal audio est représenté dans un domaine spectral, dans lequel le procédé comprend le fait de:
déterminer une enveloppe spectrale du signal audio et coder l'enveloppe spectrale, et

coder une pluralité d'échantillons spectraux du signal audio,

dans lequel le codage de la pluralité d'échantillons spectraux du signal audio est effectué en estimant un débit binaire estimé nécessaire pour coder chaque échantillon spectral parmi un ou plusieurs échantillons spectraux de la pluralité d'échantillons spectraux en fonction de l'enveloppe spectrale, et

dans lequel le codage de la pluralité d'échantillons spectraux du signal audio est effectué en codant chaque échantillon spectral de la pluralité d'échantillons spectraux, en fonction du débit binaire estimé nécessaire pour coder les un ou plusieurs échantillons spectraux, selon une première règle de codage ou selon une deuxième règle de codage qui est différente de la première règle de codage,

dans lequel la deuxième règle de codage comprend le fait d"utiliser un codec entropique et de réaliser une quantification, et dans lequel la première règle de codage comprend le fait d"utiliser un codage tramé, et

dans lequel le codage des un ou plusieurs échantillons spectraux à l'aide d'un codage tramé est effectué si le débit binaire estimé est inférieur ou égal à une valeur de seuil; et le codage des un ou plusieurs échantillons spectraux à l'aide du codage entropique et la réalisation d'une quantification sont effectués si le débit binaire estimé est supérieur à la valeur de seuil.
Procédé de décodage d'un signal audio codé, dans lequel le procédé comprend le fait de:
recevoir une enveloppe spectrale codée du signal audio et recevoir une pluralité codée d'échantillons spectraux du signal audio, et

décoder le signal audio codé en décodant l'enveloppe spectrale codée et en décodant la pluralité codée d'échantillons spectraux,

dans lequel le décodage du signal audio codé est effectué en recevant ou en estimant un débit binaire estimé nécessaire pour coder chaque échantillon spectral parmi un ou plusieurs échantillons spectraux de la pluralité codée d'échantillons spectraux, et

dans lequel le décodage du signal audio codé est effectué en décodant chaque échantillon spectral de la pluralité codée d'échantillons spectraux, en fonction du débit binaire estimé nécessaire pour coder les un ou plusieurs échantillons spectraux de la pluralité codée d'échantillons spectraux, selon une première règle de codage ou selon une deuxième règle de codage qui est différente de la première règle de codage,

dans lequel la deuxième règle de codage comprend le fait d'utiliser un codec entropique et de réaliser une quantification, et dans lequel la première règle de codage comprend le fait d'utiliser un codage tramé,

dans lequel le décodage des un ou plusieurs échantillons spectraux à l'aide du décodage du codage tramé est effectué si le débit binaire estimé est inférieur ou égal à une valeur de seuil; et dans lequel le décodage des un ou plusieurs échantillons spectraux à l'aide du décodage entropique et la réalisation d'une déquantification sont effectués si le débit binaire estimé est supérieur à la valeur de seuil.
Programme d'ordinateur pour la réaliser le procédé selon la revendication 14 ou 15 lorsqu'il est exécuté sur un ordinateur ou un processeur de signal.