ES2559040T3

ES2559040T3 - Relleno de subvectores no codificados en señales de audio codificadas por transformada

Info

Publication number: ES2559040T3
Application number: ES11860593.0T
Authority: ES
Inventors: Volodya Grancharov; Sebastian NÄSLUND; Sigurdur Sverrisson
Original assignee: Telefonaktiebolaget LM Ericsson AB
Current assignee: Telefonaktiebolaget LM Ericsson AB
Priority date: 2011-03-10
Filing date: 2011-09-14
Publication date: 2016-02-10
Anticipated expiration: 2031-09-14
Also published as: DK2684190T3; CN103503063A; US11756560B2; PT3319087T; EP2684190B1; PT2684190E; AU2011361945A1; EP2684190A4; EP3319087A1; WO2012121638A1; US9966082B2; CN103503063B; EP2975611B1; US20180226081A1; ES2758370T3; US20160322058A1; DK3319087T3; HUE037111T2; HUE026874T2; AU2011361945B2

Abstract

Un método de rellenado de subvectores residuales no codificados de una señal de audio codificada por transformada, incluyendo dicho método las etapas de: comprimir (S1) subvectores residuales actualmente codificados; rechazar (S2) subvectores residuales comprimidos que no cumplan un criterio de dispersión predeterminado; concatenar (S3) los subvectores residuales comprimidos restantes para formar un primer libro de códigos virtual (VC1); combinar (S4) pares de coeficientes del primer libro de códigos virtual (VC1) para formar un segundo libro de códigos virtual (VC2); rellenar (S5) subvectores residuales no codificados por debajo de una frecuencia predeterminada con coeficientes procedentes del primer libro de códigos virtual (VC1); rellenar (S6) subvectores residuales no codificados por encima de la frecuencia predeterminada con coeficientes procedentes del segundo libro de códigos virtual; caracterizado porque se comprimen (S1) componentes (k) de subvectores residuales actualmente codificados conforme a: donde Y(k) son las componentes de los subvectores residuales comprimidos.

Description

5

10

15

20

25

30

35

40

45

DESCRIPCION

Relleno de subvectores no codificados en senales de audio codificadas por transformada Campo tecnico

La presente tecnolog^a se refiere a la codificacion de senales de audio, y especialmente al relleno de subvectores no codificados en senales de audio codificadas por transformada.

Antecedentes

Un sistema tfpico de codificador/descodificador basado en codificacion por transformada, ha sido ilustrado en la Figura 1.

Las etapas principales de la codificacion por transformada son:

A. Transformar una trama de audio corta (20-40 ms) a un dominio de frecuencia, por ejemplo mediante la Transformada Coseno Discreta Modificada (MDCT);

B. Dividir el vector X(k) de la MDCT en multiples bandas (subvectores SV1, SV2, ...), segun se ha ilustrado en la Figura 2. Tfpicamente, el ancho de las bandas se incrementa hacia frecuencias mas altas [1];

C. Calcular la energfa en cada banda. Esto proporciona una aproximacion de la envolvente espectral, segun se ha ilustrado en la Figura 3;

D. La envolvente espectral se cuantifica, y los indices de cuantificacion se transmiten al descodificador;

E. Se obtiene un vector residual escalando el vector de MDCT con las ganancias de envolvente, por ejemplo el vector residual se forma mediante los subvectores (SV1, SV2, ...) de MDCT escalados a unidad de energfa de Valor Cuadratico Medio (RMS);

F. Se asignan bits para la cuantificacion de diferentes subvectores residuales en base a energfas de envolvente. Debido a un presupuesto limitado de bits, no se asigna ningun bit a algunos de los subvectores. Esto ha sido ilustrado en la Figura 4, donde los subvectores correspondientes a ganancias de envolvente por debajo de un umbral TH no han sido asignados con ningun bit.

G. Los subvectores residuales se cuantifican segun los bits asignados, y los indices de cuantificacion se transmiten al descodificador. La cuantificacion residual puede ser llevada a cabo, por ejemplo, con el esquema de Codificacion Factorial de Pulso (FPC) [2].

H. Los subvectores residuales con cero bits asignados no son codificados, pero en cambio se rellenan de ruido en el descodificador. Esto se consigue creando un Libro de Codigos Virtual (VC) a partir de subvectores codificados, concatenando los coeficientes perceptualmente relevantes del espectro descodificado. El VC crea contenidos en los subvectores residuales no codificados.

I. En el descodificador, el vector de MDCT se reconstruye mediante el escalonamiento ascendente de los subvectores residuales con ganancias de envolvente correspondientes, y la MDCT inversa se usa para reconstruir la trama de audio en el dominio del tiempo.

Un inconveniente del esquema de relleno de ruido convencional, por ejemplo segun [1], consiste en que la etapa H crea distorsion audible en la senal de audio reconstruida, cuando se utiliza con el esquema de la FPC.

El documento US 2010/0241437 A1 divulga un metodo para la descodificacion espectral perceptual, donde un conjunto inicial de coeficientes espectrales es el relleno del espectro. El relleno del espectro comprende el relleno de ruido de huecos espectrales estableciendo coeficientes espectrales en el conjunto inicial de coeficientes espectrales que no han sido descodificados a partir de un flujo binario igual a los elementos derivados de los coeficientes espectrales descodificados. El conjunto de coeficientes espectrales reconstruido de un dominio de frecuencia formado por el relleno espectral se convierte en una senal de audio de un dominio de tiempo.

Sumario

Un objeto general es un relleno mejorado de subvectores residuales no codificados de una senal de audio codificada por transformada.

Otro objeto es la generacion de libros de codigo virtuales usados para rellenar los subvectores residuales no codificados.

Estos objetos se han alcanzado conforme a las reivindicaciones anexas.

Un primer aspecto de la presente tecnologfa incluye un metodo de relleno de subvectores residuales no codificados

5

10

15

20

25

30

35

40

45

de una senal de audio codificada por transformada. El metodo incluye las etapas de:

• Comprimir subvectores residuales actualmente codificados;

• Rechazar subvectores residuales comprimidos que no cumplan un criterio de dispersion predeterminado;

• Concatenar los subvectores residuales comprimidos restantes para formar un primer libro de codigos virtual;

• Combinar pares de coeficientes del primer libro de codigos virtual para formar un segundo libro de codigos virtual;

• Rellenar subvectores residuales no codificados por debajo de una frecuencia predeterminada con coeficientes procedentes del primer libro de codigos virtual;

• Rellenar subvectores residuales no codificados por encima de la frecuencia predeterminada con coeficientes procedentes del segundo libro de codigos virtual.

Un segundo aspecto de la presente tecnologfa incluye un metodo de generacion de un libro de codigos virtual para rellenar subvectores residuales no codificados de una senal de audio codificada por transformada por debajo de una frecuencia predeterminada. El metodo incluye las etapas de:

• Comprimir subvectores residuales actualmente codificados;

• Concatenar los subvectores residuales comprimidos restantes para formar un libro de codigos virtual.

Un tercer aspecto de la presente tecnologfa incluye un metodo de generacion de un libro de codigos virtual para rellenar subvectores residuales no codificados de una senal de audio codificada por transformada por encima de una frecuencia predeterminada. El metodo incluye las etapas de:

• Generar un primer libro de codigos virtual conforme al segundo aspecto;

• Combinar pares de coeficientes del primer libro de codigos virtual.

Un cuarto aspecto de la presente tecnologfa incluye un rellanado de espectro para rellenar subvectores residuales no codificados de una senal de audio codificada por transformada. El rellenador de espectro incluye:

• Un compresor de subvector configurado para comprimir subvectores residuales actualmente codificados;

• Un rechazador de subvector configurado para rechazar subvectores residuales comprimidos que no cumplan un criterio de dispersion predeterminado;

• Un colector de subvector configurado para concatenar los subvectores residuales comprimidos restantes para formar un primer libro de codigos virtual;

• Un combinador de coeficientes configurado para combinar pares de coeficientes del primer libro de codigos virtual para formar un segundo libro de codigos virtual;

• Un rellenador de subvector configurado para rellenar subvectores residuales no codificados por debajo de una frecuencia predeterminada con coeficientes procedentes del primer libro de codigos virtual, y para rellenar subvectores residuales no codificados por encima de la frecuencia predeterminada con coeficientes procedentes del segundo libro de codigos virtual.

Un quinto aspecto de la presente tecnologfa incluye un descodificador que incluye un rellenador de espectro conforme al cuarto aspecto.

Un sexto aspecto de la presente tecnologfa incluye un equipo de usuario que incluye un descodificador conforme al quinto aspecto.

Un septimo aspecto de la presente tecnologfa incluye un generador de libro de codigos virtual de baja frecuencia para generar un libro de codigos virtual de baja frecuencia para rellenar subvectores residuales no codificados de una senal de audio codificada por transformada por debajo de una frecuencia predeterminada. El generador de libro de codigos virtual de baja frecuencia incluye:

• Un rechazador de subvector configurado para rechazar subvectores residuales comprimidos que no cumplan con un criterio de dispersion predeterminado;

5

10

15

20

25

30

35

40

• Un colector de subvector configurado para concatenar los subvectores residuales comprimidos restantes para formar el libro de codigos virtual de baja frecuencia.

Un octavo aspecto de la presente tecnologfa incluye un generador de libro de codigos virtual de alta frecuencia para generar un libro de codigos virtual de alta frecuencia para relleno de subvectores residuales no codificados de una senal de audio codificada por transformada por encima de una frecuencia predeterminada. El generador de libro de codigos virtual de baja frecuencia incluye:

• Un generador de libro de codigos virtual de baja frecuencia conforme con el septimo aspecto, configurado para generar un libro de codigos virtual de baja frecuencia;

• Un combinador de coeficientes configurado para combinar pares de coeficientes del libro de codigos virtual de baja frecuencia para formar el libro de codigos virtual de alta frecuencia.

Una ventaja de la presente tecnologfa de relleno espectral consiste en un perfeccionamiento perceptivo de senales de audio descodificadas en comparacion con el relleno de ruido convencional.

Breve descripcion de los dibujos

La presente tecnologfa, junto con otros objetos y ventajas de la misma, podra ser mejor comprendida haciendo referencia a la descripcion que sigue tomada junto con los dibujos que se acompanan, en los que:

La Figura 1 es un diagrama de bloques que ilustra un sistema tfpico de codificacion/descodificacion de audio basado en transformada;

La Figura 2 es un diagrama que ilustra la estructura de un vector de MDCT;

La Figura 3 es un diagrama que ilustra la distribucion de energfa en los subvectores de un vector de MDCT;

La Figura 4 es un diagrama que ilustra el uso de la envolvente espectral para asignacion de bits;

La Figura 5 es un diagrama que ilustra un residual codificado;

La Figura 6 es un diagrama que ilustra compresion de un residual codificado;

La Figura 7 es un diagrama que ilustra el rechazo de subvectores residuales codificados;

La Figura 8 es un diagrama que ilustra la concatenacion de subvectores residuales sobrevivientes para formar un primer libro de codigos virtual;

Las Figuras 9A-B son diagramas que ilustran la combinacion de coeficientes a partir del primer libro de codigos virtual para formar un segundo libro de codigos virtual;

La Figura 10 es un diagrama de bloques que ilustra un ejemplo de realizacion de un generador de libro de codigos virtual de baja frecuencia;

La Figura 11 es un diagrama de bloques que ilustra un ejemplo de realizacion de un generador de libro de codigos virtual de alta frecuencia;

La Figura 12 es un diagrama de bloques que ilustra un ejemplo de realizacion de un rellenador de espectro;

La Figura 13 es un diagrama de bloques que ilustra un ejemplo de realizacion de un descodificador que incluye un rellenador de espectro;

La Figura 14 es un diagrama de flujo que ilustra la generacion de libro de codigos virtual de baja frecuencia;

La Figura 15 es un diagrama de flujo que ilustra la generacion de libro de codigos virtual de alta frecuencia;

La Figura 16 es un diagrama de flujo que ilustra el relleno de espectro;

La Figura 17 es un diagrama de bloques que ilustra un ejemplo de realizacion de un generador de libro de codigos virtual de baja frecuencia;

La Figura 18 es un diagrama de bloques que ilustra un ejemplo de realizacion de un generador de libro de codigos virtual de alta frecuencia;

La Figura 19 es un diagrama de bloques que ilustra un ejemplo de realizacion de un rellenador de espectro, y

La Figura 20 es un diagrama de bloques que ilustra un ejemplo de realizacion de un equipo de usuario.

5

10

15

20

25

30

35

40

45

Descripcion detallada

Con anterioridad a describir con mayor detalle la presente tecnolog^a, se va a describir brevemente la codificacion/descodificacion basada en transformada, con referencia a las Figuras 1-7.

La Figura 1 es un diagrama de bloques que ilustra un sistema tipico de codificacion/descodificacion de audio basado en transformada. Una senal de entrada x(n) se envfa a un transformador de frecuencia, por ejemplo un transformador 10 de MDCT, donde tramas de audio cortas (20-40 ms) son transformadas en un dominio de frecuencia. La senal X(k) de dominio de frecuencia resultante se divide en multiples bandas (subvectores SV1, SV2, ...), segun se ha ilustrado en la Figura 2. Tfpicamente, el ancho de las bandas se incrementa hacia frecuencias mas altas [1]. La energfa de cada banda se determina en un calculador y cuantificador de envolvente 12. Esto da una aproximacion de la envolvente espectral, segun se ha ilustrado en la Figura 3. Cada subvector se normaliza segun un subvector residual en un normalizador de subvector 14 escalando la inversa del valor de envolvente (ganancia) cuantificado correspondiente.

Un asignador de bits 16 asigna bits para la cuantificacion de diferentes subvectores residuales en base a energfas de envolvente. Debido a un presupuesto limitado de bits, no se asignan bits a algunos de los subvectores. Esto ha sido ilustrado en la Figura 4, donde los subvectores correspondientes a ganancias de envolvente por debajo de un umbral TH no han sido asignados con ningun bit. Los subvectores residuales son cuantificados en un cuantificador de subvector 18 conforme a los bits asignados. La cuantificacion residual puede ser llevada a cabo, por ejemplo, con un esquema de Codificacion de Pulso Factorial (FPC) [2]. Los indices de cuantificacion de subvector residual y los indices de cuantificacion de envolvente son transmitidos a continuacion al descodificador a traves de un multiplexor (MUX) 20.

En el descodificador, se desmultiplexa la corriente de bits recibida en indices de cuantificacion de subvector residual e indices de cuantificacion de envolvente en un desmultiplexor (DEMUX) 22. Los indices de cuantificacion de subvector residual son descuantificados en subvectores residuales en un descuantificador de subvector 24, y los indices de cuantificacion de envolvente son descuantificados en ganancias de envolvente en un descuantificador de envolvente 26. Un asignador de bits 28 usa las ganancias de envolvente para controlar la descuantificacion de subvector residual.

Los subvectores residuales con cero bits asignados, no son codificados en el codificador, y en cambio son rellenados con ruido mediante un rellenador de ruido 30 en el descodificador. Esto se consigue creando un Libro de Codigos Virtual (VC) a partir de los subvectores codificados, concatenando los coeficientes perceptiblemente relevantes del espectro descodificado ([1] seccion 8.4.1). De ese modo, el VC crea contenidos en los subvectores residuales no codificados.

A

En el descodificador, el vector X(n) de MDCT es reconstruido a continuacion mediante escalado ascendente de subvectores residuales con ganancias de envolvente correspondientes en un conformador de envolvente 32, y

A

transformando el vector X(k) de dominio de frecuencia resultante en un transformador de MDCT inverso 34.

Un inconveniente del esquema convencional de relleno de ruido descrito con anterioridad consiste en que crea distorsion audible en la senal de audio reconstruida, cuando se usa con el esquema de FPC. La razon principal es que algunos de los vectores codificados pueden ser demasiado dispersos, lo que crea problemas de desajuste energetico en las bandas rellenadas con ruido. Adicionalmente, algunos de los vectores codificados pueden contener demasiada estructura (color), lo que conduce a degradaciones perceptivas cuando el relleno de ruido se realiza a frecuencias elevadas.

La descripcion que sigue va a ser enfocada a una realizacion de un procedimiento mejorado para la generacion de libro de codigos virtual en la etapa H anterior.

A

Un residual codificado X(k), ilustrado en la Figura 5, se comprime o cuantifica conforme a:

1 si X(k)> 0

o Si x(fc) = o (1)

-l si x(k)< o

imagen1

segun se ha ilustrado en la Figura 6. Esta etapa garantiza que no exista una estructura excesiva (tal como periodicidad a altas frecuencias) en las regiones rellenas de ruido. Adicionalmente, la forma espedfica de residual comprimido Y(k) permite una baja complejidad en las etapas subsiguientes.

A

Como alternativa, el residual codificado X(k) puede ser comprimido o cuantificado conforme a:

5

10

15

20

25

30

r(fc) =

' 1: SI

0: si

-1: si

X(k)>T -T<X(k)<;T X (k) < -T

(2)

donde T es un numero pequeno positivo. El valor de T puede ser usado para controlar la cantidad de compresion. Esta realizacion es tambien util para senales que hayan sido codificadas por medio de un codificador que cuantifique simetricamente en torno a 0 pero no incluye el valor 0 real.

El libro de codigos virtual se construye solamente a partir de subvectores M-dimensionales “poblados”. Si un subvector residual codificado no cumple el criterio:

Sk«|i2 (3)

fc-i

se considera disperso, y se rechaza. Por ejemplo, si el subvector tiene dimension 8 (M=8), la ecuacion (3) garantiza que un subvector particular sera rechazado desde el libro de codigos virtual si tiene mas de 6 ceros. Esto ha sido ilustrado en la Figura 7, donde el subvector SV3 es rechazado, debido a que tiene 7 ceros. Un libro de codigos virtual VC1 se forma concatenando los subvectores restantes o sobrevivientes, segun se ha ilustrado en la Figura 8. Puesto que la longitud de los subvectores es un multiplo de M, el criterio (3) puede ser usado tambien para subvectores mas largos. En este caso, las partes que no cumplan el criterio son rechazadas.

En general, un subvector comprimido se considera “poblado” si contiene mas de un 20-30% de componentes distintos de cero. En el ejemplo anterior con M=8, el criterio es “mas de un 25% de componentes distintos de cero”.

Un segundo libro de codigos virtual VC2 se crea a partir del libro de codigos virtual VC1 obtenido. Este segundo libro de codigos virtual VC2 esta incluso mas “poblado” y se usa para frecuencias de relleno superiores a 4,8 kHz (tambien son por supuesto posibles otras frecuencias de transicion; tipicamente, la frecuencia de transicion esta entre 4 y 6 kHz). El segundo libro de codigos virtual VC2 se forma conforme a:

Z(k) = Y(k)®Y(N-k), k = O...N-l (4)

donde N es el tamano (numero total de coeficientes Y(k)) del primer libro de codigos virtual VC1, y la operacion combinadora © se define como:

imagen2

Esta etapa de combinacion o fusion, ha sido ilustrada en las Figuras 9A-B. Se debe apreciar que el mismo par de coeficientes Y(k), Y(N-k) se utiliza dos veces en el proceso de fusion, una vez en la mitad inferior (Figura 9A) y una vez en la mitad superior (Figura 9B).

Los subvectores no codificados pueden ser rellenados pasando dclicamente a traves del libro de codigos virtual respectivo, VC1 o VC2 dependiendo de si el subvector que va a ser rellenado esta por debajo o por encima de la frecuencia de transicion, y copiando el numero requerido de coeficientes del libro de codigos en el subvector vacfo. De ese modo, si los libros de codigos son cortos y existen muchos subvectores para ser rellenados, se reutilizaran los mismos coeficientes para rellenar mas de un subvector.

Un ajuste de energfa de los subvectores rellenados se lleva a cabo preferentemente sobre la base de un subvector. Esto explica el hecho de que tras el rellenado del espectro, los subvectores residuales pueden no tener la energfa de RMS unitaria esperada. El ajuste se puede llevar a cabo conforme a:

5

10

15

20

25

30

35

40

45

50

55

imagen3

donde a<1, por ejemplo, a=0,8 es un factor de atenuacion optimizado perceptualmente. Un motivo para la atenuacion perceptual es que la operacion de rellenado de ruido da con frecuencia como resultado estadfsticas significativamente diferentes del vector residual y es deseable atenuar tales regiones “imprecisas”.

En un esquema mas avanzado, el ajuste de energfa de un subvector particular puede estar adaptado al tipo de subvectores vecinos: si las regiones vecinas estan codificadas a una tasa de bits alta, la atenuacion del subvector actual es mas agresiva (alfa tiende hacia cero). Si las regiones vecinas estan codificadas a una tasa de bits baja o rellenas con ruido, la atenuacion del subvector actual esta limitada (alfa tiende hacia uno). Este esquema impide la atenuacion de grandes regiones espectrales continuas, que podnan conducir a perdida de sonoridad acustica. Al mismo tiempo, si la region espectral que debe ser atenuada es estrecha, una atenuacion incluso muy intensa no afectara a la sonoridad global.

La tecnologfa descrita proporciona un relleno de ruido mejorado. Las mejoras perceptivas han sido medidas por medio de pruebas de escucha. Estas pruebas indican que el procedimiento de relleno de espectro descrito con anterioridad fue el preferido por un 83% de oyentes de las pruebas, mientras que el procedimiento de relleno de ruido convencional fue el preferido en un 17% de las pruebas.

La Figura 10 es un diagrama de bloques que ilustra un ejemplo de generador de libro de codigos virtual 60 de baja frecuencia. Los subvectores residuales son enviados a un compresor de subvector 42, el cual esta configurado para comprimir subvectores residuales actualmente codificados (es decir, subvectores a los que se haya asignado realmente bits para codificacion), por ejemplo conforme a la ecuacion (1). Los subvectores comprimidos son reenviados a un rechazador de subvector 44, el cual esta configurado para rechazar los subvectores residuales comprimidos que no cumplan con un criterio de dispersion predeterminado, por ejemplo el criterio (3). Los subvectores comprimidos restantes son recopilados en un colector de subvector 46, el cual esta configurado para concatenarlos para formar el libro de codigos virtual VC1 de baja frecuencia.

La Figura 11 es un diagrama de bloques que ilustra un ejemplo de generador de libro de codigos virtual 70 de alta frecuencia. Los subvectores residuales son reenviados a un compresor de subvector 42, el cual esta configurado para comprimir subvectores residuales actualmente codificados (es decir, subvectores que han sido actualmente asignados con bits para codificacion), por ejemplo segun la ecuacion (1). Los subvectores comprimidos son reenviados a un rechazador de subvector 44, el cual esta configurado para rechazar subvectores residuales comprimidos que no cumplan un criterio de dispersion predeterminado, como por ejemplo el criterio (3). Los restantes subvectores comprimidos son recopilados en un colector de subvector 46, el cual esta configurado para concatenarlos para formar el libro de codigos virtual VC1 de baja frecuencia. De ese modo, hasta ese punto, el generador de libro de codigos virtual 70 de alta frecuencia incluye los mismos elementos que el generador de libro de codigos virtual 60 de baja frecuencia. Los coeficientes del libro de codigos virtual VC1 de baja frecuencia son reenviados a un combinador de coeficientes 48, el cual esta configurado para combinar pares de coeficientes para formar el libro de codigos virtual VC2 de alta frecuencia, por ejemplo conforme a la ecuacion (5).

La Figura 12 es un diagrama de bloques que ilustra una realizacion de un rellenador de espectro 40. Los subvectores residuales son reenviados a un compresor de subvector 42, el cual esta configurado para comprimir subvectores residuales actualmente codificados (es decir, subvectores que han sido asignados realmente con bits para codificacion), por ejemplo conforme a la ecuacion (1). Los subvectores comprimidos son reenviados a un rechazador de subvector 44, el cual esta configurado para rechazar subvectores residuales comprimidos que no cumplan un criterio de dispersion predeterminado, por ejemplo el criterio (3). Los subvectores comprimidos restantes son recopilados en un colector de subvector 46, el cual esta configurado para concatenarlos para que formen un primer libro de codigos virtual VC1 (baja frecuencia). Los coeficientes procedentes del primer libro de codigos virtual VC1 son reenviados a un combinador de coeficientes 48, el cual esta configurado para combinar pares de coeficientes para formar un segundo libro de codigos virtual VC2 (alta frecuencia), por ejemplo conforme a la ecuacion (5). De ese modo, hasta ese punto, el rellenador de espectro 40 incluye los mismos elementos que el generador de libro de codigos virtual 70 de alta frecuencia. Los subvectores residuales son reenviados tambien a un rellenador de subvector 50, el cual esta configurado para rellenar subvectores residuales no codificados por debajo de una frecuencia predeterminada con coeficientes procedentes del primer libro de codigos virtual VC1, y para rellenar subvectores residuales no codificados por encima de la frecuencia predeterminada con coeficientes procedentes del segundo libro de codigos virtual. En una realizacion preferida, el rellenador de espectro 40 incluye tambien un ajustador de energfa 52 configurado para ajustar la energfa de los subvectores residuales no codificados rellenados, para obtener una atenuacion perceptiva, segun se ha descrito con anterioridad.

La Figura 13 es un diagrama de bloques que ilustra una realizacion de un descodificador 300 que incluye un rellenador de espectro 40. La estructura general del descodificador 300 es la misma que la del descodificador de la

5

10

15

20

25

30

35

40

45

50

55

60

Figura 1, pero con el rellenador de ruido 30 reemplazado por el rellenador de espectro 40.

La Figura 14 es un diagrama de flujo que ilustra la generacion de libro de codigos virtual de baja frecuencia. La etapa S1 comprime subvectores residuales actualmente codificados, por ejemplo conforme a la ecuacion (1). La etapa S2 rechaza subvectores residuales comprimidos que sean demasiado dispersos, es decir subvectores residuales comprimidos que no cumplan un criterio de dispersion predeterminado, por ejemplo el criterio (3). La etapa S3 concatena los subvectores residuales comprimidos restantes para formar el libro de codigos virtual VC1.

La Figura 15 es un diagrama de flujo que ilustra la generacion de libro de codigos virtual de alta frecuencia. La etapa S1 comprime subvectores residuales actualmente codificados, por ejemplo conforme a la ecuacion (1). La etapa S2 rechaza subvectores residuales comprimidos que sean demasiado dispersos, es decir subvectores residuales comprimidos que no cumplan un criterio de dispersion predeterminado, tal como el criterio (3). La etapa S3 concatena los subvectores residuales comprimidos restantes para formar un primer libro de codigos virtual VC1. De ese modo, hasta ese punto, la generacion de libro de codigos virtual de alta frecuencia incluye las mismas etapas que la generacion de libro de codigos virtual de baja frecuencia. La etapa S4 combina pares de coeficientes del primer libro de codigos virtual VC1, por ejemplo conforme a la ecuacion (5), formando con ello el libro de codigos virtual VC2 de alta frecuencia.

La Figura 16 es un diagrama de flujo que ilustra el rellenado de espectro. La etapa S1 comprime subvectores residuales actualmente codificados, por ejemplo conforme a la ecuacion (1). La etapa S2 rechaza subvectores residuales comprimidos que sean demasiado dispersos, es decir, subvectores residuales comprimidos que no cumplan un criterio de dispersion predeterminado, tal como el criterio (3). La etapa S3 concatena los subvectores residuales comprimidos restantes para formar un primer libro de codigos virtual VC1. La etapa S4 combina pares de coeficientes del primer libro de codigos virtual VC1, por ejemplo conforme a la ecuacion (5), para formar un segundo libro de codigos virtual VC2. De ese modo, hasta ese punto, el relleno de espectro incluye las mismas etapas que la generacion de libro de codigos virtual de alta frecuencia. La etapa S5 rellena subvectores residuales no codificados por debajo de una frecuencia predeterminada con coeficientes procedentes del primer libro de codigos virtual VC1. La etapa S6 rellena subvectores residuales no codificados por encima de una frecuencia predeterminada con coeficientes procedentes del segundo libro de codigos virtual VC2. La etapa S7 opcional ajusta la energfa de subvectores residuales no codificados rellenados para obtener una atenuacion perceptiva, segun se ha descrito con anterioridad. La Figura 17 es un diagrama de bloques que ilustra un ejemplo de un generador de libro de codigos virtual 60 de baja frecuencia. Este ejemplo se basa en un procesador 110, por ejemplo un microprocesador, que ejecuta una componente de software 120 para comprimir subvectores residuales actualmente codificados, una componente de software 130 para rechazar subvectores residuales comprimidos que sean demasiado dispersos, y una componente de software 140 para concatenar los restantes subvectores residuales comprimidos para formar el libro de codigos virtual VC1. Estas componentes de software estan almacenadas en la memoria 150. El procesador 110 comunica con la memoria a traves de un bus de sistema. Los subvectores residuales son recibidos por el controlador 160 de entrada/salida (E/S) que controla un bus de E/S, al que estan conectados el procesador 110 y la memoria 150. En este ejemplo, los subvectores residuales recibidos por el controlador de E/S 160 son almacenados en la memoria 150, donde estos son procesados por medio de las componentes de software. La componente de software 120 puede implementar la funcionalidad del bloque 42 en el ejemplo descrito con referencia a la Figura 10 anterior. La componente de software 130 puede implementar la funcionalidad del bloque 44 en el ejemplo descrito con referencia a la Figura 10 anterior. La componente de software 140 puede implementar la funcionalidad del bloque 46 en el ejemplo descrito con referencia a la Figura 10 anterior. El libro de codigos virtual VC1 obtenido a partir de la componente de software 140 es presentado a la salida desde la memoria 150 por el controlador de E/S 160 a traves del bus de E/S o se almacena en la memoria 150.

La Figura 18 es un diagrama de bloques que ilustra un ejemplo de generador de libro de codigos virtual 70 de alta frecuencia. Este ejemplo se basa en un procesador 110, por ejemplo un microprocesador, que ejecuta una componente de software 120 para comprimir subvectores residuales actualmente codificados, una componente de software 130 para rechazar subvectores residuales comprimidos que sean demasiado dispersos, una componente de software 140 para concatenar los restantes subvectores residuales comprimidos para formar el libro de codigos virtual VC1 de baja frecuencia, y una componente de software 170 para combinar pares de coeficientes a partir del libro de codigos VC1 para formar el libro de codigos virtual VC2 de alta frecuencia. Estas componentes de software se almacenan en la memoria 150. El procesador 110 comunica con la memoria a traves de un bus de sistema. Los subvectores residuales son recibidos por un controlador 160 de entrada/salida (E/S) que controla un bus de E/S, al que estan conectados el procesador 110 y la memoria 150. En este ejemplo, los subvectores residuales recibidos por el controlador de E/S 160 son almacenados en la memoria 150, donde son procesados por las componentes de software. La componente de software 120 puede implementar la funcionalidad del bloque 42 en el ejemplo descrito con referencia a la Figura 11 anterior. La componente de software 130 puede implementar la funcionalidad del bloque 44 en el ejemplo descrito con referencia a la Figura 11 anterior. La componente de software 140 puede implementar la funcionalidad del bloque 46 en el ejemplo descrito con referencia a la Figura 11 anterior. La componente de software 170 puede implementar la funcionalidad del bloque 48 en el ejemplo descrito con referencia a la Figura 11 anterior. El libro de codigos virtual VC1 obtenido a partir de la componente de software 140 se almacena preferentemente en la memoria 150 para este proposito. El libro de codigos virtual VC2 obtenido a partir de la componente de software 170 se presenta a la salida desde la memoria 150 por parte del controlador de E/S 160 a traves del bus de E/S o se almacena en la memoria 150.

5

10

15

20

25

30

35

40

45

La Figura 19 es un diagrama de bloques que ilustra una realizacion de un rellenador de espectro 40. Esta realizacion se basa en un procesador 110, por ejemplo un microprocesador, que ejecuta una componente de software 180 para generar un libro de codigos virtual VC1 de baja frecuencia, una componente de software 190 para generar un libro de codigos virtual VC2 de alta frecuencia, una componente de software 200 para rellenar subvectores residuales no codificados por debajo de una frecuencia predeterminada a partir del libro de codigos virtual VC1, y una componente de software 210 para rellenar subvectores residuales no codificados por encima de una frecuencia predeterminada a partir del libro de codigos virtual VC2. Estas componentes de software se almacenan en la memoria 150. El procesador 110 comunica con la memoria a traves de un bus de sistema. Los subvectores residuales son recibidos por un controlador 160 de entrada/salida (E/S) que controla un bus de E/S, al que estan conectados el procesador 110 y la memoria 150. En esta realizacion, los subvectores residuales recibidos por el controlador de E/S 160 se almacenan en la memoria 150, donde son procesados mediante las componentes de software. La componente de software 180 puede implementar la funcionalidad de los bloques 42-46 en la realizacion descrita con referencia a la Figura 12 anterior. La componente de software 190 puede implementar la funcionalidad del bloque 48 en la realizacion descrita con referencia a la Figura 12 anterior. Las componentes de software 200, 210 pueden implementar la funcionalidad del bloque 50 en la realizacion descrita con referencia a la Figura 12 anterior. Los libros de codigos virtuales VC1, VC2 obtenidos a partir de las componentes de software 180 y 190 se almacenan con preferencia en la memoria 150 para este proposito. Los subvectores residuales rellenados obtenidos a partir de las componentes de software 200, 201 son presentados a la salida desde la memoria 150 por medio del controlador de E/S 160 a traves del bus de E/S o se almacenan en la memoria 150.

La tecnologfa descrita en lo que antecede esta destinada a ser usada en un descodificador de audio, el cual puede ser usado en un dispositivo movil (por ejemplo, telefono movil, ordenador portatil) o en un PC estacionario. En esta memoria, el termino Equipo de Usuario (UE) sera usado como nombre generico de tales dispositivos. Un descodificador de audio con el esquema de rellenado de espectro que se ha propuesto puede ser usado en escenarios de comunicacion en tiempo real (dirigidos principalmente a habla) o escenarios de transmision (dirigidos principalmente a musica).

La Figura 20 ilustra una realizacion de un equipo de usuario conforme a la presente tecnologfa. Este incluye un descodificador 300 equipado con un rellenador de espectro 40 conforme a la presente tecnologfa. Esta realizacion ilustra un terminal de radio, pero tambien son factibles otros nodos de red. Por ejemplo, si se usa voz sobre IP (Protocolo de Internet) en la red, el equipo de usuario puede comprender un ordenador.

En el equipo de usuario de la Figura 20, una antena 302 recibe una senal de audio codificada. Una unidad de radio 304 transforma la senal en parametros de audio, los cuales son enviados al descodificador 300 para generar una senal de audio digital, segun se ha descrito con referencia a las diversas realizaciones anteriores. La senal de audio digital se convierte a continuacion en D/A y se amplifica en una unidad 306 y finalmente se envfa a un altavoz 308.

Los expertos en la materia comprenderan que se pueden realizar diversas modificaciones y cambios en la presente tecnologfa sin apartarse del alcance de la misma, el cual se define en las reivindicaciones anexas.

Referencias

[1] ITU-T Rec. G.719, “Low-complexity full-band audio coding for high-quality conversational applications”, 2008, Secciones 8.4.1, 8.4.3.

[2] Mittal, J. Ashley, E. Cruz-Zeno, “Low Complexity Factorial Pulse Coding of MDCT Coefficients using Approximation of Combinatorial Functions”, ICASSP 2007.

Abreviaturas

FPC Codificacion de Pulso Factorial

MDCT Transformada Coseno Discreta Modificada

RMS Valor Cuadratico Medio

UE Equipo de Usuario

VC Libro de Codigos Virtual

Claims

5

10

15

20

25

30

35

REIVINDICACIONES

1.- Un metodo de rellenado de subvectores residuales no codificados de una senal de audio codificada por transformada, incluyendo dicho metodo las etapas de:

comprimir (S1) subvectores residuales actualmente codificados;

rechazar (S2) subvectores residuales comprimidos que no cumplan un criterio de dispersion predeterminado;

concatenar (S3) los subvectores residuales comprimidos restantes para formar un primer libro de codigos virtual (VC1);

combinar (S4) pares de coeficientes del primer libro de codigos virtual (VC1) para formar un segundo libro de codigos virtual (VC2);

rellenar (S5) subvectores residuales no codificados por debajo de una frecuencia predeterminada con coeficientes procedentes del primer libro de codigos virtual (VC1);

rellenar (S6) subvectores residuales no codificados por encima de la frecuencia predeterminada con coeficientes procedentes del segundo libro de codigos virtual;

A

caracterizado porque se comprimen (S1) componentes X(k) de subvectores residuales actualmente codificados conforme a:

imagen1

si X(k)> 0 si x (fc) = o

Si X(k) <0

donde Y(k) son las componentes de los subvectores residuales comprimidos.
2. - El metodo de la reivindicacion 1, en donde los subvectores residuales comprimidos que tienen menos de un porcentaje predeterminado de componentes distintas de cero, son rechazados (S2).
3. - El metodo de la reivindicacion 1 o 2, en donde se combinan (S4) pares de coeficientes Y(k) del primer libro de codigos virtual (VC1) conforme a:

imagen2

donde N es el tamano del primer libro de codigos virtual (VC1) y Z(k) son los componentes del segundo libro de codigos virtual (VC2).
4. - El metodo de las reivindicaciones 1, 2 o 3, que incluye la etapa de ajustar (S7) la energfa de los subvectores residuales no codificados rellenados para obtener una atenuacion perceptiva.
5. - Un rellenador de espectro (40) para rellenar subvectores residuales no codificados de una senal de audio codificada por transformada, incluyendo dicho rellenador de espectro:

un compresor de subvector (42) configurado para comprimir subvectores residuales actualmente codificados;

un rechazador de subvector (44) configurado para rechazar subvectores residuales comprimidos que no cumplan un criterio de dispersion predeterminado;

un colector de subvector (46) configurado para concatenar los subvectores residuales comprimidos restantes para formar un primer libro de codigos virtual (VC1);

un combinador de coeficientes (48) configurado para combinar pares de coeficientes del primer libro de codigos virtual (VC1) para formar un segundo libro de codigos virtual (VC2);

un rellenador de subvector (50) configurado para rellenar subvectores residuales no codificados por debajo de una frecuencia predeterminada con coeficientes procedentes del primer libro de codigos virtual (VC1), y para rellenar

subvectores residuales no codificados por encima de la frecuencia predeterminada con coeficientes procedentes del segundo libro de codigos virtual (VC2), caracterizado porque el compresor de subvector (42) esta configurado para

A

comprimir componentes X(k) de subvectores residuales actualmente codificados conforme a:

imagen3

5 donde Y(k) son las componentes de los subvectores residuales comprimidos.
6. - El rellenador de espectro de la reivindicacion 5, en donde el rechazador de subvector (44) esta configurado para rechazar subvectores residuales comprimidos que tengan menos de un porcentaje predeterminado de componentes distintas de cero.
7. - El rellenador de espectro de la reivindicacion 5 o 6, en donde el combinador de coeficientes (48) esta configurado 10 para combinar pares de coeficientes Y(k) del primer libro de codigos virtual (VC1) conforme a:

sign(Y (k)) x (|y (k)| + |y (AT - k)^ Si Y(k)* 0

k = O...N -1

Y(N-k) si Y(k) = 0

donde N es el tamano del primer libro de codigos virtual (VC1) y Z(k) son los componentes del segundo libro de codigos virtual (VC2).
8. - El rellenador de espectro de la reivindicacion 5, 6 o 7, que incluye un ajustador de energfa (52) configurado para 15 ajustar la energfa de los subvectores residuales no codificados rellenados, para obtener una atenuacion perceptiva.
9. - Un descodificador (300) que incluye un rellenador de espectro (40) conforme a cualquiera de las reivindicaciones 5-8 precedentes.
10. - Un equipo de usuario (UE) que incluye un descodificador conforme a la reivindicacion 9.

Z(fc)=-