ES2668920T3

ES2668920T3 - Libro de códigos de dominio de transformada en un codificador y decodificador CELP

Info

Publication number: ES2668920T3
Application number: ES12782641.0T
Authority: ES
Inventors: Vaclav Eksler
Original assignee: VoiceAge Corp
Current assignee: VoiceAge Corp
Priority date: 2011-05-11
Filing date: 2012-05-09
Publication date: 2018-05-23
Anticipated expiration: 2032-05-09
Also published as: CA2830105A1; US8825475B2; HK1191395A1; JP6173304B2; US20120290295A1; DK2707687T3; EP2707687A4; CN103518122B; NO2669468T3; PT2707687T; WO2012151676A1; CN103518122A; JP2014517933A; EP2707687B1; EP2707687A1; CA2830105C

Abstract

Un codificador de una señal (s(n)) de audio de entrada, que comprende: una etapa de libro de códigos adaptativo estructurada para buscar en un libro (120) de códigos adaptativo un índice (T) de libro de códigos adaptativo y una ganancia (gp) de libro de códigos adaptativo; una disposición de libros de códigos que comprende: una primera etapa de libro de códigos que incluye un libro de códigos seleccionado entre un libro (130, 604, 607) de códigos CELP de dominio temporal y un libro (320, 520, 605, 606) de códigos de dominio de transformada, que incluye un calculador (303) de una transformada de una señal objetivo (300, 500) de libro de códigos de dominio de transformada y un cuantificador (305) de coeficientes (304, 504) de dominio de transformada del calculador (303) de transformada; y una segunda etapa de libro de códigos que incluye el otro entre el libro (130, 604, 607) de códigos CELP de dominio temporal y el libro (320, 520, 605, 606) de códigos de dominio de transformada; estando la primera y la segunda etapa de libro de códigos estructuradas para buscar en el libro (130, 604, 607) de códigos CELP de dominio temporal y en el libro (320, 520, 605, 606) de códigos de dominio de transformada respectivos un índice (k) de libro de códigos de innovación, una ganancia (gc) de libro de códigos de innovación, coeficientes (304, 504) de dominio de transformada y una ganancia (gq) de libro de códigos de dominio de transformada; utilizándose las etapas de libro de códigos en la secuencia etapa de libro de códigos adaptativo, primera etapa de libro de códigos, segunda etapa de libro de códigos para codificar la señal de audio de entrada; caracterizado por que la disposición de libros de códigos comprende además: un selector de un orden del libro (130, 604, 607) de códigos CELP de dominio temporal y del libro (320, 520, 605, 606) de códigos de dominio de transformada en la primera y la segunda etapa de libro de códigos, respectivamente, como una función de (a) características de la señal (s(n)) de audio de entrada y/o (b) una tasa de bits de un códec que utiliza la disposición de libros de códigos.

Description

5

10

15

20

25

30

35

40

45

50

DESCRIPCION

Libro de códigos de dominio de transformada en un codificador y decodificador CELP Campo

La presente descripción se refiere a una disposición de libros de códigos para el uso en la codificación de una señal de audio de entrada, y a un codificador y un decodificador que utilizan tal disposición de libros de códigos.

Antecedentes

El modelo de predicción lineal excitada por código (Code-Excited Linear Prediction (CELP)) se utiliza ampliamente para codificar señales de audio, por ejemplo voz, a bajas tasas de bits.

En la codificación CELP, la señal vocal se muestrea y se procesa en bloques sucesivos de un número predeterminado de muestras denominados normalmente tramas, que corresponden en cada caso típicamente a 1030 ms de voz. Las tramas están a su vez divididas en bloques más pequeños denominados subtramas.

En CELP, la señal se modela como una excitación procesada a través de un filtro 1/A(z) de síntesis variable con el tiempo. El filtro de síntesis variable con el tiempo puede adoptar muchas formas, pero muy frecuentemente se utiliza un filtro todo polos recursivo lineal. El inverso del filtro de síntesis variable con el tiempo, que es por lo tanto un filtro A(z) todo ceros no recursivo lineal, se define como un predictor a corto plazo (short-term predictor (STP)), dado que comprende coeficientes calculados de tal manera que se minimice un error de predicción entre una muestra s(n) de la señal de audio de entrada y la suma ponderada de las muestras anteriores s(n-1), s(n-2), .., s(n-m), donde m es el orden del filtro y n es un índice de dominio temporal discreto, n = 0,...,L-1, siendo L la longitud de una ventana de análisis. Otra denominación utilizada frecuentemente para el STP es predictor lineal (Linear Predictor (LP)).

Si el error de predicción del filtro LP se aplica como la entrada del filtro de síntesis variable con el tiempo con un estado inicial adecuado, la salida del filtro de síntesis es la señal de audio original, por ejemplo voz. A bajas tasas de bits, no es posible transmitir el residuo de error exacto (error de predicción minimizado del filtro LP). Por consiguiente, el residuo de error se codifica para formar una aproximación denominada excitación. En los codificadores CELP, la excitación se codifica como la suma de dos contribuciones, la primera contribución tomada de un, así llamado, libro de códigos adaptativo y la segunda contribución de un, así llamado, libro de códigos de innovación o fijo. El libro de códigos adaptativo es esencialmente un bloque de muestras v(n) de la señal de excitación anterior (retardada mediante un parámetro de retardo t) y escalado con una ganancia gp adecuada. El libro de códigos de innovación o fijo está poblado de vectores que tienen el cometido de codificar un residuo de predicción del STP y del libro de códigos adaptativo. El vector c(n) de libro de códigos de innovación o fijo es también escalado con una ganancia gc adecuada. El libro de códigos de innovación o fijo puede diseñarse utilizando muchas estructuras y restricciones. Sin embargo, en los sistemas de codificación de voz modernos se utiliza el modelo de predicción lineal excitada por código algebraico (Algebraic Code-Excited Linear Prediction (ACELP)). Un ejemplo de una implementación de ACELP se describe en [3GPP TS 26.190 “Adaptive Multi- Rate - Wideband (AMR-WB) speech codec; Transcoding functions”] y, por consiguiente, la ACELP se describirá sólo brevemente en la presente descripción. Otros ejemplos de implementaciones de ACELP pueden encontrarse en:

- Bruno Bessette et al.: "Proposed CE for extending the LPD mode in USAC", ISO IEC JTC1/SC29/WG11, octubre de 2010, Guangzhou, China,

- WO 2011/127569 A1,

- Schnitzler et al.: "Wideband speech coding using forward/backward adaptive prediction with mixed time/frequency domain excitation", IEEE Workshop on Speech Coding Proceedings, junio de 1999, Porvoo, Finlandia.

Aunque son muy eficaces para codificar voz a bajas tasas de bits, los libros de códigos ACELP no pueden ganar calidad tan rápidamente como otros enfoques (por ejemplo codificación de transformación y cuantificación vectorial) cuando se aumenta el tamaño del libro de códigos ACELP. Cuando se mide en dB/bit/muestra, el aumento de calidad a mayores tasas de bits (por ejemplo tasas de bits mayores de 16 kbits/s) obtenido utilizando más pulsos con valor distinto de cero por pista en un libro de códigos ACELp no es tan grande como el aumento de calidad (en dB/bit/muestra) a mayores tasas de bits obtenido con la codificación de transformación y cuantificación vectorial. Esto se entiende si se considera que la ACELP codifica esencialmente la señal de audio como una suma de respuestas a impulsos retardadas y escaladas del filtro de síntesis variable con el tiempo. A menores tasas de bits (por ejemplo tasas de bits menores de 12 kbits/s), el modelo ACELP captura rápidamente los componentes esenciales de la excitación. Sin embargo, a mayores tasas de bits resultan útiles una mayor granularidad y, en particular, un mejor control sobre cómo se gastan los bits adicionales en los diferentes componentes de frecuencia de la señal.

5

10

15

20

25

30

35

40

45

Compendio

La presente descripción se refiere a un codificador de una señal de audio de entrada, que comprende:

una etapa de libro de códigos adaptativo estructurada para buscar en un libro de códigos adaptativo un índice de libro de códigos adaptativo y una ganancia de libro de códigos adaptativo;

una disposición de libros de códigos que comprende:

una primera etapa de libro de códigos que incluye un libro de códigos seleccionado entre un libro de códigos CELP de dominio temporal y un libro de códigos de dominio de transformada, que incluye un calculador de una transformada de una señal objetivo de libro de códigos de dominio de transformada y un cuantificador de coeficientes de dominio de transformada del calculador de transformada; y

una segunda etapa de libro de códigos que incluye el otro entre el libro de códigos CELP de dominio temporal y el libro de códigos de dominio de transformada;

estando la primera y la segunda etapa de libro de códigos estructuradas para buscar en el libro de códigos CELP de dominio temporal y en el libro de códigos de dominio de transformada respectivos un índice de libro de códigos de innovación, una ganancia de libro de códigos de innovación, coeficientes de dominio de transformada y una ganancia de libro de códigos de dominio de transformada;

utilizándose las etapas de libro de códigos en la secuencia etapa de libro de códigos adaptativo-primera etapa de libro de códigos-segunda etapa de libro de códigos para codificar la señal de audio de entrada.

La disposición de libros de códigos del codificador comprende además un selector de un orden del libro de códigos CELP de dominio temporal y del libro de códigos de dominio de transformada en la primera y la segunda etapa de libro de códigos, respectivamente, como una función de (a) características de la señal de audio de entrada y/o (b) una tasa de bits de un códec que utiliza la disposición de libros de códigos.

Las anteriores y otras características de la disposición de libros de códigos, del codificador y del descodificador se harán más patentes con la lectura de la siguiente descripción no restrictiva de realizaciones de la misma, que se hace por medio de ejemplos ilustrativos sólo con referencia a los dibujos adjuntos.

Breve descripción de los dibujos

En los dibujos adjuntos:

la Figura 1 es un diagrama de bloques esquemático de un ejemplo de un codificador CELP que utiliza, en este ejemplo no limitativo, ACELP;

la Figura 2 es un diagrama de bloques esquemático de un ejemplo de un decodificador CELP que utiliza, en este ejemplo no limitativo, ACELP;

la Figura 3 es un diagrama de bloques esquemático de un codificador CELP que utiliza una primera estructura de modelo CELP modificado y que incluye una primera disposición de libros de códigos;

la Figura 4 es un diagrama de bloques esquemático de un decodificador CELP de acuerdo con la primera estructura de modelo CELP modificado;

la Figura 5 es un diagrama de bloques esquemático de un codificador CELP que utiliza una segunda estructura de modelo CELP modificado, que incluye una segunda disposición de libro de códigos; y

la Figura 6 es un diagrama de bloques esquemático de un ejemplo de un codificador CELP modificado general con un clasificador para elegir entre diferentes estructuras de libro de código.

Descripción detallada

La Figura 1 muestra los componentes principales de un codificador ACELP 100.

En la Figura 1, y-i(n) es la señal de excitación de libro de códigos adaptativo filtrada (es decir la respuesta de estado cero del filtro de síntesis ponderado al vector v(n) de libro de código adaptativo) y y2(n) es, de manera similar, la señal de excitación de libro de códigos de innovación filtrada. Las señales x-i(n) y X2(n) son señales objetivo para las búsquedas en el libro de códigos adaptativo y en el libro de códigos de innovación, respectivamente. El filtro de síntesis ponderado, denominado H(z), es la cascada del filtro LP 1/A(z) de síntesis y un filtro W(z) de ponderación perceptual, es decir H(z) = [1/A(z)\W(z).

5

10

15

20

25

30

35

El filtro LP A(z) puede presentar, por ejemplo, en la transformada z, la función de transferencia

*D=Z

Ü,Z

donde ai representa los coeficientes de predicción lineal (coeficientes LP) con ao = 1, y M es

r = Q

el número de coeficientes de predicción lineal (orden del análisis LP). Los coeficientes LP ai se determinan en un analizador LP (no mostrado) del codificador ACELP 100. El analizador LP se describe por ejemplo en el artículo anteriormente mencionado [3GPP TS 26.190 “Adaptive Multi-Rate - Wideband (AMR-Wb) speech codec; Transcoding functions”] y, por lo tanto, no se describirá más detalladamente en la presente descripción.

Un ejemplo de filtro de ponderación perceptual puede ser W(z) = A(zlyi)lA(zly2), donde yi y Y2 son constantes que tienen un valor entre 0 y 1 y que determinan la respuesta de frecuencia del filtro de ponderación perceptual W(z).

Búsqueda en libro de códigos adaptativo

En el codificador ACELP 100 de la Figura 1 se lleva a cabo una búsqueda en el libro de códigos adaptativo en la etapa 120 de libro de códigos adaptativo durante cada subtrama, minimizando el error cuadrático medio ponderado entre la voz original y la voz sintetizada. Esto se logra maximizando el término

imagen1

donde x-i(n) es la señal objetivo anteriormente mencionada, yi(n) es la señal de excitación de libro de códigos adaptativo filtrada anteriormente mencionada y N es la longitud de una subtrama.

La señal objetivo xi(n) se obtiene procesando en primer lugar la señal s(n) de audio de entrada, por ejemplo voz, a través de un filtro W(z) 101 de ponderación perceptual para obtener una señal sw(n) de audio ponderada perceptualmente. A continuación, un substractor 102 resta de la señal Sw(n) de audio de entrada ponderada perceptualmente la respuesta de entrada cero del filtro H(z) 103 de síntesis ponderado, para obtener la señal objetivo xi(n) para la búsqueda en el libro de códigos adaptativo. El filtro W(z) 101 ponderado perceptualmente, el filtro H(z)=W(z)lA(z) 103 de síntesis ponderado y el substractor 102 pueden definirse colectivamente como un calculador de la señal objetivo xi(n) para la búsqueda en el libro de códigos adaptativo.

Durante la búsqueda en el libro de códigos adaptativo se encuentra un índice T (retardo de tono) de libro de códigos adaptativo. A continuación, la ganancia gp (ganancia de tono) de libro de códigos adaptativo, para el índice T de libro de códigos adaptativo encontrado durante la búsqueda en el libro de códigos adaptativo, viene dada por

JV-l

£x, (n)y\n(n)

--------------;—• (2)

n=0

Para una mayor sencillez, el índice T de libro de códigos se suprime de la notación de la señal de excitación de libro de códigos adaptativo filtrada. Así pues, la señal yi(n) es equivalente a la señal y/T)(n).

El índice T de libro de códigos adaptativo y la ganancia gp de libro de códigos adaptativo se cuantifican y se transmiten al decodificador como parámetros de libro de códigos adaptativo. La búsqueda en el libro de códigos adaptativo se describe en el artículo anteriormente mencionado [3GPP TS 26.190 “Adaptive Multi-Rate - Wideband (AMR-WB) speech codec; Transcoding functions”] y, por lo tanto, no se describirá más detalladamente en la presente descripción.

Búsqueda en el libro de códigos de innovación

En la etapa 130 de libro de códigos de innovación se lleva a cabo una búsqueda en el libro de códigos de innovación minimizando, en el calculador 111, el error cuadrático medio ponderado después de eliminar la contribución del libro de códigos adaptativo, es decir

imagen2

10

15

20

25

30

35

40

45

donde la señal objetivo X2(n) para el libro de códigos de innovación se calcula restando de la señal objetivo xi(n) de libro de códigos adaptativo, a través de un substractor 104, la contribución gpyi(n> de excitación de libro de códigos adaptativo.

x2(n) = x¿n)-gp-y¿n). (4)

La contribución de excitación de libro de códigos adaptativo se calcula en la etapa 120 de libro de códigos adaptativo procesando el vector v(n) de libro de códigos adaptativo en el índice T de libro de códigos adaptativo de un libro 121 de códigos adaptativo (libro de códigos CELP de dominio temporal) a través del filtro H(z) 105 de síntesis ponderado, para obtener la señal yi(n) de excitación de libro de códigos adaptativo filtrada (es decir la respuesta de estado cero del filtro 105 de síntesis ponderado al vector v(n) de libro de códigos adaptativo), y amplificando mediante la ganancia gp de libro de códigos adaptativo, utilizando un amplificador 106, la señal yi(n) de excitación de libro de códigos adaptativo filtrada.

La contribución gcy2(k)(n> de excitación de libro de códigos de innovación de la Ecuación (3) se calcula en la etapa 130 de libro de códigos de innovación aplicando un índice k de libro de códigos de innovación a un libro 107 de códigos de innovación para producir un vector c(n> de libro de códigos de innovación. A continuación, el vector c(n> de libro de códigos de innovación se procesa a través del filtro H(z> 108 de síntesis ponderado para producir la señal y2(k)(n> de excitación de libro de códigos de innovación filtrada. A continuación, la señal y2(k)(n> de excitación de libro de códigos de innovación filtrada se amplifica, mediante un amplificador 109, con una ganancia gc de libro de códigos de innovación para producir la contribución gcy2(k)(n> de excitación de libro de códigos de innovación de la Ecuación (3). Finalmente, un substractor 110 calcula el término X2(n>-gcy2(k)(n>. A continuación, el calculador 111 eleva al cuadrado el último término y suma este término a otros términos X2(n>-gcy2(k)(n> correspondientes con diferentes valores de n en el intervalo de 0 a N-1. Como se indica en la Ecuación (3), el calculador 11 repite estas operaciones para diferentes índices k de libro de códigos de innovación para encontrar un valor mínimo del error cuadrático medio ponderado E en un determinado índice k de libro de código de innovación y, por lo tanto, completar el cálculo de la Ecuación (3). Se elige el índice k de libro de códigos de innovación correspondiente al valor mínimo del error cuadrático medio ponderado E.

En los libros de códigos ACELP, el vector c(n> de libro de códigos de innovación contiene M pulsos con signos Sj y posiciones mj y por lo tanto viene dado por

M-1

c(n) = YJ*l<>(n-mi), (5)

j=o '

donde s¡ = ± 1, y 5(n) = 1 para n = 0, y 5(n) = 0 para n t 0.

Finalmente, minimizando E de la Ecuación (3) se obtiene como resultado la ganancia de libro de códigos de innovación óptima

N-1

^x2(n)^2(«)

------------• (6)

¿Í-M"))

n=0

El índice k de libro de códigos de innovación correspondiente al valor mínimo del error cuadrático medio ponderado E y la ganancia gc de libro de códigos de innovación correspondiente se cuantifican y se transmiten al decodificador como parámetros de libro de códigos de innovación. La búsqueda en el libro de códigos de innovación se describe en el artículo anteriormente mencionado [3GPP TS 26.190 “Adaptive Multi-Rate - Wideband (AMR-WB) speech codec; Transcoding functions”] y, por lo tanto, no se describirá más detalladamente en la presente especificación.

La Figura 2 es un diagrama de bloques esquemático que muestra los componentes principales y el principio de funcionamiento de un decodificador ACELP 200.

Remitiéndonos a la Figura 2, el decodificador ACELP 200 recibe parámetros de libro de códigos adaptativo decodificados, incluyendo el índice T (retardo de tono) de libro de códigos adaptativo y la ganancia gp (ganancia de tono) de libro de códigos adaptativo. En una etapa 220 de libro de códigos adaptativo se aplica el índice T de libro de códigos adaptativo a un libro 201 de códigos adaptativo para producir un vector v(n> de libro de códigos adaptativo amplificado con la ganancia gp de libro de códigos adaptativo en un amplificador 202, para producir una contribución 203 de excitación de libro de códigos adaptativo.

Remitiéndonos aún a la Figura 2, el decodificador ACELP 200 recibe también parámetros de libro de códigos de innovación decodificados, incluyendo el índice k de libro de códigos de innovación y la ganancia gc de libro de

5

10

15

20

25

30

35

40

45

50

códigos de innovación. En una etapa 230 de libro de códigos de innovación se aplica el índice k de libro de códigos de innovación decodificado a un libro 204 de códigos de innovación para producir un vector de libro de códigos de innovación correspondiente. A continuación, el vector del libro 204 de códigos de innovación se amplifica con la ganancia gc de libro de códigos de innovación en un amplificador 205 para producir una contribución 206 de excitación de libro de códigos de innovación.

A continuación se forma la excitación total a través de una suma, en un sumador 207, de la contribución 203 de excitación de libro de códigos adaptativo y la contribución 206 de excitación de libro de códigos de innovación. A continuación se procesa la excitación total a través de un filtro LP 1/A(z) 208 de síntesis para producir una síntesis s’(n) de la señal s(n) de audio original, por ejemplo voz.

La presente descripción enseña a modificar el modelo CELP de tal manera que se utilice otra etapa de libro de códigos adicional para formar la excitación. Tal otro libro de códigos se denomina posteriormente etapa de libro de códigos de dominio de transformada, dado que codifica coeficientes de dominio de transformada. En la siguiente descripción se describen la elección de varios libros de códigos y su orden en el modelo CELP. En la Figura 6 se muestra además una estructura general de un modelo CELP modificado.

Primera estructura de modelo CELP modificado

La Figura 4 es un diagrama de bloques esquemático que muestra la primera estructura de modelo CELP modificado aplicada a un decodificador utilizando, en este ejemplo no limitativo, un decodificador ACELP. La primera estructura de modelo CELP modificado comprende una primera disposición de libros de códigos que incluye una etapa 220 de libro de códigos adaptativo, una etapa 420 de libro de códigos de dominio de transformada y una etapa 230 de libro de códigos de innovación. Como está ilustrado en la Figura 4, la excitación total e(n) 408 comprende las siguientes contribuciones:

- en la etapa 220 de libro de códigos adaptativo, el libro 201 de códigos adaptativo produce un vector v(n) de libro de códigos adaptativo en respuesta a un índice T de libro de códigos adaptativo, y es escalado por el amplificador 202 utilizando una ganancia gp de libro de códigos adaptativo, para producir una contribución 203 de excitación de libro de códigos adaptativo;

- en la etapa 420 de libro de códigos de dominio de transformada, un amplificador 407 produce y escala un vector q(n) de dominio de transformada utilizando una ganancia gq de libro de códigos de dominio de transformada, para producir una contribución 409 de excitación de libro de códigos de dominio de transformada; y

- en la etapa 230 de libro de códigos de innovación, el libro 204 de códigos de innovación produce un vector c(n) de libro de códigos de innovación en respuesta a un índice k de libro de códigos de innovación, y es escalado por el amplificador 205 utilizando una ganancia gc de libro de códigos de innovación para producir una contribución 409 de excitación de libro de códigos de innovación. Esto está ilustrado mediante la siguiente relación:

e(n) = g. • v(«) + g ■ q(n) + • c(n), n = 0,.. ,,N-\.

(7)

La primera estructura de modelo CELP modificado combina un libro 402 de códigos de dominio de transformada en una etapa 420, seguido por un libro de códigos ACELP de dominio temporal o libro 204 de códigos de innovación en una etapa 230 siguiente. El libro 402 de códigos de dominio de transformada puede utilizar, por ejemplo, una transformada discreta de coseno (Discrete Cosine Transform (DCT)) como representación de frecuencia de la señal de audio y un decodificador de cuantificador vectorial algebraico (Algebraic Vector Quantizer (AVQ)) para descuantificar los coeficientes de dominio de transformada de la DCT. Hay que señalar que el uso de la DCT y el AVQ son sólo ejemplos; pueden implementarse otras transformadas y pueden utilizarse también otros métodos para cuantificar los coeficientes de dominio de transformada.

Cálculo de la señal objetivo para el libro de códigos de dominio de transformada

En el codificador (Figura 3), el libro de códigos de dominio de transformada de la etapa 320 de libro de códigos de dominio de transformada de la primera disposición de libros de códigos funciona de la siguiente manera. En una determinada subtrama (alineada con la subtrama del libro de códigos de innovación), la señal objetivo para el libro q¡n(n) 300 de códigos de dominio de transformada, es decir el residuo r(n) de excitación después de eliminar el vector gp v(n) de libro de códigos adaptativo escalado, se calcula como

q,„ (*) = r(n) - g ■ v(n), n = 0,... ¿f-1,

(8)

donde r(n) es el, así llamado, vector objetivo en dominio de residuo obtenido filtrando la señal objetivo x-i(n) 315 a través del inverso del filtro H(z) de síntesis ponderado con estados cero. El término v(n) 313 representa el vector de libro de códigos adaptativo y gp 314 la ganancia de libro de códigos adaptativo.

10

15

20

25

30

35

40

45

Filtrado de preacentuación

En el libro de códigos de dominio de transformada, la señal objetivo para el libro qn(n) 300 de códigos de dominio de transformada se preacentúa con un filtro F(z) 301. Un ejemplo de un filtro de preacentuación es F(z)=1/(1-orz'1) con una ecuación en diferencias dada por

(«) = <?,„ (*) + «■ («-•). (9)

donde qn(n) 300 es la señal objetivo alimentada al filtro de preacentuación F(z) 301, q¡n,d(n) 302 es la señal objetivo preacentuada para el libro de códigos de dominio de transformada, y el coeficiente a controla el nivel de preacentuación. En este ejemplo no limitativo, si el valor de a está ajustado entre 0 y 1, el filtro de preacentuación aplica una pendiente espectral a la señal objetivo para el libro de códigos de dominio de transformada con el fin de realzar las frecuencias inferiores.

Cálculo de transformada

El libro de códigos de dominio de transformada comprende también un calculador 303 de transformada para aplicar, por ejemplo, una DCT a la señal objetivo preacentuada q¡n,d(n) 302 utilizando, por ejemplo, una ventana rectangular no solapada para producir bloques de coeficientes Q¡n,d(k) 304 de DCT de dominio de transformada. Puede utilizarse la DCT-II, definiéndose la DCT-II como

imagen3

donde k = 0, ..., N-1, siendo N la longitud de subtrama.

Cuantificación

Dependiendo de la tasa de bits, el libro de códigos de dominio de transformada cuantifica todos los bloques o sólo algunos bloques de coeficientes Q¡n,d(k) 304 de DCT de dominio de transformada normalmente correspondientes a frecuencias inferiores utilizando, por ejemplo, un codificador AVQ 305 para producir coeficientes Qd(k) 306 de DCT de dominio de transformada cuantificados. Los otros coeficientes Q¡n,d(k) 304 de DCT de dominio de transformada no cuantificados se ponen en 0 (no cuantificados). Un ejemplo de implementación de AVQ puede encontrarse en la patente de EE.uU. n° 7,106,228. Los índices de los coeficientes 306 de dominio de transformada cuantificados y codificados del codificador AVQ 305 se transmiten como parámetros de libro de códigos de dominio de transformada al decodificador.

En cada subtrama se compone un presupuesto de bits asignado al AVQ como una suma de un presupuesto de bits fijo y un número flotante de bits. El codificador AVQ 305 comprende una pluralidad de subcuantificadores AVQ para cuantificar por AVQ los coeficientes Q¡n,d(k) 304 de DCT de dominio de transformada. Dependiendo de los subcuantificadores AVQ utilizados del codificador 305, el AVQ normalmente no consume todos los bits asignados, dejando un número variable de bits disponible en cada subtrama. Estos bits son bits flotantes empleados en la siguiente subtrama. El número flotante de bits es igual a 0 en la primera subtrama y los bits flotantes resultantes del AVQ en la última subtrama de una trama determinada permanecen sin usar. La descripción anterior del presente párrafo admite una codificación de tasa de bits fija con un número fijo de bits por trama. En una configuración de codificación de tasa de bits variable puede utilizarse un número diferente de bits en cada subtrama, de acuerdo con cierta medida de distorsión o en relación con la ganancia del codificador AVQ 305. El número de bits puede controlarse para alcanzar una determinada tasa de bits media.

Cálculo de transformada inversa

Para obtener la contribución de excitación de libro de códigos de dominio de transformada en el dominio temporal, en primer lugar la etapa 320 de libro de códigos de dominio de transformada transforma inversamente los coeficientes Qd(k) 306 de DCT de dominio de transformada cuantificados en un calculador 307 de transformada inversa utilizando una DCT inversa (iDCT) para producir una excitación qd(n) 308 cuantificada, acentuada e inversamente transformada (señal de audio inversamente transformada). Se utiliza la DCT-II inversa (correspondiente a DCT-III hasta un factor de escala de 2/N), que se define como

imagen4

donde n = 0, ..., N-1, siendo N la longitud de subtrama. Filtrado de desacentuación

10

15

20

25

30

35

A continuación se aplica un filtro 1/F(z) 309 de desacentuación a la excitación qd(n) 308 cuantificada, acentuada e inversamente transformada para obtener la excitación de dominio temporal de la etapa q(n) 310 de libro de códigos de dominio de transformada. El filtro 309 de desacentuación tiene la función de transferencia inversa (1/F(z)) del filtro F(z) 301 de preacentuación. En el ejemplo no limitativo del filtro F(z) de preacentuación indicado anteriormente en la Ecuación (9), la ecuación en diferencias del filtro 1/F(z) de desacentuación vendría dada por

?(») = ?</(«)- «•&(»-!).

(12)

donde, en el caso del filtro 309 de desacentuación, qd(n) 308 es la excitación qd(n) 308 cuantificada, acentuada e inversamente transformada y q(n) 310 es la señal de excitación de dominio temporal de la etapa q(n) de libro de códigos de dominio de transformada.

Cálculo y cuantificación de ganancia de libro de códigos de dominio de transformada

Una vez calculada la señal de excitación de dominio temporal a partir de la etapa q(n) 310 de libro de códigos de dominio de transformada, un calculador (no mostrado) calcula la ganancia de libro de códigos de dominio de transformada de la siguiente manera:

AM

Za,„ (*)&«

-------------. (13)

k=0

donde Qin,d(k) son los coeficientes 304 de DCT de dominio de transformada de entrada, Qd(k) son los coeficientes 304 de DCT de dominio de transformada de salida de AVQ (cuantificados), k es el índice de coeficiente de dominio de transformada, k = 0, ..., N-1, siendo N el número de coeficientes de DCT de dominio de transformada.

Aún en la etapa 320 de libro de códigos de dominio de transformada, la ganancia de libro de códigos de dominio de transformada de la Ecuación (13) se cuantifica de la siguiente manera. En primer lugar se normaliza la ganancia mediante la energía Epred de innovación prevista como se indica a continuación:

imagen5

La energía Epred de innovación prevista se obtiene como una energía de señal residual media de todas las subtramas dentro de la trama en cuestión, restando una estimación de la contribución de libro de códigos adaptativo. Es decir

imagen6

donde P es el número de subtramas, y Cncrm(0) y Cncrm(1) son las correlaciones normalizadas de la primera y la segunda semitrama del análisis de tono en lazo abierto, respectivamente, y r(n) es el vector objetivo en el dominio de residuo.

A continuación, la ganancia normalizada gq,norm se cuantifica mediante un cuantificador escalar en un dominio logarítmico y finalmente se desnormaliza, dando como resultado una ganancia de libro de códigos de dominio de transformada cuantificada. En un ejemplo ilustrativo se utiliza un cuantificador escalar de 6 bits, por lo que los niveles de cuantificación están uniformemente distribuidos en el dominio logarítmico. El índice de la ganancia de libro de códigos de dominio de transformada cuantificada se transmite como un parámetro de libro de códigos de dominio de transformada al decodificador.

Refinación de la ganancia de libro de códigos adaptativo

Cuando se utiliza la primera estructura de modelo CELP modificado, la señal de excitación de dominio temporal procedente de la etapa q(n) 310 de libro de códigos de dominio de transformada puede utilizarse para refinar la señal objetivo original para la búsqueda x-i(n) 315 en el libro de códigos adaptativo como

x\MP<ü(n) = x]<<n)-gíl-yi{n), (15)

y la etapa de libro de códigos adaptativo refina la ganancia de libro de códigos adaptativo utilizando la Ecuación (2) con el uso de x-\,Updt(n) en lugar de x-i(n). La señal y3(n) es la señal de excitación de libro de códigos de dominio de

5

10

15

20

25

30

35

40

45

transformada filtrada obtenida filtrando la señal de excitación de dominio temporal de la etapa q(n) 310 de libro de códigos de dominio de transformada a través del filtro H(z) 311 de síntesis ponderado (es decir la respuesta de estado cero del filtro H(z) 311 de síntesis ponderado a la contribución q(n) de excitación de libro de códigos de dominio de transformada).

Cálculo del vector objetivo para búsqueda en libro de códigos de innovación

Cuando se utiliza la etapa 320 de libro de códigos de dominio de transformada, el cálculo de la señal objetivo para la búsqueda X2(n) 316 en el libro de códigos de innovación se lleva a cabo utilizando la Ecuación (4) con x-\(n)=x-\,upd(n) y con gp=gp,updt, es decir

*2 («) = hupd, (n) - gP,uPj, ■ y\ (»)

= x,{n)-gí!-y3(n)-gpupi¡ry](n)

Remitiéndonos a la Figura 3, el amplificador 312 lleva a cabo la operación gq-y3(n) para calcular la contribución de excitación de libro de códigos de dominio de transformada, y los substractores 104 y 317 llevan a cabo la operación

X1(n)-gp,updry1(n)-gqy3(n).

De modo similar, la señal objetivo en el dominio r(n) de residuo se actualiza para la búsqueda en el libro de códigos de innovación de la siguiente manera:

V ” s* ■ ?(w> - gp.up* ■ v(") • (17)

A continuación se aplica la búsqueda en el libro de códigos de innovación como en el modelo ACELP.

Libro de códigos de dominio de transformada en el decodificador

Remitiéndonos de nuevo a la Figura 4, en el decodificador, la contribución 409 de excitación de la etapa 420 de libro de códigos de dominio de transformada se obtiene de los parámetros de libro de códigos de dominio de transformada recibidos, incluyendo los coeficientes Qd(k) de DCT de dominio de transformada cuantificados y la ganancia gq de libro de códigos de dominio de transformada.

El libro de códigos de dominio de transformada descuantifica en primer lugar los coeficientes Qd(k) de DCT de dominio de transformada cuantificados decodificados (cuantificados) recibidos, utilizando, por ejemplo, un decodificador AVQ 404 para producir coeficientes de DCT de dominio de transformada descuantificados. A estos coeficientes de DCT de dominio de transformada descuantificados se les aplica una transformada inversa, por ejemplo una DCT inversa (iDCT), a través de un calculador 405 de transformada inversa. En el decodificador, el libro de códigos de dominio de transformada aplica un filtro 1/F(z) 406 de desacentuación después de la transformada DCT inversa para formar la señal q(n) 407 de excitación de dominio temporal. A continuación, la etapa 420 de libro de códigos de dominio de transformada, por medio de un amplificador 407, utilizando la ganancia gq de libro de códigos de dominio de transformada, escala la señal q(n) 407 de excitación de dominio temporal para formar la contribución 409 de excitación de libro de códigos de dominio de transformada.

A continuación se forma la excitación total 408 a través de una suma, en un sumador 410, de la contribución 203 de excitación de libro de códigos adaptativo, la contribución 409 de excitación de libro de códigos de dominio de transformada y la contribución 206 de excitación de libro de códigos de innovación. A continuación se procesa la excitación total 408 a través del filtro LP 1/A(z) 208 de síntesis para producir una síntesis s’(n) de la señal de audio original, por ejemplo voz.

Presupuesto de bits de libro de códigos de dominio de transformada

Por lo general, cuanto mayor es la tasa de bits tanto mayor es la cantidad de bits utilizados por el libro de códigos de dominio de transformada, lo que hace que el tamaño del libro de códigos de innovación sea el mismo en todas las diferentes tasas de bits. La primera estructura de modelo CELP modificado anteriormente descrita puede utilizarse a altas tasas de bits (alrededor de 48 kbit/s y más) para codificar señales de voz de forma prácticamente transparente y para codificar eficazmente también señales de audio genéricas.

A tasas de bits tan altas, el cuantificador vectorial de las ganancias de libro de códigos adaptativo y de innovación puede reemplazarse por dos cuantificadores escalares. Más específicamente, se utiliza un cuantificador escalar lineal para cuantificar la ganancia gp de libro de códigos adaptativo y se utiliza un cuantificador escalar logarítmico para cuantificar la ganancia gc de libro de códigos de innovación.

Segunda estructura de modelo CELP modificado

La primera estructura de modelo CELP modificado anteriormente descrita, en la que se utiliza una etapa de libro de códigos de dominio de transformada seguida de una etapa de libro de códigos de innovación (Figura 3), puede

5

10

15

20

25

30

35

40

45

50

55

cambiarse más de forma adaptativa dependiendo de las características de la señal de audio de entrada. Por ejemplo, a la hora de codificar segmentos de voz inactivos, puede ser ventajoso cambiar el orden de la etapa de libro de códigos de dominio de transformada y la etapa de libro de códigos de innovación ACELP. Por lo tanto, la segunda estructura de modelo CELP modificado utiliza una segunda disposición de libros de códigos que combina el libro de códigos adaptativo de dominio temporal en una primera etapa de libro de códigos, seguido de un libro de códigos de innovación ACELP de dominio temporal en una segunda etapa de libro de códigos, seguido de un libro de códigos de dominio de transformada en una tercera etapa de libro de códigos. El libro de códigos de innovación ACELP de la segunda etapa puede comprender normalmente libros de códigos muy pequeños e incluso puede evitarse.

Contrariamente a la primera estructura de modelo CELP modificado, en la que la etapa de libro de códigos de dominio de transformada puede considerarse como un precuantificador para la etapa de libro de códigos de innovación, en la segunda disposición de libros de códigos de la segunda estructura de modelo CELP modificado la etapa de libro de códigos de dominio de transformada se utiliza como un cuantificador de tercera etapa autónomo (o un cuantificador de segunda etapa si no se utiliza la etapa de libro de códigos de innovación). Aunque la etapa de libro de códigos de dominio de transformada da normalmente más importancia a codificar las frecuencias inferiores perceptualmente más importantes, contrariamente a la etapa de libro de códigos de dominio de transformada en la primera disposición de libros de códigos para blanquear el residuo de excitación después de la substracción de las contribuciones de excitación de libro de códigos adaptativo y de innovación en toda la gama de frecuencias. Esto puede ser deseable a la hora de codificar los segmentos con características de ruido (inactivos) de la señal de audio de entrada.

Remitiéndonos a la Figura 5, que es un diagrama de bloques de la segunda estructura de modelo CELP modificado, la etapa 520 de libro de códigos de dominio de transformada funciona de la siguiente manera. En una determinada subtrama, la señal objetivo para la búsqueda X3(n) 518 en el libro de códigos de dominio de transformada es calculada por un calculador utilizando el substractor 104, que resta de la señal objetivo x-i(n) de búsqueda en el libro de códigos adaptativo la señal y-i(n) de excitación de libro de códigos adaptativo filtrada escalada por el amplificador 106 utilizando la ganancia gp de libro de códigos adaptativo para formar la señal objetivo X2(n) de búsqueda en el libro de códigos de innovación, y un substractor 525, que resta de la señal objetivo X2(n) de búsqueda en el libro de códigos de innovación la señal y2(n) de excitación de libro de códigos de innovación filtrada escalada por el amplificador 109 utilizando la ganancia gc de libro de códigos de innovación (si se utiliza el libro de códigos de innovación), de la siguiente manera:

*3O) = *1 (») -gP yt («) -gc-yj(«) n = 0,...,N-\. (18)

El calculador filtra también la señal objetivo para la búsqueda X3(n) 518 en el libro de códigos de dominio de transformada a través del inverso del filtro H(z) de síntesis ponderado con estados cero, lo que tiene como resultado la señal objetivo de dominio de residuo para la búsqueda un(n) 500 en el libro de códigos de dominio de transformada.

Filtrado de preacentuación

La señal un(n) 500 se utiliza como señal de entrada para la búsqueda en el libro de códigos de dominio de transformada. En este ejemplo no limitativo, en el libro de códigos de dominio de transformada, la señal un(n) 500 se preacentúa en primer lugar con un filtro F(z) 301 para producir una señal preacentuada u¡n,d(n) 502. La Ecuación (9) constituye un ejemplo de un filtro de preacentuación de este tipo. El filtro de la Ecuación (9) aplica una pendiente espectral a la señal u¡n(n) 500 para realzar las frecuencias inferiores.

Cálculo de transformada

El libro de códigos de dominio de transformada comprende también, por ejemplo, una DCT aplicada por el calculador 303 de transformada a la señal preacentuada u¡n,d(n) 502 utilizando, por ejemplo, una ventana rectangular no solapada para producir bloques de coeficientes U ¡n,d(k) 504 de DCT de dominio de transformada. En la Ecuación (10) se ofrece un ejemplo de la DCT.

Cuantificación

Por lo general, todos los bloques de coeficientes U ¡n,d(k) 504 de DCT de dominio de transformada se cuantifican utilizando, por ejemplo, el codificador AVQ 305 para producir coeficientes Ud(k) 506 de DCT de dominio de transformada cuantificados. Sin embargo, los coeficientes Ud(k) 506 de DCT de dominio de transformada cuantificados pueden ponerse a cero a bajas tasas de bits, como se ha explicado en la descripción anterior. Contrariamente al libro de códigos de dominio de transformada de la primera disposición de libros de códigos, el codificador AVQ 305 puede utilizarse para codificar bloques con la mayor energía en todo el ancho de banda, en lugar de forzar al AVQ a codificar los bloques correspondientes a frecuencias inferiores.

5

10

15

20

25

30

35

40

45

De modo similar a la primera disposición de libros de códigos, se compone un presupuesto de bits asignado al AVQ en cada subtrama como una suma de un presupuesto de bits fijo y un número flotante de bits. Los índices de los coeficientes Ud(k) 506 de DCT de dominio de transformada cuantificados codificados del codificador AVQ 305 se transmiten como parámetros de libro de códigos de dominio de transformada al decodificador.

En otro ejemplo no limitativo, la cuantificación puede llevarse a cabo minimizando el error cuadrático medio en un dominio ponderado perceptualmente como en la búsqueda en el libro de códigos CELP. El filtro F(z) 301 de preacentuación anteriormente descrito puede considerarse como una forma sencilla de ponderación perceptual. Puede llevarse a cabo una ponderación perceptual más elaborada filtrando la señal un(n) 500 antes de la transformada y la cuantificación. Por ejemplo, sustituir el filtro F(z) 301 de preacentuación por el filtro W(z)/A(z) de síntesis ponderado es equivalente a transformar y cuantificar la señal objetivo X3(n). La ponderación perceptual puede aplicarse también en el dominio de transformada, por ejemplo multiplicando los coeficientes U¡n,d(k) 504 de DCT de dominio de transformada por una máscara de frecuencia antes de la cuantificación. Esto eliminará la necesidad de un filtrado de preacentuación y desacentuación. La máscara de frecuencia podría obtenerse del filtro W(z)/A(z) de síntesis ponderado.

Cálculo de transformada inversa

Los coeficientes Ud(k) 506 de DCT de dominio de transformada cuantificados se transforman inversamente en el calculador 307 de transformada inversa utilizando, por ejemplo, una DCT inversa (iDCT) para producir una excitación Ud(n) 508 cuantificada, acentuada e inversamente transformada. En la Ecuación (11) se ofrece un ejemplo de la transformada inversa.

La excitación Ud(n) 508 cuantificada, acentuada e inversamente transformada se procesa a través del filtro 1/F(z) 309 de desacentuación para obtener una señal de excitación de dominio temporal de la etapa u(n) 510 de libro de códigos de dominio de transformada. El filtro 309 de desacentuación tiene la función de transferencia inversa del filtro F(z) 301 de preacentuación; en el ejemplo no limitativo del filtro F(z) de preacentuación anteriormente descrito, la función de transferencia del filtro 309 de desacentuación viene dada por la Ecuación (12).

La señal y3(n) 516 es la señal de excitación de libro de códigos de dominio de transformada obtenida filtrando la señal u(n) 510 de excitación de dominio temporal a través del filtro H(z) 311 de síntesis ponderado (es decir la respuesta de estado cero del filtro H(z) 311 de síntesis ponderado a la señal u(n) 510 de excitación de dominio temporal).

Finalmente, la señal y3(n) 516 de excitación de libro de códigos de dominio de transformada se escala mediante el amplificador 312 utilizando la ganancia gq de libro de códigos de dominio de transformada.

Una vez calculada la contribución u(n) 510 de excitación de libro de códigos de dominio de transformada, se obtiene la ganancia gq de libro de códigos de dominio de transformada utilizando la siguiente relación:

N-1

----------------. (w)

k=0

donde U¡n,d(k) 504 son los coeficientes de DCT de dominio de transformada de entrada de AVQ y Ud(k) 506 son los coeficientes de DCT de dominio de transformada cuantificados de salida.

La ganancia gq de libro de códigos de dominio de transformada se cuantifica utilizando la normalización mediante la ganancia gc de libro de códigos de innovación. En un ejemplo se utiliza un cuantificador escalar de 6 bits, por lo que los niveles de cuantificación están uniformemente distribuidos en el dominio lineal. El índice de la ganancia gq de libro de códigos de dominio de transformada cuantificada se transmite como un parámetro de libro de códigos de dominio de transformada al decodificador.

Limitación de la contribución de libro de códigos adaptativo

Cuando se codifican los segmentos de señal de audio inactivos, por ejemplo segmentos de voz inactivos, la contribución de excitación de libro de códigos adaptativo se limita para evitar una gran periodicidad en la síntesis. En la práctica, la ganancia gp de libro de códigos adaptativo está limitada normalmente con 0<gp<1,2. Cuando se codifica un segmento de señal de audio inactivo, se prevé un limitador en la búsqueda en el libro de códigos adaptativo para limitar la ganancia gp de libro de códigos adaptativo con 0<gp<0,65.

Libro de códigos de dominio de transformada en el decodificador

5

10

15

20

25

30

35

40

45

En el decodificador, la contribución de excitación del libro de códigos de dominio de transformada se obtiene descuantificando en primer lugar los coeficientes (de DCT) de dominio de transformada decodificados (cuantificados) (utilizando, por ejemplo, un decodificador AVQ (no mostrado)) y aplicando la transformada inversa (por ejemplo DCT inversa (iDCT)) a estos coeficientes (de DCT) de dominio de transformada descuantificados. Finalmente se aplica el filtro 1/F(z) de desacentuación después de la transformada DCT inversa para formar la señal u(n) de excitación de dominio temporal escalada mediante la ganancia gq de libro de códigos de dominio de transformada (véase el libro 402 de códigos de dominio de transformada de la Figura 4).

En el decodificador, el orden de los libros de código y las correspondientes etapas de libro de código durante el proceso de decodificación no es importante, dado que una contribución de un libro de códigos en particular no depende de otras contribuciones de libro de códigos ni afecta a las mismas. Así pues, la segunda disposición de libros de códigos en la segunda estructura de modelo CELP modificado puede ser idéntica a la primera disposición de libros de códigos de la primera estructura de modelo CELP modificado de la Figura 4 con q(n) = u(n) y la excitación total viene dada por la Ecuación (7).

Finalmente, se busca en el libro de códigos de dominio de transformada restando, a través de un substractor 530, (a) la señal de excitación de dominio temporal de la etapa u(n) de libro de códigos de dominio de transformada, procesada a través del filtro H(z) 311 de síntesis ponderado y escalada mediante la ganancia gq de libro de códigos de dominio de transformada, de (b) la señal objetivo X3(n) 518 de búsqueda en el libro de códigos de dominio de transformada y minimizando el criterio de error min {|error(n)|2} en el calculador 511, como está ilustrado en la Figura 5.

Modelo CELP modificado general

En la Figura 6 se muestra un codificador CELP modificado general con una pluralidad de posibles estructuras.

El codificador CELP de la Figura 6 comprende un selector de un orden del libro de códigos CELP de dominio temporal y del libro de códigos de dominio de transformada en la segunda y la tercera etapa de libro de códigos, respectivamente, como una función de características de la señal de audio de entrada. El selector también puede reaccionar a la tasa de bits del códec con la utilización del modelo CELP modificado para no seleccionar ningún libro de códigos en la tercera etapa, más específicamente para evitar la tercera etapa. En este último caso, a la segunda etapa de libro de códigos no le sigue una tercera.

Como está ilustrado en la Figura 6, el selector puede comprender un clasificador 601 que reaccione a la señal de audio de entrada, tal como voz, para clasificar cada una de las tramas sucesivas por ejemplo como trama (o segmento) de voz activa o trama (o segmento) de voz inactiva. La salida del clasificador 601 se utiliza para accionar un primer conmutador 602 que determina si la segunda etapa de libro de códigos después de la etapa de libro de códigos adaptativo es una codificación ACELP 604 o una codificación 605 de dominio de transformada (TD). Además, un segundo conmutador 603, también accionado por la salida del clasificador 601, determina si la segunda etapa ACELP 604 va seguida de una etapa TD 606 o si la segunda etapa TD 605 va seguida de una etapa ACELP 607. Además, el clasificador 601 puede accionar el segundo conmutador 603 en relación con un trama de voz activa o inactiva y una tasa de bits del códec con la utilización del modelo CELP modificado, de manera que a la segunda etapa ACELP 604 o a la segunda etapa TD 605 no le sigue ninguna otra etapa.

En un ejemplo ilustrativo, se muestran en la Tabla I el número de libros de códigos (etapas) y su orden en un modelo CELP modificado. Como puede verse en la Tabla I, la decisión por parte del clasificador 601 depende del tipo de señal (tramas de voz activas o inactivas) y de la tasa de bits del códec.

Tabla I - Libros de códigos en un ejemplo de modelo CELP modificado (LCA significa libro de códigos adaptativo y LCDT significa libro de códigos de dominio de transformada)

Tasa de bits de códec: Tramas de voz activas Tramas de voz inactivas

16 kbit/s: LCA^ACELP LCA^ACELP

24 kbit/s: LCA^ACELP LCA^ACELP

32 kbit/s: LCA^LCDT^ACELP LCA^ACELP^LCDT

48 kbit/s: LCA^LCDT^ACELP LCA^ACELP^LCDT

Aunque en la presente memoria se han ofrecido anteriormente algunos ejemplos de implementación con referencia a un modelo ACELP, hay que tener presente que podría utilizarse un modelo CELP diferente del ACELP. También hay que señalar que el uso de la dCt y el aVq son sólo ejemplos; pueden implementarse otras transformadas y también pueden utilizarse otros métodos para cuantificar los coeficientes de dominio de transformada.

Claims

1.

5

10

15

20

25

2.

30 3.

4.

35 5.

6.

40 7.

8.

45

REIVINDICACIONES

Un codificador de una señal (s(n)) de audio de entrada, que comprende:

una etapa de libro de códigos adaptativo estructurada para buscar en un libro (120) de códigos adaptativo un índice (T) de libro de códigos adaptativo y una ganancia (gp) de libro de códigos adaptativo;

una disposición de libros de códigos que comprende:

una primera etapa de libro de códigos que incluye un libro de códigos seleccionado entre un libro (130, 604, 607) de códigos CELP de dominio temporal y un libro (320, 520, 605, 606) de códigos de dominio de transformada, que incluye un calculador (303) de una transformada de una señal objetivo (300, 500) de libro de códigos de dominio de transformada y un cuantificador (305) de coeficientes (304, 504) de dominio de transformada del calculador (303) de transformada; y

una segunda etapa de libro de códigos que incluye el otro entre el libro (130, 604, 607) de códigos CELP de dominio temporal y el libro (320, 520, 605, 606) de códigos de dominio de transformada;

estando la primera y la segunda etapa de libro de códigos estructuradas para buscar en el libro (130, 604, 607) de códigos CELP de dominio temporal y en el libro (320, 520, 605, 606) de códigos de dominio de transformada respectivos un índice (k) de libro de códigos de innovación, una ganancia (gc) de libro de códigos de innovación, coeficientes (304, 504) de dominio de transformada y una ganancia (g,) de libro de códigos de dominio de transformada;

utilizándose las etapas de libro de códigos en la secuencia etapa de libro de códigos adaptativo, primera etapa de libro de códigos, segunda etapa de libro de códigos

para codificar la señal de audio de entrada;

caracterizado por que la disposición de libros de códigos comprende además:

un selector de un orden del libro (130, 604, 607) de códigos CELP de dominio temporal y del libro (320, 520, 605, 606) de códigos de dominio de transformada en la primera y la segunda etapa de libro de códigos, respectivamente, como una función de (a) características de la señal (s(n)) de audio de entrada y/o (b) una tasa de bits de un códec que utiliza la disposición de libros de códigos.

Un codificador según la reivindicación 1, en donde el selector comprende un clasificador (601) de la señal (s(n)) de audio de entrada y al menos un primer conmutador (602) controlado por el clasificador (601) para cambiar el orden del libro (130, 604, 607) de códigos CELP de dominio temporal y del libro (320, 520, 605, 606) de códigos de dominio de transformada en la primera y la segunda etapa de libro de códigos.

Un codificador según la reivindicación 2, en donde el selector comprende un segundo conmutador (603) que reacciona tanto a las características de la señal (s(n)) de audio de entrada como a la tasa de bits del códec que utiliza la disposición de libros de códigos, para evitar la segunda etapa de libro de códigos.

Un codificador según la reivindicación 2, en donde el clasificador (601) clasifica cada uno de los segmentos sucesivos de la señal (s(n)) de audio de entrada como segmento de voz activo o segmento de voz inactivo.

Un codificador según la reivindicación 1, en donde la disposición de libros de códigos comprende varias etapas de libro de códigos relacionadas con (a) características de la señal de audio de entrada y/o (b) una tasa de bits de un códec que utiliza la disposición de libros de códigos.

Un codificador según la reivindicación 1, en donde la transformada es una transformada discreta de coseno y el cuantificador (305) es un cuantificador vectorial algebraico.

Un codificador según la reivindicación 1 o 6, en donde el libro (320, 520, 605, 606) de códigos de dominio de transformada comprende un filtro (301) de preacentuación que procesa la señal objetivo (300, 500) de libro de códigos de dominio de transformada antes de suministrar dicha señal objetivo (302, 502) de libro de códigos de dominio de transformada al calculador (303) de transformada.

Un codificador según una cualquiera de las reivindicaciones 1,6 y 7, en donde la etapa de libro (320, 520, 605, 606) de códigos de dominio de transformada comprende además un calculador (307) de una transformada inversa (30, 508) de coeficientes (306, 506) de dominio de transformada cuantificados del cuantificador (305), un filtro (309) de desacentuación para procesar los coeficientes (308, 508) de dominio de transformada cuantificados e inversamente transformados para producir una señal (310, 510) de excitación de dominio temporal, un filtro (311) de síntesis ponderado para procesar la señal (310, 510) de excitación de dominio temporal para producir una señal (y3(n)) de excitación de libro de códigos de dominio de transformada filtrada, y un amplificador (312) que utiliza la ganancia (g,) de libro de códigos de dominio

5

10

15

20

25

30

35

40

45

de transformada para escalar la señal (y3(n)) de excitación de libro de códigos de dominio de transformada filtrada para producir la contribución (409) de excitación de libro de códigos de dominio de transformada.

9. Un codificador según una cualquiera de las reivindicaciones 1 y 6 a 8, en donde la etapa de libro de códigos adaptativo comprende un libro (120) de códigos adaptativo provisto de un índice (T) de libro de códigos adaptativo para producir un vector (v(n)) de libro de códigos adaptativo y en donde el codificador comprende un calculador (104,105, 106) de la señal objetivo (300) de libro de códigos de dominio de transformada que utiliza el vector (v(n)) de libro de códigos adaptativo cuando el libro (320, 520, 605, 606) de códigos de dominio de transformada está incluido en la primera etapa de libro de códigos.

10. Un codificador según una cualquiera de las reivindicaciones 1 y 6 a 8, en donde:

la etapa de libro de códigos adaptativo comprende un libro (120) de códigos adaptativo y calcula una contribución (203) de excitación de libro de códigos adaptativo suministrando el índice (T) de libro de códigos adaptativo al libro (120) de códigos adaptativo para producir un vector (v(n)) de libro de códigos adaptativo, procesando el vector (v(n)) de libro de códigos adaptativo a través de un filtro (105) de síntesis ponderado para producir una señal (yi(n)) de excitación de libro de códigos adaptativo filtrada y amplificando la señal de excitación de libro de códigos adaptativo filtrada con un amplificador (106) que utiliza la ganancia (gp) de libro de códigos adaptativo para producir la contribución (203) de excitación de libro de códigos adaptativo; y

la etapa de libro de códigos CELP de dominio temporal comprende como libro (130, 604, 607) de códigos CELP de dominio temporal un libro de códigos de innovación y calcula una contribución (206) de excitación de libro de códigos de innovación aplicando el índice (k) de libro de códigos de innovación al libro de códigos de innovación para producir un vector (c(n)) de libro de códigos de innovación, procesando el vector (c(n)) de libro de códigos de innovación a través de un filtro (108) de síntesis ponderado para producir una señal (y2(n)) de excitación de libro de códigos de innovación filtrada y amplificando la señal (y2(n)) de excitación de libro de códigos de innovación filtrada con un amplificador (109) que utiliza la ganancia (gc) de libro de códigos de innovación para producir la contribución (206) de excitación de libro de códigos de innovación.

11. Un codificador según la reivindicación 10, que comprende un calculador (108, 109, 110) de la señal objetivo (500) de libro de códigos de dominio de transformada que utiliza la contribución (203) de excitación de libro de códigos adaptativo y la contribución (206) de excitación de libro de códigos de innovación cuando el libro (320, 520, 605, 606) de códigos de dominio de transformada está incluido en la segunda etapa de libro de códigos.

12. Un codificador según una cualquiera de las reivindicaciones 1 y 6 a 11, en donde la etapa de libro (320, 520, 605, 606) de códigos de dominio de transformada comprende un presupuesto de bits asignado a la cuantificación por parte del cuantificador (305) que es una suma de un presupuesto de bits fijo y un número flotante de bits.

13. Un codificador según la reivindicación 12, en donde el número flotante de bits en una subtrama actual comprende bits no utilizados para la cuantificación en una subtrama anterior.

14. Un codificador según una cualquiera de las reivindicaciones 1 y 6 a 13, en donde la etapa de libro (320, 520, 605, 606) de códigos de dominio de transformada comprende un calculador de la ganancia (g,) de libro de códigos de dominio de transformada que utiliza coeficientes (304, 504) de dominio de transformada del calculador (303) de transformada y coeficientes (306, 506) de dominio de transformada cuantificados del cuantificador (305).

15. Un codificador según una cualquiera de las reivindicaciones 1 y 6 a 14, en donde la etapa de libro (320, 520, 605, 606) de códigos de dominio de transformada produce una contribución de excitación de libro de códigos de dominio de transformada y en donde la etapa (120) de libro de códigos adaptativo utiliza la contribución de excitación de libro de códigos de dominio de transformada para refinar la ganancia (gp) de libro de códigos adaptativo.

16. Un codificador según una cualquiera de las reivindicaciones 1 y 6 a 15, que comprende un limitador de la ganancia (gp) de libro de códigos adaptativo en presencia de segmentos de señal de audio inactivos.

100

imagen1

imagen2

imagen3

Figura 3

imagen4

síntesis

imagen5

210

imagen6

imagen7

Figura 6