ES2821141T3

ES2821141T3 - Método y codificador para manejar coeficientes de representación de envolvente

Info

Publication number: ES2821141T3
Application number: ES17816811T
Authority: ES
Inventors: Jonas Svedberg; Martin Sehlstedt; Stefan Bruhn
Original assignee: Telefonaktiebolaget LM Ericsson AB
Current assignee: Telefonaktiebolaget LM Ericsson AB
Priority date: 2016-12-16
Filing date: 2017-12-15
Publication date: 2021-04-23
Anticipated expiration: 2037-12-15
Also published as: BR112019008054A2; EP3555885A1; MX2019006535A; US10580422B2; US20200176005A1; WO2018109143A1; US20190362730A1; EP3555885B1; US20230072546A1; PL3555885T3; PT3555885T; CN110050304B; EP3723087A1; CN110050304A; CN116343804A; US11430455B2

Abstract

Un método realizado por un codificador (1600) de un sistema (100) de comunicación para manejar los coeficientes de representación de envolvente de entrada, comprendiendo, el método: determinar (204) coeficientes residuales de representación de envolvente como primeros coeficientes de representación de envolvente comprimidos restados de los coeficientes de representación de envolvente de entrada; transformar (206) los coeficientes residuales de representación de envolvente en un dominio deformado como para obtener coeficientes residuales de representación de envolvente transformados; aplicar (208) al menos un esquema de entre una pluralidad de esquemas de codificación de ganancia y forma en los coeficientes residuales de representación de envolvente transformados con el fin de conseguir coeficientes residuales de representación de envolvente codificados de ganancia y forma, donde, en la pluralidad de esquemas de codificación de ganancia y forma, los esquemas tienen compensaciones diferentes entre sí en la resolución de 15 ganancia y/o en la resolución de forma para uno o más de los coeficientes residuales de representación de envolvente transformados; y transmitir (210), a través de un canal de comunicación a un decodificador, una representación de los primeros coeficientes de representación de envolvente comprimidos, los coeficientes residuales de representación de envolvente codificados de ganancia y forma, e información sobre el al menos un esquema aplicado de codificación de ganancia y forma.

Description

DESCRIPCIÓN

Método y codificador para manejar coeficientes de representación de envolvente

Campo técnico

Las presentes realizaciones se refieren en general a la codificación de voz y audio, y, en particular, al manejo de los coeficientes de representación de envolvente.

Antecedentes

Cuando se manejan señales de audio, tales como señales de voz, en un codificador de una unidad de transmisión, las señales de audio se representan digitalmente en forma comprimida usando, por ejemplo, codificación predictiva lineal, LPC. Como los coeficientes de LPC son sensibles a las distorsiones, que se pueden producir en una señal transmitida en una red de comunicación desde una unidad transmisora a una unidad receptora, los coeficientes de LPC podrían transformarse en coeficientes de representación de envolvente en el codificador. Además, los coeficientes de representación de envolvente se pueden comprimir, es decir, codificar, con el fin de ahorrar ancho de banda en la interfaz de comunicación entre la unidad de transmisión y la unidad de recepción. El documento US 2004/176951 A1 describe un codificador de un sistema de comunicación para manejar coeficientes de representación de envolvente de entrada.

Un uso adicional de la envolvente espectral es aplicar una envolvente de media de frecuencia normalizada retirada para escalar una señal en el dominio frecuencia antes de la cuantificación, en base a una envolvente espectral cuantificada con el fin de controlar la ubicación de la frecuencia y la magnitud de los errores de cuantificación de la línea espectral introducidos en la cuantificación de la línea espectral para esas ubicaciones de frecuencia. La envolvente de media de frecuencia normalizada eliminada puede representarse como un vector de factores de escala.

Los coeficientes de LSF proporcionan una representación compacta de una envolvente espectral, especialmente adecuada para señales de voz. Los coeficientes de LSF se utilizan en codificadores de voz y audio para representar y transmitir la envolvente de la señal a codificar. Los LSF son una representación que se basa típicamente en una predicción lineal. Los LSF comprenden un conjunto ordenado de ángulos en el intervalo de 0 a pi, o, de manera equivalente, un conjunto de frecuencias de 0 a Fs/2, donde Fs es la frecuencia de muestreo de la señal en el dominio tiempo. Los coeficientes de LSF se pueden cuantificar en el lado del codificador y luego se envían al lado del decodificador. Los coeficientes de LSF son robustos a los errores de cuantificación se deben a su propiedad de ordenación. Como beneficio adicional, los valores del coeficiente de LSF de entrada se utilizan fácilmente para sopesar el error de cuantificación para cada coeficiente individual de LSF, un principio de ponderación que coincide bien con el deseo de reducir el error de cuantificación del códec más en áreas de frecuencia perceptualmente importantes que en áreas menos importantes.

Los métodos heredados, como AMR-WB (ancho de banda adaptativo de múltiples velocidades), utilizan un libro de códigos grande almacenado o varios libros de códigos de tamaño medio en varias etapas, tal como el cuantificador de vectores de múltiples etapas (MSVQ) o el MSVQ de división, para LSF, o cuantificación por frecuencias espectrales de inmitancia (ISF), y, por lo general, realizan una búsqueda exhaustiva en libros de códigos que es computacionalmente costosa.

Alternativamente, se puede usar un VQ algorítmico; por ejemplo, en EVS (servicio perfeccionado de voz) se utiliza un VQ escalado de celosía D8+ que aplica una celosía con forma para codificar los coeficientes de LSF. El beneficio de utilizar un VQ estructurado de celosía es que la búsqueda en los libros de códigos puede simplificarse y los requisitos de almacenamiento para los libros de códigos pueden reducirse, ya que se puede utilizar la naturaleza estructurada de los VQ algorítmicos de celosía. Otros ejemplos de celosías son D8, RE8. En algunos modos de funcionamiento de EVS, se emplea la cuantificación codificada en Trellis, TCQ, para la cuantificación de LSF. La TCQ es también una VQ algorítmica estructurada.

Existe interés en conseguir una técnica eficaz de compresión que requiera una baja complejidad computacional en el codificador.

Sumario

Un objeto de las realizaciones en el presente documento es proporcionar una compresión eficiente que requiera una baja complejidad computacional en el codificador.

De acuerdo con la invención, se proporcionan un método como se establece en la reivindicación 1, un codificador como se establece en la reivindicación 19 y un programa informático como se establece en la reivindicación 21. Las realizaciones preferidas se establecen en las reivindicaciones dependientes.

Otros objetivos, características y ventajas de las realizaciones adjuntas serán evidentes a partir de la siguiente descripción detallada, de las realizaciones dependientes adjuntas y de los dibujos.

En general, todos los términos usados en las realizaciones enumeradas deben interpretarse de acuerdo con su significado ordinario en el campo técnico, a menos que se defina explícitamente de otra manera en el presente documento. Todas las referencias a "un/una/el/la elemento, aparato, componente, medio, módulo, paso, etc." deben interpretarse abiertamente como una referencia a al menos una instancia del elemento, aparato, componente, medio, módulo, paso, etc., a menos que se indique explícitamente lo contrario. Los pasos de cualquier método divulgado en el presente documento no tienen que realizarse en el orden exacto divulgado, a menos que se indique explícitamente.

Breve descripción de los dibujos

El concepto inventivo se describe ahora, a modo de ejemplo, con referencia a los dibujos adjuntos.

La figura 1 muestra una red de comunicaciones que comprende una unidad de transmisión y una unidad de recepción.

La figura 2 muestra una red de comunicaciones inalámbricas ejemplar en la que se pueden implantar las realizaciones del presente documento.

La figura 3 muestra una red de comunicación ejemplar que comprende unos dispositivos primero y segundo de comunicación habilitados por radio de corto alcance.

La figura 4 ilustra un ejemplo de acciones que puede realizar un codificador.

La figura 5 ilustra un ejemplo de acciones que puede realizar un decodificador.

La figura 6 ilustra un ejemplo de un codificador, con un bucle genérico de minimización de MSE.

La figura 7 ilustra un ejemplo de decodificador.

La figura 8 es una ilustración de diagrama de flujo de una realización de ejemplo de un flujo de búsqueda de forma de la etapa 2.

La figura 9 muestra resultados de ejemplo en términos de distorsión espectral para la cuantificación de 38 bitios de los coeficientes de representación de envolvente.

La figura 10 muestra

ejemplo de una señal en el dominio tiempo.

La figura 11 muestra

ejemplo de una señal de dominio MDCT de la señal de tiempo de la figura 10. La figura 12 muestra las energías de banda logarítmica de la señal del dominio MDCT de la figura 11.

La figura 13 muestra los coeficientes de representación de envolvente de las energías de banda logarítmica de la figura 12.

La figura 14 ilustra un ejemplo de un codificador con búsqueda de ganancia y forma en un dominio transformado. La figura 15 ilustra un ejemplo de decodificador.

La figura 16 muestra

diagrama de bloques que ilustra una realización de ejemplo de un codificador. La figura 17 muestra

diagrama de bloques que ilustra otra realización de ejemplo de un codificador. La figura 18 muestra un diagrama de bloques que ilustra un ejemplo de un decodificador.

La figura 19 muestra un diagrama de bloques que ilustra otro ejemplo de un decodificador.

Descripción detallada

El concepto inventivo se describirá ahora con más detalle a continuación con referencia a los dibujos que se acompañan, en los que se muestran determinadas realizaciones del concepto inventivo. Sin embargo, este concepto inventivo puede realizarse de muchas formas diferentes y no debe interpretarse como limitado a las realizaciones expuestas en el presente documento; más bien, estas realizaciones se proporcionan a modo de ejemplo, de modo que esta divulgación sea exhaustiva y completa, y transmita completamente el alcance del concepto inventivo, según se define en las reivindicaciones, al experto en la técnica. Los números similares se refieren a elementos similares en toda la descripción. Las figuras son esquemáticas y simplificadas para mayor claridad, y muestran simplemente detalles para la comprensión de las realizaciones presentadas en el presente documento, mientras que otros detalles se han omitido.

La figura 1 muestra una red de comunicación 100 que comprende una unidad 10 de transmisión y una unidad 20 de recepción. La unidad 10 de transmisión está conectada operativamente a la unidad 20 de recepción mediante un canal 30 de comunicación. El canal 30 de comunicación puede ser una conexión directa o un conexión indirecta mediante uno o más enrutadores o conmutadores. El canal 30 de comunicación puede ser a través de una conexión por cable, por ejemplo, mediante uno o más cables ópticos o cables metálicos, o mediante una conexión inalámbrica, por ejemplo, una conexión inalámbrica directa o una conexión mediante una red inalámbrica que comprende más de un enlace. La unidad 10 de transmisión comprende un codificador 1600. La unidad 20 de recepción comprende un decodificador 1800.

La figura 2 representa una red 100 de comunicaciones inalámbricas ejemplar en la que se pueden implantar las realizaciones del presente documento. La red 100 de comunicaciones inalámbricas puede ser una red de comunicaciones inalámbricas tal como de LTE (evolución a largo plazo), LTE-avanzada, próxima evolución, WCDMA (acces múltiple por división de código de banda ancha), GSM/EDGE (sistema global para comunicaciones móviles/velocidades de datos mejoradas para evolución de GSM), UMTS (sistema de telecomunicaciones móviles universal) o WiFi (fidelidad inalámbrica), o cualquier otra red o sistema celular similar.

La red 100 de comunicaciones inalámbricas comprende un nodo 110 de red. El nodo 110 de red da servicio al menos a una célula 112. El nodo 110 de red puede ser una estación base, una estación base de radio, un nodo B, un eNodoB, un NodoB doméstico, un eNodoB doméstico o cualquier otra unidad de red capaz de comunicarse con un dispositivo inalámbrico dentro de la célula 112 servida por el nodo de red, dependiendo, por ejemplo, de la tecnología y la terminología de acceso radioeléctrico utilizadas. El nodo de red también puede ser un controlador de estación base, un controlador de red, un nodo de retransmisión, un repetidor, un punto de acceso, un punto de acceso de radio, una unidad de radio remota, RRU, o un cabezal de radio remoto, RRH.

En la figura 2, un dispositivo inalámbrico 121 está ubicado dentro de la primera célula 112. El dispositivo 121 está configurado para comunicarse dentro de la red 100 de comunicaciones inalámbricas mediante el nodo 110 de red a través de un enlace de radio, también llamado canal de comunicaciones inalámbricas, cuando está presente. en la célula 112 servida por el nodo 110 de red. El dispositivo 121 inalámbrico puede ser, por ejemplo, cualquier tipo de dispositivo inalámbrico, como un teléfono móvil, un teléfono celular, asistentes digitales personales, PDA, un teléfono inteligente, una tableta, un sensor equipado con capacidades de comunicación inalámbrica, un equipo montado en ordenador portátil, LME, por ejemplo, USB, un equipo empotrado en ordenador portátil, LEE, un dispositivo de comunicación tipo máquina, MTC, un dispositivo de máquina a máquina, M2M, un teléfono inalámbrico, por ejemplo, un teléfono de DECT (telecomunicaciones inalámbricas mejoradas digitales), o un equipo en las instalaciones del cliente, CPE, etc. En las realizaciones de este documento, el codificador 1600 mencionado puede estar situado en el nodo 110 de red, y el decodificador 1800 mencionado puede estar situado en el dispositivo 121 inalámbrico, o el codificador 1600 puede estar situado en el dispositivo inalámbrico 121 y el decodificador 1800 puede estar situado en el nodo 110 de red.

Las realizaciones descritas en el presente documento también se pueden implantar en una red de comunicación inalámbrica de radio de corto alcance, tal como una red basada en Bluetooth. En una red de comunicación inalámbrica por radio de corto alcance, la comunicación puede realizarse entre diferentes dispositivos de comunicación habilitados para comunicación por radio de corto alcance, que pueden tener una relación tal como la relación entre un punto de acceso/una estación base y un dispositivo inalámbrico. Sin embargo, los dispositivos de comunicación habilitados para radio de corto alcance también pueden ser dos dispositivos inalámbricos que se comunican directamente entre sí, dejando obsoleta la descripción de la red celular de la figura 2. La figura 3 muestra una red de comunicación ejemplar 100 que comprende unos dispositivos primero y segundo 131, 132 de comunicación habilitados por radio de corto alcance que se comunican directamente entre sí a través de un canal de comunicación por radio de corto alcance. En las realizaciones descritas en el presente documento, el codificador 1600 mencionado puede estar situado en el primer dispositivo 131 de comunicación habilitado por radio de corto alcance y el decodificador 1800 mencionado puede estar situado en el segundo dispositivo 132 de comunicación habilitado por radio de corto alcance, o viceversa. Naturalmente, ambos dispositivos de comunicación comprenden un codificador y un decodificador para permitir la comunicación bidireccional.

Alternativamente, la red de comunicaciones puede ser una red de comunicaciones por cable.

Como parte del desarrollo de las realizaciones descritas en el presente documento, primero se identificará y discutirá el problema.

Cuando se transmiten coeficientes de representación de envolvente desde una unidad de transmisión que comprende un codificador a una unidad de recepción que comprende un decodificador, existe el interés de conseguir una mejor técnica de compresión, requiriéndose un ancho de banda bajo para transmitir la señal y una baja complejidad computacional en el codificador y el decodificador. .

De acuerdo con una realización, tal problema puede resolverse mediante un método realizado por un codificador de un sistema de comunicación para manejar coeficientes de representación de envolvente de entrada como se presentó anteriormente.

La figura 4 es un ejemplo ilustrado de acciones u operaciones que pueden ser tomadas o realizadas por un codificador, o por una unidad de transmisión que comprende el codificador. En la divulgación, el "codificador" puede corresponder a "una unidad de transmisión que comprende un codificador". El método del ejemplo mostrado en la figura 4 puede comprender una o más de las siguientes acciones:

Acción 202. Cuantificar los coeficientes de representación de envolvente de entrada utilizando un primer número de bitios.

Acción 204. Determinar los coeficientes residuales de representación de envolvente como primeros coeficientes de representación de envolvente comprimidos restados de los coeficientes de representación de envolvente de entrada. Acción 206. Transformar los coeficientes residuales de representación de envolvente en un dominio deformado como para obtener coeficientes residuales de representación de envolvente transformados.

Acción 208. Aplicar al menos un esquema de entre una pluralidad de esquemas de codificación de ganancia y forma en los coeficientes residuales de representación de envolvente transformados con el fin de conseguir coeficientes residuales de representación de envolvente codificados de ganancia y forma, donde la pluralidad de esquemas de codificación de ganancia y forma tienen mutuamente diferentes compensaciones en una o más de las resoluciones de ganancia y de forma para uno o más de los coeficientes residuales de representación de envolvente transformados.

Acción 210. Transmitir, a través de un canal de comunicación a un decodificador, una representación de los primeros coeficientes de representación de envolvente comprimidos, de los coeficientes residuales de representación de envolvente codificados en ganancia y forma e información sobre el al menos un esquema de codificación de ganancia y forma aplicado.

De acuerdo con una realización, tal problema puede resolverse mediante un método realizado por un decodificador de un sistema de comunicación para manejar coeficientes residuales de representación de envolvente como se dijo anteriormente.

La figura 5 es un ejemplo ilustrado de acciones u operaciones que pueden ser tomadas o realizadas por un decodificador, o por una unidad receptora que comprenda el decodificador. En la descripción, el "decodificador" puede corresponder a "una unidad de recepción que comprende un decodificador". El método del ejemplo mostrado en la figura 5 puede comprender una o más de las siguientes acciones:

Acción 301. Recibir, a través de un canal de comunicación, desde un codificador (1600), una representación de los primeros coeficientes de representación de envolvente comprimidos, de los coeficientes residuales de representación de envolvente codificados en ganancia y forma e información sobre al menos un esquema de codificación de ganancia y forma aplicado, aplicado por el codificador.

Acción 302. Recibir, a través del canal de comunicación y desde el codificador, el primer número de bitios usados en un cuantificador del codificador.

Acción 304. Aplicar al menos un esquema de entre una pluralidad de esquemas de decodificación de ganancia y forma en los coeficientes residuales de representación de envolvente codificados en ganancia y forma recibidos de acuerdo con la información recibida en al menos un esquema de codificación de ganancia y forma aplicado, con el fin de conseguir coeficientes residuales de representación de envolvente, donde la pluralidad de esquemas de decodificación de ganancia y forma tienen compensaciones mutuamente diferentes en una o más resoluciones de las resoluciones de ganancia y de forma para uno o más de los coeficientes residuales de representación de envolvente codificados de ganancia y forma.

Acción 306. Transformar los coeficientes residuales de representación de envolvente de un dominio deformado en un dominio original de representación de envolvente como para obtener coeficientes residuales de representación de envolvente transformados.

Acción 307. Descuantificar los coeficientes de representación de envolvente utilizando un primer número de bitios correspondiente al número de bitios utilizado para cuantificar los coeficientes de representación de envolvente en un cuantificador del codificador.

Acción 308. Determinar los coeficientes de representación de envolvente como los coeficientes residuales de representación de envolvente transformados sumados con los primeros coeficientes de representación de envolvente comprimidos recibidos.

De acuerdo con algunas realizaciones, el codificador realiza las siguientes acciones:

El codificador aplica un cuantificador de primera etapa de baja velocidad de bitios a los coeficientes de media de representación de envolvente retirados, lo que da como resultado coeficientes residuales de representación de envolvente. Una velocidad de bitios más baja requiere un almacenamiento más pequeño que una velocidad de bitios más alta que la velocidad de bitios baja. Los coeficientes de media de representación de envolvente retirados son coeficientes de representación de envolvente de entrada con el valor de media retirado.

El codificador transforma los coeficientes residuales de representación de envolvente en un dominio deformado (por ejemplo, aplicando la transformada de Hadamard, la transformada DCT rotada o la transformada DCT.

El codificador aplica selectivamente al menos un esquema de entre una pluralidad de esquemas de codificación de ganancia y forma de modo subordinado de los coeficientes residuales de representación de envolvente transformados, donde los esquemas de modo subordinado tienen diferentes compensaciones en la resolución de ganancia y/o en la resolución para la forma de los coeficientes (es decir, a través de los coeficientes residuales de representación de envolvente transformados).

Los modos subordinados de ganancia y forma pueden usar una resolución diferente (en bitios/coeficiente) para diferentes subconjuntos. Ejemplos de subconjuntos {A/B}: {par último}/{impar-último} coeficientes de Hadamard, DCT {0-9} y DCT {10-15}. Un modo de valores atípicos puede tener un solo conjunto completo de todos los coeficientes en el residual, mientras que el modo regular puede tener varios subconjuntos, o restringidos, que cubran diferentes dimensiones con diferentes resoluciones (bitios/coeficiente).

En algunos ejemplos, la selección del esquema de modo subordinado se hace mediante una combinación de cuantificador de vector de pirámide de baja complejidad, proyección de PVQ y selección de búsqueda fina de forma seguida de una optimización opcional global de error cuadrático medio, MSE. La optimización de MSE es global en el sentido de que se evalúan tanto la ganancia como la forma y todos los modos subordinados. Esto ahorra una complejidad media. La acción da como resultado un índice de modo subordinado y posiblemente una palabra de código de ganancia y palabra/s de código de forma para el modo subordinado seleccionado. La aplicación selectiva se puede realizar buscando un modo subordinado de valores atípicos inicial y, subsiguientemente, un modo no atípico.

En algunos ejemplos, la selección de modo subordinado de ganancia y forma se hace mediante una combinación de selección poco compleja de búsqueda fina de forma de VQ de pirámide (PVQ) y, luego, de optimización de MSE (error cuadrático medio) global opcional (global en el sentido de que se evalúan tanto la ganancia como la forma y todos los modos subordinados). Esto ahorra una complejidad media y da como resultado un índice j de modo subordinado de ganancia y forma y, posiblemente, una palabra i de código de ganancia, y palabra/s de código de forma para el modo subordinado j de ganancia y forma seleccionado.

En algunos ejemplos, el codificador busca un modo subordinado de valor atípico inicial y, finalmente, un modo no atípico.

En algunos ejemplos, el codificador envía palabras de código de VQ de primera etapa a través del canal al decodificador.

En algunos ejemplos, el codificador envía información de modo subordinado de alto nivel a través del canal al decodificador.

En algunos ejemplos, el codificador combina la/s palabra/s de código de ganancia con el índice de forma y las envía a través del canal al decodificador, si lo requiere el modo subordinado j de ganancia y forma seleccionado.

En algunos ejemplos, la/s palabra/s de código de PVQ de forma está/n indexada/s, opcionalmente combinada/s con una parte de la palabra de código de ganancia y/o con una parte del índice de modo subordinado por el codificador, y son enviadas por el codificador a través del canal al decodificador.

Mediante una o más de las realizaciones de la invención se pueden conseguir una o más de las siguientes ventajas: Se puede conseguir una complejidad muy baja.

La aplicación de una transformada estructurada (compactación de energía) permite un VQ de primera etapa fuertemente reducido. Por ejemplo, el VQ de la primera etapa puede reducirse al 25% de su tamaño de libro de códigos original disminuyendo tanto la ROM de tabla (memoria de solo lectura) como la complejidad de búsqueda de la primera etapa. Por ejemplo, de R=0,875 bitios/coeficiente a R=0,625 bitios por coeficiente. Por ejemplo, con las dimensiones 8, la velocidad de bitios se puede reducir de 8*0,875 = 7 bitios a 8*0,625 = 5 bitios, lo que corresponde a una caída de 128 vectores a 32 vectores de dimensión 8.

Los modos subordinados basados en PVQ estructurado se pueden buscar con una búsqueda lineal extendida (baja complejidad), incluso aunque haya varios modos subordinados de combinación de ganancia y forma para los coeficientes de representación de envolvente disponibles.

Los modos subordinados basados en PVQ estructurado se pueden optimizar para manejar ambos valores atípicos, donde los valores atípicos son los coeficientes residuales de representación de envolvente con una energía alta y baja atípica, y también manejar vectores de destino no atípicos con suficiente resolución.

A continuación, se presenta una realización. El método propuesto requiere como entrada un vector de coeficientes de representación de envolvente.

Determinación de la envolvente lateral del codificador de los factores de escala de destino

La figura 10 representa un ejemplo de una señal s(t) en el dominio tiempo. El ejemplo que se muestra son 20 ms de una señal muestreada de 16 kHz. En términos generales, la señal de tiempo s(t) se transforma en una señal de dominio frecuencia utilizando la transformada MDCT conocida, donde el componente n de la señal de dominio frecuencia se denomina c(n) y se determina de acuerdo con: c(n)=MDCT(s(t)). La figura 11 muestra los coeficientes espectrales c(n) (también conocidos como líneas espectrales) obtenidos para la señal de tiempo de la figura 10. En algunos aspectos, la señal de tiempo es una señal de audio, como una señal de voz. Se puede aplicar una ventana de análisis antes de la MDCT, véase, por ejemplo, la aplicación y la definición de MDCT en el codificador de ITU-T G.719. Los coeficientes espectrales c(n) para n=0...(Ncoded -1), donde Ncoded pueden ser, por ejemplo, 400 coeficientes de la MDCT del lado del codificador, están agrupados en esta realización en bandas uniformes Nbands=16 de longitud Lbands = Ncoded//16. Los tamaños de banda podrían ser alternativamente tamaños de banda logarítmicos o semilogarítmicos (como en el documento UIT-T G.719 mencionado anteriormente)). Las energías de banda espectral logarítmica obtenidas enLog(band) se normalizan en un vector de factores de escala de destino scf(band) al retirar la media de todos los valores de enLog(band):

/■^start+Lband-l,^ ~\2\

enLog{band) = log2 í n=start--------- —— ], , .

\ Lband ) l-U

fo r start — {0,1 ■ Lband, 2 ■ Lband, ... , (J^bands ~ 1) ' Lbcmd}

Estos factores de escala de destino scf(band) para band=0...15 representan ahora una aproximación de la forma cuadrática media (RMS) normalizada de nivel medio para la envolvente espectral de la señal s(t) de entrada en el dominio tiempo original. La figura 12 muestra las energías espectrales logarítmicas de banda enLog(band) obtenidas a partir de los coeficientes espectrales c(n) de acuerdo con la ecuación(1). La figura 13 muestra los factores scf(n) de escala obtenidos de las energías espectrales logarítmicas de banda enLog(band) de acuerdo con la ecuación (2).

Cuantificación del factor de escala lateral del codificador

General

Los factores de escala de destino scf(n) obtenidos de acuerdo con lo anterior se cuantifican usando un cuantificador vectorial de dos etapas que emplea un total de 38 bitios (R=2,375 bitios/coeficiente). La primera etapa es un VQ dividido de 10 bitios y la segunda etapa es un VQ de pirámide algorítmico de baja complejidad (PVQ). Para mantener una baja complejidad de VQ general, el VQ de pirámide se analiza de una manera de ganancia/de forma en un dominio transformado, lo que permite una búsqueda eficiente de solo forma, seguida de una evaluación de MSE total de baja complejidad en un paso combinado de determinación de forma y ganancia. El esquema de VQ presentado se puede normalmente realizar en el intervalo de 20 a 60 bitios sin ningún aumento drástico de complejidad con un aumento de velocidad de bitios.

La figura 14 ilustra esquemáticamente módulos funcionales de un codificador que emplea el VQ de las etapas 1 y 2 descrito anteriormente. En la figura 6 se muestra una representación complementaria de este codificador.

Etapa 1

La primera etapa es un VQ dividido que emplea dos libros de códigos estocásticos entrenados fuera de línea LFCB y HFCB. Cada fila del libro de códigos tiene una dimensión de 8, y el número de columnas del libro de códigos está limitado a 32, lo que requiere 5 bitios para cada división para la transmisión. Las distorsiones de MSE para los dos libros de códigos se definen como sigue:

Se encuentra el mejor índice para la división de baja frecuencia (módulo 601; búsqueda de complejidad corta/baja de SCF de VQ-etapa 1) de acuerdo con:

ind LF = argmin

_{" í=[ 0 ....31]}

Se encuentra el mejor índice para la división de alta frecuencia (módulo 601; búsqueda de complejidad corta/baja de SCF de VQ-etapa 1) de acuerdo con:

ind_HF - argmin dMSEJiF;

_{¿= [0 ....31]} (⁶)

El vector de la primera etapa se compone de:

stl(n) = LFCBindLF(n),fom = [0... 7], (7)

stl(n + 8) = HFCBind_HF(n),forn = [0... 7], (8)

La señal residual de la primera etapa se calcula (módulo 602) como:

rl(n) = scf(n ) — stl(ri), fo r n = [0... 15], (9)

Etapa 2 Descripción general del VQ de ganancia y forma

Se hace referencia a la figura 8 que ilustra una realización de ejemplo de un flujo de búsqueda de forma de la etapa 2 con las acciones 801-810:

801: Disponer las dimensiones r1 en secciones de búsqueda lineal en ri/near (opcional)

802: Proyectar el objetivo a la pirámide subrdinada en o debajo de Kouti (por ejemplo, Kouti (por ejemplo Kouti = K para la forma j=2 o j=3)

803: Objetivo de búsqueda fina para Kouti

804a: Retirar cualquier pulso en el vector youti que pertenezca a las dimensiones del conjunto B

804b: Guardar el vector de resultado intermedio youti.A (y volver a calcular los valores de correlación y energía relacionados)

805: Normalizar el vector entero atípico youti al vector de energía unitaria Xq,outi

806: En base al resultado de la forma youti,A para las dimensiones del conjunto A. Dimensiones de búsqueda fina del conjunto A en el objetivo de Ki-Kouti,A para Ki

807: Guardar el vector yi de resultado intermedio (y sus valores de correlación y energía relacionados)

808: En base a yi, dimensiones de búsqueda fina del conjunto B en el objetivo para Kb

809: Guardar vector yo resultante

810: Normalizar el vector yi a Xq,i y normalizar el vector yo a Xq,o.

Los módulos correspondientes en la figura 6 son el módulo 611 (dirección general), el módulo 612 (formas atípicas), el módulo 613 (formas regulares), donde el módulo 611 implanta las acciones 801 a 810 y el módulo 612 implanta las acciones 803 y 805, (sin embargo, la acción 803 se ejecuta primero con j=3 y luego con j=2, y luego se ejecuta la acción 805 de normalización para cada j) ya que el módulo 612 da como resultado dos vectores atípicos).

En un nivel alto, el error cuadrático medio general que es minimizado (616) por la segunda etapa es:

donde Ggainind,shapeind es un valor escalar, D es una matriz de rotación de 16 por 16 y Xq,shaPe es un vector normalizado de energía unitario de longitud 16. Los índices shapeind, gainind, unitShapeldxs dan como resultado un total de 228 combinaciones posibles de ganancia y forma, el objetivo de la búsqueda de la segunda etapa es encontrar el conjunto de índices que dé como resultado un valor mínimo de distorsión de dMSE. En la figura 6, este análisis y esta minimización general de MSE de ganancia y forma se implanta mediante el módulo selector 614 de forma normalizada, el módulo 615 de ajuste de aplicación de ganancia, el módulo 618 de resta y el módulo 616 de minimización de MSE. El módulo 616 de minimización de MSE como se muestra en la figura 6 puede también incluir variantes de las formas y, (una unidad xj de energía normalizada, sería xq,shape,). Este bucle de minimización de error general indicado en la figura 6 y por la ecuación 10 indica que el error de m Se se evalúa en el dominio factor de escala original, sin embargo, dado que las transformaciones de análisis y de síntesis implantadas tienen una precisión numérica suficientemente alta, la optimización de MSE de ganancia y forma puede preferiblemente en el dominio factor de escala transformado (véase la ecuación 11, figura 14) ahorrar complejidad de procesamiento del lado del codificador.

Etapa 2 Transformada

La segunda etapa emplea una rotación de DCT de 16 dimensiones usando una matriz D de 16 por 16. La matriz D ha sido determinada fuera de línea para una cuantificación eficiente del factor de escala, tiene la propiedad de que DTD = I, donde I es la matriz de identidad. Para reducir la complejidad de búsqueda del lado del codificador, la D transformada (es decir, la DCT) inversa (es decir, el análisis) se puede usar antes de la determinación de la forma y la ganancia, mientras que en el lado del decodificador sólo se requiere la DT transformada (es decir, la IDCT) directa (síntesis). Los coeficientes de la matriz de rotación de D completa se enumeran más adelante. Cabe señalar que las funciones convencionales DCT() e IDCT() podrían usarse para realizar estas transformaciones. Las posibles alternativas que también son capaces de manejar un componente de valor de media en la señal residual son, por ejemplo, utilizar la transformada de Hadamard con requisitos de procesamiento y almacenamiento muy bajos o incluso una matriz de rotación entrenada. En la figura 6, el movimiento de una señal candidata desde el dominio factor de escala transformado al dominio factor de escala original es implantado por el módulo 617 de transformada de síntesis. La figura 14 muestra cómo la búsqueda de forma y ganancia de MSE se mueve preferiblemente al dominio transformado por la transformada de análisis en el módulo 1402, esto también se muestra explícitamente en la ecuación 11.

Etapa 2 Candidatos de forma

Hay cuatro candidatos de forma normalizados de energía unitaria de 16 dimensiones diferentes evaluados, donde la normalización siempre se realiza sobre 16 coeficientes. Las configuraciones de pulso para dos conjuntos (indicados A y B) de factores de escala para cada índice (j) de forma candidato se dan en la tabla 1.

Tabla 1: Configuraciones de pulso de candidatos de forma de segunda etapa de factores de escala de VQ

La configuración de pulsos de índice de forma j=0 es una configuración de forma híbrida de PVQ, con Ka=10 sobre Na=10 factores de escala y Ka=1 sobre los Nb=6 factores de escala restantes. Para el índice de forma 0, los dos conjuntos de pulsos unitarios son energía unitaria normalizada sobre la dimensión objetivo completa N=Na+ Nb =16, incluso aunque el pulso entero de PVQ y la enumeración de signos se realicen por separado para cada conjunto de factores de escala.

Etapa 2 Preparación del objetivo

La preparación del objetivo de búsqueda de forma consiste en una rotación de análisis de matriz dimensional 16x16 (una DCT implantada usando la matriz D) de la siguiente manera:

t2rot(n ) - r l ( n ) ■ D(n,m), where n - [0 ... 15 ] ,m = [0 ...15] (11)

Etapa 2 Búsqueda de forma

La meta de un procedimiento de búsqueda de forma de PVQ(N, K) genérico es encontrar el mejor vector normalizado xq(n). En notación vectorial, xq(n) se define como:

X ( 12)

don q d = e y = Yn.k pertenece a PVQ(N, K) y es un punto de determinación en la superficie de una hiperpirámide N-dimensional, la norma L1 de yN.K es K. En otras palabras, yN.K es el vector de código de forma entero seleccionado de tamaño N de acuerdo con:

Es decir, que Xq es el vector entero normalizado de energía unitaria y, un punto determinista en la hiperesfera de energía unitaria. El mejor vector y entero es el que minimiza el error de forma cuadrática media entre el vector objetivo de la segunda etapa t2rot(n) = x(n) y el vector de salida cuantificado normalizado Xq. La búsqueda de forma se consigue minimizando lo siguiente distorsión:

d _uPVQ-shape - - x _A Tx _A ~ (14)

_{J f y}

De manera equivalente, elevando al cuadrado el numerador y el denominador, maximizando el cociente QPVQ-shape:

CxTy ) 2 (icorrxy)2

Qpvq- shape (15)

yTy energyy ’

donde corrxy es la correlación entre el vector x y el vector y . En la búsqueda de la forma óptima y(n) del vector PVQ con la norma K de L1, se pueden realizar actualizaciones iterativas de las variables de QPVQ.-shape. para cada candidato de posición de pulso unitario nc, en todo el "cuadrante" positivo en el espacio N-dimensional de acuerdo con:

corrxy(k,nc) = corrxy(k - 1) 1 ■ \x(nc)\ (16)

energyy{k,nc) = energyy{k - 1) 2 ■ l 2 ■ y{k - 1 ,n c) l 2, (17)

donde corrxy(k-1) significa la correlación conseguida hasta ahora al colocar los pulsos anteriores unitarios k-1, y energyy(k-1) significa la energía acumulada conseguida hasta el momento al colocar los pulsos anteriores unitarios k-1, e y(k-1, nc) significa la amplitud de y en la posición nc de la ubicación anterior de un total de k-1 pulsos unitarios:

La mejor posición nbest para el pulso unitario k, se actualiza iterativamente aumentando nc de 0 a N-1:

Para evitar operaciones de división (que podrían ser especialmente importantes en la aritmética de punto fijo), la decisión de actualización de maximización de QpvQ-shape se puede realizar utilizando una multiplicación cruzada de un numerador de correlación de mejor cuadrado guardado bestCorrSq hasta ahora, y el denominador de energía mejor guardado bestEn hasta ahora:

La maximización iterativa de la forma QpvQ-shape(k, nc) puede comenzar desde un número cero de pulsos unitarios colocados inicialmente (ystart(n) = 0, para n=0...15) o, alternativamente, desde un número previo de colocación de pulsos unitarios basado en una proyección hasta un punto de valor entero por debajo de la superficie de la pirámide K , con un impulso inferior garantizado de pulsos unitarios en la norma K de L1 de destino. Tal proyección puede hacerse de la siguiente manera:

_{5W t(«) = ||t2ror(>!)l' projfac\,for 0... 15}(²²)

También podría usarse una proyección a K (en la superficie de las pirámides de PVQ(N,K)). Los problemas de precisión numérica dan como resultado un punto sobre la superficie de las pirámides, se tiene que realizar una nueva proyección válida en o por debajo de la superficie, o, alternativamente, se retiran los pulsos unitarios hasta que se alcanza la superficie de la pirámide.

Para la forma ¡=0, las posiciones del conjunto B sólo contienen un único pulso unitario no apilado con una contribución fija de energía. Esto significa que la búsqueda del pulso único en el conjunto B puede simplificarse para buscar sólo el valor absoluto máximo en las seis ubicaciones del conjunto B .

Se establecen cuatro vectores yj de configuraciones de pulsos enteros con signo usando la medida de distorsión dPVQ-shape, y luego se calculan sus correspondientes vectores unitarios de forma de energía xq,¡ de acuerdo con la ecuación (12). Como cada configuración total de pulsos y¡ abarca siempre 16 coeficientes, la normalización de energía se realiza siempre sobre la dimensión 16, incluso aunque se utilicen dos conjuntos más cortos para la enumeración del vector entero yo.

Se puede conseguir una búsqueda de pulsos unitarios general eficiente (para los cuatro candidatos de forma) buscando las formas en el orden desde la forma ¡=3 a la forma ¡=0, haciendo una primera proyección a un punto en o por debajo de la pirámide K=6, y luego se puede sumar secuencialmente pulsos unitarios y guardar los resultados de formas intermedias hasta que K sea correcto para cada uno de los candidatos de forma con un número más alto de pulsos unitarios K. Obsérvese que, como las formas del conjunto regular A ¡=0, 1 abarcan diferentes regiones de factor de escala permitidas que las dos formas atípicas (¡=2, 3), la configuración de pulsos de inicio de búsqueda para las dos formas regulares se maneja retirando cualesquiera pulsos unitarios que no sean posibles de indexar en los conjuntos A de formas regulares (para ¡=0,1). Ya que la búsqueda de pulsos se realiza en la figura ortogonal totalmente positiva, se realiza el paso final de establecer los signos de las entradas distintas de cero en y¡(n) basándose en el signo correspondiente del vector objetivo x(n).

En la Tabla 2 se resume un ejemplo de un procedimiento de búsqueda correspondiente a la estrategia de búsqueda de PVQ anterior para las formas basadas en PVQ descritas.

Tabla 2: Ejemplo informativo de la estrategia de búsqueda de PVQ para las formas basadas en PVQ descritas.

Un ejemplo de vectores enteros y¡ potencialmente disponibles y de vectores normalizados de energía unitaria xq,j, después de la búsqueda de PVQ se resume en la tabla 3.

Tabla 3: Ejemplo informativo de vectores enteros y¡ potencialmente disponibles y vectores normalizados de energía unitaria xqj después de la búsqueda del PVQ.

Candidatos de ganancia de ajuste

Hay cuatro conjuntos de candidatos de ganancia de ajuste diferentes, uno de los cuales corresponde a cada candidato j de forma general. La configuración de la ganancia de ajuste para cada una de las formas se da en la tabla 4.

Tabla 4: Conjuntos de ganancia de ajuste de la segunda etapa del factor de escala de VQ que incluyen un factor común global de ganancia de 2,5

Determinación de la combinación de forma y ganancia

La mejor forma y ganancia posible se determina entre las posibles candidatas de forma y cada conjunto de ganancia correspondiente. Para minimizar la complejidad, el MSE frente al objetivo puede evaluarse en el dominio rotado, es decir, el mismo dominio en el que se realizó la búsqueda de forma en:

15

dMSE(J, i) = ^ \ t 2 rot(n) — Gi }- xqy(n))2, fo r j = 0...3, i = 0... Gmaxindj (23)

71 = 0

De un total de 18(2+4+4+8) combinaciones posibles de ganancia y forma, el shape_index(=j) y el índice de ganancia de ajuste gain_index(=i) que da como resultado el MSE mínimo se seleccionan para la enumeración y multiplexación subsiguientes:

{shapejndex - j ,gain_index - i} - argmin dMSE(j,i)

_{/ = 0 ... 3,£=0} _...Gmaxindj (24)

Enumeración de las configuraciones de pulsos de PVQ seleccionadas

La configuración o las configuraciones de pulsos de la forma seleccionada se enumeran usando un esquema eficiente que separa cada configuración de pulso PVQ(N, K) en dos palabras de código cortas; un bitio de índice de signo de dirección y una palabra de código de índice de m Pv Q entero. El espacio de bitios del índice de MPVQ es típicamente fraccional (es decir, un número total de configuraciones de pulsos sin potencia de 2). En la figura 6, la enumeración del vector entero seleccionado y¡ en el bitio de índice de signo de dirección LS_indA y el índice de MPVQ idxA (y, además, para la forma j=0, en el bitio de índice de signo de dirección LS_indB y el índice de MPVQ idxB) se implanta mediante el módulo 621de enumeración de MPVQ.

El índice de forma de entero de MPVQ de mayor tamaño (j=2, "outlier_near") encaja dentro de una palabra sin signo de 24 bitios, lo que permite implantaciones rápidas de enumeración y desenumeración de MPVQ en plataformas que soportan aritmética de enteros sin signo de 24 bitios o superior.

El esquema de enumeración usa una tabla de desviaciones de indexación A(n, k) que se puede encontrar como valores enteros sin signo en la tabla a continuación. Los valores de desviación en A (dimensión n, norma de L1 de k) se definen recursivamente como:

con condiciones iniciales A(n, k=0) = 0 for n>=0, A(n=0, k) =1 for k>0.

La enumeración real de un vector entero con signo y(=vec_in) con una norma de L1 de K(=k_val_in) sobre la dimensión N(=dim_in), en un índice de forma de MPVQ index y en un índice de signo de dirección lead_sign_ind se muestra en pseudocódigo a continuación:

Tabla 5: Enumeración de factores de escala de VQ de forma de la segunda etapa del vector entero y¡ en índices de signos de dirección e índices de forma de MPVQ para cada posible índice j de forma seleccionado.

Multiplexación de palabras de código de VQ de factor de escala

Multiplexación de la primera etapa:

Los índices de la etapa 1 se multiplexan en el siguiente orden: ind_LF (5 bitios) seguido de ind_HF (5 bitios).

Multiplexación de la segunda etapa:

Para utilizar eficientemente el espacio total de bitios disponible para el cuantificador de factor de escala (38 bitios), en combinación con los índices de MPVQ de tamaño fraccionario, son codificados conjuntamente el índice j de forma, las palabras de código de forma de la segunda etapa y, potencialmente, un LSB de la palabra de código de ganancia. El orden general de codificación de parámetros para los componentes de multiplexación de segunda etapa se muestra en la tabla 6.

Tabla 6: Orden de multiplexación y parámetros para la segunda etapa.

En la multiplexación de signos de dirección LeadSignA y/o LeadSignB, cada signo de dirección se multiplexa como 1 si el signo de dirección es negativo, y se multiplexa como 0 si el signo de dirección es positivo. La Tabla 7 muestra los valores de bitio de modo subordinado, los tamaños de los diversos índices de forma de MPVQ de segunda etapa y las secciones de separación de ganancia de ajuste para cada índice de forma (j).

Tabla 7: Valores de bitio de modo subordinado, tamaños de los diversos índices de forma de MPVQ de segunda etapa, y las secciones de separación de ganancia de ajuste para cada índice de forma (j).

Codificación de ganancia o MSB de ganancias:

Para una forma seleccionada con índice de forma j=0 y j=2, el índice de ganancia seleccionado se envía sin modificación como índice i, para el valor de ganancia G j requiriendo 1 bitio para j=0 y 2 bitios para j=2.

Para una forma seleccionada con índice de forma j=1 y j=3, y un valor de ganancia seleccionado G j con índice de ganancia i, la parte de MSB del índice de ganancia se envía primero mediante una retirada del bitio de ganancia LSB. Es decir, que . ímsbs = i>>1; LSBgain = i&0x1. La multiplexación de ímsbs requerirá 1 bitio para j=1 y 2 bitios para j=3. El bitio de LSBgain se multiplexará en el índice conjunto.

En la figura 6, la composición del índice conjunto basada en la forma j seleccionada y el índice de ganancia seleccionado i y el bitio de índice de signo de dirección enumerado LS_indA y el índice de MPVQ de idxA (y para la forma j=0, bitio de índice de signo de dirección LS_indB e índice de MPVQ idxB) es realizado por el módulo 622 de composición de índice conjunto, y además el resultado de la composición conjunta se envía al módulo 623 de codificador de multiplexor para su subsiguiente transmisión al decodificador.

Composición del índice conjunto:

La composición del índice conjunto para un índice de forma seleccionado de j=0 ('regular') se determina como:

La composición del índice conjunto para un índice de forma seleccionado de j=1 ('regularjf) se determina como: indeXjQinti— LSBgain ■ SZsdapei 41 índexsylCLpei 41 (27)

La composición del índice conjunto para un índice de forma seleccionado de j=2 ('outlier_near') se determina como: indexj 0int2 — índex^ g^^ 2$ (28)

La composición del índice conjunto para un índice de forma seleccionado de j=3 ('outlier_far')

Síntesis del vector de factor de escala cuantificado

El vector cuantificado de la primera etapa st1, el vector de forma de energía unitaria de la segunda etapa cuantificado xq,¡, y la ganancia de ajuste cuantificada G^í,¡ (con índice de ganancia i) se utilizan para establecer el vector de factor de escala cuantificado scfQ(n) como sigue :

st 2(n) = Gíj ■ [xqj(n) ■DT] for n - 0 ... 15 (30)

scfQ(ri) = stl(ri) st2(n) f o r n = 0... 15 (31)

En la ecuación (30, la multiplicación de la matriz de tiempos de vector xqj(n) ■ DT realiza la transformada de síntesis de IDCT. Aunque esta (ecuaciones 30 y 31) generación cuantificada del factor de escala cuantificada tiene lugar en el lado del codificador, los pasos correspondientes se realizan de la misma manera en el decodificador, véase la figura 7 módulos 702; contribución de SCF VQ-stage 1, 706; deformación/transformada inversa, la ganancia de ajuste en el módulo 707 y la suma en el módulo 708.

Aplicación de factor de escala y cuantificación del espectro normalizado

El vector de factor de escala cuantificado scfQ(n) se usa ahora para escalar/normalizar los coeficientes c(n) de MDCT en cnorm(n) como sigue:

71

cnorm(n) = c(n )/2sc^ ^ l°°r L^band^ fo r n — [0 — (Ncoded — 1)} (^2)

Los coeficientes normalizados cnorm(n) pueden cuantificarse usando un cuantificador de PCM logarítmico, como ITU-T G.711, donde G.711 se define para usar 8 bitios por coeficiente, en normQ(n) para n=(0..Ncoded-1). Y la ley mu de G711 puede manejar un intervalo dinámico de 14 bitios.

Los bitios del parámetro de espectro residual resultante spec(n) para n=(0 ... Ncoded-1) se reenvían en el canal de transporte, donde cada spec(n) es un índice de 8 bitios de G.711.

Cuantificación inversa del factor de escala del lado del decodificador

En algunos aspectos, el decodificador realiza los siguientes pasos. En primer lugar, se decodifica un conjunto de 16 factores de escala cuantificados como se describe para/en el codificador. Estos factores de escala cuantificados son los mismos que los factores de escala cuantificados obtenidos en el codificador. Los factores de escala cuantificados se utilizan luego para dar forma al coeficiente de espectro normalizado MDCT recibido como se describe más adelante.

La figura 15 ilustra esquemáticamente módulos funcionales de un decodificador correspondiente para el codificador que emplea el VQ de las etapas 1 y 2 divulgado anteriormente. En la figura 7 se muestra una representación complementaria de este decodificador.

Etapa 1 Decodificación de VQ del factor de escala

Los parámetros de la primera etapa se decodifican, en la figura 7 esto lo realiza el módulo demultiplexor 701; y en la figura 14 esto lo realiza el módulo demultiplexor 1501 de corriente de bitios como sigue:

ind_LF = read_indice(5); /* stagel LF 5 bits */

ind_HF = read_indice( 5 ) ; / * stagel HF 5 bits * /

Los índices de la primera etapa ind_LF e ind_HF se convierten en la señal st1(n) de acuerdo con las ecuaciones (7) y (8) anteriores, en la figura 7 esto se realiza en el módulo 702 de contribución de la etapa 1; y en la figura 14 esto lo realiza el módulo 1502 de VQ de división inverso de la etapa 1.

Etapa 2 Decodificación de VQ de factor de escala

Para utilizar eficientemente el espacio de bitios total disponible para el cuantificador de factor de escala (38 bitios), en combinación con los índices fraccionarios de MPVQ de tamaño, la selección de forma, las palabras de código de forma de la segunda etapa y el bitio menos significativo de ganancia de ajuste se codifican conjuntamente como se describe en la tabla 7. En el lado del decodificador/receptor tiene lugar el proceso inverso. El bitio del modo subordinado de la segunda etapa, el índice de ganancia inicial y el índice de signo de dirección se leen primero de la corriente de bitios decodificada de la siguiente manera:

Si subModeMSB es igual a 0, en conrrespondencia con una de las formas (j=0 or j=1), se sigue el siguiente procedimiento de demultiplexación:

Si subModeMSB es igual a 1, (modos subordinados 'outlier_near' o "outlier_far") se sigue el siguiente procedimiento de demultiplexación:

En la figura 7, el índice conjunto de 24 o 25 bitios se lee del módulo 701 de demultiplexación, donde el índice conjunto se indica tmp32 en el pseudocódigo anterior, la descomposición se realiza mediante el módulo 703 de descomposición de índice conjunto de forma, y el índice de forma decodificado resultante j y los índices de forma resultantes (idxA, LS_indB, indxB) se envían al módulo 704 de desenumeración. Cuando el bitio de índice LS_indA es un solo bitio, puede obtenerse directamente del módulo 701 de demultiplexación. Para j=1 y j=3, el módulo 703 de descomposición del índice conjunto de forma también genera el bitio de ganancia menos significativa gainLSB y lo combina en un índice de ganancia final i. Después de que el módulo 704 de desenumeración haya realizado la enumeración inversa de MPVQ, el vector y¡ es normalizado en un vector de energía unitaria xq.j por el módulo 705 de normalización de energía unitaria de PVQ. Subsiguientemente, la transformada de síntesis directa (DCT) es aplicada por el módulo 706 de deformación/transformada inversa, y el vector resultante es después escalado por ganancia Gij por el módulo 707 de ganancia de ajuste. La señal cuantificada del factor de escala se obtiene mediante el módulo sumador 708, sumando el vector escalado al módulo 702 de contribución de SCF de etapa 1 de VQ.

Desenumeración de los índices de forma

Si shape_j es 0, dos formas A(LS_indA, idxA), B(LS_indB, idxB), se desenumeran en vectores enteros con signo, de lo contrario (shape_j no es 0) sólo se desenumera una forma. La configuración de las cuatro posibles configuraciones de forma se describió en la tabla 1.

Se muestra la desenumeración real de un índice de signo de dirección LS_ind y de un índice de forma MPVQ MPVQ_ind en un vector entero con signo y (denominado vec_out) con una norma de L1 de K (denotada k_val_in) sobre la dimensión N (denotada dim_in) en pseudocódigo a continuación.

Las llamadas de desenumeración de MPVQ de acuerdo con la tabla 8 se realizan para la forma demultiplexada (j). Tabla 8: Desenumeración de la forma de segunda etapa de factor de escala de VQ en el vector entero y¡ para cada posible índice j de forma recibido.

Normalización de energía unitaria de la forma recibida

El vector entero con signo desenumerado y se normaliza a un vector xqj de energía unitaria sobre la dimensión 16 de acuerdo con la ecuación (12).

Reconstrucción de los factores de escala cuantificados

El valor Gij de ganancia de ajuste para el índice i de ganancia y el índice j de forma se determina en base a una búsqueda en la tabla (véase la tabla 4 del codificador).

Finalmente, la síntesis del vector de factor de escala cuantificado scfQ(n) se realiza de la misma forma que en el lado del codificador (véanse las ecuaciones 30 y 31).

La generación final del factor de escala cuantificado está en la figura 7 realizada por los módulos 702 (contribución de la etapa 1), 706 (transformada de síntesis directa) y 707 (aplicación de ganancia) junto con la suma de vectores en el módulo 708. La generación del factor de escala cuantificado se ilustra también en la figura 15, módulos 1502 (etapa 1 VQ inversa), 1505 (transformada de síntesis inversa), 1506 (aplicación de ganancia de ajuste) y 1507 (suma de vector).

Cuantificación inversa del lado del decodificador del espectro normalizado y aplicación de factor de escala.

Los bitios del parámetro de espectro spec(n) para n=(0..Ncoded-1), recibidos a través de un canal de comunicaciones se descuantifican usando un cuantificador pcm logarítmico inverso, como ITU-T G.711 (usando 8 bitios por coeficiente ) en cnormQ (n) para n=(0..Ncoded-1). El vector de factor de escala cuantificado scfQ(n) se utiliza ahora para escalar los coeficientes de t Cm D normalizados cuantificados cnormQ(n) en cQ(n) de la siguiente manera:

Finalmente, la MDCT inversa (véase, por ejemplo, el decodificador UIT-T G.719) se aplica al espectro cuantificado escalado de la siguiente manera:

sQ(t) = IMDCT{cQ(n)) (34)

Además, después de la IMDCT, se coloca en ventana la señal sQ(t) y se realiza la operación de suma de superposición (OLA) de MDCT requerida para obtener la señal final sintetizada en el dominio tiempo, véase, por ejemplo, el decodificador de ITU-T G.719, donde se aplica una ventana sinusoidal antes de la OLA de MDCT.

La figura 9 muestra resultados de ejemplo en términos de distorsión espectral (SD) para la cuantificación de 38 bitios de los coeficientes de representación de envolvente. En la figura, un VQ de división en múltiples etapas ('MSVQ') de 38 bitios de referencia en base a VQ tiene un rendimiento ligeramente mejor (con una mediana de SD más baja, de aproximadamente 1,2 dB) que el cuantificador de ejemplo propuesto, que tiene una mediana de SD ligeramente más alta, de aproximadamente 1,25. En estas gráficas de caja de estadísticas de SD, la mediana se da como la línea central en cada caja, y la caja completa muestra los percentiles 25 y 75, y las cruces muestran puntos atípicos. El cuantificador de 38 bitios 'PVQ-D-Q' totalmente cuantificado de ejemplo proporciona una complejidad mucho menor en términos tanto de millones de operaciones ponderadas por segundo (WMOPS) como de memoria de solo lectura (ROM) de tabla requerida. Como puede verse en la figura 9, la segunda etapa reduce la SD desde la primera etapa (3,5 dB) a aproximadamente 1,25 dB cuando se emplean tanto la primera como la segunda etapa.

A continuación se enumeran los factores de escala de la primera etapa (LFCB y HFCB), la tabla A de desviación de indexación de MPVQ y una matriz D de rotación de DCT.

- 2 . 1 85 1 - 1 . 9 7 1 5 - 1 .7 8 72 - 1 .9 16 7 - 1 . 79 4 0 - 1 . 3574 - 0 . 7 0 54 - 0 . 0 47 8 0 . 6937 0 . 955 6 0 . 5752 - 0 .1 1 4 6 - 0 . 64 6 1 - 0 . 95 24 - 1 . 0 7 41 - 0 . 7 58 1 - 1 . 2 97 5 - 0 . 7404 - 0 .3 4 54 - 0 .3 13 3 - 0 . 40 3 0 - 0 . 37 20 - 0 . 0 7 83 0 . 0970 0 .9147 1 . 7429 1 . 9091 1 . 5441 1 .0934 0 .6475 0 . 0362 - 0 .2971 - 2 . 5 14 3 - 2 . 8 9 1 8 - 2 .0 0 45 - 0 . 7 50 9 0 .4412 1 .2 019 1 . 3274 1 . 2205 - 0 . 9222 0 .6325 1 . 0874 0 .5086 0 .1312 - 0 . 29 61 - 0 . 2 0 70 0 . 1349 0 .7903 0 .6284 0 . 3931 0 .4800 0 .4478 0 .2097 0 . 0066 - 0 . 0 86 1 1 .4478 2 . 7240 2 .3108 0 .9351 - 0 . 2 747 - 0 . 9 02 1 - 0 . 9407 - 0 . 6 33 7 0 .7934 0 .0144 - 0 .5 6 78 - 0 .5 5 4 8 - 0 . 47 9 5 - 0 . 173 9 0 .0680 0 . 2951 2 .7243 2 .9595 1 . 8495 0 . 5633 0 . 1399 0 .35 96 0 .6895 0 . 6398 - 0 . 53 06 - 0 . 2 1 2 7 0 . 0058 0 .4249 0 .4731 0 . 858 9 1 .1911 0 . 9962 1 .6873 2 .4361 2 . 3302 1 . 7798 1 .4441 1 . o 2 00 1 .4720 Q .9777 - 2 . 95 18 - 1 . 5 9 3 9 - 0 . 1 0 99 0 .3886 0 .5129 0 .6281 0 . 8226 0 . 375 9 0 .101 9 0 . 5899 0 .6190 1 . 2673 2 . 4196 2 .25 17 0 .5255 - 0 . 3 9 6 6 2 . 6825 1 .3274 0 .1302 - 0 .3 3 8 5 - 0 .3 6 3 2 - 0 .1917 - 0 . 1 5 48 - 0 .2 3 42 4 .827 0 3 . 1195 1 . 3951 0 . 2503 - 0 . 39 3 6 - 0 . 64 3 5 - 0 . 6 42 6 - 0 . 7232 0 .0878 - 0 . 5 6 9 6 - 1 . 1 45 1 - 1 .6 6 9 7 - 1 . 8453 - 1 . 56 4 7 - 1 . 1 17 5 - 0 . 5 3 40 1 . 3 91 0 ' . 9 8 1 5 1 . 1127 - 0 .2 2 0 1 - 0 .7 75 0 - 0 . 59 4 1 0 .1369 0 . 3182 0 .3346 - 0 . 1 6 0 6 - 0 . 53 94 - 0 .5 2 93 0 .1904 2 . 560 6 2 .8190 0 .6567 1 .9323 3 .01 03 3 .0654 2 . 5011 1. 9309 0 .5722 - 0 . 81 17 - 1 . 1 7 64 O . l / b l - 0 . 7 5 0 5 - 1 . 03 94 - 1 .1 3 53 - 1 . 0420 - 0 . 01 5 2 2 .0705 3 . 4295 - 1 .1 8 82 0 .3668 1 . 3096 1. 683 3 1 .2510 0 .9424 0 .8263 0 .4400 2 .5332 2 .11 27 1 . 2629 0 . 7615 0 .5221 0 .1187 - 0 . 45 23 - 0 . 7 00 4 3 . 998 9 4 . C 790 2 . 8229 1 . 7261 0 .6471 - 0 . 3 31 1 - 0 . 88 40 - 1 . 1270 0 . 5079 1 .5884 1 . 7290 1 . 0069 0 .3771 0 .4764 1 .0875 1 . 0876 3 . 1686 3 . 2585 2 . 4223 1 . 7945 1 .5218 1 .1720 0 .4894 - 0 . 0 62 3 1 .8941 1 .2511 0 .5905 0 . 6084 0 .8782 1 .1191 1 .01 86 0 .6205 0 .9489 2 .132 4 2 .7235 2 . 7699 2 . 5429 2 .020 5 0 .8300 - 0 . 0 2 7 6 - 1 .8 8 0 3 - 1 . 2 6 4 3 0 .3114 1 .8367 2 .2563 2 .048 2 2 .19 53 2 .0 266 0 .2464 0 . 9556 1 .5205 1 .9755 1 .9404 2 .233 8 1 .9384 1 .2723 } ;

H F C B [ 32 ] [ 8 }

{ 0 .2320 - 1 . 0 0 3 9 - 2 . 1422 - 2 . 3 7 53 - 2 .2 3 04 - 2 .1 7 6 0 - 2 . 2 90 7 - 2 . 5 3 2 9 - 1 . 29 5 0 - 1 . 79 9 3 - 1 . 8 87 0 - 1 . 8 09 9 - 1 .7 6 3 4 - 1 . 03 4 2 - 1 . 80 4 8 - 1 . 7 36 8 0 . 1393 - 0 . 25 8 2 - 0 . 6 50 8 - 1 . 0 63 2 - 1 .6 1 9 3 - 2 . 1 8 7 6 - 2 . 63 7' 6 - 2 . 9 79 0 - 0 . 31 6 5 - 0 . 47 7 7 - ü . 5512 - 0 . 4 84 8 - 0 .2 3 8 4 - 0 . 14 3 0 0 .0683 0 .0883 0 .8795 0 .2983 - 0 . 9 15 4 - 2 . 2 06 5 - 2 . 74 1 4 - 2 . 8 6 1 4 - 2 . 8 8 8 4 - 2 . 9 5 1 8 - 0 .2 9 6 7 - 0 . 9750 - 1 . 3 5 8 5 - 0 . 98 37 - 0 .6 5 3 0 - 0 . 99 0 0 - 1 . 51 4 7 - 2 . 40 7 1 0 .3410 0 .268 9 0 .0563 0 . 0499 - 0 . 0954 - 0 . 76 0 2 - 2 .32 ' / 6 - 3 . 7 7 1 6 - 1 .4 1 2 3 - 1 . 4 8 5 2 - 1 . 1 8 6 0 - 0 . 62 50 0 . 1539 0 . 5764 0 .7951 0 .59 66 - 0 .2 2 8 8 - 0 . 33 3 7 - 0 . 8 09 3 - 1 . 635 9 - 1 . 8 8 4 9 - 1 .6 45 0 - 1 . 40 5 2 - 1 . 4 66 7 - 1 . 0 7 ' 5 - 1 . 41 7 7 - 1 . 5 4 8 9 - 1 . 45 30 - 1 . 0 3 18 - 0 .6 9 0 6 - 0 . 42 8 8 - 0 . 4 95 0 - 0 .5 9 1 0 - 0 . 0 7 12 0 .3457 0 .3005 - 1 . 1 1 87 - 2 .4 4 0 9 - 2 . 22 8 5 - 1 . 8 95 1 - 0 .8 4 84 - 0 .5 3 3 2 0 .0900 0 .8450 1 . 0657 0 .7376 0 .256 6 - 0 . 49 20 1 .140 / 0 .9640 0 .3815 - 0 . 43 28 - 1 . 81 63 - 2 .8 02 8 - 3 . 2 3 3 9 - 3 . 45 91 - 0 .3 7 63 0 .0426 0 .5165 0 .2517 - 0 .2 1 62 - 0 .5 34 1 - 0 . 6408 - 0 . 86 97 0 . 6650 1 . 0979 1 .3834 1 .3433 0 .8230 0 . 2159 - 0 . 4 04 9 - 1 . 07 03 - 0 .6 2 6 3 - C .6712 - 0 . 22 8 5 0 .5190 _ . 3 672 2 .1802 2 .536 0 2 .20 12 1 . 4101 C . 7544 - 1 . .305 5 - 1 .871 3 - 1 . 2 4 01 - 1 .2 57 1 - 2 . 03 6 7 - 2 . 89 6 9 0 . 3614 - 0 . 022 0 - 0 . 57 9 4 - 0 . 87 94 - 0 . 8 5 07 - 0 . 7 79 4 - 0 .7 3 2 2 - 0 . 88 83 0 . 4375 G . 3054 - 0 . 0074 - 0 . 4 95 6 - 0 . 8 0 67 - 1 . 2 24 3 - 1 . 7 0 1 5 - 2 . 24 4 9

- 3 .2 6640 7412190941 e - 01 , - 2.733004667504394 e - 01 , - 1.9642373959677560 - 01 , - 1.0263113188058930 - 01 ,

+ 2 .500000 üü000000 ü e - 01 , 3.1180 62532 466678 e - ü l , 1 .96423739596 / 756 e - 01 , 3 .4654 2922 99' / ' /286 e - 0 2, - 1 .352990250365493 e - 01 , - 2 .733004667504394 e - 01 , - 3 . 467599613305369 e - 01 , - 3.383295002935882 e - 01 , - 2 .5000000000000 O l e - 01 , - 1 . 0 263 _ 1318805894 e - 01 , - 6 .897484482073574 e - 02 , 2 .2429189658565 S 0 e - 01 , 3.2 66407412190941 e - 01 , 3.518 5093 43815957 e - 01 , - 2.939689006043397 e - 01 , 1 . 666639146194367 e - 01 ,

+ 2.500000000000000 e - 01 , 2 . 733 00 4667 5043 94 e - 01 , 6 . 897 48448207 35 75 e - 0 2, - 1.666639146194366 e - 01 , - 3 .2 66407412190941 e - 01 , - 3 . 3 33 2950 02935882 e - 01 , - 1 .964237395967755 e - 01 , 3 .4654 29229977288 e - 02 , 2.500000000000001 e - 01 , 3.5185093438159576 - 01 , 2 . 93 968 900604 3397 e - 01 , 1 .02 63113188 05 8330 - 01 , - 1 .3 52 990 250 365493 e - 01 , - 3 .118 0625 32 4666796 - 01 , - 3.467599613305369 e - 01 , - 2 .242918 9658 565 300 - 01 ,

+ 2.500000000000000 e - 01 , 2 .242918965 S 56591 e - 01 , - 6 . 897 48448207 35 75 e - 0 2, - 3 .1180 62 53 2466678 e - 01 , - 3 .2 66407412190941 e - 01 , - 1 . 0 26311318 C 05094 e - 01 , - 1 .964237395967755 e - 01 , 3 . 5105 0934 3815 957 e - 01 , i 2.5000000 0000 0001 e - 01 , - 3 .465429229 S 77282 e - 02 , - 2 . 93 968 900604 8397 e - 01 , - 3 . 3832950029358 S 2 e - 01 , - 1 .3 52 990 250 365493 e - 01 , 1 . 666639146194367 e - 01 , - 3 .467599613305369 e - 01 , 2 .73 30 045675 043 Q 4 e - 01 ,

+ 2.500000000000000 c - 01 , 1 . 666 63 914 61943 66 C - 01 , - 1 . 964 2373 95 9677 56 C - 01 , - 3 .5185 0934 3815956 c - 01 , - 1 .3 52 990 250 365493 e - 01 , 2 .242918965856591 e - 01 , 3 . 467599613305369 e - 01 , 1 . 02 63113188 05 894 © - 01 , - 2 .500000000000001 e - 01 , - 3 . 3 33 2950 02935882 e - 01 , - 6 .897484482073574 e - 02, 2 . 7330 04 6675 043 94 © - 01 , 3.2 66407412190941 e - 01 , 3.4654292299772 89 e - 02, - 2 .939689006043397 e - 01 , - 3 .1180 62 53 24 666770 - 01 ,

+ 2.500000000000000 e - 01 , 1 . 026311318 S 058 94 e - 01 , - 2 . 939689006043397 e - 01 , - 2 .7330 04 6675 043 930 - 01 , 1.3 52 990 2 503 65493 e - 01 , 3 . 518 50 9343 815957 e - 01 , 6 . 897484482073579 e - 02 , - 3 .1180 6253 246667 S e - 01 , - 2 .5 00000000000001 e - 01 , 1 .6 66 63 914 61943 660 - 01 , 3.4675996133053690 - 01 , 3 .4654292299772930 - 02 , - 3 .266407412190941 e - 01 , - 2 .2429 ' 8965856591 0 - 01 , - 1.9642373959677560 - 01 , 3 .3832950029358820 - 01 ,

+ 2.500000000000000 e - 01 , 3.4 o 5429229977287 e - 02 , - 3.467599613305369 e - 01 , - 1.0263113188058930 - 01 , 3.2664074121909416 - 01 , 1 . 6o6 63914 6194366 e - D l , - 2 .939689006046397 e - 01 , - 2.2429189658565910 - 01 , 2.500000000000001 e - 01 , 2 . 733 00 4667 5043 93 e - 01 , - 1.964237395967756 e - 01 , - 3.1180625324666780 - 01 , 1.3 52 990 250 365493 e - 01 , 3 .3 33 2950 02935882 e - 01 , - 6 . 897484482073578 e - 02 , - 3 .5185 0934 3815 95 60 - 01 ,

+ 2.500000000000000 e - 01 , - 3 .465429229977287 e - D 2, - 3.467599613305369 e - 01 , 1 .02 63113188 058 930 - 01 , 3.2 66407412190941 e - 01 , - 1 .6666391461943660 - 01 , - 2 .939689006043397 e - 01 , 2.242918 9658 565 910 - 01 , 2.500000000000001 e - 01 , - 2 .7330046675043930 - 01 , - 1.964237395967756 e - 01 , 3 .1180 62 53 24 666780 - 01 , 1 .352 9902 50 3654 93 e - 01 , - 3 . 3 33 2950 02 3358820 - 01 , - 6.897484482073578 e - 02 , 3.518509343815956 e - 01 ,

+ 2.500000000000000 e - 01 , - 1 . 0 26311318805094 e - 01 , - 2 .939609006048397 e - 01 , 2 .7330 046675 04393 e - 01 , i 1.352 9902 50 3654 93 e - 01 , - 3 .518 5093 43815957 e - 01 , i 6 .897484482073579 e - 02 , i 3.1180625 32 46 6678 e - 01 , - 2.500000000000001 e - 01 , - 1 . 666 63 914 61943 66 e - 01 , 3 .467599613305359 e - 01 , - 3 .4654 29229977293 e - 0 2, - 3.266407412190941 e - 01 , 2 . 242 918 965 85 65 91 e - 01 , - 1 . 964237395967 756 e - 01 , - 3 . 383295002935 S 62 e - 01 ,

+ 2.500000000000000 e - 01 , - 1 .6 66 63 914 61943 660 - 01 , - 1 .9642373959677560 - 01 , 3 . 5185 0934 3815 95 6 © - 01 , - 1.352990250365493 e - 01 , - 2 .2429189658565910 - 01 , 3.4 67 59961330 53 590 - 01 , - 1 . 02 63113188 05 894 © - 01 , - 2 .5000000000000016 - 01 , 3 .3 33 2950 02 9358820 - 01 , - 6.897484482073574 © - 02 , - 2 . 7330 04 6675 043 94 © - 01 , 3 .2664074121909416 - 01 , - 3 .465429229977289 © - 02 , - 2 . 93 968900 60 43 3970 - 01 , 3 .1180 62 53 24 666770 - 01 ,

+ 2.5000000000000006 - 01 , - 2 .2429289658565910 - 01 , - 6 . 897484482073575 e - 02 , 3 .1180 62 5324 66 67 80 - 01 , - 3 .2664074121909416 - 01 , 1.0263113188058940 - 01 , - 1.9642373959677550 - 01 , - 3.5185093438159570 - 01 , 2.5000000 00 00 00 01 6 - 01 , 3.4654292799772820 - 02 , - 2 . 93 968 900604 83 970 - 01 , 3 .3832950029358220 - 01 , - 1 .352 9902 o ü3654 936 - 01 , - 1 .6666391461943670 - 01 , - 3 . 46739961330 o 369 e - 01 , - 2 .7330 04 6675 043 940 - 01 ,

De acuerdo con lo anterior, se proporciona un método eficiente de baja complejidad para cuantificar los coeficientes de representación de envolvente.

De acuerdo con las realizaciones, la aplicación de una transformada a los coeficientes residuales de representación de envolvente permite una primera etapa de muy baja velocidad y baja complejidad en el VQ sin sacrificar el rendimiento.

De acuerdo con las realizaciones, la selección de un modo subordinado de valores atípicos en un cuantificador PVQ de múltiples modos permite un manejo eficiente de los valores atípicos del coeficiente residual de representación de envolvente. Los valores atípicos tienen ganancias/energía muy altas o muy bajas o una forma atípica.

De acuerdo con las realizaciones, la selección de un modo subordinado regular en un cuantificador PVQ de múltiples modos permite una codificación de mayor resolución de los coeficientes/formas residuales de representación de envolvente más frecuentes/típicos.

De acuerdo con las realizaciones, para permitir un esquema de búsqueda de PVQ eficiente, el modo de valores atípicos emplea un VQ no dividido, mientras que el modo subordinado normal no atípico emplea un VQ dividido, con diferentes bitios/coeficientes en cada segmento dividido. Además, los segmentos divididos pueden ser preferiblemente una muestra no lineal del vector transformado.

De acuerdo con las formas de realización, la aplicación de una búsqueda de PVQ de modo dual/ múltiple eficiente permite una búsqueda y una selección de modo subordinado muy eficaces en una estructura de ganancia y forma basada en PVQ de múltiples modos.

De acuerdo con las realizaciones, los métodos divulgados en el presente documento permiten el uso eficiente de un espacio de bitios fraccional a través del uso de una combinación conjunta de índices de forma, ganancias de LSB y LSB de indicaciones de modo subordinado.

Para realizar los métodos y acciones del presente documento, se proporcionan un codificador 1600 y un decodificador 1800. Las figuras 16-17 son diagramas de bloques que representan el codificador 1600. Las figuras 18-19 son diagramas de bloques que representan el decodificador 1800. El codificador 1600 está configurado para realizar los métodos descritos para el codificador 1600 en las realizaciones descritas en el presente documento, mientras que el decodificador 1800 está configurado para realizar los métodos descritos para el decodificador 1800 descrito en el presente documento.

Para el codificador, las realizaciones pueden implantarse a través de uno o más procesadores 1603 en el codificador representado en las figuras 16 y 17, junto con el código 1605 de programa informático para realizar las funciones y/o acciones de método de las realizaciones del presente documento. El código de programa mencionado anteriormente se puede también proporcionar como un producto de programa informático, por ejemplo en forma de un soporte de datos que lleva un código de programa informático para realizar las realizaciones en el presente documento cuando se carga en el codificador 1600. Un soporte tal puede tener la forma de un disco CD ^rO^m. Sin embargo, es factible con otros soportes de datos tal como una memoria portátil. El código de programa informático puede proporcionarse adicionalmente como código de programa puro en un servidor y descargarse al codificador 1600. El codificador 1600 puede comprender adicionalmente una unidad 1602 de comunicación para comunicación por cable o inalámbrica con por ejemplo, el decodificador 1800. La unidad de comunicación puede ser un receptor y transmisor por cable o inalámbrico o un transceptor por cable o inalámbrico. El codificador 1600 comprende adicionalmente una memoria 1604. La memoria 1604 se puede utilizar, por ejemplo, para almacenar aplicaciones o programas para realizar los métodos del presente documento y/o cualquier información utilizada por tales aplicaciones o programas. El código del programa informático puede descargarse en la memoria 1604. El codificador 1600 puede, de acuerdo con la realización de la figura 17, comprender un módulo 1702 de determinación para determinar los coeficientes residuales de representación de envolvente como primeros coeficientes de representación de envolvente comprimidos restados de los coeficientes de representación de envolvente de entrada, un módulo 1704 de transformada para los coeficientes residuales de representación de envolvente en un dominio deformado como para obtener coeficientes residuales de representación de envolvente transformados, un módulo 1706 de aplicación para aplicar al menos un esquema de entre una pluralidad de esquemas de codificación de ganancia y forma en los coeficientes residuales de representación de envolvente transformados con el fin de conseguir coeficientes residuales de representación de envolvente codificados de ganancia y forma, donde la pluralidad de esquemas de codificación de ganancia y forma tiene compensaciones mutuamente diferentes en resolución de ganancia y/o en resolución de forma para uno o más de los coeficientes residuales de representación de envolvente transformados, y un módulo 1708 de emisión para transmitir, a través de un canal de comunicación a un decodificador, una representación de los primeros coeficientes de representación de envolvente comprimidos, los coeficientes residuales de representación de envolvente codificados de ganancia y forma, e información en el al menos un esquema aplicado de codificación de ganancia y forma. El codificador 1600 puede comprender adicionalmente, de manera opcional, un módulo 1710 de cuantificación para cuantificar los coeficientes de representación de envolvente de entrada utilizando un primer número de bitios.

Para el decodificador 1800, los ejemplos útiles para comprender la invención en el presente documento pueden implantarse a través de uno o más procesadores 1803 en el decodificador 1800 representado en la figura 18 y la figura 19, junto con el código de programa informático 1805 para realizar las funciones y/o las acciones de método de las realizaciones del presente documento. El código de programa mencionado anteriormente también puede proporcionarse como un producto de programa informático, por ejemplo, en forma de un soporte de datos que lleva un código de programa informático para realizar las realizaciones del presente documento cuando se carga en el decodificador 1800. Un soporte tal puede tener la forma de un disco CD ROM. Sin embargo, es factible con otros soportes de datos como memoria portátil. El código de programa informático puede proporcionarse adicionalmente como código de programa puro en un servidor y descargarse al decodificador 1800. El decodificador 1800 puede comprender adicionalmente una unidad 1802 de comunicación para comunicación por cable o inalámbrica con, por ejemplo, el codificador 1600. La unidad de comunicación puede ser un receptor y transmisor por cable o inalámbrico o un transceptor. El decodificador 1800 comprende adicionalmente una memoria 1804. La memoria 1804 se puede utilizar, por ejemplo, para almacenar aplicaciones o programas para realizar los métodos del presente documento y/o cualquier información utilizada por tales aplicaciones o programas. El código del programa informático puede descargarse en la memoria 1804.

El decodificador 1800 puede, de acuerdo con la figura 19, comprender un módulo 1902 de recepción para recibir, a través de un canal de comunicación desde un codificador 1600, una representación de los primeros coeficientes comprimidos de representación de envolvente, coeficientes residuales de representación de envolvente codificados en ganancia y forma e información en al menos un esquema aplicado de codificación de ganancia y forma, aplicado por el codificador, un módulo 1904 de aplicación para aplicar al menos un esquema de entre una pluralidad de esquemas de decodificación de ganancia y forma en los coeficientes residuales de representación de envolvente codificados de ganancia y forma recibidos de acuerdo con la información recibida en al menos un esquema aplicado de codificación de ganancia y forma, con el fin de conseguir coeficientes residuales de representación de envolvente, donde la pluralidad de esquemas de decodificación de ganancia y forma tienen compensaciones mutuamente diferentes en la resolución de ganancia y/ o la resolución de forma para uno o más de los coeficientes residuales de representación de envolvente codificados en forma y ganancia, un módulo transformador 1906 para transformar los coeficientes residuales de representación de envolvente desde un dominio deformado a un dominio original de representación de envolvente como para obtener coeficientes residuales de representación de envolvente transformados, y un módulo 1908 de determinación para determinar coeficientes de representación de envolvente como los coeficientes residuales de representación de envolvente transformados sumados a los primeros coeficientes comprimidos de representación de envolvente recibidos. El decodificador 1800 puede comprender adicionalmente de manera opcional un módulo 1910 de descuantificación para descuantificar los coeficientes de representación de envolvente cuantificados usando un primer número de bitios correspondiente al número de bitios usados para cuantificar los coeficientes de representación de envolvente en un cuantificador del codificador.

Como entenderá fácilmente el experto en diseño de comunicaciones, las funciones de otros circuitos se pueden implantar usando lógica digital y/o uno o más elementos de entre microcontroladores, microprocesadores u otro equipo físico informático (hardware) digital. En algunas realizaciones, varias o todas las diversas funciones pueden implantarse juntas, tal como en un solo circuito integrado específico de aplicación (ASIC), o en dos o más dispositivos separados con interfaces de hardware y/o de equipo lógico informático (software) apropiadas entre ellos. Aunque la descripción anterior contiene una pluralidad de especificidades, éstas no deben interpretarse como limitantes del alcance del concepto inventivo definido por las reivindicaciones, sino como simplemente proporcionando ilustraciones de algunas realizaciones ejemplares del concepto descrito. La referencia a un elemento en singular no pretende significar "uno y sólo uno", a menos que se indique explícitamente, sino "uno o más". Lo que es más, no es necesario que un aparato o método aborde todos y cada uno de los problemas que se busca resolver mediante el concepto actualmente descrito, para que quede abarcado por el presente documento. En las figuras ejemplares, una línea discontinua significa, en general, que la característica dentro de la línea discontinua es opcional.

Abreviaturas

LSF Frecuencias espectrales de línea

LSP Pares espectrales de línea

ISP Pares espectrales de inmitancia

ISF Frecuencias espectrales de inmitancia

VQ Cuantificador vectorial

MS-SVQ Cuantificador de vector dividido de múltiples etapas

PVQ VQ de pirámide

NPVQ Número de índices de PVQ

MPVQ Esquema de enumeración de PVQ modular con signo

MSE Error cuadrático medio

RMS Media cuadrática

WMSE MSE ponderado

LSB Bitio menos significativo

MSB Bitio más significativo

DCT Transformada de coseno discreta

IDCT Transformada de coseno discreta inversa

RDCT DCT girada (basada en ACF)

LOG2 Logaritmo en base 2

SD Distorsión espectral

EVS Servicio de voz perfeccionado

WB Banda ancha (típicamente una señal de audio muestreada a 16 kHz)

WMOPS Millones de operaciones ponderadas por segundo

WC-WMOPS Peor caso de WMOPS

AMR-WB Banda ancha adaptativa de múltiples velocidades

DSP Procesador de señal digital

TCQ Cuantificación codificada en Trellis

MUX MUltipleXor (unidad de multiplexación)

DEMUX DE-MUltipleXor (unidad de demultiplexación)

ARE Codificador aritmético/de intervalo

ARD Decodificador aritmético/de intervalo

El concepto inventivo se ha descrito principalmente en lo anterior con referencia a unas pocas realizaciones. Sin embargo, como apreciará fácilmente el experto en la técnica, son igualmente posibles otras realizaciones distintas de las divulgadas anteriormente dentro del alcance del concepto inventivo, tal como se define en las reivindicaciones de patente adjuntas.

Claims

REIVINDICACIONES

1. Un método realizado por un codificador (1600) de un sistema (100) de comunicación para manejar los coeficientes de representación de envolvente de entrada, comprendiendo, el método:

determinar (204) coeficientes residuales de representación de envolvente como primeros coeficientes de representación de envolvente comprimidos restados de los coeficientes de representación de envolvente de entrada; transformar (206) los coeficientes residuales de representación de envolvente en un dominio deformado como para obtener coeficientes residuales de representación de envolvente transformados;

aplicar (208) al menos un esquema de entre una pluralidad de esquemas de codificación de ganancia y forma en los coeficientes residuales de representación de envolvente transformados con el fin de conseguir coeficientes residuales de representación de envolvente codificados de ganancia y forma, donde, en la pluralidad de esquemas de codificación de ganancia y forma, los esquemas tienen compensaciones diferentes entre sí en la resolución de ganancia y/o en la resolución de forma para uno o más de los coeficientes residuales de representación de envolvente transformados; y

transmitir (210), a través de un canal de comunicación a un decodificador, una representación de los primeros coeficientes de representación de envolvente comprimidos, los coeficientes residuales de representación de envolvente codificados de ganancia y forma, e información sobre el al menos un esquema aplicado de codificación de ganancia y forma.

2. El método de acuerdo con la reivindicación 1, que comprende adicionalmente:

cuantificar (202) los coeficientes de representación de envolvente de entrada utilizando un primer número de bitios, y en el que la determinación (204) de los coeficientes residuales de representación de envolvente comprende restar los coeficientes de representación de envolvente cuantificados de los coeficientes de representación de envolvente de entrada, y los primeros coeficientes de representación de envolvente comprimidos transmitidos son los coeficientes de representación de envolvente cuantificados.

3. El método de acuerdo con cualquiera de las reivindicaciones anteriores, en el que aplicar (208) al menos un esquema de entre una pluralidad de esquemas de codificación de ganancia y forma sobre los coeficientes residuales de representación de envolvente transformados comprende aplicar selectivamente al menos un esquema de entre la pluralidad de esquemas de codificación de ganancia y forma.

4. El método de acuerdo con la reivindicación 3, en el que la selección en la aplicación selectiva (208) del al menos uno de la pluralidad de esquemas de codificación de ganancia y forma se realiza mediante una combinación de una proyección de forma de PVQ y una búsqueda fina de forma para alcanzar un primer punto de código de pirámide de PVQ sobre las dimensiones disponibles en base al coeficiente residual de representación por envolvente.

5. El método de acuerdo con la reivindicación 3, en el que la selección en la aplicación selectiva (208) del al menos un esquema de entre la pluralidad de esquemas de codificación de ganancia y forma se realiza mediante una combinación de una proyección de forma de PVQ y una búsqueda fina de forma para alcanzar un primer punto de código de pirámide de ^pV^qsobre dimensiones disponibles seguido de otra búsqueda fina de forma para alcanzar un segundo punto de código de pirámide de PVQ dentro de un conjunto restringido de dimensiones.

6. El método de acuerdo con cualquiera de las reivindicaciones anteriores, en el que al menos algunos de la pluralidad de esquemas de codificación de ganancia y forma utilizan resoluciones de bitios diferentes entre sí para diferentes subconjuntos de coeficientes residuales de representación de envolvente.

7. El método de acuerdo con cualquiera de las reivindicaciones anteriores, en el que los coeficientes de representación de envolvente de entrada son coeficientes de representación de envolvente retirados de media.

8. El método de acuerdo con cualquiera de las reivindicaciones anteriores, en el que la aplicación (208) de al menos un esquema de entre una pluralidad de esquemas de codificación de ganancia y forma sobre los coeficientes residuales de representación de envolvente transformados comprende aplicar un VQ de dos etapas.

9. El método de acuerdo con la reivindicación 8, en el que el VQ de dos etapas comprende un VQ dividido de primera etapa y un PVQ de segunda etapa.

10. El método de acuerdo con la reivindicación 9, en el que el VQ dividido emplea dos libros de códigos estocásticos entrenados fuera de línea.

11. El método de acuerdo con la reivindicación 10, en el que los dos libros de códigos estocásticos entrenados fuera de línea no son mayores que la mitad del tamaño de los libros de códigos utilizados durante el PVQ de segunda etapa.

12. El método de acuerdo con la reivindicación 9, en el que el PVQ emplea la aplicación de una matriz de rotación de DCT, la aplicación de una búsqueda de forma, la aplicación de ganancia de ajuste y de cuantificación de modo subordinado, y la aplicación de enumeración de forma.

13. El método de acuerdo con la reivindicación 12, en el que el VQ de dos etapas emplea un total de 38 bitios completos.

14. El método de acuerdo con cualquiera de las reivindicaciones anteriores, en el que un espacio de bitios enteros para multiplexación de ganancia y forma se utiliza seccionando una palabra de código de forma conjunta en varias secciones subordinadas, y donde una sección subordinada específica indica el bitio menos significativo de modo subordinado, el bitio menos significativo de ganancia, o una palabra adicional de código de forma.

15. El método de acuerdo con cualquiera de las reivindicaciones anteriores, en el que la representación se define mediante índices para libros de códigos.

16. El método de acuerdo con cualquiera de las reivindicaciones anteriores, en el que la representación se define por los primeros coeficientes de representación de envolvente comprimidos, los coeficientes residuales de representación de envolvente codificados de ganancia y forma, y la información en al menos un esquema aplicado de codificación de ganancia y forma.

17. El método de acuerdo con cualquiera de las reivindicaciones anteriores, en el que los coeficientes de representación de envolvente representan factores de escala.

18. El método de acuerdo con cualquiera de las reivindicaciones anteriores, en el que los coeficientes de representación de envolvente representan una forma de onda de audio codificada.

19. Un codificador (1600) de un sistema (100) de comunicación para manejar coeficientes de representación de envolvente de entrada, comprendiendo, el codificador, circuitería (1603) de procesamiento, estando, la circuitería de procesamiento, configurada para hacer al codificador (1600):

determinar coeficientes residuales de representación de envolvente como primeros coeficientes de representación de envolvente comprimidos restados de los coeficientes de representación de envolvente de entrada;

transformar los coeficientes residuales de representación de envolvente en un dominio deformado como para obtener coeficientes residuales de representación de envolvente transformados;

Aplicar al menos un esquema de entre una pluralidad de esquemas de codificación de ganancia y forma en los coeficientes residuales de representación de envolvente transformados con el fin de conseguir coeficientes residuales de representación de envolvente codificados de ganancia y forma, donde la pluralidad de esquemas de codificación de ganancia y forma tienen compensaciones diferentes entre sí en la resolución de ganancia y/o la resolución de forma para uno o más de los coeficientes residuales de representación de envolvente transformados; y transmitir a un decodificador, a través de un canal de comunicación, una representación de los primeros coeficientes de representación de envolvente comprimidos, los coeficientes residuales de representación de envolvente codificados en ganancia y forma, e información en el al menos un esquema aplicado de codificación de ganancia y forma.

20. El codificador (1600) de acuerdo con la reivindicación 19, estando, el codificador, configurado adicionalmente para realizar el método de acuerdo con cualquiera de las reivindicaciones 1 a 18.

21. Un programa informático (1605) para manejar coeficientes de representación de envolvente de entrada, comprendiendo, el programa informático, un código de ordenador que, cuando se ejecuta en la circuitería (1603) de procesamiento de un codificador (1600), hace al codificador (1600):

aplicar (208) al menos un esquema de entre una pluralidad de esquemas de codificación de ganancia y forma en los coeficientes residuales de representación de envolvente transformados con el fin de conseguir coeficientes residuales de representación de envolvente codificados de ganancia y forma, donde los esquemas de la pluralidad de esquemas de codificación de ganancia y forma tienen compensaciones diferentes entre sí en la resolución de ganancia y/o en la resolución de forma para uno o más de los coeficientes residuales de representación de envolvente transformados; y

transmitir (210) a un decodificador, a través de un canal de comunicación, una representación de los primeros coeficientes de representación de envolvente comprimidos, los coeficientes residuales de representación de envolvente codificados de ganancia y forma, e información en el al menos un esquema aplicado de codificación de ganancia y forma.