ES2641315T3 - Corrección de ganancia post-cuantificación en codificación de audio - Google Patents

Corrección de ganancia post-cuantificación en codificación de audio Download PDF

Info

Publication number
ES2641315T3
ES2641315T3 ES11860420.6T ES11860420T ES2641315T3 ES 2641315 T3 ES2641315 T3 ES 2641315T3 ES 11860420 T ES11860420 T ES 11860420T ES 2641315 T3 ES2641315 T3 ES 2641315T3
Authority
ES
Spain
Prior art keywords
gain
precision
correction
pulses
attenuation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES11860420.6T
Other languages
English (en)
Inventor
Erik Norvell
Volodya Grancharov
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Telefonaktiebolaget LM Ericsson AB
Original Assignee
Telefonaktiebolaget LM Ericsson AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Telefonaktiebolaget LM Ericsson AB filed Critical Telefonaktiebolaget LM Ericsson AB
Application granted granted Critical
Publication of ES2641315T3 publication Critical patent/ES2641315T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/038Vector quantisation, e.g. TwinVQ audio
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/083Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain

Abstract

Un método de ajuste de ganancia en la decodificación de audio que ha sido codificado con representaciones separadas de ganancia y forma, incluyendo dicho método los pasos de: estimar (S1) una medida (A(b)) de precisión de la representación de forma ( ) para una banda (b) de frecuencia, comprendiendo la banda (b) de frecuencia pluralidad de coeficientes, en el que la forma ha sido codificada utilizando un esquema de codificación de vector de impulso en el que los impulsos pueden ser añadidos uno encima de otro para formar impulsos de diferentes alturas, y la medida (A(b)) de precisión se basa en un número de impulsos (R(b) y una altura de un impulso máximo (pmax(b)); determinar (S2) basándose en la medida (A(b)) de precisión estimada una corrección (gc(b)) de ganancia; ajustar (S3) la representación (Ê(b)) de ganancia basándose en la corrección de ganancia determinada.

Description

5
10
15
20
25
30
35
40
45
50
55
60
65
DESCRIPCION
Correccion de ganancia post-cuantificacion en codificacion de audio Campo tecnico
La presente tecnologia se refiere a la correccion de ganancia en la codificacion de audio basandose en esquemas de cuantificacion donde la cuantificacion se divide en una representacion de ganancia y una representacion de forma, denominada codificacion de audio en forma de ganancia, y especialmente para correccion de ganancia post- cuantificacion.
Antecedentes
Se espera que los servicios de telecomunicaciones modernos manejen muchos tipos diferentes de senales de audio. Si bien el contenido de audio principal son las senales de voz, existe el deseo de manejar senales mas generales como musica y mezclas de musica y voz. Aunque la capacidad en las redes de telecomunicaciones esta aumentando continuamente, sigue siendo de gran interes limitar el ancho de banda requerido por canal de comunicacion. En las redes moviles, los anchos de banda de transmision mas pequenos para producen un consumo de energia menor tanto en el dispositivo movil como en la estacion base. Esto se traduce en ahorro de energia y de costes para el operador movil, mientras que el usuario final experimental una duracion prolongada de la bateria y un aumento del tiempo de conversacion. Ademas, con menos ancho de banda consumido por usuario, la red movil puede atender a un mayor numero de usuarios en paralelo.
Hoy en dia, la tecnologia de compresion dominante para servicios de voz moviles es CELP (prediccion lineal excitada por codigo), que logra una buena calidad de audio para la voz en anchos de banda bajos. Es ampliamente utilizado en codecs desplegados como AMR (multivelocidad adaptativa), AMR-WB (ancho de banda de velocidad adaptativa) y GSM-EFR (sistema global para comunicaciones moviles - velocidad completa mejorada). Sin embargo, para senales de audio generales, como la musica, la tecnologia CELP tiene un rendimiento bajo. Estas senales pueden a menudo ser mejor representadas mediante el uso de codificacion basada en la transformada de frecuencia, por ejemplo los codecs ITU-T G.722.1 [1] y G.719 [2]. Sin embargo, los codecs de dominio de transformada operan generalmente a una velocidad de bits mayor que los codecs de voz. Existe una brecha entre los dominios de voz y de audio general en terminos de codificacion y es deseable aumentar el rendimiento de los codecs de dominio de transformada a velocidades de bits mas bajas.
Los codecs de dominio de transformada requieren una representacion compacta de los coeficientes de transformada del dominio frecuencia. Estas representaciones a menudo se basan en la cuantificacion vectorial (VQ), donde los coeficientes se codifican en grupos. Entre los diversos metodos para la cuantificacion vectorial esta la VQ en forma de ganancia. Este enfoque aplica la normalizacion a los vectores antes de codificar los coeficientes individuales. El factor de normalizacion y los coeficientes normalizados se denominan la ganancia y la forma del vector, que puede codificarse por separado. La estructura en forma de ganancia tiene muchos beneficios. Al dividir la ganancia y la forma, el codec se puede adaptar facilmente a diferentes niveles de entrada de fuente mediante el diseno del cuantificador de ganancia. Tambien es beneficioso desde una perspectiva perceptual donde la ganancia y la forma pueden tener diferente importancia en diferentes regiones de frecuencia. Por ultimo, la division en forma de ganancia simplifica el diseno del cuantificador y lo hace menos complejo en terminos de memoria y recursos computacionales en comparacion con un cuantificador de vector sin restricciones. En la figura 1 se puede ver una descripcion funcional de un cuantificador en forma de ganancia.
Si se aplica a un espectro de dominio frecuencia, la estructura en forma de ganancia se puede utilizar para formar una envolvente espectral y una representacion de estructura fina. La secuencia de valores de ganancia forma la envolvente del espectro mientras que los vectores de forma dan el detalle espectral. Desde una perspectiva perceptual es beneficioso dividir el espectro utilizando una estructura de banda no uniforme que sigue la resolucion de frecuencia del sistema auditivo humano. Esto generalmente significa que anchos de banda estrechos se utilizan para frecuencias bajas, mientras que anchos de banda mas grandes se utilizan para altas frecuencias. La importancia perceptual de la estructura fina espectral varia con la frecuencia, pero tambien depende de las caracteristicas de la propia senal. Los codificadores de transformada emplean a menudo un modelo auditivo para determinar las partes importantes de la estructura fina y asignar los recursos disponibles a las partes mas importantes. La envolvente espectral se utiliza a menudo como entrada a este modelo auditivo. El codificador de forma cuantifica los vectores de forma utilizando los bits asignados. Vease la figura 2 para un ejemplo de un sistema de codificacion basado en la transformada con un modelo auditivo.
Dependiendo de la precision del cuantificador de forma, el valor de ganancia utilizado para reconstruir el vector puede ser mas o menos apropiado. Especialmente cuando los bits asignados son pocos, el valor de ganancia se aleja del valor optimo. Una forma de resolver esto es codificar un factor de correccion que explique el desajuste de ganancia despues de la cuantificacion de forma. Otra solucion es codificar primero la forma y luego calcular el factor de ganancia optima dada la forma cuantificada.
5
10
15
20
25
30
35
40
45
50
55
60
65
La solucion para codificar un factor de correccion de ganancia despues de la cuantificacion de forma puede consumir una velocidad de bits considerable. Si la velocidad es ya baja, esto significa que se deben tomar mas bits en otros lugares y tal vez puede reducir la velocidad de bits disponible para la estructura fina.
Para codificar la forma antes de codificar la ganancia es una solucion mejor, pero si la velocidad de bits para el cuantificador de forma se decide a partir del valor de ganancia cuantificado, entonces la ganancia y la cuantificacion de forma dependerian entre si. Una solucion iterativa podria resolver esta codependencia, pero podria resultar demasiado compleja para ejecutarse en tiempo real en un dispositivo movil.
El documento US 2011/0002266 A1 (Yang Gao) describe un post-procesamiento de dominio frecuencia basandose en enmascaramiento perceptual, donde un factor de ganancia de modificacion adaptativa se aplica a cada coeficiente de frecuencia con el fin de mejorar la calidad percibida de los coeficientes espectrales.
Sumario
Un objeto es obtener un ajuste de ganancia en la decodificacion de audio que se ha codificado con representaciones separadas de ganancia y forma.
Este objeto se consigue de acuerdo con las reivindicaciones adjuntas.
Un primer aspecto implica un metodo de ajuste de ganancia que incluye los siguientes pasos:
• Se estima una medida de precision de la representacion de la forma.
• Se determina una correccion de ganancia basandose en la medida de precision estimada.
• La representacion de ganancia se ajusta basandose en la correccion de ganancia determinada.
Un segundo aspecto implica un aparato de ajuste de ganancia que incluye:
• Un medidor de precision configurado para estimar una medida de precision de la representacion de forma y para determinar una correccion de ganancia basandose en la medida de precision estimada.
• Un ajustador de envolvente configurado para ajustar la representacion de ganancia basandose en la correccion de ganancia determinada.
Un tercer aspecto implica un decodificador que incluye un aparato de ajuste de ganancia de acuerdo con el segundo aspecto.
Un cuarto aspecto implica un nodo de red que incluye un decodificador de acuerdo con el tercer aspecto.
El esquema propuesto para la correccion de ganancia mejora la calidad percibida de un sistema de codificacion de audio en forma de ganancia. El esquema tiene una complejidad computacional baja y requiere pocos bits adicionales, si los hay.
Breve descripcion de los dibujos
La presente tecnologia, junto con otros objetivos y ventajas de la misma, puede entenderse mejor haciendo referencia a la siguiente descripcion tomada junto con los dibujos adjuntos, en los que:
la figura 1 ilustra un esquema de cuantificacion de vector en forma de ganancia de ejemplo;
la figura 2 ilustra un esquema de codificacion y decodificacion de dominio de transformada de ejemplo;
la figura 3A-C ilustra la cuantificacion del vector en forma de ganancia en un caso simplificado;
la figura 4 ilustra un decodificador de dominio de transformada de ejemplo que utiliza una medida de precision para determinar una correccion de envolvente;
la figura 5A-B ilustra un resultado de ejemplo de escalar la sintesis con factores de ganancia cuando el vector de forma es un vector de impulso escaso;
la figura 6A-B ilustra como la altura de impulso mas grande puede indicar la precision del vector de forma; la figura 7 ilustra un ejemplo de una funcion de atenuacion basada en la velocidad para la realizacion 1;
5
10
15
20
25
30
35
40
45
50
55
60
65
la figura 8 ilustra un ejemplo de una funcion de ajuste de ganancia dependiente de la altura maxima del impulso y de la velocidad para la realizacion 1;
la figura 9 ilustra otro ejemplo de una funcion de ajuste de ganancia dependiente de la altura de impulso maxima y de la velocidad para la realizacion 1;
la figura 10 ilustra una realizacion de la presente tecnologia en el contexto de un sistema codificador y decodificador de audio basado en MDCT;
la figura 11 ilustra un ejemplo de una funcion de mapeo desde la medida de estabilidad al factor de limitacion de ajuste de ganancia;
la figura 12 ilustra un ejemplo de un sistema decodificador y codificador ADPCM y con un tamano de paso adaptativo;
la figura 13 ilustra un ejemplo en el contexto de un sistema codificador y decodificador de audio basado en ADPCM de sub-banda;
la figura 14 ilustra un ejemplo de la presente tecnologia en el contexto de un sistema codificador y decodificador de audio basado en ADPCM de sub-banda;
la figura 15 ilustra un codificador de dominio de transformada de ejemplo que incluye un clasificador de senales;
la figura 16 ilustra otro decodificador de dominio de transformada de ejemplo que utiliza una medida de precision para determinar una correccion de envolvente;
la figura 17 ilustra una realizacion de un aparato de ajuste de ganancia de acuerdo con la presente tecnologia; la figura 18 ilustra una realizacion de ajuste de ganancia de acuerdo con la presente tecnologia con mas detalle; la figura 19 es un diagrama de flujo que ilustra el metodo de acuerdo con la presente tecnologia; la figura 20 es un diagrama de flujo que ilustra una realizacion del metodo de acuerdo con la presente tecnologia; y la figura 21 ilustra una realizacion de una red de acuerdo con la tecnologia actual.
Descripcion detallada
En la siguiente descripcion se utilizaran las mismas designaciones de referencia para elementos que realicen la misma funcion o una funcion similar.
Antes de describir la presente tecnologia en detalle, la codificacion en forma de ganancia se ilustrara con referencia a las figuras 1-3.
La figura 1 ilustra un esquema de cuantificacion de vector en forma de ganancia de ejemplo. La parte superior de la figura ilustra el lado del codificador. Un vector x de entrada se envia a una calculadora 10de normalizacion, que determina la norma del vector (ganancia) g, tipicamente la norma euclidiana. Esta norma exacta se cuantifica en un cuantificador 12 de norma, y la inversa 1/g de la norma cuantificada g se envia a un multiplicador 14 para escalar el vector x de entrada en una forma. La forma se cuantifica en un cuantificador 16 de forma. Las representaciones de la ganancia y la forma cuantificadas se envian a un multiplexor 18 de flujo de bits (mux). Estas representaciones se ilustran con lineas discontinuas para indicar que pueden, por ejemplo, constituir indices en tablas (libros de codigos) en lugar de los valores cuantificados reales.
La parte inferior de la figura 1 ilustra el lado del decodificador. Un demultiplexor 20 de flujo de bits (demux) recibe las representaciones de ganancia y forma. La representacion de forma se envia a un descuantificador 22 de forma, y la representacion de ganancia se envia a un descuantificador 24 de ganancia. La ganancia obtenida g se envia a un
A
multiplicador 26, donde escala la forma obtenida, lo que da el vector reconstruido x.
La figura 2 ilustra un esquema de codificacion y decodificacion de dominio de transformada de ejemplo. La parte superior de la figura ilustra el lado del codificador. Una senal de entrada es enviada a un transformador de frecuencia 30, por ejemplo basandose en la Transformada Discreta de Coseno Modificada (MDCT), para producir la transformada X de frecuencia. La transformada X de frecuencia es enviada a una calculadora 32 de envolvente, la cual determina la energia E(b) de cada banda de frecuencia b. Estas energias se cuantifican en energias E(b) en un cuantificador 34 de envolvente. Las energias cuantificadas E(b) son enviadas a un normalizador 36 de envolvente, que escala los coeficientes de la banda de frecuencias b de la transformada X con la inversa de la energia
5
10
15
20
25
30
35
40
45
50
55
60
65
cuantificada E(b) correspondiente de la envolvente. Las formas escaladas resultantes son enviadas a un cuantificador 38 de estructura fina. Las energias cuantificadas E(b) tambien son enviadas a un asignador 40 de bits, que asigna bits para la cuantificacion de estructura fina a cada banda b de frecuencia. Como se ha indicado anteriormente, la asignacion R(b) de bits puede basarse en un modelo del sistema auditivo humano. Las representaciones de las ganancias cuantificadas E(b) y las correspondientes formas cuantificadas son enviadas al multiplexor 18 de flujo de bits.
La parte inferior de la figura 2 ilustra el lado del decodificador. El demultiplexor 20 de flujo de bits recibe las representaciones de ganancia y forma. Las representaciones de ganancia son enviadas a un descuantificador 42 de envolventes. Las energias de envolvente generadas E(b) son enviadas a un asignador 44 de bits, que determina la asignacion R(b) de bits de las formas recibidas. Las representaciones de forma son enviadas a un descuantificador 46 de estructura fina, que esta controlado por la asignacion R(b) de bits. Las formas decodificadas son enviadas a un conformador 48 de envolvente, que las escala con las energias de envolvente correspondientes E(b) para formar una transformada de frecuencia reconstruida. Esta transformada es enviada a un transformador 50 de frecuencia inverso, por ejemplo basado en la Transformada de Coseno Discreta Modificada Inversa (IMDCT), que produce una senal de salida que representa audio sintetizado.
La figura 3A-C ilustra la cuantificacion de vector en forma de ganancia descrita anteriormente en un caso simplificado en el que la banda b de frecuencias esta representada por el vector bidimensional X(b) en la figura 3A. Este caso es suficientemente simple para ser ilustrado en un dibujo, pero tambien lo suficientemente general como para ilustrar el problema con la cuantificacion en forma de ganancia (en la practica, los vectores tienen tipicamente 8 o mas dimensiones). El lado derecho de la figura 3A ilustra una representacion exacta en forma de ganancia del vector X(b) con una ganancia E(b) y una forma (vector de longitud unitaria) N'(b).
Sin embargo, como se ilustra en la figura 3B, la ganancia exacta E(b) se radifica en una ganancia cuantificada E(b) en el lado del codificador. Dado que la inversa de la ganancia cuantificada E(b) se utiliza para escalar el vector X(b), el vector escalado resultante N(b) apuntara en la direccion correcta, pero no sera necesariamente de longitud unitaria. Durante la cuantificacion de forma el vector escalado N(b) se cuantifica en la forma cuantificada &(*). En este caso, la cuantificacion se basa en un esquema de codificacion de impulsos [3], que construye la forma (o direccion) a partir de una suma de impulsos enteros con signo. Los impulsos pueden anadirse uno encima del otro para cada dimension. Esto significa que las posiciones de cuantificacion de forma permitidas estan representadas por los puntos grandes en las rejillas rectangulares ilustradas en las figuras 3B-C. El resultado es que la forma
A '
cuantificada N(b) en general no coincide con la forma (direccion) de N(b) (y N’(b)).
La figura 3C ilustra que la precision de la cuantificacion de forma depende de los bits asignados R(b), o de manera equivalente el numero total de impulsos disponibles para la cuantificacion de forma. En la parte izquierda de la figura 3C la cuantificacion de forma se basa en 8 impulsos, mientras que la cuantificacion de forma en la parte derecha utiliza solo 3 impulsos (el ejemplo de la figura 3B utiliza 4 impulsos).
Por lo tanto, se apreciara que, dependiendo de la precision del cuantificador de forma, el valor de ganancia E(b) utilizado para reconstruir el vector (b) en el lado del decodificador puede ser mas o menos apropiado. De acuerdo con la presente tecnologia, una correccion de ganancia puede basarse en una medida de precision de la forma cuantificada.
La medida de precision utilizada para corregir la ganancia puede derivarse de parametros ya disponibles en el decodificador, pero tambien puede depender de parametros adicionales designados para la medida de precision. Tipicamente, los parametros incluirian el numero de bits asignados para el vector de forma y el propio vector de forma, pero tambien puede incluir el valor de ganancia asociado con el vector de forma y estadisticas pre- almacenadas sobre las senales que son tipicas para el sistema de codificacion y decodificacion. En la figura 4 se muestra un resumen de un sistema que incorpora una medida de precision y una correccion o ajuste de ganancia.
La figura 4 ilustra un ejemplo de decodificador 300 de dominio de transformada que utiliza una medida de precision para determinar una correccion de envolvente. Con el fin de evitar el desorden del dibujo, solo se ilustra el lado del decodificador. El lado del codificador puede ser implementado como en la figura 2. La nueva caracteristica es un aparato 60 de ajuste de ganancia. El aparato 60 de ajuste de ganancia incluye un medidor 62 de precision
A '
configurado para estimar una medida A(b) de precision de la representacion de forma, y para determinar una correccion gc(b) de ganancia basandose en la medida A(b) de precision estimada. Tambien incluye un ajustador 64 de envolvente configurado para ajustar la representacion E(b) de ganancia basandose en la correccion de ganancia determinada.
Como se ha indicado anteriormente, la correccion de ganancia puede, en algunas realizaciones, ser formada sin gastar bits adicionales. Esto se realiza estimando la correccion de ganancia a partir de parametros ya disponibles en el decodificador. Este proceso se puede describir como una estimacion de la precision de la forma codificada. Tipicamente, esta estimacion incluye derivar la medida A(b) de precision de las caracteristicas de cuantificacion de forma que indican la resolucion de la cuantificacion de forma.
5
10
15
20
25
30
35
40
45
50
55
Realizacion 1
En una realizacion, la presente tecnologia se utiliza en un sistema codificador/decodificador de audio. El sistema se basa en la transformada y la transformada utilizada es la Transformada Discreta de Coseno Modificada (MDCT) que utiliza ventanas sinusoidales con superposicion del 50%. Sin embargo, se entiende que cualquier transformada adecuada para la codificacion de transformada puede utilizarse junto con una segmentacion y ventana apropiadas.
Codificador de la realizacion 1
El audio de entrada se extrae en tramas utilizando 50% de superposicion y ventanas con una ventana sinusoidal simetrica. Cada trama con ventanas se transforma a continuacion en un espectro MDCT X. El espectro se divide en sub-bandas para procesamiento, donde las anchuras de la sub-banda no son uniformes. Los coeficientes espectrales de la trama m que pertenecen a la banda b se indican X(b, m) y tienen el ancho de banda BW(b). Puesto que la mayoria de los pasos del codificador y del decodificador se pueden describir dentro de una trama, omitimos el indice de trama y apenas utilizamos la notacion X(b). Los anchos de banda deberian aumentar preferentemente con frecuencia creciente para cumplir con la resolucion de frecuencia del sistema auditivo humano. El valor cuadratico medio (RMS) de cada banda se utiliza como factor de normalizacion y se denomina E(b):
m -
X(b)TX(fc)
BW[b)
(1)
donde X(b)T indica la transposicion de X(b).
El valor RMS puede ser visto como el valor de energia por coeficiente. La secuencia de factores de normalizacion E(b) para b = l, 2, ..., Nbandas forma la envolvente del espectro MDCT, donde Nbandas indica el numero de bandas. A continuacion, la secuencia se cuantifica para ser transmitida al decodificador. Para asegurar que la normalizacion puede invertirse en el decodificador, se obtiene la envolvente cuantificada E(b). En esta realizacion de ejemplo, los coeficientes de envolvente son cuantificados escalares en el dominio de registro utilizando un tamano de paso de 3 dB y los indices de cuantificador se codifican diferencialmente utilizando la codificacion de Huffman. La envolvente cuantificada se utiliza para la normalizacion de las bandas espectrales, es decir:
imagen1
Tengase en cuenta que si la envolvente no cuantificada E(b) se utiliza para la normalizacion, la forma tendria RMS = 1, es decir:
imagen2
jN'(b)TN'{b) V BW{b)
(3)
Mediante el uso de la envolvente cuantificada E(b), el vector de forma tendra un valor RMS cercano a 1. Esta caracteristica se utilizara en el decodificador para crear una aproximacion del valor de ganancia.
La union de los vectores de forma normalizados N(b) forma la estructura fina del espectro MDCT. La envolvente cuantificada se utiliza para producir una asignacion R(b) de bits para la codificacion de los vectores N(b) de forma normalizados. El algoritmo de asignacion de bits utiliza preferentemente un modelo auditivo para distribuir los bits a las partes perceptualmente mas relevantes. Puede utilizarse cualquier esquema de cuantificacion para codificar el vector de forma. Comun para todos es que pueden ser disenados bajo el supuesto de que la entrada es normalizada, lo que simplifica el diseno de cuantificador. En esta realizacion, la cuantificacion de forma se realiza utilizando un esquema de codificacion de impulsos que construye la forma de sintesis a partir de una suma de impulsos de enteros senalizados [3]. Los impulsos pueden anadirse uno encima del otro para formar impulsos de diferente altura. En esta realizacion, la asignacion R(b) de bits indica el numero de impulsos asignados a la banda b.
Los indices de cuantificador a partir de la cuantificacion de envolvente y la cuantificacion de forma son multiplexados en un flujo de bits para ser almacenados o transmitidos a un decodificador.
Decodificador de la realizacion 1
El decodificador desmultiplexa los indices del flujo de bits y envia los indices relevantes a cada modulo de decodificacion. En primer lugar, se obtiene la envolvente cuantificada E(b). A continuacion, la asignacion de bits de
5
10
15
20
25
30
35
40
45
50
estructura fina se deriva de la envolvente cuantificada utilizando una asignacion de bits identica a la utilizada en el
A ‘
codificador. Los vectores N(b) de forma de la estructura fina se decodifican utilizando los indices y la asignacion R(b) de bits obtenida.
Ahora, antes de escalar la estructura fina decodificada con la envolvente, se determinan factores de correccion de ganancia adicionales. En primer lugar, la ganancia de correspondencia RMS se obtiene como:
imagen3
El factor gRMS(b) es un factor de escala que normaliza el valor RMS a 1, es decir:
imagen4
En esta realizacion buscamos minimizar el error cuadratico medio (MSE) de la sintesis:
imagen5
con la solucion
N(b)TN(b)
N[b)TN{b)
(7)
Dado que gMSE(b) depende de la forma de entrada N(b), no se conoce en el decodificador. En esta realizacion, el impacto se estima utilizando una medida de precision. La relacion de estas ganancias se define como un factor de correccion de ganancia gc(b):
gjb) =
9HSR (^) 0R\!s(k)
(8)
Cuando la precision de la cuantificacion de la forma es buena, el factor de correccion es cercano a 1, es decir:
N(b) -> N(b) => gc(b) 1 (9)
Sin embargo, cuando la precision de es baja, gMSE(b) y gRMs(b) divergiran. En esta realizacion, en la que la forma se codifica utilizando un esquema de codificacion de impulsos, una velocidad baja hara que el vector de forma sea escaso y gRMS(b) dara una sobreestimacion de la ganancia apropiada en terminos de MSE. Para este caso gc(b) debe ser inferior a 1 para compensar el rebasamiento. Veanse las figuras 5A-B para una ilustracion de ejemplo del caso de forma de impulso de baja velocidad. La figura 5A-B ilustra un ejemplo de escala de la sintesis con factores de ganancia gMSE (figura 5B) y gRMS (figura 5A) cuando el vector de forma es un vector de impulso escaso. La escala de gRMS da impulsos que son demasiado altos en un sentido MSE.
Por otra parte, una senal de destino pico o escasa puede estar bien representada con una forma de impulso. Aunque la dispersion de la senal de entrada puede no ser conocida en la etapa de sintesis, la escasez de la forma de sintesis puede servir como un indicador de la precision del vector de forma sintetizado. Una forma de medir la dispersion de la forma de sintesis es la altura del pico maximo en la forma. El razonamiento detras de esto es que una senal de entrada escasa es mas probable que genere altos picos en la forma de sintesis. Vease la figura 7A-B para una ilustracion de como la altura del pico puede indicar la precision de dos vectores de impulso de velocidad igual. En la figura 7A hay 5 impulsos disponibles (R(b) = 5) para representar la forma discontinua. Puesto que la forma es bastante constante, la codificacion genero 5 impulsos distribuidos de igual altura 1, es decir pmax = 1. En la figura 7B tambien hay 5 impulsos disponibles para representar la forma discontinua. Sin embargo, en este caso la forma es pico o escasa, y el pico mas grande esta representado por 3 impulsos uno encima del otro, es decir pmax = 3. Esto indica que la correccion gc(b) de ganancia depende de una dispersion estimada pmax de la forma cuantificada.
Como se ha indicado anteriormente, la forma N(b) de entrada no es conocida por el decodificador. Puesto que gMSE(b) depende de la forma N(b) de entrada, esto significa que la correccion o compensacion gc(b) de ganancia no puede en la practica basarse en la ecuacion ideal (8). En esta realizacion se decide en cambio la correccion de ganancia gc(b) basandose en la velocidad binaria en terminos del numero de impulsos R(b), la altura del impulso 5 mas grande en el vector de forma pmax(b) y la banda b de frecuencias, es decir:
9c(b) = /(*(*>).
(10}
Se ha observado que las velocidades mas bajas requieren generalmente una atenuacion de la ganancia para 10 minimizar el MSE. La dependencia de la velocidad puede ser implementada como una tabla t(R(b)) de consulta que es entrenada en datos de senal de audio relevantes. En la figura 7 se puede ver una tabla de consulta de ejemplo. Dado que los vectores de forma en esta realizacion tienen anchuras diferentes, la velocidad puede expresarse preferentemente como numero de impulsos por muestra. De esta manera se puede utilizar la misma atenuacion dependiente de la velocidad para todos los anchos de banda. Una solucion alternativa, que se utiliza en esta 15 realizacion, es utilizar un tamano T de paso en la tabla dependiendo de la anchura de la banda. Aquf, utilizamos 4 anchos de banda diferentes en 4 grupos diferentes y por lo tanto requieren 4 tamanos de paso. Un ejemplo de tamanos de paso se encuentra en la tabla 1. Utilizando el tamano de paso, el valor de busqueda se obtiene utilizando una operacion de redondeo t(l_R(b)-T_|), donde L J representa el redondeo al entero mas cercano.
20 Tabla 1
Grupo de banda
Ancho de banda Tamano T de paso
1
8 4
2
16 4/3
3
24 2
4
34 1
Otro cuadro de consulta de ejemplo se da en la tabla 2.
Tabla 2
Grupo de banda
Ancho de banda Tamano T de paso
1
8 4
2
16 4/3
3
24 2
4
32 1
25
La dispersion estimada se puede implementar como otra tabla u(R(b), pmax(b)) de consulta basandose tanto en el numero de impulsos R(b) como en la altura del impulso maximo pmax(b). En la figura 8 se muestra una tabla de consulta de ejemplo. La tabla u de consulta sirve como medida A(b) de precision para la banda b, es decir:
A{b) = u(R{b)ipmJb)) (11)
30
Se observo que la aproximacion de gMSE era mas adecuada para el rango de frecuencias mas bajas desde una perspectiva perceptual. Para las frecuencias mas altas, la estructura fina se vuelve menos importante perceptualmente y la coincidencia del valor de energfa o RMS se hace vital. Por esta razon, la atenuacion de 35 ganancia se puede aplicar solo por debajo de cierto numero de banda bTHR. En este caso, la correccion de ganancia gc(b) tendra una dependencia explfcita de la banda b de frecuencias. La funcion de correccion de ganancia resultante puede definirse en este caso como:
40
g (b)= W^))* A(b)» b<bTHR
[l, de otro modo
(12)
La descripcion hasta este punto tambien se puede utilizar para describir las caracterfsticas esenciales del ejemplo de realizacion de la figura 4. Asf, en la realizacion de la figura 4, la sfntesis final X(b) se calcula como:
m = 9c(b)9RMsm(n)N(b) (13)
W)
Como alternativa, la funcion u(R(b)), pmax(b)) se puede implementar como una funcion lineal de la altura maxima de impulso pmax y la velocidad R(b) de bits asignada, por ejemplo como:
5
10
15
20
25
30
35
40
45
u(R(b),PmJb)) = k • (PriJb)- R(b)) +1 donde la inclinacion k se determina por:
imagen6
La funcion depende del parametro amin de sintonia que da el factor de atenuacion inicial para R(b) = l y pmax(b) = 1. La funcion se ilustra en la figura 9, con el parametro amin = 0,41 de ajuste. Tipicamente Umax e[0,7, 1,4] y Umin e[0, Umax]. En la ecuacion (14) u es lineal en la diferencia entre pmax(b) y R(b). Otra posibilidad es tener diferentes factores de inclinacion para pmax(b) y R(b).
La velocidad de bits para una banda dada puede cambiar drasticamente para una banda dada entre tramas adyacentes. Esto puede conducir a variaciones rapidas de la correccion de ganancia. Tales variaciones son especialmente criticas cuando la envolvente es bastante estable, es decir, los cambios totales entre las tramas son bastante pequenos. Esto sucede a menudo para senales de musica que normalmente tienen envolventes de energia mas estables. Para evitar que la atenuacion de ganancia introduzca inestabilidad, se puede anadir una adaptacion adicional. En la figura 10 se da una vision general de tal realizacion, en la que se ha anadido un medidor 66 de estabilidad al aparato 60 de ajuste de ganancia en el decodificador 300.
La adaptacion puede por ejemplo basarse en una medida de estabilidad de la envolvente E(b). Un ejemplo de una medida de este tipo es calcular la distancia euclidiana al cuadrado entre vectores de envolvente log2 adyacentes:
AE(m) = -~-— V {iog2E(b,m)-[og2E(b,m-l)) (16)
Nbmds m
Aqui, AE(m) indica la distancia euclidiana al cuadrado entre los vectores de envolvente para la trama m y la trama m - 1. La medida de estabilidad tambien puede ser filtrada en paso bajo para tener una adaptacion mas suave:
AJS(m) = «AE(m) 4- (1 - a)AB(m -1) (17)
Un valor adecuado para el factor a de olvido puede ser 0,1. La medida de estabilidad se puede utilizar para crear una limitacion de la atenuacion, por ejemplo, una funcion sigmoide, tal como:
imagen7
donde los parametros se pueden establecer en C1 = 6, C2 = 2 y C3 = 1,9. Debe tenerse en cuenta que estos parametros han de considerarse como ejemplos, mientras que los valores reales pueden elegirse con mas libertad. Por ejemplo:
Cle[l,10]
<=^[1,4]
C3e[-5,10]
La figura 11 ilustra un ejemplo de una funcion de mapeo desde la medida de estabilidad At{m) al factor gmm de limitacion de ajuste de ganancia. La expresion anterior para gmin se implementa preferentemente como una tabla de busqueda o con una funcion de paso simple, tal como:
5
10
15
20
25
30
35
40
45
50
55
fl, AE(m)<C,IC,
M(m)>C3/C,
La variable gmm e[0,1 ] de limitacion de atenuacion se puede utilizar para crear una modificacion de ganancia adaptada a la estabilidad como:
gc(b) = max(ga(b),gmill) (20}
imagen8
Despues de la estimacion de la ganancia, la sintesis final X(b) se calcula como:
X(b) = m9msm(ri)N(b) (21)
W)
En las variantes descritas de la realizacion 1, la union de los vectores sintetizados X(b) forma el espectro sintetizado X, que se procesa adicionalmente utilizando la transformada MDCT inversa, se enciende con la ventana sinusoidal simetrica y se anade a la sintesis de salida utilizando la estrategia de superposicion y suma.
Ejemplo 2
En otro ejemplo, la forma se cuantifica utilizando un banco de filtros QMF (filtro espejo en cuadratura) y un esquema ADPCM (modulacion por codigo de impulso diferencial adaptativo) para la cuantificacion de la forma. Un ejemplo de un esquema ADPCM de sub-banda es el ITU-T G.722 [4]. La senal de audio de entrada se procesa preferentemente en segmentos. Un ejemplo de esquema ADPCM se muestra en la figura 12, con un tamano S de paso adaptativo. Aqui, el tamano de paso adaptativo del cuantificador de forma sirve como una medida de precision que ya esta presente en el decodificador y no requiere senalizacion adicional. Sin embargo, el tamano del paso de cuantificacion debe extraerse de los parametros utilizados por el proceso de decodificacion y no de la propia forma sintetizada. Una vista general de esta realizacion se muestra en la figura 14. Sin embargo, antes de que esta realizacion se describa en detalle, se describira un esquema ADPCM de ejemplo basandose en un banco de filtros QMF con referencia a las figuras 12 y 13.
La figura 12 ilustra un ejemplo de un sistema de codificador y decodificador ADPCM con un tamano de paso de adaptativo. Un cuantificador ADPCM 70 incluye un sumador 72, que recibe una senal de entrada y resta una estimacion de la senal de entrada anterior para formar una senal e de error. La senal de error se cuantifica en un cuantificador 74, cuya salida es enviada al multiplexor 18 de flujo de bits, y tambien a una calculadora de tamano de paso 76 y un descuantificador 78. La calculadora 76 de tamano de paso adapta el tamano S de paso de cuantificacion para obtener un error aceptable. El tamano S de paso de cuantificacion es enviado al multiplexor 18 de flujo de bits, y tambien controla el cuantificador 74 y el descuantificador 78. El descuantificador 78 emite una estimacion e de error a un sumador 80. La otra entrada del sumador 80 recibe una estimacion de la senal de entrada que ha sido retardada por un elemento 82 de retardo. Esto forma una estimacion actual de la senal de entrada, que es enviada al elemento 82 de retardo. La senal retardada tambien es enviada a la calculadora 76 de tamano de paso y (con un cambio de signo) al sumador 72 para formar la senal e de error.
Un descuantificador ADPCM 90 incluye un decodificador 92 de tamano de paso, que decodifica el tamano S de paso recibido y lo envia a un descuantificador 94. El descuantificador 94 decodifica la estimacion e de error, que es enviada a un sumador 98, cuya otra entrada recibe la senal de salida del sumador retardada por un elemento 96 de retardo.
La figura 13 ilustra un ejemplo en el contexto de un sistema codificador y decodificador de audio basado en ADPCM de sub-banda. El lado del codificador es similar al lado del codificador de la realizacion de la figura 2. Las diferencias esenciales son que el transformador de frecuencia 30 ha sido reemplazado por un banco 100 de filtros de analisis QMF (filtro espejo en cuadratura), y que el cuantificador 38 de estructura fina ha sido reemplazado por un cuantificador ADPCM, tal como el cuantificador 70 en la figura 12. El lado del decodificador es similar al lado del decodificador de la realizacion de la figura 2. Las diferencias esenciales son que el transformador 50 de frecuencia inversa ha sido reemplazado por un banco 102 de filtro de sintesis QMF, y que el descuantificador 46 de estructura fina ha sido reemplazado por un descuantificador ADPCM tal como el descuantificador 90 en la figura 12.
La figura 14 ilustra una realizacion de la presente tecnologia en el contexto de un sistema codificador y decodificador de audio basado en ADPCM de sub-banda. Con el fin de evitar el desorden del dibujo, solo se ilustra el lado del decodificador 300. El lado del codificador puede ser implementado como en la figura 13.
5
10
15
20
25
30
35
40
45
50
55
Codificador del ejemplo 2
El codificador aplica el banco de filtros QMF para obtener las senales de sub-banda. Los valores de RMS de cada senal de sub-banda se calculan y las senales de sub-bandas se normalizan. La envolvente E(b), la asignacion de bits de sub-banda R(b) y los vectores N(b) de forma normalizados se obtienen como en la realizacion 1. Cada sub- banda normalizada se alimenta en el cuantificador ADPCM. En esta realizacion, el ADPCM funciona de una manera adaptativa hacia delante y determina un paso S(b) de escalado que se utilizara para la sub-banda b. El paso de escalado se elige para minimizar el MSE a traves de la trama de sub-banda. En esta realizacion, el paso se elige intentando todos los pasos posibles y seleccionando el que da el minimo MSE:
S(b) = min-~^(N(b)-Q(N{b),S)jriN{b)-Q(N(b),S)) (22)
donde Q(x, s) es la funcion de ADPCM de la variable x que utiliza un tamano de paso de s. El tamano de paso seleccionado puede utilizarse para generar la forma cuantificada:
N{b) = Q(N(b),S(b)) (23)
Los indices de cuantificador a partir de la cuantificacion de envolvente y la cuantificacion de forma son multiplexados en un flujo de bits para ser almacenados o transmitidos a un decodificador.
Decodificador del ejemplo 2
El decodificador desmultiplexa los indices del flujo de bits y envia los indices relevantes a cada modulo de decodificacion. La envolvente cuantificada E(b) y la asignacion R(b) de bits se obtienen como en la realizacion 1. Los vectores N(b) de forma sintetizados se obtienen a partir del decodificador ADPCM o descuantificador junto con los tamanos S(b) de pasos de adaptacion. Los tamanos de paso indican una precision del vector de forma cuantificado, donde un tamano de paso mas pequeno corresponde a una mayor precision y viceversa. Una posible implementacion es hacer que la precision A (b) sea inversamente proporcional al tamano del paso utilizando un factor de proporcionalidad y:
imagen9
donde y debe establecerse para lograr la relacion deseada. Una eleccion posible es y = Smin donde smin es el tamano de paso minimo, que da la precision 1 para S(b) = Smin.
El factor de correccion de ganancia gc puede obtenerse utilizando una funcion de mapeo:
gM = h(R(b),h)-A(b) (1)
La funcion h de mapeo puede implementarse como una tabla de consulta basada en la velocidad R(b) y la banda b de frecuencia. Esta tabla puede definirse agrupando los valores gMSE/gRMS de correccion de ganancia optimos por estos parametros y calculando la entrada de tabla promediando los valores de correccion de ganancia optimos para cada grupo.
Despues de la estimacion de la correccion de ganancia, la sintesis X(b) de sub-banda se calcula como:
X{b) = gl:{b)g,i;s[b)E (n)N(b) (2)
La trama de audio de salida se obtiene aplicando el banco de filtros de sintesis QMF a las sub-bandas.
En el ejemplo ilustrado en la figura 14, el medidor 62 de precision en el aparato 60 de ajuste de ganancia recibe el tamano S(b) de paso de cuantificacion aun no decodificado directamente del flujo de bits recibido. Una alternativa, como se ha indicado anteriormente, es decodificarlo en el descuantificador 90 de ADPCM y enviarlo en forma decodificada al medidor 62 de precision.
Hay que senalar que el ejemplo 2 descrito anteriormente no forma parte de la invencion reivindicada pero da un ejemplo util de una implementacion alternativa para entender al invencion.
5
10
15
20
25
30
35
40
45
50
55
60
Otras alternativas
La medida de precision se podria complementar con un parametro de clase de senal derivado en el codificador. Esto puede ser, por ejemplo, un discriminador de voz/musica o un estimador de nivel de ruido de fondo. En la figura 15-16 se muestra un resumen de un sistema que incorpora un clasificador de senales. El lado del codificador en la figura 15 es similar al lado del codificador en la figura 2, pero ha sido provisto de un clasificador 104 de senales. El lado 300 del decodificador en la figura 16 es similar al lado del decodificador en la figura 4, pero ha sido provisto de una entrada de clase de senal adicional en el medidor 62 de precision.
La clase de senal podria incorporarse en la correccion de ganancia, por ejemplo, teniendo una adaptation dependiente de la clase. Si asumimos que las clases de senal son la voz o la musica correspondientes a los valores C = 1 y C = 0, respectivamente, podemos limitar el ajuste de ganancia a ser efectivo solo durante la voz, es decir:
= b<bTH^C = l
c [l, de otro modo
En otra realization alternativa el sistema puede actuar como un predictor junto con una correccion o compensation de ganancia parcialmente codificada. En esta realizacion, la medida de precision se utiliza para mejorar la prediction de la correccion o compensacion de ganancia de tal manera que el error de ganancia restante pueda codificarse con menos bits.
Cuando se crea la correccion de ganancia o el factor gc de compensacion, es posible que se quiera realizar una compensacion entre el valor RMS o la energia y minimizar el MSE. En algunos casos, hacer coincidir la energia es mas importante que una forma de onda precisa. Esto es por ejemplo verdadero para las frecuencias mas altas. Para acomodar esto, la correccion de ganancia final puede, en una realizacion adicional, ser formada utilizando una suma ponderada de los diferentes valores de ganancia:
g[ = P9rms +(1~ ^9msb =/? + (!- = /? + (!- P)gc (28)
9 RMS 9rms
donde gc es la correccion de ganancia obtenida de acuerdo con uno de los enfoques descritos anteriormente. El factor p de ponderacion puede adaptarse por ejemplo a la frecuencia, velocidad de bits o el tipo de senal.
Los pasos, funciones, procedimientos y / o bloques descritos en el presente documento pueden implementarse en el equipo fisico utilizando cualquier tecnologia convencional, tal como tecnologia de circuito discreto o de circuito integrado, incluyendo tanto circuiteria electronica de uso general como circuiteria especifica de aplicacion.
Alternativamente, al menos algunos de los pasos, funciones, procedimientos y/o bloques descritos en el presente documento pueden implementarse en el equipo logico para su ejecucion por un dispositivo de procesamiento adecuado, tal como un microprocesador, procesador de senal digital (DSP) y/o cualquier logica programable adecuada , como un dispositivo de matriz de puertas programables (FPGA).
Tambien debe entenderse que puede ser posible reutilizar las capacidades generales de procesamiento del decodificador. Esto puede hacerse, por ejemplo, mediante la reprogramacion del equipo logico existente o mediante la adicion de nuevos componentes de equipo logico.
La figura 17 ilustra una realizacion de un aparato 60 de ajuste de ganancia de acuerdo con la presente tecnologia. Esta realizacion se basa en un procesador 110, por ejemplo un microprocesador, que ejecuta un componente 120 de equipo logico para estimar la medida de precision, un componente 130 de equipo logico para determinar la ganancia de la correccion y un componente 140 de equipo logico para ajustar la representation de ganancia. Estos componentes de equipo logico se almacenan en la memoria 150. El procesador 110 se comunica con la memoria a
ft ^
traves de un bus de sistema. Los parametros N(b\ R(b), E(b) son recibidos por un controlador 160 de entrada/salida (I/O) que controla un bus I/O, al que estan conectados el procesador 110 y la memoria 150. En esta realizacion, los parametros recibidos por el controlador 160 de I/O se almacenan en la memoria 150, donde son procesados por los componentes de equipo logico. Los componentes 120, 130 de equipo logico pueden implementar la funcionalidad del bloque 62 en las realizaciones descritas anteriormente. El componente 140 de equipo logico puede implementar
la funcionalidad del bloque 64 en las realizaciones descritas anteriormente. La representacion E(t>) de ganancia ajustada obtenida a partir del componente 140 de equipo logico es emitida desde la memoria (150) por el controlador 160 de I/O a traves del bus de I/O.
La figura 18 ilustra una realizacion de ajuste de ganancia de acuerdo con la presente tecnologia con mas detalle. Un estimador 200 de atenuacion esta configurado para utilizar la asignacion R(b) de bits recibida para determinar una atenuacion de ganancia t(R(b)). El estimador 200 de atenuacion puede, por ejemplo, ser implementado como una tabla de consulta o en un equipo logico basandose en una ecuacion lineal tal como la ecuacion (14) anterior. La
5
10
15
20
25
30
35
40
45
50
55
60
65
asignacion R(b) de bits tambien es enviada a un estimador 202 de precision de forma, que tambien recibe una dispersion estimada pmax(b) de la forma cuantificada, por ejemplo representada por la altura del impulso mas alto en la representacion w(b) de forma . El estimador 202 de precision de forma puede, por ejemplo, ser implementado como una tabla de consulta. La atenuacion estimada t(R(b)) y la precision A(b) de forma estimada se multiplican en un multiplicador 204. En una realizacion, este producto t(R(b))-A(b) forma directamente la correccion gc(b) de ganancia. En otra realizacion, la correccion de ganancia gc(b) se forma de acuerdo con la ecuacion (12) anterior. Esto requiere un conmutador 206 controlado por un comparador 208, que determina si la banda b de frecuencia es menor que un limite bTHR de frecuencia. Si este es el caso, entonces gc(b) es igual a t(R(b))-A(b)). De lo contrario gc(b) se establece en 1. La correccion gc(b) de ganancia es enviada a otro multiplicador 210, cuya otra entrada recibe la ganancia gRMA(b) de correspondencia RMS. La ganancia gRMA(b) de correspondencia RMS es determinada por una calculadora 212 de ganancia de correspondencia RMS basandose en la representacion N(b) de forma recibida y ancho de banda BW(b) correspondiente, vease la ecuacion (4) anterior. El producto resultante es enviado a otro multiplicador 214, que tambien recibe la representacion N(b) de forma y la representacion E(b) de ganancia, y
A.
forma la sintesis X(b)_
La deteccion de estabilidad descrita con referencia a la figura 10 puede incorporarse en la realizacion 2 asi como las otras realizaciones descritas anteriormente. La figura 19 es un diagrama de flujo que ilustra el metodo de acuerdo
con la presente tecnologia. El paso S1 estima una medida A(b) de precision de la representacion N{b) de forma. La medida de precision puede derivarse, por ejemplo, de caracteristicas de cuantificacion de forma, tales como R(b), S(b), que indican la resolucion de la cuantificacion de forma. El paso S2 determina una correccion de ganancia, tal como gc(b), gc(b), g’c(b), basandose en la medida de precision estimada. El paso S3 ajusta la representacion E(b) de ganancia basandose en la correccion de ganancia determinada.
La figura 20 es un diagrama de flujo que ilustra una realizacion del metodo de acuerdo con la tecnologia actual, en la que la forma ha sido codificada utilizando un esquema de codificacion de impulsos y la correccion de ganancia depende de una dispersion estimada pmax(b) de la forma cuantificada. Se supone que una medida de precision ya se ha determinado en un paso S1 (figura 19). El paso S4 estima una atenuacion de ganancia que depende de la velocidad de bits asignada. El paso S5 determina una correccion de ganancia basandose en la medida de precision estimada y la atenuacion de ganancia estimada. A continuacion, el procedimiento procede al paso S3 (figura 19) para ajustar la representacion de ganancia.
La figura 21 ilustra una realizacion de una red de acuerdo con la tecnologia actual. Incluye un decodificador 300 provisto de un aparato de ajuste de ganancia de acuerdo con la presente tecnologia. Esta realizacion ilustra un terminal de radio, pero tambien son factibles otros nodos de red. Por ejemplo, si se utiliza voz sobre IP (Protocolo de Internet) en la red, los nodos pueden comprender ordenadores.
En el nodo de red de la figura 21, una antena 302 recibe una senal de audio codificada. Una unidad 304 de radio transforma esta senal en parametros de audio, los cuales son enviados al decodificador 300 para generar una senal de audio digital, como se describe con referencia a las diversas realizaciones anteriores. La senal de audio digital es entonces convertida y amplificada D/A en una unidad 306 y finalmente transmitida a un altavoz 308.
Aunque la descripcion anterior se centra en la codificacion de audio basada en transformada, los mismos principios tambien pueden aplicarse a la codificacion de audio en el dominio tiempo con representaciones separadas de ganancia y forma, por ejemplo codificacion CELP.
Los expertos en la tecnica comprenderan que se pueden hacer diversas modificaciones y cambios en la presente tecnologia sin apartarse del alcance de la misma, que se define por las reivindicaciones adjuntas.
Abreviaturas
ADPCM Modulacion por codigo de impulso diferencial adaptativo AMR Multivelocidad adaptativa
AMR-WB Ancho de banda de multivelocidad adaptativa CELP Prediccion lineal excitada por codigo
GSM-EFR Sistema global para comunicaciones moviles - Velocidad completa mejorada DSP Procesador de senal digital FPGA Matriz de puertas programable IP Protocolo de Internet
MDCT Transformada discreta de coseno modificada
MSE Error cuadratico medio 5
QMF Filtro espejo en cuadratura RMS Media cuadratica 10 VQ Cuantificacion de vector Referencias
[1] "ITU-T G.722.1 ANNEX C: A NEW LOW-COMPLEXITY 14 KHZ AUDIO CODING STANDARD", ICASSP 2006 15
[2] "ITU-T G.719: A NEW LOW-COMPLEXITY FULL-BAND (20 KHZ) AUDIO CODING STANDARD FOR HIGHQUALITY CONVERSATIONAL APPLICATIONS", WASPA 2009
[3] U. Mittal, J. Ashley, E. Cruz-Zeno, "Low Complexity Factorial Pulse Coding of MDCT Coefficients using 20 Approximation of Combinatorial Functions", ICASSP 2007
[4] "7 kHz Audio Coding Within 64 kbit/s", [G.722], IEEE JOURNAL ON SELECTED AREAS IN COMMUNICATIONS, 1988

Claims (15)

  1. 5
    10
    15
    20
    25
    30
    35
    40
    45
    50
    55
    60
    65
    REIVINDICACIONES
    ha sido codificado con representaciones
    (w(b)) para una banda (b) de frecuencia, comprendiendo la banda (b) de frecuencia pluralidad de coeficientes, en el que la forma ha sido codificada utilizando un esquema de codificacion de vector de impulso en el que los impulsos pueden ser anadidos uno encima de otro para formar impulsos de diferentes alturas, y la medida (A(b)) de precision se basa en un numero de impulsos (R(b) y una altura de un impulso maximo (pmax(b));
    determinar (S2) basandose en la medida (A(b)) de precision estimada una correccion (gc(b)) de ganancia; ajustar (S3) la representacion (E(b)) de ganancia basandose en la correccion de ganancia determinada.
  2. 2. - El metodo de la reivindicacion 1, en el que la correccion (gc(b)) de ganancia tambien depende de la banda (b) de frecuencia.
  3. 3. - El metodo de cualquiera de las reivindicaciones precedentes, incluidos los pasos de:
    estimar (S4) una atenuacion (t(R(b)) de ganancia que depende de la velocidad (R(b)) de bits asignada;
    determinar (S5) la correccion (gc(b)) de ganancia basandose en la medida (A(b)) de precision estimada y la atenuacion (t(R(b)) de ganancia estimada.
  4. 4. - El metodo de la reivindicacion 3, en el que la atenuacion (t(R(b)) de ganancia es estimada a partir de una tabla (200) de busqueda.
  5. 5. - El metodo de la reivindicacion 3 o 4, que incluye el paso de estimar (S5) la medida (A(b)) de precision a partir de una tabla (200) de busqueda.
  6. 6. - El metodo de la reivindicacion 3 o 4, que incluye el paso de estimar la medida (A(b)) de precision a partir de una funcion linear de la altura (pmax) de altura de impulso maxima y la velocidad (R(b)) de bits asignada
  7. 7. - El metodo de cualquiera de las reivindicaciones precedentes, que incluye el paso de adaptar la correccion (gc(b)) de ganancia a una clase de senal de audio determinada.
  8. 8. - Un aparato (60) de ajuste de ganancia para su uso en decodificar audio que ha sido codificado con representaciones de forma y ganancia separadas, incluyendo dichos aparatos:
    A
    un medidor (62) de precision configurado para estimar una medida (A(b)) de precision de la representacion (w(b)) de forma para una banda (b) de frecuencia, la banda (b) de frecuencia comprendiendo pluralidad de coeficientes, en el que la forma ha sido codificada utilizando un esquema de codificacion de vector de impulso en el que los impulsos pueden ser anadidos uno encima de otro para formar impulsos de diferentes alturas, la medida (A(b)) de precision se basa en un numero de impulsos (R(b)) y una altura de un impulso maximo (pmax(b)), y para determinar una correccion (gc(b)) de ganancia, en el que la correccion (gc(b)) de ganancia se determina basandose en la medicion (A(b)) de precision estimada;
    un ajustador (64) de envolvente configurado para ajustar la representacion (E(b)) de ganancia basandose en la correccion de ganancia determinada.
  9. 9. - El aparato de la reivindicacion 8, en el que la correccion (gc(b)) de ganancia tambien depende de la banda (b) de frecuencia.
  10. 10. - El aparato de la reivindicacion 8 o 9, en el que el medidor de precision incluye
    un estimador (200) de atenuacion configurado para estimar una atenuacion (t(R(b))) de ganancia que depende de la velocidad (R(b)) de bits asignada;
    un estimador (202) de precision de forma configurado para estimar la medida (A(b)) de precision;
    un corrector (204, 206, 208) de ganancia configurado para determinar una correccion (gc(b)) de ganancia basandose en la medida (A(b)) de precision estimada y la atenuacion (t(R(b))) de ganancia estimada.
  11. 11. - El aparato de la reivindicacion 10, en el que el estimador (200) de atenuacion se implementa como una tabla de
    1.- Un metodo de ajuste de ganancia en la decodificacion de audio que separadas de ganancia y forma, incluyendo dicho metodo los pasos de:
    estimar (S1) una medida (A(b)) de precision de la representacion de forma
    busqueda.
  12. 12. - El aparato de la reivindicacion 10 u 11, en el que el estimador (202) de precision de forma es una tabla de busqueda.
    5
  13. 13. - El aparato de la reivindicacion 10 u 11, en el que el estimador (202) de precision de forma es configurado para estimar la medida (A(b)) de precision a partir de una funcion lineal de la altura (pmax) de impulso maxima y la velocidad (R(b)) de bits asignada.
    10 14.- El aparato de cualquiera de las reivindicaciones 8-11, en el que el medidor (62) de precision es configurado para
    adaptar la correccion (gc(b)) de ganancia a una clase de senal de audio determinada.
  14. 15. - Un decodificador que incluye un aparato (60) de ajuste de ganancia de acuerdo con cualquiera de las reivindicaciones 8-14.
    15
  15. 16. - Un nodo de red que incluye un decodificador de acuerdo con la reivindicacion 15.
ES11860420.6T 2011-03-04 2011-07-04 Corrección de ganancia post-cuantificación en codificación de audio Active ES2641315T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201161449230P 2011-03-04 2011-03-04
US201161449230P 2011-03-04
PCT/SE2011/050899 WO2012121637A1 (en) 2011-03-04 2011-07-04 Post-quantization gain correction in audio coding

Publications (1)

Publication Number Publication Date
ES2641315T3 true ES2641315T3 (es) 2017-11-08

Family

ID=46798434

Family Applications (2)

Application Number Title Priority Date Filing Date
ES17173430T Active ES2744100T3 (es) 2011-03-04 2011-07-04 Decodificador de audio con corrección de ganancia post-cuantificación
ES11860420.6T Active ES2641315T3 (es) 2011-03-04 2011-07-04 Corrección de ganancia post-cuantificación en codificación de audio

Family Applications Before (1)

Application Number Title Priority Date Filing Date
ES17173430T Active ES2744100T3 (es) 2011-03-04 2011-07-04 Decodificador de audio con corrección de ganancia post-cuantificación

Country Status (10)

Country Link
US (4) US10121481B2 (es)
EP (2) EP3244405B1 (es)
CN (2) CN105225669B (es)
BR (1) BR112013021164B1 (es)
DK (1) DK3244405T3 (es)
ES (2) ES2744100T3 (es)
PL (2) PL2681734T3 (es)
PT (1) PT2681734T (es)
TR (1) TR201910075T4 (es)
WO (1) WO2012121637A1 (es)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101819180B1 (ko) * 2010-03-31 2018-01-16 한국전자통신연구원 부호화 방법 및 장치, 그리고 복호화 방법 및 장치
PT2908313T (pt) 2011-04-15 2019-06-19 Ericsson Telefon Ab L M Partilha adaptativa de taxas de ganho/forma
JP6088532B2 (ja) * 2011-10-21 2017-03-01 サムスン エレクトロニクス カンパニー リミテッド 無損失符号化方法
PL3457400T3 (pl) * 2012-12-13 2024-02-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Urządzenie do kodowania głosowego audio, urządzenie do dekodowania głosowego audio, sposób kodowania głosowego audio i sposób dekodowania głosowego audio
US9818424B2 (en) * 2013-05-06 2017-11-14 Waves Audio Ltd. Method and apparatus for suppression of unwanted audio signals
CN108364657B (zh) 2013-07-16 2020-10-30 超清编解码有限公司 处理丢失帧的方法和解码器
SG10201808274UA (en) 2014-03-24 2018-10-30 Samsung Electronics Co Ltd High-band encoding method and device, and high-band decoding method and device
CN106683681B (zh) 2014-06-25 2020-09-25 华为技术有限公司 处理丢失帧的方法和装置
FI3405950T3 (fi) * 2016-01-22 2022-12-15 Stereoaudiokoodaus ILD-pohjaisella normalisoinnilla ennen keski/sivupäätöstä
US10109284B2 (en) 2016-02-12 2018-10-23 Qualcomm Incorporated Inter-channel encoding and decoding of multiple high-band audio signals
US10950251B2 (en) * 2018-03-05 2021-03-16 Dts, Inc. Coding of harmonic signals in transform-based audio codecs

Family Cites Families (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5109417A (en) * 1989-01-27 1992-04-28 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
US5263119A (en) * 1989-06-29 1993-11-16 Fujitsu Limited Gain-shape vector quantization method and apparatus
ATE218741T1 (de) * 1994-02-01 2002-06-15 Qualcomm Inc Lineare vorhersage durch impulsanregung
JP3707116B2 (ja) * 1995-10-26 2005-10-19 ソニー株式会社 音声復号化方法及び装置
JP3707153B2 (ja) * 1996-09-24 2005-10-19 ソニー株式会社 ベクトル量子化方法、音声符号化方法及び装置
ATE302991T1 (de) * 1998-01-22 2005-09-15 Deutsche Telekom Ag Verfahren zur signalgesteuerten schaltung zwischen verschiedenen audiokodierungssystemen
US6351730B2 (en) * 1998-03-30 2002-02-26 Lucent Technologies Inc. Low-complexity, low-delay, scalable and embedded speech and audio coding with adaptive frame loss concealment
US6223157B1 (en) * 1998-05-07 2001-04-24 Dsc Telecom, L.P. Method for direct recognition of encoded speech data
US6691092B1 (en) * 1999-04-05 2004-02-10 Hughes Electronics Corporation Voicing measure as an estimate of signal periodicity for a frequency domain interpolative speech codec system
US6496798B1 (en) * 1999-09-30 2002-12-17 Motorola, Inc. Method and apparatus for encoding and decoding frames of voice model parameters into a low bit rate digital voice message
US6615169B1 (en) * 2000-10-18 2003-09-02 Nokia Corporation High frequency enhancement layer coding in wideband speech codec
JP4506039B2 (ja) * 2001-06-15 2010-07-21 ソニー株式会社 符号化装置及び方法、復号装置及び方法、並びに符号化プログラム及び復号プログラム
US6658383B2 (en) * 2001-06-26 2003-12-02 Microsoft Corporation Method for coding speech and music signals
US7146313B2 (en) 2001-12-14 2006-12-05 Microsoft Corporation Techniques for measurement of perceptual audio quality
CN1639984B (zh) * 2002-03-08 2011-05-11 日本电信电话株式会社 数字信号编码方法、解码方法、编码设备、解码设备
US7447631B2 (en) * 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
US7555434B2 (en) * 2002-07-19 2009-06-30 Nec Corporation Audio decoding device, decoding method, and program
SE0202770D0 (sv) * 2002-09-18 2002-09-18 Coding Technologies Sweden Ab Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks
WO2004090870A1 (ja) * 2003-04-04 2004-10-21 Kabushiki Kaisha Toshiba 広帯域音声を符号化または復号化するための方法及び装置
US8218624B2 (en) * 2003-07-18 2012-07-10 Microsoft Corporation Fractional quantization step sizes for high bit rates
US20090210219A1 (en) * 2005-05-30 2009-08-20 Jong-Mo Sung Apparatus and method for coding and decoding residual signal
JP3981399B1 (ja) * 2006-03-10 2007-09-26 松下電器産業株式会社 固定符号帳探索装置および固定符号帳探索方法
US7590523B2 (en) * 2006-03-20 2009-09-15 Mindspeed Technologies, Inc. Speech post-processing using MDCT coefficients
US20080013751A1 (en) * 2006-07-17 2008-01-17 Per Hiselius Volume dependent audio frequency gain profile
US20100049512A1 (en) * 2006-12-15 2010-02-25 Panasonic Corporation Encoding device and encoding method
WO2008072737A1 (ja) * 2006-12-15 2008-06-19 Panasonic Corporation 符号化装置、復号装置およびこれらの方法
JP4871894B2 (ja) * 2007-03-02 2012-02-08 パナソニック株式会社 符号化装置、復号装置、符号化方法および復号方法
EP2159790B1 (en) * 2007-06-27 2019-11-13 NEC Corporation Audio encoding method, audio decoding method, audio encoding device, audio decoding device, program, and audio encoding/decoding system
US8085089B2 (en) * 2007-07-31 2011-12-27 Broadcom Corporation Method and system for polar modulation with discontinuous phase for RF transmitters with integrated amplitude shaping
US7853229B2 (en) * 2007-08-08 2010-12-14 Analog Devices, Inc. Methods and apparatus for calibration of automatic gain control in broadcast tuners
ATE521064T1 (de) * 2007-10-08 2011-09-15 Harman Becker Automotive Sys Verstärkung und spektralformenanpassung bei der verarbeitung von audiosignalen
US8515767B2 (en) * 2007-11-04 2013-08-20 Qualcomm Incorporated Technique for encoding/decoding of codebook indices for quantized MDCT spectrum in scalable speech and audio codecs
US20110035214A1 (en) * 2008-04-09 2011-02-10 Panasonic Corporation Encoding device and encoding method
EP2345027B1 (en) 2008-10-10 2018-04-18 Telefonaktiebolaget LM Ericsson (publ) Energy-conserving multi-channel audio coding and decoding
JP4439579B1 (ja) * 2008-12-24 2010-03-24 株式会社東芝 音質補正装置、音質補正方法及び音質補正用プログラム
US8391212B2 (en) * 2009-05-05 2013-03-05 Huawei Technologies Co., Ltd. System and method for frequency domain audio post-processing based on perceptual masking
ES2888804T3 (es) * 2009-10-15 2022-01-07 Voiceage Corp Conformación simultánea de ruido en el dominio del tiempo y el dominio de la frecuencia para transformaciones TDAC
AU2010309894B2 (en) * 2009-10-20 2014-03-13 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-mode audio codec and CELP coding adapted therefore
US9117458B2 (en) * 2009-11-12 2015-08-25 Lg Electronics Inc. Apparatus for processing an audio signal and method thereof
US9208792B2 (en) * 2010-08-17 2015-12-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for noise injection
JP5719941B2 (ja) * 2011-02-09 2015-05-20 テレフオンアクチーボラゲット エル エム エリクソン(パブル) オーディオ信号の効率的なエンコーディング/デコーディング

Also Published As

Publication number Publication date
EP2681734B1 (en) 2017-06-21
BR112013021164A2 (pt) 2018-06-26
RU2013144554A (ru) 2015-04-10
EP3244405A1 (en) 2017-11-15
TR201910075T4 (tr) 2019-08-21
DK3244405T3 (da) 2019-07-22
EP3244405B1 (en) 2019-06-19
US20210287688A1 (en) 2021-09-16
WO2012121637A1 (en) 2012-09-13
US20200005803A1 (en) 2020-01-02
CN103443856A (zh) 2013-12-11
US10460739B2 (en) 2019-10-29
BR112013021164B1 (pt) 2021-02-17
US20130339038A1 (en) 2013-12-19
CN105225669A (zh) 2016-01-06
US10121481B2 (en) 2018-11-06
US20170330573A1 (en) 2017-11-16
EP2681734A1 (en) 2014-01-08
CN103443856B (zh) 2015-09-09
EP2681734A4 (en) 2014-11-05
CN105225669B (zh) 2018-12-21
ES2744100T3 (es) 2020-02-21
PL3244405T3 (pl) 2019-12-31
PT2681734T (pt) 2017-07-31
PL2681734T3 (pl) 2017-12-29
US11056125B2 (en) 2021-07-06

Similar Documents

Publication Publication Date Title
ES2641315T3 (es) Corrección de ganancia post-cuantificación en codificación de audio
RU2404506C2 (ru) Устройство масштабируемого декодирования и устройство масштабируемого кодирования
US8612219B2 (en) SBR encoder with high frequency parameter bit estimating and limiting
ES2665766T3 (es) Mezclado de corrientes de datos de entrada y generación a partir de ahí de una corriente de datos de salida
ES2476992T3 (es) Codificador, descodificador, método de codificación y método de descodificaci�n
US10770078B2 (en) Adaptive gain-shape rate sharing
RU2643452C2 (ru) Устройство кодирования аудио/голоса, устройство декодирования аудио/голоса, способ кодирования аудио/голоса и способ декодирования аудио/голоса
ES2665599T3 (es) Codificador y descodificador de audio
BRPI0808705A2 (pt) Dispositivo de codificação, dispositivo de decodificação e seu método
BRPI0517949B1 (pt) dispositivo de conversão para converter um sinal dominante, método de conversão de um sinal dominante, e meio não transitório legível por computador
WO2006041055A1 (ja) スケーラブル符号化装置、スケーラブル復号装置及びスケーラブル符号化方法
WO2016013164A1 (ja) 音響信号符号化装置、音響信号復号装置、音響信号符号化方法および音響信号復号方法
JP5609591B2 (ja) オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム
JP2019144527A (ja) 音響信号符号化装置、音響信号復号装置、音響信号符号化方法および音響信号復号方法
RU2575389C2 (ru) Коррекция коэффициента усиления после квантования при кодировании аудио