ES2545623T3 - Compartición adaptativa de la velocidad de ganancia-forma - Google Patents

Compartición adaptativa de la velocidad de ganancia-forma Download PDF

Info

Publication number
ES2545623T3
ES2545623T3 ES11788925.3T ES11788925T ES2545623T3 ES 2545623 T3 ES2545623 T3 ES 2545623T3 ES 11788925 T ES11788925 T ES 11788925T ES 2545623 T3 ES2545623 T3 ES 2545623T3
Authority
ES
Spain
Prior art keywords
shape
gain
quantizer
signal
bit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES11788925.3T
Other languages
English (en)
Inventor
Erik Norvell
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Telefonaktiebolaget LM Ericsson AB
Original Assignee
Telefonaktiebolaget LM Ericsson AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=45063198&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=ES2545623(T3) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Telefonaktiebolaget LM Ericsson AB filed Critical Telefonaktiebolaget LM Ericsson AB
Application granted granted Critical
Publication of ES2545623T3 publication Critical patent/ES2545623T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/038Vector quantisation, e.g. TwinVQ audio

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

Método en un codificador de audio para asignar bits a un cuantificador de ajuste de ganancia y a un cuantificador de forma para su uso con el fin de codificar un vector de ganancia-forma, comprendiendo el método: - determinar (S1) una velocidad de bits actual y un valor de una primera propiedad de la señal, y en donde el método está caracterizado por - identificar (S2) una asignación de bits para el cuantificador de ajuste de ganancia y el cuantificador de forma para la velocidad de bits actual y la primera propiedad de la señal determinadas, usando información de una tabla que indica por lo menos una asignación de bits para el cuantificador de ajuste de ganancia y el cuantificador de forma de los cuales se ha establecido una correspondencia con una velocidad de bits y una primera propiedad de la señal, y - aplicar (S3) la asignación de bits identificada cuando se codifica el vector de ganancia-forma.

Description

5
10
15
20
25
30
35
40
45
50
55
E11788925
18-08-2015
DESCRIPCIÓN
Compartición adaptativa de la velocidad de ganancia-forma
Campo técnico
Realizaciones de la presente invención se refieren a métodos y dispositivos usados para la codificación y decodificación de audio, y en particular a cuantificadores de ganancia-forma de los codificadores y decodificadores de audio.
Antecedentes
Se espera que los servicios actuales de telecomunicaciones gestionen muchos tipos diferentes de señales de audio. Aunque el contenido de audio principal es señales de voz, existe un deseo por gestionar señales más generales, tales como música y mezclas de música y voz. Aunque la capacidad de las redes de telecomunicaciones está creciendo continuamente, sigue existiendo un gran interés en limitar el ancho de banda requerido por canal de comunicaciones. En las redes de comunicaciones móviles, unos anchos de banda de transmisión más pequeños para cada llamada producen un menor consumo de potencia tanto en el dispositivo móvil como en la estación base. Esto se traduce en un ahorro de energía y de costes para el operador de las comunicaciones móviles, mientras que el usuario final experimentará un aumento de la vida de la batería y un incremento del tiempo de habla. Además, con un consumo menor de ancho de banda por cada usuario, la red de telecomunicaciones móviles puede prestar servicio a un número mayor de usuarios en paralelo.
En la actualidad, la tecnología de compresión dominante para servicios de voz móviles es la Predicción Lineal con Excitación por Código (CELP), la cual logra una buena calidad de audio en cuanto a calidad de la voz con anchos de banda bajos. La misma se usa ampliamente en códecs desplegados, tales como la Velocidad Completa Mejorada GSM (GSM-EFR), la MultiVelocidad Adaptativa (AMR) y la Banda Ancha de AMR (AMR-WB). No obstante, para señales de audio generales, tales como música, la tecnología CELP presenta un rendimiento deficiente. Normalmente, estas señales se pueden representar mejor usando una codificación basada en transformadas a frecuencia, por ejemplo los códecs G.722.1 y G.719 de la ITU-T. No obstante, los códecs en el dominio de las transformadas trabajan generalmente con una velocidad de bits mayor que los códecs de voz. Existe un vacío entre los dominios de la voz y del audio en general en términos de codificación, y es deseable aumentar el rendimiento de los códecs en el dominio de las transformadas con velocidades de bits inferiores.
Los códecs en el dominio de las transformadas requieren una representación compacta de los coeficientes de transformadas en el dominio de la frecuencia. Normalmente, estas representaciones se basan en una cuantificación vectorial (VQ), en la que los coeficientes se codifican en grupos. Un ejemplo de cuantificación vectorial es la VQ de ganancia-forma. Este planteamiento aplica una normalización a los vectores antes de codificar los coeficientes individuales. Al factor de normalización y a los coeficientes normalizados se les hace referencia como ganancia y forma del vector, las cuales se pueden codificar por separado. La estructura de ganancia-forma tiene muchas ventajas. Al dividir la ganancia y la forma, el códec se puede adaptar fácilmente a niveles de entrada variables de las fuentes diseñando el cuantificador de ganancia. También resulta beneficioso desde la perspectiva de la percepción, en la que la ganancia y la forma pueden conllevar una importancia diferente en regiones de frecuencia diferentes. Finalmente, la división de ganancia-forma simplifica el diseño del cuantificador y lo hace menos complejo en términos de memoria y recursos computacionales en comparación con un cuantificador vectorial sin restricciones. En la figura 1, que ilustra un lado de codificador 40 y un lado de decodificador 50, puede observarse una vista general y funcional de un cuantificador de ganancia-forma para un vector según la técnica anterior. En la figura 1, un vector de datos de entrada arbitrario
imagen1100 de longitud
imagen2se alimenta a un esquema de cuantificación de ganancia-forma. En este caso, el factor de ganancia se define como la norma euclídea (norma 2) del vector, lo cual implica que los términos ganancia y norma se usan de forma intercambiable en la totalidad del presente documento. En primer lugar, un módulo 110 de cálculo de normas calcula una norma g que representa el tamaño total del vector. Habitualmente, se usa la norma euclídea
imagen3
imagen4
imagen4
imagen5
A continuación, la norma se cuantifica por medio de un cuantificador 120 de normas para formar
imagen6
y un índice de cuantificación
imagen4
que representa la norma cuantificada. El vector de entrada se escala usando 1/
imagen7
con el fin de formar un vector de forma normalizado imagen8, el cual a su vez se alimenta al cuantificador 130 de formas. El índice de cuantificador
imagen4
del cuantificador 130 de formas y el cuantificador 120 de normas se multiplexan por medio de un multiplexor 140 de flujos continuos de bits para su almacenamiento o transmisión a un decodificador 50. El decodificador 50 recupera los índices
imagen4
e
imagen9
a partir del flujo continuo de bits demultiplexado, y constituye un vector reconstruido
imagen10
190 recuperando el vector de forma cuantificado
imagen11
a partir del decodificador 150 de formas y la norma cuantificada a partir del decodificador 160 de normas, y escalando la forma cuantificada, con
imagen12
imagen4
imagen13
imagen14
imagen4
imagen15
imagen4
imagen16
imagen17180. Generalmente, el cuantificador de ganancia-forma actúa sobre vectores de longitud limitada, aunque se pueden usar para gestionar
imagen4
imagen18
imagen4
imagen19
10
15
20
25
30
35
40
45
50
E11788925
18-08-2015
secuencias más largas fraccionando en primer lugar la señal en vectores más cortos y aplicando los cuantificadores de ganancia-forma a cada vector. Normalmente, esta estructura se usa en códecs de audio basados en transformadas. La figura 2 ejemplifica un sistema de codificación basado en transformadas para cuantificación de ganancia y forma, para una secuencia de vectores según la técnica anterior. Debe observarse que la figura 1 ilustra un cuantificador de ganancia-forma para un vector, mientras que la cuantificación de ganancia-forma de la figura 2 se aplica en paralelo sobre una secuencia de vectores, en donde los vectores constituyen conjuntamente un espectro de frecuencia. La secuencia de los valores de ganancia (norma) constituye la envolvente espectral. El audio 200 de entrada se fracciona en primer lugar en segmentos de tiempo o tramas como preparación para la transformada 210 a frecuencia. Cada trama se transforma al dominio de la frecuencia para constituir un espectro en el dominio de la frecuencia . Esto se puede realizar usando cualquier transformada adecuada, tal como MDCT, DCT o DFT. La elección de la transformada puede depender de las características de la señal de entrada, de tal manera que con esa transformada se modelen adecuadamente propiedades importantes. También puede incluir consideraciones para otras etapas de procesado, en caso de que la transformada se reutilice para otras etapas de procesado, tales como un procesado estéreo. El espectro de frecuencia se fracciona en vectores de fila más cortos indicados como
imagen20. En este momento, cada vector representa los coeficientes de una banda de frecuencia
imagen4
imagen21. Desde una perspectiva de la percepción, resulta beneficioso fraccionar el espectro usando una estructura de bandas no uniforme que sigue la resolución frecuencial del sistema auditivo humano. Esto significa en general que se usan anchos de banda estrechos para frecuencias bajas, mientras que para frecuencias altas se usan anchos de banda mayores.
imagen4
A continuación, la norma de cada banda se calcula 230 tal como en la ecuación (1) con el fin de constituir una secuencia de valores de ganancia
imagen22que constituyen la envolvente espectral. A continuación, estos valores se imagen23cuantifican usando el cuantificador 240 de envolventes para constituir la envolvente cuantificada
imagen24. La cuantificación 240 de la envolvente se puede realizar usando cualquier técnica de cuantificación, por ejemplo, una cuantificación escalar diferencial, o cualquier esquema de cuantificación vectorial. Los coeficientes de la envolvente imagen4cuantificada
imagen25se usan para normalizar 250 los vectores de banda
imagen26con el fin de constituir los vectores de forma normalizados correspondientes
imagen27.
imagen28
imagen4
imagen29
Obsérvese que si la cuantificación de la envolvente es precisa, es decir,
imagen30, la norma de los vectores de forma normalizados será 1. Esto remite a una pre-normalización que se puede realizar en el decodificador.
imagen31
La secuencia de vectores de forma normalizados constituye la estructura fina del espectro. La importancia perceptiva de la estructura fina espectral varía con la frecuencia, aunque también puede depender de otras propiedades de la señal, tales como la señal envolvente espectral. Normalmente, los codificadores de transformada utilizan un modelo auditivo para determinar las partes importantes de la estructura fina y asignar los recursos disponibles a las partes más importantes. Frecuentemente, la envolvente espectral se usa como entrada para este modelo auditivo y la salida es típicamente una asignación de bits para dicha cada una de las bandas correspondientes a los coeficientes de la envolvente. En este caso, un algoritmo 270 de asignación de bits usa una envolvente cuantificada
imagen32
en combinación con un modelo auditivo interno para asignar un número de bits que, a su vez, son usados por el cuantificador 260 de la estructura fina. Los índices de la cuantificación de la envolvente
imagen4
y la cuantificación de la estructura fina
imagen33
son multiplexados por un multiplexor 280 de flujos continuos de bits para su almacenamiento o transmisión a un decodificador.
El decodificador demultiplexa, en el demultiplexor 285 de flujos continuos de bits, los índices del canal de comunicación con los medios almacenados, y reenvía los índices
imagen34
al decuantificador 265 de estructuras finas y los índices
imagen4
al decuantificador 245 de envolventes. La envolvente cuantificada
imagen35
se obtiene a partir de un decuantificador 245 de envolventes y se alimenta hacia una entidad 275 de asignación de bits en el decodificador, la cual genera la asignación de bits
imagen36
imagen37
imagen38
imagen39
imagen40
imagen41. El decuantificador 265 de estructuras finas usa los índices de estructura fina y la asignación de bits para producir los vectores de estructura fina cuantificados imagen42
imagen43. Se obtiene un espectro de frecuencia sintetizado
imagen44escalando, en una entidad 235 de conformación de envolventes, en la estructura fina cuantificada, con la envolvente cuantificada
imagen45
imagen4
imagen4
imagen4
imagen46
salida, sintetizada.
10
15
20
25
30
35
40
E11788925
18-08-2015
El rendimiento de la VQ de ganancia-forma para velocidades de bits diferentes depende de cómo interaccionan los cuantificadores de ganancia y de forma. En particular, algunos cuantificadores de forma tienen la capacidad de compensar pequeñas desviaciones de energía que pueden provenir de la cuantificación de ganancia. Se puede decir que otros cuantificadores de forma son cuantificadores de forma puros, los cuales no pueden representar ninguna información de ganancia y no pueden compensar en absoluto el error del cuantificador de ganancia. Para los cuantificadores de ganancia puros, el sistema de ganancia-forma se convierte en sensible a la compartición de bits entre ganancia y forma. Otra solución posible es asignar un factor adicional de ajuste de ganancia después de la cuantificación de la forma para ajustar la ganancia sobre la base de la forma sintetizada, tal como se muestra en la figura 3. La figura 3 muestra un sistema de codificación basado en transformadas según se ilustra en la figura 2 con el añadido del analizador 301 de ajuste de ganancia, para asignar un factor de ajuste de ganancia adicional imagen47respectivo
imagen48. Este se halla comparando la estructura fina cuantificada con la estructura fina
imagen49
imagen50
imagen4
El factor de ajuste de ganancia
imagen51se cuantifica para producir un índice
imagen52que se multiplexa junto con los índices de estructura fina
imagen53y los índices de envolvente
imagen54para su almacenamiento o transmisión a un decodificador.
Recuérdese que una cuantificación de envolvente perfecta daría
imagen55. Mediante el pre-ajuste de la ganancia de la estructura fina cuantificada, el factor de ajuste de ganancia también puede gestionar errores de cuantificación por la cuantificación de la envolvente. Esto se puede realizar usando la ecuación (1) para obtener un factor de ganancia de pre-ajuste
imagen56
imagen57
imagen58
imagen59
imagen60
lo cual da como resultado que
imagen61
El decodificador de la Figura 3 es similar al decodificador de la figura 2, aunque con el añadido de una unidad 302 de ajuste de ganancia que hace uso del índice de ajuste de ganancia
imagen62para reconstruir un factor de ajuste de ganancia cuantificado
imagen63. Esto se usa a su vez para crear una estructura fina ajustada en ganancia
imagen64.
imagen65
escalando la estructura fina ajustada por
ganancia, con la envolvente
imagen66
La transformada inversa se aplica al espectro de frecuencia sintetizado
para obtener la señal de salida sintetizada.
No obstante, con velocidades de bits bajas el ajuste de ganancia puede consumir demasiados bits lo cual reduce el rendimiento del cuantificador de forma y aporta un rendimiento total deficiente.
El documento US 2007/016414 da a conocer un método para codificación de señales, por ejemplo, un espectro de audio transformado, aprovechando las auto-similitudes de la señal. Esto se realiza mediante el uso de una pluralidad de libros de códigos, incluyendo vectores codificados previamente (es decir, una técnica de diccionario), vectores
imagen67
10
15
20
25
30
35
40
45
50
55
E11788925
18-08-2015
generados aleatoriamente o vectores de un libro de códigos predefinido. Estos vectores también se pueden transformar, tal como por compresión o descompresión dinámica, inversa, y varios de estos vectores se pueden combinar además para crear una coincidencia del vector objetivo. La codificación de estos vectores se puede llevar a cabo en un dominio normalizado por ganancia, es decir, usando el concepto bien conocido de codificación de ganancia-forma.
Sumario
Uno de los objetivos de realizaciones de la presente invención según se define en las reivindicaciones 1, 3, 5 y 10, es proporcionar una VQ mejorada de ganancia-forma.
Esto se logra determinando un número de bits que se asignarán a un cuantificador de ajuste de ganancia y de forma para una pluralidad de combinaciones de una velocidad de bits actual y una primera propiedad de la señal. El número de bits determinado y asignado para el cuantificador de ajuste de ganancia y de forma debería proporcionar un resultado para la velocidad de bits y la propiedad de la señal en cuestión que es mejor que el correspondiente con el uso de un esquema de asignación fijo individual. Esto se puede lograr mediante la obtención de la asignación de bits usando un promedio de asignaciones de bits óptimas para un conjunto de datos de entrenamiento. De este modo, calculando previamente un número de bits para los cuantificadores de ajuste de ganancia y de forma para una pluralidad de combinaciones de la velocidad de bits y una primera propiedad de la señal, y creando una tabla que indique el número de bits a asignar para los cuantificadores de ajuste de ganancia y de forma para una pluralidad de combinaciones de la velocidad de bits y una primera propiedad de la señal. De esta manera, la tabla se puede usar para obtener una asignación de bits mejorada.
Según un primer aspecto de realizaciones de la presente invención, se proporciona un método en un codificador de audio para asignar bits a un cuantificador de ajuste de ganancia y a un cuantificador de forma con el fin de usarse para codificar un vector de ganancia-forma. En el método, se determinan una velocidad de bits actual y un valor de una primera propiedad de la señal. Se identifica una asignación de bits para el cuantificador de ajuste de ganancia y el cuantificador de forma para la velocidad de bits actual determinada y la primera propiedad de la señal, usando información de una tabla que indica por lo menos una asignación de bits para el cuantificador de ajuste de ganancia y el cuantificador de forma de los cuales se ha establecido una correspondencia con una velocidad de bits y una primera propiedad de la señal. Además, la asignación de bits identificada se aplica cuando se codifica el vector de ganancia-forma.
De acuerdo con un segundo aspecto de realizaciones de la presente invención, se proporciona un método, en un decodificador de audio, para asignar bits a un decuantificador de ajuste de ganancia y un decuantificador de forma con el fin de usarse para decodificar un vector de ganancia-forma. En el método, se determina una velocidad de bits actual y un valor de una primera propiedad de la señal. Se identifica una asignación de bits para el cuantificador de ajuste de ganancia y el cuantificador de forma para la velocidad de bits actual determinada y la primera propiedad de la señal, usando información de una tabla que indica por lo menos una asignación de bits para el cuantificador de ajuste de ganancia y el cuantificador de forma de los cuales se ha establecido una correspondencia con una velocidad de bits y una primera propiedad de la señal. Además, la asignación de bits identificada se aplica cuando se decodifica el vector de ganancia-forma.
Según un tercer aspecto de realizaciones de la presente invención, se proporciona un codificador de audio para asignar bits a un cuantificador de ajuste de ganancia y un cuantificador de forma con el fin de usarse para codificar un vector de ganancia-forma. El codificador comprende una entidad de compartición adaptativa de bits configurada para determinar una velocidad de bits actual y un valor de una primera propiedad de la señal. Además, la entidad de compartición adaptativa de bits está configurada para identificar una asignación de bits para el cuantificador de ajuste de ganancia y el cuantificador de forma para la velocidad de bits actual determinada y la primera propiedad de la señal, usando información de una tabla que indica por lo menos una asignación de bits para el cuantificador de ajuste de ganancia y el cuantificador de forma de los cuales se ha establecido una correspondencia con una velocidad de bits y una primera propiedad de la señal. El codificador comprende además un cuantificador de ajuste de ganancia y de forma que está configurado para aplicar la asignación de bits identificada cuando se codifica el vector de ganancia-forma.
Según un cuarto aspecto de realizaciones de la presente invención, se proporciona un decodificador de audio para asignar bits a un decuantificador de ajuste de ganancia y un decuantificador de forma con el fin de usarse para decodificar un vector de ganancia-forma. El decodificador comprende una entidad de compartición adaptativa de bits configurada para determinar una velocidad de bits actual y un valor de una primera propiedad de la señal, para usar información de una tabla que indica por lo menos una asignación de bits para el decuantificador de ajuste de ganancia y el decuantificador de forma de los cuales se ha establecido una correspondencia como una velocidad de bits y una primera propiedad de la señal, y para identificar una asignación de bits para el decuantificador de ajuste de ganancia y el decuantificador de forma para la velocidad de bits actual determinada y la primera propiedad de la señal. El decodificador comprende además un decuantificador de ajuste de ganancia y de forma configurado para aplicar la asignación de bits identificada cuando se decodifica el vector de ganancia-forma.
10
15
20
25
30
35
40
45
50
E11788925
18-08-2015
Según otros aspectos de realizaciones de la presente invención, se proporciona un dispositivo móvil. Según un aspecto, el dispositivo móvil comprende un codificador de acuerdo con las realizaciones, y según otro aspecto el dispositivo móvil comprende un decodificador de acuerdo con las realizaciones descritas en la presente.
Una ventaja que se obtiene con realizaciones de la presente invención es que las realizaciones son particularmente beneficiosas para sistemas de VQ de ganancia-forma en los que la VQ de forma no puede representar energía y, por tanto, no compensa el error de cuantificación del cuantificador de ganancia.
Otra ventaja es que la asignación de bits de acuerdo con realizaciones de la presente invención obtiene un mejor resultado global de VQ de ganancia-forma para velocidades de bits diferentes.
Breve descripción de los dibujos
La Fig. 1 es un esquema de ejemplo de cuantificación vectorial de ganancia-forma según la técnica anterior.
La Fig. 2 es un esquema de ejemplo de codificación y decodificación en el dominio de las transformadas, basado en una cuantificación vectorial de ganancia-forma según la técnica anterior.
La Fig. 3 es un esquema de ejemplo de codificación y decodificación en el dominio de las transformadas, basado en una cuantificación vectorial de ganancia-forma, que hace uso de un parámetro de ajuste de ganancia codificado después de la cuantificación de forma según la técnica anterior.
La Fig. 4a muestra un diagrama de flujo de un método en un decodificador según realizaciones de la presente invención y la 4b muestra un diagrama de flujo de un método en un decodificador según realizaciones de la presente invención.
La Fig. 4c y la Fig. 4d ilustran un esquema de codificación y decodificación en el dominio de las transformadas, basado en la VQ de ganancia-forma, con un algoritmo de compartición adaptativa de bits según realizaciones de la presente invención.
La Fig. 5 muestra una tabla de consulta de ejemplo la cual implementa un algoritmo de compartición de bits sobre la base del número de impulsos y el ancho de banda.
La Fig. 6 muestra un ejemplo de un esquema de VQ de ganancia-forma con una configuración de múltiples libros de códigos para el cuantificador y el decuantificador de forma.
La Fig. 7 muestra un ejemplo de cómo puede obtenerse una tabla de asignación de bits de ganancia usando errores al cuadrado promediados, evaluados entre una entrada y un vector sintetizado con la utilización de todas las combinaciones consideradas de bits de ganancia y números de impulsos. Una sombra más oscura indica una mayor distorsión promedio para la combinación particular de bits de ganancia/impulsos. La línea negra gruesa muestra un camino voraz a través de la matriz para cada ancho de banda considerado, que decide, en cada punto, si los recursos se consumen mejor en bits de ganancia o en impulsos adicionales. La línea negra gruesa se corresponde con la tabla de consulta de la Fig. 6.
La Fig. 8 ilustra que un codificador y un decodificador de acuerdo con realizaciones de la presente invención se implementan en un terminal móvil.
Descripción técnica detallada
Por consiguiente, la presente invención se refiere a una solución para asignar bits a una cuantificación de ajuste de ganancia y una cuantificación de forma, a las que se hace referencia como cuantificación de ajuste de ganancia y de forma. Esto se logra usando una tabla que indica una asignación de bits para cuantificadores de ajuste de ganancia y de forma para un número de combinaciones de velocidad de bits y una primera propiedad de la señal. La velocidad de bits se determina y la primera propiedad de la señal o bien es definida previamente por el codificador o bien se determina. A continuación, se determina la asignación de bits para los cuantificadores de ajuste de ganancia y de forma usando dicha tabla sobre la base de la velocidad de bits determinada y la primera propiedad de la señal. La primera propiedad de la señal es un ancho de banda de acuerdo con una primera realización o la longitud de la señal de acuerdo con una segunda realización según se describe posteriormente.
Volviendo a continuación a la figura 4a se muestra un diagrama de flujo que ilustra un método en un codificador de acuerdo con la presente invención. En el método, se determina en S1 una velocidad de bits actual y un valor de una primera propiedad de la señal. A continuación, se identifica S2 una asignación de bits usando una tabla que comprende información que indica por lo menos una asignación de bits para el cuantificador de ajuste de ganancia y el cuantificador de forma de los cuales se ha establecido una correspondencia con una velocidad de bits y una primera propiedad de la señal, y para el cuantificador de ajuste de ganancia y el cuantificador de forma para la velocidad de bits actual determinada y la primera propiedad de la señal. En este momento, la asignación de bits identificada se puede aplicar S3 cuando se codifica el vector de ganancia-forma.
E11788925
18-08-2015
En la figura 4b, se muestra de acuerdo con la presente invención un diagrama de flujo que ilustra un método, en un decodificador, para asignar bits a un decuantificador de ajuste de ganancia y un decuantificador de forma con el fin de usarse para decodificar un vector de ganancia-forma. En el método, se determina en S4 una velocidad de bits actual y un valor de una primera propiedad de la señal. Se usa S5 información de una tabla para identificar una asignación de bits para el decuantificador de ajuste de ganancia y de forma para la velocidad de bits actual determinada y la primera propiedad de la señal, en donde la tabla indica por lo menos una asignación de bits para el decuantificador de ajuste de ganancia y el decuantificador de forma de los cuales se ha establecido una correspondencia con una velocidad de bits y una primera propiedad de la señal. Además, la asignación de bits identificada se aplica S6 cuando se decodifica el vector de ganancia-forma.
La primera realización de la presente invención se describe en el contexto de un sistema de codificador y decodificador de audio en el dominio de las transformadas, usando un cuantificador de forma basado en impulsos según se muestra en las figuras 4c y 4d. Por tanto, la primera realización se ejemplifica mediante lo siguiente.
En un transformador 410 de frecuencia del codificador, el audio de entrada se extrae en tramas usando un solapamiento del 50% y con un enventanado con una ventana sinusoidal simétrica. A continuación, cada trama enventanada se transforma en un espectro de MDCT imagen68. El espectro se fracciona en subbandas para su procesado, en donde los anchos de las subbandas son no uniformes. Los coeficientes espectrales de la trama
imagen69perteneciente a la banda
imagen70se indican como
imagen71y tienen el ancho de banda
imagen72.
En la primera realización, se supone que la primera propiedad de la señal, es decir, los anchos de banda
imagen73, es fija y conocida tanto en el codificador como en el decodificador. No obstante, también es posible considerar soluciones en las que el fraccionamiento de la banda es variable, en función de la velocidad de bits total del códec o adaptada a la señal de entrada. Una manera de adaptar el fraccionamiento de la banda sobre la base de la señal de entrada es incrementar la resolución de la banda para regiones de alta energía o para regiones que se consideran importantes desde el punto de vista de la percepción. Si la resolución del ancho de banda depende de la velocidad de bits, la resolución de la banda aumentaría típicamente con la velocidad de bits.
Puesto que la mayoría de etapas del codificador y el decodificador se pueden describir dentro de una trama; se omite el índice de trama
imagen74y se usa la notación
imagen75420. Preferentemente, los anchos de banda deberían aumentar con la frecuencia de manera que se ajusten a la resolución frecuencial del sistema auditivo humano. El valor de raíz cuadrática media (RMS) de cada banda
imagen76se usa como factor de normalización y se indica como
imagen77.
imagen78se determina en el módulo 430 de cálculo de envolventes.
imagen79
imagen4
El valor de RMS puede interpretarse como el valor de energía por coeficiente. La secuencia de
imagen80para constituye la envolvente del espectro de MDCT, donde
imagen81
imagen82indica el número de bandas. Seguidamente la secuencia se cuantifica con el fin de ser transmitida al decodificador. Para garantizar que la normalización realizada en la entidad 450 de normalización de envolventes se puede invertir en el decodificador, la envolvente cuantificada
imagen83
se obtiene a partir del cuantificador 440 de envolventes. En esta realización ejemplificativa, los coeficientes de la envolvente se cuantifican escalarmente en el dominio logarítmico usando un tamaño del paso de 3 dB y los índices del cuantificador se codifican diferencialmente usando una codificación Huffman. Los coeficientes de la envolvente codificados se usan para producir los vectores de forma correspondientes a cada banda imagen84.
imagen85
imagen86
imagen87
imagen88
imagen89
La envolvente cuantificada
imagen90se introduce en el modelo de percepción para obtener una asignación de bits mediante un asignador 470 de bits. Para cada una de las bandas, los bits asignados serán compartidos entre un cuantificador de forma y la cuantificación de un factor de ajuste de ganancia
imagen91
imagen92. El número de bits asignados al cuantificador de forma y a cuantificador de ajuste de ganancia será decidido por una entidad 403 de compartición adaptativa de bits.
imagen93
El factor de ajuste de ganancia determinado por una entidad 401 de ajuste de ganancia puede compensar tanto el error de cuantificación de la envolvente como el error de cuantificación de forma. Obsérvese que la compensación 10
15
20
25
30
35
40
45
50
E11788925
18-08-2015
imagen94
del error de cuantificación de la envolvente presupone que el vector cuantificado de la estructura fina se ha normalizado para presentar
En el momento de la determinación de la compartición de bits entre el vector de forma imagen95
imagen96y el factor de ajuste de ganancia
imagen97no se conoce la forma de síntesis
. En esta realización ejemplificativa, el cuantificador de forma es un esquema de codificación por impulsos que produce vectores de forma de síntesis con imagen98, es decir, no puede representar ninguna desviación de energía proveniente del error de cuantificación de ganancia. La compartición de bits se decide usando una tabla 404 almacenada en una base de datos que comprende una asignación de bits para el cuantificador de ajuste de ganancia y el cuantificador de forma para varias combinaciones de velocidad de bits y una propiedad de la señal. En esta realización, la primera propiedad de la señal es el ancho de banda y esto es conocido por el codificador y el decodificador. Las velocidades de bits que se asignarán para el cuantificador de ajuste de ganancia y el cuantificador de forma se pueden determinar llevando a cabo las siguientes etapas:
1. Se estima el número de impulsos en la forma de síntesis
imagen99a partir de la velocidad de bits
imagen100de la banda. Debería indicarse que la velocidad de bits de la banda es la velocidad de bits total que se va a compartir entre la cuantificación de ajuste de ganancia y la cuantificación de forma. Esto se puede realizar restando el número máximo de bits usados para el ajuste de ganancia
imagen101y utilizando una tabla de consulta para hallar el número de impulsos
imagen102para la velocidad obtenida imagen103. La relación entre la velocidad de bits y el número de impulsos viene dada por el cuantificador de forma utilizado. Como ejemplo, si un impulso requiere un número fijo de bits
imagen104, entonces la relación entre la velocidad de bits y los impulsos se puede escribir como
imagen105
en donde
imagen106indica un redondeo por defecto al valor entero más próximo. En general, si se usan esquemas de indexación eficientes para los impulsos, puede que no resulte posible mostrar el número de impulsos por bit con una relación proporcional como en la ecuación (6). Usando
imagen107en la consulta, la solución se inclinará hacia el uso de más bits para la forma que para el ajuste de ganancia, ya que esto se consideró como ventajoso desde la perspectiva de la percepción.
2. Usar el número de impulsos para hallar la velocidad de bits deseada
imagen108para cuantificar
imagen109. Este valor se recupera usando el número de impulsos
imagen110y el ancho de banda de la banda actual
imagen111en una tabla de consulta de la base de datos 404. Esta tabla contiene asignaciones de bits óptimas y promediadas, para combinaciones de parejas
que se han obtenido ejecutando el esquema del cuantificador sobre datos de audio pertinentes. Eso implica que se calcula una distribución óptima de bits para combinaciones diferentes de velocidad de bits y una propiedad de la señal. En esta realización, la velocidad de bits se traduce en un número de impulsos y la propiedad de la señal se corresponde con el ancho de banda. En la figura 5 se muestra gráficamente un ejemplo de las combinaciones de parejas
en la tabla de consulta. Tablas para anchos de banda diferentes (BW=8, BW=16, BW=24, BW=32), lo cual incluye el número de impulsos (que se determina basándose en la velocidad de bits R(b)), a partir de los cuales se determina la velocidad de bits para cuantificar G(b). Para el caso en el que se asignan 0 bits para la ganancia, se puede usar un planteamiento de ajuste de ganancia de cero bits.
3. La asignación de bits para el cuantificador de forma se obtiene restando los bits de ajuste de ganancia con respecto al balance de bits para la banda.
imagen112
imagen113
imagen114
Después de decidir las velocidades de bits
imagen115y imagen116, el cuantificador de forma se aplica al vector de forma
imagen117, y se obtiene la forma sintetizada
imagen118en el proceso de cuantificación. A continuación, se obtiene el factor de ajuste de ganancia según se ha descrito en la ecuación (3). El factor de ajuste de ganancia se cuantifica usando un cuantificador escalar para obtener un índice que se puede usar con el fin de producir el ajuste de ganancia cuantificado
imagen119. Los índices de los cuantificadores de envolvente
imagen120, del cuantificador de estructura fina
imagen121
y del cuantificador de ajuste de ganancia
imagen122
se multiplexan para ser transmitidos a un decodificador o para su almacenamiento.
Para obtener la tabla de consulta usada en la etapa 2) anterior, puede usarse el siguiente procedimiento. En primer lugar, se pueden obtener datos de entrenamiento ejecutando las etapas de análisis antes descritas para extraer vectores de forma
imagen123
de la misma longitud, a partir de señales de voz y de audio para cuyo uso está destinado el códec. El vector de forma se puede cuantificar usando todos los impulsos en el intervalo considerado, y el factor de ajuste de ganancia se puede cuantificar usando todos los bits en el intervalo considerado. Se puede generar una forma de síntesis ajustada por ganancia
imagen124
imagen125para todas las combinaciones de impulsos
imagen126y bits de ganancia imagen127.
5
10
15
20
25
30
35
40
45
E11788925
18-08-2015
imagen128
La distancia de error al cuadrado (distorsión) para cada una de estas combinaciones se puede expresar en una matriz tridimensional
imagen129
Se puede evaluar una distorsión promedio por cada combinación
imagen130
En la figura 7 se ilustra una matriz de distorsión promedio
imagen131de ejemplo, en donde se muestra una matriz de distorsión independiente para todos los anchos de banda usados en el códec. La intensidad de la matriz indica la distorsión promedio, de tal manera que una sombra de gris más clara se corresponde con una distorsión promedio menor. Comenzando en
imagen132se puede hallar un camino a través de la matriz usando un planteamiento de voracidad en el que cada paso se escogió para aumentar al máximo la reducción de la distorsión promedio. Es decir, en cada iteración se pueden considerar las posiciones
imagen133
imagen134
imagen135 imagen136y
y la selección se puede realizar basándose en la reducción de distorsión mayor o bien para
imagen137o bien para
imagen138.
imagen139
imagen140
imagen141
El proceso se puede repetir para todas las longitudes de vector (anchos de banda) usadas en el códec.
El decodificador según la primera realización demultiplexa, por medio de un demultiplexor 485 de flujos continuos de bits, los índices del flujo continuo de bits y reenvía los índices pertinentes a cada módulo 445, 465 de decodificación. imagen142En primer, el decuantificador 445 de envolventes obtiene la envolvente cuantificada
imagen143usando los índices de envolvente
imagen144. A continuación, el asignador 475 de bits obtiene la asignación de bits
imagen145usando
imagen146. Las etapas del codificador para obtener el número de impulsos por cada banda y hallar las
imagen147y
imagen148correspondientes se repiten usando una entidad 405 de compartición adaptativa de bits y una tabla 406 almacenada en una base de datos. La tabla está asociada a la entidad de compartición adaptativa de bits lo cual implica que la tabla se puede localizar o bien dentro o bien fuera de la entidad de compartición de bits. Usando las velocidades de bits designadas junto con el índice de cuantificador de estructuras finas
imagen149y el índice de ajuste de ganancia
imagen150, una entidad 402 de ajuste de ganancia y una entidad 435 de conformación de envolventes obtienen la forma sintetizada
imagen151
y el factor de ajuste de ganancia cuantificado
imagen152
. La síntesis de subbanda
imagen153
se obtiene a partir del producto del coeficiente de envolvente, el ajuste de ganancia y los valores de forma:
imagen154
La unión de los vectores sintetizados
imagen155constituye el aspecto sintetizado
imagen156
el cual se procesa adicionalmente usando la transformada 415 de MDCT inversa, con un enventanado que se realiza con la ventana de seno simétrica y se suma a la síntesis de salida utilizando la estrategia de suma con solapamiento para proporcionar audio sintetizado 490.
En la segunda realización, se usa un banco de filtros de QMF para dividir la señal en diferentes subbandas. En este caso, cada subbanda reproduce una representación diezmada en el dominio del tiempo, de cada banda. Cada vector en el dominio del tiempo se trata como un vector que se cuantifica usando una estrategia de VQ de gananciaforma. El cuantificador de forma se implementa usando un cuantificador vectorial sin restricciones con múltiples libros de códigos, en donde se almacenan libros de códigos de tamaños diferentes CB(n). Cuanto mayor sea el número de bits asignado a la forma, mayor será el tamaño de libro de códigos. Por ejemplo, si se asignan
imagen157
bits de forma, se utilizará CB(n+1) lo cual es un libro de códigos de tamaño 2n . Los libros de códigos CB(n) se han encontrado ejecutando un algoritmo de entrenamiento sobre un conjunto pertinente de vectores de forma de datos de entrenamiento para cada número de bits, por ejemplo, utilizando el Algoritmo de Max-Lloyd Generalizado, ampliamente conocido. La densidad del centroide (punto de reconstrucción) aumenta con el tamaño y, por tanto, proporciona una distorsión reducida para una velocidad de bits aumentada. Todas las entradas del VQ de forma se han normalizado a RMS = 1, lo cual significa que la VQ de forma no puede representar ninguna desviación de energía. En la figura 6 se muestra una ilustración de un esquema de cuantificación de ganancia-forma de ejemplo que usa una VQ de forma con múltiples libros de códigos. Desde una perspectiva general, la segunda realización se puede describir tal como se muestra en las figuras 4c y 4d, aunque en la tabla almacenada en la base de datos DB se obtiene ahora utilizando la VQ con múltiples libros de códigos para garantizar un funcionamiento eficiente para esta configuración.
imagen158
imagen159
10
15
20
25
30
35
40
45
50
55
E11788925
18-08-2015
El codificador de la segunda realización aplica el banco de filtros de QMF para obtener las señales de subbanda en el dominio del tiempo
imagen160. Obsérvese que en este momento la subbanda se representa por medio de una señal en el dominio del tiempo, diezmada críticamente, y que se corresponde con la banda imagen161. Se calculan los valores de RMS de cada señal de subbanda y las señales de subbanda se normalizan. La envolvente
imagen162, la envolvente cuantificada
imagen163, la asignación de bits de subbanda
imagen164y los vectores de forma normalizados
imagen165se adquieren como en la realización 1. La longitud de la señal de subbanda se indica como
imagen166, lo cual es igual al número de muestras de la señal de subbanda o la longitud del vector
imagen167(véase
imagen168en la realización 1). A continuación, se obtiene la compartición de bits
imagen169utilizando una tabla de consulta que se define para la velocidad
imagen170y la longitud de señal
imagen171. La tabla de consulta se ha obtenido de una manera similar a la de la realización 1. Usando las velocidades de bits obtenidas, se cuantifican los vectores de forma y de ajuste de ganancia. En particular, la cuantificación de forma se realiza seleccionando un libro de códigos en función del número de bits disponibles
y hallando la entrada del libro de códigos con la mínima distancia al cuadrado con respecto al vector de forma . En la segunda realización, la entrada se halla mediante una búsqueda exhaustiva, es decir, calculando la distancia al cuadrado a todos los vectores y seleccionando la entrada que proporciona la distancia más pequeña.
Los índices del cuantificador de envolvente, del cuantificador de forma y del cuantificador de ajuste de ganancia se multiplexan para su transmisión a un decodificador o para su almacenamiento.
El decodificador de la segunda realización demultiplexa los índices del flujo continuo de bits y reenvía los índices pertinentes a cada módulo de decodificación. La envolvente cuantificada
imagen172y la asignación de bits
imagen173se obtienen como en la realización 1. Usando una tabla de consulta para compartición de bits que se corresponde con imagen174 imagen175la utilizada en el codificador, se obtienen las velocidades de bits
imagen176y
imagen177, y junto con los índices del cuantificador se obtienen la forma sintetizada
imagen178y el ajuste de ganancia
imagen179. La síntesis de subbanda temporal
imagen180se genera usando la ecuación (8). La trama de audio de salida, sintetizada, se genera aplicando el banco de filtros de QMF de síntesis a las subbandas sintetizadas.
Por consiguiente, en referencia a la figura 4c se proporciona un codificador para asignar bits a un cuantificador de ajuste de ganancia y a un cuantificador de forma con el fin de usarlo para codificar un vector de ganancia-forma. El codificador comprende una entidad 403 de compartición adaptativa de bits configurada para determinar una velocidad de bits actual y un valor de una primera propiedad de la señal, para usar información de una tabla 404 que indica por lo menos una asignación de bits para el cuantificador de ajuste de ganancia y el cuantificador de forma de los cuales se ha establecido una correspondencia con una velocidad de bits y una primera propiedad de la señal, para identificar, usando dicha tabla 404, una asignación de bits para el cuantificador de ajuste de ganancia y el cuantificador de forma para la velocidad de bits actual determinada y la primera propiedad de la señal, y un cuantificador 401 de ajuste de ganancia al que se hace referencia como entidad de ajuste de ganancia y un cuantificador de forma al que se hace referencia como cuantificador de estructuras finas configuradas para aplicar la asignación de bits identificada cuando se codifica el vector de ganancia-forma. Debería indicarse que la tabla 404 está asociada a la entidad 403 de compartición adaptativa de bits lo cual implica que la tabla se puede situar o bien dentro o bien fuera de la entidad de compartición de bits.
Se proporciona un decodificador para asignar bits a un decuantificador de ajuste de ganancia y un decuantificador de forma con vistas a usarlo para decodificar un vector de ganancia-forma. El decodificador comprende una entidad 405 de compartición adaptativa de bits configurada para determinar una velocidad de bits actual y un valor de una primera propiedad de la señal, y para usar información de una tabla 406 que indica por lo menos una asignación de bits para el decuantificador de ajuste de ganancia y el decuantificador de forma de los cuales se ha establecido una correspondencia con una velocidad de bits y una primera propiedad de la señal. La entidad 405 de compartición adaptativa de bits está configurada además para identificar, usando dicha tabla 406, una asignación de bits para el decuantificador de ajuste de ganancia y el decuantificador de forma para la velocidad de bits actual determinada y la primera propiedad de la señal, y el decodificador comprende además un decuantificador de ajuste de ganancia al que se hace referencia también como entidad de ajuste de ganancia y un decuantificador de forma al que se hace referencia también como decuantificador de estructuras finas, respectivamente configurados para aplicar la asignación de bits identificada cuando se decodifica el vector de ganancia-forma. Debería indicarse que la tabla 406 está asociada a la entidad 405 de compartición adaptativa de bits lo cual implica que la tabla puede estar situada o bien dentro o bien fuera de la entidad de compartición de bits.
Debería indicarse que las entidades del codificador 810 y el decodificador 820, respectivamente, se pueden implementar por medio de un procesador 815, 825 configurado para procesar partes de software que proporcionan la funcionalidad de las entidades según se ilustra en la figura 8. Las partes de software se almacenan en una memoria 817, 827 y se recuperan de la memoria cuando se procesan.
De acuerdo con otro aspecto de la presente invención, se proporciona un dispositivo móvil 800 que comprende el codificador 810 y/o un decodificador 820 de acuerdo con realizaciones. Debe indicarse que el codificador y el decodificador de las realizaciones también se pueden implementar en un nodo de red.
imagen181
imagen182
imagen183

Claims (15)

  1. 5
    10
    15
    20
    25
    30
    35
    40
    45
    50
    REIVINDICACIONES
    1. Método en un codificador de audio para asignar bits a un cuantificador de ajuste de ganancia y a un cuantificador de forma para su uso con el fin de codificar un vector de ganancia-forma, comprendiendo el método:
    -determinar (S1) una velocidad de bits actual y un valor de una primera propiedad de la señal, y en donde el método está caracterizado por
    -identificar (S2) una asignación de bits para el cuantificador de ajuste de ganancia y el cuantificador de forma para la velocidad de bits actual y la primera propiedad de la señal determinadas, usando información de una tabla que indica por lo menos una asignación de bits para el cuantificador de ajuste de ganancia y el cuantificador de forma de los cuales se ha establecido una correspondencia con una velocidad de bits y una primera propiedad de la señal, y
    -aplicar (S3) la asignación de bits identificada cuando se codifica el vector de ganancia-forma.
  2. 2.
    Método según la reivindicación 1, en el que la primera propiedad de la señal es el ancho de banda.
  3. 3.
    Método en un decodificador de audio para asignar bits a un decuantificador de ajuste de ganancia y a un decuantificador de forma para su uso con el fin de decodificar un vector de ganancia-forma, comprendiendo el método:
    -determinar (S4) una velocidad de bits actual y un valor de una primera propiedad de la señal, y en donde el método está caracterizado por
    -identificar (S5) una asignación de bits para el cuantificador de ajuste de ganancia y el cuantificador de forma para la velocidad de bits actual y la primera propiedad de la señal determinadas, usando información de una tabla que indica por lo menos una asignación de bits para el cuantificador de ajuste de ganancia y el cuantificador de forma de los cuales se ha establecido una correspondencia con una velocidad de bits y una primera propiedad de la señal, y
    -aplicar (S6) la asignación de bits identificada cuando se decodifica el vector de ganancia-forma.
  4. 4.
    Método según la reivindicación 3, en el que la primera propiedad de la señal es el ancho de banda.
  5. 5.
    Codificador de audio para asignar bits a un cuantificador de ajuste de ganancia y a un cuantificador de forma para su uso con el fin de codificar un vector de ganancia-forma, comprendiendo el codificador una entidad 403 de compartición adaptativa de bits configurada para determinar una velocidad de bits actual y un valor de una primera propiedad de la señal, caracterizado por que la entidad 403 de compartición adaptativa de bits está configurada para identificar una asignación de bits para el cuantificador de ajuste de ganancia y el cuantificador de forma para la velocidad de bits actual y la primera propiedad de la señal determinadas, usando información de una tabla 404 que indica por lo menos una asignación de bits para el cuantificador de ajuste de ganancia y el cuantificador de forma de los cuales se ha establecido una correspondencia con una velocidad de bits y una primera propiedad de la señal, y un ajuste de ganancia, comprendiendo además el codificador un cuantificador 403 de forma configurado para aplicar la asignación de bits identificada cuando se codifica el vector de ganancia-forma.
  6. 6.
    Codificador de audio según la reivindicación 5, en el que la primera propiedad de la señal es el ancho de banda.
  7. 7.
    Codificador de audio según la reivindicación 5, en el que la primera propiedad de la señal es la longitud de la señal.
  8. 8.
    Codificador de audio según la reivindicación 6, en el que el ancho de banda es fijo y conocido en el codificador.
  9. 9.
    Codificador de audio según cualquiera de las reivindicaciones 5 a 8, en el que el codificador es un codificador de audio en el dominio de las transformadas.
  10. 10.
    Decodificador de audio para asignar bits a un decuantificador de ajuste de ganancia y un decuantificador de forma para su uso con el fin de decodificar un vector de ganancia-forma, comprendiendo el decodificador una entidad 505 de compartición adaptativa de bits configurada para determinar una velocidad de bits actual y un valor de una primera propiedad de la señal, caracterizado por que la entidad 505 de compartición adaptativa de bits está configurada para usar información de una tabla 406 que indica por lo menos una asignación de bits para el decuantificador de ajuste de ganancia y el decuantificador de forma de los cuales se ha establecido una correspondencia con una velocidad de bits y una primera propiedad de la señal, y para identificar, usando dicha tabla 406, una asignación de bits para el decuantificador de ajuste de ganancia y el decuantificador de forma para la velocidad de bits actual y la primera propiedad de la señal determinadas, y un ajuste de ganancia, y el decodificador comprende además un decuantificador 405 de forma configurado para aplicar la asignación de bits identificada cuando se decodifica el vector de ganancia-forma.
    11
  11. 11.
    Decodificador de audio según la reivindicación 10, en el que la primera propiedad de la señal es el ancho de banda.
  12. 12.
    Decodificador de audio según la reivindicación 10, en el que la primera propiedad de la señal es la longitud de la señal.
    5 13. Decodificador de audio según la reivindicación 11, en el que el ancho de banda es fijo y conocido en el codificador.
  13. 14. Decodificador de audio según cualquiera de las reivindicaciones 10 a 13, en el que el decodificador es un decodificador de audio en el dominio de las transformadas.
  14. 15. Dispositivo móvil que comprende un codificador de audio según cualquiera de las reivindicaciones 5 a 9. 10 16. Dispositivo móvil que comprende un decodificador de audio según cualquiera de las reivindicaciones 10 a
  15. 14.
    12
ES11788925.3T 2011-04-15 2011-10-17 Compartición adaptativa de la velocidad de ganancia-forma Active ES2545623T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201161475767P 2011-04-15 2011-04-15
US201161475767P 2011-04-15
PCT/SE2011/051238 WO2012141635A1 (en) 2011-04-15 2011-10-17 Adaptive gain-shape rate sharing

Publications (1)

Publication Number Publication Date
ES2545623T3 true ES2545623T3 (es) 2015-09-14

Family

ID=45063198

Family Applications (2)

Application Number Title Priority Date Filing Date
ES11788925.3T Active ES2545623T3 (es) 2011-04-15 2011-10-17 Compartición adaptativa de la velocidad de ganancia-forma
ES15162742T Active ES2741559T3 (es) 2011-04-15 2011-10-17 Compartición adaptativa de la velocidad de ganancia-forma

Family Applications After (1)

Application Number Title Priority Date Filing Date
ES15162742T Active ES2741559T3 (es) 2011-04-15 2011-10-17 Compartición adaptativa de la velocidad de ganancia-forma

Country Status (10)

Country Link
US (4) US9548057B2 (es)
EP (2) EP2697795B1 (es)
JP (3) JP2014513813A (es)
DK (2) DK2697795T3 (es)
ES (2) ES2545623T3 (es)
PL (2) PL2697795T3 (es)
PT (2) PT2697795E (es)
TR (1) TR201907767T4 (es)
WO (1) WO2012141635A1 (es)
ZA (1) ZA201306709B (es)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI579831B (zh) * 2013-09-12 2017-04-21 杜比國際公司 用於參數量化的方法、用於量化的參數之解量化方法及其電腦可讀取的媒體、音頻編碼器、音頻解碼器及音頻系統
CN110649925B (zh) * 2013-11-12 2023-04-07 瑞典爱立信有限公司 划分的增益形状向量编码
US20150149157A1 (en) * 2013-11-22 2015-05-28 Qualcomm Incorporated Frequency domain gain shape estimation
US10366698B2 (en) 2016-08-30 2019-07-30 Dts, Inc. Variable length coding of indices and bit scheduling in a pyramid vector quantizer
WO2018109143A1 (en) * 2016-12-16 2018-06-21 Telefonaktiebolaget Lm Ericsson (Publ) Methods, encoder and decoder for handling envelope representation coefficients
BR112020004909A2 (pt) * 2017-09-20 2020-09-15 Voiceage Corporation método e dispositivo para distribuir, de forma eficiente, um bit-budget em um codec celp

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5819215A (en) * 1995-10-13 1998-10-06 Dobson; Kurt Method and apparatus for wavelet based data compression having adaptive bit rate control for compression of digital audio or other sensory data
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US20070147518A1 (en) * 2005-02-18 2007-06-28 Bruno Bessette Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX
US7562021B2 (en) * 2005-07-15 2009-07-14 Microsoft Corporation Modification of codewords in dictionary used for efficient coding of digital media spectral data
KR100848324B1 (ko) 2006-12-08 2008-07-24 한국전자통신연구원 음성 부호화 장치 및 그 방법
JP4871894B2 (ja) * 2007-03-02 2012-02-08 パナソニック株式会社 符号化装置、復号装置、符号化方法および復号方法
WO2009029035A1 (en) 2007-08-27 2009-03-05 Telefonaktiebolaget Lm Ericsson (Publ) Improved transform coding of speech and audio signals
US8577673B2 (en) * 2008-09-15 2013-11-05 Huawei Technologies Co., Ltd. CELP post-processing for music signals
WO2011122875A2 (ko) * 2010-03-31 2011-10-06 한국전자통신연구원 부호화 방법 및 장치, 그리고 복호화 방법 및 장치
EP2681734B1 (en) * 2011-03-04 2017-06-21 Telefonaktiebolaget LM Ericsson (publ) Post-quantization gain correction in audio coding

Also Published As

Publication number Publication date
US20140025375A1 (en) 2014-01-23
US10192558B2 (en) 2019-01-29
DK2697795T3 (en) 2015-09-07
US20200365164A1 (en) 2020-11-19
WO2012141635A1 (en) 2012-10-18
EP2908313B1 (en) 2019-05-08
US20170148446A1 (en) 2017-05-25
JP2017062477A (ja) 2017-03-30
ZA201306709B (en) 2014-11-26
JP6600054B2 (ja) 2019-10-30
US9548057B2 (en) 2017-01-17
PL2697795T3 (pl) 2015-10-30
TR201907767T4 (tr) 2019-06-21
PT2697795E (pt) 2015-09-25
JP2018205766A (ja) 2018-12-27
US20190122671A1 (en) 2019-04-25
EP2697795A1 (en) 2014-02-19
ES2741559T3 (es) 2020-02-11
JP6388624B2 (ja) 2018-09-12
EP2908313A1 (en) 2015-08-19
DK2908313T3 (da) 2019-06-11
US10770078B2 (en) 2020-09-08
PT2908313T (pt) 2019-06-19
EP2697795B1 (en) 2015-06-17
JP2014513813A (ja) 2014-06-05
PL2908313T3 (pl) 2019-11-29

Similar Documents

Publication Publication Date Title
JP6600054B2 (ja) 方法、符号化器、復号化器、及び移動体機器
ES2238798T3 (es) Metodo para codificar y descodificar datos de tipo audio.
CN102081927B (zh) 一种可分层音频编码、解码方法及系统
CN102222505B (zh) 可分层音频编解码方法系统及瞬态信号可分层编解码方法
ES2644730T3 (es) Postfiltro de código de audio
ES2460893T3 (es) Sistemas, procedimientos y aparato para limitar el factor de ganancia
TWI573132B (zh) 用以實行霍夫曼編碼之裝置及方法
ES2970676T3 (es) Dispositivo de codificación de audio vocal, dispositivo de decodificación de audio vocal, procedimiento decodificación de audio vocal, y procedimiento de decodificación de audio vocal
BRPI0517780A2 (pt) aparelho de decodificação escalável e aparelho de codificação escalável
ES2628127T3 (es) Cuantificador avanzado
ES2703873T3 (es) Codificación/descodificación de la transformada de señales armónicas de audio
RU2505921C2 (ru) Способ и устройство кодирования и декодирования аудиосигналов (варианты)
ES2546028T3 (es) Un método y un dispositivo de codificación/decodificación
CN104681028A (zh) 一种编码方法及装置
JP2017523451A (ja) 圧縮hoa表現をデコードする方法および装置ならびに圧縮hoa表現をエンコードする方法および装置
WO2011045926A1 (ja) 符号化装置、復号装置およびこれらの方法
JP2017523453A (ja) 圧縮hoa表現をデコードする方法および装置ならびに圧縮hoa表現をエンコードする方法および装置
ES2406422T3 (es) Esquema multimodo para codificación mejorada de audio
ES2540051T3 (es) Método y un decodificador para la atenuación de regiones de señal reconstruidas con baja precisión
Atlas et al. Modulation frequency and efficient audio coding
CN116129918A (zh) 一种提高音频编码质量的方法
BRPI0317954B1 (pt) Variable rate audio coding and decoding process