ES2956522T3 - Método y dispositivo de codificación aritmética o decodificación aritmética - Google Patents
Método y dispositivo de codificación aritmética o decodificación aritmética Download PDFInfo
- Publication number
- ES2956522T3 ES2956522T3 ES21213737T ES21213737T ES2956522T3 ES 2956522 T3 ES2956522 T3 ES 2956522T3 ES 21213737 T ES21213737 T ES 21213737T ES 21213737 T ES21213737 T ES 21213737T ES 2956522 T3 ES2956522 T3 ES 2956522T3
- Authority
- ES
- Spain
- Prior art keywords
- spectral coefficients
- quantization
- probability density
- context
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 35
- 230000003595 spectral effect Effects 0.000 claims abstract description 152
- 230000006870 function Effects 0.000 claims abstract description 64
- 238000013139 quantization Methods 0.000 claims abstract description 62
- 238000001228 spectrum Methods 0.000 claims abstract description 29
- 238000013507 mapping Methods 0.000 claims abstract description 25
- 238000012545 processing Methods 0.000 claims abstract description 21
- 238000011002 quantification Methods 0.000 claims description 25
- 230000004044 response Effects 0.000 claims description 5
- 230000006835 compression Effects 0.000 description 6
- 238000007906 compression Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 239000013598 vector Substances 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000003750 conditioning effect Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/40—Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code
- H03M7/4006—Conversion to or from arithmetic code
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/182—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
La invención propone un método y un dispositivo para codificar y decodificar aritméticamente un coeficiente espectral actual utilizando coeficientes espectrales precedentes. Dichos coeficientes espectrales precedentes ya están codificados y ambos, dichos coeficientes espectrales anteriores y actuales, están comprendidos en uno o más espectros cuantificados resultantes de la cuantificación de la transformada tiempo-frecuencia de valores de muestra de señales de vídeo, audio o voz. Dicho método comprende procesar los coeficientes espectrales anteriores. coeficientes, usando los coeficientes espectrales precedentes procesados para determinar una clase de contexto que es una de al menos dos clases de contexto diferentes, usando la clase de contexto determinada y un mapeo de las al menos dos clases de contexto diferentes a al menos dos funciones de densidad de probabilidad diferentes para determinar la función de densidad de probabilidad, y codificación aritmética del coeficiente espectral actual basándose en la función de densidad de probabilidad determinada, en donde el procesamiento de los coeficientes espectrales anteriores comprende cuantificar de manera no uniforme absolutos de los coeficientes espectrales anteriores para su uso en la determinación de la clase de contexto. (Traducción automática con Google Translate, sin valor legal)
Description
DESCRIPCIÓN
Método y dispositivo de codificación aritmética o decodificación aritmética
Referencia cruzada a solicitud relacionada
Esta solicitud es una solicitud divisional europea de la solicitud de patente europea EP 21153228.8.
Campo técnico
La invención se refiere a la codificación y decodificación aritmética de datos multimedia.
Antecedentes de la invención
La codificación aritmética es un método para la compresión sin pérdida de datos. La codificación aritmética se basa en una función de densidad de probabilidad (PDF, por sus siglas en inglés). Para lograr un efecto de compresión, la función de densidad de probabilidad sobre la cual se basa la codificación tiene que ser idéntica, o al menos ser similar (cuanto más, mejor), a la función de densidad de probabilidad real que los datos siguen realmente.
Si la codificación aritmética se basa en una función de densidad de probabilidad adecuada, esta puede lograr una compresión significativa que produzca un código al menos casi óptimo. Por lo tanto, la codificación aritmética es una técnica utilizada a menudo en la codificación de audio, voz o vídeo para codificar o decodificar las secuencias de coeficientes, en donde los coeficientes son transformados tiempo-frecuencia cuantificadas de valores de muestra de señales de voz o audio o píxeles de vídeo en una representación binaria.
Para mejorar de manera uniforme la compresión, la codificación aritmética puede basarse en un conjunto de funciones de densidad de probabilidad, en donde la función de densidad de probabilidad utilizada para codificar un coeficiente actual depende de un contexto de dicho coeficiente actual. Es decir, las funciones de densidad de probabilidad diferentes pueden utilizarse para codificar un mismo valor de cuantificación dependiendo de un contexto en el cual aparece el coeficiente que tiene el mismo valor de cuantificación. El contexto de un coeficiente se define mediante los valores de cuantificación de los coeficientes comprendidos en un vecindario de uno o más coeficientes vecinos que rodean el coeficiente respectivo, p. ej., una subsecuencia de uno o más coeficientes ya codificados o decodificados adyacentes precedentes, en una secuencia, el coeficiente respectivo a codificarse o decodificarse. Cada una de las posibles apariencias diferentes que el vecindario puede adoptar define un diferente contexto posible, cada uno identificado a una función de densidad de probabilidad asociada.
En la práctica, dicha mejora de la compresión se vuelve manifiesta únicamente si el vecindario es lo suficiente grande. Esto va de la mano con una explosión combinatoria de la cantidad de diferentes contextos posibles, así como una gran cantidad correspondiente de funciones de densidad de probabilidad posibles o un mapeo complejo correspondiente.
Un ejemplo de un esquema de codificación aritmética basada en el contexto puede encontrarse en ISO/IEC JTC1/SC29/WG11 N10215, octubre de 2008, Busan, Corea, que propone un modelo de referencia para la codificación unificada de la voz y el sonido (USAC, por sus siglas en inglés). Según la propuesta, se consideran 4 tuplas ya decodificadas para el contexto.
Otro ejemplo de una codificación aritmética basada en el contexto relacionada con USAC puede encontrarse en ISO/IEC JTC1/SC29/WG11 N10847, julio de 2009, Londres, Reino Unido.
Respecto a la reducción de la complejidad en la codificación de entropía condicional de alto nivel, la patente estadounidense 5,298,896 propone una cuantificación no uniforme de los símbolos de condicionamiento.
MAX NEUENDORF ET AL: "A Novel Scheme for Low Bitrate Unified Speech and Audio Coding - MPEG RM0", AUDIO ENGINEERING SOCIETY CONVENTION PAPER, NUEV YORK, NY, EE.UU., 1 de enero de 2009 proporciona una visión general del códec USAC.
MEINE NIKOLAUS ET AL: "IMPROVED QUANTIZATION AND LOSSLESS CODING FOR SUBBAND AUDIO CODING", PREPRINTS OF PAPERS PRESENTED AT THE AES CONVENTION, vol. 1-4, 31 de mayo de 2005, describe un algoritmo de codificación de fuente basado en el modelo clásico de Markov, que usa Cuantificación Vectorial y codificación aritmética junto con un contexto dinámicamente adaptado de índices vectoriales previamente codificados.
Compendio de la invención
Correspondiente a la gran cantidad de contextos que deben manipularse, existe una gran cantidad de funciones de densidad de probabilidad que deben almacenarse, recuperarse y manipularse o, al menos, un mapeo complejo correspondiente de los contextos de las funciones de densidad de probabilidad. Esto aumenta al menos uno de los requisitos de capacidad de memoria y latencia de codificación/decodificación. En la técnica es necesaria una solución alternativa que permita lograr una correcta compresión similar mientras disminuye al menos uno de los
requisitos de capacidad de memoria y latencia de codificación/decodificación.
Para abordar esta necesidad, la invención propone un método de decodificación que comprende las características de la reivindicación 1, un método de codificación que comprende las características de la reivindicación 4, un dispositivo para la codificación aritmética que comprende las características de la reivindicación 7, y un dispositivo para la decodificación aritmética que comprende las características de la reivindicación 8.
Las características de otras realizaciones propuestas se especifican en las reivindicaciones dependientes.
Un método de codificación, o decodificación, aritmética, respectivamente, utiliza los coeficientes espectrales precedentes para la codificación o decodificación aritmética, respectivamente, de un coeficiente espectral actual, en donde dichos coeficientes espectrales precedentes ya están codificados, o decodificados, respectivamente. Tanto los coeficientes espectrales precedentes como dicho coeficiente espectral actual están comprendidos en uno o más espectros cuantificados producto de la cuantificación de la transformada tiempo-frecuencia de los valores de muestra de señales de voz, audio o vídeo. Dicho método comprende además procesar los coeficientes espectrales precedentes, utilizar los coeficientes espectrales precedentes procesados para determinar una clase de contexto que sea una de al menos dos clases de contexto diferentes, utilizar la clase de contexto determinada y un mapeo a partir de las dos o más clases de contexto diferentes a al menos dos funciones de densidad de probabilidad diferentes para determinar la función de densidad de probabilidad y la codificación, o decodificación, aritmética, respectivamente, del coeficiente espectral actual en base a la función de densidad de probabilidad determinada. Una característica del método es que procesar los coeficientes espectrales precedentes comprende cuantificar de manera no uniforme los valores absolutos de los coeficientes espectrales precedentes.
El uso de las clases de contexto como alternativa a los contextos para determinar la función de densidad de probabilidad permite agrupar dos o más contextos diferentes, lo que produce funciones de densidad de probabilidad diferentes, pero muy similares, en una única clase de contexto que se mapea en una única función de densidad de probabilidad. El agrupamiento se logra mediante el uso de valores absolutos cuantificados no uniformes de los coeficientes espectrales precedentes para determinar la clase de contexto.
El procesamiento de los coeficientes espectrales precedentes comprende determinar una suma de los valores absolutos cuantificados de los coeficientes espectrales precedentes para utilizar en la determinación de la clase de contexto. Similarmente, hay una correspondiente realización del dispositivo para codificación aritmética así como una correspondiente realización del dispositivo para descodificación aritmética en las que los medios de procesamiento están adaptados para determinar una suma de absolutos cuantificados de los coeficientes espectrales precedentes para usar en la determinación de la clase de contexto.
El procesamiento es de forma tal que el procesamiento de los coeficientes espectrales precedentes comprenda además una primera cuantificación en la cual los valores absolutos de los coeficientes espectrales precedentes se cuantifiquen según un esquema de primera cuantificación, una determinación de varianza en la cual se determina la varianza de los valores absolutos de los coeficientes espectrales precedentes cuantificados según el esquema de primera cuantificación, el uso de la varianza determinada para la selección de uno de al menos dos esquemas diferentes de segunda cuantificación no lineal y una segunda cuantificación en la cual los valores absolutos de los coeficientes espectrales precedentes cuantificados según el esquema de primera cuantificación se cuantifican adicionalmente según el esquema seleccionado de segunda cuantificación no lineal.
La determinación de la varianza comprende la determinación de una suma de los valores absolutos de los coeficientes espectrales precedentes cuantificados según el esquema de primera cuantificación y la comparación de la suma determinada con al menos un umbral.
El procesamiento está adaptado de forma tal que el procesamiento produzca un primer resultado o al menos un segundo resultado diferente. La clase de contexto es determinada en base al resultado de la segunda cuantificación. Los métodos determinan adicionalmente la función de densidad de probabilidad usando la determinada clase de contexto y un mapeo de al menos dos clases de contexto diferentes a al menos dos funciones de densidad de probabilidad diferentes. Los coeficientes espectrales actuales son codificados/decodificados aritméticamente en base a la función de densidad de probabilidad determinada. Al menos una de una señal de conmutación de modo y una señal de reconfiguración se reciben y la al menos una señal recibida se usa para controlar la determinación de la clase de contexto. En respuesta a la señal de reconfiguración, sólo se usan coeficientes espectrales precedentes de la trama actual para determinar la clase de contexto. Las dos o más funciones de densidad de probabilidad diferentes pueden determinarse con antelación con el uso de un conjunto representativo de datos para determinar las dos o más funciones de densidad de probabilidad diferentes. El mapeo de la descodificación es realizado y el mapeo de la codificación puede ser realizado usando una tabla de búsqueda o una tabla Hash.
Breve descripción de los dibujos
Las realizaciones de ejemplo de la invención se ilustran en los dibujos y se explican en mayor detalle en la descripción a continuación. Las realizaciones de ejemplo se explican únicamente para aclarar la invención, pero no limitan el alcance de la invención como es definido en las reivindicaciones.
En las figuras:
La Figura 1 representa de manera ilustrativa una realización del codificador de la invención,
La Figura 2 representa de manera ilustrativa una realización del decodificador de la invención,
La Figura 3 representa de manera ilustrativa un ejemplo útil para comprender la invención, aunque no forme parte de la invención al no contener todas las características de la invención, de un clasificador de contexto para determinar una clase de contexto,
La Figura 4 representa de manera ilustrativa una realización de un clasificador de contexto para determinar una clase de contexto,
La Figura 5a representa de manera ilustrativa un primer vecindario de intervalos espectrales precedentes que preceden un intervalo espectral actual a codificarse o decodificarse en el modo de dominio de frecuencia,
La Figura 5b representa de manera ilustrativa un segundo vecindario de intervalos espectrales precedentes que preceden un intervalo espectral actual a codificarse o decodificarse en el modo de transformada de predicción lineal ponderada,
La Figura 6a representa de manera ilustrativa un tercer vecindario de intervalos espectrales precedentes que preceden un intervalo espectral actual de frecuencia más baja a codificarse o decodificarse en el modo de dominio de frecuencia,
La Figura 6b representa de manera ilustrativa un cuarto vecindario de intervalos espectrales precedentes que preceden un segundo intervalo espectral actual de frecuencia más baja a codificarse o decodificarse en el modo de dominio de frecuencia,
La Figura 7a representa de manera ilustrativa un quinto vecindario de intervalos espectrales precedentes que preceden un intervalo espectral actual de frecuencia más baja a codificarse o decodificarse en el modo de transformada de predicción lineal ponderada,
La Figura 7b representa de manera ilustrativa un sexto vecindario de intervalos espectrales precedentes que preceden un segundo intervalo espectral actual de frecuencia más baja a codificarse o decodificarse en el modo de transformada de predicción lineal ponderada,
La Figura 7c representa de manera ilustrativa un séptimo vecindario de intervalos espectrales precedentes que preceden un tercer intervalo espectral actual de frecuencia más baja a codificarse o decodificarse en el modo de transformada de predicción lineal ponderada,
La Figura 7d representa de manera ilustrativa un octavo vecindario de intervalos espectrales precedentes que preceden un tercer intervalo espectral actual de frecuencia más baja a codificarse o decodificarse en el modo de transformada de predicción lineal ponderada,
La Figura 8 representa de manera ilustrativa vecindarios de diferentes intervalos espectrales a codificarse o decodificarse, dichos intervalos espectrales diferentes comprendidos en un primer espectro a codificarse o decodificarse después de iniciar la codificación/decodificación o de la aparición de una señal de reconfiguración en el modo de dominio de frecuencia,
La Figura 9 representa de manera ilustrativa otros vecindarios de diferentes intervalos espectrales a codificarse o decodificarse en el modo de transformada de predicción lineal ponderada, dichos intervalos espectrales diferentes comprendidos en un segundo espectro a codificarse o decodificarse después de iniciar la codificación/decodificación o de la aparición de una señal de reconfiguración en el modo de transformada de predicción lineal ponderada.
Realizaciones ilustrativas
La invención puede llevarse a cabo en cualquier dispositivo electrónico que comprenda un dispositivo de procesamiento adaptado de manera correspondiente. Por ejemplo, el dispositivo para la decodificación aritmética puede ser una televisión, un teléfono móvil o un ordenador personal, un reproductor de mp3, un sistema de navegación o un sistema de audio de un automóvil. El dispositivo para la codificación aritmética puede ser un teléfono móvil, un ordenador personal, un sistema de navegación de automóvil activo, una cámara fotográfica digital, una videocámara digital o un dictáfono, entre otros.
Las realizaciones ilustrativas descritas a continuación se refieren a la codificación y decodificación de intervalos espectrales cuantificados producto de la cuantificación de la transformada tiempo-frecuencia de muestras multimedia.
La invención se basa en la manera en que se utilizan los intervalos espectrales cuantificados ya transmitidos, p. ej., intervalos espectrales precedentes cuantificados que preceden un intervalo espectral BIN cuantificado actual en una
secuencia, para determinar la función de densidad de probabilidad PDF a utilizarse en la codificación y decodificación aritmética, respectivamente, del intervalo espectral BIN cuantificado actual.
Las realizaciones ilustrativas descritas de los métodos y dispositivos para la codificación aritmética o la decodificación aritmética comprenden diversas etapas o medios, respectivamente, para la cuantificación no uniforme.
Una primera etapa que puede comprenderse, pero no necesariamente, en una realización ilustrativa del método es una etapa de conmutación en la cual se decide cuál modo de transformada general se utilizará. Por ejemplo, en el esquema de codificación sin ruido de USAC, el modo de transformada general puede ser un modo de dominio de frecuencia (FD, por sus siglas en inglés) o un modo de transformada de predicción lineal ponderada (wLPT, por sus siglas en inglés). Cada modo general puede utilizar un vecindario diferente, es decir, una selección diferente de intervalos espectrales ya codificados o decodificados, respectivamente, para la determinación de la PDF.
Según la invención, el contexto de un intervalo espectral BIN actual se determina con una generación de contexto de módulo COCL. A partir del contexto determinado, se determina una clase de contexto mediante la clasificación del contexto, en donde, antes de la clasificación, el contexto se procesa mediante la cuantificación no uniforme NUQ1 de los intervalos espectrales del contexto. La clasificación comprende estimar una varianza VES del contexto y comparar la varianza con al menos un umbral. A continuación, la estimación de la varianza se utiliza para controlar una cuantificación adicional NUQ2 que es no lineal.
En el proceso de codificación que se representa de manera ilustrativa en la Figura 1, se determina una función de densidad de probabilidad (PDF) ideal para codificar el intervalo espectral BIN cuantificado actual. A estos efectos, se puede utilizar únicamente información que ya sea conocida también en el lado del decodificador. Es decir, se pueden utilizar únicamente intervalos espectrales precedentes cuantificados codificados o decodificados. Esto se lleva a cabo en un bloque clasificador de contexto COCL. Allí, los intervalos espectrales precedentes seleccionados definen un vecindario NBH que se utiliza para determinar la clase de contexto real. La clase de contexto puede representarse mediante un número de clase de contexto. El número de clase de contexto se utiliza para recuperar la PDF correspondiente de una memoria de PDF MEM1 mediante un mapeo MAP, por ejemplo mediante una tabla de búsqueda o una tabla hash. La determinación de la clase de contexto puede depender de un conmutador de modo general GMS que permita utilizar diferentes vecindarios en función del modo seleccionado. Tal como se mencionó anteriormente, para USAC, puede haber dos modos generales (modo FD y modo wLPT). Si se lleva a cabo una conmutación de modo general GMS en el lado del codificador, una señal de cambio de modo o una señal general actual deben estar comprendidas en el tren de bits, de modo que también sea conocida en el decodificador. Por ejemplo, en el modelo de referencia para la codificación unificada de la voz y el sonido (USAC) propuesta por iSo /IEC JTC1/SC29/WG11 N10847, julio 2009, Londres, Reino Unido, se propone core mode en la tabla WD 4.4 y core_mode0/1 en la tabla 4.5 para la transmisión del modo general.
Después de la determinación de una PDF adecuada para codificar el intervalo espectral BIN cuantificado actual mediante el codificador aritmético AEC, el intervalo espectral BIN cuantificado actual se suministra a la memoria de vecindario MEM2, es decir, el intervalo actual BIN se convierte en un intervalo precedente. Los intervalos espectrales precedentes comprendidos en la memoria del vecindario MEM2 pueden ser utilizados por el bloque COCL para codificar el siguiente intervalo espectral BIN. Durante, antes o después de memorizar el intervalo espectral BIN actual, dicho intervalo actual BIN es codificado aritméticamente por el codificador aritmético AEC. El resultado de la codificación aritmética AEC se almacena en el búfer de intervalo BUF o se escribe en el tren de bits directamente. El tren de bits o el contenido del búfer BUF pueden transmitirse o emitirse, por ejemplo, mediante cable o satélite. O los intervalos espectrales codificados aritméticamente pueden escribirse en un medio de almacenamiento como un DVD, disco duro, disco de Blu-ray o similares. La memoria de PDF MEM1 y la memoria del vecindario MEM2 pueden ser una única memoria física.
La conmutación de reconfiguración RS permite reiniciar, ocasionalmente, la codificación o decodificación en marcos especializados en los cuales la codificación o decodificación se inicia sin el conocimiento de los espectros precedentes, estos marcos especializados se conocen como puntos de entrada de decodificación. Dado que se lleva a cabo una conmutación de reconfiguración RS en el lado del codificador, una señal de reconfiguración debe estar comprendida en el tren de bits, de modo que también sea conocida en el decodificador. Por ejemplo, en el modelo de referencia para la codificación unificada de la voz y el sonido (USAC) propuesta por ISO/IEC JTC1/SC29/WG11 N10847, julio 2009, Londres, Reino Unido, se propone un arith_reset_flag en la tabla WD 4.10 y la tabla 4.14.
El correspondiente esquema de decodificación basado en el vecindario se representa de manera ilustrativa en la Figura 2. Comprende bloques similares al esquema de codificación. La determinación de la PDF a utilizarse en la decodificación aritmética es idéntica al esquema de codificación para asegurar que la PDF determinada sea la misma tanto en el codificador como en el decodificador. La decodificación aritmética toma los bits del búfer de bits BUF o el tren de bits directamente y utiliza la PDF determinada para decodificar el intervalo espectral BIN cuantificado actual. Luego, el intervalo espectral cuantificado decodificado se suministra a la memoria del vecindario MEM2 de la determinación del bloque de número de clase de contexto COCL y puede utilizarse para decodificar el siguiente intervalo espectral.
La Figura 3 representa de manera ilustrativa un primer ejemplo, útil para comprender la invención, del clasificador de contexto COCL para determinar una clase de contexto en detalle.
Antes de almacenar el intervalo espectral BIN cuantificado actual en la memoria de espectros MEM2, este se puede cuantificar de manera no uniforme en el bloque NUQ1. Esto presenta dos ventajas: en primer lugar, permite un almacenamiento más eficiente de los intervalos cuantificados, que generalmente son valores enteros con signo de 16 Bits. En segundo lugar, se reduce la cantidad de valores que cada intervalo cuantificado puede tener. Esto permite una gran reducción de las posibles clases de contexto en el proceso de determinación de clase de contexto en el bloque CLASE. Asimismo, dado que en la determinación de la clase de contexto se puede descartar el signo de los intervalos cuantificados, el cálculo de los valores absolutos se puede incluir en el bloque de cuantificación no uniforme NUQ1. En la Tabla 1 se muestra la cuantificación no uniforme ilustrativa tal como se puede llevar a cabo en el bloque NUQ1. En el ejemplo, después de la cuantificación no uniforme, son posibles tres valores diferentes para cada intervalo. Sin embargo, en general, la única restricción de cuantificación no uniforme es que reduce la cantidad de valores que puede adoptar un intervalo.
Tabla 1 Etapa de cuantificación no uniforme ilustrativa que incluye el cálculo de valores absolutos
Los intervalos espectrales mapeados/cuantificados de manera no uniforme se almacenan en la memoria espectral MEM2. Según la selección GMS de modo general seleccionado, para la determinación de clase de contexto CLASE de cada intervalo a codificarse, se selecciona un vecindario NBH seleccionado de intervalos espectrales. La Figura 5a representa de manera ilustrativa un primer vecindario NBH ilustrativo de un intervalo espectral BIN a codificarse o decodificarse.
En este ejemplo, únicamente los intervalos espectrales del espectro (marco) real o actual y los intervalos espectrales de un espectro (marco) precedente definen el vecindario NBH. Por supuesto, es posible utilizar intervalos espectrales de más de un espectro precedente como parte del vecindario, lo que produce una mayor complejidad, pero también puede ofrecer una mayor eficiencia de codificación en última instancia. Debe observarse que, a partir del espectro real, se pueden utilizar únicamente intervalos ya transmitidos para definir el vecindario NBH, dado que tienen que estar accesibles también en el decodificador. Aquí, así como en los siguientes ejemplos, se presume el orden de transmisión de frecuencias bajas a altas de los intervalos espectrales. Luego, el vecindario seleccionado NBH se utiliza como entrada en el bloque COCL de determinación de clase de contexto. A continuación, se explica en primer lugar la idea general detrás de la determinación de la clase de contexto y una versión simplificada, antes de describir la verdadera invención.
La idea general detrás de la determinación de la clase de contexto es permitir una estimación fiable de la varianza del intervalo a codificarse. Esta varianza prevista, nuevamente, se puede utilizar para obtener una estimación de la PDF del intervalo a codificarse. Para la estimación de la varianza no es necesario evaluar el signo de los intervalos en el vecindario. Por lo tanto, el signo ya es descartado en la etapa de cuantificación antes de su almacenamiento en la memoria espectral MEM2. Una determinación de la clase de contexto muy simple puede ser la siguiente: el vecindario NBH del intervalo espectral BIN puede asemejarse a la Figura 5a y consiste en 7 intervalos espectrales. Si se utiliza la cuantificación no uniforme de manera ilustrativa que se muestra en la Tabla, cada intervalo puede tener 3 valores. Esto produce 37 = 2187 clases de contexto posibles.
Para reducir adicionalmente esta cantidad de posibles clases de contexto, se puede descartar la posición relativa de cada intervalo en el vecindario NBH. Por lo tanto, se cuenta únicamente la cantidad de intervalos que tienen el valor 0, 1 o 2, respectivamente, en donde la suma de la cantidad de intervalos 0, la cantidad de intervalos 1 y la cantidad de intervalos 2 es, por supuesto, igual a la cantidad general de intervalos en el vecindario. En el vecindario NBH que comprende n intervalos, de los cuales cada uno puede adoptar uno de entre tres valores diferentes, existen 0.5* (n2+3*n+2) clases de contexto. Por ejemplo, en un vecindario de 7 intervalos, hay 36 clases de contexto posibles y en un vecindario de 6 intervalos, hay 28 clases de contexto posibles.
Una determinación de clase de contexto más compleja pero aún lo suficientemente simple toma en consideración que las investigaciones han demostrado que el intervalo espectral del espectro precedente a la misma frecuencia es de particular importancia (el intervalo espectral representado por un círculo punteado en la Figura 5a, 5b, 6a, 6b, 7a, 7b, 7c, 8 y 9). Para los otros intervalos en el vecindario, los representados por círculos a rayas horizontales en las figuras respectivas, la posición relativa es menos importante. Por lo tanto, el intervalo a la misma frecuencia en el espectro precedente se utiliza de manera explícita para la determinación de la clase de contexto, mientras que para los otros 6 intervalos se cuenta únicamente la cantidad de intervalos 0, la cantidad de intervalos 1 y la cantidad de intervalos 2. Esto produce 3 x 28 = 84 clases de contexto posibles.
Los experimentos han demostrados que dicha clasificación de contexto es muy eficiente para el modo FD.
Según la invención, la determinación de clase de contexto se expande mediante una estimación de la varianza VES, lo que controla una segunda cuantificación no uniforme NUQ2. Esto permite una mejor adaptación de la generación de clase de contexto COCL a un mayor rango dinámico de la varianza prevista del intervalo a codificarse. El diagrama de bloques correspondiente de la determinación de clase de contexto expandida se muestra de manera ilustrativa en 4.
En el ejemplo que se muestra en la Figura 4, la cuantificación no uniforme se separa en dos etapas de las cuales una etapa precedente proporciona una cuantificación más fina (bloque NUQ1) y una etapa posterior proporciona una cuantificación más gruesa (bloque NUQ2). Esto permite la adaptación de la cuantificación de, p. ej., la varianza del vecindario. La varianza del vecindario se estima en el bloque de estimación de varianza v Es , en donde la estimación de la varianza se basa en dicha cuantificación más fina precedente de los intervalos en el vecindario NBH en el bloque NUQ1. No es necesario que la estimación de la varianza sea precisa, pero puede ser muy aproximada. Por ejemplo, es suficiente que la aplicación USAC decida si la suma de los valores absolutos de los intervalos en el vecindario NBH después de dicha cuantificación más fina cumple o supera un umbral de varianza o no, es decir, una conmutación entre una varianza alta y baja es suficiente.
La cuantificación no uniforme de la etapa 2 puede verse como se muestra en la Tabla 2. En este ejemplo, el modo de varianza baja corresponde a la cuantificación de la etapa 1 que se muestra en la Tabla 2.
La tabla 2 representa una cuantificación no uniforme de 2 etapas ilustrativa; la segunda o etapa posterior cuantifica de manera diferente en función de si la varianza se ha estimado como alta o baja.
La última determinación de clase de contexto en el bloque CLASE es la misma que en la versión simplificada de la Figura 3. Es posible utilizar diferentes determinaciones de clase de contexto según el modo de varianza. También es posible utilizar más de dos modos de varianza, que, por supuesto, produce un aumento de la cantidad de clases de contexto y un aumento de la complejidad.
Para los primeros intervalos en un espectro, un vecindario como el que se muestra en la Figura 5a o 5b no es aplicable, porque ninguno de los primeros intervalos ni ninguno de los intervalos de frecuencia más baja existen. Para cada uno de estos casos especiales, se puede definir un vecindario propio. En una realización adicional, los intervalos no existentes se completan con un valor predefinido. Para el vecindario ilustrativo presentado en la Figura 5a, los vecindarios definidos para los primeros intervalos a transmitirse en el espectro se muestran en la Figura 6a y la Figura 6b. La idea es expandir el vecindario a intervalos de frecuencia más alta para permitir el uso de la misma función de determinación de clase de contexto que para el resto del espectro. Esto significa también que se pueden utilizar las mismas clases de contexto y al menos las mismas PDF. Esto no sería posible si el tamaño del vecindario se acaba de reducir (por supuesto, esto también es una opción).
Las reconfiguraciones suceden habitualmente antes de codificar un nuevo espectro. Tal como ya se mencionó, esto es necesario para permitir puntos de inicio especializados para la decodificación. Por ejemplo, si el proceso de decodificación inicia a partir de un determinado marco/espectro, de hecho, el proceso de decodificación debe iniciar desde el punto de la última reconfiguración para posteriormente decodificar el marco precedente hasta el espectro de inicio deseado. Esto significa que, cuantas más reconfiguraciones sucedan, más puntos de entrada existen para la decodificación. Sin embargo, la eficiencia de codificación es menor en un espectro después de una reconfiguración.
Después de producirse una reconfiguración, no hay ningún espectro precedente disponible para la definición del vecindario. Esto significa que únicamente los intervalos espectrales precedentes del espectro real se utilizan en el vecindario. Sin embargo, el procedimiento general puede no cambiarse y se pueden utilizar las mismas “herramientas”. Nuevamente, los primeros intervalos deben tratarse de manera diferente como se explicó en la sección anterior.
En la Figura 8 se muestra una definición de vecindario reconfigurado ilustrativo. Esta definición puede utilizarse en el caso de una reconfiguración en el modo FD de USAC.
La cantidad de clases de contexto adicionales como se muestra en el ejemplo de la Figura 8 (con el uso de la cuantificación de la Tabla con, en última instancia, 3 valores cuantificados posibles o 6 valores si se utilizan los valores después de la etapa 1 de cuantificación) es la siguiente: la manipulación para el primer intervalo agrega 1 clase de contexto, el 2.° intervalo agrega 6 (se utiliza el valor después de la etapa 1 de cuantificación), el 3.er intervalo agrega 6 y el 4.° intervalo agrega 10 clases de contexto. Si se consideran adicionalmente dos modos de varianza (alta y baja), esta cantidad de clases de contexto se ve casi duplicada (únicamente para el primer intervalo, cuando no hay información disponible y para el segundo intervalo cuando el valor utilizado para el intervalo después de la etapa 1 de cuantificación no está duplicado).
Esto da como resultado, en este ejemplo, 1 6 2x6 2x10 = 39 clases de contexto adicionales para la manipulación de las reconfiguraciones.
El bloque MAP de mapeo toma la clasificación de contexto determinada mediante el bloque COCL, p. ej., un número de clase de contexto determinado, y selecciona la PDF correspondiente de la memoria de PDF MEM1. En esta etapa, es posible reducir adicionalmente la cantidad de tamaño de memoria al utilizar una única PDF para más de una clase de contexto. Es decir, las clases de contexto que tengan una PDF similar pueden utilizar una PDF conjunta. Estas PDF pueden predefinirse en una etapa de entrenamiento con el uso de un conjunto de datos representativos lo suficientemente grande. Este entrenamiento puede incluir una fase de optimización, donde se identifican las clases de contexto correspondientes a PDF similares y las PDF correspondientes se fusionan. En función de las estadísticas de los datos, esto puede producir una cantidad relativamente pequeña de PDF que debe almacenarse en la memoria. En la versión experimental ilustrativa para USAC, se aplicó exitosamente un mapeo de 822 clases de contexto a 64 PDF.
La práctica de esta función de mapeo MAP puede ser una simple tabla de búsqueda si la cantidad de clases de contexto no es demasiado grande. Si la cantidad aumenta, se puede aplicar una tabla hash a efectos de eficiencia. Tal como se mencionó anteriormente, una conmutación de modo general GMS permite conmutar entre el modo de dominio de frecuencia (FD) y el modo de transformada de predicción lineal ponderada (wLPT). En función del modo, se pueden utilizar diferentes vecindarios. Se ha demostrado en experimentos que los vecindarios ilustrativos representados en la Figura 5a, Figura 6a y 6b y Figura 8 son lo suficientemente grandes para el modo FD. Sin embargo, para el modo wLPT, se ha descubierto que los vecindarios más grandes, como los representados ilustrativamente en la Figura 5b, Figura 7a, 7b y 7c y la Figura 9, son ventajosos.
Es decir, la manipulación de reconfiguración ilustrativa en el modo wLPT está representada en la Figura 9. Los vecindarios ilustrativos en el modo wLPT para el intervalo menor, el segundo intervalo menor, el tercer intervalo menor y el cuarto intervalo menor en un espectro se representan en la Figura 7a, 7b, 7c y 7d, respectivamente. Y en la Figura 5b se representa un vecindario ilustrativo en el modo wLPT para todos los otros intervalos en un espectro. La cantidad de clases de contexto producidas por el vecindario ilustrativo representado en la Figura 5b es 3 x 91 = 273 clases de contexto. El factor 3 resulta de la manipulación especial de un intervalo a la misma frecuencia que el intervalo a codificarse o a decodificarse actualmente. Según la fórmula presentada anteriormente, existen 0.5*((12*12)+3*12 2) = 91 combinaciones de cantidad de intervalos con valor 2, 1 o 0 para los restantes 12 intervalos en el vecindario. En una realización que diferencia las clases de contexto en función de si la varianza del vecindario cumple o supera un umbral, las 273 clases de contexto se duplican.
Una manipulación de reconfiguración ilustrativa como se muestra en la Figura 9 también puede agregar una cantidad de clases de contexto.
En una realización ilustrativa analizada que produjo buenos resultados en los experimentos, existen 822 posibles clases de contexto, que se desglosan en la siguiente Tabla 1.
Tabla 1 Desglose de posibles clases de contexto de la propuesta CE USAC MPEG
En una realización ilustrativa analizada, estas 822 posibles clases de contexto se mapean en 64 PDF. El mapeo se
determina en una fase de entrenamiento, tal como se describió anteriormente.
Las 64 PDF resultantes deben almacenarse en tablas ROM, p. ej., en exactitud de 16 bits para un codificador aritmético de punto fijo. Aquí se descubre otra ventaja del esquema propuesto: en la versión borrador de trabajo actual de la normalización USAC mencionada en la sección de antecedentes, los cuádruples (vectores que contienen 4 intervalos espectrales) se codifican juntos con una única palabra de código. Esto produce libros de códigos muy grandes, incluso si el rango dinámico de cada componente en el vector es muy pequeño (p. ej., cada componente puede tener los valores [-4, ..., 3] ^ 84 = 4096 vectores diferentes posibles). Sin embargo, la codificación de valores escalares permite un rango dinámico alto para cada intervalo con un libro de código muy pequeño. El libro de código utilizado en la realización ilustrativa analizada tiene 32 entradas que ofrecen un rango dinámico para el intervalo de -15 a 15 y una palabra de código Esc-(para el caso en que el valor de un intervalo se encuentre fuera de este rango). Esto significa que únicamente 64 x 32 valores de 16 bits deben almacenarse en tablas ROM.
Anteriormente, se describió un método para la codificación aritmética de un coeficiente espectral actual con el uso de coeficientes espectrales precedentes, en donde dichos coeficientes espectrales precedentes ya están codificados y, tanto los coeficientes espectrales precedentes como los actuales, están comprendidos en uno o más espectros cuantificados que resultan de la cuantificación de la transformada tiempo-frecuencia de valores de muestra de señal de voz, audio o vídeo. En un ejemplo, útil para comprender la invención pero que no comprende todas las etapas de la invención, dicho método comprende además procesar los coeficientes espectrales precedentes, utilizar los coeficientes espectrales precedentes procesados para determinar una clase de contexto que sea una de al menos dos clases de contexto diferentes, utilizar la clase de contexto determinada y un mapeo a partir de las dos o más clases de contexto diferentes a al menos dos funciones de densidad de probabilidad diferentes para determinar la función de densidad de probabilidad y la codificación aritmética del coeficiente espectral actual en base a la función de densidad de probabilidad determinada, en donde procesar los coeficientes espectrales precedentes comprende la cuantificación no uniforme de los coeficientes espectrales precedentes.
En otro ejemplo, útil para comprender la invención, que sin embargo omite alguna funcionalidad de la invención, el dispositivo para la codificación aritmética de un coeficiente espectral actual que utiliza coeficientes espectrales precedentes ya codificados comprende medios de procesamiento, un primer medio para determinar una clase de contexto, una memoria que almacene al menos dos funciones de densidad de probabilidad diferentes, un segundo medio para recuperar la densidad de probabilidad y un codificador aritmético.
Luego, el medio de procesamiento se adapta para procesar los coeficientes espectrales precedentes ya codificados mediante su cuantificación no uniforme y dicho primer medio se adapta para utilizar el resultado de procesamiento para determinar la clase de contexto como una de al menos dos clases de contexto diferentes. La memoria almacena al menos dos funciones de densidad de probabilidad diferentes y un mapeo de las dos o más clases de contexto a las dos o más funciones de densidad de probabilidad diferentes, lo que permite recuperar la función de densidad de probabilidad que corresponde a la clase de contexto determinada. El segundo medio se adapta para recuperar, de la memoria, la densidad de probabilidad que corresponde a la clase de contexto determinada, y el codificador aritmético se adapta para la codificación aritmética del coeficiente espectral actual en base a la función de densidad de probabilidad recuperada.
Existe otro correspondiente ejemplo útil para entender la invención, que pierde sin embargo alguna funcionalidad de la invención, correspondiente del dispositivo para la decodificación aritmética de un coeficiente espectral actual que utiliza coeficientes espectrales precedentes ya decodificados que comprende medios de procesamiento, un primer medio para determinar una clase de contexto, una memoria que almacene al menos dos funciones de densidad de probabilidad diferentes, un segundo medio para recuperar la densidad de probabilidad y un decodificador aritmético. Luego, el medio de procesamiento se adapta para procesar los coeficientes espectrales precedentes ya decodificados mediante su cuantificación no uniforme y dicho primer medio se adapta para utilizar el resultado de procesamiento para determinar la clase de contexto como una de al menos dos clases de contexto diferentes. La memoria almacena al menos dos funciones de densidad de probabilidad diferentes y un mapeo de las dos o más clases de contexto a las dos o más funciones de densidad de probabilidad diferentes, lo que permite recuperar la función de densidad de probabilidad que corresponde a la clase de contexto determinada. El segundo medio se adapta para recuperar, de la memoria, la densidad de probabilidad que corresponde a la clase de contexto determinada, y el decodificador aritmético se adapta para la decodificación aritmética del coeficiente espectral actual en base a la función de densidad de probabilidad recuperada.
Claims (8)
1. Un método para la decodificación aritmética de un coeficiente espectral actual de un marco actual con el uso de coeficientes espectrales precedentes del marco actual y/o un marco previo, estando dichos coeficientes espectrales precedentes ya decodificados, en donde dichos coeficientes espectrales precedentes y dicho coeficiente espectral actual están comprendidos en uno o más espectros cuantificados que resultan de la cuantificación de valores de muestra de señal de voz, audio o vídeo transformados por tiempo-frecuencia, comprendiendo dicho método las etapas de:
- realizar una primera cuantificación en la cual los valores absolutos de los coeficientes espectrales precedentes se cuantifican según un esquema de primera cuantificación, en el que la realización de la primera cuantificación determina coeficientes espectrales precedentes cuantificados;
- determinar una varianza de los coeficientes espectrales precedentes cuantificados, que comprende determinar una suma de los coeficientes espectrales precedentes cuantificados y comparar la suma determinada con al menos un umbral;
- utilizar la varianza determinada para seleccionar uno de entre al menos dos esquemas diferentes de segunda cuantificación no lineal;
- realizar una segunda cuantificación en la cual los coeficientes espectrales precedentes cuantificados se cuantifican adicionalmente según el esquema seleccionado de segunda cuantificación no lineal, en el que la realización de la segunda cuantificación incluye determinar un resultado de la segunda cuantificación;
- determinar una clase de contexto de al menos dos clases de contexto diferentes, en donde la clase de contexto es determinada en base al resultado de la segunda cuantificación;
- determinar una función de densidad de probabilidad usando la clase de contexto determinada y un mapeo de al menos dos clases de contexto diferentes a al menos dos funciones de densidad de probabilidad diferentes; y - decodificar aritméticamente el coeficiente espectral actual en base a la función de densidad de probabilidad determinada,
comprendiendo además el método las etapas de:
- recibir una señal de conmutación de modo y/o una señal de reconfiguración; y
- usar la señal de conmutación de modo y/o la señal de reconfiguración para controlar la etapa de determinar la clase de contexto, en el que, en respuesta a la señal de reconfiguración, sólo se usan coeficientes espectrales precedentes de la trama actual para determinar la clase de contexto,
en el que el mapeo es realizado usando una tabla de búsqueda o una tabla Hash.
2. El método según la reivindicación 1, comprendiendo adicionalmente dicho método
- utilizar un conjunto de datos representativo para determinar las al menos dos o más funciones de densidad de probabilidad diferentes.
3. El método según la reivindicación 1 o la reivindicación 2, en el que dicho mapeo incluye un mapeo de una pluralidad de clases de contexto diferentes que tienen funciones de densidad de probabilidad similares a una única función de densidad de probabilidad, de tal manera que dicha pluralidad de clases de contexto diferentes comparten dicha única función de densidad de probabilidad.
4. Un método para la codificación aritmética de un coeficiente espectral actual de un marco actual con el uso de coeficientes espectrales precedentes del marco actual y/o un marco previo, estando dichos coeficientes espectrales precedentes ya codificados, en donde dichos coeficientes espectrales precedentes y dicho coeficiente espectral actual están comprendidos en uno o más espectros cuantificados que resultan de la cuantificación de valores de muestra de señal de voz, audio o vídeo transformados por tiempo-frecuencia, comprendiendo dicho método las etapas de:
- realizar una primera cuantificación en la cual los valores absolutos de los coeficientes espectrales precedentes se cuantifican según un esquema de primera cuantificación, en el que la realización de la primera cuantificación determina coeficientes espectrales precedentes cuantificados;
- determinar una varianza de los coeficientes espectrales precedentes cuantificados, que comprende determinar una suma de valores absolutos de los coeficientes espectrales precedentes cuantificados y comparar la suma determinada con al menos un umbral;
- utilizar la varianza determinada para seleccionar uno de entre al menos dos esquemas diferentes de segunda
cuantificación no lineal; y
- realizar una segunda cuantificación en la cual los coeficientes espectrales precedentes cuantificados se cuantifican adicionalmente según el esquema seleccionado de segunda cuantificación no lineal, en el que la realización de la segunda cuantificación incluye determinar un resultado de la segunda cuantificación,
- determinar una clase de contexto de al menos dos clases de contexto diferentes, en donde la clase de contexto se determina en base al resultado de la segunda cuantificación;
- determinar una función de densidad de probabilidad usando la clase de contexto determinada y un mapeo de al menos dos clases de contexto diferentes a al menos dos funciones de densidad de probabilidad diferentes; y - codificar aritméticamente el coeficiente espectral actual en base a la función de densidad de probabilidad determinada,
comprendiendo además el método las etapas de:
- recibir una señal de conmutación de modo y/o una señal de reconfiguración; y
- usar la señal de conmutación de modo y/o la señal de reconfiguración para controlar la etapa de determinar la clase de contexto, en el que, en respuesta a la señal de reconfiguración, sólo se usan coeficientes espectrales precedentes de la trama actual para determinar la clase de contexto.
5. Método según la reivindicación 4, comprendiendo dicho método además
- utilizar un conjunto de datos representativo para determinar las dos o más funciones de densidad de probabilidad diferentes.
6. El método según la reivindicación 4 o la reivindicación 5, en el que dicho mapeo incluye un mapeo de una pluralidad de clases de contexto diferentes que tienen funciones de densidad de probabilidad similares a una única función de densidad de probabilidad, de tal manera que dicha pluralidad de clases de contexto diferentes comparten dicha única función de densidad de probabilidad.
7. Dispositivo para la codificación aritmética de un coeficiente espectral actual de un marco actual con el uso de coeficientes espectrales precedentes del marco actual y/o un marco previo, estando dichos coeficientes espectrales precedentes ya codificados, en donde dichos coeficientes espectrales precedentes y dicho coeficiente espectral actual están comprendidos en uno o más espectros cuantificados que resultan de la cuantificación de valores de muestra de señal de voz, audio o vídeo transformados por tiempo-frecuencia, comprendiendo dicho dispositivo: medios de procesamiento adaptados para:
- realizar una primera cuantificación en la cual los valores absolutos de los coeficientes espectrales precedentes son cuantificados según un esquema de primera cuantificación, en el que la realización de la primera cuantificación determina coeficientes espectrales precedentes cuantificados;
- determinar una varianza de los coeficientes espectrales precedentes cuantificados, que comprende determinar una suma de los coeficientes espectrales precedentes cuantificados y comparar la suma determinada con al menos un umbral;
- utilizar la varianza determinada para seleccionar uno de entre al menos dos esquemas diferentes de segunda cuantificación no lineal; y
- realizar una segunda cuantificación en la cual los coeficientes espectrales precedentes cuantificados se cuantifican adicionalmente según el esquema seleccionado de segunda cuantificación no lineal, en el que la realización de la segunda cuantificación incluye determinar un resultado de la segunda cuantificación, y
primeros medios para determinar una clase de contexto de entre al menos dos clases de contexto diferentes, estando dichos primeros medios adaptados para determinar la clase de contexto en base al resultado de la segunda cuantificación;
segundos medios para determinar una función de densidad de probabilidad, estando dichos segundos medios adaptados para determinar la función de densidad de probabilidad usando la clase de contexto determinada y un mapeo de las dos o más clases de contexto diferentes a al menos dos funciones de densidad de probabilidad diferentes; y
un codificador aritmético para la codificación aritmética del coeficiente espectral actual en base a la función de densidad de probabilidad determinada,
en el que dichos primeros medios están configurados para:
- recibir una señal de conmutación de modo y/o una señal de reconfiguración; y
- usar la señal de conmutación de modo y/o la señal de reconfiguración para controlar la etapa de determinar la clase de contexto, en el que, en respuesta a la señal de reconfiguración, sólo se usan coeficientes espectrales precedentes de la trama actual para determinar la clase de contexto.
8. Dispositivo para la decodificación aritmética de un coeficiente espectral actual de un marco actual con el uso de coeficientes espectrales precedentes del marco actual y/o un marco previo, estando dichos coeficientes espectrales precedentes ya decodificados, en donde dichos coeficientes espectrales precedentes y dicho coeficiente espectral actual están comprendidos en uno o más espectros cuantificados que resultan de la cuantificación de valores de muestra de señal de voz, audio o vídeo transformados por tiempo-frecuencia, comprendiendo dicho dispositivo: medios de procesamiento adaptados para:
- realizar una primera cuantificación en la cual los valores absolutos de los coeficientes espectrales precedentes son cuantificados según un esquema de primera cuantificación, en el que la realización de la primera cuantificación determina coeficientes espectrales precedentes cuantificados;
- determinar una varianza de los coeficientes espectrales precedentes cuantificados, que comprende determinar una suma de los coeficientes espectrales precedentes cuantificados, cuantificados según el esquema de primera cuantificación, y comparar la suma determinada con al menos un umbral;
- utilizar la varianza determinada para seleccionar uno de entre al menos dos esquemas diferentes de segunda cuantificación no lineal; y
- realizar una segunda cuantificación en la cual los coeficientes espectrales precedentes cuantificados se cuantifican adicionalmente según el esquema seleccionado de segunda cuantificación no lineal, en el que la realización de la segunda cuantificación incluye determinar un resultado de la segunda cuantificación; y
primeros medios para determinar una clase de contexto de entre al menos dos clases de contexto diferentes, estando dichos primeros medios adaptados para determinar la clase de contexto en base al resultado de la segunda cuantificación;
segundos medios para determinar una función de densidad de probabilidad, dichos segundos medios adaptados para determinar la función de densidad de probabilidad usando la clase de contexto determinada y un mapeo de las dos o más clases de contexto diferentes a al menos dos funciones de densidad de probabilidad diferentes; y un decodificador aritmético para la decodificación aritmética del coeficiente espectral actual en base a la función de densidad de probabilidad determinada,
en el que dichos primeros medios están configurados para:
- recibir una señal de conmutación de modo y/o una señal de reconfiguración; y
- usar la señal de conmutación de modo y/o la señal de reconfiguración para controlar la etapa de determinar la clase de contexto, en el que, en respuesta a la señal de reconfiguración, sólo se usan coeficientes espectrales precedentes de la trama actual para determinar la clase de contexto,
en el que el mapeo es realizado usando una tabla de búsqueda o una tabla Hash.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP09305961A EP2315358A1 (en) | 2009-10-09 | 2009-10-09 | Method and device for arithmetic encoding or arithmetic decoding |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2956522T3 true ES2956522T3 (es) | 2023-12-22 |
Family
ID=41698446
Family Applications (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES21213737T Active ES2956522T3 (es) | 2009-10-09 | 2010-10-01 | Método y dispositivo de codificación aritmética o decodificación aritmética |
ES10762909T Active ES2743152T3 (es) | 2009-10-09 | 2010-10-01 | Método y dispositivo de codificación aritmética y decodificación aritmética |
ES19187816T Active ES2866125T3 (es) | 2009-10-09 | 2010-10-01 | Método y dispositivo para decodificación aritmética |
ES21153228T Active ES2906415T3 (es) | 2009-10-09 | 2010-10-01 | Método y dispositivo de codificación aritmética o decodificación aritmética |
Family Applications After (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES10762909T Active ES2743152T3 (es) | 2009-10-09 | 2010-10-01 | Método y dispositivo de codificación aritmética y decodificación aritmética |
ES19187816T Active ES2866125T3 (es) | 2009-10-09 | 2010-10-01 | Método y dispositivo para decodificación aritmética |
ES21153228T Active ES2906415T3 (es) | 2009-10-09 | 2010-10-01 | Método y dispositivo de codificación aritmética o decodificación aritmética |
Country Status (16)
Country | Link |
---|---|
US (7) | US9219498B2 (es) |
EP (6) | EP2315358A1 (es) |
JP (1) | JP5666602B2 (es) |
KR (10) | KR102168511B1 (es) |
CN (8) | CN105119606B (es) |
AU (7) | AU2010305548B2 (es) |
BR (3) | BR122019019924B1 (es) |
CA (7) | CA3178163A1 (es) |
ES (4) | ES2956522T3 (es) |
HK (7) | HK1211755A1 (es) |
MX (1) | MX2012004172A (es) |
MY (3) | MY176427A (es) |
RU (2) | RU2691197C2 (es) |
TW (7) | TWI618365B (es) |
WO (1) | WO2011042366A1 (es) |
ZA (1) | ZA201201402B (es) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2315358A1 (en) | 2009-10-09 | 2011-04-27 | Thomson Licensing | Method and device for arithmetic encoding or arithmetic decoding |
CA2907353C (en) | 2009-10-20 | 2018-02-06 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio information, method for decoding an audio information and computer program using a detection of a group of previously-decoded spectral values |
ES2532203T3 (es) * | 2010-01-12 | 2015-03-25 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Codificador de audio, decodificador de audio, método para codificar y decodificar una información de audio y programa de computación que obtiene un valor de contexto de sub-región basado en una norma de valores espectrales previamente decodificados |
CN103052873B (zh) † | 2010-07-14 | 2018-05-15 | 恰根有限公司 | 新型液体加工装置 |
US9659063B2 (en) * | 2010-12-17 | 2017-05-23 | Software Ag | Systems and/or methods for event stream deviation detection |
WO2015108358A1 (ko) * | 2014-01-15 | 2015-07-23 | 삼성전자 주식회사 | 선형 예측 부호화 계수를 양자화하기 위한 가중치 함수 결정 장치 및 방법 |
CN106157960A (zh) * | 2015-04-14 | 2016-11-23 | 杜比实验室特许公司 | 音频内容的自适应算术编解码 |
US9792259B2 (en) | 2015-12-17 | 2017-10-17 | Software Ag | Systems and/or methods for interactive exploration of dependencies in streaming data |
RU2611022C1 (ru) * | 2016-01-28 | 2017-02-17 | федеральное государственное казенное военное образовательное учреждение высшего образования "Военная академия связи имени Маршала Советского Союза С.М. Буденного" Министерства обороны Российской Федерации | Способ совместного арифметического и помехоустойчивого кодирования (варианты) |
US11776562B2 (en) * | 2020-05-29 | 2023-10-03 | Qualcomm Incorporated | Context-aware hardware-based voice activity detection |
RU2752868C1 (ru) * | 2020-08-24 | 2021-08-11 | федеральное государственное казенное военное образовательное учреждение высшего образования "Военная академия связи имени Маршала Советского Союза С.М. Буденного" Министерства обороны Российской Федерации | Способ арифметического кодирования и декодирования |
Family Cites Families (42)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5381145A (en) * | 1993-02-10 | 1995-01-10 | Ricoh Corporation | Method and apparatus for parallel decoding and encoding of data |
US5298896A (en) * | 1993-03-15 | 1994-03-29 | Bell Communications Research, Inc. | Method and system for high order conditional entropy coding |
KR100219592B1 (ko) * | 1995-05-29 | 1999-09-01 | 윤종용 | 웨이브릿 변환을 이용한 영상 압축 방법 |
RU2093968C1 (ru) | 1995-08-02 | 1997-10-20 | Закрытое акционерное общество "Техно-ТМ" | Способ кодирования-декодирования изображений и устройство для его осуществления |
EP0998720A4 (en) * | 1997-07-31 | 2005-03-23 | Univ California | DEVICE AND METHOD FOR IMAGE AND SIGNAL PROCESSING |
KR100335609B1 (ko) | 1997-11-20 | 2002-10-04 | 삼성전자 주식회사 | 비트율조절이가능한오디오부호화/복호화방법및장치 |
US6731811B1 (en) * | 1997-12-19 | 2004-05-04 | Voicecraft, Inc. | Scalable predictive coding method and apparatus |
US6351567B1 (en) * | 1998-12-22 | 2002-02-26 | Intel Corporation | Efficient encoding of video blocks |
US6492916B1 (en) * | 2001-03-30 | 2002-12-10 | Ricoh Co., Ltd. | Method and apparatus for generating multiple selectable contexts |
US6859563B2 (en) * | 2001-03-30 | 2005-02-22 | Ricoh Co., Ltd. | Method and apparatus for decoding information using late contexts |
US6870962B2 (en) * | 2001-04-30 | 2005-03-22 | The Salk Institute For Biological Studies | Method and apparatus for efficiently encoding chromatic images using non-orthogonal basis functions |
JP3807342B2 (ja) * | 2002-04-25 | 2006-08-09 | 三菱電機株式会社 | デジタル信号符号化装置、デジタル信号復号装置、デジタル信号算術符号化方法、およびデジタル信号算術復号方法 |
DK1467491T3 (da) * | 2002-05-02 | 2007-03-19 | Fraunhofer Ges Forschung | Arithmetical coding of transform coefficients |
US7505604B2 (en) * | 2002-05-20 | 2009-03-17 | Simmonds Precision Prodcuts, Inc. | Method for detection and recognition of fog presence within an aircraft compartment using video images |
US7043423B2 (en) * | 2002-07-16 | 2006-05-09 | Dolby Laboratories Licensing Corporation | Low bit-rate audio coding systems and methods that use expanding quantizers with arithmetic coding |
US6906647B2 (en) | 2002-09-20 | 2005-06-14 | Ntt Docomo, Inc. | Method and apparatus for arithmetic coding, including probability estimation state table creation |
PT3468045T (pt) * | 2002-09-20 | 2022-05-31 | Ntt Docomo Inc | Método e aparelho para codificação aritmética |
US7580584B2 (en) * | 2003-07-18 | 2009-08-25 | Microsoft Corporation | Adaptive multiple quantization |
US7577844B2 (en) * | 2004-03-17 | 2009-08-18 | Microsoft Corporation | Systems and methods for encoding randomly distributed features in an object |
CN100508402C (zh) * | 2005-09-16 | 2009-07-01 | 北京中星微电子有限公司 | 一种aac或mp3解码器中的反量化方法 |
CN100459436C (zh) * | 2005-09-16 | 2009-02-04 | 北京中星微电子有限公司 | 一种音频编码中比特分配的方法 |
CN101167368B (zh) * | 2005-12-05 | 2012-03-28 | 华为技术有限公司 | 一种实现算术编解码的方法及装置 |
GB0600141D0 (en) * | 2006-01-05 | 2006-02-15 | British Broadcasting Corp | Scalable coding of video signals |
WO2007123257A1 (en) * | 2006-04-21 | 2007-11-01 | Kabushiki Kaisha Toshiba | Method and apparatus for entropy coding and decoding |
US7653705B2 (en) | 2006-06-26 | 2010-01-26 | Microsoft Corp. | Interactive recording and playback for network conferencing |
US7656942B2 (en) * | 2006-07-20 | 2010-02-02 | Hewlett-Packard Development Company, L.P. | Denoising signals containing impulse noise |
EP1921752B1 (en) * | 2006-11-13 | 2012-12-19 | Google, Inc. | Adaptive arithmetic encoding and decoding of digital data |
US7756350B2 (en) * | 2006-11-13 | 2010-07-13 | Global Ip Solutions, Inc. | Lossless encoding and decoding of digital data |
CN100493198C (zh) * | 2007-05-31 | 2009-05-27 | 北京中星微电子有限公司 | 算术编码中的概率模型存储方法 |
ATE500588T1 (de) | 2008-01-04 | 2011-03-15 | Dolby Sweden Ab | Audiokodierer und -dekodierer |
EP4376305A3 (en) | 2008-07-11 | 2024-07-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and audio decoder |
CA2871268C (en) * | 2008-07-11 | 2015-11-03 | Nikolaus Rettelbach | Audio encoder, audio decoder, methods for encoding and decoding an audio signal, audio stream and computer program |
US8111923B2 (en) * | 2008-08-14 | 2012-02-07 | Xerox Corporation | System and method for object class localization and semantic class based image segmentation |
US8638850B2 (en) * | 2009-05-06 | 2014-01-28 | Advanced Micro Devices, Inc. | Execution units for context adaptive binary arithmetic coding (CABAC) |
EP2315358A1 (en) | 2009-10-09 | 2011-04-27 | Thomson Licensing | Method and device for arithmetic encoding or arithmetic decoding |
CA2907353C (en) * | 2009-10-20 | 2018-02-06 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio information, method for decoding an audio information and computer program using a detection of a group of previously-decoded spectral values |
ES2532203T3 (es) * | 2010-01-12 | 2015-03-25 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Codificador de audio, decodificador de audio, método para codificar y decodificar una información de audio y programa de computación que obtiene un valor de contexto de sub-región basado en una norma de valores espectrales previamente decodificados |
US20140324745A1 (en) * | 2011-12-21 | 2014-10-30 | Nokia Corporation | Method, an apparatus and a computer software for context recognition |
US9001178B1 (en) | 2012-01-27 | 2015-04-07 | Google Inc. | Multimedia conference broadcast system |
US20140195675A1 (en) | 2013-01-09 | 2014-07-10 | Giga Entertainment Media Inc. | Simultaneous Content Data Streaming And Interaction System |
US10516850B2 (en) | 2013-11-26 | 2019-12-24 | Vonage Business Inc. | Method and system for recalling and replaying content during a communications session |
US20160128638A1 (en) * | 2014-11-10 | 2016-05-12 | Bloom Technologies NV | System and method for detecting and quantifying deviations from physiological signals normality |
-
2009
- 2009-10-09 EP EP09305961A patent/EP2315358A1/en not_active Withdrawn
-
2010
- 2010-10-01 KR KR1020197034955A patent/KR102168511B1/ko active IP Right Grant
- 2010-10-01 MY MYPI2016001568A patent/MY176427A/en unknown
- 2010-10-01 EP EP23185352.4A patent/EP4274101A3/en active Pending
- 2010-10-01 EP EP21213737.6A patent/EP3998708B1/en active Active
- 2010-10-01 CN CN201510458560.6A patent/CN105119606B/zh active Active
- 2010-10-01 CA CA3178163A patent/CA3178163A1/en active Pending
- 2010-10-01 KR KR1020177004383A patent/KR101782300B1/ko active IP Right Grant
- 2010-10-01 EP EP10762909.9A patent/EP2486657B1/en active Active
- 2010-10-01 CA CA2969949A patent/CA2969949C/en active Active
- 2010-10-01 KR KR1020197004376A patent/KR101993820B1/ko active IP Right Grant
- 2010-10-01 CN CN201510458538.1A patent/CN105099463B/zh active Active
- 2010-10-01 KR KR1020197018003A patent/KR102051015B1/ko active IP Right Grant
- 2010-10-01 WO PCT/EP2010/064644 patent/WO2011042366A1/en active Application Filing
- 2010-10-01 MY MYPI2020004142A patent/MY191414A/en unknown
- 2010-10-01 KR KR1020237033869A patent/KR20230145524A/ko not_active Application Discontinuation
- 2010-10-01 US US13/500,106 patent/US9219498B2/en active Active
- 2010-10-01 ES ES21213737T patent/ES2956522T3/es active Active
- 2010-10-01 RU RU2015135352A patent/RU2691197C2/ru active
- 2010-10-01 CN CN201510458595.XA patent/CN105119607B/zh active Active
- 2010-10-01 BR BR122019019924-8A patent/BR122019019924B1/pt active IP Right Grant
- 2010-10-01 ES ES10762909T patent/ES2743152T3/es active Active
- 2010-10-01 TW TW106103307A patent/TWI618365B/zh active
- 2010-10-01 MY MYPI2012000846A patent/MY160033A/en unknown
- 2010-10-01 CA CA3178149A patent/CA3178149A1/en active Pending
- 2010-10-01 CN CN201510458980.4A patent/CN105099464B/zh active Active
- 2010-10-01 EP EP19187816.4A patent/EP3591843B1/en active Active
- 2010-10-01 CN CN201080045319.6A patent/CN102577133B/zh active Active
- 2010-10-01 TW TW104143481A patent/TWI580198B/zh active
- 2010-10-01 KR KR1020207029672A patent/KR102361280B1/ko active IP Right Grant
- 2010-10-01 CN CN201510458559.3A patent/CN104967454B/zh active Active
- 2010-10-01 TW TW109142920A patent/TWI764409B/zh active
- 2010-10-01 KR KR1020187015841A patent/KR101950253B1/ko active IP Right Grant
- 2010-10-01 KR KR1020227004028A patent/KR102586833B1/ko active IP Right Grant
- 2010-10-01 BR BR112012006688-9A patent/BR112012006688B1/pt active IP Right Grant
- 2010-10-01 KR KR1020127009033A patent/KR101709681B1/ko active IP Right Grant
- 2010-10-01 EP EP21153228.8A patent/EP3846348B1/en active Active
- 2010-10-01 TW TW111113393A patent/TWI832200B/zh active
- 2010-10-01 JP JP2012532548A patent/JP5666602B2/ja active Active
- 2010-10-01 TW TW099133448A patent/TWI558110B/zh active
- 2010-10-01 CA CA3151229A patent/CA3151229A1/en active Pending
- 2010-10-01 BR BR122019019559-5A patent/BR122019019559B1/pt active IP Right Grant
- 2010-10-01 CA CA3121374A patent/CA3121374C/en active Active
- 2010-10-01 RU RU2012118634/08A patent/RU2565501C2/ru active
- 2010-10-01 CN CN201510458602.6A patent/CN104993833B/zh active Active
- 2010-10-01 MX MX2012004172A patent/MX2012004172A/es active IP Right Grant
- 2010-10-01 ES ES19187816T patent/ES2866125T3/es active Active
- 2010-10-01 ES ES21153228T patent/ES2906415T3/es active Active
- 2010-10-01 CA CA2777057A patent/CA2777057C/en active Active
- 2010-10-01 KR KR1020177026142A patent/KR101866361B1/ko active IP Right Grant
- 2010-10-01 TW TW108128334A patent/TWI714203B/zh active
- 2010-10-01 CN CN201510458536.2A patent/CN105071815B/zh active Active
- 2010-10-01 CA CA3178168A patent/CA3178168A1/en active Pending
- 2010-10-01 AU AU2010305548A patent/AU2010305548B2/en active Active
- 2010-10-01 TW TW106142795A patent/TWI676363B/zh active
-
2012
- 2012-02-24 ZA ZA2012/01402A patent/ZA201201402B/en unknown
-
2015
- 2015-10-20 AU AU2015246076A patent/AU2015246076B2/en active Active
- 2015-10-27 US US14/924,156 patent/US9973208B2/en active Active
- 2015-12-16 HK HK15112356.6A patent/HK1211755A1/xx unknown
- 2015-12-16 HK HK15112354.8A patent/HK1211753A1/xx unknown
- 2015-12-16 HK HK15112355.7A patent/HK1211754A1/xx unknown
-
2016
- 2016-05-18 HK HK16105686.0A patent/HK1217826A1/zh unknown
- 2016-05-18 HK HK16105687.9A patent/HK1217827A1/zh unknown
- 2016-05-18 HK HK16105685.1A patent/HK1217825A1/zh unknown
- 2016-05-18 HK HK16105684.2A patent/HK1217824A1/zh unknown
-
2017
- 2017-12-07 AU AU2017272250A patent/AU2017272250B2/en active Active
-
2018
- 2018-04-12 US US15/952,082 patent/US10516414B2/en active Active
-
2019
- 2019-11-07 US US16/677,539 patent/US10848180B2/en active Active
-
2020
- 2020-05-29 AU AU2020203538A patent/AU2020203538B2/en active Active
- 2020-11-09 US US17/092,648 patent/US11381249B2/en active Active
-
2021
- 2021-12-02 AU AU2021277715A patent/AU2021277715B2/en active Active
-
2022
- 2022-06-30 US US17/854,866 patent/US11770131B2/en active Active
-
2023
- 2023-09-06 AU AU2023226688A patent/AU2023226688B2/en active Active
- 2023-09-12 US US18/465,479 patent/US20230421174A1/en active Pending
-
2024
- 2024-09-05 AU AU2024219410A patent/AU2024219410A1/en active Pending
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2956522T3 (es) | Método y dispositivo de codificación aritmética o decodificación aritmética | |
RU2778873C2 (ru) | Способ и устройство для арифметического кодирования или арифметического декодирования | |
WO2011045927A1 (ja) | 符号化装置、復号装置およびこれらの方法 |