ES2739531T3 - Agrupamiento adaptable de parámetros para eficiencia de codificación mejorada - Google Patents
Agrupamiento adaptable de parámetros para eficiencia de codificación mejorada Download PDFInfo
- Publication number
- ES2739531T3 ES2739531T3 ES06723036T ES06723036T ES2739531T3 ES 2739531 T3 ES2739531 T3 ES 2739531T3 ES 06723036 T ES06723036 T ES 06723036T ES 06723036 T ES06723036 T ES 06723036T ES 2739531 T3 ES2739531 T3 ES 2739531T3
- Authority
- ES
- Spain
- Prior art keywords
- parameters
- representation
- tuples
- tuple
- sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/12—Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/40—Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/15—Data rate or code amount at the encoder output by monitoring actual compressed data size at the memory before deciding storage at the transmission buffer
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/189—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
- H04N19/196—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
- H04N19/463—Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/91—Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/0017—Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/002—Dynamic bit allocation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
Abstract
Unidad de compresión para compresión de parámetros, incluyendo los parámetros un primer conjunto de parámetros que incluye una representación de una primera porción de una señal de audio o de video original, incluyendo además los parámetros un segundo conjunto de parámetros que incluye una representación de una segunda porción de la señal de audio o de video original, siendo vecina la segunda porción de la primera porción, que comprende: un suministrador (100) configurado para suministrar una primera tupla y una segunda tupla teniendo cada tupla cuatro parámetros, en el que el primer conjunto de parámetros incluye una representación de un primer cuadro (130a) de la señal de audio o de video original y en el que el segundo conjunto de parámetros incluye una representación de un segundo cuadro (130b) de la señal de audio o de video original; un estimador (102) de bits configurado para estimar un número de bits necesarios para codificar los conjuntos de parámetros que utilizan una primera secuencia (138) de tuplas que incluyen la primera tupla basada en una regla de codificación y para codificar los conjuntos de parámetros que utilizan una segunda secuencia (140) de tuplas que incluyen la segunda tupla basada en la regla de codificación, en el que la regla de codificación es tal que cada tupla tiene asociada a ella una palabra código única de un grupo de palabras código diferentes; y un proveedor (104) configurado para proporcionar bloques (118) codificados, siendo operativo el proveedor para proporcionar los bloques (118) codificados, utilizando la secuencia de tuplas que da como resultado un menor número de bits, y para proporcionar una indicación (120b) de secuencia que indica la secuencia de tuplas de la cual se derivan los bloques (118b) codificados, en el que las tuplas tienen cuatro parámetros y en el que se utiliza un código cuatridimensional de Huffman para codificar las tuplas, siendo el número 4 de la dimensión del código igual al número de parámetros de las tuplas, y en el que el suministrador (100) es operativo para suministrar la primera tupla (152a) que consiste en cuatro parámetros del primer conjunto de parámetros, siendo vecinos los parámetros de los parámetros dentro de la representación de la señal de audio o de vídeo original; y consistiendo la segunda tupla (152b) en: dos parámetros del primer conjunto de parámetros, siendo vecinos los dos parámetros dentro de la representación de la señal de vídeo o de audio original, y el mismo número de parámetros del segundo conjunto de parámetros, siendo vecinos el mismo número de parámetros dentro de la representación de la señal de audio o de vídeo original, en el que los dos parámetros del primer conjunto de parámetros y el mismo número de parámetros del segundo conjunto de parámetros describen la misma banda de frecuencia en el primer cuadro (130a) y en el segundo cuadro (130b).
Description
DESCRIPCIÓN
Agrupamiento adaptable de parámetros para eficiencia de codificación mejorada
Campo de la invención
La presente invención se refiere a la codificación sin pérdidas de parámetros, y en particular, a la generación y uso de una regla de codificación para la compresión eficiente de parámetros.
Antecedentes de la invención y técnica previa
En tiempos recientes, la técnica de reproducción de audio de multicanal se está volviendo cada vez más importante. Esto puede ser debido al hecho de que las técnicas de compresión/codificación de audio tales como la técnica de mp3 bien conocida han hecho posible distribuir grabaciones de audio mediante Internet u otros canales de transmisión que tienen un ancho de banda limitado. La técnica de codificación de mp3 se ha vuelto tan famosa debido al hecho de que permite la distribución de todas las grabaciones en un formato estereofónico, esto es, una representación digital de la grabación de audio que incluye un primer canal o canal estereofónico izquierdo y un segundo canal o canal estereofónico derecho.
No obstante, hay deficiencias básicas de los sistemas de sonido de dos canales convencionales. Por consiguiente, se ha desarrollado la técnica surround. Una representación surround de multi-canal recomendada incluye, además de los dos canales estereofónicos L y R, un canal central adicional C y dos canales surround Ls, Rs. Este formato de sonido de referencia es también denominado como tres/dos-estéreo, que significa tres canales frontales y dos canales surround. En general, se requieren cinco canales de transmisión. En un ambiente de reproducción, son necesarios por lo menos cinco altavoces en cinco lugares decentes para obtener un punto de barrido óptimo en una cierta distancia de los cinco altavoces bien colocados.
Se conocen varias técnicas en la técnica para reducir la cantidad de datos requeridos para la transmisión de una señal de audio de multicanal. Tales técnicas son llamadas técnicas de estéreo adjuntas. Para este fin, se hace referencia a la figura 9, que muestra un dispositivo 60 de estéreo adjunto. Este dispositivo puede ser un dispositivo que implementa, por ejemplo, codificación de estéreo de intensidad (IS) o codificación de indicación binaural (BCC). Tal dispositivo recibe en general - como entrada - por lo menos dos canales (CH1, CH2, ... CHn) y emite por lo menos un solo canal portador y datos paramétricos. Los datos paramétricos son definidos de tal manera que, en un descodificador, se puede calcular una aproximación de un canal original (CH1, CH2 ... CHn).
Normalmente, el canal portador incluirá muestras de sub-banda, coeficientes espectrales, muestras de dominio de tiempo etc., que proporcionan una representación comparativamente fina de la señal fundamental, en tanto que los datos paramétricos no incluyen tales muestras de coeficientes espectrales sino que incluyen parámetros de control para controlar un cierto algoritmo de reconstrucción tal como ponderación mediante multiplicación, desplazamiento de tiempo, desplazamiento de frecuencia, desplazamiento de fase, etc. Por consiguiente, los datos paramétricos, incluyen solo una representación comparativamente burda de la señal o el canal asociado. Dicho en números, la cantidad de datos requeridos por un canal portador estará en el intervalo de 60 - 70 kbit/s, en tanto que la cantidad de datos requeridos por la información lateral paramétrica para un canal estará normalmente en el intervalo 1.5 - 2.5 kbit/s. Un ejemplo para datos paramétricos son los factores de escala bien conocidos, información estereofónica de intensidad o parámetros de indicación binaurales como se describirá posteriormente.
La técnica de BCC se describe por ejemplo en el documento 5574 de la convención de AES, “Binaural Cue Coding applied to Stereo and Multi-Channel Audio Compression”, C. Faller, F. Baumgarte, mayo de 2002, Múnich, en el documento de la IEEE WASPAA “Efficient representation of spatial audio using perceptual parametrization”, octubre de 2001, Mohonk, NY, en “Binaural cue coding applied to audio compression with flexible rendering”, C. Faller y F. Baumgarte, AES 113° Convención, Los Angeles, Preprint 5686, octubre de 2002 y en “Binaural cue coding - Part II: Schemes and applications”, C. Faller y F. Baumgarte, IEEE Trans. on Speech and Audio Proc., volumen. 11, n.° 6, noviembre de 2003.
En la codificación BCC, un número de canales de entrada de audio son convertidos a una representación espectral utilizando una DFT (Transformación discreta de Fourier) con ventanas solapantes. El espectro uniforme resultante se divide en particiones no solapantes. Cada partición tiene aproximadamente un ancho de banda proporcional al ancho de banda rectangular equivalente (ERB). Luego los parámetros BCC son estimados entre dos canales para cada partición. Estos parámetros BCC son normalmente dados para cada canal con respecto a un canal de referencia y son además cuantificados. Los parámetros transmitidos se calculan finalmente de acuerdo con fórmulas prescritas (codificadas), que pueden depender también de las particiones específicas de la señal que va a procesarse.
Existe un número de parámetros BCC. El parámetro ICLD, por ejemplo, describe la diferencia (proporción) de las
energías contenidas en 2 canales comparados. El parámetro ICC (coherencia/correlación de inter-canal) describe la correlación entre los dos canales, que puede entenderse como la similaridad de las formas de onda de los dos canales. El parámetro de ICTD (diferencia de tiempo de inter-canal) describe un desplazamiento de tiempo global entre los 2 canales mientras que el parámetro de IPD (diferencia de fase de inter-canal) describe lo mismo con respecto a las fases de las señales.
Se debe ser consiente de que, en un procesamiento por cuadros de una señal de audio, el análisis de BCC también se efectúa de cuadro en cuadro, esto es variable en el tiempo, y también variable en frecuencia. Esto significa que, para cada banda espectral, los parámetros BCC se obtienen individualmente. Este significa además que, en el caso de que un banco de filtro de audio descompone la señal de entrada en por ejemplo 32 señales del paso de banda, un bloque de análisis de BCC obtiene un conjunto de parámetros BCC para cada una de las 32 bandas.
Una técnica relacionada, también conocida como estereofónica paramétrica o estereoparámetrica, se describe en J. Breebaart, S. van de Par, A. Kohlrausch, E. Schuijers, “High-Quality Parametric Spatial Audio Coding at Low Bitrates”, AES 116° Convención, Berlín, Preprint 6072, 10 de mayo de 2004, y E. Schuijers, J. Breebaart, H. Purnhagen, J. Engdegard, “Low Complexity Parametric Stereo Coding”, AES 116° Convención, Berlín, Preprint 6073, mayo de 2004.
En resumen, los procedimientos recientes para la codificación paramétrica de señales de audio de multi-canal (“codificación de audio espacial”, “codificación de indicación binaural” (BCC) etc.) representan una señal de audio de multi-canal por medio de una señal de mezcla descendente (podría ser monofonónica o comprender varios canales) e información lateral paramétrica (“ indicaciones espaciales”) que caracterizan su etapa sonora espacial percibida. Es deseable mantener la proporción de información lateral tan baja como sea posible con el fin de minimizar la información de carga general y dejar tanto como sea posible la capacidad de transmisión disponible para la codificación de las señales de mezcla descendente.
Una manera de mantener la proporción de bits de la información lateral baja es codificar sin pérdidas la información lateral de un esquema de audio espacial mediante la aplicación de, por ejemplo, algoritmos de codificación de entropía a la información lateral.
La codificación sin pérdidas se ha aplicado extensamente en la codificación de audio general con el fin de asegurar una representación óptimamente compacta para coeficientes espectrales cuantificados y otra información lateral. Ejemplos de esquemas y métodos de codificación apropiados se ofrecen en los estándares de ISO/IEC, MPEG1 parte 3, MPEG2 parte 7 y MPEG4 parte 3.
Estos estándares y, por ejemplo, también el documento de IEEE “Noiseless Coding of Quantized Spectral Coefficients in MPEG-2 Advanced Audio Coding”, S. R. Quackenbush, J. D. Johnston, IEEE WASPAA, Mohonk, NY, octubre de 1997 describen técnicas del estado de la técnica que incluyen las siguientes medidas para codificar sin pérdidas parámetros cuantificados:
• Codificación de Huffman multidimensional de coeficientes espectrales cuantificados.
• Uso de un libro de códigos de Huffman común (multidimensional) para conjuntos de coeficientes.
• Codificación del valor ya sea como un agujero o información de signos de codificación e información de magnitud separadamente (esto es, que tiene solo entradas del libro de códigos de Huffman para un valor absoluto dado que reduce el tamaño del libro de código necesario, libros de códigos “firmados” frente a “sin firmar”).
• Uso de libros de código alternativos de diferentes valores absolutos más grandes (LAVs), esto es, diferentes valores absolutos máximos dentro de los parámetros que van a codificarse.
• Uso de libros de códigos alternativos de diferente distribución estadística para cada LAV.
• Transmisión de la elección del libro de código de Huffman como información lateral al descodificador.
• Utilizar “secciones” para definir el intervalo de aplicación de cada libro de código de Huffman seleccionado.
• Codificación diferencial de factores de escala con respecto a la frecuencia y codificación de Huffman subsecuente del resultado.
Otra técnica para la codificación sin pérdidas de valores burdamente cuantificados a un solo código de PCM se propone en el estándar de audio MPEG1 (llamado agrupamiento dentro del estándar y usado para capa 2). Esto se explica en más detalle en el estándar ISO/IEC 11172-3:93.
La Publicación “Binaural cue coding - Part II: Schemes and applications”, C. Faller y F. Baumgarte, IEEE Trans. on Speech and Audio Proc., volumen. 11, n.° 6, noviembre de 2003 ofrece alguna información con respecto a la codificación de parámetros BCC. Se propone que los parámetros de ICLD cuantificados se codifiquen diferencialmente:
• con respecto a la frecuencia y el resultado es subsecuentemente codificado por Huffman (con un código de Huffman unidimensional)
• con respecto al tiempo y el resultado es subsecuentemente codificado por Huffman (con un código de Huffman unidimensional),
y que finalmente, la variante más eficiente se selecciona como la representación de una señal de audio original. En Bosi M. et al.: "ISO/IEC MPEG-2 Advanced audio coding" Revista de la Audio Engineering Society (Sociedad de Ingeniería del Sonido), vol. 45, n.° 10, páginas 789-812 se propone la agrupación e intercalado de parámetros, antes de su codificación de Huffman.
La solicitud de patente estadounidense US 5,528,628 se refiere a codificación de longitud variable de símbolos de entrada utilizando una pluralidad de tablas de longitud de código variable. Se codifica la misma secuencia de símbolos utilizando diferentes codificadores de longitud variable de codificadores Huffman que tienen diferentes tablas de código. La decision de qué representación codificada va a transmitirse se realiza finalmente dependiendo de la longitud de código resultante.
La solicitud de patente europea 1047 198 A3 propone un enfoque similar, utilizando adicionalmente solo libros de código de valor absoluto.
Shen-Chuan Tai et al.: "An adaptive 3-D discrete cosine transform coder for medical image compression" IEEE Transactions on Information Technology in Biomedicine, vol. 4, n.° 3, págs. 259-263) propone un método para codificar datos de imagen bidimensional utilizando un algoritmo de codificación, desarrollado originalmente para codificar información tridimensional. En el método propuesto, se utiliza una técnica de segmentación basada en la magnitud de energía local para segmentar subbloques de la imagen en diferentes niveles de energía. Aquellos subbloques con el mismo nivel de energía entonces se juntan para formar un cuboide tridimensional. Entonces, se utiliza un tri-DCT para comprimir el cuboide tridimensional individualmente.
El documento WO01/26095A1 proporciona un método y un aparato para codificación de envolvente espectral. La divulgación enseña cómo realizar enviar una señal de forma compacta de un mapeo tiempo/frecuencia de la representación envolvente, y además, codificar los datos de la envolvente espectral de manera eficiente utilizando codificación direccional tiempo/frecuencia adaptativa. El método puede aplicarse tanto a sistemas de codificación de voz como a sistemas de audio natural y es especialmente adecuado para codificadores que utilizan SBR u otros métodos de reconstrucción de alta frecuencia.
El documento MPEG WD 2 para MPEG Surround, 73. La conferencia MPEG, del 25 de julio de 2005 al 25 de julio de 2005, n.° N7387 describe un proyecto de trabajo para MPEG Surround.
Como se menciona anteriormente, se ha propuesto optimizar el funcionamiento de compresión mediante la aplicación de codificación diferencial con respecto a la frecuencia y, alternativamente, con respecto al tiempo y seleccionar la variante más eficiente. Después, la variante seleccionada se envía por una señal a un descodificador mediante alguna información lateral.
Se han hecho muchos esfuerzos por reducir el tamaño de un canal de audio de mezcla descendente y la información lateral correspondiente. No obstante, las proporciones de bits que pueden obtenerse son todavía demasiado altas para permitir cada aplicación posible. Por ejemplo, el streaming decontenido de audio y video a teléfonos móviles requiere las mínimas velocidades de bits posibles y por consiguiente una codificación más eficiente del contenido.
Sumario de la invención
El objetivo de la presente invención es proporcionar un concepto de codificación mejorado que obtenga una compresión sin pérdidas de valores de parámetros con una mayor eficiencia.
De acuerdo con el primer aspecto de la presente invención, este objetivo se alcanza mediante una unidad de compresión para la compresión de parámetros según la reivindicación 1.
De acuerdo con el segundo aspecto de la presente invención, este objetivo se alcanza mediante un descodificador
para descodificar bloques de parámetros codificados según la reivindicación 4.
De acuerdo con el tercer aspecto de la presente invención, este objetivo se alcanza mediante un método para la compresión de parámetros según la reivindicación 8.
De acuerdo con el cuarto aspecto de la presente invención, este objetivo se alcanza mediante un programa informático según la reivindicación 10.
De acuerdo con el quinto aspecto de la presente invención, este objetivo se alcanza mediante un método para descodificar bloques de parámetros codificados según la reivindicación 9.
De acuerdo con el sexto aspecto de la presente invención, este objetivo se alcanza mediante un programa informático según la reivindicación 11.
La presente invención se basa en el descubrimiento de que pueden codificarse eficientemente parámetros que incluyen un primer conjunto de parámetros de una representación de una primera porción de una señal original, y que incluyen un segundo conjunto de parámetros de una representación de una segunda porción de la señal original, cuando los parámetros se disponen en una primera secuencia de tuplas y en una segunda secuencia de tuplas, en el que la primera secuencia de tuplas comprende tuplas de parámetros que tienen dos parámetros de una única porción de la señal original y en el que la segunda secuencia de tuplasm comprende tuplas de parámetros que tienen un parámetro de la primera porción y un parámetro de la segunda porción de la señal original. Una codificación eficiente puede alcanzarse utilizando un estimador de bits para estimar el número de bits necesarios para codificar la primera y la segunda secuencia de tuplas, en las que solamente se codifica la secuencia de tuplas que resulta en el número menor número de bits.menor número de bits
menor número de bits
Por consiguiente, el principio básico es que, se redisponen los parámetros que van a codificarse, por ejemplo en tiempo y en frecuencia, y finalmente se utiliza la disposición (secuencia de tuplas) de los parámetros para la compresión que da como resultado el menor número de bits para los parámetros comprimidos.
En un ejemplo, dos conjuntos de parámetros espectrales que describen la representación espectral de dos porciones de tiempo consecutivas de una señal original se agrupan adaptablemente en pares de dos parámetros para mejorar la eficiencia de codificación. Por consiguiente, por una parte se genera una secuencia de tuplas utilizando tuplas de parámetros que consisten en dos parámetros de frecuencia vecinos de la misma porción de tiempo. Por otra parte, se genera una segunda secuencia de tuplas utilizando tuplas que se integran utilizando un primer parámetro de la primera porción de tiempo y el parámetro correspondiente de la segunda porción de tiempo de la señal original. Luego, ambas secuencias de tuplas se codifican utilizando un código de Huffman bidimensional. Las dos secuencias codificadas de tuplas se comparan en sus tamaños y la tupla que da como resultado el menor número de bits se selecciona finalmente para ser transmitida. La información, sobre qué clase de tuplas se han utillizado para construir los datos codificados se transmite a un descodificador como información lateral adicional. Una ventaja del codificador de la invención descrito previamente es que, debido al agrupamiento de parámetros en tuplas que consisten en dos parámetros, puede aplicarse un código de Huffman bidimensional para la compresión, que da como resultado en general una proporción de bits más baja.
Una segunda ventaja es que, el agrupamiento adaptable, esto es, el concepto para decidir dinámicamente entre dos estrategias de agrupamiento posibles durante el proceso de codificación, produce una disminución adicional en la proporción de bits de la información lateral.
La decisión entre las dos estrategias de agrupamiento solo una vez para un conjunto de dos cuadros consecutivos reduce adicionalmente la cantidad de información lateral requerida, puesto que la indicación sobre qué estrategias de agrupamiento se han utilizado durante la codificación, tiene que transmitirse solo una vez para un conjunto de dos cuadros de tiempo consecutivos completos.
En una realización adicional de la presente invención, una unidad de compresión de la invención comprende adicionalmente un codificador diferencial que codifica diferencialmente los parámetros ya sea en tiempo o en frecuencia antes del agrupamiento adaptable. Aquella codificación diferencial junto con el agrupamiento adaptable y un libro de código de Huffman apropiado reduce adicionalmente el tamaño de la información lateral que va a transmitirse. Las dos posibilidades de codificación diferenciales junto con las dos estrategias de agrupamiento da como resultado un número total de cuatro combinaciones posibles, incrementado adicionalmente la probabilidad de encontrar una regla de codificación que de como resultado una baja velocidad de bits de información lateral.
En una realización adicional de la presente invención, el concepto inventivo se utiliza para una unidad de
descompresión, que permite descodificar bloques codificados de parámetros y reconstruir o reintegrar los cuadros originales en base a una información lateral que señala el esquema de agolpamiento subyacente de los bloques codificados de parámetros. En una modificación ventajosa, el descodificador de la invención también permite la descodificación de datos que no han sido agrupados adaptablemente, por consiguiente, se puede obtener una compatibilidad del descodificador de la invención con equipo existente.
Breve descripción de las figuras
Se describen posteriormente modalidades preferidas de la presente invención con referencia a las figuras adjuntas, en donde:
la figura 1 muestra una unidad de compresión inventiva;
la figura 2 muestra dos posibilidades de agrupamiento adaptable de parámetros;
la figura 3 muestra algunas posibilidades adicionales de agrupamiento adaptable de parámetros;
la figura 4 muestra esquemas de codificación diferencial;
la figura 5 muestra un descodificador inventivo;
la figura 6 muestra un codificador de multi-canal de la técnica anterior.
Descripción detallada de modalidades preferidas
La figura 1 muestra una unidad 90 de compresión inventiva, que comprende un suministrador 100, un estimador 102 de bits y un proveedor 104.
El suministrador 100 suministra una primera secuencia 106a de tuplas y una segunda secuencia 106b de tuplas en dos salidas de datos. El proveedor 104 recibe los tuplas 106a y 106b en dos de sus entradas 108a y 108b de datos. El estimador de bits recibe las dos tuplas en sus entradas 110a y 110b de datos.
El estimador 102 de bits estima el número de bits que resultan de la aplicación de una regla de codificación a las dos tuplas 106a y 106b. El estimador 102 de bits escoge la tupla que da como resultado el menor número de bits y envía por una señal mediante una salida 112a de señalización, si la tupla 106a o 106b dará como resultado el menor número de bits.
En base a la decisión del estimador 102 de bits, la tupla que da como resultado el menor número de bits se codifica finalmente en bloques 118 codificados, que son proporcionados mediante la salida 120a del proveedor 104, en donde el proveedor envía además por una señal una indicación de secuencia a su línea 120b de señalización, indicando que la secuencia original de tuplas (106a o 106b) se codificó para derivar los bloques 118 codificados. En una realización alternativa, puede obtenerse la misma funcionalidad cuando se omiten las conexiones 122a y 122b de líneas discontinuas entre el suministrador 100 y el proveedor 104. En este escenario alternativo, el estimador 102 de bits codificaría la secuencia de tuplas 106a y 106b, y transferiría dos bloques 124a y 124b codificados diferentes al proveedor 104, en donde el proveedor señala adicionalmente de cuál de las secuencias originales de tuplas 106a y 106b los bloques 124a y 124b codificados se derivan. Para este fin, puede utilizarse la salida 112a de señalización del estimador 102 de bits o la señalización puede derivarse implícitamente por el proveedor 104.
En esta realización alternativa, el proveedor 104 simplemente enviaría el bloque codificado con el menor número de bits a su salida 120a, proporcionando adicionalmente la indicación de secuencia.
La figura 2 muestra un ejemplo de dos esquemas de agrupamiento adaptables que se utilizan para derivar una secuencia de tuplas que van a codificarse. Para explicar el principio del agrupamiento adaptable, se muestran cuatro cuadros 130a a 130d de tiempo subsecuentes de una señal de original, en donde cada uno de los cuadros tiene un conjunto de cinco parámetros 132a a 132e espectrales.
De acuerdo con el ejemplo, los parámetros espectrales de dos cuadros consecutivos se agrupan ya sea en frecuencia, como se ilustra por las tuplas 134a y 134b o en el tiempo, como se ilustra por las tuplas 136a y 136b para construir la secuencias de tuplas. El agrupamiento en el tiempo da como resultado una primera secuencia 138 de tuplas, mientras que el agrupamiento en frecuencia da como resultado la segunda secuencia 140 de tuplas. Las secuencias 138 y 140 de tuplas se codifican utilizado por ejemplo un libro de códigos de Huffman, que da como
resultado dos secuencias diferentes de palabras códigopalabras 142 y 144 código. De acuerdo con la presente invención, la secuencia de palabras código que requiere el menor número de bits, se transmite finalmente a un descodificador, que tiene que recibir adicionalmente una indicación de secuencia, que señala ya sea el agrupamiento en el tiempo o agrupamiento de frecuencia que es fundamental o subyacente a la secuencia de palabras código. Como se puede ver en La figura 2. para el ejemplo mostrado de agolpamiento adaptable de pares de parámetros (bidimensional), la indicación de secuencia puede consistir en solo un bit.
La figura 3 muestra algunas estrategias de agrupamiento alternativas, que pueden utilizarse para implementar el agrupamiento adaptable de la invención, que permite códigos de Huffman con dimensiones mayores de 2. La figura 3 muestra una estrategia de agrupamiento para un código 146a de Huffman bidimensional para un código 146b de Huffman tridimensional y para un código 146c de Huffman tetradimensional como se utilizan de acuerdo con la invención. Para cada una de las estrategias, se ilustran dos cuadros de tiempo consecutivos, en donde los parámetros pertenecientes a la misma tupla son representados por las mismas letras mayúsculas.
En el caso del código de Huffman bidimensional, el agrupamiento se hace como ya se ha ilustrado en la figura 2, construyendo tuplas bidimensionales en frecuencia 148a y en tiempo 148b. En caso de construcción de tuplas que consisten en tres parámetros, las tuplas de frecuencia 158a son de tal manera que, tres parámetros vecinos dentro de un cuadro se agrupan conjuntamente para formar una tupla. Las tuplas de tiempo 150b pueden construirse de tal manera que los dos parámetros vecinos de un cuadro se combinan con un parámetro del otro cuadro, como se muestra en la figura 3.
Según la invención, se construyen tuplas 152a tetradimensionales agrupadas en tiempo de forma correspondiente a las otras tuplas de tiempo mediante agrupamiento de cuatro parámetros vecinos de un cuadro a una tupla. Las tuplas de agrupamiento de tiempo 152b se construyen de tal manera que, los dos parámetros vecinos de un cuadro se combinan con dos parámetros vecinos del otro cuadro, en donde los pares de parámetros de los cuadros individuales describen la misma propiedad espectral de los dos cuadros de tiempo consecutivos.
El permitir diferentes esquemas de agrupamiento, como se ilustra en la figura 3, puede reducir significativamente la proporción de bits de la información lateral, por ejemplo si se usa una variedad de libros de código de Huffman predefinidos de diferentes dimensiones, la dimensión del agrupamiento puede variarse dentro del el proceso de codificación, de tal manera que la representación que da como resultado la proporción de bits más baja puede utilizarse en cualquier tiempo o dentro del proceso de codificación.
La figura 4 muestra, cómo una unidad de compresión inventiva, que comprende adicionalmente un codificador diferencial, puede utilizarse para disminuir adicionalmente la información lateral mediante alguna codificación diferencial antes del proceso de codificación de Huffman.
Para ilustrar la codificación diferencial en tiempo y frecuencia o en tiempo y frecuencia, la misma representación 160 absoluta de parámetros, que ya se mostró en la figura 2, se utiliza como base para las varias etapas de codificación diferenciales. La primera posibilidad es codificar diferencialmente los parámetros de la representación 160 absoluta en frecuencia, dando como resultado los parámetros 162 codificados diferencialmente. Como se puede ver en la figura 4, para codificar diferencialmente la representación 160 absoluta, el primer parámetro de cada cuadro se deja sin cambios, mientras que el segundo parámetro se reemplaza por la diferencia del segundo parámetro y el primer parámetro de la representación 160 absoluta. Los otros parámetros dentro de la representación codificada diferencialmente se construyen siguiendo la misma regla.
Otra posibilidad es la codificación diferencial en tiempo, que produce la representación 164. Esta representación se construye al dejar el primer cuadro completo sin cambio, mientras que los parámetros de los siguientes cuadros se reemplazan por la diferencia del parámetro de la representación absoluta y del mismo parámetro del cuadro previo, como se puede ver en la figura 4.
Una tercera posibilidad es codificar primero diferencialmente en frecuencia, seguido por una codificación diferencial en tiempo o viceversa, dando como resultado la misma representación 166 codificada, que se codifica diferencialmente en tiempo y frecuencia.
Se notará que se tiene la posibilidad de usar estas cuatro representaciones diferentes de la señal original como entrada al agrupamiento adaptable. Con referencia a las diferentes representaciones 160 a 166 del ejemplo dado de parámetros, se puede ver claramente cómo la codificación diferencial tiene impacto sobre la velocidad permitida de información lateral. Al observar la representación 160 absoluta, se reconoce que ni un agrupamiento en el tiempo ni en frecuencia daría como resultado tuplas que tuvieran el mismo contenido. Por consiguiente, no se puede construir ningún libro de códigos de Huffman apropiado que asignaría las palabras código más cortas a los tuplas que se presentan más.
El caso es diferente al observar la diferencialidad en representación 162 codificada por frecuencia, en donde se
podría construir un libro de códigos de Huffman que solamente necesitara tener cuatro entradas para cubrir toda la representación, y en donde ya sea la tupla (1, 1) o la tupla (2, 2) se asignaría a la palabra código con mínima longitud, para obtener una información lateral compacta.
La ventaja es menos obvia en la representación que se codifica diferencialmente en tiempo 164. No obstante, se puede ganar también aquí el agrupamiento en frecuencia y haciendo uso de las numerosas tuplas (5, 5) y (10, 10). Para la representación que se codifica diferencialmente en tiempo y en frecuencia 166, todavía se obtendría una reducción adicional de la proporción de bits de información lateral que en la representación 162, puesto que un agrupamiento en el tiempo daría como resultado una alta multiplicidad de la tupla (1, 0), como se indica en la figura, permitiendo construir un libro de códigos de Huffman, que asignaría la palabra código más corta a la tupla previa. Como se puede ver claramente en la figura 4, la alta flexibilidad del concepto inventivo que hace uso del agrupamiento adaptable y de codificación diferencial permite escoger la estrategia que se ajusta más a la señal de audio original, permitiendo así mantener la velocidad de bits de información lateral baja.
En resumen, en una realización preferida, los valores de parámetro cuantificados se codifican en primer lugar diferencialmente con respecto al tiempo (variante 1) y diferencialmente con respecto a la frecuencia (variante 2). Luego los parámetros resultantes pueden agruparse de manera adaptable con respecto al tiempo (variante a) y frecuencia (variante b). Como resultado están disponibles cuatro combinaciones (1a, 1b, 2a, 2b) de las cuales se selecciona la mejor y se envía por una señal al descodificador. Esto se podía hacer por una información de 2 bits solamente, que representa las variantes 1a, 1b, 2a, 2b mediante, por ejemplo, la combinación de bits 00, 01, 10, 11. La figura 5 muestra un descodificador de acuerdo con la presente invención, para descodificar bloques codificados de parámetros, en donde el bloque de parámetros incluye un primer cuadro que tiene un conjunto de primeros parámetros espectrales y un segundo cuadro que tiene un conjunto de segundos parámetros espectrales.
El descodificador 200 comprende un descompresor 202 y un constructor 204 de cuadros. El descompresor recibe en una entrada un bloque 206 codificado de parámetros. El descompresor deriva, utilizando una regla de descodificación, una secuencia 208 de tuplas de parámetros del bloque 206 codificado de parámetros. Esta secuencia 208 de tuplas de parámetros se introduce al constructor 204 de cuadros.
El constructor de cuadros recibe adicionalmente una indicación 210 de secuencia, que indica qué secuencia de tuplas se ha utilizado por el codificador para construir el bloque codificado de parámetros.
Luego el constructor 204 de cuadros reordena la secuencia 208 de tuplas dirigidos por la indicación 210 de secuencia para reconstruir el primer cuadro 112a y el segundo cuadro 112b de la secuencia 208 de tuplas de parámetros.
Los ejemplos descritos anteriormente obtienen una mejora adicional de la eficiencia de codificación al introducir un agrupamiento adaptable de valores que van a codificarse utilizando un código de Huffman multidimensional. Como ejemplo, ambos, el agrupamiento bidimensional de valores con respecto a la frecuencia se puede hacer también como el agrupamiento bidimensional de valores con respecto al tiempo. Luego el esquema de codificación se efectuaría en ambos tipos de codificación y se escogería el más ventajoso (esto es, la variante que requiere menos bits). Esta decisión se envía por una señal al descodificador mediante información lateral.
En ejemplos adicionales, como se ilustra en la figura 3, también es posible integrar códigos de Huffman de más dimensiones aplicando diferentes estrategias de agrupamiento para construir las tuplas. Los ejemplos dados muestran estrategias de agrupamiento que construyen las tuplas mediante agrupación conjunta de parámetros de dos cuadros consecutivos solamente. También es posible realizar el agrupamiento utilizando parámetros de tres o más cuadros consecutivos, realizando el agrupamiento de manera directa.
En una modificación del codificador de la invención, también es posible combinar el agrupamiento diferencial y las estrategias de codificación diferencial con el uso de diferentes libros de códigos de Huffman para derivar la representación más corta posible de la información lateral. Esto podría reducir adicionalmente la proporción de bits de información lateral de una señal de audio codificada a costa de tener parámetros de información lateral adicionales, que señalan el libro de códigos de Huffman usado para la codificación.
Las realizaciones preferidas descritas de la presente invención muestran el concepto inventivo para ejemplos, en donde la estrategia agrupamiento no cambia dentro de dos cuadros de tiempo consecutivos. En una modificación de la presente invención también es por supuesto posible tener múltiples cambios entre el agrupamiento en el tiempo y en frecuencia dentro de un conjunto de dos cuadros, que implicaría que la indicación de secuencia también se suministra dentro de los cuadros para señalar el cambio de estrategia de agrupamiento.
En los ejemplos dados, los parámetros se codifican diferencialmente antes de codificarse por Huffman. Por supuesto, también es posible cualquier regla de codificación sin pérdidas antes de la codificación de Huffman de los parámetros, siendo el objetivo de la codificación derivar tantas tuplas con el mismo contenido como sea posible.
Hay cuatro representaciones de parámetros posibles diferentes dados de la figura 4, es decir, la representación absoluta, la representación diferencial en frecuencia, la representación diferencial en tiempo y la representación diferencial en tiempo y frecuencia. Para escoger entre cuatro representaciones, la información lateral que señala qué representación se ha utilizado, tiene que ser de por lo menos dos bits de tamaño, como se indica en la figura 4. Para equilibrar la victoria de una ganancia de eficiencia posible de la codificación frente a la indicación de representación espectral adicional, por supuesto también se podría decidir principalmente permitir solo dos representaciones posibles, reduciendo la indicación de representación espectral a la longitud de un solo bit.
Como un ejemplo de un descodificador la invención, la figura 5 muestra un descodificador 200 que recibe además del bloque 206 codificado de parámetros alguna información lateral. La información lateral que dirige el constructor 204 de cuadros comprende solamente una indicación 210 de secuencia en el ejemplo dado. Un descodificador de acuerdo con la presente invención puede por supuesto procesar cualquier otra información lateral requerida, especialmente una indicación de representación espectral, que indica la representación espectral que se ha utilizado para codificar cuadros originales.
Dependiendo de ciertos requerimientos de implementación de los métodos de la invención, los métodos de la invención pueden implementarse en hardware o en software. La implementación puede realizarse utilizando un medio de almacenamiento digital, en particular un disco flexible, DVD o un CD que tiene señales de control que se pueden leer electrónicamente almacenadas en el mismo, que cooperan con un sistema informático programable, de tal manera que se efectúan los métodos de la invención. En general, por consiguiente, la presente invención es un producto de programa informático con un código de programa almacenado en un portador legible por la máquina, siendo operativo el código de programa para efectuar los métodos de la invención cuando el producto de programa informático se ejecuta en un ordenador. En otras palabras, por consiguiente, los métodos inventivos son un programa informático que tiene un código de programa para efectuar por lo menos uno de los métodos inventivos cuando el programa informático se ejecuta en un ordenador.
En tanto que lo anterior se ha mostrado y descrito en particular con referencia a realizaciones particulares del mismo, se comprenderá por aquellos expertos en la técnica que pueden realizarse varios otros cambios en forma y detalles sin desviarse del alcance definido por las reivindicaciones adjuntas.
Claims (1)
- REIVINDICACIONESUnidad de compresión para compresión de parámetros, incluyendo los parámetros un primer conjunto de parámetros que incluye una representación de una primera porción de una señal de audio o de video original, incluyendo además los parámetros un segundo conjunto de parámetros que incluye una representación de una segunda porción de la señal de audio o de video original, siendo vecina la segunda porción de la primera porción, que comprende:un suministrador (100) configurado para suministrar una primera tupla y una segunda tupla teniendo cada tupla cuatro parámetros, en el que el primer conjunto de parámetros incluye una representación de un primer cuadro (130a) de la señal de audio o de video original y en el que el segundo conjunto de parámetros incluye una representación de un segundo cuadro (130b) de la señal de audio o de video original;un estimador (102) de bits configurado para estimar un número de bits necesarios para codificar los conjuntos de parámetros que utilizan una primera secuencia (138) de tuplas que incluyen la primera tupla basada en una regla de codificación y para codificar los conjuntos de parámetros que utilizan una segunda secuencia (140) de tuplas que incluyen la segunda tupla basada en la regla de codificación, en el que la regla de codificación es tal que cada tupla tiene asociada a ella una palabra código única de un grupo de palabras código diferentes; yun proveedor (104) configurado para proporcionar bloques (118) codificados, siendo operativo el proveedor para proporcionar los bloques (118) codificados, utilizando la secuencia de tuplas que da como resultado un menor número de bits, y para proporcionar una indicación (120b) de secuencia que indica la secuencia de tuplas de la cual se derivan los bloques (118b) codificados,en el que las tuplas tienen cuatro parámetros y en el que se utiliza un código cuatridimensional de Huffman para codificar las tuplas, siendo el número 4 de la dimensión del código igual al número de parámetros de las tuplas, yen el que el suministrador (100) es operativo para suministrar la primera tupla (152a) que consiste en cuatro parámetros del primer conjunto de parámetros, siendo vecinos los parámetros de los parámetros dentro de la representación de la señal de audio o de vídeo original; yconsistiendo la segunda tupla (152b) en:dos parámetros del primer conjunto de parámetros, siendo vecinos los dos parámetros dentro de la representación de la señal de vídeo o de audio original, yel mismo número de parámetros del segundo conjunto de parámetros, siendo vecinos el mismo número de parámetros dentro de la representación de la señal de audio o de vídeo original,en el que los dos parámetros del primer conjunto de parámetros y el mismo número de parámetros del segundo conjunto de parámetros describen la misma banda de frecuencia en el primer cuadro (130a) y en el segundo cuadro (130b).Unidad de compresión según la reivindicación 1, en la que los parámetros incluyen parámetros de codificación de indicación binaural BCC que describen una interrelación espacial entre un primer canal de audio original y un segundo canal de audio original, y en el que los parámetros BCC se eligen de la siguiente lista de parámetros BCC:coherencia/correlación de intercanal (ICC)diferencia de nivel de intercanal (ICLD)diferencia de tiempo de intercanal (ICTD), ydiferencia de fase de intercanal (IPD).Unidad de compresión según la reivindicación 1, que comprende además un codificador diferencial para el procesamiento de una señal de audio o de vídeo original, de forma que el primer conjunto de parámetros y el segundo conjunto de parámetros incluye una representación de diferencia, siendo la diferencia una diferencia en el tiempo, la frecuencia o en el tiempo y en la frecuencia.4. Descodificador para descodificar bloques (206) de parámetros codificados, incluyendo los parámetros un primer conjunto de parámetros que incluye una representación de una primera porción de una señal de audio o de vídeo original, incluyendo además los parámetros un segundo conjunto de parámetros que incluye una representación de una segunda porción de la señal de audio o de vídeo original, siendo vecina la segunda porción de la primera porción, y para el procesamiento de una indicación (210) de secuencia, que comprende:un descompresor, siendo operativo el descompresor para descomprimir, utilizando una regla de descodificación que depende de una regla de descodificación utilizada para codificar secuencias de tuplas, un bloque (206) de parámetros codificados para derivar una secuencia de tuplas de parámetros, teniendo cada tupla cuatro parámetros, en el que el primer conjunto de parámetros incluye una representación de un primer cuadro (130a) de la señal de audio o de vídeo original y en el que el segundo conjunto de parámetros incluye una representación de un segundo cuadro (130b) de la señal de audio o de vídeo original, y en el que la regla de codificación es tal que cada tupla tiene asociada a ella una palabra código única de un grupo de palabras código diferentes; yun constructor de cuadros configurado para recibir la indicación (210) de secuencia, indicando la indicación (210) de secuencia una secuencia de tuplas utilizada por un número de secuencias diferentes que subyace al bloque (206) codificado, en el que el número de secuencias de tuplas diferentes incluye una primera secuencia de tuplas que consiste en primeras tuplas (152a) y una segunda secuencia de tuplas que consiste en segundas tuplas (152b), y para construir los conjuntos de parámetros que utilizan la información de la secuencia de tuplas utilizada, en el que las tuplas primera y segunda tienen 4 parámetros, y en el que un código de Huffman cuatridimensional se utiliza para descodificar las tuplas codificadas, siendo el número 4 de la dimensión del código igual al número de parámetros de las tuplas, yen el que una primera tupla (152a) consiste en cuatro parámetros del primer conjunto de parámetros, siendo vecinos los parámetros de los parámetros dentro de la representación de la señal de audio o de vídeo original, yen el que una segunda tupla (152b) consiste en dos parámetros del primer conjunto de parámetros, siendo vecinos los dos parámetros dentro de la representación de la señal de audio o de vídeo original, y el mismo número de parámetros del segundo conjunto de parámetros, siendo vecinos el mismo número de parámetros dentro de la representación de la señal de audio o de vídeo original, y en el que los dos parámetros del primer conjunto de parámetros y el mismo número de parámetros del segundo conjunto de parámetros describen la misma banda de frecuencia en el primer cuadro (130a) y en el segundo cuadro (130b).5. Descodificador según la reivindicación 4, en el que el constructor de cuadros es operativo para construir conjuntos de parámetros que comprenden parámetros BCC que describen una interrelación espacial entre un primer y un segundo canal de audio y en el que los parámetros BCC se eligen de la siguiente lista de parámetros BCC:coherencia/correlación de intercanal (ICC)diferencia de nivel de intercanal (ICLD)diferencia de tiempo de intercanal (ICTD), ydiferencia de fase de intercanal (IPD).6. Descodificador según la reivindicación 4, que comprende además un descodificador diferencial para recibir una indicación de representación y para procesar los conjuntos de parámetros de forma que los parámetros se derivan de una representación espectral de diferencia, siendo la diferencia una diferencia en tiempo, en frecuencia o en tiempo y en frecuencia, en el que el descodificador diferencial está operativo para procesar el primer y el segundo conjunto de parámetros dependiendo de la indicación de representación.7. Descodificador según la reivindicación 6, en el que el constructor de cuadros y el descodificador diferencial están operativos para recibir la indicación (210) de secuencia y una indicación de representación como una palabra de datos binarios que tiene al menos tres bits.8. Método para la compresión de parámetros, incluyendo los parámetros un primer conjunto de parámetros que incluye una representación de una primera porción de una señal de audio o de vídeo original, incluyendo además los parámetros un segundo conjunto de parámetros que incluye una representación de una segunda porción de la señal de audio o de vídeo original, siendo vecina la segunda porción de la primera porción, comprendiendo el método:suministrar una primera y una segunda tupia, teniendo cada tupia cuatro parámetros, en el que el primer conjunto de parámetros incluye una representación de un primer cuadro (130a) de la señal de audio o de vídeo original y en el que el segundo conjunto de parámetros incluye una representación de un segundo cuadro (130b) de la señal de audio o de vídeo original;estimar un número de bits necesario para codificar los conjuntos de parámetros utilizando una primera secuencia de tuplas que incluye la primera tupla basada en una regla de codificación, y para codificar los cuadros que utilizan una segunda secuencia de tuplas que incluye la segunda tupla, basada en la regla de codificación, en el que la regla de codificación es tal que cada tupla tiene asociada a ella una palabra código única de un grupo de palabras código diferentes;proporcionar bloques (118) codificados utilizando la secuencia de tuplas que da como resultado un número menor de bits; yproporcionar una indicación (120b) de secuencia que indica la secuencia de tuplas de la que se derivan los bloques (118) codificados,en el que las tuplas tienen un número de 4 parámetros, y en el que se utiliza un código de Huffman cuatridimensional para codificar las tuplas, siendo el número 4 de la dimensión del código igual al número de parámetros de las tuplas, y en el que la etapa de suministro suministra la primera tupla (152a) que consiste en cuatro parámetros del primer conjunto de parámetros, siendo vecinos los parámetros de los parámetros dentro de la representación de la señal de audio o de vídeo original; yconsistiendo la segunda tupla (152b) endos parámetros del primer conjunto de parámetros, siendo vecinos los dos parámetros dentro de la representación de la señal de audio o de vídeo original, yel mismo número de parámetros del segundo conjunto de parámetros, siendo vecino el mismo número de parámetros dentro la representación de la señal de audio o de vídeo original,en el que los dos parámetros del primer conjunto de parámetros y el mismo número de parámetros del segundo conjunto de parámetros describen la misma banda de frecuencia en el primer cuadro (130a) y en el segundo cuadro (130b).9. Método para descodificar bloques (206) de parámetros codificados, incluyendo los parámetros un primer conjunto de parámetros que incluye una representación de una primera porción de una señal de audio o de vídeo original, incluyendo además los parámetros un segundo conjunto de parámetros que incluye una representación de una segunda porción de la señal de audio o de vídeo original, siendo vecina la segunda porción de la primera porción, y para el procesamiento de una indicación (210) de secuencia, comprendiendo el método:descomprimir, utilizando una regla de descodificación que depende de una regla de codificación utilizada para codificar secuencias de tuplas, el bloque (206) de parámetros codificado para derivar una secuencia de tuplas de parámetros, teniendo cada tupla cuatro parámetros, en el que el primer conjunto de parámetros incluye una representación de un primer cuadro (130a) de la señal de audio o de vídeo original y en el que el segundo conjunto de parámetros incluye una representación de un segundo cuadro (130b) de la señal de audio o de vídeo original, y en el que la regla de codificación es tal que cada tupla tiene asociada a ella una palabra código única de un grupo de palabras código diferentes;recibir la indicación (210) de secuencia que indica una secuencia de tuplas utilizada de un número de secuencias diferentes subyacentes al bloque (206) codificado, en el que el número de secuencias de tuplas diferentes incluye una primera secuencia de tuplas que consiste en primeras tuplas (152a) y una segunda secuencia de tuplas que consiste en segundas tuplas (152b); yconstruir los conjuntos de parámetros utilizando la información de la secuencia de tuplas utilizada, en el que las tuplas primera y segunda tienen 4 parámetros, y en el que un código de Huffman cuatridimensional se utiliza para descodificar las tuplas codificadas, siendo el número 4 de la dimensión del código igual al número de parámetros de las tuplas, yen el que una primera tupla (152a) consiste en cuatro parámetros del primer conjunto de parámetros, siendo vecinos los parámetros de los parámetros dentro de la representación de la señal de audio o de vídeo original, yen el que una segunda tupia (152b) consiste en dos parámetros del primer conjunto de parámetros, siendo vecinos los dos parámetros dentro de la representación de la señal de audio o de vídeo original, y el mismo número de parámetros del segundo conjunto de parámetros, siendo vecino el mismo número de parámetros dentro de la representación de la señal de audio o de vídeo original, y en el que los dos parámetros del primer conjunto de parámetros y el mismo número de parámetros del segundo conjunto de parámetros describen la misma banda de frecuencia en el primer cuadro (130a) y en el segundo cuadro (130b).10. Programa informático que tiene un código de programa para realizar, cuando se ejecuta en un ordenador, un método para la compresión de parámetros según la reivindicación 8.11. Programa informático que tiene un código de programa para realizar, cuando se ejecuta en un ordenador, un método para descodificar bloques (206) de parámetros codificados según la reivindicación 9.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US67099305P | 2005-04-13 | 2005-04-13 | |
US11/243,915 US7991610B2 (en) | 2005-04-13 | 2005-10-05 | Adaptive grouping of parameters for enhanced coding efficiency |
PCT/EP2006/001295 WO2006108464A1 (en) | 2005-04-13 | 2006-02-13 | Adaptive grouping of parameters for enhanced coding efficiency |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2739531T3 true ES2739531T3 (es) | 2020-01-31 |
Family
ID=36581385
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES06723036T Active ES2739531T3 (es) | 2005-04-13 | 2006-02-13 | Agrupamiento adaptable de parámetros para eficiencia de codificación mejorada |
Country Status (18)
Country | Link |
---|---|
US (2) | US7991610B2 (es) |
EP (2) | EP3503409A1 (es) |
JP (1) | JP5027799B2 (es) |
KR (1) | KR100954181B1 (es) |
CN (1) | CN101160726B (es) |
AU (1) | AU2006233512C1 (es) |
BR (3) | BRPI0612356B1 (es) |
CA (1) | CA2607460C (es) |
ES (1) | ES2739531T3 (es) |
IL (1) | IL186315A (es) |
MX (1) | MX2007012663A (es) |
MY (1) | MY141958A (es) |
NO (1) | NO343207B1 (es) |
PL (1) | PL1869774T3 (es) |
PT (1) | PT1869774T (es) |
RU (1) | RU2368074C2 (es) |
TW (1) | TWI321316B (es) |
WO (1) | WO2006108464A1 (es) |
Families Citing this family (51)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5461835B2 (ja) | 2005-05-26 | 2014-04-02 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号の符号化/復号化方法及び符号化/復号化装置 |
JP5227794B2 (ja) | 2005-06-30 | 2013-07-03 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号をエンコーディング及びデコーディングするための装置とその方法 |
AU2006266655B2 (en) | 2005-06-30 | 2009-08-20 | Lg Electronics Inc. | Apparatus for encoding and decoding audio signal and method thereof |
US8185403B2 (en) | 2005-06-30 | 2012-05-22 | Lg Electronics Inc. | Method and apparatus for encoding and decoding an audio signal |
JP5231225B2 (ja) | 2005-08-30 | 2013-07-10 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号をエンコーディング及びデコーディングするための装置とその方法 |
KR100880643B1 (ko) | 2005-08-30 | 2009-01-30 | 엘지전자 주식회사 | 오디오 신호의 디코딩 방법 및 장치 |
US8577483B2 (en) | 2005-08-30 | 2013-11-05 | Lg Electronics, Inc. | Method for decoding an audio signal |
US7788107B2 (en) | 2005-08-30 | 2010-08-31 | Lg Electronics Inc. | Method for decoding an audio signal |
US7672379B2 (en) | 2005-10-05 | 2010-03-02 | Lg Electronics Inc. | Audio signal processing, encoding, and decoding |
US8068569B2 (en) | 2005-10-05 | 2011-11-29 | Lg Electronics, Inc. | Method and apparatus for signal processing and encoding and decoding |
US7696907B2 (en) | 2005-10-05 | 2010-04-13 | Lg Electronics Inc. | Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor |
KR100857112B1 (ko) | 2005-10-05 | 2008-09-05 | 엘지전자 주식회사 | 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치 |
US7751485B2 (en) | 2005-10-05 | 2010-07-06 | Lg Electronics Inc. | Signal processing using pilot based coding |
US7646319B2 (en) | 2005-10-05 | 2010-01-12 | Lg Electronics Inc. | Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor |
EP1952112A4 (en) | 2005-10-05 | 2010-01-13 | Lg Electronics Inc | METHOD AND DEVICE FOR SIGNAL PROCESSING AND CODING AND DECODING METHOD AND DEVICE THEREFOR |
US7840401B2 (en) | 2005-10-24 | 2010-11-23 | Lg Electronics Inc. | Removing time delays in signal paths |
US20080004729A1 (en) * | 2006-06-30 | 2008-01-03 | Nokia Corporation | Direct encoding into a directional audio coding format |
US9565509B2 (en) * | 2006-10-16 | 2017-02-07 | Dolby International Ab | Enhanced coding and parameter representation of multichannel downmixed object coding |
MX2009003564A (es) * | 2006-10-16 | 2009-05-28 | Fraunhofer Ges Forschung | Aparato y metodo para transformacion de parametro multicanal. |
US9653088B2 (en) * | 2007-06-13 | 2017-05-16 | Qualcomm Incorporated | Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding |
US8065166B2 (en) | 2007-10-30 | 2011-11-22 | Onemednet Corporation | Methods, systems, and devices for managing medical images and records |
US9760677B2 (en) | 2009-04-29 | 2017-09-12 | Onemednet Corporation | Methods, systems, and devices for managing medical images and records |
US9171344B2 (en) | 2007-10-30 | 2015-10-27 | Onemednet Corporation | Methods, systems, and devices for managing medical images and records |
US20110002469A1 (en) * | 2008-03-03 | 2011-01-06 | Nokia Corporation | Apparatus for Capturing and Rendering a Plurality of Audio Channels |
EP2144229A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Efficient use of phase information in audio encoding and decoding |
ES2651437T3 (es) | 2008-07-11 | 2018-01-26 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Codificador de audio y decodificador de audio |
KR20100136890A (ko) * | 2009-06-19 | 2010-12-29 | 삼성전자주식회사 | 컨텍스트 기반의 산술 부호화 장치 및 방법과 산술 복호화 장치 및 방법 |
WO2011045548A1 (fr) * | 2009-10-15 | 2011-04-21 | France Telecom | Codage/decodage parametrique bas debit optimise |
KR101336051B1 (ko) * | 2010-01-12 | 2013-12-04 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 오디오 인코더, 오디오 디코더, 오디오 정보 인코딩 방법, 오디오 정보 디코딩 방법, 및 수치적 이전 콘텍스트 값의 수치 표현의 수정을 이용하는 컴퓨터 프로그램 |
JP2013005204A (ja) * | 2011-06-16 | 2013-01-07 | Sony Corp | ビデオ送信装置、ビデオ受信装置、およびビデオ送信方法 |
US8400335B2 (en) | 2011-07-21 | 2013-03-19 | International Business Machines Corporation | Using variable length code tables to compress an input data stream to a compressed output data stream |
US8669889B2 (en) | 2011-07-21 | 2014-03-11 | International Business Machines Corporation | Using variable length code tables to compress an input data stream to a compressed output data stream |
US8692696B2 (en) | 2012-01-03 | 2014-04-08 | International Business Machines Corporation | Generating a code alphabet of symbols to generate codewords for words used with a program |
US8552890B2 (en) * | 2012-01-19 | 2013-10-08 | Sharp Laboratories Of America, Inc. | Lossless coding with different parameter selection technique for CABAC in HEVC |
US9743116B2 (en) | 2012-01-19 | 2017-08-22 | Huawei Technologies Co., Ltd. | High throughput coding for CABAC in HEVC |
US10616581B2 (en) | 2012-01-19 | 2020-04-07 | Huawei Technologies Co., Ltd. | Modified coding for a transform skipped block for CABAC in HEVC |
US9654139B2 (en) | 2012-01-19 | 2017-05-16 | Huawei Technologies Co., Ltd. | High throughput binarization (HTB) method for CABAC in HEVC |
US8581753B2 (en) | 2012-01-19 | 2013-11-12 | Sharp Laboratories Of America, Inc. | Lossless coding technique for CABAC in HEVC |
US20130188736A1 (en) | 2012-01-19 | 2013-07-25 | Sharp Laboratories Of America, Inc. | High throughput significance map processing for cabac in hevc |
US9860527B2 (en) | 2012-01-19 | 2018-01-02 | Huawei Technologies Co., Ltd. | High throughput residual coding for a transform skipped block for CABAC in HEVC |
WO2014031240A2 (en) | 2012-08-21 | 2014-02-27 | Emc Corporation | Lossless compression of fragmented image data |
US9659569B2 (en) | 2013-04-26 | 2017-05-23 | Nokia Technologies Oy | Audio signal encoder |
CN105474308A (zh) * | 2013-05-28 | 2016-04-06 | 诺基亚技术有限公司 | 音频信号编码器 |
CN105659320B (zh) * | 2013-10-21 | 2019-07-12 | 杜比国际公司 | 音频编码器和解码器 |
US9911423B2 (en) | 2014-01-13 | 2018-03-06 | Nokia Technologies Oy | Multi-channel audio signal classifier |
JP6259930B2 (ja) * | 2014-03-25 | 2018-01-10 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | ダイナミックレンジ制御における効率的なゲイン符号化を有するオーディオ符号化装置及びオーディオ復号化装置 |
GB2567427B (en) * | 2017-10-06 | 2020-10-07 | Imagination Tech Ltd | Data compression |
GB2576769A (en) | 2018-08-31 | 2020-03-04 | Nokia Technologies Oy | Spatial parameter signalling |
GB2585187A (en) * | 2019-06-25 | 2021-01-06 | Nokia Technologies Oy | Determination of spatial audio parameter encoding and associated decoding |
JP2023554411A (ja) * | 2020-12-15 | 2023-12-27 | ノキア テクノロジーズ オサケユイチア | 空間音声パラメータの量子化 |
CN115865099B (zh) * | 2022-12-01 | 2024-04-16 | 河南大学 | 基于霍夫曼编码的多类型数据分段压缩方法及系统 |
Family Cites Families (60)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63284974A (ja) | 1987-05-15 | 1988-11-22 | Matsushita Electric Works Ltd | 画像圧縮方式 |
SU1711331A1 (ru) | 1987-05-28 | 1992-02-07 | Всесоюзный научно-исследовательский институт радиовещательного приема и акустики им.А.С.Попова | Устройство кодировани и декодировани сигналов звукового вещани |
US5225904A (en) * | 1987-10-05 | 1993-07-06 | Intel Corporation | Adaptive digital video compression system |
US5532694A (en) | 1989-01-13 | 1996-07-02 | Stac Electronics, Inc. | Data compression apparatus and method using matching string searching and Huffman encoding |
JPH0773249B2 (ja) | 1989-06-29 | 1995-08-02 | 富士通株式会社 | 音声符号化・復号化伝送方式 |
US5325091A (en) | 1992-08-13 | 1994-06-28 | Xerox Corporation | Text-compression technique using frequency-ordered array of word-number mappers |
US5550540A (en) | 1992-11-12 | 1996-08-27 | Internatioal Business Machines Corporation | Distributed coding and prediction by use of contexts |
US5717394A (en) | 1993-02-10 | 1998-02-10 | Ricoh Company Ltd. | Method and apparatus for encoding and decoding data |
JPH07203441A (ja) | 1993-12-28 | 1995-08-04 | Matsushita Graphic Commun Syst Inc | 符号化装置及び復号化装置 |
US5550541A (en) | 1994-04-01 | 1996-08-27 | Dolby Laboratories Licensing Corporation | Compact source coding tables for encoder/decoder system |
CA2156889C (en) | 1994-09-30 | 1999-11-02 | Edward L. Schwartz | Method and apparatus for encoding and decoding data |
KR100209877B1 (ko) | 1994-11-26 | 1999-07-15 | 윤종용 | 복수개의 허프만부호테이블을 이용한 가변장부호화장치 및 복호화장치 |
JPH08179794A (ja) * | 1994-12-21 | 1996-07-12 | Sony Corp | サブバンド符号化方法及び装置 |
US5721720A (en) | 1994-12-28 | 1998-02-24 | Kabushiki Kaisha Toshiba | Optical recording medium recording pixel data as a compressed unit data block |
US5819215A (en) | 1995-10-13 | 1998-10-06 | Dobson; Kurt | Method and apparatus for wavelet based data compression having adaptive bit rate control for compression of digital audio or other sensory data |
CN1158050A (zh) | 1995-12-27 | 1997-08-27 | 汤姆森消费电子有限公司 | 图像数据压缩系统和方法 |
US5870436A (en) | 1997-01-02 | 1999-02-09 | Raytheon Company | Uniform discrete fourier transform filter parameter encoder |
US6237496B1 (en) | 1997-02-26 | 2001-05-29 | Northrop Grumman Corporation | GPS guided munition |
KR100261253B1 (ko) | 1997-04-02 | 2000-07-01 | 윤종용 | 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치 |
US6064954A (en) * | 1997-04-03 | 2000-05-16 | International Business Machines Corp. | Digital audio signal coding |
RU2214047C2 (ru) | 1997-11-19 | 2003-10-10 | Самсунг Электроникс Ко., Лтд. | Способ и устройство для масштабируемого кодирования/декодирования аудиосигналов |
US6862278B1 (en) | 1998-06-18 | 2005-03-01 | Microsoft Corporation | System and method using a packetized encoded bitstream for parallel compression and decompression |
US6166664A (en) | 1998-08-26 | 2000-12-26 | Intel Corporation | Efficient data structure for entropy encoding used in a DWT-based high performance image compression |
US6546049B1 (en) | 1998-10-05 | 2003-04-08 | Sarnoff Corporation | Parameterized quantization matrix adaptation for video encoding |
JP2000151413A (ja) * | 1998-11-10 | 2000-05-30 | Matsushita Electric Ind Co Ltd | オーディオ符号化における適応ダイナミック可変ビット割り当て方法 |
US6624761B2 (en) | 1998-12-11 | 2003-09-23 | Realtime Data, Llc | Content independent data compression method and system |
SE9903552D0 (sv) | 1999-01-27 | 1999-10-01 | Lars Liljeryd | Efficient spectral envelope coding using dynamic scalefactor grouping and time/frequency switching |
JP3323175B2 (ja) | 1999-04-20 | 2002-09-09 | 松下電器産業株式会社 | 符号化装置 |
US6539357B1 (en) | 1999-04-29 | 2003-03-25 | Agere Systems Inc. | Technique for parametric coding of a signal containing information |
SE9903191D0 (sv) | 1999-09-08 | 1999-09-08 | Pacesetter Ab | Compression and decompression coding scheme and apparatus |
US6978236B1 (en) * | 1999-10-01 | 2005-12-20 | Coding Technologies Ab | Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching |
RU2159507C1 (ru) | 1999-10-29 | 2000-11-20 | Аликов Сергей Владимирович | Узел кодирования и/или декодирования информации, система передачи информации с уплотнением каналов, система передачи информации в телекоммуникационной сети |
JP2001151413A (ja) | 1999-11-29 | 2001-06-05 | Shinkawa Ltd | ワイヤボンダにおけるスプールホルダ構造 |
JP3609323B2 (ja) * | 2000-05-08 | 2005-01-12 | 日本電信電話株式会社 | 楽音符号化方法および楽音復号化方法、符号生成方法およびこれらの方法を実行するプログラムを記録した記録媒体 |
JP2001339311A (ja) | 2000-05-26 | 2001-12-07 | Yamaha Corp | オーディオ信号圧縮回路および伸長回路 |
US6813438B1 (en) | 2000-09-06 | 2004-11-02 | International Business Machines Corporation | Method to customize the playback of compact and digital versatile disks |
US6675148B2 (en) * | 2001-01-05 | 2004-01-06 | Digital Voice Systems, Inc. | Lossless audio coder |
US7583805B2 (en) | 2004-02-12 | 2009-09-01 | Agere Systems Inc. | Late reverberation-based synthesis of auditory scenes |
US7006636B2 (en) | 2002-05-24 | 2006-02-28 | Agere Systems Inc. | Coherence-based audio coding and synthesis |
US7292901B2 (en) | 2002-06-24 | 2007-11-06 | Agere Systems Inc. | Hybrid multi-channel/cue coding/decoding of audio signals |
US7644003B2 (en) | 2001-05-04 | 2010-01-05 | Agere Systems Inc. | Cue-based audio coding/decoding |
US20030035553A1 (en) | 2001-08-10 | 2003-02-20 | Frank Baumgarte | Backwards-compatible perceptual coding of spatial cues |
US7116787B2 (en) | 2001-05-04 | 2006-10-03 | Agere Systems Inc. | Perceptual synthesis of auditory scenes |
JP4125565B2 (ja) | 2001-08-31 | 2008-07-30 | 松下電器産業株式会社 | 画像符号化方法、画像復号化方法及びその装置 |
US20030081685A1 (en) * | 2001-10-31 | 2003-05-01 | Montgomery Dennis L. | Method and apparatus for determining patterns within adjacent blocks of data |
KR20040070195A (ko) * | 2001-11-30 | 2004-08-06 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 신호 부호화 |
ES2664270T3 (es) | 2001-12-17 | 2018-04-18 | Microsoft Technology Licensing, Llc | Codificación por omisión de macrobloques |
US8498422B2 (en) * | 2002-04-22 | 2013-07-30 | Koninklijke Philips N.V. | Parametric multi-channel audio representation |
US7039204B2 (en) | 2002-06-24 | 2006-05-02 | Agere Systems Inc. | Equalization for audio mixing |
US7502743B2 (en) * | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
US7433824B2 (en) * | 2002-09-04 | 2008-10-07 | Microsoft Corporation | Entropy coding by adapting coding between level and run-length/level modes |
JP4369140B2 (ja) | 2003-02-17 | 2009-11-18 | パナソニック株式会社 | オーディオ高能率符号化装置、オーディオ高能率符号化方法、オーディオ高能率符号化プログラム及びその記録媒体 |
US7426462B2 (en) | 2003-09-29 | 2008-09-16 | Sony Corporation | Fast codebook selection method in audio encoding |
US7617166B2 (en) * | 2004-04-14 | 2009-11-10 | The Boeing Company | Neural network for aeroelastic analysis |
US7272567B2 (en) * | 2004-03-25 | 2007-09-18 | Zoran Fejzo | Scalable lossless audio codec and authoring tool |
EP1749296B1 (en) * | 2004-05-28 | 2010-07-14 | Nokia Corporation | Multichannel audio extension |
DE102004063950B4 (de) * | 2004-08-07 | 2009-02-19 | Tropf, Hermann | Kanalcodiervorrichtung |
US7161507B2 (en) * | 2004-08-20 | 2007-01-09 | 1St Works Corporation | Fast, practically optimal entropy coding |
KR100857112B1 (ko) * | 2005-10-05 | 2008-09-05 | 엘지전자 주식회사 | 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치 |
ES2651437T3 (es) * | 2008-07-11 | 2018-01-26 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Codificador de audio y decodificador de audio |
-
2005
- 2005-10-05 US US11/243,915 patent/US7991610B2/en active Active
-
2006
- 2006-02-13 PT PT06723036T patent/PT1869774T/pt unknown
- 2006-02-13 CN CN2006800120933A patent/CN101160726B/zh active Active
- 2006-02-13 PL PL06723036T patent/PL1869774T3/pl unknown
- 2006-02-13 MX MX2007012663A patent/MX2007012663A/es active IP Right Grant
- 2006-02-13 BR BRPI0612356-2A patent/BRPI0612356B1/pt active IP Right Grant
- 2006-02-13 RU RU2007141934/09A patent/RU2368074C2/ru active
- 2006-02-13 WO PCT/EP2006/001295 patent/WO2006108464A1/en active Application Filing
- 2006-02-13 CA CA2607460A patent/CA2607460C/en active Active
- 2006-02-13 EP EP19156694.2A patent/EP3503409A1/en active Pending
- 2006-02-13 JP JP2008505744A patent/JP5027799B2/ja active Active
- 2006-02-13 BR BR122019014628-4A patent/BR122019014628B1/pt active IP Right Grant
- 2006-02-13 EP EP06723036.7A patent/EP1869774B1/en active Active
- 2006-02-13 BR BR122019014976-3A patent/BR122019014976B1/pt not_active IP Right Cessation
- 2006-02-13 AU AU2006233512A patent/AU2006233512C1/en active Active
- 2006-02-13 ES ES06723036T patent/ES2739531T3/es active Active
- 2006-02-13 KR KR1020077022723A patent/KR100954181B1/ko active IP Right Grant
- 2006-02-15 MY MYPI20060645A patent/MY141958A/en unknown
- 2006-04-11 TW TW095112773A patent/TWI321316B/zh active
-
2007
- 2007-09-25 IL IL186315A patent/IL186315A/en active IP Right Grant
- 2007-11-12 NO NO20075796A patent/NO343207B1/no unknown
-
2010
- 2010-11-17 US US12/948,417 patent/US9043200B2/en active Active
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2739531T3 (es) | Agrupamiento adaptable de parámetros para eficiencia de codificación mejorada | |
US7788106B2 (en) | Entropy coding with compact codebooks | |
ES2320800T3 (es) | Codificacion sin perdidas de informacion con velocidad de bits maxima garantizada. |