ES2312025T3 - Esquema de codificador/descodificador de multicanal casi transparente o transparente. - Google Patents

Esquema de codificador/descodificador de multicanal casi transparente o transparente. Download PDF

Info

Publication number
ES2312025T3
ES2312025T3 ES05797659T ES05797659T ES2312025T3 ES 2312025 T3 ES2312025 T3 ES 2312025T3 ES 05797659 T ES05797659 T ES 05797659T ES 05797659 T ES05797659 T ES 05797659T ES 2312025 T3 ES2312025 T3 ES 2312025T3
Authority
ES
Spain
Prior art keywords
signal
multichannel
channel
residual
parameters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES05797659T
Other languages
English (en)
Inventor
Jonas Lindblom
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Application granted granted Critical
Publication of ES2312025T3 publication Critical patent/ES2312025T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Error Detection And Correction (AREA)
  • Dc Digital Transmission (AREA)
  • Analogue/Digital Conversion (AREA)
  • Glass Compositions (AREA)
  • Optical Measuring Cells (AREA)
  • Structure Of Printed Boards (AREA)
  • Piezo-Electric Transducers For Audible Bands (AREA)
  • Electroluminescent Light Sources (AREA)
  • Devices For Indicating Variable Information By Combining Individual Elements (AREA)

Abstract

Un codificador de multicanal para codificar una señal de multicanal original que tiene por lo menos dos canales, caracterizado porque comprende: un proveedor de parámetros para proporcionar uno o más parámetros, el uno o más parámetros son formados de tal manera que una señal de multicanal reconstruida puede ser formada utilizando uno o más canales de mezcla descendente derivados de la señal de multicanal y el uno o más parámetros; un codificador residual para generar una señal residual codificada en base a la señal de multicanal original, el uno o más canales de mezcla descendente o el uno o más parámetros, de tal manera que la señal de multicanal reconstruida, cuando es formada utilizando la señal residual es más similar a la señal de multicanal original que cuando es formada sin usar la señal residual, el codificador residual incluye un descodificador de multicanal para generar una señal de multicanal descodificada utilizando el uno o más canales de mezcla descendente y el uno o más parámetros; un calculador de error para calcular una representación de señal de error de multicanal en base a la señal de multicanal descodificada y la señal de multicanal original y un procesador residual para procesar la representación de señal de error de multicanal para obtener la señal residual codificada, y un formador de corriente de datos para formar una corriente de datos que tiene la señal residual codificada y el uno o más parámetros.

Description

Esquema de codificador/descodificador de multicanal casi transparente o transparente.
Campo de la invención
La presente invención es concerniente con esquemas de codificación de multicanal y en particular con esquemas de codificación de multicanal paramétricos.
Antecedentes de la invención y técnica anterior
Hoy en día, dos técnicas dominan el aprovechamiento de la irrelevancia y la redundancia estéreo contenida en las señales de audio estereofónicas. La codificación estéreo de lado medio (M/S) [1], tiene objetivo principalmente la remoción de redundancia y está basada en el hecho de que puesto que los dos canales están frecuentemente bastante correlacionados, es mejor codificar la suma y la diferencia entre los dos. Más bits (relativamente) pueden luego ser gastados en la señal de suma de alta potencia que en la señal de lado de baja potencia (o diferencia). La codificación estéreo de intensidad [2, 3], por otra parte, obtiene remoción de irrelevancia mediante, en cada sub-banda, reemplazar las dos señales por una señal de suma y un ángulo de azimut. En el descodificador, el parámetro de azimut es usado para controlar la ubicación espacial del evento auditivo representado por la señal de suma de sub-banda. Estéreo de lado medio y estéreo de intensidad son ambos usados extensamente en los estándares de codificación de audio existentes [4].
Un problema con el procedimiento de M/S hacia el aprovechamiento de redundancia, es que si los dos componentes están fuera de fase (uno está retardado en relación con el otro), la ganancia de codificación de M/S se desvanece. Este es un problema conceptual, puesto que los retardos de tiempo son frecuentes en las señales de audio reales. Por ejemplo, la audición espacial depende mucho de las diferencias de tiempo entre las señales (especialmente a bajas frecuencias) [5]. En las grabaciones de audio, los retardos de tiempo se pueden derivar tanto de ajustes de micrófono estereofónicos como de post-procesamiento artificial (efectos de sonido). En la codificación de lado medio, una solución ad-hoc es frecuentemente usada para la cuestión de retardo de tiempo: la codificación de M/S es usada solamente cuando la potencia de la señales de diferencia es menor que un factor constante de aquel de la señal de suma [1]. El problema de alineación es tratado mejor en [6], en donde uno de los componentes de señal es precedido del otro. Los filtros de predicción son derivados en una base de cuadro por cuadro en el codificador, y son transmitidos como información lateral. En [7], una alternativa adaptable hacia atrás es considerada. Se notará que la ganancia de desempeño es fuertemente dependiente del tipo de señal, pero para ciertos tipos de señales, se obtiene una ganancia espectacular en comparación con la codificación estéreo de M/S.
La codificación estéreo paramétrica ha recibido mucha atención últimamente [8-11]. En base a un codificador mono de núcleo (un solo canal), tales esquemas paramétricos extraen el componente estéreo (multicanal) y los codifican separadamente a una velocidad de bits relativamente baja. Esto se puede ver como una generalización de la codificación estéreo de intensidad. Los métodos de codificación estéreo paramétricos son particularmente útiles en el intervalo de baja velocidad de bits de codificación de audio, en donde se tiene como resultado un incremento significativo en la calidad de gastar solamente una pequeña parte del presupuesto de bits totales en el componente estéreo. Los métodos paramétricos también son atractivos puesto que son extensibles al caso de multicanal (más de dos canales) y tiene la habilidad de ofrecer compatibilidad hacia atrás: surround MP3 [12] es un ejemplo en donde los datos de multicanal son codificados y transmitidos en el campo auxiliar de la corriente de datos. Esto permite que receptores sin capacidades de multicanal descodifiquen una señal estéreo normal, mientras que los receptores con capacidad surround pueden disfrutar audio de multicanal. Los métodos paramétricos dependen frecuentemente de la extracción y codificación de diferentes indicaciones psicoacústicas, principalmente diferencias de nivel intercanal (ICLD) y diferencias de tiempo intercanal (ICTD). En [11], se reporta que un parámetro de coherencia es importante para un resultado de sonido natural. Sin embargo, los métodos paramétricos están limitados en el sentido que a velocidades de bit más alta, los codificadores no son aptos de alcanzar celda transparente debido a la restricción de modelado inherente.
Los problemas relacionados con los codificadores de multicanal paramétricos son que su valor de calidad obtenible máximo está limitado a un umbral, que es significativamente menor que la calidad transparente. El umbral de calidad paramétrico es mostrado en 1100 en la figura 11. Como se puede ver de una curva esquemática que representa la dependencia de calidad/densidad de bits de un mono codificador BCC mejorado (1102), la calidad no puede cruzar el umbral de calidad paramétrico 1100 sin consideración de la velocidad de bits. Esto significa que aún con una velocidad de bits incrementada, la cálida de tal codificador de multicanal paramétrico no se puede incrementar más.
El mono codificador BCC mejorado es un ejemplo de los codificadores estéreo actualmente existentes o codificadores de multicanal en los cuales se efectúa una mezcla descendente estéreo o una mezcla descendente de multicanal. Adicionalmente, los parámetros son derivados que describen relaciones de nivel intercanal, relaciones de tiempo intercanal, relaciones de coherencia intercanal, etc.
Los parámetros son diferentes de una señal de forma de onda de tal manera que una señal lateral de un codificador medio/lateral, puesto que la señal lateral describe una diferencia entre dos canales en un formato de estilo de forma de onda en comparación con la representación paramétrica, que describe similaridades o disimilaridades entre dos canales al dar un cierto parámetro en lugar de una representación de forma de onda de muestra en muestra. En tanto que los parámetros requieren un bajo número de bits que sean transmitidos de un codificador a un descodificador, descripciones de forma de onda, esto es, señales residuales son derivadas en un estilo de forma de onda requieren más bits y permiten en principio una reconstrucción transparente.
La figura 11 muestra una dependencia de calidad/velocidad de bits típica de tal codificador estéreo convencional a base de forma de onda (1104). Se vuelve claro de la figura 11 que, al incrementar la velocidad de bits más y más, la calidad de codificador estéreo convencional tal como el codificador estéreo medio/lateral se incrementa más y más hasta que la calidad llega a la calidad transparente. Hay una clase de "velocidad de bits de cruce", a la cual la curva característica 1102 para el codificador de multicanal paramétrico y la curva 1104 para el codificador estéreo a base de forma de onda convencional se cruzan entre sí.
Debajo de esta velocidad de bits de cruce, el codificador de multicanal paramétrico es mucho mejor que el codificador estéreo convencional. Cuando la misma velocidad de bits para ambos codificadores es considerada, el codificador de multicanal paramétrico proporciona una calidad que es más alta que la calidad del codificador estéreo a base de forma de onda convencional por la diferencia de calidad 1108. En otras palabras, cuando se desea tener una cierta calidad 1110, esta calidad puede ser obtenida utilizando el codificador paramétrico por una velocidad de bits que es reducida por una velocidad de bits de diferencia 1112 en comparación con un codificador estéreo a base de forma de onda convencional.
Por encima de la velocidad de bits de cruce, sin embargo, la situación es completamente diferente. Puesto que el codificador paramétrico está en su umbral 1100 de calidad de codificador paramétrico máxima, una mejor calidad puede solamente ser obtenida al utilizar un codificador estéreo a base de forma de onda convencional que usa el mismo número de bits como en el codificador paramétrico.
Sumario de la invención
Es el objeto de la presente invención proporcionar un esquema de codificación/descodificación que permita calidad incrementada y velocidad de bits reducida en comparación con los esquemas de codificación de multicanal existentes.
De acuerdo con el primer aspecto de la invención, este objeto es obtenido mediante un codificador de multicanal para codificar una señal de multicanal original que tiene por lo menos dos canales, que comprende: proveedor de parámetros para proporcionar uno o más parámetros, el uno o más parámetros son formados de tal manera que una señal de multicanal reconstruida puede ser formada utilizando uno o más canales de mezcla descendente derivados de la señal de multicanal y el uno o más parámetros; codificador residual para generar una señal residual codificada en base a la señal de multicanal original, el uno o más canales de mezcla descendente o el uno o más parámetros de tal manera que la señal de multicanal reconstruida cuando es formada utilizando la señal residual es más similar a la señal de multicanal original que cuando es formada sin usar la señal residual, el codificador residual que incluye un descodificador de multicanal para generar una señal de multicanal descodificada utilizando el uno o más canales de mezcla descendente y el uno o más parámetros; un calculador de error para calcular una representación de señal de error de multicanal en base a la señal de multicanal descodificada y la señal de multicanal original; y un procesador residual para procesar la representación de señal de error de multicanal para obtener la señal residual codificada y formador de corriente de datos para formar una corriente de datos que tiene la señal residual codificada y el uno o más parámetros.
De acuerdo con un segundo aspecto de la presente invención, este objeto es obtenido mediante un descodificador de multicanal para descodificar una señal de multicanal codificada que tiene uno o más canales de mezcla descendente, uno o más parámetros y una señal residual codificada, el uno o más canales de mezcla descendente dependen de un parámetro de alineación o un parámetro de ganancia, que comprende: un descodificador residual para generar una señal residual descodificada en base a la señal residual codificada y un descodificador de multicanal para generar una primera señal de multicanal reconstruida utilizando uno o más canales de mezcla descendente y el uno o más parámetros, en donde el descodificador de multicanal es operativo adicionalmente para generar una segunda señal de multicanal reconstruida utilizando el uno o más canales de mezcla descendente y la señal residual descodificada, en donde el descodificador de multicanal es operativo adicionalmente para ponderar el canal de mezcla descendente utilizando el parámetro de ganancia, para agregar la señal residual descodificada a un canal de mezcla descendente ponderado y para ponderar otra vez un canal resultante para obtener la primera señal de multicanal reconstruida y para restar la señal residual descodificada del canal de mezcla descendente y ponderar un canal resultante de la sustracción utilizando el parámetro de ganancia o para desalinear una diferencia entre el canal de mezcla descendente y la señal residual descodificada cuando se obtiene la segunda señal de multicanal reconstruida.
De acuerdo con un tercer aspecto de la presente invención, este objeto es obtenido mediante un codificador de multicanal para codificar una señal de multicanal original que tiene por lo menos dos canales, que comprende: un alineador de tiempo para alinear un primer canal y un segundo canal de los por lo menos dos canales utilizando un parámetro de alineación; un mezclador descendente para generar un canal de mezcla descendente utilizando los canales alineados; un calculador de ganancia para calcular un parámetro de ganancia no igual a uno para ponderar un canal alineado, de tal manera que la diferencia entre los canales alineados es reducida en comparación con un valor de ganancia de uno y un formador de corriente de datos para formar una corriente de datos que tiene información en cuanto al canal de mezcla descendente, información en cuanto al parámetro de alineación e información en cuanto al parámetro de ganancia.
De acuerdo con un cuarto aspecto de la presente invención, este objeto es obtenido mediante un descodificador de multicanal para descodificar una señal de multicanal codificada que tiene información en cuanto a uno o más canales de mezcla descendente, información en cuanto a un parámetro de ganancia, información en cuanto a un parámetro de alineación y una señal residual codificada, que comprende: un descodificador de canal de mezcla descendente para generar un canal de mezcla descendente descodificado y un procesador para procesar el canal de mezcla descendente descodificado utilizando el parámetro de ganancia para obtener un primer un canal de salida descodificado y para procesar el canal de mezcla descendente descodificado utilizando el parámetro de ganancia y para desalinear utilizando el parámetro de alineación para obtener un segundo canal de salida descodificado; y un descodificador residual para generar una señal residual descodificada, en donde el procesador es operativo para ponderar principalmente el canal de mezcla descendente utilizando el parámetro de ganancia, para agregar la señal residual descodificada y para ponderar en segundo lugar utilizando el parámetro de ganancia para obtener un primer canal reconstruido y para restar la señal residual descodificada del canal de mezcla descendente antes de la ponderación y para desalinear para obtener el segundo canal reconstruido.
Aspectos adicionales de la presente invención incluyen métodos correspondientes, corrientes de datos/archivos y programas de computadora.
La presente invención está basada en el hallazgo de que los problemas relacionados con los codificadores paramétricos convencionales y codificadores a base de forma de onda son tratados al combinar codificación paramétrica y codificación a base de forma de onda. Tal codificador de la invención genera una corriente de datos escalada que tiene, como primera capa de mejora, una representación de parámetro codificada y que tiene, como segunda capa de mejora, una señal residual codificada, que es preferiblemente una señal estilo forma de onda. En general, una señal residual adicional, que no es proporcionada en un codificador de multicanal paramétrico puro permite mejorar la calidad obtenible en particular entre la velocidad de bits de cruce en la figura 11 y la calidad transparente máxima. Como se puede ver en la figura 11, aún debajo de la velocidad de bits de cruce, el algoritmo decodificador de la invención funciona mejor que un codificador de multicanal paramétrico puro con respecto a calidad a velocidades de bits comparables. En comparación con un codificador estéreo convencional plenamente a base de forma de onda, sin embargo, el esquema de parámetro/codificación de forma de onda/descodificación combinado es mucho más eficiente en bits. En otras palabras, los dispositivos de la invención combinan óptimamente las ventajas de codificación paramétrica y codificación a base de forma de onda, de tal manera que, aún por encima de la velocidad de bits de cruce, el codificador de la invención se beneficia del concepto paramétrico, pero funciona mejor que el codificador paramétrico puro.
Dependiendo de ciertas modalidades, las ventajas de la presente invención superan al codificador paramétrico del arte previo o codificador de multicanal a base de forma de onda convencional más o menos. Modalidades más avanzadas proporcionan una mejor característica de calidad/velocidad de bits, en tanto que modalidades de bajo nivel de la presente invención requieren menos energía de procesamiento en el lado del codificador y/o descodificador, pero, debido a las señales residuales codificadas adicionalmente, permiten una mejor calidad que un codificador paramétrico puro, puesto que la calidad del codificador paramétrico puro está limitada por la calidad de umbral 1100 en la figura 11.
El esquema de codificación/descodificación de la invención es ventajoso en que es apto de moverse sin costuras desde la codificación paramétrica pura a la codificación de aproxima de forma de onda o codificación de forma de onda transparente perfecta.
Preferiblemente, la codificación estéreo paramétrica y codificación estéreo media/lateral son combinadas a un esquema que tiene la habilidad de converger hacia la calidad transparente. En este esquema relacionado con estéreo medio/lateral preferido, la correlación entre los componentes de señal, esto es, el canal izquierdo y el canal derecho son aprovechados más eficientemente.
En general, la idea de la invención puede ser aplicada en varias modalidades a un codificador de multicanal paramétrico. En una modalidad, la señal residual es derivada de la señal original sin usar la información de parámetros también disponible en el codificador. Esta modalidad es preferible en situaciones en donde la energía de procesamiento y posiblemente el consumo de energía del procesador son una cuestión. Tal situación puede ocurrir en dispositivos portátiles que tienen posibilidades de energía restringida tales como teléfonos móviles, palm tops, etc. La señal residual es solamente derivada de la señal original y no depende de una mezcla descendente o los parámetros. Por consiguiente, en el lado del descodificador, la primera señal de multicanal reconstruido, que es generada utilizando el canal de mezcla descendente y los parámetros no es usada para generar la segunda señal de multicanal reconstruida.
No obstante, hay algo de redundancia en los parámetros por una parte y la señal residual por otra parte. Una redundancia-reducción puede ser obtenida mediante otros sistemas de codificadores/descodificador que, para calcular la señal residual codificada, hacen uso de la información de parámetros disponible en el codificador y opcionalmente, también del canal de mezcla descendente, que podría también estar disponible en el codificador.
Dependiendo de la cierta situación, el codificador residual puede ser un dispositivo de análisis mediante síntesis que calcula una señal de multicanal reconstruida completa utilizando el canal de mezcla descendente y la información de parámetros. Luego, en base a la señal reconstruida, una señal de diferencia para cada canal puede ser generada, de tal manera que se obtiene una representación de error de multicanal, que puede ser procesada de maneras diferentes. Una manera sería aplicar otro esquema de codificación de multicanal paramétrico a la representación de error de multicanal. Otra posibilidad sería efectuar un esquema de formación de matriz para la mezcla descendente de la representación de error de multicanal. Otra posibilidad sería cancelar las señales de error de los canales surround izquierdo y derecho y codificar solamente la señal de error de canal central o además, también codificar la señal de error de canal izquierdo y la señal de error del canal derecho.
Así, existen muchas posibilidades para implementar un procesador residual a base de una representación de error.
La modalidad mencionada anteriormente permite alta flexibilidad para la codificación escalable de la señal residual. Sin embargo, es bastante demandante en energía de procesamiento, puesto que una reconstrucción de multicanal completa es efectuada en el codificador y una representación de error para cada canal de la señal de multicanal va a ser generada e introducida al procesador residual. En el lado del descodificador, es necesario calcular primero la primera señal de multicanal reconstruida y luego, en base a la señal residual descodificada, que es cualquier representación de la señal de error, la segunda señal reconstruida tiene que ser generada. Así, independientemente del hecho, si la primera señal reconstruida va a ser emitida o no, tiene que ser calculada en el lado del descodificador.
En otra modalidad preferida de la presente invención, el procedimiento de análisis mediante síntesis en el lado del codificador y el cálculo de la primera señal de multicanal reconstruido, independientemente del hecho, si va a ser emitida o no, son reemplazados por un cálculo del lado del codificador directa de la señal residual. Este está basado en un canal original ponderado que depende de un parámetro de multicanal o está basado en una clase de una mezcla descendente modificada que depende otra vez de un parámetro de alineación. En este esquema, la información adicional, esto es, la señal residual es calculada no iterativamente utilizando los parámetros y las señales originales, pero no usado el uno o más canales de mezcla descendentes.
Este esquema es muy eficiente en los lados del codificador y el descodificador. Cuando la señal residual no es transmitida o ha sido cortada de una corriente de datos escalables debido a los requerimientos de ancho de banda, el descodificador de la invención genera automáticamente una primera señal de multicanal reconstruida a base del canal de mezcla descendente y los parámetros de ganancia y alineación, en tanto que, cuando una señal residual no es igual a cero es introducida, el reconstructor de multicanal no calcula la primera señal de multicanal reconstruida, sino que solamente calcula la segunda señal de multicanal reconstruida. Así, este esquema de codificador/descodificador es ventajoso en que permite un cálculo bastante eficiente en el lado del codificador también como el lado del descodificador y utiliza la representación de parámetros para reducir la redundancia en la señal residual, de tal manera que se obtiene un esquema de codificación/descodificación muy eficiente en energía de procesamiento y eficiente en velocidad de bits.
Breve descripción de las figuras
Modalidades preferidas de la presente invención son descritas en detalle con respecto a las figuras adjuntas, en las cuales:
La figura 1 es un diagrama de bloques de una representación general del codificador de multicanal de la invención;
La figura 2 es un diagrama de bloques de una representación general de un descodificador de multicanal;
La figura 3 es un diagrama de bloques de una modalidad del lado del codificador de baja energía de procesamiento;
La figura 4 es un diagrama de bloques de una modalidad de descodificador para el sistema de codificador de la figura 3;
La figura 5 es un diagrama de bloques de una modalidad de codificador a base de análisis mediante síntesis;
La figura 6 es un diagrama de bloques de una modalidad de descodificador correspondiente a la modalidad del codificador de la figura 5;
La figura 7 es un diagrama de bloques general de una modalidad de codificador directo que tiene redundancia reducida en la señal residual codificada;
La figura 8 es una modalidad preferida de un descodificador correspondiente al codificador de la figura 7;
La figura 9a es una modalidad preferida de un esquema de codificador/descodificador a base del concepto de las figuras 7 y 8;
La figura 9b es una modalidad preferida de la modalidad de la figura 9a, cuando ninguna señal residual sino solamente parámetros de alineación y ganancia son transmitidos;
La figura 9c es un conjunto de ecuaciones usadas en el lado del codificador en las figuras 9a y 9b;
La figura 9d es un conjunto de ecuaciones usadas en el lado del descodificador en las figuras 9a y 9b;
La figura 10 es una modalidad a base de banco de filtro de análisis/banco de filtro de síntesis del esquema de las figuras 9a a 9d; y
La figura 11 ilustra una comparación de un desempeño típico de codificadores paramétricos y a base de forma de onda convencionales y el codificador mejorado de la invención.
Descripción detallada de las modalidades preferidas
La figura 1 muestra una modalidad preferida de un codificador de multicanal para codificar una señal de multicanal original que tiene por lo menos dos canales. El primer canal puede ser un canal izquierdo 10a y el segundo canal puede ser un canal derecho 10b en un ambiente estéreo. Aunque las modalidades de la invención son descritas en el contexto de un esquema estéreo, la extensión a un esquema de multicanal es directa, puesto que una representación de multicanal que tiene por ejemplo 5 canales tiene varios pares de un primer canal y un segundo canal. En el contexto de un esquema surround 5.1, el primer canal puede ser el canal izquierdo frontal y el segundo canal puede ser el canal derecho frontal. Alternativamente, el primer canal puede ser el canal izquierdo frontal y el segundo canal puede ser el canal central. Alternativamente, el primer canal puede ser el canal central y el segundo canal puede ser el canal derecho frontal. Alternativamente, el primer canal puede ser el canal izquierdo posterior (canal surround izquierdo) y el segundo canal puede ser el canal derecho posterior (canal surround derecho).
Un codificador de la invención puede incluir un mezclador descendente 12 para generar uno o más canales de mezcla descendente. En el ambiente estéreo, el mezclador descendente 12 generará un solo canal de mezcla descendente. En un ambiente de multicanal, sin embargo, el mezclador descendente 12 puede generar varios canales de mezcla descendente. En un ambiente de multicanal 5.1, el mezclador descendente 13 genera preferiblemente dos canales de mezcla descendente. En general, el número de canales de mezcla descendente es más pequeño que el número de canales en la señal de multicanal original.
El codificador de multicanal de la invención también incluye un proveedor de parámetro 14 para proporcionar uno o más parámetros, el uno o más parámetros son formados de tal manera que una señal de multicanal reconstruida puede ser formada utilizando el uno o más canales de mezcla descendente derivados de la señal de multicanal y el uno o más parámetros.
Importantemente, el codificador de multicanal de la invención incluye además un codificador residual 16 para generar una señal residual codificada. La señal residual codificada es generada en base la señal de multicanal original, el uno o más canales de mezcla descendente o el uno o más parámetros. En general, la señal residual codificada es generada de tal manera que la señal de multicanal reconstruida cuando es formada utilizando la señal residual es más similar a la señal de multicanal original que cuando es formada sin la señal residual. Así, la señal residual codificada permite que el descodificador genere una señal de multicanal reconstruida que tiene una calidad más alta que el umbral de calidad paramétrico 1100 mostrado en la figura 11. El uno o más parámetros y la señal residual codificada son introducidos a un formador de corriente de datos 18, que forma una corriente de datos que tiene la señal residual y el uno o más parámetros. Preferiblemente, la corriente de datos emitida por el formador de corriente de datos 18 es una corriente de datos escalada que tiene una primera capa de mejora que incluye información en cuanto al uno o más parámetros y una segunda capa de mejora que información en cuanto a la señal residual codificada. Como es conocido en el arte, las diferentes capas de escalamiento en una corriente de datos escalada pueden ser descodificadas individualmente, de tal manera que un dispositivo de bajo nivel, tal como un descodificador paramétrico puro está en la posición para descodificar la corriente de datos escalada al simplemente ignorar la segunda capa de mejora.
En una modalidad de la presente invención, la corriente de datos escalada incluye además, como una capa base, el uno o más canales de mezcla descendente. Sin embargo, la presente invención también es aplicable en un ambiente en el cual el usuario ya está en posesión del canal de mezcla descendente. Esta situación puede ocurrir, cuando el canal de mezcla descendente es una señal mono o señal estéreo, que el usuario ya ha recibido vía otro canal de transmisión o vía el mismo canal de transmisión pero antes en comparación con la recepción de la primera capa de mejora y la segunda capa de mejora. Cuando hay una transmisión separada del(los) canal(es) de mezcla descendente y las primeras y segundas capas de mejora, el codificador no tiene necesariamente que incluir el mezclador descendente 12. Esta situación es indicada por la línea discontinua del bloque del mezclador descendente.
Adicionalmente, el proveedor de parámetros 14 no tiene necesariamente que calcular realmente los parámetros en base al primero y el segundo canal original. En situaciones en los cuales los parámetros para una cierta señal de canal ya existen, es suficiente proporcionar los parámetros ya generados al codificador de la figura 1, de tal manera que estos parámetros son suministrados al formador de corriente de datos 18 y al codificador residual para ser usados opcionalmente para el cálculo de la señal residual y para ser introducidos a la corriente de datos escalada. Preferiblemente, sin embargo, el codificador residual usa adicionalmente los parámetros como se muestra por una línea de conexión de puntos 19.
En una modalidad preferida de la presente invención, el codificador residual 16 puede ser controlado vía una entrada de control de velocidad de bits separada. En este caso, el codificador residual comprende un cierto codificador de pérdida tal como un cuantificador que tiene un tamaño de etapa de cuantificador controlable. Cuando un tamaño de etapa de cuantificador grande es señalizada vía la entrada de control de velocidad de bits, la señal residual codificada tendrá un intervalo de valor más pequeño (el índice de cuantificación más grande emitido por el cuantificador) en comparación con un caso en el cual un tamaño de etapa de cuantificador más pequeño es señalizado vía la entrada de control de velocidad de bits. El tamaño de etapa de cuantificador grande dará como resultado una demanda de bits más baja para la señal residual codificada y por consiguiente, dará como resultado una corriente de datos escalada que tiene una velocidad de bits reducida en comparación con el caso en el cual el cuantificador dentro del codificador residual 16 tiene un tamaño de etapa de cuantificador más pequeño dando como resultado una señal residual codificada que necesita más bits.
Estrictamente hablando, las observaciones anteriores se aplican a la cuantificación escalar. Dicho en general, sin embargo, es preferido usar un codificador que tiene resolución controlable, que está a base de una técnica de cuantificación de vector. Cuando la resolución es alta, se requieren más bits para codificar la señal residual en comparación con el caso en el cual la resolución es baja.
La figura 2 muestra una modalidad preferida de un descodificador de multicanal de la invención, que puede ser usado en relación con el codificador de la figura 1. En particular, la figura 2 muestra un descodificador de multicanal para descodificar una señal de multicanal codificada que tiene uno o más canales de mezcla descendente, uno o más parámetros y una señal residual codificada. Toda esta información, esto es, el canal de mezcla descendente, los parámetros y las señalarse residuales codificadas son incluidos en una corriente de datos escalada 20 introducida a un analizador sintáctico de corriente de datos que extrae la señal residual codificada de la corriente de datos escalada 20 y envía la señal residual codificada a un descodificador residual 22. Análogamente, el uno o más canales de mezcla descendente preferiblemente codificados son proporcionados a un descodificador de mezcla descendente 24. Adicionalmente, los uno o más parámetros preferiblemente codificados son proporcionados a uno descodificador de parámetros 23 para proporcionar el uno o más parámetros en una forma descodificada. Esta información emitida por los bloques 22, 23 y 24 es introducida a un descodificador de multicanal 25 para generar una primera señal de multicanal reconstruida 26 o una segunda señal de multicanal reconstruida 27. La primera señal de multicanal reconstruida es generada por el descodificador de multicanal 25 utilizando el uno o más canales de mezcla descendente y el uno o más parámetros, pero no usando la señal residual. La segunda señal de multicanal reconstruida 27, sin embargo, es generada utilizando el uno o más canales de mezcla descendente y la señal residual descodificada. Puesto que la señal residual incluye información adicional y preferiblemente información de forma de onda, la segunda señal de multicanal reconstruida 27 es más similar a una señal de multicanal original (tales como canales 10a y 10b de la figura 1) que la primera señal de multicanal reconstruida.
Dependiendo de la cierta implementación del descodificador de multicanal 25, el descodificador de multicanal 25 emitirá ya sea la primera señal de multicanal reconstruido 26 o la segunda señal de multicanal reconstruida 27. Alternativamente, el descodificador de multicanal 25 calcula la primera señal de multicanal reconstruida además de la segunda señal de multicanal reconstruida. Naturalmente, en todas las implementaciones, el descodificador de multicanal 25 solamente emitirá la segunda señal de multicanal reconstruida, cuando la corriente de datos escalada incluye la señal residual codificada. Sin embargo, cuando la corriente de datos escalada es procesada desde el codificador al descodificador al separar la segunda capa de mejora, el descodificador de multicanal 25 solamente emitirá la primera señal de canal reconstruida. Tal separación de la segunda capa de mejora puede tomar lugar cuando hubo un canal de transmisión en camino entre el codificador y el descodificador, que tuvo recursos de ancho de banda altamente limitados, de tal manera que la transmisión de la corriente de datos escalada fue solamente posible sin la segunda capa de mejora.
Las figuras 3 y 4 ilustran una modalidad de concepto de la invención, que requiere solamente energía de procesamiento reducida en el lado de codificador (figura 3) también como en el lado del descodificador (figura 4). El codificador de la figura 3 incluye un codificador estéreo de intensidad 30, que emite una mono señal de mezcla descendente por una parte e información de dirección estéreo de intensidad paramétrica por otra parte. La mono mezcla descendente, que es preferiblemente formada al agregar el primero y el segundo canal de entrada y la información de dirección paramétrica son introducidos a un reductor de velocidad de datos 31. Para el canal de mono mezcla descendente, el reductor de velocidad de datos 31 puede incluir cualquiera de los codificadores de audio bien conocidos, tales como un codificador MP3, un codificador AAC o cualquier otro codificador de audio para mono señales. Para la información de dirección paramétrica, el reductor de velocidad de datos 31 puede incluir cualquiera de los codificadores conocidos para información paramétrica tales como un decodificador de diferencia, un cuantificador y/o un codificador de entropía tal como un codificador de Huffman o un codificador aritmético. Así, los bloques 30 y 31 de la figura 3 proporcionan las funcionalidades ilustradas esquemáticamente por los bloques 12 y 14 del codificador de la figura 1.
El codificador residual 16 incluye un calculador de señal lateral 32 y un reductor de velocidad de datos aplicado subsecuentemente 33. El calculador de señal lateral 32 efectúa un cálculo de señal lateral conocido de codificadores medio/lateral del arte previo. Un ejemplo preferido es un cálculo de diferencia de muestra en muestra entre el primer canal 10a y el segundo canal 10b para obtener una señal lateral tipo forma de onda, que luego es introducida al reductor de velocidad de datos 33 para la compresión de velocidad de datos. El reductor de velocidad de datos 33 puede incluir los mismos elementos como se bosqueja adicionalmente con respecto al reductor de velocidad de datos 31. En la salida del bloque 33, se obtiene una señal residual codificada, que es introducida al formador de corriente de datos 18, de tal manera que se obtiene una corriente de datos preferiblemente escalada.
La corriente de datos emitida por el bloque 18 incluye ahora, además de la mono mezcla descendente, información de dirección estéreo de intensidad paramétrica también como una señal residual codificada tipo forma de onda.
El reductor de velocidad de datos 33 puede ser controlado por una entrada de control de velocidad de bits como ya se discute en relación con la figura 1. En otra modalidad, el reductor de velocidad de datos 33 está dispuesto para generar una corriente de datos de salida escalada que tiene, en su capa base, una señal residual codificada con un número de bits bajo por muestra y que tiene, en su primera capa de mejora, una señal residual codificada con un número medio de bits por muestra y que tiene, en su siguiente capa de mejora, una señal residual codificada con otra vez un número más alto de bits por muestra. Para la capa base de la salida del reductor de velocidad de datos, se puede usar por ejemplo 0.5 bits por muestra. Para la primera capa de mejora se pueden usar por ejemplo 4 bits por muestra y para la segunda capa de mejora se pueden usar por ejemplo 16 bits/muestra.
Un descodificador correspondiente es mostrado en la figura 4. La corriente de datos introducida al analizador sintáctico de corriente de datos 21 es analizada sintácticamente para emitir separadamente información de parámetros al descompresor 23. La información de mezcla descendente codificada es introducida al descompresor 24 y la señal residual codificada es introducida al descompresor residual 22. El descodificador de la figura 4 incluye además un descodificador estéreo de intensidad directo 40 y además un descodificador medio/lateral 41. Ambos descodificadores 40 y 41 efectúan las funciones del descodificador de multicanal 25 para emitir la primera señal de multicanal reconstruida 26, que es solamente generada por el descodificador estéreo de intensidad 40 y para emitir la segunda señal de multicanal reconstruida 27, que es solamente generada por el descodificador de MS 41.
Cuando la corriente de datos incluye una señal residual codificada, la implementación directa en la figura 4 emitiría la primera señal de multicanal reconstruida 26, también como en la segunda señal de multicanal reconstruida. Naturalmente, solo la mejor segunda señal de multicanal reconstruida 27 es interesante para el usuario en esta situación. Por consiguiente, un control de descodificador 42 puede ser proporcionado para detectar, si hay una señal residual codificada en la corriente de datos. Cuando es detectada, de tal manera que ninguna de tal señal residual codificada está en la corriente de datos, el control de descodificador 42 es operativo para desactivar el descodificador medio/lateral 40 para ahorrar energía de procesamiento y por consiguiente, energía de la batería que es especialmente útil en un dispositivo portátil de baja energía tal como un teléfono móvil, etc.
La figura 5 muestra otra modalidad de la presente invención, en la cual la señal residual codificada es generada en base a un procedimiento de análisis mediante síntesis. Otra vez, los primeros y segundos canales 10a, 10b son introducidos a un mezclador descendente 50, que es seguido por un reductor de velocidad de datos 51. En la salida del bloque 51, una señal de mezcla descendente preferiblemente comprimida que tiene uno o más canales de mezcla descendente es obtenida y suministrada al formador de corriente de datos 18. Así, los bloques 50 y 51 proporcionan la funcionalidad del dispositivo mezclador descendente 12 de la figura 1. Adicionalmente, los primeros y los segundos canales de entrada 10a, 10b son suministrados a un calculador de parámetros 53 y los parámetros emitidos por el calculador de parámetros son enviados a otro reductor de velocidad de datos 54 para comprimir el uno o más parámetros. Así, los bloques 53 y 54 proporcionan la misma funcionalidad como el proveedor de parámetros 14 de la
figura 1.
En contraste con la modalidad de la figura 3, sin embargo, el codificador residual 16 es más sofisticado. En particular, el codificador residual 16 incluye un reconstructor de multicanal paramétrico 55. El reconstructor de multicanal genera, para el ejemplo de dos canales, un primer canal reconstruido y un segundo canal reconstruido. Puesto que el reconstructor de multicanal paramétrico usa solamente los canales de mezcla descendente y los parámetros, la calidad de la señal de multicanal reconstruida emitida por el bloque 55 corresponderá a la curva 1102 en la figura 11 y siempre estará debajo del umbral paramétrico 1100 de la figura 11.
La señal de multicanal reconstruida es introducida a un calculador de error 56. El calculador de error 56 es operativo para también recibir el primero y el segundo canal de entrada 10a y 10b y emite una primera señal de error y una segunda señal de error. Preferiblemente, el calculador de error calcula una diferencia de muestra en muestra entre un canal original y un canal reconstruido correspondiente (bloque de salida 55). Este procedimiento es efectuado para cada par de canal original y canal reconstruido. La salida del calculador de error 56 es -otra vez- una representación de multicanal, pero ahora, en contraste con la señal de multicanal original, una señal de error de multicanal. Esta señal de error de multicanal que tiene el mismo número de canales como la señal de multicanal original es introducida a un procesador residual 57 para generar la señal residual codificada.
Existen numerosas implementaciones del procesador residual 57, que dependen todas de los requerimientos de ancho de banda, grado requerido de escalabilidad, requerimientos de calidad, etc.
En una implementación preferida, el procesador residual 57 es otra vez implementado como un codificador de multicanal que genera uno o más canales de mezcla descendente de error y parámetros de mezcla descendente de error. Se puede decir que esta modalidad es una clase de un codificador de multicanal iterativo, puesto que el procesador residual 57 podría incluir los bloques 50, 51, 53 y 54.
Alternativamente, el procesador residual 57 puede ser operativo para seleccionar solamente uno o dos canales de error a partir de su señal de entrada, que tiene la energía más alta y para procesar solamente la señal de error de energía más alta para obtener la señal residual codificada. Además o en lugar de este criterio, criterios más avanzados pueden ser usados que son a base de medidas de error motivadas más perceptualmente. Alternativamente, el procesador residual podría incluir un esquema de formación de matriz para la mezcla descendente de los canales de entrada a uno o más canales de entrada descendente, de tal manera que un dispositivo de descodificadores correspondientes efectuaría un procedimiento de des-formación de matriz análogo. El uno o más canales de mezcla descendente pueden luego ser procesados utilizando elementos de un codificador mono o estéreo bien conocido o pueden ser procesados completamente utilizando uno de los codificadores mono-estéreo mencionados anteriormente para obtener la señal residual codificada.
Un descodificador para el codificador de la figura 5 es mostrado en la figura 6. En comparación con la modalidad de la figura 2, la figura 6 revela que el descodificador de multicanal 25 incluye un reconstructor de multicanal paramétrico 60 y un combinador 61. El reconstructor de multicanal paramétrico 60 genera la primera señal de multicanal reconstruida 26 solamente en base a información de mezcla descendente descodificada e información de parámetros descodificada. La primera señal reconstruida 26 puede ser emitida, cuando ninguna señal residual codificada está incluida en la corriente de datos. Sin embargo, cuando una señal residual codificada está incluida en la corriente de datos, la primera señal reconstruida no es emitida sino introducida a un combinador 61 para combinar la señal de multicanal reconstruida paramétricamente 26 a la señal residual descodificada que es una de las representaciones de la representación de error en la salida de calculador de error 56 de la figura 5 como se discute anteriormente. El combinador 61 combina la señal residual descodificada, esto es, cualquier representación de la señal de error y la señal de multicanal reconstruida paramétricamente para emitir la segunda señal reconstruida 27. Cuando el descodificador de la figura 6 es considerado con respecto a la figura 11, se vuelve claro que, para una cierta velocidad de bits, la primera señal reconstruida tiene una calidad determinada por la línea 1102, en tanto que la segunda señal reconstruida 27 tiene una calidad más alta determinada por la línea 1114 para la misma velocidad de bits.
La modalidad de la figura 5/figura 6 es preferible a la modalidad de la figura 3/figura 4, puesto que la redundancia en la señal residual codificada es reducida. Sin embargo, la modalidad de la figura 5/figura 6 requiere una cantidad más alta de energía de procesamiento, almacenamiento, recursos de batería y retardo algorítmico.
Una solución intermedia preferida entre la modalidad de las figuras 3/figura 4 y la modalidad de la figura 5/figura 6 es descrita subsecuentemente con referencia a la figura 7 en cuanto a una representación de codificador y figura 8 en cuanto a una representación de descodificador. El codificador incluye un cierto mezclador descendente 70 para efectuar una mezcla descendente utilizando los primeros y segundos canales de entrada 10a, 10b. En contraste con una simple muestra descendente, que es generada por solamente agregar ambos canales originales 10a, 10b para obtener una mono señal, el mezclador descendente 70 es controlado por un parámetro de alineación generado por un calculador de parámetros 71. Aquí, ambos canales de entrada 10a, 10b son alineados en el tiempo entre sí antes de que ambas señales sean agregadas entre sí. De esta manera, una mono señal especial es obtenida en la salida del mezclador descendente 70, tal mono señal es diferente de una mono señal por ejemplo generada por un codificador estéreo de intensidad de bajo nivel como se muestra con el número 30 en la figura 3.
Además del parámetro de alineación o en lugar del parámetro de alineación, el calculador de parámetro 71 es operativo para generar un parámetro de ganancia. El parámetro de ganancia es introducido a un dispositivo ponderador 72 para ponderar preferiblemente el segundo canal 10b utilizando el parámetro de ganancia, antes de que se efectúe un cálculo de la señal lateral. La ponderación del segundo canal antes de calcular la diferencia semejante a forma de onda entre el primero y el segundo canal da como resultado una señal residual más pequeña, que es mostrada en la entrada de la señal lateral especial a cualquier reductor de velocidad de datos apropiado 33. El reductor de velocidad de datos 33 mostrado en la figura 7 puede ser implementado exactamente como el reductor de velocidad de datos 33 mostrado en la figura 3.
La modalidad de la figura 7 es diferente de la modalidad de la figura 3 en que se toma en cuenta información de parámetros para preferiblemente en el mezclador descendente 70 también como el cálculo de señal residual, de al manera que la señal residual emitida por el reductor de velocidad de datos 33 de la figura 7 puede ser representada por un número más bajo de bits que la señal emitida por el reductor de velocidad de datos 33. Esto es debido al hecho de que la señal residual de la figura 7 incluye menos redundancia que la señal residual de la figura 3.
La figura 8 muestra una modalidad preferida de una implementación de descodificador correspondiente a la implementación de codificador de la figura 7. Contrario al descodificador de la figura 6, el reconstructor de multicanal 25 es operativo para emitir automáticamente la primera señal de multicanal reconstruida 26, cuando la señal lateral, esto es, la señal residual es cero o para emitir automáticamente la segunda señal de multicanal reconstruido 27, cuando la señal residual no es igual a cero. Así, el reconstructor de multicanal 25 de la figura 8 no puede emitir ambas señales 26 y 27 simultáneamente, sino que puede solamente emitir una primera de las dos señales o una segunda de las dos señales. Así, la modalidad de la figura 8 no requiere ningún control de descodificador tal como se muestra en la
figura 4.
En particular, el descodificador de señal residual 22 en la figura 8 emite la señal lateral especial tal como es generada por el elemento 72 de codificador correspondiente de la figura 7. Adicionalmente, el descodificador de mezcla descendente 24 emite la mono señal especial tal como es generada por el mezclador descendente 70 de la figura 7.
Luego, la señal lateral especial y la mono señal especial son introducidas al descodificador de multicanal conjuntamente con el parámetro de ganancia y el parámetro de alineación de tiempo. El parámetro de ganancia es operativo para controlar la etapa de ganancia 80 al aplicar una ganancia de acuerdo con una primera regla de ganancia. Adicionalmente, el parámetro de ganancia controla las etapas de ganancia adicionales 82, 83 para aplicar una ganancia de acuerdo con una segunda regla de ganancia diferente. Adicionalmente, el reconstructor de multicanal incluye un sustractor 84 y un adicionador 85 también como un bloque de desalineación de tiempo 86 para generar un primer canal reconstruido y un segundo canal reconstruido.
Subsecuentemente, se hace referencia a una modalidad preferida del esquema de codificador/descodificador de las figuras 7 y 8. La figura 9a muestra un esquema de codificador/descodificador completo de acuerdo con un aspecto de la presente invención. En la cual la señal residual d(n) no es igual a cero. Adicionalmente, la figura 9b indica el codificador/descodificador escalable de la figura 9a, cuando ninguna señal de diferencia d(n) ha sido calculada o cuando la corriente de datos ha sido separada para reducir la señal residual, por ejemplo debido a un requerimiento relacionado con ancho de banda de transmisión. En el caso de separación de la señal residual codificada de la corriente de datos transmitida de un codificador a un descodificador en la modalidad de la figura 9a, la modalidad de la figura 9a se convierte en un escenario de multicanal paramétrico puro, en el cual el parámetro de alineación y el parámetro de ganancia son los parámetros de multicanal y la mono señal espacial es el canal de mezcla descendente transmitido desde el lado del codificador al lado del descodificador.
La reconstrucción de multicanal en el lado de descodificador es efectuada utilizando solamente los parámetros de alineación y ganancia, puesto que no se recibe ninguna señal residual en el lado del descodificador, esto es, d(n) es igual a cero.
La figura 9c muestra las ecuaciones fundamentales del codificador de la invención, en tanto que la figura 9d indica la ecuación fundamental para el descodificador de la invención.
En particular, el codificador de la invención, incluye, como proveedor de parámetros 14 de la figura 1, el calculador de parámetros 71. El calculador de parámetros 71 es operativo para calcular un parámetro de alineación de tiempo para alinear el canal derecho r(n) al canal izquierdo l(n). En las figuras 9a a 9d, el canal derecho alineado es indicado por
r_{a}(n). El parámetro de alineación es extraído preferiblemente mediante superposición de bloques de la señal de entrada. El parámetro de alineación corresponde al retardo de tiempo entre el canal izquierdo y el canal derecho y es estimado preferiblemente utilizando técnicas de correlación cruzada de dominio de tiempo. Para el caso cuando no hay ganancia de alineación en una sub-banda, por ejemplo en el caso de señales independientes, el parámetro de retardo es ajustado a cero. Preferiblemente, un parámetro de retardo (alineación de tiempo) es estimado por sub-banda en la estructura de sub-banda. En una modalidad preferida, una velocidad de análisis fija de 46 ms y 50% de superposición de ventanas de Hamming se ha empleado.
El calculador de parámetros 71 calcula además el valor de ganancia. El valor de ganancia es también extraído preferiblemente de la superposición de bloques de la señal. Normalmente, el parámetro de ganancia es idéntico al parámetro de diferencia de nivel usado comúnmente en codificación paramétrica tal como el esquema de codificación de indicación binaural bien conocido. Alternativamente, el valor de ganancia puede ser calculado utilizando un procedimiento iterativo, en el cual la señal de diferencia es retroalimentada al calculador de parámetros y el valor de ganancia es ajustado de tal manera que la señal de diferencia llega a un valor mínimo como se muestra por la línea discontinua 90 en la figura 9a. Tan pronto como la alineación y ganancia de parámetros son calculados, el mezclador descendente 70 en la figura 7, también como el codificador residual 16 en la figura 7 pueden ser reiniciados. En particular, el mezclador descendente 70 de la figura 7 incluye un bloque de alineación 91 para retardar un canal por el parámetro de alineación de tiempo calculado. Luego el segundo canal retardado r_{a}(n) agregado al primer canal utilizando un dispositivo adicionador 92. En la salida del adicionador 92, el canal de mezcla descendente está presente. Así, el mezclador descendente 70 en la figura 7 incluye los bloques 91 y 92 para formar la mono señal especial.
El codificador residual 16 en la figura 7 incluye además el ponderador 93 y el calculador de señal lateral subsecuente 94, que calcula la diferencia entre el primer canal original y el segundo canal alineado y ponderado. En particular, para la ponderación del segundo canal alineado, la primera regla de ponderación usada en un bloque de lado del descodificador correspondiente 80 es efectuada. Así, el codificador residual 16 incluye el dispositivo de alineación 91, el dispositivo de ponderación 93 y el calculador de señal lateral 94. Puesto que el segundo canal alineado es usado para la mezcla descendente también como el cálculo residual, es suficiente calcular el canal derecho alineado solamente un vez y enviar el resultado al mezclador descendente 70 también como al ponderador/calculador de señal lateral 72 en la figura 7.
Preferiblemente, los factores de alineación y ganancia son escogidos de tal manera que el proceso es reversible, de tal manera que las ecuaciones de la figura 9d son bien definidas y bien acondicionadas numéricamente.
Un mono codificador genérico puede ser usado para el mono codificador 51 para codificar la señal de suma y un codificador residual preferiblemente especializado 33 es empleado para el residual.
Cuando el mono codificador 51 es sin pérdidas, esto es, cuando la mono señal no es cuantificada adicionalmente y ya sea el codificador residual es también sin pérdidas o el modalidad de señal de alineación coincide con la señal fuente perfectamente, entonces la estructura de codificación de la invención mostrada en la figura 9a tiene la propiedad de reconstrucción perfecta que también asume que los parámetros de alineación y ganancia están solamente sujetos a un esquema de codificación sin pérdidas.
\newpage
El sistema de la invención de la figura 9a proporciona una estructura para un esquema que puede operar con degradación agraciada sobre una multitud de intervalos como se indica en la figura 11, línea 1114. En particular, sin codificación residual, esto es, d(n) = 0, el esquema se reduce a la codificación estéreo paramétrico al transmitir solamente los parámetros de alineación y ganancia (como parámetros de multicanal) además de la mono señal (como en canal de mezcla descendente). Esta situación es ilustrada en la figura 9b. Adicionalmente, el sistema de la invención tiene la ventaja de que el método de alineación trata automáticamente el problema de mono mezcla descendente.
Subsecuentemente, se hace referencia a la figura 10 que ilustra una implementación de la modalidad de la invención ilustrada en las figuras 9a a 9d a una estructura de codificación de sub-banda. Los canales izquierdo y derecho originales son introducidos a un banco de filtro de análisis 1000 para obtener varias señales de sub-banda. Para cada señal de sub-banda, un esquema de codificación/descodificación como se muestra en las figuras 9a a 9d es utilizado. En el lado del descodificador, las señales de sub-banda reconstruidas son combinadas en un banco de filtro de síntesis 1010 para llegar finalmente a las señales de multicanal reconstruidas de plena banda. Naturalmente, para cada sub-banda, un parámetro de alineación y un parámetro de ganancia va a ser transmitido desde el lado de codificador al lado del descodificador como se ilustra por una flecha 1020 en la figura 10.
La implementación preferida de la estructura de codificación de sub-banda de la figura 10 está basada en un banco de filtros modulados de coseno con dos etapas, con el fin de obtener anchos de banda de sub-banda desiguales (en una escala motivada perceptualmente). La primera etapa divide la señal en M bandas. Las M señales de sub-banda son decimadas críticamente y alimentadas al segundo banco de filtro de etapas. El k-ésimo filtro de la segunda etapa,
k \epsilon {1, ..., M}, tiene M_{k} bandas. En una implementación preferida, se usan M = 8 bandas y una estructura de sub-banda como en la tabla de la figura 10, dando como resultado 36 sub-bandas efectivas después de las dos etapas es preferido. Los filtros de prototipo son designados de acuerdo con [13] con por lo menos 100 dB que amortiguan en la banda de retención. El orden de filtros en la primera etapa es 116 y el orden de filtro máximo en la segunda etapa es 256. La estructura de codificación es luego aplicada a pares de sub-bandas (correspondientes a los canales de sub-banda izquierdo y derecho).
El agrupamiento correspondiente de las sub-bandas entre el primero y el segundo banco de filtros de etapas es mostrado en la tabla a la derecha en la figura 10, que hace claro que la primera sub-banda k incluye 16 sub-bandas. Adicionalmente, la segunda sub-banda incluye 8 sub-bandas, etc.
Se obtiene codificación paramétrica eficiente utilizando técnicas de cuantificación de vector de mezcla Gaussiana (VQ) (GM). La cuantificación basada en modelos GM es popular en el campo de codificación de habla [14-16] y facilita la implementación de baja complejidad de VQ dimensional alto. En una implementación preferida, se cuantifican por vectores de 36-dimensionales de ganancia y parámetros de retardo. Los modelos GM todos tienen 16 componentes de mezcla y son entrenados en una base de datos de parámetros extraídos de 60 minutos de datos de audio (con contenido variable y disjuntos de señales de prueba de evaluación subsecuente). Métodos a base de modelos estadísticos explícitos son usados menos frecuentemente en codificación de audio que en codificación de habla. Una razón de esta creencia equivocada en la habilidad de modelos estadísticos para capturar toda la información relevante contenida en audio general. En un caso preferido, evaluación preliminar utilizando procedimientos de prueba abiertos y cerrados de modelos de parámetro indican sin embargo que este no es un problema en este caso. La velocidad de bits resultante para los parámetros de ganancia y retardo es 2.3 kbps.
La estructura de sub-banda es aprovechada para la codificación de las señales residuales. Con el mismo procesamiento por bloques como se describe adicionalmente, la varianza en cada sub-banda es estimada y las varianzas son cuantificadas por vectores utilizando GM VQ a través de sub-bandas (esto es, un vector 36-dimensional es codificado a la vez). Las varianzas facilitan la asignación de bits entre las sub-bandas que usan un algoritmo de asignación de bits codicioso [17, página 234]. Luego las señales de sub-banda son codificadas utilizando cuantificadores escalares uniformes.
La ganancia instantánea g(n) y retardo \tau(n) son obtenidos mediante interpolación lineal de los estimados de bloques. El retardo variable en el tiempo es realizado por medio de un filtro de retardo fraccional de 73-orden a base de una respuesta de impulso de sincronización truncada y de ventana de Hamming [18]. Los coeficientes de filtro son actualizados en una base según muestra utilizando el parámetro de retardo interpolado.
Se propone una estructura para la codificación flexible de la imagen estéreo en audio general. Con la nueva estructura, es posibles moverse sin costuras desde un modo estéreo paramétrico a codificación de aproximadamente de forma de onda. Una implementación ejemplar de las ideas fue probada, tanto usando un residual sin codificar para evaluar el efecto de incrementar la velocidad de bits del codificador residual y utilizando un codificador de núcleo MP3, con el fin de evaluar el esquema de un escenario o más real.
Para estabilizar la imagen estéreo, es preferido filtrar en paso de bajos los parámetros en un sistema paramétrico puro o en un sistema escalable que tiene una parte paramétrica pura que puede ser usada por un descodificador sin procesar la señal residual, como se hace en por ejemplo [9]. Esto reduce la ganancia de alineación del sistema. Al codificar el residual utilizando codificación de sub-banda escalar, la calidad es incrementada adicionalmente y se aproxima a la calidad transparente. En particular, la adición de bits al residual estabiliza la imagen estéreo y el ancho de estéreo es también incrementado. Además, técnicas de segmentación de tiempo flexible y velocidad variable (por ejemplo, depósito de bits) son preferidos para aprovechar mejor la naturaleza dinámica de audio general. Un parámetro de coherencia es incluido preferiblemente en el filtro de alineación para mejorar el modo paramétrico. Codificación residual mejorada, que emplea el escalamiento perceptual, cuantificación de vector y codificación diferencial, conducen a irrelevancia más eficiente y remoción de redundancia.
Aunque el sistema de la invención se ha descrito en el contexto de codificación estéreo y en el contexto de un esquema de codificación medio/lateral mejorado paramétricamente, se notará en la presente que cada esquema de codificación/descodificación paramétrico de multicanal tal como una clase de intensidad estéreo generalizada de codificación se puede aprovechar de un componente del lado adicionalmente encerrado para llegar adicionalmente a la propiedad de reconstrucción perfecta. Aunque una modalidad preferida de un esquema de codificador/descodificador de la invención se ha descrito utilizando una alineación de tiempo en el lado del codificador, transmisión del parámetro de alineación y uso de desalineación de tiempo en el lado del descodificador, existen alternativas adicionales, que llevan a cabo la alineación de tiempo en el lado del descodificador para generar una señal de diferencia pequeña, pero que no efectúa la desalineación de tiempo en el lado del descodificador, de tal manera que el parámetro de alineación no será transmitido del codificador al descodificador. En esta modalidad, la cancelación de la desalineación de tiempo incluye naturalmente un artefacto. Sin embargo, este artefacto en la mayoría de los casos no es serio de tal manera que tal modalidad es especialmente apropiada para descodificadores de multicanal de bajo precio.
Por consiguiente, la presente invención puede también ser considerada como una extensión de una esquema de codificación estéreo paramétrico preferiblemente tipo BCC o cualquier otro esquema de codificación de multicanal, que cae completamente de regreso a un esquema puramente paramétrico, cuando la señal residual codificada es separada. De acuerdo con la presente invención, un sistema puramente paramétrico es mejorado al transmitir varios tipos de información adicional que incluye preferiblemente la señal residual en un estilo de forma de onda, el parámetro de ganancia y/o el parámetro de alineación de tiempo. Así, una operación de descodificación que utiliza la información adicional da como resultado una calidad más alta que la que sería disponible con técnicas paramétricas solas.
Dependiendo de los requerimientos, los métodos de codificación o descodificación de la invención pueden ser implementados en elementos físicos, elementos de programación o en elementos fijos. Por consiguiente, la invención también es concerniente con un medio que se puede leer por computadora que tienen almacenado un código de programa, que cuando se ejecuta en una computadora da como resultado uno de los métodos de la invención. Así, la presente invención es un programa de computadora que tiene un código de programa, que cuando es ejecutado en una computadora da como resultado el método de la invención.
\vskip1.000000\baselineskip
Lista de referencias
[1] J.D. Johnston y A.J. Ferreira, "Sum-difference stereo transform coding", en Proc. IEEE Int. Conf. Acoust., Speech, Signal Processing (ICASSP), 1992, vol. 2, págs. 569.572.
[2] R. Waal y R. Veldhuis, "Subband coding of stereophonic digital audio signals", en Proc. IEEE Int. Conf. Acoust., Speech, Signal Processing (ICASSP), 1991, págs. 3601.3604.
[3] J. Herre, K. Brandenburg, y D. Lederer, "Intensity stereo coding", en Preprint 3799, 96th AES Convention, 1994.
[4] K. Brandenburg, "MP3 and AAC explained", en Proc. of the AES 17th International Conference, paper no. 17-009, 1999.
[5] J. Blauert, Spatial hearing: the psychophysics of human sound localization, The MIT Press, Cambridge, Massachusetts, 1997.
[6] H. Fuchs, "Improving joint stereo audio coding by adaptive inter-channel prediction", en Proc. of IEEE Workshop on Applications of Signal Processing to Audio and Acoustics, 1993, págs. 39.42.
[7] H. Fuchs, "Improving MPEG audio coding by backward adaptive linear stereo prediction", en Preprint 4086, 99th AES Convention, 1995.
[8] F. Baumgarte y C. Faller, "Binaural cue coding. part I: Psychoacoustic fundamentals and design principles", IEEE Trans. Speech Audio Processing, vol. 11, no. 6, págs. 509.519, 2003.
[9] C. Faller y F. Baumgarte, "Binaural cue coding. part II: Schemes and applications", IEEE Trans. Speech Audio Processing, vol. 11, no. 6, págs. 520.531, 2003.
[10] C. Faller, Parametric Coding of Spatial Audio, Ph. D. thesis, Ecole Polytechnique Federale de Lausanne, 2004.
[11] J. Breebaart, S. van de Par, A. Kohlrausch, y E. Schuijers, "High-quality parametric spatial audio coding at low bitrates", en Preprint 6072, 116th AES Convention, 2004.
[12] J. Herre, C. Faller, C. Ertel, J. Hilpert, A. Hoelzer, y C. Spenger, "MP3 surround: Efficient and compatible coding of multi-channel audio", en Preprint 6049, 116th AES Convention, 2004.
[13] Y-P. Lin and P.P. Vaidyanaythan, "A Kaiser window approach for the design of prototype filters of cosine modulated filterbanks", IEEE Signal Processing Letters, vol. 5, nº. 6, págs. 132.134, 1998.
[14] P. Hedelin y J. Skoglund, "Vector quantization based on Gaussian mixture models", IEEE Trans. Speech Audio Processing, vol. 8, nº. 4, págs. 385.401, 2000.
[15] A.D. Subramaniam y B.D. Rao, "PDF optimized parametric vector quantization of speech line spectral frequencies", IEEE Trans. Speech Audio Processing, vol. 11, nº. 2, págs. 130.142, 2003.
[16] J. Lindblom y P. Hedelin, "Variable-dimension quantization of sinusoidal amplitudes using Gaussian mixture models", en Proc. IEEE Int. Conf. Acoust., Speech, Signal Processing (ICASSP), 2004, vol. 1, págs. 153.156.
[17] A. Gersho y R. M. Gray, Vector Quantization and Signal Compression, Kluwer Academic Publishers, Boston, 1992.
[18] T.I. Laakso, V. Välimäki, M. Karjalainen, y U.K. Laine, "Tools for fractional delay filter design", IEEE Signal Processing Magazine, págs. 30.60, enero 1996.
[19] ITU-R Recommendation BS.1534, Method for the Subjective Assessment of Intermediate Quality Level of Coding Systems, ITU-T, 2001.
[20] "The LAME project", http://lame.sourceforge.net/, July 2004, v3.96.1.

Claims (26)

1. Un codificador de multicanal para codificar una señal de multicanal original que tiene por lo menos dos canales, caracterizado porque comprende:
un proveedor de parámetros para proporcionar uno o más parámetros, el uno o más parámetros son formados de tal manera que una señal de multicanal reconstruida puede ser formada utilizando uno o más canales de mezcla descendente derivados de la señal de multicanal y el uno o más parámetros;
un codificador residual para generar una señal residual codificada en base a la señal de multicanal original, el uno o más canales de mezcla descendente o el uno o más parámetros, de tal manera que la señal de multicanal reconstruida, cuando es formada utilizando la señal residual es más similar a la señal de multicanal original que cuando es formada sin usar la señal residual, el codificador residual incluye un descodificador de multicanal para generar una señal de multicanal descodificada utilizando el uno o más canales de mezcla descendente y el uno o más parámetros; un calculador de error para calcular una representación de señal de error de multicanal en base a la señal de multicanal descodificada y la señal de multicanal original y un procesador residual para procesar la representación de señal de error de multicanal para obtener la señal residual codificada, y
un formador de corriente de datos para formar una corriente de datos que tiene la señal residual codificada y el uno o más parámetros.
2. El codificador de multicanal de conformidad con la reivindicación 1, caracterizado porque el formador de corriente de datos es operativo para formar una corriente de datos escalable, en la cual el uno o más parámetros y la señal residual están en capas de escalamiento diferentes.
3. El codificador de multicanal de conformidad con la reivindicación 1, caracterizado porque el codificador residual es operativo para calcular la señal residual codificada como una señal residual de forma de onda.
4. El codificador de multicanal de conformidad con la reivindicación 1, caracterizado porque el codificador residual es operativo para generar la señal residual en base al uno o más parámetros y la señal de multicanal original sin el uno o más canales de mezcla descendente, de tal manera que la señal residual tiene una energía más pequeña en comparación con la generación de la señal residual sin usar el uno o más parámetros.
5. El codificador de multicanal de conformidad con la reivindicación 4, caracterizado porque el proveedor de parámetros comprende:
un calculador de alineación para calcular un parámetro de alineación de tiempo a ser provisto a un alineador de tiempo para alinear un primer canal y un segundo canal de los por lo menos dos canales o
un calculador de ganancia para calcular una ganancia no igual a 1 para ponderar un canal, de tal manera que una diferencia entre dos canales es reducida en comparación con un valor de ganancia de uno.
6. El codificador de multicanal de conformidad con la reivindicación 5, caracterizado porque el codificador residual es operativo para calcular y codificar una señal de diferencia derivada de un primer canal y un segundo canal alineado o ponderado.
7. El codificador de multicanal de conformidad con la reivindicación 5, caracterizado porque comprende además un mezclador descendente para generar un canal de mezcla descendente utilizando los canales alineados.
8. El codificador de multicanal de conformidad con la reivindicación 1, caracterizado porque comprende además un banco de filtro de análisis para dividir la señal de multicanal a una pluralidad de bandas de frecuencia,
en donde el proveedor de parámetros y el codificador residual son operativos para operar sobre las señales de sub-banda, y
en donde el formador de corriente de datos es operativo para recolectar señales residuales codificadas y parámetros para una pluralidad de bandas de frecuencia.
9. El codificador de multicanal de conformidad con la reivindicación 1, caracterizado porque el procesador residual incluye un codificador de multicanal para generar una representación de multicanal de la representación de señal de error de multicanal.
10. El codificador de multicanal de conformidad con la reivindicación 9, caracterizado porque el procesador residual es operativo para generar adicionalmente uno o más canales de mezcla descendente de la representación de señal de error de multicanal.
\newpage
11. El codificador de multicanal de conformidad con la reivindicación 1, caracterizado porque el proveedor de parámetros es operativo para proporcionar parámetros de codificación de indicación binaural (BCC) tales como diferencias de nivel de intercanal, parámetros de coherencia intercanal, diferencias de tiempo intercanal o indicaciones de envolvente de canal.
12. Un método de codificación de una señal de multicanal original que tiene por lo menos dos canales, caracterizado porque comprende:
proporcionar uno o más parámetros, el uno o más parámetros son formados de tal manera que una señal de multicanal reconstruida puede ser formada utilizando uno o más canales de mezcla descendente derivados de la señal de multicanal y el uno o más parámetros;
generar una señal residual codificada en base a la señal de multicanal original, el uno o más canales de mezcla descendente o el uno o más parámetros, de tal manera que la señal de multicanal reconstruida, cuando es formada utilizando la señal residual es más similar a la señal de multicanal original que cuando es formada sin usar la señal residual, la etapa de generación incluye generar una señal de multicanal descodificada utilizando el uno o más canales de mezcla descendente y el uno o más parámetros, calcular una representación de señal de error de multicanal en base a la señal de multicanal descodificada y la señal de multicanal original; y procesar la representación de señal de error de multicanal para obtener la señal residual codificada, y
formar una corriente de datos que tiene la señal residual codificada y el uno o más parámetros.
13. Un descodificador de multicanal para descodificar una señal de multicanal codificada que tiene uno o más canales de mezcla descendente, uno o más parámetros y una señal residual codificada, el uno o más canales de mezcla descendente dependen de un parámetro de alineación o un parámetro de ganancia, caracterizado porque compren-
de:
un descodificador residual para generar una señal residual descodificada en base a la señal residual codificada,
y
un descodificador de multicanal para generar una primera señal de multicanal reconstruida utilizando uno o más canales de mezcla descendente y el uno o más parámetros,
en donde el descodificador de multicanal es operativo adicionalmente para generar una segunda señal de multicanal reconstruida utilizando el uno o más canales de mezcla descendente y la señal residual descodificada,
en donde el descodificador de multicanal es operativo adicionalmente para ponderar el canal de mezcla descendente utilizando el parámetro de ganancia, para agregar la señal residual descodificada a un canal de mezcla descendente ponderado y para ponderar otra vez un canal resultante para obtener la primera señal de multicanal reconstruida y para restar la señal residual descodificada del canal de mezcla descendente y ponderar un canal resultante de la sustracción utilizando el parámetro de ganancia o para desalinear una diferencia entre el canal de mezcla descendente y la señal residual descodificada cuando se obtiene la segunda señal de multicanal reconstruida.
14. El descodificador de multicanal de conformidad con la reivindicación 13, caracterizado porque la señal de multicanal codificada es representada por una corriente de datos escalada, la corriente de datos escalada tiene una primera capa de escalamiento que incluye el uno o más parámetros y una segunda capa de escalamiento que incluye la señal residual codificada,
en donde el codificador de multicanal comprende además:
un analizador sintáctico de corriente de datos para extraer la primer capa de escalamiento o la segunda capa de escalamiento.
15. El descodificador de multicanal de conformidad con la reivindicación 13, caracterizado porque la señal residual codificada depende del uno o más parámetros, y
en el cual el descodificador de multicanal es operativo para usar el uno o más canales de mezcla descendente, el uno o más parámetros y la señal residual descodificada para generar la segunda señal de multicanal reconstruida.
16. El descodificador de multicanal de conformidad con la reivindicación 13, caracterizado porque el canal de mezcla descendente depende de un parámetro de alineación o un parámetro de ganancia, y
en el cual el descodificador de multicanal es operativo para ponderar el canal de mezcla descendente utilizando una primera regla de ponderación basada en el parámetro de ganancia y para ponderar el canal de mezcla descendente utilizando una segunda regla de ponderación que utiliza el parámetro de ganancia o
desalinear un canal de salida con respecto al otro canal de salida utilizando el parámetro de alineación.
17. El descodificador de multicanal de conformidad con la reivindicación 13, caracterizado porque los parámetros incluyen parámetros de codificación de indicación binaural (BCC) tales como diferencias de nivel de intercanal, parámetros de coherencia de intercanal, diferencias de tiempo de intercanal o indicaciones de envolvente de canal, y
en el cual el descodificador de multicanal es operativo para efectuar una operación de descodificación de multicanal de acuerdo con un esquema de codificación de indicación binaural (BCC).
18. El descodificador de multicanal de conformidad con la reivindicación 13, caracterizado porque el uno o más canales de mezcla descendente, el uno o más parámetros y la señal residual codificada son representados mediante datos sub-banda-específicos, que comprenden además:
un banco de filtro de síntesis para combinar datos de sub-banda reconstruidos generados mediante el descodificador de multicanal para obtener una representación de plena banda de la primera o la segunda señal de multicanal reconstruida.
19. Un método de descodificación de una señal de multicanal codificada que tiene uno o más canales de mezcla descendente, uno o más parámetros y una señal residual codificada, caracterizado porque comprende:
generar una señal residual descodificada en base a la señal residual codificada, y
generar una primera señal de multicanal reconstruida utilizando uno o más canales de mezcla descendente y el uno o más parámetros y generar una segunda señal de multicanal reconstruida utilizando el uno o más canales de mezcla descendente y la señal residual descodificada, la etapa de generación incluye ponderación del canal de mezcla descendente utilizando el parámetro de ganancia, agregar la señal residual descodificada a un canal de mezcla descendente ponderado y ponderar otra vez un canal resultante para obtener la primera señal de multicanal reconstruida y restar la señal residual descodificada del canal de mezcla descendente y ponderar un canal resultante de la sustracción utilizando el parámetro de ganancia o desalinear una diferencia entre el canal de mezcla descendente y la señal residual descodificada cuando se obtiene la segunda señal de multicanal reconstruida.
20. Un codificador de multicanal para codificar una señal de multicanal original que tiene por lo menos dos canales, caracterizado porque comprende:
un alineador de tiempo para alinear un primer canal y un segundo canal de los por lo menos dos canales utilizando un parámetro de alineación;
un mezclador descendente para generar un canal de mezcla descendente utilizando los canales alineados;
un calculador de ganancia para calcular un parámetro de ganancia no igual a uno para ponderar un canal alineado, de tal manera que la diferencia entre los canales alineados es reducida en comparación con un valor de ganancia de 1, y
un formador de corriente de datos para formar una corriente de datos que tiene información en cuanto al canal de mezcla descendente, información en cuanto al parámetro de alineación e información en cuanto al parámetro de ganancia.
21. El codificador de multicanal de conformidad con la reivindicación 20, caracterizado porque comprende además un codificador residual para calcular y codificar una señal de diferencia derivada del primer canal y un segundo canal alineado y ponderado,
en donde el formador de corriente de datos es operativo además para incluir una señal residual codificada a la corriente de datos.
22. Un descodificador de multicanal para descodificar una señal de multicanal codificada que tiene información en cuanto a uno o más canales de mezcla descendente, información en cuanto a un parámetro de ganancia, información en cuanto a un parámetro de alineación y una señal residual codificada, caracterizado porque comprende: un descodificador de canal de mezcla descendente para generar un canal de mezcla descendente descodificado;
un procesador para procesar el canal de mezcla descendente descodificado utilizando el parámetro de ganancia para obtener un primer canal de salida descodificado y para procesar el canal de mezcla descendente descodificado utilizando el parámetro de ganancia y para desalinear utilizando el parámetro de alineación para obtener un segundo canal de salida descodificado, y
un descodificador residual para generar una señal residual descodificada,
en donde el procesador es operativo para ponderar principalmente el canal de mezcla descendente utilizando el parámetro de ganancia, para agregar la señal residual descodificada y para ponderar en segundo lugar utilizando el parámetro de ganancia para obtener un primer canal reconstruido y para restar la señal residual descodificada del canal de mezcla descendente antes de la ponderación y para desalinear para obtener el segundo canal reconstruido.
23. Un método de codificación de una señal de multicanal original que tiene por lo menos dos canales, caracterizado porque comprende:
alinear en el tiempo un primer canal y un segundo canal de los por lo menos dos canales utilizando un parámetro de alineación;
generar un canal de mezcla descendente utilizando los canales alineados;
calcular un parámetro de ganancia no igual a uno para ponderar un canal alineado, de tal manera que la diferencia entre los canales alineados es reducida en comparación con un valor de ganancia de 1, y
formar una corriente de datos que tiene información en cuanto al canal de mezcla descendente, información en cuanto al parámetro de alineación e información en cuanto al parámetro de ganancia.
24. Un método para descodificar una señal de multicanal codificada que tiene información en cuanto a uno o más canales de mezcla descendente, información en cuanto a un parámetro de ganancia, información en cuanto a un parámetro de alineación y una señal residual codificada, caracterizado porque comprende:
generar un canal de mezcla descendente descodificado;
procesar el canal de mezcla descendente descodificado utilizando el parámetro de ganancia para obtener un primer canal de salida descodificado y procesar el canal de mezcla descendente descodificado utilizando el parámetro de ganancia y una desalineación en base al parámetro de alineación para obtener un segundo canal de salida descodificado, y
descodificar la señal residual codificada para obtener una señal residual descodificada,
en donde la etapa de procesamiento incluye principalmente ponderar el canal de mezcla descendente utilizando el parámetro de ganancia, agregar la señal residual descodificada y en segundo lugar ponderación utilizando el parámetro de ganancia para obtener un primer canal reconstruido y restar la señal residual descodificada del canal de mezcla descendente antes de la ponderación y desalineación para obtener el segundo canal reconstruido.
25. Una señal de multicanal codificada caracterizada porque tiene información en cuanto a uno o más canales de mezcla descendente, uno o más parámetros resultantes, cuando son combinados con el uno o más canales de mezcla descendente, en una primera señal de multicanal reconstruida y una señal residual codificada resultante, cuando son combinadas con el uno o más canales de mezcla descendente, en una segunda señal de multicanal reconstruida, en donde la segunda señal de multicanal reconstruida es más similar a una señal de multicanal original que la primera señal de multicanal reconstruida, en donde la señal de multicanal codificada es una corriente de datos escalable, en la cual el uno o más parámetros y la señal residual están en diferentes capas de escalamiento o el uno o más parámetros incluyen parámetros de codificación de indicación binaural (BCC) tales como diferencias de nivel de intercanal, parámetros de coherencia de intercanal, diferencias de tiempo de intercanal o indicaciones de envolvente de canal.
26. Un programa de computadora, caracterizado porque efectúa, cuando se ejecuta en una computadora, el método de conformidad con cualquiera de las reivindicaciones 12, 19, 23 ó 24.
ES05797659T 2005-02-22 2005-10-04 Esquema de codificador/descodificador de multicanal casi transparente o transparente. Active ES2312025T3 (es)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US65521605P 2005-02-22 2005-02-22
US655216P 2005-02-22
US11/080,775 US7573912B2 (en) 2005-02-22 2005-03-14 Near-transparent or transparent multi-channel encoder/decoder scheme
US80775 2005-03-14

Publications (1)

Publication Number Publication Date
ES2312025T3 true ES2312025T3 (es) 2009-02-16

Family

ID=35519868

Family Applications (1)

Application Number Title Priority Date Filing Date
ES05797659T Active ES2312025T3 (es) 2005-02-22 2005-10-04 Esquema de codificador/descodificador de multicanal casi transparente o transparente.

Country Status (19)

Country Link
US (1) US7573912B2 (es)
EP (1) EP1851997B1 (es)
JP (1) JP4887307B2 (es)
KR (1) KR100954179B1 (es)
CN (2) CN101120615B (es)
AT (1) ATE406076T1 (es)
AU (1) AU2005328264B2 (es)
BR (1) BRPI0520053B1 (es)
CA (1) CA2598541C (es)
DE (1) DE602005009262D1 (es)
ES (1) ES2312025T3 (es)
HK (1) HK1107495A1 (es)
IL (1) IL185304A0 (es)
MX (1) MX2007009887A (es)
NO (1) NO339907B1 (es)
PL (1) PL1851997T3 (es)
PT (1) PT1851997E (es)
RU (1) RU2388176C2 (es)
WO (1) WO2006089570A1 (es)

Families Citing this family (118)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1973320B (zh) * 2004-04-05 2010-12-15 皇家飞利浦电子股份有限公司 立体声编码和解码的方法及其设备
ES2373728T3 (es) * 2004-07-14 2012-02-08 Koninklijke Philips Electronics N.V. Método, dispositivo, aparato codificador, aparato decodificador y sistema de audio.
KR100773539B1 (ko) * 2004-07-14 2007-11-05 삼성전자주식회사 멀티채널 오디오 데이터 부호화/복호화 방법 및 장치
MX2007005261A (es) * 2004-11-04 2007-07-09 Koninkl Philips Electronics Nv Codificacion y descodificacion de un conjunto de senales.
EP1691348A1 (en) * 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametric joint-coding of audio sources
JP4887288B2 (ja) * 2005-03-25 2012-02-29 パナソニック株式会社 音声符号化装置および音声符号化方法
EP1866911B1 (en) * 2005-03-30 2010-06-09 Koninklijke Philips Electronics N.V. Scalable multi-channel audio coding
CN101151660B (zh) * 2005-03-30 2011-10-19 皇家飞利浦电子股份有限公司 多通道音频编码器、解码器以及相应方法
US7751572B2 (en) * 2005-04-15 2010-07-06 Dolby International Ab Adaptive residual audio coding
JP4988716B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
EP1905002B1 (en) * 2005-05-26 2013-05-22 LG Electronics Inc. Method and apparatus for decoding audio signal
JP2008542816A (ja) * 2005-05-26 2008-11-27 エルジー エレクトロニクス インコーポレイティド オーディオ信号の符号化及び復号化方法
AU2006266579B2 (en) * 2005-06-30 2009-10-22 Lg Electronics Inc. Method and apparatus for encoding and decoding an audio signal
JP2009500656A (ja) * 2005-06-30 2009-01-08 エルジー エレクトロニクス インコーポレイティド オーディオ信号をエンコーディング及びデコーディングするための装置とその方法
AU2006266655B2 (en) * 2005-06-30 2009-08-20 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
US8626503B2 (en) * 2005-07-14 2014-01-07 Erik Gosuinus Petrus Schuijers Audio encoding and decoding
US7761303B2 (en) * 2005-08-30 2010-07-20 Lg Electronics Inc. Slot position coding of TTT syntax of spatial audio coding application
US7788107B2 (en) * 2005-08-30 2010-08-31 Lg Electronics Inc. Method for decoding an audio signal
KR101169280B1 (ko) * 2005-08-30 2012-08-02 엘지전자 주식회사 오디오 신호의 디코딩 방법 및 장치
JP4859925B2 (ja) * 2005-08-30 2012-01-25 エルジー エレクトロニクス インコーポレイティド オーディオ信号デコーディング方法及びその装置
CN101253556B (zh) * 2005-09-02 2011-06-22 松下电器产业株式会社 能量整形装置以及能量整形方法
US7646319B2 (en) * 2005-10-05 2010-01-12 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
KR100857121B1 (ko) * 2005-10-05 2008-09-05 엘지전자 주식회사 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치
US7672379B2 (en) * 2005-10-05 2010-03-02 Lg Electronics Inc. Audio signal processing, encoding, and decoding
EP1946062A4 (en) * 2005-10-05 2009-09-09 Lg Electronics Inc METHOD AND DEVICE FOR SIGNAL PROCESSING AND CODING AND DECODING METHOD AND DEVICE THEREFOR
US7751485B2 (en) * 2005-10-05 2010-07-06 Lg Electronics Inc. Signal processing using pilot based coding
US7696907B2 (en) 2005-10-05 2010-04-13 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
US8068569B2 (en) * 2005-10-05 2011-11-29 Lg Electronics, Inc. Method and apparatus for signal processing and encoding and decoding
US20070092086A1 (en) * 2005-10-24 2007-04-26 Pang Hee S Removing time delays in signal paths
US8112286B2 (en) * 2005-10-31 2012-02-07 Panasonic Corporation Stereo encoding device, and stereo signal predicting method
KR100803212B1 (ko) * 2006-01-11 2008-02-14 삼성전자주식회사 스케일러블 채널 복호화 방법 및 장치
EP1974347B1 (en) * 2006-01-19 2014-08-06 LG Electronics Inc. Method and apparatus for processing a media signal
CN102693727B (zh) * 2006-02-03 2015-06-10 韩国电子通信研究院 用于控制音频信号的渲染的方法
WO2007091850A1 (en) * 2006-02-07 2007-08-16 Lg Electronics Inc. Apparatus and method for encoding/decoding signal
BRPI0706488A2 (pt) * 2006-02-23 2011-03-29 Lg Electronics Inc método e aparelho para processar sinal de áudio
US7835904B2 (en) * 2006-03-03 2010-11-16 Microsoft Corp. Perceptual, scalable audio compression
KR100773562B1 (ko) * 2006-03-06 2007-11-07 삼성전자주식회사 스테레오 신호 생성 방법 및 장치
US7676374B2 (en) * 2006-03-28 2010-03-09 Nokia Corporation Low complexity subband-domain filtering in the case of cascaded filter banks
RU2551797C2 (ru) 2006-09-29 2015-05-27 ЭлДжи ЭЛЕКТРОНИКС ИНК. Способы и устройства кодирования и декодирования объектно-ориентированных аудиосигналов
EP2054875B1 (en) * 2006-10-16 2011-03-23 Dolby Sweden AB Enhanced coding and parameter representation of multichannel downmixed object coding
WO2008046530A2 (en) * 2006-10-16 2008-04-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for multi -channel parameter transformation
US8571875B2 (en) * 2006-10-18 2013-10-29 Samsung Electronics Co., Ltd. Method, medium, and apparatus encoding and/or decoding multichannel audio signals
WO2008069584A2 (en) * 2006-12-07 2008-06-12 Lg Electronics Inc. A method and an apparatus for decoding an audio signal
FR2911020B1 (fr) * 2006-12-28 2009-05-01 Actimagine Soc Par Actions Sim Procede et dispositif de codage audio
FR2911031B1 (fr) * 2006-12-28 2009-04-10 Actimagine Soc Par Actions Sim Procede et dispositif de codage audio
EP2111618A4 (en) * 2007-02-13 2010-04-21 Lg Electronics Inc METHOD AND APPARATUS FOR PROCESSING AUDIO SIGNAL
JP2010521866A (ja) 2007-03-16 2010-06-24 エルジー エレクトロニクス インコーポレイティド オーディオ信号の処理方法及び装置
GB0705328D0 (en) * 2007-03-20 2007-04-25 Skype Ltd Method of transmitting data in a communication system
EP3712888B1 (en) * 2007-03-30 2024-05-08 Electronics and Telecommunications Research Institute Apparatus and method for coding and decoding multi object audio signal with multi channel
JP5291096B2 (ja) * 2007-06-08 2013-09-18 エルジー エレクトロニクス インコーポレイティド オーディオ信号処理方法及び装置
CN101802907B (zh) * 2007-09-19 2013-11-13 爱立信电话股份有限公司 多信道音频的联合增强
GB2453117B (en) 2007-09-25 2012-05-23 Motorola Mobility Inc Apparatus and method for encoding a multi channel audio signal
MX2010004138A (es) * 2007-10-17 2010-04-30 Ten Forschung Ev Fraunhofer Codificacion de audio usando conversion de estereo a multicanal.
CA2705968C (en) * 2007-11-21 2016-01-26 Lg Electronics Inc. A method and an apparatus for processing a signal
US8566108B2 (en) * 2007-12-03 2013-10-22 Nokia Corporation Synchronization of multiple real-time transport protocol sessions
US20100290629A1 (en) * 2007-12-21 2010-11-18 Panasonic Corporation Stereo signal converter, stereo signal inverter, and method therefor
ES2401817T3 (es) * 2008-01-31 2013-04-24 Agency For Science, Technology And Research Procedimiento y dispositivo de distribución/truncado de la velocidad de transmisión de bits para codificación de audio escalable
US9111525B1 (en) * 2008-02-14 2015-08-18 Foundation for Research and Technology—Hellas (FORTH) Institute of Computer Science (ICS) Apparatuses, methods and systems for audio processing and transmission
CN102037507B (zh) * 2008-05-23 2013-02-06 皇家飞利浦电子股份有限公司 参数立体声上混合设备、参数立体声译码器、参数立体声下混合设备、参数立体声编码器
US8355921B2 (en) * 2008-06-13 2013-01-15 Nokia Corporation Method, apparatus and computer program product for providing improved audio processing
KR101428487B1 (ko) * 2008-07-11 2014-08-08 삼성전자주식회사 멀티 채널 부호화 및 복호화 방법 및 장치
US8315396B2 (en) * 2008-07-17 2012-11-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating audio output signals using object based metadata
AU2013200578B2 (en) * 2008-07-17 2015-07-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating audio output signals using object based metadata
WO2010017833A1 (en) * 2008-08-11 2010-02-18 Nokia Corporation Multichannel audio coder and decoder
US9330671B2 (en) * 2008-10-10 2016-05-03 Telefonaktiebolaget L M Ericsson (Publ) Energy conservative multi-channel audio coding
MX2011011399A (es) * 2008-10-17 2012-06-27 Univ Friedrich Alexander Er Aparato para suministrar uno o más parámetros ajustados para un suministro de una representación de señal de mezcla ascendente sobre la base de una representación de señal de mezcla descendete, decodificador de señal de audio, transcodificador de señal de audio, codificador de señal de audio, flujo de bits de audio, método y programa de computación que utiliza información paramétrica relacionada con el objeto.
WO2010091736A1 (en) * 2009-02-13 2010-08-19 Nokia Corporation Ambience coding and decoding for audio applications
WO2010091555A1 (zh) * 2009-02-13 2010-08-19 华为技术有限公司 一种立体声编码方法和装置
CN101826326B (zh) * 2009-03-04 2012-04-04 华为技术有限公司 一种立体声编码方法、装置和编码器
AU2015246158B2 (en) * 2009-03-17 2017-10-26 Dolby International Ab Advanced stereo coding based on a combination of adaptively selectable left/right or mid/side stereo coding and of parametric stereo coding.
AU2013206557B2 (en) * 2009-03-17 2015-11-12 Dolby International Ab Advanced stereo coding based on a combination of adaptively selectable left/right or mid/side stereo coding and of parametric stereo coding
BR122019023924B1 (pt) * 2009-03-17 2021-06-01 Dolby International Ab Sistema codificador, sistema decodificador, método para codificar um sinal estéreo para um sinal de fluxo de bits e método para decodificar um sinal de fluxo de bits para um sinal estéreo
EP2413314A4 (en) * 2009-03-24 2012-02-01 Huawei Tech Co Ltd METHOD AND DEVICE FOR SWITCHING ON A SIGNAL DELAY
CN101533641B (zh) * 2009-04-20 2011-07-20 华为技术有限公司 对多声道信号的声道延迟参数进行修正的方法和装置
GB2470059A (en) * 2009-05-08 2010-11-10 Nokia Corp Multi-channel audio processing using an inter-channel prediction model to form an inter-channel parameter
CN101556799B (zh) * 2009-05-14 2013-08-28 华为技术有限公司 一种音频解码方法和音频解码器
JP5793675B2 (ja) * 2009-07-31 2015-10-14 パナソニックIpマネジメント株式会社 符号化装置および復号装置
KR101613975B1 (ko) * 2009-08-18 2016-05-02 삼성전자주식회사 멀티 채널 오디오 신호의 부호화 방법 및 장치, 그 복호화 방법 및 장치
JP5345024B2 (ja) * 2009-08-28 2013-11-20 日本放送協会 3次元音響符号化装置、3次元音響復号装置、符号化プログラム及び復号プログラム
WO2011029984A1 (en) * 2009-09-11 2011-03-17 Nokia Corporation Method, apparatus and computer program product for audio coding
KR101710113B1 (ko) * 2009-10-23 2017-02-27 삼성전자주식회사 위상 정보와 잔여 신호를 이용한 부호화/복호화 장치 및 방법
JP5511848B2 (ja) * 2009-12-28 2014-06-04 パナソニック株式会社 音声符号化装置および音声符号化方法
JP5333257B2 (ja) * 2010-01-20 2013-11-06 富士通株式会社 符号化装置、符号化システムおよび符号化方法
EP2369861B1 (en) * 2010-03-25 2016-07-27 Nxp B.V. Multi-channel audio signal processing
JP5604933B2 (ja) * 2010-03-30 2014-10-15 富士通株式会社 ダウンミクス装置およびダウンミクス方法
RU2683175C2 (ru) 2010-04-09 2019-03-26 Долби Интернешнл Аб Стереофоническое кодирование на основе mdct с комплексным предсказанием
EP3422346B1 (en) 2010-07-02 2020-04-22 Dolby International AB Audio encoding with decision about the application of postfiltering when decoding
US8948403B2 (en) * 2010-08-06 2015-02-03 Samsung Electronics Co., Ltd. Method of processing signal, encoding apparatus thereof, decoding apparatus thereof, and signal processing system
JP5581449B2 (ja) * 2010-08-24 2014-08-27 ドルビー・インターナショナル・アーベー Fmステレオ無線受信機の断続的モノラル受信の隠蔽
WO2012040898A1 (en) 2010-09-28 2012-04-05 Huawei Technologies Co., Ltd. Device and method for postprocessing decoded multi-channel audio signal or decoded stereo signal
JP5949270B2 (ja) * 2012-07-24 2016-07-06 富士通株式会社 オーディオ復号装置、オーディオ復号方法、オーディオ復号用コンピュータプログラム
KR20140017338A (ko) * 2012-07-31 2014-02-11 인텔렉추얼디스커버리 주식회사 오디오 신호 처리 장치 및 방법
RU2628900C2 (ru) * 2012-08-10 2017-08-22 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Кодер, декодер, система и способ, использующие концепцию остатка для параметрического кодирования аудиобъектов
JP2015534116A (ja) * 2012-09-14 2015-11-26 ドルビー ラボラトリーズ ライセンシング コーポレイション マルチチャネル・オーディオ・コンテンツ解析に基づく上方混合検出
EP2757559A1 (en) * 2013-01-22 2014-07-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for spatial audio object coding employing hidden objects for signal mixture manipulation
TWI546799B (zh) * 2013-04-05 2016-08-21 杜比國際公司 音頻編碼器及解碼器
KR20230020553A (ko) 2013-04-05 2023-02-10 돌비 인터네셔널 에이비 스테레오 오디오 인코더 및 디코더
US8804971B1 (en) * 2013-04-30 2014-08-12 Dolby International Ab Hybrid encoding of higher frequency and downmixed low frequency content of multichannel audio
CN105393304B (zh) * 2013-05-24 2019-05-28 杜比国际公司 音频编码和解码方法、介质以及音频编码器和解码器
SG11201510164RA (en) 2013-06-10 2016-01-28 Fraunhofer Ges Forschung Apparatus and method for audio signal envelope encoding, processing and decoding by splitting the audio signal envelope employing distribution quantization and coding
PT3008726T (pt) 2013-06-10 2017-11-24 Fraunhofer Ges Forschung Aparelho e método de codificação, processamento e descodificação de envelope de sinal de áudio por modelação da representação de soma cumulativa empregando codificação e quantização de distribuição
EP2830053A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal
EP2830051A3 (en) 2013-07-22 2015-03-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, methods and computer program using jointly encoded residual signals
EP3503095A1 (en) 2013-08-28 2019-06-26 Dolby Laboratories Licensing Corp. Hybrid waveform-coded and parametric-coded speech enhancement
EP2854133A1 (en) * 2013-09-27 2015-04-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Generation of a downmix signal
PL3800898T3 (pl) * 2014-05-28 2023-12-27 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Procesor danych i transport danych kontrolnych użytkownika do dekoderów audio i modułów renderowania
EP3067885A1 (en) * 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding a multi-channel signal
CA2997334A1 (en) 2015-09-25 2017-03-30 Voiceage Corporation Method and system for encoding left and right channels of a stereo sound signal selecting between two and four sub-frames models depending on the bit budget
PL3405949T3 (pl) 2016-01-22 2020-07-27 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Urządzenie i sposób szacowania międzykanałowej różnicy czasowej
US10210871B2 (en) * 2016-03-18 2019-02-19 Qualcomm Incorporated Audio processing for temporally mismatched signals
CN106162180A (zh) * 2016-06-30 2016-11-23 北京奇艺世纪科技有限公司 一种图像编解码方法及装置
BR112019009424A2 (pt) 2016-11-08 2019-07-30 Fraunhofer Ges Forschung mixador de redução, método para mixagem de redução de pelo menos dois canais, codificador multicanal, método para codificar um sinal multicanal, sistema e método de processamento de áudio
CA3127805C (en) * 2016-11-08 2023-12-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding or decoding a multichannel signal using a side gain and a residual gain
CN109215667B (zh) 2017-06-29 2020-12-22 华为技术有限公司 时延估计方法及装置
RU2762302C1 (ru) 2018-04-05 2021-12-17 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство, способ или компьютерная программа для оценки разности во времени между каналами
CN110556117B (zh) * 2018-05-31 2022-04-22 华为技术有限公司 立体声信号的编码方法和装置
CN110403582B (zh) * 2019-07-23 2021-12-03 宏人仁医医疗器械设备(东莞)有限公司 一种用于分析脉波波形品质的方法
GB2623516A (en) * 2022-10-17 2024-04-24 Nokia Technologies Oy Parametric spatial audio encoding

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR970005131B1 (ko) * 1994-01-18 1997-04-12 대우전자 주식회사 인간의 청각특성에 적응적인 디지탈 오디오 부호화장치
JP2852862B2 (ja) * 1994-02-01 1999-02-03 株式会社グラフィックス・コミュニケーション・ラボラトリーズ Pcmオーディオ信号の変換方法と装置
KR100335611B1 (ko) * 1997-11-20 2002-10-09 삼성전자 주식회사 비트율 조절이 가능한 스테레오 오디오 부호화/복호화 방법 및 장치
US7292901B2 (en) 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
AU2003212604A1 (en) 2002-04-09 2003-10-20 Koninklijke Philips Electronics N.V. Compound objective lens with fold mirror
ES2341327T3 (es) * 2002-04-10 2010-06-18 Koninklijke Philips Electronics N.V. Codificacion y decodificacion de señales audio multicanal.
US8498422B2 (en) 2002-04-22 2013-07-30 Koninklijke Philips N.V. Parametric multi-channel audio representation
AU2003216682A1 (en) * 2002-04-22 2003-11-03 Koninklijke Philips Electronics N.V. Signal synthesizing
ES2323294T3 (es) * 2002-04-22 2009-07-10 Koninklijke Philips Electronics N.V. Dispositivo de decodificacion con una unidad de decorrelacion.
US7039204B2 (en) * 2002-06-24 2006-05-02 Agere Systems Inc. Equalization for audio mixing
WO2004008806A1 (en) 2002-07-16 2004-01-22 Koninklijke Philips Electronics N.V. Audio coding
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
JPWO2005081229A1 (ja) * 2004-02-25 2007-10-25 松下電器産業株式会社 オーディオエンコーダ及びオーディオデコーダ
WO2005086139A1 (en) * 2004-03-01 2005-09-15 Dolby Laboratories Licensing Corporation Multichannel audio coding
US7391870B2 (en) * 2004-07-09 2008-06-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E V Apparatus and method for generating a multi-channel output signal

Also Published As

Publication number Publication date
DE602005009262D1 (de) 2008-10-02
CN102270452B (zh) 2013-11-13
CA2598541A1 (en) 2006-08-31
EP1851997A1 (en) 2007-11-07
AU2005328264B2 (en) 2009-03-26
JP2008530616A (ja) 2008-08-07
CN101120615A (zh) 2008-02-06
RU2388176C2 (ru) 2010-04-27
HK1107495A1 (en) 2008-04-03
WO2006089570A1 (en) 2006-08-31
AU2005328264A1 (en) 2006-08-31
PL1851997T3 (pl) 2009-01-30
ATE406076T1 (de) 2008-09-15
BRPI0520053B1 (pt) 2019-02-19
PT1851997E (pt) 2008-12-04
KR20070098930A (ko) 2007-10-05
EP1851997B1 (en) 2008-08-20
US20060190247A1 (en) 2006-08-24
CA2598541C (en) 2012-08-14
US7573912B2 (en) 2009-08-11
KR100954179B1 (ko) 2010-04-21
NO20074829L (no) 2007-09-21
BRPI0520053A2 (pt) 2009-04-14
JP4887307B2 (ja) 2012-02-29
NO339907B1 (no) 2017-02-13
RU2007135178A (ru) 2009-03-27
IL185304A0 (en) 2008-02-09
MX2007009887A (es) 2007-09-07
CN101120615B (zh) 2012-05-23
CN102270452A (zh) 2011-12-07

Similar Documents

Publication Publication Date Title
ES2312025T3 (es) Esquema de codificador/descodificador de multicanal casi transparente o transparente.
KR102230727B1 (ko) 광대역 정렬 파라미터 및 복수의 협대역 정렬 파라미터들을 사용하여 다채널 신호를 인코딩 또는 디코딩하기 위한 장치 및 방법
ES2733878T3 (es) Codificación mejorada de señales de audio digitales multicanales
JP7106711B2 (ja) マルチチャネル信号符号化方法、マルチチャネル信号復号方法、エンコーダ、およびデコーダ
JP5185340B2 (ja) マルチチャネルオーディオ信号を表示するための装置と方法
AU2005259618B2 (en) Multi-channel synthesizer and method for generating a multi-channel output signal
KR20200091880A (ko) 양자화 및 엔트로피 코딩을 이용한 방향성 오디오 코딩 파라미터들을 인코딩 또는 디코딩하기 위한 장치 및 방법
NO342804B1 (no) Kompatibel flerkanal-koding/dekoding
TWI792006B (zh) 音訊合成器、訊號產生方法及儲存單元
JP7035154B2 (ja) マルチチャネル信号符号化方法、マルチチャネル信号復号化方法、符号器、及び復号器
TWI843389B (zh) 音訊編碼器、降混訊號產生方法及非暫時性儲存單元
ES2439693T3 (es) Codificación de señales de múltiples canales