ES2403178T3

ES2403178T3 - Codificación de señales estéreo

Info

Publication number: ES2403178T3
Application number: ES03745859T
Authority: ES
Inventors: Ronaldus M. Aarts; Roy Irwan
Original assignee: Koninklijke Philips Electronics NV
Current assignee: Koninklijke Philips NV
Priority date: 2002-04-10
Filing date: 2003-03-20
Publication date: 2013-05-16
Anticipated expiration: 2023-03-20
Also published as: KR20040101415A; BR0304231A; JP4805540B2; EP1500085B1; RU2316154C2; CN1647154A; KR101016251B1; RU2004133032A; EP1500085A1; JP2005522721A; AU2003209957A1; WO2003085643A1; CN100508026C; US20050141721A1; US7437299B2

Abstract

Método para codificar una señal multicanal que incluye al menos una primera componente de señal y unasegunda componente de señal, siendo la primera componente de señal y la segunda componente de señalcomponentes de señal de dominio de tiempo, comprendiendo el método las etapas de - transformar en el dominio de tiempo al menos las componentes de señal primera y segunda medianteuna transformación predeterminada en una señal principal que incluye la mayor parte de la energía deseñal y al menos una señal residual que incluye menos energía que la señal principal, estando latransformación predeterminada parametrizada por al menos un parámetro de transformación; y - representar la señal multicanal al menos mediante la señal principal y el parámetro de transformación.

Description

Codificación de señales estéreo

Esta invención se refiere a la codificación de señales multicanal que incluyen al menos una primera y una segunda componente de señal. Más particularmente, la invención se refiere a la codificación de señales de audio multifónicas, tales como señales estereofónicas.

Las señales de audio estereofónicas comprenden una componente de señal izquierda (L) y una derecha (R) que pueden originarse desde una fuente de señal estéreo, por ejemplo desde micrófonos separados. La codificación de señales de audio tiene el objetivo de reducir la tasa de transmisión de bits de una señal estereofónica, por ejemplo con el fin de permitir una transmisión eficaz de señales de sonido a través de una red de comunicaciones, tal como Internet, a través de un módem y líneas telefónicas analógicas, canales de comunicación móvil u otras redes inalámbricas, etc., y almacenar una señal de sonido estereofónica en una tarjeta de chip u otro medio de almacenamiento con capacidad de almacenamiento limitada.

La patente estadounidense n.º 4.589.127 da a conocer un transmisor para señales estereofónicas que genera señales de suma y de diferencia de las señales L y R estéreo. Las señales de suma y de diferencia se usan posteriormente en un esquema de modulación que da como resultado una señal modulada que comprende la información tanto de suma como de diferencia.

Sin embargo, el anterior método de la técnica anterior no aborda el problema de la codificación de una señal estéreo con una utilización eficaz de tasa de transmisión de bits, es decir con una tasa de transmisión de bits baja para una calidad de sonido dada.

El documento no de patente VAN DER WAAL R G ET AL.: “Subband coding of stereophonic digital audio signals”, SPEECH PROCESSING 2, VLSI, UNDERWATER SIGNAL PROCESSING. TORONTO, 14-17 DE MAYO DE 1991, ICASSP, NUEVA YORK, 14 de abril de 1991, páginas 3601-3604, XP010043648, da a conocer otro enfoque para la codificación de audio estereofónico.

Los anteriores y otros problemas se resuelven mediante un método para codificar una señal multicanal tal como se define en la reivindicación 1.

Por consiguiente, transformando la señal multicanal en una señal principal que incluye la mayor parte de la energía y una señal residual que sólo incluye poca energía de señal, la señal multicanal puede representarse mediante la señal principal, el parámetro de transformación y, opcionalmente, una señal residual pequeña, mejorando así la eficacia de codificación para la señal multicanal. Efectivamente, la señal multicanal puede codificarse con una tasa de transmisión de bits que es sólo ligeramente mayor que la de un único canal, por ejemplo un canal monofónico. La señal codificada resultante puede almacenarse y/o comunicarse a un receptor.

Cuando el método comprende además la etapa de determinar de manera adaptativa el parámetro de transformación basándose en al menos las componentes de señal primera y segunda, puede hacerse un seguimiento del parámetro de transformación óptimo de manera continua, garantizando así que la transformación sigue siendo óptima aunque cambien las características de la señal de entrada, por ejemplo en el ejemplo de una señal de audio debido a una fuente de sonido en movimiento o a cambios en las propiedades acústicas del entorno.

Cuando la transformación predeterminada es una rotación y el parámetro de transformación corresponde a un ángulo de rotación, se proporciona una transformación sencilla basándose sólo en un único parámetro, el ángulo de rotación. Adaptando el ángulo de manera que las componentes de señal, por ejemplo las componentes de señal L y R de una señal estéreo, roten en una señal de componente principal y una señal residual, se proporciona una codificación eficaz mientras se mantiene una señal de alta calidad.

En una realización preferida de la invención, la etapa de representar la señal multicanal al menos mediante la señal principal y el parámetro de transformación comprende además la etapa de representar la señal multicanal mediante la señal principal, el parámetro de transformación y la señal residual, mejorando así adicionalmente la calidad de la señal codificada puesto que no se descarta ninguna información de señal. Puesto que la señal residual es pequeña en comparación con la señal principal, la asignación de bits puede ajustarse entre esas señales. Además, puesto que la asignación de tasa de transmisión de bits puede variar, se proporciona un mecanismo para una degradación equilibrada, por ejemplo aumentando o disminuyendo de manera adaptativa la tasa de transmisión de bits permitida para la señal residual.

Por consiguiente, en una realización adicional preferida, la etapa de representar la señal multicanal mediante la señal principal, el parámetro de transformación y la señal residual, comprende además las etapas de

-: codificar la señal principal con una primera tasa de transmisión de bits; y

-: codificar la señal residual con una segunda tasa de transmisión de bits más pequeña que la primera tasa de transmisión de bits. En otra realización preferida,

-: el método comprende además la etapa de estimar la señal residual a partir de la señal principal usando un filtro de predicción que corresponde a un conjunto de parámetros de filtro; y

-: la etapa de representar la señal multicanal al menos mediante la señal principal y el parámetro de transformación comprende la etapa de representar la señal multicanal mediante la señal principal, el parámetro de transformación y el conjunto de parámetros de filtro.

Esta realización de la invención se basa en el reconocimiento de que para muchas señales multicanal, por ejemplo en el caso de señales de audio para señales de música y de habla, la señal residual puede estimarse como versión filtrada de la señal principal. Por tanto, cuando se determina un conjunto de parámetros de filtro de un filtro adaptativo que modela la señal residual, los parámetros de filtro pueden codificarse junto con la señal principal y el parámetro de transformación. Por consiguiente, se evita tener que comunicar la señal residual sin perder la información incluida en esa señal, proporcionando así una codificación eficaz que conserva un alto nivel de calidad.

Una ventaja de la invención es que proporciona una utilización de tasa de transmisión de bits eficaz, es decir un esquema de codificación que usa una tasa de transmisión de bits baja para una calidad de sonido dada. El esquema de codificación según la invención puede usarse para reducir la tasa de transmisión de bits sin reducir significativamente la calidad de sonido, para mantener la tasa de transmisión de bits mientras se mejora la calidad de sonido, o una combinación de los anteriores.

La invención se refiere además a un método para decodificar información de señal multicanal tal como se define en la reivindicación 10.

La presente invención puede implementarse de diferentes maneras incluyendo los métodos descritos anteriormente y a continuación, disposiciones para codificar y decodificar señales multicanal, respectivamente, una señal de datos, y medios de producto adicionales, dando lugar cada uno, uno o más de los beneficios y ventajas descritos en relación con el método mencionado en primer lugar, y teniendo cada uno, una o más realizaciones preferidas que corresponden a las realizaciones preferidas descritas en relación con el método mencionado en primer lugar y dadas a conocer en las reivindicaciones dependientes.

Se observa que las características de los métodos descritos anteriormente y a continuación pueden implementarse en software y llevarse a cabo en un sistema de procesamiento de datos u otros medios de procesamiento provocados por la ejecución de instrucciones ejecutables por ordenador. Las instrucciones pueden ser medios de código de programa cargados en una memoria, tal como una RAM, desde un medio de almacenamiento o desde otro ordenador a través de una red informática. Alternativamente, las características descritas pueden implementarse mediante un conjunto de circuitos físicos en lugar de software o en combinación con software.

La invención se refiere además a una disposición para codificar una señal multicanal tal como se define en la reivindicación 13.

La invención se refiere además a una disposición para decodificar información de señal multicanal tal como se define en la reivindicación 14.

Las disposiciones anteriores pueden formar parte de cualquier equipo electrónico, incluyendo ordenadores, tales como PC estacionarios y portátiles, equipos de comunicaciones de radio estacionarios y portátiles y otros dispositivos manuales o portátiles, tales como teléfonos móviles, buscapersonas, reproductores de audio, reproductores multimedia, comunicadores, es decir organizadores electrónicos, teléfonos inteligentes, asistentes digitales personales (PDA), ordenadores manuales o similares.

El término medios de procesamiento comprende microprocesadores programables para fines generales o especiales, procesadores de señal digital (DSP), circuitos integrados de aplicación específica (ASIC), disposiciones lógicas programables (PLA), disposiciones de puertas programables en campo (FPGA), circuitos electrónicos para fines especiales, etc., o una combinación de los mismos. Los medios de procesamiento primeros y segundos anteriores pueden ser medios de procesamiento separados o pueden estar comprendidos en un medio de procesamiento.

El término medios de recepción incluye un conjunto de circuitos y/o dispositivos adecuados para permitir la comunicación de datos, por ejemplo a través de un enlace de datos por cable o inalámbrico. Ejemplos de tales medios de recepción incluyen una interfaz de red, una tarjeta de red, un receptor de radio, un receptor para otras señales electromagnéticas adecuadas, tales como luz infrarroja, por ejemplo a través de un puerto IrDa, comunicaciones basadas en radio, por ejemplo a través de transceptores Bluetooth o similares. Ejemplos adicionales de tales medios de recepción incluyen un módem por cable, un módem telefónico, un adaptador de red digital de servicios integrados (RDSI), un adaptador de línea de abonado digital (DSL), un transceptor vía satélite, un adaptador Ethernet o similares.

El término medios de recepción comprende además otros circuitos/dispositivos de entrada para recibir señales de datos, por ejemplo señales de datos almacenadas en un medio legible por ordenador. Ejemplos de tales medios de recepción incluyen una unidad de disco flexible, una unidad de CD-Rom, una unidad de DVD o cualquier otra unidad de disco adecuada, un adaptador de tarjeta de memoria, un adaptador de tarjeta inteligente, etc.

La invención se refiere además a una señal de datos que incluye información de señal multicanal tal como se define en la reivindicación 15.

La invención se refiere además a un dispositivo para comunicar una señal multicanal tal como se define en la reivindicación 16.

Estos y otros aspectos de la invención resultarán evidentes a partir de y se aclararán con referencia a las realizaciones y con referencia al dibujo, en el que:

la figura 1 muestra una vista esquemática de un sistema para comunicar señales estéreo según una realización de la invención;

la figura 2 muestra una vista esquemática de una disposición para codificar una señal estéreo según una primera realización de la invención;

la figura 3 ilustra la determinación de la transformación de señal según una realización de la invención;

la figura 4 muestra una vista esquemática de una disposición para decodificar una señal estéreo según una primera realización de la invención;

la figura 5 muestra una vista esquemática de una disposición para codificar una señal estéreo según una segunda realización de la invención;

la figura 6 muestra una vista esquemática de una disposición para decodificar una señal estéreo según una segunda realización de la invención;

las figuras 7a-c muestran vistas esquemáticas de ejemplos de un circuito de filtro para su uso en una realización de la invención;

la figura 8 muestra una vista esquemática de una disposición para codificar una señal estéreo según una tercera realización de la invención;

la figura 9 muestra una vista esquemática de una disposición para codificar una señal estéreo según una cuarta realización de la invención;

la figura 10 muestra una vista esquemática de una disposición para decodificar una señal estéreo según la cuarta realización de la invención;

la figura 11 muestra una vista esquemática de una disposición para codificar una señal multicanal según una quinta realización de la invención;

la figura 12 muestra una vista esquemática de una disposición para codificar una señal multicanal según una sexta realización de la invención; y

la figura 13 muestra una vista esquemática de un circuito de sustracción para su uso con una realización de la invención.

La figura 1 muestra una vista esquemática de un sistema para comunicar señales estéreo según una realización de la invención. El sistema comprende un dispositivo 101 de codificación para generar una señal estereofónica codificada y un dispositivo 105 de decodificación para decodificar una señal codificada recibida en una componente de señal estéreo L y una componente de señal estéreo R. El dispositivo 101 de codificación y el dispositivo 105 de decodificación pueden ser cada uno cualquier equipo electrónico o parte de tal equipo. En este caso, el término equipo electrónico comprende ordenadores, tales como PC estacionarios y portátiles, equipos de comunicación de radio estacionarios y portátiles y otros dispositivos manuales o portátiles, tales como teléfonos móviles, buscapersonas, reproductores de audio, reproductores multimedia, comunicadores, es decir organizadores electrónicos, teléfonos inteligentes, asistentes digitales personales (PDA), ordenadores manuales o similares. Se observa que el dispositivo 101 de codificación y el dispositivo de decodificación pueden combinarse en un equipo electrónico en el que las señales estereofónicas se almacenan en un medio legible por ordenador para una reproducción posterior.

El dispositivo 101 de codificación comprende un codificador 102 para codificar una señal estereofónica según la invención, incluyendo la señal estereofónica una componente de señal L y una componente de señal R. El codificador recibe las componentes de señal L y R y genera una señal codificada T. La señal estereofónica L y R, 5 puede originarse desde un conjunto de micrófonos, por ejemplo a través de un equipo electrónico adicional, tal como un equipo de mezcla, etc. Las señales pueden recibirse adicionalmente como salida de otro reproductor estéreo, por el aire como señal de radio, o mediante cualquier otro medio adecuado. A continuación se describirán realizaciones preferidas de un codificador de este tipo según la invención. Según una realización, el codificador 102 se conecta a un transmisor 103 para transmitir la señal codificada T a través de un canal 109 de comunicaciones al dispositivo 105 de decodificación. El transmisor 103 puede comprender un conjunto de circuitos adecuado para permitir la comunicación de datos, por ejemplo a través de un enlace 109 de datos por cable o inalámbrico. Ejemplos de un transmisor de este tipo incluyen una interfaz de red, una tarjeta de red, un transmisor de radio, un transmisor para otras señales electromagnéticas adecuadas, tales como un LED para transmitir luz infrarroja, por ejemplo a través de un puerto IrDa, comunicaciones basadas en radio, por ejemplo a través de un transceptor Bluetooth o similares. 15 Ejemplos adicionales de transmisores adecuados incluyen un módem por cable, un módem telefónico, un adaptador de red digital de servicios integrados (RDSI), un adaptador de línea de abonado digital (DSL), un transceptor vía satélite, un adaptador Ethernet o similares. De manera correspondiente, el canal 109 de comunicaciones puede ser cualquier enlace de datos por cable o inalámbrico adecuado, por ejemplo de una red de comunicaciones basada en paquetes, tal como Internet u otra red TCP/IP, un enlace de comunicaciones de corto alcance, tal como un enlace infrarrojo, una conexión Bluetooth u otro enlace basado en radio. Ejemplos adicionales del canal de comunicaciones incluyen redes informáticas y redes de telecomunicaciones inalámbricas, tales como una red de datos por paquetes digitales celulares (CDPD), una red de sistema global para comunicaciones móviles (GSM), una red de acceso múltiple por división de código (CDMA), una red de acceso múltiple por división de tiempo (TDMA), una red de servicio general de radio por paquetes (GPRS), una red de tercera generación, tal como una red UMTS o similar. 25 Alternativa o adicionalmente, el dispositivo de codificación puede comprender una o más interfaces 104 de otro tipo para comunicar la señal estéreo codificada T al dispositivo 105 de decodificación. Ejemplos de tales interfaces incluyen una unidad de disco para almacenar datos en un medio 110 legible por ordenador, por ejemplo una unidad de disco flexible, una unidad de CD-ROM de lectura/escritura, una unidad de DVD, etc. Otros ejemplos incluyen una ranura para tarjeta de memoria, un lector/escritor de tarjeta magnética, una interfaz para acceder a una tarjeta inteligente, etc. De manera correspondiente, el dispositivo 105 de decodificación comprende un receptor 108 correspondiente para recibir la señal transmitida por el transmisor y/u otra interfaz 106 para recibir la señal estéreo codificada comunicada a través de la interfaz 104 y el medio 110 legible por ordenador. El dispositivo de decodificación comprende además un decodificador 107 que recibe la señal recibida T y la decodifica en componentes estéreo L’ y R’ correspondientes. A continuación se describirán realizaciones preferidas de un

35 decodificador de este tipo según la invención. Las señales decodificadas L’ y R’ pueden alimentarse posteriormente a un reproductor estéreo para su reproducción a través de un conjunto de altavoces, auriculares o similares.

La figura 2 muestra una vista esquemática de una disposición 102 para codificar una señal estéreo según una primera realización de la invención. La disposición comprende un conjunto 201 de circuitos para realizar una rotación de la señal estéreo en el espacio L-R en un ángulo a, dando como resultado componentes de señal rotadas y y r según la transformación

45 donde wL=cosa y wR=sena se denominarán factores de ponderación.

Según la invención, el ángulo a se determina de manera que corresponda a una dirección de alta varianza de señal. La dirección de máxima varianza de señal, es decir la componente principal, puede estimarse mediante un análisis de componente principal de manera que la componente rotada y corresponde a la señal de componente principal que incluye la mayor parte de la energía de señal, y r es una señal residual. De manera correspondiente, la disposición de la figura 2 comprende un conjunto 200 de circuitos que determina el ángulo a o, alternativamente, los factores de peso wL y wR.

Haciendo referencia a la figura 3, según una realización preferida, los factores de peso wL y wR anteriores se 55 determinan según el siguiente algoritmo:

Inicialmente, las señales estéreo L y R entrantes se rectifican y se filtran paso bajo, dando como resultado señales de envolvente p(k) de L y q(k) de R, respectivamente, donde p(k) y q(k) están muestreadas de manera adecuada y el índice de muestra se denomina k. Por tanto, el vector x(k) = (p(k), q(k)) indica el vector de señal entrante. Alternativamente, las señales L y R pueden usarse directamente, es decir sin filtrado, o pueden usarse otras versiones filtradas de L y R, por ejemplo señales filtradas paso alto L y R. En la figura 3, se ilustran varios puntos de señal como círculos. Como ejemplo, se indican el punto de señal x(k) y sus componentes p(k) y q(k) correspondientes. Según la invención, las señales se rotan en la dirección de la componente principal de los vectores de señal. En el ejemplo de la figura 3, esto corresponde a la dirección y, siendo a el ángulo entre la dirección y y la dirección p. El vector de peso w = (wL, wR) indica la dirección de la componente principal, y las componentes rotadas de x(k) se indican como y(k) y r(k), respectivamente.

La componente principal puede determinarse mediante cualquier método adecuado conocido en la técnica. En una realización particularmente ventajosa, se usa un método iterativo que utiliza la regla de Oja (véase por ejemplo S. Haykin: “Neural Networks”, Prentice Hall, N.J., 1999). Según esta realización, el vector de peso w se estima de manera iterativa según la siguiente ecuación

donde w(k) = (wL(k), wR(k)) corresponde a la estimada en el instante k. Por ejemplo, la iteración anterior puede iniciarse con un conjunto de pequeños pesos aleatorios w(0), o de cualquier otra manera adecuada. El vector de peso estimado anterior puede usarse para calcular la señal rotada según y(k) = wT(k)x(k). Alternativamente, la iteración de la ecuación (2) puede realizarse en bloques, por ejemplo para un bloque de N muestras, donde N depende de la implementación particular, por ejemplo, N=512, 1024, 2048, etc. En esta realización, puede usarse el vector de peso estimado w(N) para un bloque en la transformación de todas las muestras de ese bloque según y(k) = wT(N)x(k).

El factor I en la ecuación (2) corresponde a una escala de tiempo del algoritmo de seguimiento. Si I=0, los factores de ponderación y, por tanto, el ángulo a, permanecen constantes, mientras que cambian rápidamente para I grande. Como ejemplo, para un tamaño de bloque de 2048 muestras, I puede seleccionarse del orden de 10-3 para una tasa de muestreo de 44,1 kHz.

Una ventaja del algoritmo iterativo anterior es que es lineal, es decir no requiere el cálculo de ninguna función trigonométrica, raíces cuadradas o similares. Una ventaja adicional es que la iteración anterior proporciona un vector de peso w normalizado, puesto que el término -I w(k-1)y(k-1) en la ecuación (2) corresponde a un término de disminución de peso que penaliza pesos grandes mientras que el término + I x(k-1) dirige el vector de peso en la dirección de la componente principal. Se observa además que en la presente realización, puesto que x(k) es la señal envolvente, wL,wR E [0,1], es decir el vector de peso w permanece en el primer cuadrante en la figura 3, garantizando así que I es positivo. Una ventaja adicional de esta realización es que es suficiente transmitir uno de

wL y wR, puesto que el otro factor puede determinarse según . Alternativamente, puede transmitirse el ángulo a.

Haciendo referencia de nuevo a la figura 2, el circuito 200 emite el ángulo a determinado o, alternativamente, uno o ambos de los factores de peso wL y wR. La información de ángulo se alimenta al circuito 201 de rotación que genera las componentes de señal rotadas y y r. Se entiende que los circuitos 200 y 201 pueden combinarse en un único circuito que realice el cálculo iterativo de la ecuación (2) y el cálculo de y y r según la ecuación (1).

La disposición comprende además codificadores 202 que realizan una codificación apropiada de las señales y y r, respectivamente. Por ejemplo, las señales pueden codificarse según MPEG, por ejemplo capa 3 de MPEG I (MP3), según una codificación sinusoidal (SSC), o esquemas de codificación de audio basados en esquemas de subbanda, paramétricos o de transformada, o cualquier otro esquema adecuado o combinación de los mismos. Se entiende que los codificadores 202 pueden ser del mismo tipo o de tipos diferentes, por ejemplo un codificador de MP3 y un codificador de SSC, etc. Las señales codificadas ye y re resultantes, respectivamente, se alimentan a un circuito 204 combinador junto con la información de ángulo a. El circuito 204 combinador realiza división en tramas, asignación de tasa de transmisión de bits y codificación sin pérdidas, dando como resultado una señal combinada T que va a comunicarse. En una realización, el ángulo a o, alternativamente, wL y/o wR pueden comunicarse como parte de una cabecera transmitida antes de una trama de señal, un bloque de señal o similar. Según la invención, puesto que se hace un seguimiento del ángulo a de transformación de manera que la señal de componente principal incluya la mayor parte de la energía de señal, las tasas de transmisión de bits asignadas a las señales y y r pueden seleccionarse para que sean diferentes, optimizando así la eficacia de codificación.

Por ejemplo, las señales estéreo L y R pueden expresarse como L=M+S y R=M-S, donde M corresponde a una señal en el medio o central y S corresponde a una señal estéreo o lateral. En el caso de una grabación acústica de una fuente de sonido estacionaria, por ejemplo un hablante grabado por dos micrófonos, las señales L y R son sustancialmente iguales, si el hablante está situado exactamente entre los micrófonos y suponiendo que no hay distorsiones acústicas tales como reflexiones, etc. Por tanto, en este caso S es sustancialmente cero o al menos pequeña y el esquema de codificación según la invención proporciona sustancialmente y correspondiente a L+R y r correspondiente a L-R de manera que son cero o pequeñas; esto corresponde a a = 45 grados. Si el hablante no está situado exactamente entre los micrófonos, es decir hay una asimetría, pero todavía suponiendo que no hay reflexiones u otras distorsiones, la señal rotada y según la invención todavía corresponde al hablante y la señal residual r es sustancialmente cero. Sin embargo, en este caso el ángulo a difiere de 45 grados. Si la fuente de sonido se mueve, por ejemplo de izquierda a derecha, el método según la invención todavía proporciona una señal de componente principal y que corresponde a la fuente y una señal residual r pequeña, que es idealmente r=0. En este caso, a cambia de 0 (completamente hacia la izquierda) a 90 grados (completamente hacia la derecha).

El ejemplo anterior ilustra la ventaja de hacer un seguimiento del ángulo a. En las situaciones anteriores puede ser suficiente transmitir la señal de componente principal y y el ángulo a, con el fin de permitir que el decodificador reconstruya las señales originales R y L sin una pérdida significativa en calidad. En general, cuando la señal residual r es pequeña en comparación con la señal principal, la asignación de bits o eficacia de codificación puede ajustarse entre y y r. Por tanto, una ventaja de la invención es que permite una codificación eficaz de señales estéreo.

La figura 4 muestra una vista esquemática de una disposición 107 para decodificar una señal estéreo según la primera realización de la invención. La disposición recibe una señal estéreo codificada T, por ejemplo que se origina desde un codificador según la realización descrita en relación con la figura 2. La disposición comprende un circuito 404 para extraer las señales codificadas ye y re y la información de ángulo a a partir de la señal combinada T, es decir el circuito 404 realiza una operación inversa a la del combinador 204 de la figura 2. Las señales ye y re extraídas se alimentan a decodificadores 402 correspondientes que realizan una decodificación de audio que corresponde a la codificación realizada por los codificadores 202 de la figura 2, dando como resultado la señal de componente principal decodificada y’ y la señal residual decodificada r’. Las señales y’, r’ y la información de ángulo a se alimentan a un circuito 401 de rotación que rota las señales y’, r’ de vuelta a la dirección de las componentes L y R originales, dando como resultado así las señales recibidas L’ y R’.

La figura 5 muestra una vista esquemática de una disposición para codificar una señal estéreo según una segunda realización de la invención. La disposición comprende un conjunto 201 de circuitos que realiza una rotación de las señales estéreo L y R en un ángulo a, dando como resultado componentes de señal rotadas y y r, tal como se describió en relación con la figura 2. La disposición comprende además un conjunto 200 de circuitos para determinar el ángulo de rotación tal como se describió en relación con las figuras 2 y 3. Según esta realización de la invención, se reconoce que la señal residual r puede estimarse como versión filtrada de la señal principal y. Tal como se describe en relación con la figura 2, en una grabación acústica de una fuente de audio grabada por dos micrófonos en ausencia de distorsiones acústicas, por ejemplo debido a reflexiones, etc., la señal principal y corresponde a la fuente de audio y la señal residual es sustancialmente cero. Sin embargo, en una situación más realista se presentan distorsiones, por ejemplo debido a reflexiones de la señal en las paredes de una sala y en la cabeza y torso del hablante, etc. Estos efectos influyen en la señal residual r. Por consiguiente, cuando se estima la señal residual mediante un filtro, el filtro en efecto modela la acústica de la sala, etc. Para una orquesta clásica la situación es similar, mientras que en el caso de música pop moderna la situación puede ser ligeramente diferente. En este caso, un ingeniero de sonido mezcla normalmente múltiples canales en dos canales, usando a menudo una reverberación artificial, aparatos de efectos, etc. En este caso, el filtro modela los efectos acústicos introducidos por el proceso de mezclado.

Haciendo referencia todavía a la figura 5, la disposición comprende un filtro 501 adaptativo que recibe la señal principal y como entrada y que genera una señal filtrada . Los parámetros de filtro Fp del filtro adaptativo se seleccionan de manera que la señal filtrada

: se aproxima a la señal residual r, por ejemplo controlando el filtro 501 adaptativo mediante la señal de error e indicando la diferencia entre r y

: tal como se generan por un circuito 502 de sustracción. Los parámetros de filtro Fp resultantes se alimentan a un circuito 204 combinador, preferiblemente después de una codificación apropiada mediante un codificador 503, por ejemplo un codificador que proporciona una codificación de Huffman o cualquier otro esquema de codificación adecuado. El filtro 501 puede ser cualquier filtro adecuado conocido en la técnica. Ejemplos de tales filtros incluyen un filtro de respuesta finita al impulso (FIR) o un filtro de respuesta infinita al impulso (IIR), adaptativo o fijo, fijándose o haciéndose un seguimiento de las frecuencias de corte y de las magnitudes de manera recursiva, o similar. El filtro puede ser de cualquier orden, preferiblemente menor a 10. El tipo del filtro puede ser Butterworth, Chebychev o cualquier otro tipo adecuado de filtro. La disposición comprende además un codificador 202 para codificar la señal principal tal como se describió en relación con la figura 2, dando como resultado la señal principal codificada ye que se alimenta al circuito 204 combinador junto con los parámetros de filtro Fp y la información de ángulo a. Tal como se describió en relación con la figura 2, el circuito 204 combinador realiza división en tramas, asignación de tasa de transmisión de bits y codificación sin pérdidas, dando como resultado una señal combinada T que va a comunicarse que incluye la señal principal codificada ye, los parámetros de filtro Fp y la información de ángulo a. Según esta realización de la invención, la tasa de transmisión de bits que va a asignarse a los parámetros de filtro Fp puede ser considerablemente menor que la tasa de transmisión de bits necesaria para la señal principal y, por ejemplo, en una realización, la tasa de transmisión de bits para Fp puede ser, en promedio, menor que el 10% de la tasa de transmisión de bits para y. Por tanto, una ventaja de la invención es que reduce la tasa de transmisión de bits necesaria para transmitir una señal estéreo. La tasa de transmisión de bits total según la invención es sólo ligeramente mayor que para un único canal monofónico. Sin embargo, se observa que esta proporción puede variar durante una grabación. Por ejemplo, la proporción puede hacerse más pequeña, por ejemplo en una situación con pequeñas distorsiones y una fuente estacionaria, pero también más grande, por ejemplo si las señales L y R son momentáneamente independientes.

La figura 6 muestra una vista esquemática de una disposición 107 para decodificar una señal estéreo según la segunda realización de la invención. La disposición recibe una señal estéreo codificada T, por ejemplo que se origina desde un codificador según la realización descrita en relación con la figura 5. La disposición comprende un circuito 404 para extraer la señal codificada ye, los parámetros de filtro Fp y la información de ángulo a de la señal combinada T, es decir el circuito 404 realiza una operación inversa a la del combinador 204 de la figura 5. La señal ye extraída se alimenta a un decodificador 402 para realizar una decodificación de audio que corresponde a la codificación realizada por el codificador 202 de la figura 5, dando como resultado la señal de componente principal decodificada y’. Preferiblemente, los parámetros de filtro se decodifican mediante un decodificador 602 que corresponde a la codificación de los parámetros de filtro por el codificador 503 de la figura 5. La señal y’ se alimenta

a un filtro 601 junto con los parámetros de filtro Fp recibidos. El filtro 601 genera una señal residual estimada correspondiente. La señal de componente principal recibida y’, la señal residual estimada

: y la información de ángulo a recibida se alimentan a un circuito 401 de rotación que rota las señales y’,

: de vuelta a la dirección de las componentes L y R originales, dando como resultado las señales recibidas L’ y R’.

En la realización descrita en relación con las figuras 5 y 6, los filtros 501 y 601 pueden ser un filtro adaptativo convencional en el dominio temporal o de tiempo (véase por ejemplo “Adaptive Filter Theory”, por S. Haykin, Prentice Hall, 2001), por ejemplo un filtro adaptativo conocido del campo de la cancelación de eco. Otros ejemplos de filtros incluyen un filtro de FIR o IIR fijo con una frecuencia de corte y magnitud fijas o adaptativas. Alternativamente, en una realización, el filtro puede basarse en un modelo psicoacústico del sistema auditivo humano, por ejemplo tal como se conoce de la codificación de MPEG, reduciendo así el número de parámetros de filtro. Según todavía otra realización, el filtro se simplifica adicionalmente, por ejemplo usando un filtro de orden 10 usando 5 filtros bicuadráticos y una unidad de reverberación artificial. En esta realización, en el lado de codificación, se adapta el filtro y se determina el tiempo de reverberación. Estos parámetros varían lentamente, reduciendo así la tasa de transmisión de bits necesaria para su transmisión.

Las figuras 7a-c muestran vistas esquemáticas de ejemplos de un circuito de filtro para su uso en una realización de la invención.

En el ejemplo de la figura 7a, el filtro 501 comprende una combinación de un filtro 701 y un filtro 702 de reverberación. Por ejemplo, el filtro 701 puede ser un filtro adaptativo convencional en el dominio temporal o de tiempo, un filtro de FIR o IIR fijo con una frecuencia de corte y magnitud fijas o adaptativas, etc., por ejemplo un filtro paso alto. Según esta realización, tanto los parámetros de filtro del filtro 701 como los parámetros del filtro 702 de reverberación, tal como el tiempo de reverberación indicado como T60, se transmiten al decodificador como parámetros de filtro Fp.

En el ejemplo de la figura 7b, además de los filtros 701 y 702, se añaden dos circuitos 703-704 de control. Se añade un circuito 703 de control para garantizar que la potencia promedio de la señal residual r y la potencia promedio de la salida del reverberador 702 son aproximadamente iguales, por ejemplo multiplicando la salida del reverberador 702 por un parámetro 11. Un segundo circuito 704 de control multiplica la salida ajustada a escala del reverberador por 12. El factor 12 puede seleccionarse en el intervalo de entre -3 dB y +6 dB y se determina de manera que la correlación cruzada p entre r y

: sea lo más alta posible, es decir que las señales r y f sean lo más similares posibles. Por tanto, la disposición de filtro de la figura 7b comprende además un circuito 705 para determinar la correlación cruzada p. La disposición de filtro comprende además un multiplicador 706 para generar el producto 1=11·12 que se emite como parte de los parámetros de filtro Fp. Por tanto, 11 es una ganancia que se controla automáticamente, por ejemplo comparando la media absoluta de r y , y 12 es otra ganancia que se controla automáticamente, por ejemplo mediante el uso del coeficiente de correlación cruzada p. Se pretende que la primera

ganancia garantice que se conserve la energía de r, es decir que la energía de la señal predicha

: en el receptor corresponda a la energía de r. La segunda ganancia es para garantizar que r y

: estén adecuadamente correlacionados.

En una realización, el reverberador 702 y el filtro 701 pueden ser fijos, es decir no adaptados según los parámetros de filtro Fp. Además, 12 puede ser fijo, dejando así el parámetro 11 que varía lentamente como el único parámetro adaptativo que es necesario ajustar y transmitir. Por consiguiente, se proporciona una disposición de filtro particularmente sencilla. Una ventaja de esta realización es que sólo requiere aproximadamente la mitad de la tasa de transmisión de bits estéreo original para transmitir una señal estéreo. Debe observarse que pueden usarse variaciones adicionales de la realización anterior. Por ejemplo, en una realización puede prescindirse del filtro 701.

Además, alternativa o adicionalmente a la correlación p, pueden usarse otras medidas de correlación para garantizar un alto grado de similitud entre la señal original y la señal después de la codificación-decodificación. Por ejemplo, en una realización pueden usarse dos correladores en lugar del correlador 705. Un correlador puede calcular la correlación cruzada pLR de las señales de entrada L y R. Además, un segundo correlador puede calcular la correlación cruzada p’LR de las salidas L’ y R’ resultantes del codificador-decodificador, es decir según esta realización, el codificador comprende además un circuito de decodificador para determinar las señales L’ y R’. Esta realización usa la diferencia lp=pLR -p’LR para controlar 12 de manera que lp se mínima. Esto se ilustra en la figura 7c, en la que el correlador de la figura 7b se sustituye por el circuito 707 que recibe las señales L y R así como L’ y R’ como entradas y genera como salida una señal indicativa de la diferencia lp. La salida lp del circuito 707 controla el circuito 704 para ajustar a escala el residuo estimado

de manera que se minimice lp. En una realización, las entradas al circuito 707 se filtran paso alto, por ejemplo a 250 Hz, de manera que las bajas frecuencias tengan una contribución decreciente con respecto a lp. Como en la realización de la figura 7b, una ventaja de esta realización es que la correlación entre la imagen estéreo resultante y la imagen estéreo original antes de la codificacióndecodificación es muy alta.

La figura 8 muestra una vista esquemática de una disposición para codificar una señal estéreo según una tercera realización de la invención. La disposición es una variación de la realización descrita en relación con la figura 5, y comprende un conjunto 201 de circuitos para realizar una rotación de las señales estéreo L y R, un conjunto 200 de circuitos para determinar el ángulo de rotación, un filtro 501 adaptativo, un circuito 502 de sustracción, un codificador 202, un codificador 503 y un circuito 204 combinador, tal como se describió en relación con la figura 5. Según esta realización, la señal de componente principal y no se alimenta directamente al filtro 501. En lugar de ello, la disposición comprende además un decodificador 402 tal como se describió en relación con la figura 6. El decodificador 402 recibe la señal de componente principal codificada ye generada por el codificador 202 y genera la señal principal decodificada y’ que se alimenta al filtro 501. Una ventaja de esta realización es que reduce el efecto de errores de codificación introducidos por la codificación y decodificación de la señal y. Estos errores de codificación hacen que la señal decodificada y’ sea ligeramente diferente de la señal original y debido al hecho de que el decodificador 402 en la práctica no es una inversa perfecta del codificador 202, es decir E E-1 f 1. Por consiguiente, aplicando una codificación y decodificación de la señal y en el decodificador, la entrada y’ al filtro 501 corresponde a la entrada y’ alimentada al filtro 601 en el receptor, mejorando así el resultado de la predicción de r’ de la señal residual en el receptor. Por tanto, el codificador según esta realización puede usarse en relación con un decodificador según la realización de la figura 6.

La figura 9 muestra una vista esquemática de una disposición para codificar una señal estéreo según una cuarta realización de la invención. La disposición es una variación de la realización descrita en relación con la figura 5, y comprende un conjunto 201 de circuitos para realizar una rotación de las señales estéreo L y R, un conjunto 200 de circuitos para determinar el ángulo de rotación, un filtro 501 adaptativo, un circuito 502 de sustracción, un codificador 202, un codificador 503 y un circuito 204 combinador, tal como se describieron en relación con la figura 5. Según esta realización, la señal de componente principal y no se alimenta directamente al filtro 501. En lugar de ello, la disposición comprende además un circuito 901 de multiplicación que multiplica la señal residual r recibida del circuito 201 por una constante y, y un circuito 902 de adición para añadir la señal residual ajustada a escala a la señal de componente principal y, dando como resultado una señal y + y r que se alimenta al filtro 501. En este caso, y es un valor positivo pequeño, por ejemplo del orden de 10-2. En una realización, se hace un seguimiento de la constante y de manera adaptativa. Una ventaja de esta realización es que las frecuencias que no están sustancialmente presentes en el espectro de la señal y pero que están presentes en el espectro de r pueden utilizarse en el modelado de la señal residual

por el filtro 501, mejorando así la calidad de la señal codificada. Según esta realización la señal y + y r se alimenta al codificador 202 que genera la señal principal decodificada ye que va a transmitirse al receptor. Además, según esta realización, la constante y se alimenta al combinador 204 y se transmite al receptor.

La figura 10 muestra una vista esquemática de una disposición para decodificar una señal estéreo según la cuarta realización de la invención, es decir adecuada para decodificar una señal recibida de un codificador según la figura

9. La disposición comprende un circuito 404 para extraer la información recibida a partir de la señal combinada T, un decodificador 402, un decodificador 602, un filtro 601 y un circuito 401 de rotación tal como se describió en relación con la figura 6. Según esta realización, el circuito 404 extrae además la constante y a partir de la señal combinada T,

y la disposición comprende además un circuito 1001 de multiplicación para multiplicar la señal residual predicha generada por el filtro 601 por la constante y recibida. La disposición comprende además un circuito 1002 para sustraer la señal residual predicha ajustada a escala resultante y

de la señal principal decodificada y’.

La figura 11 muestra una vista esquemática de una disposición para codificar una señal multicanal según una quinta realización de la invención. La disposición recibe una señal multicanal x = (x1,...,xn) que comprende n canales. La disposición comprende un analizador 1100 de componente principal para realizar un análisis de componente principal de la señal x, dando como resultado un vector de peso w = (w1,...,wn) para transformar la señal de entrada x en una señal de componente principal y y n-1 señales residuales r1, r2, ..., rn-1. La disposición comprende además un circuito 1101 de transformación que recibe la señal de entrada x y el vector de peso w determinado y que genera las señales y y r1, ..., rn-1 según la transformación anterior. Las señales transformadas se codifican por codificadores 202 y 1102 adecuados y combinan mediante un circuito 204 combinador junto con el vector de peso w, tal como se describió en relación con la figura 2. Según esta realización, el codificador 1102 está adaptado para codificar las señales residuales r1, ..., rn-1. Por ejemplo, el codificador 1102 puede comprender n-1 codificadores paralelos, codificando cada uno una de las señales residuales tal como se describió en relación con el codificador 202.

La figura 12 muestra una vista esquemática de una disposición para codificar una señal multicanal según una sexta realización de la invención. Además de la transformación de una señal multicanal tal como se describió en relación con la figura 11, según esta realización, la señal de componente principal se alimenta a un conjunto de filtros 501 adaptativos, cada uno de los cuales predice una de las señales residuales r1,...,rn-1, tal como se describió en relación con la figura 5, dando como resultado parámetros de filtro Fp1,..., Fp(n-1) correspondientes que se alimentan a codificadores 503 correspondientes y, posteriormente, al combinador 204. En un codificador (no mostrado)

correspondiente, se usan filtros correspondientes para generar estimadas 1,..., n-1 de las señales residuales basándose en los parámetros de filtro, tal como se describió en relación con la figura 6.

Se entiende que, según una realización, sólo puede transmitirse un subconjunto de señales residuales, por ejemplo r1,...,rk, k<n-1, al receptor o alimentarse a filtros correspondientes, reduciendo así la tasa de transmisión de bits necesaria mientras se mantiene la mayor parte de la calidad de señal.

La figura 13 muestra una vista esquemática de un circuito de sustracción para su uso con una realización de la invención. En las realizaciones anteriores de las figuras 5, 8, 9 y 12, los parámetros de filtro se determinan comparando una señal objetivo con una señal estimada, es decir mediante la señal de error e que indica la diferencia entre r y

tal como se genera mediante un circuito 502 de sustracción. Se entiende que el circuito de sustracción puede generar medidas de diferencia diferentes entre r y , por ejemplo puede determinarse una diferencia en el dominio de tiempo o en el dominio de frecuencia. Haciendo referencia a la figura 13, el circuito 502 puede comprender circuitos 1301 para transformar las señales r y , respectivamente, en el dominio de frecuencia, por ejemplo realizando una transformada rápida de Fourier (FFT). Las componentes de frecuencia resultantes pueden procesarse además mediante respectivos circuitos 1304. Por ejemplo pueden ponderarse frecuencias diferentes de una manera diferente, preferiblemente según las propiedades del sistema auditivo humano, dando por tanto más peso a diferencias en el intervalo de frecuencia audible. Otros ejemplos de procesamiento adicional mediante los circuitos 1304 incluyen un promediado de componentes de frecuencia predeterminadas, calculando la magnitud de las componentes de frecuencia complejas, agrupando las componentes de filtro o similares. Por ejemplo, en una realización preferida, se realiza un agrupamiento antes de la sustracción en el dominio de frecuencia. Este agrupamiento puede realizarse usando un banco de filtros, por ejemplo con subanchos de banda lineales o logarítmicos. Alternativamente, el agrupamiento puede realizarse usando el denominado ancho de banda rectangular equivalente (ERB) (véase por ejemplo “An introduction to the Psychology of Hearing”, de Brian Moore, Academic Press, Londres, 1997). La técnica del ancho de banda rectangular equivalente agrupa bandas de frecuencia que corresponden a los filtros auditivos humanos, por ejemplo las denominadas bandas críticas. Según esta realización, el valor correspondiente del ERB en función de la frecuencia central, f (en kHz), puede calcularse según ERB = 24,7(4,37 f + 1). Todavía haciendo referencia a la figura 13, el circuito 502 comprende además un circuito 1303 de sustracción para sustraer las componentes de frecuencia procesadas. Alternativamente, las señales transformadas generadas por los circuitos 1301 se alimentan directamente al circuito 1304 de sustracción sin procesamiento adicional. La señal de diferencia generada por el circuito 1304 de sustracción se alimenta a un circuito 1302 de transformación para transformar la señal de error de vuelta al dominio de tiempo, por ejemplo realizando una transformada rápida inversa de Fourier (IFFT). Alternativamente, puede usarse directamente la señal de diferencia en el dominio de frecuencia.

Se entiende que un experto puede adaptar las realizaciones anteriores, por ejemplo añadiendo o eliminando características, o combinando características de las realizaciones anteriores. Por ejemplo, se entiende que las características introducidas en las realizaciones de las figuras 8 y 9 pueden incorporarse también en la realización de la figura 12. Como otro ejemplo, la señal de error e que describe la calidad de la señal residual estimada en la realización de la figura 5 puede compararse con un error umbral que indica un error aceptable máximo. Si el error no es aceptable, la señal de error puede transmitirse, después de una codificación adecuada, junto con la señal T de manera similar a los métodos usados dentro del campo de codificación predictiva lineal (LPC).

Se observa además que la invención no se limita a señales estereofónicas, sino que también puede aplicarse a otras señales de entrada multicanal que tengan dos o más canales de entrada. Ejemplos de tales señales multicanal incluyen señales recibidas desde un disco versátil digital (DVD) o un disco compacto de súper audio, etc. En este caso más general, una señal de componente principal y y una o más señales residuales r todavía pueden generarse según la invención. El número de señales residuales transmitidas depende del número de canales y la tasa de transmisión de bits deseada, ya que pueden omitirse residuos de orden superior sin degradar significativamente la calidad de señal.

En general, una ventaja de la invención es que la asignación de tasa de transmisión de bits puede variarse de manera adaptativa, permitiendo así una degradación equilibrada. Por ejemplo, si el canal de comunicación momentáneamente sólo permite transmitir una tasa de transmisión de bits reducida, por ejemplo debido a un tráfico de red aumentado, ruido o similares, la tasa de transmisión de bits de la señal transmitida puede reducirse sin degradar significativamente la calidad perceptible de la señal. Por ejemplo, en el caso de una fuente de sonido estacionaria comentada anteriormente, la tasa de transmisión de bits puede reducirse en un factor de aproximadamente dos sin degradar significativamente la calidad de señal, lo que corresponde a transmitir un único canal en lugar de dos.

Se observa que las disposiciones anteriores pueden implementarse como microprocesadores programables para fines generales o especiales, procesadores de señal digital (DSP), circuitos integrados de aplicación específica (ASIC), disposiciones lógicas programables (PLA), disposiciones de puertas programables en campo (FPGA), circuitos electrónicos para fines especiales, etc. o una combinación de los mismos.

5 Debe observarse que las realizaciones mencionadas anteriormente ilustran más que limitan la invención, y que los expertos en la técnica podrán diseñar muchas realizaciones alternativas sin apartarse del alcance de las reivindicaciones adjuntas. En las reivindicaciones, cualquier símbolo de referencia colocado entre paréntesis no se interpretará como que limita la reivindicación. La expresión “que comprende/comprendiendo” no excluye la presencia de otros elementos o etapas aparte de los enumerados en una reivindicación. La invención puede implementarse

10 por medio de hardware que comprende varios elementos distintos, y por medio de un ordenador programado adecuadamente. En una reivindicación de dispositivo que enumera varios medios, varios de estos medios pueden implementarse mediante un único elemento de hardware. El mero hecho de que se mencionen determinadas medidas en reivindicaciones dependientes mutuamente diferentes no indica que no pueda usarse una combinación de estas medidas de manera ventajosa.

Claims

REIVINDICACIONES

1. Método para codificar una señal multicanal que incluye al menos una primera componente de señal y una segunda componente de señal, siendo la primera componente de señal y la segunda componente de señal componentes de señal de dominio de tiempo, comprendiendo el método las etapas de

-

transformar en el dominio de tiempo al menos las componentes de señal primera y segunda mediante una transformación predeterminada en una señal principal que incluye la mayor parte de la energía de señal y al menos una señal residual que incluye menos energía que la señal principal, estando la transformación predeterminada parametrizada por al menos un parámetro de transformación; y

-

representar la señal multicanal al menos mediante la señal principal y el parámetro de transformación.
2.

Método según la reivindicación 1, comprendiendo además el método la etapa de determinar de manera adaptativa el parámetro de transformación basándose en al menos las componentes de señal primera y segunda.
3.

Método según la reivindicación 1 ó 2, en el que la señal principal corresponde a una componente principal de las componentes de señal primera y segunda.
4.

Método según una cualquiera de las reivindicaciones 1 a 3, en el que la transformación predeterminada es una rotación y el parámetro de transformación corresponde a un ángulo de rotación.
5.

Método según una cualquiera de las reivindicaciones 1 a 4, en el que la etapa de representar la señal multicanal al menos mediante la señal principal y el parámetro de transformación comprende además la etapa de representar la señal multicanal mediante la señal principal, el parámetro de transformación y la señal residual.
6.

Método según la reivindicación 5, en el que la etapa de representar la señal multicanal mediante la señal principal, el parámetro de transformación y la señal residual comprende además las etapas de

-

codificar la señal principal con una primera tasa de transmisión de bits; y

-

codificar la señal residual con una segunda tasa de transmisión de bits más pequeña que la primera tasa de transmisión de bits.
7.

Método según una cualquiera de las reivindicaciones 1 a 6, caracterizado porque la señal principal corresponde a una primera energía de señal y la señal residual corresponde a una segunda energía de señal más pequeña que la primera energía de señal.
8.

Método según una cualquiera de las reivindicaciones 1 a 7, en el que

- el método comprende además la etapa de estimar la señal residual a partir de la señal principal usando un filtro de predicción que corresponde a un conjunto de parámetros de filtro; y

-la etapa de representar la señal multicanal al menos mediante la señal principal y el parámetro de transformación comprende la etapa de representar la señal multicanal mediante la señal principal, el parámetro de transformación y el conjunto de parámetros de filtro.
9.

Método según una cualquiera de las reivindicaciones 1 a 8, en el que la señal multicanal comprende una señal estereofónica que incluye una componente de señal izquierda y una derecha.
10.

Método para decodificar información de señal multicanal, comprendiendo el método las etapas de

-

recibir una señal principal y un parámetro de transformación, correspondiendo la señal principal a un resultado de una transformación predeterminada en el dominio de tiempo de al menos una primera y una segunda componente de señal de dominio de tiempo de una señal de fuente multicanal, estando la transformación predeterminada parametrizada por al menos el parámetro de transformación; y

-

generar una primera y una segunda componente de señal de dominio de tiempo decodificada transformando inversamente la señal principal recibida y al menos una señal residual en el dominio de tiempo.
11.

Método según la reivindicación 10, en el que la etapa de recibir una señal principal y un parámetro de transformación comprende además la etapa de recibir la señal residual.
12.

Método según la reivindicación 10 u 11, en el que

-

la etapa de recibir la señal principal y el parámetro de transformación comprende además la etapa de recibir un conjunto de parámetros de filtro, y

-

comprendiendo además el método la etapa de predecir la señal residual a partir de la señal principal usando un filtro de predicción que corresponde al conjunto de parámetros de filtro recibido.
13. Disposición para codificar una señal multicanal que incluye al menos una primera componente de señal y una segunda componente de señal, siendo la primera componente de señal y la segunda componente de señal componentes de señal de dominio de tiempo, comprendiendo la disposición:

-

primeros medios de procesamiento adaptados para transformar en el dominio de tiempo al menos las componentes de señal primera y segunda mediante una transformación predeterminada en una señal principal que incluye la mayor parte de la energía de señal y al menos una señal residual que incluye menos energía que la señal principal, estando la transformación predeterminada parametrizada por al menos un parámetro de transformación; y

-

segundos medios de procesamiento adaptados para representar la señal multicanal al menos mediante la señal principal y el parámetro de transformación.
14. Disposición para decodificar información de señal multicanal, comprendiendo la disposición:

-

medios de recepción para recibir una señal principal y un parámetro de transformación, correspondiendo la señal principal a un resultado de una transformación predeterminada en el dominio de tiempo de una primera y una segunda señal de fuente multicanal de dominio de tiempo, estando la transformación predeterminada parametrizada por al menos el parámetro de transformación; y

-

medios de procesamiento para generar una primera y una segunda señal multicanal de dominio de tiempo transformando inversamente la señal principal recibida y una señal residual en el dominio de tiempo.
15.

Señal de datos que incluye información de señal multicanal, estando la señal de datos codificada mediante un método para codificar una señal multicanal que incluye al menos una componente y una segunda componente de señal, siendo la primera componente de señal y la segunda componente de señal componentes de señal de dominio de tiempo, comprendiendo el método las etapas de transformar en el dominio de tiempo al menos las componentes de señal primera y segunda mediante una transformación predeterminada en una señal principal que incluye la mayor parte de la energía de señal y al menos una señal residual que incluye menos energía que la señal principal, estando la transformación predeterminada parametrizada por al menos un parámetro de transformación; y representar la señal multicanal al menos mediante la señal principal y el parámetro de transformación, dando como resultado dicha señal de datos.
16.

Dispositivo para comunicar una señal multicanal que incluye al menos una primera componente de señal y una segunda componente de señal, siendo la primera componente de señal y la segunda componente de señal componentes de señal de dominio de tiempo, comprendiendo el dispositivo una disposición para codificar la señal multicanal, incluyendo la disposición

-

primeros medios de procesamiento adaptados para transformar en el dominio de tiempo al menos las componentes de señal primera y segunda mediante una transformación predeterminada en una señal principal que incluye la mayor parte de la energía de señal y al menos una señal residual que incluye menos energía que la señal principal, estando la transformación predeterminada parametrizada por al menos un parámetro de transformación; y

-

segundos medios de procesamiento adaptados para representar la señal multicanal al menos mediante la señal principal y el parámetro de transformación.