ES2403178T3 - Codificación de señales estéreo - Google Patents

Codificación de señales estéreo

Info

Publication number
ES2403178T3
ES2403178T3 ES03745859T ES03745859T ES2403178T3 ES 2403178 T3 ES2403178 T3 ES 2403178T3 ES 03745859 T ES03745859 T ES 03745859T ES 03745859 T ES03745859 T ES 03745859T ES 2403178 T3 ES2403178 T3 ES 2403178T3
Authority
ES
Spain
Prior art keywords
signal
main
multichannel
transformation
transformation parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
ES03745859T
Other languages
English (en)
Inventor
Ronaldus M. Aarts
Roy Irwan
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Application granted granted Critical
Publication of ES2403178T3 publication Critical patent/ES2403178T3/es
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/667Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using a division in frequency subbands

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereo-Broadcasting Methods (AREA)

Abstract

Método para codificar una señal multicanal que incluye al menos una primera componente de señal y unasegunda componente de señal, siendo la primera componente de señal y la segunda componente de señalcomponentes de señal de dominio de tiempo, comprendiendo el método las etapas de - transformar en el dominio de tiempo al menos las componentes de señal primera y segunda medianteuna transformación predeterminada en una señal principal que incluye la mayor parte de la energía deseñal y al menos una señal residual que incluye menos energía que la señal principal, estando latransformación predeterminada parametrizada por al menos un parámetro de transformación; y - representar la señal multicanal al menos mediante la señal principal y el parámetro de transformación.

Description

Codificación de señales estéreo
Esta invención se refiere a la codificación de señales multicanal que incluyen al menos una primera y una segunda componente de señal. Más particularmente, la invención se refiere a la codificación de señales de audio multifónicas, tales como señales estereofónicas.
Las señales de audio estereofónicas comprenden una componente de señal izquierda (L) y una derecha (R) que pueden originarse desde una fuente de señal estéreo, por ejemplo desde micrófonos separados. La codificación de señales de audio tiene el objetivo de reducir la tasa de transmisión de bits de una señal estereofónica, por ejemplo con el fin de permitir una transmisión eficaz de señales de sonido a través de una red de comunicaciones, tal como Internet, a través de un módem y líneas telefónicas analógicas, canales de comunicación móvil u otras redes inalámbricas, etc., y almacenar una señal de sonido estereofónica en una tarjeta de chip u otro medio de almacenamiento con capacidad de almacenamiento limitada.
La patente estadounidense n.º 4.589.127 da a conocer un transmisor para señales estereofónicas que genera señales de suma y de diferencia de las señales L y R estéreo. Las señales de suma y de diferencia se usan posteriormente en un esquema de modulación que da como resultado una señal modulada que comprende la información tanto de suma como de diferencia.
Sin embargo, el anterior método de la técnica anterior no aborda el problema de la codificación de una señal estéreo con una utilización eficaz de tasa de transmisión de bits, es decir con una tasa de transmisión de bits baja para una calidad de sonido dada.
El documento no de patente VAN DER WAAL R G ET AL.: “Subband coding of stereophonic digital audio signals”, SPEECH PROCESSING 2, VLSI, UNDERWATER SIGNAL PROCESSING. TORONTO, 14-17 DE MAYO DE 1991, ICASSP, NUEVA YORK, 14 de abril de 1991, páginas 3601-3604, XP010043648, da a conocer otro enfoque para la codificación de audio estereofónico.
Los anteriores y otros problemas se resuelven mediante un método para codificar una señal multicanal tal como se define en la reivindicación 1.
Por consiguiente, transformando la señal multicanal en una señal principal que incluye la mayor parte de la energía y una señal residual que sólo incluye poca energía de señal, la señal multicanal puede representarse mediante la señal principal, el parámetro de transformación y, opcionalmente, una señal residual pequeña, mejorando así la eficacia de codificación para la señal multicanal. Efectivamente, la señal multicanal puede codificarse con una tasa de transmisión de bits que es sólo ligeramente mayor que la de un único canal, por ejemplo un canal monofónico. La señal codificada resultante puede almacenarse y/o comunicarse a un receptor.
Cuando el método comprende además la etapa de determinar de manera adaptativa el parámetro de transformación basándose en al menos las componentes de señal primera y segunda, puede hacerse un seguimiento del parámetro de transformación óptimo de manera continua, garantizando así que la transformación sigue siendo óptima aunque cambien las características de la señal de entrada, por ejemplo en el ejemplo de una señal de audio debido a una fuente de sonido en movimiento o a cambios en las propiedades acústicas del entorno.
Cuando la transformación predeterminada es una rotación y el parámetro de transformación corresponde a un ángulo de rotación, se proporciona una transformación sencilla basándose sólo en un único parámetro, el ángulo de rotación. Adaptando el ángulo de manera que las componentes de señal, por ejemplo las componentes de señal L y R de una señal estéreo, roten en una señal de componente principal y una señal residual, se proporciona una codificación eficaz mientras se mantiene una señal de alta calidad.
En una realización preferida de la invención, la etapa de representar la señal multicanal al menos mediante la señal principal y el parámetro de transformación comprende además la etapa de representar la señal multicanal mediante la señal principal, el parámetro de transformación y la señal residual, mejorando así adicionalmente la calidad de la señal codificada puesto que no se descarta ninguna información de señal. Puesto que la señal residual es pequeña en comparación con la señal principal, la asignación de bits puede ajustarse entre esas señales. Además, puesto que la asignación de tasa de transmisión de bits puede variar, se proporciona un mecanismo para una degradación equilibrada, por ejemplo aumentando o disminuyendo de manera adaptativa la tasa de transmisión de bits permitida para la señal residual.
Por consiguiente, en una realización adicional preferida, la etapa de representar la señal multicanal mediante la señal principal, el parámetro de transformación y la señal residual, comprende además las etapas de
-
codificar la señal principal con una primera tasa de transmisión de bits; y
-
codificar la señal residual con una segunda tasa de transmisión de bits más pequeña que la primera tasa de transmisión de bits. En otra realización preferida,
-
el método comprende además la etapa de estimar la señal residual a partir de la señal principal usando un filtro de predicción que corresponde a un conjunto de parámetros de filtro; y
-
la etapa de representar la señal multicanal al menos mediante la señal principal y el parámetro de transformación comprende la etapa de representar la señal multicanal mediante la señal principal, el parámetro de transformación y el conjunto de parámetros de filtro.
Esta realización de la invención se basa en el reconocimiento de que para muchas señales multicanal, por ejemplo en el caso de señales de audio para señales de música y de habla, la señal residual puede estimarse como versión filtrada de la señal principal. Por tanto, cuando se determina un conjunto de parámetros de filtro de un filtro adaptativo que modela la señal residual, los parámetros de filtro pueden codificarse junto con la señal principal y el parámetro de transformación. Por consiguiente, se evita tener que comunicar la señal residual sin perder la información incluida en esa señal, proporcionando así una codificación eficaz que conserva un alto nivel de calidad.
Una ventaja de la invención es que proporciona una utilización de tasa de transmisión de bits eficaz, es decir un esquema de codificación que usa una tasa de transmisión de bits baja para una calidad de sonido dada. El esquema de codificación según la invención puede usarse para reducir la tasa de transmisión de bits sin reducir significativamente la calidad de sonido, para mantener la tasa de transmisión de bits mientras se mejora la calidad de sonido, o una combinación de los anteriores.
La invención se refiere además a un método para decodificar información de señal multicanal tal como se define en la reivindicación 10.
La presente invención puede implementarse de diferentes maneras incluyendo los métodos descritos anteriormente y a continuación, disposiciones para codificar y decodificar señales multicanal, respectivamente, una señal de datos, y medios de producto adicionales, dando lugar cada uno, uno o más de los beneficios y ventajas descritos en relación con el método mencionado en primer lugar, y teniendo cada uno, una o más realizaciones preferidas que corresponden a las realizaciones preferidas descritas en relación con el método mencionado en primer lugar y dadas a conocer en las reivindicaciones dependientes.
Se observa que las características de los métodos descritos anteriormente y a continuación pueden implementarse en software y llevarse a cabo en un sistema de procesamiento de datos u otros medios de procesamiento provocados por la ejecución de instrucciones ejecutables por ordenador. Las instrucciones pueden ser medios de código de programa cargados en una memoria, tal como una RAM, desde un medio de almacenamiento o desde otro ordenador a través de una red informática. Alternativamente, las características descritas pueden implementarse mediante un conjunto de circuitos físicos en lugar de software o en combinación con software.
La invención se refiere además a una disposición para codificar una señal multicanal tal como se define en la reivindicación 13.
La invención se refiere además a una disposición para decodificar información de señal multicanal tal como se define en la reivindicación 14.
Las disposiciones anteriores pueden formar parte de cualquier equipo electrónico, incluyendo ordenadores, tales como PC estacionarios y portátiles, equipos de comunicaciones de radio estacionarios y portátiles y otros dispositivos manuales o portátiles, tales como teléfonos móviles, buscapersonas, reproductores de audio, reproductores multimedia, comunicadores, es decir organizadores electrónicos, teléfonos inteligentes, asistentes digitales personales (PDA), ordenadores manuales o similares.
El término medios de procesamiento comprende microprocesadores programables para fines generales o especiales, procesadores de señal digital (DSP), circuitos integrados de aplicación específica (ASIC), disposiciones lógicas programables (PLA), disposiciones de puertas programables en campo (FPGA), circuitos electrónicos para fines especiales, etc., o una combinación de los mismos. Los medios de procesamiento primeros y segundos anteriores pueden ser medios de procesamiento separados o pueden estar comprendidos en un medio de procesamiento.
El término medios de recepción incluye un conjunto de circuitos y/o dispositivos adecuados para permitir la comunicación de datos, por ejemplo a través de un enlace de datos por cable o inalámbrico. Ejemplos de tales medios de recepción incluyen una interfaz de red, una tarjeta de red, un receptor de radio, un receptor para otras señales electromagnéticas adecuadas, tales como luz infrarroja, por ejemplo a través de un puerto IrDa, comunicaciones basadas en radio, por ejemplo a través de transceptores Bluetooth o similares. Ejemplos adicionales de tales medios de recepción incluyen un módem por cable, un módem telefónico, un adaptador de red digital de servicios integrados (RDSI), un adaptador de línea de abonado digital (DSL), un transceptor vía satélite, un adaptador Ethernet o similares.
El término medios de recepción comprende además otros circuitos/dispositivos de entrada para recibir señales de datos, por ejemplo señales de datos almacenadas en un medio legible por ordenador. Ejemplos de tales medios de recepción incluyen una unidad de disco flexible, una unidad de CD-Rom, una unidad de DVD o cualquier otra unidad de disco adecuada, un adaptador de tarjeta de memoria, un adaptador de tarjeta inteligente, etc.
La invención se refiere además a una señal de datos que incluye información de señal multicanal tal como se define en la reivindicación 15.
La invención se refiere además a un dispositivo para comunicar una señal multicanal tal como se define en la reivindicación 16.
Estos y otros aspectos de la invención resultarán evidentes a partir de y se aclararán con referencia a las realizaciones y con referencia al dibujo, en el que:
la figura 1 muestra una vista esquemática de un sistema para comunicar señales estéreo según una realización de la invención;
la figura 2 muestra una vista esquemática de una disposición para codificar una señal estéreo según una primera realización de la invención;
la figura 3 ilustra la determinación de la transformación de señal según una realización de la invención;
la figura 4 muestra una vista esquemática de una disposición para decodificar una señal estéreo según una primera realización de la invención;
la figura 5 muestra una vista esquemática de una disposición para codificar una señal estéreo según una segunda realización de la invención;
la figura 6 muestra una vista esquemática de una disposición para decodificar una señal estéreo según una segunda realización de la invención;
las figuras 7a-c muestran vistas esquemáticas de ejemplos de un circuito de filtro para su uso en una realización de la invención;
la figura 8 muestra una vista esquemática de una disposición para codificar una señal estéreo según una tercera realización de la invención;
la figura 9 muestra una vista esquemática de una disposición para codificar una señal estéreo según una cuarta realización de la invención;
la figura 10 muestra una vista esquemática de una disposición para decodificar una señal estéreo según la cuarta realización de la invención;
la figura 11 muestra una vista esquemática de una disposición para codificar una señal multicanal según una quinta realización de la invención;
la figura 12 muestra una vista esquemática de una disposición para codificar una señal multicanal según una sexta realización de la invención; y
la figura 13 muestra una vista esquemática de un circuito de sustracción para su uso con una realización de la invención.
La figura 1 muestra una vista esquemática de un sistema para comunicar señales estéreo según una realización de la invención. El sistema comprende un dispositivo 101 de codificación para generar una señal estereofónica codificada y un dispositivo 105 de decodificación para decodificar una señal codificada recibida en una componente de señal estéreo L y una componente de señal estéreo R. El dispositivo 101 de codificación y el dispositivo 105 de decodificación pueden ser cada uno cualquier equipo electrónico o parte de tal equipo. En este caso, el término equipo electrónico comprende ordenadores, tales como PC estacionarios y portátiles, equipos de comunicación de radio estacionarios y portátiles y otros dispositivos manuales o portátiles, tales como teléfonos móviles, buscapersonas, reproductores de audio, reproductores multimedia, comunicadores, es decir organizadores electrónicos, teléfonos inteligentes, asistentes digitales personales (PDA), ordenadores manuales o similares. Se observa que el dispositivo 101 de codificación y el dispositivo de decodificación pueden combinarse en un equipo electrónico en el que las señales estereofónicas se almacenan en un medio legible por ordenador para una reproducción posterior.
El dispositivo 101 de codificación comprende un codificador 102 para codificar una señal estereofónica según la invención, incluyendo la señal estereofónica una componente de señal L y una componente de señal R. El codificador recibe las componentes de señal L y R y genera una señal codificada T. La señal estereofónica L y R, 5 puede originarse desde un conjunto de micrófonos, por ejemplo a través de un equipo electrónico adicional, tal como un equipo de mezcla, etc. Las señales pueden recibirse adicionalmente como salida de otro reproductor estéreo, por el aire como señal de radio, o mediante cualquier otro medio adecuado. A continuación se describirán realizaciones preferidas de un codificador de este tipo según la invención. Según una realización, el codificador 102 se conecta a un transmisor 103 para transmitir la señal codificada T a través de un canal 109 de comunicaciones al dispositivo 105 de decodificación. El transmisor 103 puede comprender un conjunto de circuitos adecuado para permitir la comunicación de datos, por ejemplo a través de un enlace 109 de datos por cable o inalámbrico. Ejemplos de un transmisor de este tipo incluyen una interfaz de red, una tarjeta de red, un transmisor de radio, un transmisor para otras señales electromagnéticas adecuadas, tales como un LED para transmitir luz infrarroja, por ejemplo a través de un puerto IrDa, comunicaciones basadas en radio, por ejemplo a través de un transceptor Bluetooth o similares. 15 Ejemplos adicionales de transmisores adecuados incluyen un módem por cable, un módem telefónico, un adaptador de red digital de servicios integrados (RDSI), un adaptador de línea de abonado digital (DSL), un transceptor vía satélite, un adaptador Ethernet o similares. De manera correspondiente, el canal 109 de comunicaciones puede ser cualquier enlace de datos por cable o inalámbrico adecuado, por ejemplo de una red de comunicaciones basada en paquetes, tal como Internet u otra red TCP/IP, un enlace de comunicaciones de corto alcance, tal como un enlace infrarrojo, una conexión Bluetooth u otro enlace basado en radio. Ejemplos adicionales del canal de comunicaciones incluyen redes informáticas y redes de telecomunicaciones inalámbricas, tales como una red de datos por paquetes digitales celulares (CDPD), una red de sistema global para comunicaciones móviles (GSM), una red de acceso múltiple por división de código (CDMA), una red de acceso múltiple por división de tiempo (TDMA), una red de servicio general de radio por paquetes (GPRS), una red de tercera generación, tal como una red UMTS o similar. 25 Alternativa o adicionalmente, el dispositivo de codificación puede comprender una o más interfaces 104 de otro tipo para comunicar la señal estéreo codificada T al dispositivo 105 de decodificación. Ejemplos de tales interfaces incluyen una unidad de disco para almacenar datos en un medio 110 legible por ordenador, por ejemplo una unidad de disco flexible, una unidad de CD-ROM de lectura/escritura, una unidad de DVD, etc. Otros ejemplos incluyen una ranura para tarjeta de memoria, un lector/escritor de tarjeta magnética, una interfaz para acceder a una tarjeta inteligente, etc. De manera correspondiente, el dispositivo 105 de decodificación comprende un receptor 108 correspondiente para recibir la señal transmitida por el transmisor y/u otra interfaz 106 para recibir la señal estéreo codificada comunicada a través de la interfaz 104 y el medio 110 legible por ordenador. El dispositivo de decodificación comprende además un decodificador 107 que recibe la señal recibida T y la decodifica en componentes estéreo L’ y R’ correspondientes. A continuación se describirán realizaciones preferidas de un
35 decodificador de este tipo según la invención. Las señales decodificadas L’ y R’ pueden alimentarse posteriormente a un reproductor estéreo para su reproducción a través de un conjunto de altavoces, auriculares o similares.
La figura 2 muestra una vista esquemática de una disposición 102 para codificar una señal estéreo según una primera realización de la invención. La disposición comprende un conjunto 201 de circuitos para realizar una rotación de la señal estéreo en el espacio L-R en un ángulo a, dando como resultado componentes de señal rotadas y y r según la transformación
45 donde wL=cosa y wR=sena se denominarán factores de ponderación.
Según la invención, el ángulo a se determina de manera que corresponda a una dirección de alta varianza de señal. La dirección de máxima varianza de señal, es decir la componente principal, puede estimarse mediante un análisis de componente principal de manera que la componente rotada y corresponde a la señal de componente principal que incluye la mayor parte de la energía de señal, y r es una señal residual. De manera correspondiente, la disposición de la figura 2 comprende un conjunto 200 de circuitos que determina el ángulo a o, alternativamente, los factores de peso wL y wR.
Haciendo referencia a la figura 3, según una realización preferida, los factores de peso wL y wR anteriores se 55 determinan según el siguiente algoritmo:
Inicialmente, las señales estéreo L y R entrantes se rectifican y se filtran paso bajo, dando como resultado señales de envolvente p(k) de L y q(k) de R, respectivamente, donde p(k) y q(k) están muestreadas de manera adecuada y el índice de muestra se denomina k. Por tanto, el vector x(k) = (p(k), q(k)) indica el vector de señal entrante. Alternativamente, las señales L y R pueden usarse directamente, es decir sin filtrado, o pueden usarse otras versiones filtradas de L y R, por ejemplo señales filtradas paso alto L y R. En la figura 3, se ilustran varios puntos de señal como círculos. Como ejemplo, se indican el punto de señal x(k) y sus componentes p(k) y q(k) correspondientes. Según la invención, las señales se rotan en la dirección de la componente principal de los vectores de señal. En el ejemplo de la figura 3, esto corresponde a la dirección y, siendo a el ángulo entre la dirección y y la dirección p. El vector de peso w = (wL, wR) indica la dirección de la componente principal, y las componentes rotadas de x(k) se indican como y(k) y r(k), respectivamente.
La componente principal puede determinarse mediante cualquier método adecuado conocido en la técnica. En una realización particularmente ventajosa, se usa un método iterativo que utiliza la regla de Oja (véase por ejemplo S. Haykin: “Neural Networks”, Prentice Hall, N.J., 1999). Según esta realización, el vector de peso w se estima de manera iterativa según la siguiente ecuación
donde w(k) = (wL(k), wR(k)) corresponde a la estimada en el instante k. Por ejemplo, la iteración anterior puede iniciarse con un conjunto de pequeños pesos aleatorios w(0), o de cualquier otra manera adecuada. El vector de peso estimado anterior puede usarse para calcular la señal rotada según y(k) = wT(k)x(k). Alternativamente, la iteración de la ecuación (2) puede realizarse en bloques, por ejemplo para un bloque de N muestras, donde N depende de la implementación particular, por ejemplo, N=512, 1024, 2048, etc. En esta realización, puede usarse el vector de peso estimado w(N) para un bloque en la transformación de todas las muestras de ese bloque según y(k) = wT(N)x(k).
El factor I en la ecuación (2) corresponde a una escala de tiempo del algoritmo de seguimiento. Si I=0, los factores de ponderación y, por tanto, el ángulo a, permanecen constantes, mientras que cambian rápidamente para I grande. Como ejemplo, para un tamaño de bloque de 2048 muestras, I puede seleccionarse del orden de 10-3 para una tasa de muestreo de 44,1 kHz.
Una ventaja del algoritmo iterativo anterior es que es lineal, es decir no requiere el cálculo de ninguna función trigonométrica, raíces cuadradas o similares. Una ventaja adicional es que la iteración anterior proporciona un vector de peso w normalizado, puesto que el término -I w(k-1)y(k-1) en la ecuación (2) corresponde a un término de disminución de peso que penaliza pesos grandes mientras que el término + I x(k-1) dirige el vector de peso en la dirección de la componente principal. Se observa además que en la presente realización, puesto que x(k) es la señal envolvente, wL,wR E [0,1], es decir el vector de peso w permanece en el primer cuadrante en la figura 3, garantizando así que I es positivo. Una ventaja adicional de esta realización es que es suficiente transmitir uno de
wL y wR, puesto que el otro factor puede determinarse según . Alternativamente, puede transmitirse el ángulo a.
Haciendo referencia de nuevo a la figura 2, el circuito 200 emite el ángulo a determinado o, alternativamente, uno o ambos de los factores de peso wL y wR. La información de ángulo se alimenta al circuito 201 de rotación que genera las componentes de señal rotadas y y r. Se entiende que los circuitos 200 y 201 pueden combinarse en un único circuito que realice el cálculo iterativo de la ecuación (2) y el cálculo de y y r según la ecuación (1).
La disposición comprende además codificadores 202 que realizan una codificación apropiada de las señales y y r, respectivamente. Por ejemplo, las señales pueden codificarse según MPEG, por ejemplo capa 3 de MPEG I (MP3), según una codificación sinusoidal (SSC), o esquemas de codificación de audio basados en esquemas de subbanda, paramétricos o de transformada, o cualquier otro esquema adecuado o combinación de los mismos. Se entiende que los codificadores 202 pueden ser del mismo tipo o de tipos diferentes, por ejemplo un codificador de MP3 y un codificador de SSC, etc. Las señales codificadas ye y re resultantes, respectivamente, se alimentan a un circuito 204 combinador junto con la información de ángulo a. El circuito 204 combinador realiza división en tramas, asignación de tasa de transmisión de bits y codificación sin pérdidas, dando como resultado una señal combinada T que va a comunicarse. En una realización, el ángulo a o, alternativamente, wL y/o wR pueden comunicarse como parte de una cabecera transmitida antes de una trama de señal, un bloque de señal o similar. Según la invención, puesto que se hace un seguimiento del ángulo a de transformación de manera que la señal de componente principal incluya la mayor parte de la energía de señal, las tasas de transmisión de bits asignadas a las señales y y r pueden seleccionarse para que sean diferentes, optimizando así la eficacia de codificación.
Por ejemplo, las señales estéreo L y R pueden expresarse como L=M+S y R=M-S, donde M corresponde a una señal en el medio o central y S corresponde a una señal estéreo o lateral. En el caso de una grabación acústica de una fuente de sonido estacionaria, por ejemplo un hablante grabado por dos micrófonos, las señales L y R son sustancialmente iguales, si el hablante está situado exactamente entre los micrófonos y suponiendo que no hay distorsiones acústicas tales como reflexiones, etc. Por tanto, en este caso S es sustancialmente cero o al menos pequeña y el esquema de codificación según la invención proporciona sustancialmente y correspondiente a L+R y r correspondiente a L-R de manera que son cero o pequeñas; esto corresponde a a = 45 grados. Si el hablante no está situado exactamente entre los micrófonos, es decir hay una asimetría, pero todavía suponiendo que no hay reflexiones u otras distorsiones, la señal rotada y según la invención todavía corresponde al hablante y la señal residual r es sustancialmente cero. Sin embargo, en este caso el ángulo a difiere de 45 grados. Si la fuente de sonido se mueve, por ejemplo de izquierda a derecha, el método según la invención todavía proporciona una señal de componente principal y que corresponde a la fuente y una señal residual r pequeña, que es idealmente r=0. En este caso, a cambia de 0 (completamente hacia la izquierda) a 90 grados (completamente hacia la derecha).
El ejemplo anterior ilustra la ventaja de hacer un seguimiento del ángulo a. En las situaciones anteriores puede ser suficiente transmitir la señal de componente principal y y el ángulo a, con el fin de permitir que el decodificador reconstruya las señales originales R y L sin una pérdida significativa en calidad. En general, cuando la señal residual r es pequeña en comparación con la señal principal, la asignación de bits o eficacia de codificación puede ajustarse entre y y r. Por tanto, una ventaja de la invención es que permite una codificación eficaz de señales estéreo.
La figura 4 muestra una vista esquemática de una disposición 107 para decodificar una señal estéreo según la primera realización de la invención. La disposición recibe una señal estéreo codificada T, por ejemplo que se origina desde un codificador según la realización descrita en relación con la figura 2. La disposición comprende un circuito 404 para extraer las señales codificadas ye y re y la información de ángulo a a partir de la señal combinada T, es decir el circuito 404 realiza una operación inversa a la del combinador 204 de la figura 2. Las señales ye y re extraídas se alimentan a decodificadores 402 correspondientes que realizan una decodificación de audio que corresponde a la codificación realizada por los codificadores 202 de la figura 2, dando como resultado la señal de componente principal decodificada y’ y la señal residual decodificada r’. Las señales y’, r’ y la información de ángulo a se alimentan a un circuito 401 de rotación que rota las señales y’, r’ de vuelta a la dirección de las componentes L y R originales, dando como resultado así las señales recibidas L’ y R’.
La figura 5 muestra una vista esquemática de una disposición para codificar una señal estéreo según una segunda realización de la invención. La disposición comprende un conjunto 201 de circuitos que realiza una rotación de las señales estéreo L y R en un ángulo a, dando como resultado componentes de señal rotadas y y r, tal como se describió en relación con la figura 2. La disposición comprende además un conjunto 200 de circuitos para determinar el ángulo de rotación tal como se describió en relación con las figuras 2 y 3. Según esta realización de la invención, se reconoce que la señal residual r puede estimarse como versión filtrada de la señal principal y. Tal como se describe en relación con la figura 2, en una grabación acústica de una fuente de audio grabada por dos micrófonos en ausencia de distorsiones acústicas, por ejemplo debido a reflexiones, etc., la señal principal y corresponde a la fuente de audio y la señal residual es sustancialmente cero. Sin embargo, en una situación más realista se presentan distorsiones, por ejemplo debido a reflexiones de la señal en las paredes de una sala y en la cabeza y torso del hablante, etc. Estos efectos influyen en la señal residual r. Por consiguiente, cuando se estima la señal residual mediante un filtro, el filtro en efecto modela la acústica de la sala, etc. Para una orquesta clásica la situación es similar, mientras que en el caso de música pop moderna la situación puede ser ligeramente diferente. En este caso, un ingeniero de sonido mezcla normalmente múltiples canales en dos canales, usando a menudo una reverberación artificial, aparatos de efectos, etc. En este caso, el filtro modela los efectos acústicos introducidos por el proceso de mezclado.
Haciendo referencia todavía a la figura 5, la disposición comprende un filtro 501 adaptativo que recibe la señal principal y como entrada y que genera una señal filtrada . Los parámetros de filtro Fp del filtro adaptativo se seleccionan de manera que la señal filtrada
se aproxima a la señal residual r, por ejemplo controlando el filtro 501 adaptativo mediante la señal de error e indicando la diferencia entre r y
tal como se generan por un circuito 502 de sustracción. Los parámetros de filtro Fp resultantes se alimentan a un circuito 204 combinador, preferiblemente después de una codificación apropiada mediante un codificador 503, por ejemplo un codificador que proporciona una codificación de Huffman o cualquier otro esquema de codificación adecuado. El filtro 501 puede ser cualquier filtro adecuado conocido en la técnica. Ejemplos de tales filtros incluyen un filtro de respuesta finita al impulso (FIR) o un filtro de respuesta infinita al impulso (IIR), adaptativo o fijo, fijándose o haciéndose un seguimiento de las frecuencias de corte y de las magnitudes de manera recursiva, o similar. El filtro puede ser de cualquier orden, preferiblemente menor a 10. El tipo del filtro puede ser Butterworth, Chebychev o cualquier otro tipo adecuado de filtro. La disposición comprende además un codificador 202 para codificar la señal principal tal como se describió en relación con la figura 2, dando como resultado la señal principal codificada ye que se alimenta al circuito 204 combinador junto con los parámetros de filtro Fp y la información de ángulo a. Tal como se describió en relación con la figura 2, el circuito 204 combinador realiza división en tramas, asignación de tasa de transmisión de bits y codificación sin pérdidas, dando como resultado una señal combinada T que va a comunicarse que incluye la señal principal codificada ye, los parámetros de filtro Fp y la información de ángulo a. Según esta realización de la invención, la tasa de transmisión de bits que va a asignarse a los parámetros de filtro Fp puede ser considerablemente menor que la tasa de transmisión de bits necesaria para la señal principal y, por ejemplo, en una realización, la tasa de transmisión de bits para Fp puede ser, en promedio, menor que el 10% de la tasa de transmisión de bits para y. Por tanto, una ventaja de la invención es que reduce la tasa de transmisión de bits necesaria para transmitir una señal estéreo. La tasa de transmisión de bits total según la invención es sólo ligeramente mayor que para un único canal monofónico. Sin embargo, se observa que esta proporción puede variar durante una grabación. Por ejemplo, la proporción puede hacerse más pequeña, por ejemplo en una situación con pequeñas distorsiones y una fuente estacionaria, pero también más grande, por ejemplo si las señales L y R son momentáneamente independientes.
La figura 6 muestra una vista esquemática de una disposición 107 para decodificar una señal estéreo según la segunda realización de la invención. La disposición recibe una señal estéreo codificada T, por ejemplo que se origina desde un codificador según la realización descrita en relación con la figura 5. La disposición comprende un circuito 404 para extraer la señal codificada ye, los parámetros de filtro Fp y la información de ángulo a de la señal combinada T, es decir el circuito 404 realiza una operación inversa a la del combinador 204 de la figura 5. La señal ye extraída se alimenta a un decodificador 402 para realizar una decodificación de audio que corresponde a la codificación realizada por el codificador 202 de la figura 5, dando como resultado la señal de componente principal decodificada y’. Preferiblemente, los parámetros de filtro se decodifican mediante un decodificador 602 que corresponde a la codificación de los parámetros de filtro por el codificador 503 de la figura 5. La señal y’ se alimenta
a un filtro 601 junto con los parámetros de filtro Fp recibidos. El filtro 601 genera una señal residual estimada correspondiente. La señal de componente principal recibida y’, la señal residual estimada
y la información de ángulo a recibida se alimentan a un circuito 401 de rotación que rota las señales y’,
de vuelta a la dirección de las componentes L y R originales, dando como resultado las señales recibidas L’ y R’.
En la realización descrita en relación con las figuras 5 y 6, los filtros 501 y 601 pueden ser un filtro adaptativo convencional en el dominio temporal o de tiempo (véase por ejemplo “Adaptive Filter Theory”, por S. Haykin, Prentice Hall, 2001), por ejemplo un filtro adaptativo conocido del campo de la cancelación de eco. Otros ejemplos de filtros incluyen un filtro de FIR o IIR fijo con una frecuencia de corte y magnitud fijas o adaptativas. Alternativamente, en una realización, el filtro puede basarse en un modelo psicoacústico del sistema auditivo humano, por ejemplo tal como se conoce de la codificación de MPEG, reduciendo así el número de parámetros de filtro. Según todavía otra realización, el filtro se simplifica adicionalmente, por ejemplo usando un filtro de orden 10 usando 5 filtros bicuadráticos y una unidad de reverberación artificial. En esta realización, en el lado de codificación, se adapta el filtro y se determina el tiempo de reverberación. Estos parámetros varían lentamente, reduciendo así la tasa de transmisión de bits necesaria para su transmisión.
Las figuras 7a-c muestran vistas esquemáticas de ejemplos de un circuito de filtro para su uso en una realización de la invención.
En el ejemplo de la figura 7a, el filtro 501 comprende una combinación de un filtro 701 y un filtro 702 de reverberación. Por ejemplo, el filtro 701 puede ser un filtro adaptativo convencional en el dominio temporal o de tiempo, un filtro de FIR o IIR fijo con una frecuencia de corte y magnitud fijas o adaptativas, etc., por ejemplo un filtro paso alto. Según esta realización, tanto los parámetros de filtro del filtro 701 como los parámetros del filtro 702 de reverberación, tal como el tiempo de reverberación indicado como T60, se transmiten al decodificador como parámetros de filtro Fp.
En el ejemplo de la figura 7b, además de los filtros 701 y 702, se añaden dos circuitos 703-704 de control. Se añade un circuito 703 de control para garantizar que la potencia promedio de la señal residual r y la potencia promedio de la salida del reverberador 702 son aproximadamente iguales, por ejemplo multiplicando la salida del reverberador 702 por un parámetro 11. Un segundo circuito 704 de control multiplica la salida ajustada a escala del reverberador por 12. El factor 12 puede seleccionarse en el intervalo de entre -3 dB y +6 dB y se determina de manera que la correlación cruzada p entre r y
sea lo más alta posible, es decir que las señales r y f sean lo más similares posibles. Por tanto, la disposición de filtro de la figura 7b comprende además un circuito 705 para determinar la correlación cruzada p. La disposición de filtro comprende además un multiplicador 706 para generar el producto 1=11·12 que se emite como parte de los parámetros de filtro Fp. Por tanto, 11 es una ganancia que se controla automáticamente, por ejemplo comparando la media absoluta de r y , y 12 es otra ganancia que se controla automáticamente, por ejemplo mediante el uso del coeficiente de correlación cruzada p. Se pretende que la primera
ganancia garantice que se conserve la energía de r, es decir que la energía de la señal predicha
en el receptor corresponda a la energía de r. La segunda ganancia es para garantizar que r y
estén adecuadamente correlacionados.
En una realización, el reverberador 702 y el filtro 701 pueden ser fijos, es decir no adaptados según los parámetros de filtro Fp. Además, 12 puede ser fijo, dejando así el parámetro 11 que varía lentamente como el único parámetro adaptativo que es necesario ajustar y transmitir. Por consiguiente, se proporciona una disposición de filtro particularmente sencilla. Una ventaja de esta realización es que sólo requiere aproximadamente la mitad de la tasa de transmisión de bits estéreo original para transmitir una señal estéreo. Debe observarse que pueden usarse variaciones adicionales de la realización anterior. Por ejemplo, en una realización puede prescindirse del filtro 701.
Además, alternativa o adicionalmente a la correlación p, pueden usarse otras medidas de correlación para garantizar un alto grado de similitud entre la señal original y la señal después de la codificación-decodificación. Por ejemplo, en una realización pueden usarse dos correladores en lugar del correlador 705. Un correlador puede calcular la correlación cruzada pLR de las señales de entrada L y R. Además, un segundo correlador puede calcular la correlación cruzada p’LR de las salidas L’ y R’ resultantes del codificador-decodificador, es decir según esta realización, el codificador comprende además un circuito de decodificador para determinar las señales L’ y R’. Esta realización usa la diferencia lp=pLR -p’LR para controlar 12 de manera que lp se mínima. Esto se ilustra en la figura 7c, en la que el correlador de la figura 7b se sustituye por el circuito 707 que recibe las señales L y R así como L’ y R’ como entradas y genera como salida una señal indicativa de la diferencia lp. La salida lp del circuito 707 controla el circuito 704 para ajustar a escala el residuo estimado
de manera que se minimice lp. En una realización, las entradas al circuito 707 se filtran paso alto, por ejemplo a 250 Hz, de manera que las bajas frecuencias tengan una contribución decreciente con respecto a lp. Como en la realización de la figura 7b, una ventaja de esta realización es que la correlación entre la imagen estéreo resultante y la imagen estéreo original antes de la codificacióndecodificación es muy alta.
La figura 8 muestra una vista esquemática de una disposición para codificar una señal estéreo según una tercera realización de la invención. La disposición es una variación de la realización descrita en relación con la figura 5, y comprende un conjunto 201 de circuitos para realizar una rotación de las señales estéreo L y R, un conjunto 200 de circuitos para determinar el ángulo de rotación, un filtro 501 adaptativo, un circuito 502 de sustracción, un codificador 202, un codificador 503 y un circuito 204 combinador, tal como se describió en relación con la figura 5. Según esta realización, la señal de componente principal y no se alimenta directamente al filtro 501. En lugar de ello, la disposición comprende además un decodificador 402 tal como se describió en relación con la figura 6. El decodificador 402 recibe la señal de componente principal codificada ye generada por el codificador 202 y genera la señal principal decodificada y’ que se alimenta al filtro 501. Una ventaja de esta realización es que reduce el efecto de errores de codificación introducidos por la codificación y decodificación de la señal y. Estos errores de codificación hacen que la señal decodificada y’ sea ligeramente diferente de la señal original y debido al hecho de que el decodificador 402 en la práctica no es una inversa perfecta del codificador 202, es decir E E-1 f 1. Por consiguiente, aplicando una codificación y decodificación de la señal y en el decodificador, la entrada y’ al filtro 501 corresponde a la entrada y’ alimentada al filtro 601 en el receptor, mejorando así el resultado de la predicción de r’ de la señal residual en el receptor. Por tanto, el codificador según esta realización puede usarse en relación con un decodificador según la realización de la figura 6.
La figura 9 muestra una vista esquemática de una disposición para codificar una señal estéreo según una cuarta realización de la invención. La disposición es una variación de la realización descrita en relación con la figura 5, y comprende un conjunto 201 de circuitos para realizar una rotación de las señales estéreo L y R, un conjunto 200 de circuitos para determinar el ángulo de rotación, un filtro 501 adaptativo, un circuito 502 de sustracción, un codificador 202, un codificador 503 y un circuito 204 combinador, tal como se describieron en relación con la figura 5. Según esta realización, la señal de componente principal y no se alimenta directamente al filtro 501. En lugar de ello, la disposición comprende además un circuito 901 de multiplicación que multiplica la señal residual r recibida del circuito 201 por una constante y, y un circuito 902 de adición para añadir la señal residual ajustada a escala a la señal de componente principal y, dando como resultado una señal y + y r que se alimenta al filtro 501. En este caso, y es un valor positivo pequeño, por ejemplo del orden de 10-2. En una realización, se hace un seguimiento de la constante y de manera adaptativa. Una ventaja de esta realización es que las frecuencias que no están sustancialmente presentes en el espectro de la señal y pero que están presentes en el espectro de r pueden utilizarse en el modelado de la señal residual
por el filtro 501, mejorando así la calidad de la señal codificada. Según esta realización la señal y + y r se alimenta al codificador 202 que genera la señal principal decodificada ye que va a transmitirse al receptor. Además, según esta realización, la constante y se alimenta al combinador 204 y se transmite al receptor.
La figura 10 muestra una vista esquemática de una disposición para decodificar una señal estéreo según la cuarta realización de la invención, es decir adecuada para decodificar una señal recibida de un codificador según la figura
9. La disposición comprende un circuito 404 para extraer la información recibida a partir de la señal combinada T, un decodificador 402, un decodificador 602, un filtro 601 y un circuito 401 de rotación tal como se describió en relación con la figura 6. Según esta realización, el circuito 404 extrae además la constante y a partir de la señal combinada T,
y la disposición comprende además un circuito 1001 de multiplicación para multiplicar la señal residual predicha generada por el filtro 601 por la constante y recibida. La disposición comprende además un circuito 1002 para sustraer la señal residual predicha ajustada a escala resultante y
de la señal principal decodificada y’.
La figura 11 muestra una vista esquemática de una disposición para codificar una señal multicanal según una quinta realización de la invención. La disposición recibe una señal multicanal x = (x1,...,xn) que comprende n canales. La disposición comprende un analizador 1100 de componente principal para realizar un análisis de componente principal de la señal x, dando como resultado un vector de peso w = (w1,...,wn) para transformar la señal de entrada x en una señal de componente principal y y n-1 señales residuales r1, r2, ..., rn-1. La disposición comprende además un circuito 1101 de transformación que recibe la señal de entrada x y el vector de peso w determinado y que genera las señales y y r1, ..., rn-1 según la transformación anterior. Las señales transformadas se codifican por codificadores 202 y 1102 adecuados y combinan mediante un circuito 204 combinador junto con el vector de peso w, tal como se describió en relación con la figura 2. Según esta realización, el codificador 1102 está adaptado para codificar las señales residuales r1, ..., rn-1. Por ejemplo, el codificador 1102 puede comprender n-1 codificadores paralelos, codificando cada uno una de las señales residuales tal como se describió en relación con el codificador 202.
La figura 12 muestra una vista esquemática de una disposición para codificar una señal multicanal según una sexta realización de la invención. Además de la transformación de una señal multicanal tal como se describió en relación con la figura 11, según esta realización, la señal de componente principal se alimenta a un conjunto de filtros 501 adaptativos, cada uno de los cuales predice una de las señales residuales r1,...,rn-1, tal como se describió en relación con la figura 5, dando como resultado parámetros de filtro Fp1,..., Fp(n-1) correspondientes que se alimentan a codificadores 503 correspondientes y, posteriormente, al combinador 204. En un codificador (no mostrado)
correspondiente, se usan filtros correspondientes para generar estimadas 1,..., n-1 de las señales residuales basándose en los parámetros de filtro, tal como se describió en relación con la figura 6.
Se entiende que, según una realización, sólo puede transmitirse un subconjunto de señales residuales, por ejemplo r1,...,rk, k<n-1, al receptor o alimentarse a filtros correspondientes, reduciendo así la tasa de transmisión de bits necesaria mientras se mantiene la mayor parte de la calidad de señal.
La figura 13 muestra una vista esquemática de un circuito de sustracción para su uso con una realización de la invención. En las realizaciones anteriores de las figuras 5, 8, 9 y 12, los parámetros de filtro se determinan comparando una señal objetivo con una señal estimada, es decir mediante la señal de error e que indica la diferencia entre r y
tal como se genera mediante un circuito 502 de sustracción. Se entiende que el circuito de sustracción puede generar medidas de diferencia diferentes entre r y , por ejemplo puede determinarse una diferencia en el dominio de tiempo o en el dominio de frecuencia. Haciendo referencia a la figura 13, el circuito 502 puede comprender circuitos 1301 para transformar las señales r y , respectivamente, en el dominio de frecuencia, por ejemplo realizando una transformada rápida de Fourier (FFT). Las componentes de frecuencia resultantes pueden procesarse además mediante respectivos circuitos 1304. Por ejemplo pueden ponderarse frecuencias diferentes de una manera diferente, preferiblemente según las propiedades del sistema auditivo humano, dando por tanto más peso a diferencias en el intervalo de frecuencia audible. Otros ejemplos de procesamiento adicional mediante los circuitos 1304 incluyen un promediado de componentes de frecuencia predeterminadas, calculando la magnitud de las componentes de frecuencia complejas, agrupando las componentes de filtro o similares. Por ejemplo, en una realización preferida, se realiza un agrupamiento antes de la sustracción en el dominio de frecuencia. Este agrupamiento puede realizarse usando un banco de filtros, por ejemplo con subanchos de banda lineales o logarítmicos. Alternativamente, el agrupamiento puede realizarse usando el denominado ancho de banda rectangular equivalente (ERB) (véase por ejemplo “An introduction to the Psychology of Hearing”, de Brian Moore, Academic Press, Londres, 1997). La técnica del ancho de banda rectangular equivalente agrupa bandas de frecuencia que corresponden a los filtros auditivos humanos, por ejemplo las denominadas bandas críticas. Según esta realización, el valor correspondiente del ERB en función de la frecuencia central, f (en kHz), puede calcularse según ERB = 24,7(4,37 f + 1). Todavía haciendo referencia a la figura 13, el circuito 502 comprende además un circuito 1303 de sustracción para sustraer las componentes de frecuencia procesadas. Alternativamente, las señales transformadas generadas por los circuitos 1301 se alimentan directamente al circuito 1304 de sustracción sin procesamiento adicional. La señal de diferencia generada por el circuito 1304 de sustracción se alimenta a un circuito 1302 de transformación para transformar la señal de error de vuelta al dominio de tiempo, por ejemplo realizando una transformada rápida inversa de Fourier (IFFT). Alternativamente, puede usarse directamente la señal de diferencia en el dominio de frecuencia.
Se entiende que un experto puede adaptar las realizaciones anteriores, por ejemplo añadiendo o eliminando características, o combinando características de las realizaciones anteriores. Por ejemplo, se entiende que las características introducidas en las realizaciones de las figuras 8 y 9 pueden incorporarse también en la realización de la figura 12. Como otro ejemplo, la señal de error e que describe la calidad de la señal residual estimada en la realización de la figura 5 puede compararse con un error umbral que indica un error aceptable máximo. Si el error no es aceptable, la señal de error puede transmitirse, después de una codificación adecuada, junto con la señal T de manera similar a los métodos usados dentro del campo de codificación predictiva lineal (LPC).
Se observa además que la invención no se limita a señales estereofónicas, sino que también puede aplicarse a otras señales de entrada multicanal que tengan dos o más canales de entrada. Ejemplos de tales señales multicanal incluyen señales recibidas desde un disco versátil digital (DVD) o un disco compacto de súper audio, etc. En este caso más general, una señal de componente principal y y una o más señales residuales r todavía pueden generarse según la invención. El número de señales residuales transmitidas depende del número de canales y la tasa de transmisión de bits deseada, ya que pueden omitirse residuos de orden superior sin degradar significativamente la calidad de señal.
En general, una ventaja de la invención es que la asignación de tasa de transmisión de bits puede variarse de manera adaptativa, permitiendo así una degradación equilibrada. Por ejemplo, si el canal de comunicación momentáneamente sólo permite transmitir una tasa de transmisión de bits reducida, por ejemplo debido a un tráfico de red aumentado, ruido o similares, la tasa de transmisión de bits de la señal transmitida puede reducirse sin degradar significativamente la calidad perceptible de la señal. Por ejemplo, en el caso de una fuente de sonido estacionaria comentada anteriormente, la tasa de transmisión de bits puede reducirse en un factor de aproximadamente dos sin degradar significativamente la calidad de señal, lo que corresponde a transmitir un único canal en lugar de dos.
Se observa que las disposiciones anteriores pueden implementarse como microprocesadores programables para fines generales o especiales, procesadores de señal digital (DSP), circuitos integrados de aplicación específica (ASIC), disposiciones lógicas programables (PLA), disposiciones de puertas programables en campo (FPGA), circuitos electrónicos para fines especiales, etc. o una combinación de los mismos.
5 Debe observarse que las realizaciones mencionadas anteriormente ilustran más que limitan la invención, y que los expertos en la técnica podrán diseñar muchas realizaciones alternativas sin apartarse del alcance de las reivindicaciones adjuntas. En las reivindicaciones, cualquier símbolo de referencia colocado entre paréntesis no se interpretará como que limita la reivindicación. La expresión “que comprende/comprendiendo” no excluye la presencia de otros elementos o etapas aparte de los enumerados en una reivindicación. La invención puede implementarse
10 por medio de hardware que comprende varios elementos distintos, y por medio de un ordenador programado adecuadamente. En una reivindicación de dispositivo que enumera varios medios, varios de estos medios pueden implementarse mediante un único elemento de hardware. El mero hecho de que se mencionen determinadas medidas en reivindicaciones dependientes mutuamente diferentes no indica que no pueda usarse una combinación de estas medidas de manera ventajosa.

Claims (16)

  1. REIVINDICACIONES
    1. Método para codificar una señal multicanal que incluye al menos una primera componente de señal y una segunda componente de señal, siendo la primera componente de señal y la segunda componente de señal componentes de señal de dominio de tiempo, comprendiendo el método las etapas de
    -
    transformar en el dominio de tiempo al menos las componentes de señal primera y segunda mediante una transformación predeterminada en una señal principal que incluye la mayor parte de la energía de señal y al menos una señal residual que incluye menos energía que la señal principal, estando la transformación predeterminada parametrizada por al menos un parámetro de transformación; y
    -
    representar la señal multicanal al menos mediante la señal principal y el parámetro de transformación.
  2. 2.
    Método según la reivindicación 1, comprendiendo además el método la etapa de determinar de manera adaptativa el parámetro de transformación basándose en al menos las componentes de señal primera y segunda.
  3. 3.
    Método según la reivindicación 1 ó 2, en el que la señal principal corresponde a una componente principal de las componentes de señal primera y segunda.
  4. 4.
    Método según una cualquiera de las reivindicaciones 1 a 3, en el que la transformación predeterminada es una rotación y el parámetro de transformación corresponde a un ángulo de rotación.
  5. 5.
    Método según una cualquiera de las reivindicaciones 1 a 4, en el que la etapa de representar la señal multicanal al menos mediante la señal principal y el parámetro de transformación comprende además la etapa de representar la señal multicanal mediante la señal principal, el parámetro de transformación y la señal residual.
  6. 6.
    Método según la reivindicación 5, en el que la etapa de representar la señal multicanal mediante la señal principal, el parámetro de transformación y la señal residual comprende además las etapas de
    -
    codificar la señal principal con una primera tasa de transmisión de bits; y
    -
    codificar la señal residual con una segunda tasa de transmisión de bits más pequeña que la primera tasa de transmisión de bits.
  7. 7.
    Método según una cualquiera de las reivindicaciones 1 a 6, caracterizado porque la señal principal corresponde a una primera energía de señal y la señal residual corresponde a una segunda energía de señal más pequeña que la primera energía de señal.
  8. 8.
    Método según una cualquiera de las reivindicaciones 1 a 7, en el que
    - el método comprende además la etapa de estimar la señal residual a partir de la señal principal usando un filtro de predicción que corresponde a un conjunto de parámetros de filtro; y
    -la etapa de representar la señal multicanal al menos mediante la señal principal y el parámetro de transformación comprende la etapa de representar la señal multicanal mediante la señal principal, el parámetro de transformación y el conjunto de parámetros de filtro.
  9. 9.
    Método según una cualquiera de las reivindicaciones 1 a 8, en el que la señal multicanal comprende una señal estereofónica que incluye una componente de señal izquierda y una derecha.
  10. 10.
    Método para decodificar información de señal multicanal, comprendiendo el método las etapas de
    -
    recibir una señal principal y un parámetro de transformación, correspondiendo la señal principal a un resultado de una transformación predeterminada en el dominio de tiempo de al menos una primera y una segunda componente de señal de dominio de tiempo de una señal de fuente multicanal, estando la transformación predeterminada parametrizada por al menos el parámetro de transformación; y
    -
    generar una primera y una segunda componente de señal de dominio de tiempo decodificada transformando inversamente la señal principal recibida y al menos una señal residual en el dominio de tiempo.
  11. 11.
    Método según la reivindicación 10, en el que la etapa de recibir una señal principal y un parámetro de transformación comprende además la etapa de recibir la señal residual.
  12. 12.
    Método según la reivindicación 10 u 11, en el que
    -
    la etapa de recibir la señal principal y el parámetro de transformación comprende además la etapa de recibir un conjunto de parámetros de filtro, y
    -
    comprendiendo además el método la etapa de predecir la señal residual a partir de la señal principal usando un filtro de predicción que corresponde al conjunto de parámetros de filtro recibido.
  13. 13. Disposición para codificar una señal multicanal que incluye al menos una primera componente de señal y una segunda componente de señal, siendo la primera componente de señal y la segunda componente de señal componentes de señal de dominio de tiempo, comprendiendo la disposición:
    -
    primeros medios de procesamiento adaptados para transformar en el dominio de tiempo al menos las componentes de señal primera y segunda mediante una transformación predeterminada en una señal principal que incluye la mayor parte de la energía de señal y al menos una señal residual que incluye menos energía que la señal principal, estando la transformación predeterminada parametrizada por al menos un parámetro de transformación; y
    -
    segundos medios de procesamiento adaptados para representar la señal multicanal al menos mediante la señal principal y el parámetro de transformación.
  14. 14. Disposición para decodificar información de señal multicanal, comprendiendo la disposición:
    -
    medios de recepción para recibir una señal principal y un parámetro de transformación, correspondiendo la señal principal a un resultado de una transformación predeterminada en el dominio de tiempo de una primera y una segunda señal de fuente multicanal de dominio de tiempo, estando la transformación predeterminada parametrizada por al menos el parámetro de transformación; y
    -
    medios de procesamiento para generar una primera y una segunda señal multicanal de dominio de tiempo transformando inversamente la señal principal recibida y una señal residual en el dominio de tiempo.
  15. 15.
    Señal de datos que incluye información de señal multicanal, estando la señal de datos codificada mediante un método para codificar una señal multicanal que incluye al menos una componente y una segunda componente de señal, siendo la primera componente de señal y la segunda componente de señal componentes de señal de dominio de tiempo, comprendiendo el método las etapas de transformar en el dominio de tiempo al menos las componentes de señal primera y segunda mediante una transformación predeterminada en una señal principal que incluye la mayor parte de la energía de señal y al menos una señal residual que incluye menos energía que la señal principal, estando la transformación predeterminada parametrizada por al menos un parámetro de transformación; y representar la señal multicanal al menos mediante la señal principal y el parámetro de transformación, dando como resultado dicha señal de datos.
  16. 16.
    Dispositivo para comunicar una señal multicanal que incluye al menos una primera componente de señal y una segunda componente de señal, siendo la primera componente de señal y la segunda componente de señal componentes de señal de dominio de tiempo, comprendiendo el dispositivo una disposición para codificar la señal multicanal, incluyendo la disposición
    -
    primeros medios de procesamiento adaptados para transformar en el dominio de tiempo al menos las componentes de señal primera y segunda mediante una transformación predeterminada en una señal principal que incluye la mayor parte de la energía de señal y al menos una señal residual que incluye menos energía que la señal principal, estando la transformación predeterminada parametrizada por al menos un parámetro de transformación; y
    -
    segundos medios de procesamiento adaptados para representar la señal multicanal al menos mediante la señal principal y el parámetro de transformación.
ES03745859T 2002-04-10 2003-03-20 Codificación de señales estéreo Expired - Lifetime ES2403178T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP02076410 2002-04-10
EP02076410 2002-04-10
PCT/IB2003/001152 WO2003085643A1 (en) 2002-04-10 2003-03-20 Coding of stereo signals

Publications (1)

Publication Number Publication Date
ES2403178T3 true ES2403178T3 (es) 2013-05-16

Family

ID=28685943

Family Applications (1)

Application Number Title Priority Date Filing Date
ES03745859T Expired - Lifetime ES2403178T3 (es) 2002-04-10 2003-03-20 Codificación de señales estéreo

Country Status (10)

Country Link
US (1) US7437299B2 (es)
EP (1) EP1500085B1 (es)
JP (1) JP4805540B2 (es)
KR (1) KR101016251B1 (es)
CN (1) CN100508026C (es)
AU (1) AU2003209957A1 (es)
BR (1) BR0304231A (es)
ES (1) ES2403178T3 (es)
RU (1) RU2316154C2 (es)
WO (1) WO2003085643A1 (es)

Families Citing this family (58)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2403178T3 (es) 2002-04-10 2013-05-16 Koninklijke Philips Electronics N.V. Codificación de señales estéreo
CN1761998B (zh) 2003-03-17 2010-09-08 皇家飞利浦电子股份有限公司 用于生成单声道信号的方法、部件、音频编码器和系统
US7725324B2 (en) * 2003-12-19 2010-05-25 Telefonaktiebolaget Lm Ericsson (Publ) Constrained filter encoding of polyphonic signals
US7809579B2 (en) * 2003-12-19 2010-10-05 Telefonaktiebolaget Lm Ericsson (Publ) Fidelity-optimized variable frame length encoding
MXPA06011396A (es) * 2004-04-05 2006-12-20 Koninkl Philips Electronics Nv Metodos de codificacion y decodificacion de senales estereofonicas y aparatos que utilizan los mismos.
JP2007538284A (ja) * 2004-05-17 2007-12-27 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオシステム
KR100773539B1 (ko) * 2004-07-14 2007-11-05 삼성전자주식회사 멀티채널 오디오 데이터 부호화/복호화 방법 및 장치
MX2007005262A (es) * 2004-11-04 2007-07-09 Koninkl Philips Electronics Nv Codificacion y decodificacion de senales de audio de varios canales.
KR100707177B1 (ko) * 2005-01-19 2007-04-13 삼성전자주식회사 디지털 신호 부호화/복호화 방법 및 장치
US9626973B2 (en) * 2005-02-23 2017-04-18 Telefonaktiebolaget L M Ericsson (Publ) Adaptive bit allocation for multi-channel audio encoding
US7751572B2 (en) 2005-04-15 2010-07-06 Dolby International Ab Adaptive residual audio coding
JP4988716B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
WO2006126843A2 (en) 2005-05-26 2006-11-30 Lg Electronics Inc. Method and apparatus for decoding audio signal
WO2007083952A1 (en) 2006-01-19 2007-07-26 Lg Electronics Inc. Method and apparatus for processing a media signal
RU2406164C2 (ru) * 2006-02-07 2010-12-10 ЭлДжи ЭЛЕКТРОНИКС ИНК. Устройство и способ для кодирования/декодирования сигнала
US8612238B2 (en) 2006-02-07 2013-12-17 Lg Electronics, Inc. Apparatus and method for encoding/decoding signal
RU2407070C2 (ru) * 2006-02-09 2010-12-20 ЭлДжи ЭЛЕКТРОНИКС ИНК. Способ и устройство кодирования и декодирования объектно-ориентированного звукового сигнала
FR2898725A1 (fr) 2006-03-15 2007-09-21 France Telecom Dispositif et procede de codage gradue d'un signal audio multi-canal selon une analyse en composante principale
KR101339854B1 (ko) 2006-03-15 2014-02-06 오렌지 주 성분 분석에 의해 다중채널 오디오 신호를 인코딩하기 위한 장치 및 방법
MX2008012251A (es) 2006-09-29 2008-10-07 Lg Electronics Inc Metodos y aparatos para codificar y descodificar señales de audio basadas en objeto.
RU2009116275A (ru) * 2006-09-29 2010-11-10 ЭлДжи ЭЛЕКТРОНИКС ИНК. (KR) Способы и устройства кодирования и декодирования объектно-ориентированных аудиосигналов
KR101434198B1 (ko) * 2006-11-17 2014-08-26 삼성전자주식회사 신호 복호화 방법
FR2911031B1 (fr) * 2006-12-28 2009-04-10 Actimagine Soc Par Actions Sim Procede et dispositif de codage audio
RU2394283C1 (ru) * 2007-02-14 2010-07-10 ЭлДжи ЭЛЕКТРОНИКС ИНК. Способы и устройства для кодирования и декодирования объектно-базированных аудиосигналов
TWI431610B (zh) 2007-02-14 2014-03-21 Lg Electronics Inc 用以將以物件為主之音訊信號編碼與解碼之方法與裝置
KR101261524B1 (ko) * 2007-03-14 2013-05-06 삼성전자주식회사 노이즈를 포함하는 오디오 신호를 저비트율로부호화/복호화하는 방법 및 이를 위한 장치
US8983830B2 (en) * 2007-03-30 2015-03-17 Panasonic Intellectual Property Corporation Of America Stereo signal encoding device including setting of threshold frequencies and stereo signal encoding method including setting of threshold frequencies
CN101071570B (zh) * 2007-06-21 2011-02-16 北京中星微电子有限公司 耦合声道的编、解码处理方法、音频编码装置及解码装置
CN101802907B (zh) * 2007-09-19 2013-11-13 爱立信电话股份有限公司 多信道音频的联合增强
EP2250641B1 (en) * 2008-03-04 2011-10-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus for mixing a plurality of input data streams
EP2124486A1 (de) * 2008-05-13 2009-11-25 Clemens Par Winkelabhängig operierende Vorrichtung oder Methodik zur Gewinnung eines pseudostereophonen Audiosignals
RU2497204C2 (ru) * 2008-05-23 2013-10-27 Конинклейке Филипс Электроникс Н.В. Устройство параметрического стереофонического повышающего микширования, параметрический стереофонический декодер, устройство параметрического стереофонического понижающего микширования, параметрический стереофонический кодер
EP2287836B1 (en) 2008-05-30 2014-10-15 Panasonic Intellectual Property Corporation of America Encoder and encoding method
EP2293292B1 (en) * 2008-06-19 2013-06-05 Panasonic Corporation Quantizing apparatus, quantizing method and encoding apparatus
EP2345027B1 (en) 2008-10-10 2018-04-18 Telefonaktiebolaget LM Ericsson (publ) Energy-conserving multi-channel audio coding and decoding
WO2010070016A1 (en) * 2008-12-19 2010-06-24 Dolby Sweden Ab Method and apparatus for applying reverb to a multi-channel audio signal using spatial cue parameters
GB2466669B (en) * 2009-01-06 2013-03-06 Skype Speech coding
GB2466674B (en) * 2009-01-06 2013-11-13 Skype Speech coding
GB2466672B (en) * 2009-01-06 2013-03-13 Skype Speech coding
GB2466671B (en) * 2009-01-06 2013-03-27 Skype Speech encoding
GB2466670B (en) * 2009-01-06 2012-11-14 Skype Speech encoding
GB2466673B (en) 2009-01-06 2012-11-07 Skype Quantization
GB2466675B (en) * 2009-01-06 2013-03-06 Skype Speech coding
BR122019023877B1 (pt) 2009-03-17 2021-08-17 Dolby International Ab Sistema codificador, sistema decodificador, método para codificar um sinal estéreo para um sinal de fluxo de bits e método para decodificar um sinal de fluxo de bits para um sinal estéreo
US8452606B2 (en) * 2009-09-29 2013-05-28 Skype Speech encoding using multiple bit rates
BR112012026324B1 (pt) * 2010-04-13 2021-08-17 Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E. V Codificador de aúdio ou vídeo, decodificador de aúdio ou vídeo e métodos relacionados para o processamento do sinal de aúdio ou vídeo de múltiplos canais usando uma direção de previsão variável
WO2012010929A1 (en) 2010-07-20 2012-01-26 Nokia Corporation A reverberation estimator
MX2013002188A (es) 2010-08-25 2013-03-18 Fraunhofer Ges Forschung Aparato para generar una señal decorrelacionada utilizando informacion de fase transmitida.
JP5680391B2 (ja) * 2010-12-07 2015-03-04 日本放送協会 音響符号化装置及びプログラム
US8654984B2 (en) * 2011-04-26 2014-02-18 Skype Processing stereophonic audio signals
MY165933A (en) * 2011-07-01 2018-05-18 Dolby Laboratories Licensing Corp System and method for adaptive audio signal generation, coding and rendering
JP5994073B2 (ja) * 2013-01-31 2016-09-21 株式会社アクセル 音声信号圧縮装置及び音声信号圧縮方法
CN104282309A (zh) * 2013-07-05 2015-01-14 杜比实验室特许公司 丢包掩蔽装置和方法以及音频处理系统
EP2830065A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency
WO2016142002A1 (en) 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
US12125492B2 (en) 2015-09-25 2024-10-22 Voiceage Coproration Method and system for decoding left and right channels of a stereo sound signal
WO2017049396A1 (en) * 2015-09-25 2017-03-30 Voiceage Corporation Method and system for time domain down mixing a stereo sound signal into primary and secondary channels using detecting an out-of-phase condition of the left and right channels
JP2016095531A (ja) * 2016-01-12 2016-05-26 株式会社アクセル 音声信号圧縮装置及び音声信号圧縮方法

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4589127A (en) * 1978-06-05 1986-05-13 Hazeltine Corporation Independent sideband AM multiphonic system
CA1268546A (en) * 1985-08-30 1990-05-01 Shigenobu Minami Stereophonic voice signal transmission system
JPH0761043B2 (ja) * 1986-04-10 1995-06-28 株式会社東芝 ステレオ音声伝送蓄積方式
JPH0758939B2 (ja) * 1985-09-30 1995-06-21 株式会社東芝 ステレオ信号伝送方法、符号化装置および復号化装置
NL9100173A (nl) 1991-02-01 1992-09-01 Philips Nv Subbandkodeerinrichting, en een zender voorzien van de kodeerinrichting.
US5291557A (en) * 1992-10-13 1994-03-01 Dolby Laboratories Licensing Corporation Adaptive rematrixing of matrixed audio signals
DE4320990B4 (de) 1993-06-05 2004-04-29 Robert Bosch Gmbh Verfahren zur Redundanzreduktion
DE4331376C1 (de) * 1993-09-15 1994-11-10 Fraunhofer Ges Forschung Verfahren zum Bestimmen der zu wählenden Codierungsart für die Codierung von wenigstens zwei Signalen
DE4409368A1 (de) * 1994-03-18 1995-09-21 Fraunhofer Ges Forschung Verfahren zum Codieren mehrerer Audiosignale
EP0786921B1 (de) 1996-01-26 2002-07-17 Micronas GmbH Digitaler Demodulator
US5812971A (en) * 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping
US6430295B1 (en) * 1997-07-11 2002-08-06 Telefonaktiebolaget Lm Ericsson (Publ) Methods and apparatus for measuring signal level and delay at multiple sensors
US6121904A (en) * 1998-03-12 2000-09-19 Liquid Audio, Inc. Lossless data compression with low complexity
US6539357B1 (en) * 1999-04-29 2003-03-25 Agere Systems Inc. Technique for parametric coding of a signal containing information
RU2161868C1 (ru) * 2000-05-12 2001-01-10 Федеральное государственное унитарное предприятие Научно-исследовательский институт радио Государственного комитета РФ по связи и информатизации Способ трансляции стереофонического сигнала
KR100981694B1 (ko) * 2002-04-10 2010-09-13 코닌클리케 필립스 일렉트로닉스 엔.브이. 스테레오 신호들의 코딩
ES2403178T3 (es) 2002-04-10 2013-05-16 Koninklijke Philips Electronics N.V. Codificación de señales estéreo

Also Published As

Publication number Publication date
KR20040101415A (ko) 2004-12-02
BR0304231A (pt) 2004-07-27
JP4805540B2 (ja) 2011-11-02
EP1500085B1 (en) 2013-02-20
RU2316154C2 (ru) 2008-01-27
CN1647154A (zh) 2005-07-27
KR101016251B1 (ko) 2011-02-25
RU2004133032A (ru) 2005-04-20
EP1500085A1 (en) 2005-01-26
JP2005522721A (ja) 2005-07-28
AU2003209957A1 (en) 2003-10-20
WO2003085643A1 (en) 2003-10-16
CN100508026C (zh) 2009-07-01
US20050141721A1 (en) 2005-06-30
US7437299B2 (en) 2008-10-14

Similar Documents

Publication Publication Date Title
ES2403178T3 (es) Codificación de señales estéreo
ES2341327T3 (es) Codificacion y decodificacion de señales audio multicanal.
ES2629453T3 (es) Codificador, descodificador y procedimiento de codificación
JP6038355B2 (ja) オーディオ処理システムにおける信号脱相関
JP6138279B2 (ja) 推定された空間的パラメータを使ったオーディオ信号の向上
JP6046274B2 (ja) 上方混合されたオーディオ信号のチャネル間コヒーレンスの制御方法
Cheng et al. Spread spectrum signaling for speech watermarking
JP5283046B2 (ja) ピーク検出に基づく選択的スケーリングマスク計算
TW202205259A (zh) 高階保真立體音響訊號表象之壓縮方法和裝置以及解壓縮方法和裝置
CN101542601B (zh) 用于动态正规化以减少低电平信号的精确度损失的系统及方法
JPWO2008132850A1 (ja) ステレオ音声符号化装置、ステレオ音声復号装置、およびこれらの方法
WO2015151451A1 (ja) 符号化装置、復号装置、符号化方法、復号方法、およびプログラム
JP5309944B2 (ja) オーディオ復号装置、方法、及びプログラム
KR20070090217A (ko) 스케일러블 부호화 장치 및 스케일러블 부호화 방법
JP5483813B2 (ja) マルチチャネル音声音響信号符号化装置および方法、並びにマルチチャネル音声音響信号復号装置および方法
Aarts et al. Coding of stereo signals
BRPI0304231B1 (pt) Method for codifying a multiple channel signal, method and arrangement for decoding multiple channel signal information, provision for coding a multiple channel sign, data sign including multiple channel signal information, and a communication device multi-channel signal
GB2611356A (en) Spatial audio capture
Stanković et al. Digital Audio