ES2278348T3 - Codificacion/decodificacion multicanal compatible. - Google Patents

Codificacion/decodificacion multicanal compatible. Download PDF

Info

Publication number
ES2278348T3
ES2278348T3 ES04787072T ES04787072T ES2278348T3 ES 2278348 T3 ES2278348 T3 ES 2278348T3 ES 04787072 T ES04787072 T ES 04787072T ES 04787072 T ES04787072 T ES 04787072T ES 2278348 T3 ES2278348 T3 ES 2278348T3
Authority
ES
Spain
Prior art keywords
channel
mixing
original
downstream mixing
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
ES04787072T
Other languages
English (en)
Inventor
Juergen Herre
Johannes Hilpert
Stefan Geyersberger
Andreas Hoelzer
Claus Spenger
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=34394093&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=ES2278348(T3) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Application granted granted Critical
Publication of ES2278348T3 publication Critical patent/ES2278348T3/es
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Theoretical Computer Science (AREA)
  • Algebra (AREA)
  • Pure & Applied Mathematics (AREA)
  • Stereophonic System (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Error Detection And Correction (AREA)
  • Executing Machine-Instructions (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereo-Broadcasting Methods (AREA)

Abstract

Aparato para procesar una señal de audio multicanal, teniendo la señal de audio multicanal al menos tres canales originales, que comprende: un medio (12) para proporcionar un primer canal de mezclado descendente como un canal de mezclado descendente izquierdo y un segundo canal de mezclado descendente como un canal de mezclado descendente derecho, derivándose el primer y segundo canales de mezclado descendentes de los canales originales de manera que los canales de mezclado descendente izquierdo y derecho se forman de manera que el resultado, cuando se reproduce, es una representación estéreo de la señal de audio multicanal; un medio (14) medios para calcular la información lateral de canal para un canal original seleccionado de las señales originales, siendo el medio para calcular operativo para calcular la información lateral de canal de manera que un canal de mezclado descendente o un canal de mezclado descendente combinado que incluye el primer y segundo canal de mezclado descendente, cuando se ponderan utilizando la información lateral de canal, dan como resultando una aproximación del canal original seleccionado; y un medio (18) para generar datos de salida, incluyendo los datos de salida la información lateral de canal.

Description

Codificación/decodificación multicanal compatible.
Campo de la invención
La presente invención se refiere a un aparato y método para procesar una señal de audio multicanal y en particular, a un aparato y método para procesar una señal de audio multicanal en una manera estéreo-compatible.
Antecedentes de la invención y técnica anterior
En tiempos recientes, la técnica de reproducción de audio multicanal se vuelve más y más importante. Esto puede deberse al hecho de que las técnicas de compresión/codificación de audio tal como la técnica mp3 bien conocida ha hecho posible distribuir grabaciones de audio a través de Internet u otros canales de transmisión que tienen un ancho de banda limitado. La técnica que codifica mp3 se ha vuelto famosa debido al hecho de que permite la distribución de todas las grabaciones en un formato estéreo, es decir, una representación digital de la grabación de audio incluyendo un canal estéreo primero o izquierdo y un canal estéreo segundo o derecho.
Sin embargo, existen inconvenientes básicos de los sistemas de sonido de dos canales convencionales. Por lo tanto, se ha desarrollado la técnica de suspensión periférica. Una representación de suspensión periférica multicanal recomendada incluye, además de los dos canales estéreo L y R, un canal C central adicional y dos canales Ls, Rs de suspensión periférica. Este formato de sonido de referencia también se conoce como tri/bi-estéreo que se refiere a tres canales frontales y dos canales de suspensión periférica. Generalmente, se requieren cinco canales de transmisión. En un ambiente de reproducción, al menos cinco altavoces en cinco lugares diferentes respectivos son necesarios para obtener un punto suave óptimo a una cierta distancia de los cinco altavoces bien colocados.
Se conocen varias técnicas en la materia para reducir la cantidad de datos requeridos para la transmisión de una señal de audio multicanal. Tales técnicas se llaman técnicas estéreo de conjunto. Para este fin, se hace referencia a la figura 10 que muestra un dispositivo estéreo de conjunto 60. Este dispositivo puede ser un dispositivo que implementa por ejemplo, estéreo de intensidad (IS) o código de indicación binaural (BCC). Tal dispositivo generalmente recibe -como una entrada- al menos dos canales (CH1, CH2, ... CHn) y emite un solo canal portador y datos paramétricos. Los datos paramétricos se definen de manera que en un decodificador, puede calcularse una aproximación de un canal original (CH1, CH2, ...CHn).
Normalmente, el canal portador incluirá muestras de sub-banda, coeficientes espectrales, muestras de dominio de tiempo etc., que proporcionan una representación comparativamente fina de la señal subyacente, mientras que los datos paramétricos no incluyen tales muestras de coeficientes espectrales pero incluyen parámetros de control para controlar un cierto algoritmo de reconstrucción tal como la ponderación mediante multiplicación, cambio de hora, cambio de frecuencia,... Los datos paramétricos por lo tanto incluyen solo una representación comparativamente burda de la señal o el canal asociado. Establecido en números, la cantidad de datos requeridos por un canal portador estarán en el intervalo de 60 - 70 kbit/s, mientras que la cantidad de los datos requeridos por la información lateral paramétrica para un canal estará en el intervalo de 1,5 - 2,5 kbit/s. Un ejemplo para los datos paramétricos son los factores de graduación bien conocidos, los parámetros de información estéreo de intensidad o de indicación binaurales tal como se describirá a continuación.
La codificación estéreo de intensidad se describe en la preimpresión 3799 de AES, "Codificación Estéreo de Intensidad", J. Herre, K.H. Brandenburg, D. Lederer, Febrero 1994, Amsterdam. Generalmente, el concepto de estéreo de intensidad se basa en una transformada de eje principal para aplicarse a los datos de ambos canales de audio estereofónicos. Si la mayoría de los puntos de datos se concentran alrededor del primer eje principal, puede lograrse una ganancia de codificación al girar ambas señales mediante un cierto ángulo antes de la codificación. Sin embargo, esto no siempre es verdad para las técnicas de producción estereofónicas reales. Por lo tanto, esta técnica se modifica al excluir el segundo componente ortogonal de la transmisión en el flujo de bits. Así, las señales reconstruidas para los canales izquierdo y derecho consisten de versiones ponderadas o graduadas de manera diferente de la misma señal transmitida. Sin embargo, las señales reconstruidas difieren en su amplitud pero son idénticas con respecto a su información de fase. Sin embargo, las envolturas de energía-tiempo de ambos canales de audio originales, se conservan por medio de la operación de graduación selectiva, que típicamente opera en una manera selectiva de frecuencia. Esto se conforma a la percepción humana del sonido a altas frecuencias, en donde las indicaciones espaciales dominantes se determinan mediante las envolturas de energía.
Adicionalmente, en implementaciones prácticas, la señal transmitida, es decir, el canal portador se genera a partir de la suma de la señal del canal izquierdo y el canal derecho en lugar de girar ambos componentes. Además, este procesamiento, es decir, generar los parámetros de estéreo de intensidad para llevar a cabo la operación de graduación, se lleva a cabo en selección de frecuencia, es decir, independientemente para cada banda de factor de graduación, es decir, división de la frecuencia codificadora. Preferiblemente, ambos canales se combinan para formar un canal combinado o "portador" y además del canal combinado, se determina la información estéreo de intensidad que depende de la energía del primer canal, la energía del segundo canal o la energía del combinado o canal.
\newpage
La técnica BCC se describe en el documento de la convención AES 5574, "Codificación de indicación binaural aplicada a la compresión de audio estéreo y multicanal", C. Faller, Baumgarte, Mayo 2002, Munich. En la codificación BCC, un número de canales de entrada de audio se convierte a una representación espectral utilizando una transformada en base a DFT con ventanas de solapamiento. El espectro uniforme resultante se divide en divisiones de no solapamiento teniendo cada una un índice. Cada división tiene un ancho de banda proporcional al ancho de banda rectangular equivalente (ERB). Las diferencias de nivel de inter-canal (ICLD) y las diferencias de tiempo de inter-canal (ICTD) se estiman para cada división para cada trama k. El ICLD e ICTD se cuantifican y codifican dando como resultado un flujo de bits BCC. Las diferencias de nivel de inter-canal y las diferencias de tiempo de inter-canal se dan para cada canal con relación a un canal de referencia. Entonces, los parámetros se calculan según las fórmulas prescritas, que dependen de ciertas divisiones de la señal a procesarse.
En un lado de decodificador, el decodificador recibe una monoseñal y el flujo de bits BCC. La monoseñal se transforma en el dominio de frecuencia y se introduce en un bloque de síntesis espacial, que también recibe los valores ICLD e ICTD decodificados. En el bloque de síntesis espacial, los valores de los parámetros BCC (ICLD e ICTD) se utilizan para llevar a cabo una operación de ponderación de la monoseñal para sintetizar las señales multicanal, que después de una conversión de frecuencia/tiempo, representan una reconstrucción de la señal de audio multicanal original.
En el caso de BCC, el módulo 60 estéreo de conjunto es operativo para emitir la información lateral de canal de tal forma que los datos paramétricos de canal son parámetros ICLD o ICTD cuantificados y codificados, en donde uno de los canales originales se utiliza como el canal de referencia para codificar la información lateral de canal.
Normalmente, el canal portador se forma de la suma de los canales originales participantes.
Naturalmente, las técnicas anteriores solo proporcionan una mono-representación para un decodificador, que solamente puede procesar el canal portador, pero no es capaz de procesar los datos paramétricos para generar una o más aproximaciones de más de un canal de entrada.
Para transmitir los cinco canales en una forma compatible, es decir, en un formato de flujo de bits, que también puede entenderse para un decodificador estéreo normal, la tal denominada técnica de combinación matricial, se ha utilizado como se describe en "Suspensión periférica MUSICAM: un sistema de codificación multicanal universal compatible con ISO 11172-3", G. Theile y G. Stoll, preimpresión 3403 de AES, Octubre de 1992, San Francisco. Los cinco canales L, R, C, Ls y Rs de entrada se alimentan en un dispositivo de combinación matricial que lleva a cabo una operación de combinación matricial para calcular los canales Lo, Ro estéreo básicos o compatibles, a partir de los cinco canales de entrada. En particular, estos canales Lo/Ro estéreo básicos se calculan como se establece a continuación:
Lo = L + xC + yLs
Ro = R + xC + yRs
x e y son constantes. Los otros tres canales C, Ls, Rs se transmiten como se encuentran en una capa de extensión, además de una capa estéreo básica, que incluye una versión codificada de señales Lo/Ro estéreo básicas. Con respecto al flujo de bits, esta capa estéreo básica de Lo/Ro incluye un encabezado, información tal como los factores de graduación y las muestras de sub-banda. La capa de extensión multicanal, es decir, el canal central y los dos canales de suspensión periférica se incluyen en el campo de extensión multicanal, que también se denomina campo de datos auxiliar.
En un lado de decodificador, se lleva a cabo una operación de combinación matricial inversa para formar las reconstrucciones de los canales izquierdo y derecho en la representación de cinco canales utilizando los canales Lo, Ro estéreo básicos y los tres canales adicionales. Adicionalmente, los tres canales adicionales se decodifican de la información auxiliar para obtener una representación de cinco canales o de suspensión periférica decodificada de la señal de audio multicanal original.
Se describe otro enfoque para la codificación multicanal en la publicación "Codificación multicanal de audio MPEG-2 mejorada", B. Grill, J. Herre, K. H. Brandenburg, E. Eberlein, J. Koller, J. Mueller, preimpresión 3865 de AES, Febrero de 1994, Amsterdam, en la cual con el fin de obtener compatibilidad hacia atrás, se consideran los modos compatibles hacia atrás. Con este fin, se utiliza una matriz de compatibilidad para obtener dos de los tal denominados canales Lc, Rc de mezclado descendente a partir de los cinco canales de entrada originales. Además, es posible seleccionar dinámicamente los tres canales auxiliares transmitidos como datos auxiliares.
Con el fin de explotar la irrelevancia estéreo, se aplica una técnica estéreo de conjunto a los grupos de canales, por ejemplo, los tres canales frontales, es decir, para el canal izquierdo, el canal derecho y el canal central. Con este fin, estos tres canales se combinan para obtener un canal combinado. Este canal combinado se cuantifica y empaqueta en el flujo de bits. Entonces, este canal combinado junto con la información estéreo de conjunto correspondiente se introduce en un módulo de decodificación estéreo de conjunto para obtener los canales decodificados estéreo de conjunto, es decir, un canal izquierdo decodificado estéreo de conjunto, un canal derecho decodificado estéreo de conjunto y un canal central decodificado estéreo de conjunto. Estos canales decodificados estéreo de conjunto, junto con el canal de suspensión periférica izquierdo y el canal de suspensión periférica derecho, se introducen en un bloque de matriz de compatibilidad para formar el primer y segundo canales Lc, Rc de mezclado descendente. Entonces, las versiones cuantificadas de ambos canales de mezclado descendente y una versión cuantificada del canal combinado se empaquetan en el flujo de bits junto con los parámetros de codificación estéreo de conjunto.
Por lo tanto, utilizando la codificación estéreo de intensidad, un grupo de señales de canales originales independientes se transmite dentro de una sola porción de datos "portadores". El decodificador reconstruye entonces las señales involucradas como datos idénticos, que se regradúan según sus envolturas de energía-tiempo originales. Consecuentemente, una combinación lineal de los canales transmitidos llevará a resultados, que son bastante diferentes del mezclado descendente original. Esto se aplica a cualquier clase de codificación estéreo de conjunto en base al concepto estéreo de intensidad. Para un sistema de codificación que proporciona canales de mezclado descendente compatibles, existe una consecuencia directa: La reconstrucción deshaciendo la combinación matricial, tal como se describe en la publicación anterior, sufre de artefactos provocados por la reconstrucción imperfecta. Utilizando un tal denominado esquema de predistorsión estéreo de conjunto, en el cual una codificación estéreo de conjunto de los canales izquierdo, derecho y central se lleva a cabo antes de la combinación matricial en el codificador, se mejora este problema. De esta forma, el esquema de deshacer la combinación matricial para la reconstrucción introduce menos artefactos, ya que en el lado de codificador, las señales decodificadas estéreo de conjunto se han utilizado para generar los canales de mezclado descendente. Así, el proceso de reconstrucción imperfecta se cambia a los canales Lc y Rc de mezclado descendente compatibles, en donde es mucho más probable que se enmascaren por la propia señal de audio.
Aunque tal sistema ha dado como resultado menos artefactos debido a que se deshace la combinación matricial en el lado de decodificador, éste sin embargo tiene algunas desventajas. Una desventaja es que los canales Lc y Rc de mezclado descendente estéreo-compatibles se derivan no a partir de los canales originales sino a partir de las versiones codificadas/decodificadas estéreo de intensidad de los canales originales. Por lo tanto las pérdidas de datos debidas al sistema de codificación estéreo de intensidad se incluyen en los canales de mezclado descendente compatibles. Un decodificador solo estéreo, sólamente decodifica los canales compatibles en lugar de mejorar los canales codificados estéreo de intensidad, por lo tanto proporciona una señal de salida que está afectada por las pérdidas de datos inducidos de estéreo intensidad.
Adicionalmente, un canal adicional completo tiene que transmitirse además de los dos canales de mezclado descendente. Este canal es el canal combinado, que se forma por medio de codificación estéreo de conjunto del canal izquierdo, el canal derecho y el canal central. Adicionalmente, la información estéreo de intensidad para reconstruir los canales L, R, C originales a partir del canal combinado también tiene que transmitirse al decodificador. En el decodificador, una combinación matricial inversa, es decir, se lleva a cabo una operación para deshacer la combinación matricial para derivar los canales de suspensión periférica de los dos canales de mezclado descendente. Adicionalmente, los canales izquierdo, derecho y central originales se aproximan mediante la decodificación estéreo de conjunto utilizando el canal combinado transmitido y los parámetros estéreo de conjunto transmitidos. Debe notarse que los canales izquierdo, derecho y central originales se derivan por la decodificación estéreo de conjunto del canal combinado.
El documento EP 0688113 A2 describe un método y aparato para codificar y decodificar señales de audio digitales y un aparato para grabar audio digital. Una señal original multicanal que tiene un canal central, un canal izquierdo, un canal derecho, un canal de suspensión periférica izquierdo y un canal de suspensión periférica derecho se introduce en un analizador común. El analizador común analiza qué parte de los distintos canales pueden tratarse en común y emite de manera selectiva solamente la parte de los datos de audio de lo canales respectivos que van a tratarse en común. Las partes de los canales originales que no pueden tratarse en común se codifican de manera separada. Mediante circuitos de transformada ortogonal, los canales originales se transforman en el dominio de frecuencia. A continuación, un selector de procesamiento de tratamiento común selecciona, basándose en datos sobre tratamiento común, el intervalo de frecuencia tal para el que el nivel absoluto de ruido de cuantificación generado por el tratamiento común se hace inferior a la curva de audibilidad mínima. Los otros datos en tiempo o frecuencia, donde no se cumple esta condición, no se tratan en común sino que se codifican y transmiten de manera separada.
El documento de patente de los EE.UU. describe un método para codificar una pluralidad de señales de audio. El canal izquierdo, el canal derecho y el canal central se introducen en un codificador estéreo de conjunto, que emite una señal codificada de conjunto. Después de la cuantificación en un bloque de cuantificación, la señal se suministra a un empaquetador de flujo de bits. Además, esta señal codificada de conjunto se introduce en un decodificador estéreo de conjunto para obtener señales decodificadas simuladas. Estas señales decodificadas simuladas se introducen en una matriz de compatibilidad, que también recibe el canal de suspensión periférica izquierdo y el canal de suspensión periférica derecho. Basándose en estos cinco canales, se generan y cuantifican una señal compatible izquierda y una señal compatible derecha y finalmente se envían al empaquetador de flujo de bits.
Es el objetivo de la presente invención proporcionar un concepto para un procesamiento o procesamiento inverso eficiente en bits y reducido en artefactos de una señal de audio multicanal.
Según un primer aspecto de la presente invención, este objetivo se logra mediante un aparato para procesar una señal de audio multicanal, teniendo la señal de audio de multicanal al menos tres canales originales, que comprende: un medio para proporcionar un primer canal de mezclado descendente y un segundo canal de mezclado descendente, derivándose el primer y segundo canales de mezclado descendente de los canales originales; un medio para calcular la información lateral de canal para un canal original seleccionado de las señales originales, siendo el medio para calcular operativo para calcular la información lateral de canal de manera que un canal de mezclado descendente o un canal de mezclado descendente combinado que incluye el primer y segundo canal de mezclado descendente, cuando se ponderan utilizando la información lateral de canal, da como resultado una aproximación del canal original seleccionado; y un medio para generar datos de salida, incluyendo los datos de salida la información lateral de canal, el primer canal de mezclado descendente o una señal derivada del primer canal de mezclado descendente y el segundo canal de mezclado descendente o una señal derivada del segundo canal de mezclado descendente.
Según un segundo aspecto de la presente invención, este objetivo se logra por un método de procesar una señal de audio multicanal, teniendo al menos la señal de audio multicanal tres canales originales, que comprende: proporcionar un primer canal de mezclado descendente y un segundo canal de mezclado descendente, derivándose el primer y segundo canal de mezclado descendente a partir de los canales originales; calculando la información lateral de canal para un canal original seleccionado de las señales originales por lo que un canal de mezclado descendente o un canal de mezclado descendente combinado que incluye el primer y segundo canal de mezclado descendente, cuando se ponderan utilizando la información lateral de canal, da como resultado una aproximación del canal original seleccionado; y generar los datos de salida, incluyendo los datos de salida la información lateral de canal, el primer canal de mezclado descendente o una señal derivada del primer canal de mezclado descendente y el segundo canal de mezclado descendente o una señal derivada del segundo canal de mezclado descendente.
Según un tercer aspecto de la presente invención, este objetivo se logra mediante un aparato para el procesamiento inverso de datos de entrada, incluyendo los datos de entrada la información lateral de canal, un primer canal de mezclado descendente o una señal derivada del primer canal de mezclado descendente y un segundo canal de mezclado descendente o una señal derivada del segundo canal de mezclado descendente, en el que el primer canal de mezclado descendente y el segundo canal de mezclado descendente se derivan de al menos tres canales originales de una señal de audio multicanal y en el que la información lateral de canal se calcula de tal forma que un canal de mezclado descendente o un canal de mezclado descendente combinado que incluye el primer canal de mezclado descendente y el segundo canal de mezclado descendente, cuando se ponderan utilizando la información lateral de canal, da como resultado una aproximación del canal original seleccionado, comprendiendo el aparato: un lector de datos de entrada para leer los datos de entrada para obtener el primer canal de mezclado descendente o una señal derivada del primer canal de mezclado descendente y el segundo canal de mezclado descendente o una señal derivada del segundo canal de mezclado descendente y la información lateral de canal; y un reconstructor de canal para reconstruir la aproximación del canal original seleccionado utilizando la información lateral de canal en el canal de mezclado descendente o el canal de mezclado descendente combinado para obtener la aproximación del canal original seleccionado.
Según un cuarto aspecto de la presente invención, este objetivo se logra por un método de procesamiento inverso de datos de entrada, incluyendo los datos de entrada información lateral de canal, un primer canal de mezclado descendente o una señal derivada del primer canal de mezclado descendente y un segundo canal de mezclado descendente o una señal derivada del segundo canal de mezclado descendente, en el que el primer canal de mezclado descendente y el segundo canal de mezclado descendente se derivan de al menos tres canales originales de una señal de audio multicanal y en el que la información lateral de canal se calcula de tal forma que un canal de mezclado descendente o un canal de mezclado descendente combinado que incluye el primer canal de mezclado descendente y el segundo canal de mezclado descendente, cuando se ponderan utilizando la información lateral de canal, da como resultado una aproximación del canal original seleccionado, comprendiendo el método: leer los datos de entrada para obtener el primer canal de mezclado descendente o una señal derivada del primer canal de mezclado descendente y el segundo canal de mezclado descendente o una señal derivada del segundo canal de mezclado descendente y la información lateral de canal; y reconstruir la aproximación del canal original seleccionado utilizando la información lateral de canal y el canal de mezclado descendente o el canal de mezclado descendente combinado para obtener la aproximación del canal original seleccionado.
Según un quinto aspecto y un sexto aspecto de la presente invención, este objetivo se logra mediante un programa informático que incluye el método de procesamiento o el método de procesamiento inverso.
La presente invención se basa en el descubrimiento de que se obtiene la codificación eficiente y reducida en artefactos de la señal de audio multicanal, cuando dos canales de mezclado descendente que preferiblemente representan los canales estéreo izquierdo y derecho se empaquetan en lo datos de salida.
Inventivamente, la información lateral de canal paramétrica para uno o más de los canales originales se deriva de tal forma que se relaciona con uno de los canales de mezclado descendente en lugar de, como en la técnica anterior, con un canal estéreo de conjunto "combinado". Esto se refiere a que la información lateral de canal paramétrica se calcula de tal forma que sobre un lado de decodificador, un reconstructor de canal utiliza la información lateral de canal y uno de los canales de mezclado descendente o una combinación de los canales de mezclado descendente para reconstruir una aproximación del canal de audio original, al cual se asigna la información lateral de canal.
El concepto inventivo es ventajoso en que proporciona una extensión multicanal eficiente en bits de manera que puede reproducirse una señal de audio multicanal en un decodificador.
\newpage
Adicionalmente, el concepto inventivo es compatible hacia atrás, ya que un decodificador en graduación inferior, que solo se adapta para el procesamiento de dos canales, puede simplemente ignorar la información de extensión, es decir, la información lateral de canal. El decodificador de graduación inferior solamente puede reproducir los dos canales de mezclado descendente para obtener una representación estéreo de la señal de audio multicanal original. Sin embargo, un decodificador de graduación mayor que se facilita para la operación multicanal, puede utilizar la información lateral de canal transmitida para reconstruir las aproximaciones de los canales originales.
La presente invención es ventajosa en que es de eficiente en bits, ya que, en contraste con la técnica anterior, no se requiere ningún canal portador adicional más allá de los canales Lc, Rc de mezclado descendente primero y segundo. En su lugar, la información lateral de canal se relaciona con uno o ambos de los canales de mezclado descendente. Esto significa que los propios canales de mezclado descendente sirven como un canal portador, al cual se combina la información lateral de canal para reconstruir un canal de audio original. Esto significa que la información lateral de canal es preferiblemente la información lateral paramétrica, es decir, información que no incluye cualquiera de las muestras de sub-banda o coeficientes espectrales. En su lugar, la información lateral paramétrica es información utilizada para ponderar (en tiempo y/o frecuencia) el canal de mezclado descendente respectivo o la combinación de los canales de mezclado descendente respectivos para obtener una versión reconstruida de un canal original seleccionado.
En una realización preferida de la presente invención, se obtiene una codificación compatible hacia atrás de una señal multicanal que se basa en una señal estéreo compatible. Preferiblemente, la señal estéreo compatible (señal de mezclado descendente) se genera utilizando la combinación matricial de los canales originales de la señal de audio multicanal.
Inventivamente, la información lateral de canal para un canal original seleccionado se obtiene en base a las técnicas estéreo de conjunto tales como la codificación estéreo de intensidad o codificación de indicación binaural. Así, en el lado de decodificador, tiene que llevarse a cabo la operación para deshacer la combinación matricial. Se evitan los problemas asociados con deshacer la combinación matricial, es decir, ciertos artefactos relacionados con una distribución no deseada de cuantificación de ruido en las operaciones para deshacer la combinación matricial. Esto se debe al hecho de que el decodificador utiliza un reconstructor de canal, que reconstruye una señal original, al utilizar uno de los canales de mezclado descendente o una combinación de los canales de mezclado descendente y la información lateral de canal transmitida.
Preferiblemente, se aplica el concepto inventivo a una señal de audio de mutli-canal que tiene cinco canales. Estos cinco canales son una canal L izquierdo, una canal R derecho, un canal C central, un canal Ls de suspensión periférica izquierdo y un canal Rs de suspensión periférica derecho. Preferiblemente, los canales de mezclado descendente son canales Ls y Rs de mezclado descendente estéreo compatibles, que proporcionan una representación de estéreo de la señal de audio multicanal original.
Según la realización preferida de la presente invención, para cada canal original, la información lateral de canal se calcula en un lado de codificador empaquetado en los datos de salida. La información lateral de canal para el canal izquierdo original se deriva utilizando el canal de mezclado descendente izquierdo. La información del canal lateral para el canal de suspensión periférica izquierdo se deriva utilizando el canal de mezclado descendente izquierdo. La información lateral de canal para el canal derecho original se deriva a partir del canal de mezclado descendente derecho. La información del canal lateral para el canal de suspensión periférica derecho se deriva utilizando el canal de mezclado descendente derecho.
Según la realización preferida de la presente invención, la información de canal para el canal central original se deriva utilizando el primer canal de mezclado descendente así como el segundo canal de mezclado descendente, es decir, utilizando una combinación de los dos canales de mezclado descendente. Preferiblemente, esta combinación es una suma.
Así, los agrupamientos, es decir, la relación entre la información lateral de canal y la señal portadora, es decir, el canal de mezclado descendente utilizado para proporcionar la información lateral de canal para un canal original seleccionado son de tal forma que, para una calidad óptima, se selecciona un cierto canal de mezclado descendente, que contiene la cantidad relativa más alta posible de la señal multicanal original respectiva que se representa por medio de la información lateral de canal. Como una señal portadora estéreo de conjunto de este tipo, se utilizan el primer y segundo canales de mezclado descendente. Preferiblemente, también puede utilizarse la suma del primer y segundo canales de mezclado descendente. Naturalmente, la suma del primer y segundo canales de mezclado descendente puede utilizarse para calcular la información lateral de canal para cada uno de los canales originales. Sin embargo, preferiblemente, se utiliza la suma de los dos canales de mezclado descendente para calcular la información lateral de canal del canal central original en un ambiente de suspensión periférica, tal como cinco canales de suspensión periférica, siete canales de suspensión periférica, suspensión periférica de 5.1 o suspensión periférica de 7.1. Es especialmente ventajoso utilizar la suma del primer y segundo canales de mezclado descendente ya que no existen operaciones adicionales de transmisión que tengan que llevarse a cabo. Esto es debido al hecho de que ambos canales de mezclado descendente se presentan en el decodificador de tal forma que la suma de estos canales de mezclado descendente puede llevarse a cabo fácilmente en el decodificador sin requerir ningún bit de transmisión adicional.
Preferiblemente, la información lateral de canal que forma la extensión multicanal se introduce en el flujo de bits de datos de salida en una forma compatible de manera que un decodificador de graduación inferior simplemente ignora los datos de extensión multicanal y solo proporciona la representación estéreo de la señal de audio
multicanal.
Sin embargo, un codificador de graduación superior no solo utiliza dos canales de mezclado descendente, sino además emplea la información lateral de canal para reconstruir una representación multicanal completa de la señal de audio original.
Un decodificador inventivo es operativo para decodificar primero ambos canales de mezclado descendente y para leer la información lateral de canal para los canales originales seleccionados. Entonces, la información lateral de canal y los canales de mezclado descendente se utilizan para reconstruir las aproximaciones de los canales originales. Con este fin, preferiblemente no se lleva a cabo ninguna operación para deshacer la combinación matricial. Esto significa que, en esta realización, cada uno de, por ejemplo, los cinco canales de entrada originales se reconstruyen utilizando, por ejemplo, cinco conjuntos de diferentes informaciones laterales del canal. En el decodificador, se lleva a cabo el mismo agrupamiento como en el codificador para calcular la aproximación del canal reconstruido. En un ambiente de suspensión periférica de cinco canales, esto significa que para reconstruir el canal izquierdo original, se utilizan el canal de mezclado descendente izquierdo y la información lateral de canal para el canal izquierdo. Para reconstruir el canal derecho original, se utilizan el canal de mezclado descendente derecho y la información lateral de canal para el canal derecho. Para reconstruir el canal de suspensión periférica izquierdo original, se utilizan el canal de mezclado descendente izquierdo y la información lateral de canal para el canal de suspensión periférica izquierdo. Para reconstruir el canal de suspensión periférica derecho original, se utilizan la información lateral de canal para el canal de suspensión periférica derecho y el canal de mezclado descendente derecho. Para reconstruir el canal central original, se utiliza un canal combinado formado a partir del primer canal de mezclado descendente y el segundo canal de mezclado descendente y la información lateral de canal central.
Naturalmente, también es posible, volver a reproducir el primer y segundo canales de mezclado descendente como los canales izquierdo y derecho de manera que solamente tienen que transmitirse tres conjuntos (de por ejemplo, cinco) de los parámetros de información lateral de canal. Sin embargo, esto solo es aconsejable en situaciones donde existen reglas menos estrictas con respecto a la calidad. Esto se debe al hecho de que normalmente, el canal de mezclado descendente izquierdo y el canal de mezclado descendente derecho son diferentes del canal izquierdo original o canal derecho original. Tal procesamiento solamente es ventajoso en situaciones donde no puede permitirse el transmitir la información lateral de canal para cada uno de los canales originales.
Breve descripción de los dibujos
Las realizaciones preferidas de la presente invención se describen a continuación en referencia a las figuras acompañantes en las que:
La figura 1 es un diagrama de bloques de una realización preferida del codificador inventivo;
La figura 2 es un diagrama de bloque de una realización preferida del decodificador inventivo;
La figura 3A es un diagrama de bloque para una implementación preferida del medio para calcular para obtener la información lateral de canal selectivo de frecuencia;
La figura 3B es una realización preferida de un cálculo que implementa el procesamiento estéreo de conjunto tal como una codificación de intensidad o codificación de indicación binaural;
La figura 4 ilustra otra realización preferida del medio para calcular la información lateral de canal, en el que la información lateral de canal son factores de ganancia;
La figura 5 ilustra una realización preferida de una implementación del decodificador, cuando el codificador se implementa como en la figura 4;
La figura 6 ilustra una implementación preferida del medio para proporcionar los canales de mezclado descendente;
La figura 7 ilustra los agrupamientos de los canales originales y de mezclado descendente para calcular la información lateral de canal para los canales originales respectivos;
La figura 8 ilustra otra realización preferida de un codificador inventivo;
La figura 9 ilustra otra implementación de un decodificador inventivo; y
La figura 10 ilustra una técnica anterior del codificador estéreo de conjunto.
Descripción detallada de las realizaciones preferidas
La figura 1 muestra un aparato para procesar una señal 10 multicanal que tiene al menos tres canales originales tales como R, L y C. Preferiblemente, la señal de audio original tiene más de tres canales, tales como cinco canales en el ambiente de suspensión periférica, que se ilustran en la figura 1. Los cinco canales son el canal L izquierdo, el canal R derecho, el canal C central, el canal Ls de suspensión periférica izquierdo y el canal Rs de suspensión periférica derecho. El aparato inventivo incluye el medio 12 para proporcionar un primer canal Lc de mezclado descendente y un segundo canal Rc de mezclado descendente, derivándose el primer y segundo canales de mezclado descendente a partir de los canales originales. Para derivar los canales de mezclado descendente a partir de los canales originales, existen varias posibilidades. Una posibilidad es derivar los canales Lc y Rc de mezclado descendente por medio de la combinación matricial de los canales originales utilizando una operación de combinación matricial tal como se ilustra en la figura 6. Esta operación de combinación matricial se lleva a cabo en el dominio de tiempo.
Los parámetros a, b y t de la combinación matricial se seleccionan de tal forma que son inferiores o iguales a 1. Preferiblemente, a y b son 0.7 ó 0.5. El parámetro t de ponderación total se selecciona preferiblemente de tal forma que se evita el corte del canal. Alternativamente, tal como se indica en la figura 1, los canales Lc y Rc de mezclado descendente también pueden suministrarse de forma externa. Esto puede hacerse, cuando los canales Lc y Rc de mezclado descendente son el resultado de una operación de "mezclado a mano". En este escenario, un ingeniero de sonido mezcla los canales de mezclado descendente por sí mismo en lugar de utilizar una operación de combinación matricial automatizada. El ingeniero de sonido lleva a cabo el mezclado creativo para obtener los canales Lc y Rc de mezclado descendente optimizados que dan la mejor representación estéreo posible de la señal de audio multicanal original.
En el caso de un suministro externo de los canales de mezclado descendente, el medio para proporcionar no lleva a cabo una operación de combinación matricial sino simplemente envía los canales de mezclado descendente suministrados de forma externa a un medio 14 de cálculo posterior.
El medio 14 de cálculo es operativo para calcular la información lateral de canal tal como l_{1}, ls_{i}, r_{i} o rs_{i} para seleccionar los canales originales tales como L, Ls, R o Rs respectivamente. En particular, el medio 14 para calcular es operativo para calcular la información lateral de canal de tal manera que un canal de mezclado descendente, cuando se pondera utilizando la información lateral de canal, da como resultado una aproximación del canal original seleccionado.
Alternativa o adicionalmente, el medio para calcular la información lateral de canal es operativo además para calcular la información lateral de canal para un canal original seleccionado de tal forma que un canal de mezclado descendente combinado que incluye una combinación del primer y segundo canales de mezclado descendente, cuando se pondera utilizando la información lateral de canal calculada da como resultado una aproximación del canal original seleccionado. Para mostrar esta característica en la figura, se muestran un sumador 14a y un calculador 14b de información lateral de canal combinado.
Para el experto en la técnica, está claro que estos elementos no tienen que implementarse como elementos distintos. En su lugar, la funcionalidad completa de los bloques 14, 14a y 14b puede implementarse por medio de un cierto procesador que puede ser un procesador de propósito general o cualquier otro medio para llevar a cabo la funcionalidad requerida.
Adicionalmente, debe notarse aquí que las señales de canal son muestras de sub-banda o valores de dominio de frecuencia que se indican en mayúsculas. La información lateral de canal se indica, a diferencia de los propios canales, mediante minúsculas. La información c_{i} lateral de canal es por lo tanto, la información lateral de canal para el canal central C original.
La información lateral de canal así como los canales Lc y Rc de mezclado descendente o una versión Lc' o Rc' codificada tal como se produce por un codificador 16 de audio, se introducen en un formateador 18 de datos de salida. Generalmente, el formateador 18 de datos de salida actúa como un medio para generar los datos de salida, incluyendo los datos de salida la información lateral de canal para al menos un canal original, el primer canal de mezclado descendente o una señal derivada del primer canal de mezclado descendente (tal como una versión codificada del mismo) y el segundo canal de mezclado descendente o una señal derivada del segundo canal de mezclado descendente (tal como una versión codificada del mismo).
El flujo 20 de datos de salida o de salida puede transmitirse entonces a un decodificador de flujo de bits o puede almacenarse o distribuirse. Preferiblemente, el flujo 20 de bits de salida es un flujo de bits compatible que también puede leerse mediante un decodificador de graduación inferior que no tiene una capacidad de extensión multicanal. Tales codificadores de graduación inferior tales como la mayoría de los decodificadores mp3 normales del estado de la técnica, simplemente ignorará los datos de extensión multicanal, es decir, la información lateral de canal. Solo decodificarán el primer y segundo canales de mezclado descendente para producir una salida estéreo. Los decodificadores de graduación superior, tales como decodificadores posibilitados para multicanal leerán la información lateral de canal y entonces generarán una aproximación de los canales de audio originales de tal forma que se obtiene una impresión de audio multicanal.
La figura 8 muestra una realización preferida de la presente invención en el ambiente de cinco canales de suspensión periférica/mp3. Aquí, se prefiere escribir los datos de mejora de suspensión periférica en el campo de datos auxiliar en la sintáxis de flujo de bits mp3 estandarizada de tal manera que se obtiene un flujo de bits de "suspensión periférica mp3".
La figura 2 muestra una ilustración de un decodificador inventivo que actúa como un aparato para procesar de forma inversa el dato de entrada recibido en un puerto 22 de datos de entrada. El dato recibido en el puerto 22 de datos de entrada es el mismo dato que el emitido a la salida del puerto 20 de datos de salida en la figura 1. Alternativamente, cuando los datos no se transmiten a través del canal alámbrico sino a través del canal inalámbrico, los datos recibidos en el puerto 22 de datos de entrada son datos derivados a partir de los datos originales producidos por el codificador.
Los datos de entrada de codificador entran en un lector 24 de corriente de datos para leer los datos de entrada para finalmente obtener la información 26 lateral de canal y el canal 28 de mezclado descendente izquierdo y el canal 30 de mezclado descendente derecho. En el caso de que los datos de entrada incluyan versiones codificadas de los canales de mezclado descendente, que corresponde al caso en el que está presente el codificador 16 de audio en la figura 1, el lector 24 de corriente de datos también incluye un decodificador de audio, que se adapta al codificador de audio utilizado para codificar los canales de mezclado descendente. En este caso, el decodificador de audio, que es parte del lector 24 de corriente de datos, es operativo para generar el primer canal Lc de mezclado descendente y el segundo canal Rc de mezclado descendente, o se dicho más exactamente, una versión codificada de aquellos canales. Para la facilidad de la descripción, solamente se hace una distinción entre las señales y versiones codificadas de las mismas cuando se dice explícitamente.
La información 26 lateral de canal y los canales 28 y 30 de mezclado descendente izquierdo y derecho que se emiten por el lector 24 de corriente de datos se alimentan en un reconstructor 32 multicanal para proporcionar una versión 34 reconstruida de las señales de audio originales, que pueden reproducirse por medio de un reproductor 36 multicanal. En el caso de que el reconstructor multicanal sea operativo en el dominio de frecuencia, el reproductor 36 multicanal recibirá los datos de entrada de dominio de frecuencia, que tienen que estar codificados en cierta forma, tal como convertirse en el dominio de tiempo antes de reproducirlos. Con este fin, el reproductor 36 multicanal también incluye medios de decodificación.
Debe notarse aquí que un decodificador de graduación inferior solo tendrá el lector 24 de corriente de datos, que solo emite los canales 28 y 30 de mezclado descendente derecho e izquierdo a una salida 38 estéreo. Un decodificador inventivo mejorado sin embargo, extraerá la información 26 lateral de canal y usará esta información lateral y los canales 28 y 30 de mezclado descendente para reconstruir las versiones 34 reconstruidas de los canales originales utilizando el reconstructor 32 multicanal.
La figura 3A muestra una realización del calculador 14 inventivo, que un codificador de audio por un lado y el calculador de información lateral de canal por otro lado accionan sobre la misma representación espectral de la señal multicanal. La figura 1 sin embargo, muestra la otra alternativa, en la cual el codificador de audio por un lado y el calculador de información lateral de canal por otro lado accionan sobre diferentes representaciones espectrales de la señal multicanal. Cuando los recursos de cómputo no son tan importantes como la calidad del audio, se prefiere la alternativa de la figura 1, ya que pueden utilizarse bancos de filtros optimizados individualmente para codificar el audio y calcular la información lateral. Sin embargo, cuando los recursos de cómputo son una cuestión importante, se prefiere la alternativa de la figura 3A, ya que esta alternativa requiere menos potencia de cómputo debido a una utilización compartida de elementos.
El dispositivo mostrado en la figura 3A es operativo para recibir dos canales A y B. El dispositivo mostrado en la figura 3A es operativo para calcular una información lateral para el canal B por lo que utilizando esta información lateral de canal para el canal B original seleccionado, puede calcularse una versión reconstruida del canal B a partir de la señal A del canal. Adicionalmente, el dispositivo mostrado en la figura 3A es operativo para formar la información lateral de canal de dominio de frecuencia, tales como los parámetros para ponderar (mediante multiplicación o procesamiento de tiempo como por ejemplo en la codificación BCC) los valores espectrales o muestras de sub-banda. Con este fin, el calculador inventivo incluye medios 140a de conversión de tiempo/frecuencia y partición en ventanas para obtener una representación de frecuencia del canal A a una salida 140b o una representación de dominio de frecuencia del canal B a una salida 140c.
En la realización preferida, la determinación de la información lateral (por medio de los medios 140f de determinación de información lateral) se lleva a cabo utilizando valores espectrales cuantificados. Entonces, también se encuentra presente un cuantificador 140d que preferiblemente se controla utilizando un modelo psicoacústico que tiene una entrada 140e de control del modelo acústico. Sin embargo, no se requiere un cuantificador cuando el medio 140c de determinación de información lateral utiliza una representación no cuantificada del canal A para determinar la información lateral de canal para el canal B.
En el caso de que la información lateral de canal para el canal B se calcule por medio de una representación de domino de frecuencia del canal A y de la representación de dominio de frecuencia del canal B, el medio 140a de conversión de tiempo/frecuencia y partición en ventanas puede ser el mismo que el que se utiliza en un codificador de audio basado en bancos de filtros. En este caso, cuando se considera ACC (ISO/IEC 13818-3), el medio 140a se implementa como un banco de filtros de MDCT (MDCT = transformada discreta del coseno modificada) con una funcionalidad de solapamiento y agregado del 50%.
En tal caso, el cuantificador 140d es un cuantificador iterativo como el que se utiliza cuando se generan las señales de audio mp3 o ACC codificadas. La representación del dominio de frecuencia del canal A, que preferiblemente ya está cuantificada, puede entonces utilizarse directamente para codificar la entropía utilizando un codificador de entropía 140g, que puede ser un codificador basado en Huffman o un codificador de entropía que implementa la codificación aritmética.
Cuando se compara con la figura 1, la salida del dispositivo en la figura 3A es la información lateral tal como l_{i} para un canal original (correspondiente a la información lateral para B en la salida del dispositivo 140f). El flujo de bits codificada por entropía para el canal A corresponde a por ejemplo el canal Lc' de mezclado descendente izquierdo codificado en la salida del bloque 16 en la figura 1. A partir de la figura 3A está claro que el elemento 14 (figura 1) es decir, el calculador para calcular la información lateral de canal y el codificador 16 de audio (figura 1) puede implementarse como un medio separado o puede implementarse como una versión compartida de manera que ambos dispositivos comparten varios elementos tal como el banco 140a de filtros de MDCT, el cuantificador 140e y el codificador 140g de entropía. Naturalmente, en el caso de que se necesita una transformada diferente, etc. para determinar la información lateral de canal, entonces el codificador 16 y el calculador 14 (figura 1) se implementarán en diferentes dispositivos de manera que ambos elementos no compartan el banco de filtros, etc.
Generalmente, el determinador real para calcular la información lateral (o dicho generalmente el calculador 14) puede implementarse como un módulo estéreo de conjunto tal como se muestra en la figura 3B, que funciona según cualquiera de las técnicas estéreo de conjunto tal como la codificación estéreo de intensidad o la codificación de indicación binaural.
A diferencia de tales codificadores estéreo de intensidad de la técnica anterior, el medio 140f de determinación inventivo no tiene que calcular el canal combinado. El "canal combinado" o canal portador, como puede decirse, ya existe y es el canal Lc de mezclado descendente compatible izquierdo o el canal Rc de mezclado descendente compatible derecho o una versión combinada de estos canales de mezclado descendente tal como Lc + Rc. Por lo tanto, el dispositivo 140f inventivo sólamente tiene que calcular la información de graduación para graduar el canal de mezclado descendente respectivo de manera que se obtiene la envoltura de energía/tiempo del canal original seleccionado respectivo, cuando el canal de mezclado descendente se pesa utilizando la información de graduación o como puede decirse, la información direccional de intensidad.
Por lo tanto, el módulo 140f estéreo de conjunto en la figura 3B se ilustra de manera que recibe, como una entrada, el canal A "combinado" que es el primer o segundo canal de mezclado descendente o una combinación de los canales de mezclado descendente y el canal original seleccionado. Este módulo, naturalmente emite el canal A "combinado" y los parámetros estéreo de conjunto como la información lateral de canal de manera que, utilizando el canal A y los parámetros estéreo de conjunto combinados, puede calcularse una aproximación del canal B original seleccionado.
Alternativamente, el módulo 140f estéreo de conjunto puede implementarse para llevar a cabo la codificación de indicación binaural.
En el caso de BCC, el módulo estéreo de conjunto 140f es operativo para sacar la información lateral de canal de manera que la información lateral de canal son parámetros ICLD o ICTD cuantificados y codificados, en donde el canal original seleccionado sirve como el canal real a procesarse, mientras que el canal de mezclado descendente respectivo se utiliza para calcular la información lateral, de manera que el primer, el segundo o una combinación del primer y segundo canales de mezclado descendente se utiliza como el canal de referencia en el sentido de la técnica de codificación/ decodificación de BCC.
En referencia a la figura 4, se da una implementación simple dirigida a energía del elemento 140f. Este dispositivo incluye un selector 44 de banda de frecuencia que selecciona una banda de frecuencia a partir del canal A y una banda de frecuencia correspondiente del canal B. Entonces, en ambas bandas de frecuencia, se calcula una energía por medio de un calculador 42 de energía para cada rama. La implementación detallada del calculador 42 de energía dependerá de si la señal de salida del bloque 40 es una señal de sub-banda o coeficientes de frecuencia. En otras implementaciones, donde se calculan los factores de graduación para las bandas del factor de graduación, ya pueden utilizarse los factores de graduación del primer y segundo canal A, B como valores E_{A} y E_{B} de energía o al menos como estimaciones de la energía. En un dispositivo 44 de cálculo del factor de ganancia, se determina un factor g_{B} de ganancia para la banda de frecuencia seleccionada en base a una cierta regla tal como la regla de determinación de ganancia ilustrada en el bloque 44 en la figura 4. Aquí, el factor g_{B} de ganancia puede utilizarse directamente para ponderar las muestras de dominio de tiempo o coeficientes de frecuencia tal como se describirá después en la figura 5. Con este fin, el factor g_{B} de ganancia, que es válido para la banda de frecuencia seleccionada, se utiliza como la información lateral de canal para el canal B como el canal original seleccionado. Este canal B original seleccionado no se transmitirá al decodificador sino que se representará mediante la información lateral de canal paramétrica tal como se calculó por el calculador 14 en la figura 1.
Debe notarse aquí que no es necesario transmitir los valores de ganancia como la información lateral de canal. También es suficiente transmitir los valores dependientes de frecuencia relacionados con la energía absoluta del canal original seleccionado. Entonces, el decodificador tiene que calcular la energía real del canal de mezclado descendente y el factor de ganancia en base a la energía del canal de mezclado descendente y la energía transmitida para el canal B.
La figura 5 muestra una implementación posible de un decodificador establecido en conexión con un codificador de audio perceptual basado en la transformada. En comparación con la figura 2, las funcionalidades del decodificador de entropía y el cuantificador 50 inverso (figura 5) se incluirán en el bloque 24 de la figura 2. Sin embargo, la funcionalidad de los elementos 52a, 52b de conversión de frecuencia/tiempo (figura 5), se implementará en el elemento 36 de la figura 2. El elemento 50 en la figura 5 recibe una versión codificada de la primera o segunda señal Lc' o Rc' de mezclado descendente. A la salida del elemento 50, está presente una versión al menos parcialmente codificada del primer y segundo canal de mezclado descendente que se llama subsiguientemente canal A. El canal A se introduce en un selector 54 de banda de frecuencia para seleccionar una cierta banda de frecuencia a partir del canal A. Esta banda de frecuencia seleccionada se pondera utilizando un multiplicador 56. El multiplicador 56 recibe, para multiplicar, un cierto g_{B} factor de ganancia, que se asigna a la banda de frecuencia seleccionada que se selecciona por el selector 54 de banda de frecuencia que corresponde al selector 40 de banda de frecuencia en la figura 4 en el lado de codificador. En la entrada del convertidor 52a de frecuencia/tiempo, existe, junto con otras bandas, una representación de dominio de frecuencia del canal A. A la salida del multiplicador 56 y en particular, a la entrada del medio 52b de conversión de frecuencia/tiempo habrá una representación de dominio de frecuencia reconstruida del canal B. Por lo tanto, en la salida del elemento 52a habrá una representación de dominio de tiempo para el canal A, mientras que en la salida del elemento 52b, habrá una representación de dominio de tiempo del canal B reconstruido.
Debe notarse aquí que, dependiendo de la implementación determinada, el canal Lc o Rc de mezclado descendente decodificado no se reproducirá en una decodificador mejorado multicanal. En tal codificador mejorado multicanal, los canales de mezclado descendente decodificados solo se utilizarán para reconstruir los canales originales. Los canales de mezclado descendente decodificados solo se reproducen de nuevo en decodificadores de solo estéreo de graduación inferior.
Con este fin, se hace referencia a la figura 9, que muestra la implementación preferida de la presente invención en un ambiente de suspensión periférica/mp3. Un flujo de bits de suspensión periférica mejorada de mp3 entra en un decodificador 24 mp3 estándar, que emite las versiones codificadas de los canales de mezclado descendente originales. Estos canales de mezclado descendente pueden reproducirse de nuevo directamente mediante un decodificador de nivel bajo. Alternativamente, estos dos canales entran en el dispositivo 32 de decodificación estéreo de conjunto avanzada que también recibe los datos de extensión multicanal, que preferiblemente entran en el campo de datos auxiliar en un flujo de bits que se ajusta a los requisitos de mp3.
Subsiguientemente, se hace referencia a la figura 7 que muestra el agrupamiento del canal original seleccionado y el canal de mezclado descendente respectivo o el canal de mezclado descendente combinado. En este sentido, la columna derecha de la tabla 7 corresponde al canal A en las figuras 3A, 3B, 4 y 5 mientras que la columna de en medio corresponde al canal B en estas figuras. En la columna izquierda en la figura 7, se expone explícitamente la información lateral de canal respectiva. Según la tabla de la figura 7, la información l_{i} lateral de canal para el canal L izquierdo original se calcula utilizando el canal Lc de mezclado descendente izquierdo. La información ls_{i} lateral de canal de suspensión periférica izquierdo se determina mediante el canal Ls de suspensión periférica izquierdo seleccionado y el canal Lc de mezclado descendente izquierdo es el portador. La información r_{i} lateral de canal derecho para el canal R derecho original se determina utilizando el canal Rc de mezclado descendente derecho. Adicionalmente, la información lateral de canal para el canal Rs de suspensión periférica derecho se determina utilizando el canal Rc de mezclado descendente como el portador. Finalmente, la información c_{i} lateral de canal para el canal C central se determina utilizando el canal de mezclado descendente combinado, que se obtiene por medio de una combinación del primer y segundo canal de mezclado descendente, que puede calcularse fácilmente tanto en un codificador como en un decodificador y que no requiere ningún bit extra para la transmisión.
Naturalmente, puede calcularse la información lateral de canal para el canal izquierdo, por ejemplo, en base a un canal de mezclado descendente combinado o incluso un canal de mezclado descendente, que se obtiene mediante una adición ponderada del primer y segundo canales de mezclado descendente tal como 0.7 Lc y 0.3 Lc, siempre que el decodificador conozca los parámetros de ponderación o se transmitan en consecuencia. Sin embargo, para la mayoría de las aplicaciones, se preferirá que solo se derive la información lateral de canal para el canal central a partir del canal de mezclado descendente combinado, es decir, a partir de una combinación del primer y segundo canales de mezclado descendente.
Para mostrar el potencial de ahorro de bits de la presente invención, se da el siguiente ejemplo típico. En el caso de una señal de audio de cinco canales, un codificador normal necesita una tasa de bits de 64 kbit/s para cada magnitud de canal ascendiendo a una tasa de bits total de 320 kbit/s para la señal de cinco canales. Las señales estéreo izquierda y derecha requieren una tasa de bits de 128 kbit/s. La información lateral de los canales para un canal se encuentra entre 1,5 y 2 kbit/s. Así, incluso en un caso en el que se transmite información lateral de canal para cada uno de los cinco canales, estos datos adicionales solamente ascienden a 7,5 hasta 10 kbit/s. Así, el concepto inventivo permite la transmisión de una señal de audio de cinco canales utilizando una tasa de bits de 138 kbit/s (comparada con 320 (!) kbit/s) con buena calidad, ya que el decodificador no utiliza la operación para deshacer la combinación matricial problemática. Probablemente es incluso más importante el hecho de que el concepto inventivo es completamente compatible hacia atrás, ya que cada uno de los reproductores mp3 existentes es capaz de reproducir de nuevo el primer canal de mezclado descendente y el segundo canal de mezclado descendente para producir una salida estéreo convencional.
Dependiendo del ambiente de aplicación, el método inventivo para el procesamiento o procesamiento inverso puede implementarse en hardware o en software. La implementación puede ser un medio de almacenamiento digital tal como un disco o un CD que tiene señales de control electrónicamente legibles, que pueden cooperar con un sistema informático programable de manera que se lleva a cabo el método inventivo para el procesamiento o procesamiento inverso. Dicho generalmente, la invención también se refiere por tanto a un producto de programa informático que tiene un código de programa almacenado sobre un portador legible por máquina, estando el código del programa adaptado para llevar a cabo el método inventivo cuando el producto de programa informático e ejecuta en un ordenador. En otras palabras, la invención también se refiere por tanto a un programa informático que tiene un código de programa para llevar a cabo el método, cuando el programa informático se ejecuta en un ordenador.

Claims (28)

1. Aparato para procesar una señal de audio multicanal, teniendo la señal de audio multicanal al menos tres canales originales, que comprende:
un medio (12) para proporcionar un primer canal de mezclado descendente como un canal de mezclado descendente izquierdo y un segundo canal de mezclado descendente como un canal de mezclado descendente derecho, derivándose el primer y segundo canales de mezclado descendentes de los canales originales de manera que los canales de mezclado descendente izquierdo y derecho se forman de manera que el resultado, cuando se reproduce, es una representación estéreo de la señal de audio multicanal;
un medio (14) medios para calcular la información lateral de canal para un canal original seleccionado de las señales originales, siendo el medio para calcular operativo para calcular la información lateral de canal de manera que un canal de mezclado descendente o un canal de mezclado descendente combinado que incluye el primer y segundo canal de mezclado descendente, cuando se ponderan utilizando la información lateral de canal, dan como resultando una aproximación del canal original seleccionado; y
un medio (18) para generar datos de salida, incluyendo los datos de salida la información lateral de canal.
2. Aparato según la reivindicación 1, en el que el medio (18) para generar es operativo para generar los datos de salida de manera que los datos de salida incluyen adicionalmente el primer canal de mezclado descendente o una señal derivada del primer canal de mezclado descendente y el segundo canal de mezclado descendente o una señal derivada del segundo canal de mezclado descendente.
3. Aparato según la reivindicación 1 ó 2, en el que el medio (14) para calcular es operativo para determinar la información lateral de canal como datos paramétricos que no incluyen las muestras de dominio de tiempo o valores espectrales.
4. Aparato según una cualquiera de las reivindicaciones 1 a 3, en el que el medio (14) para calcular es operativo para llevar a cabo la codificación estéreo de conjunto utilizando un canal de mezclado descendente como un canal portador y utilizando, como un canal de entrada, el canal original seleccionado, para generar los parámetros estéreo de conjunto como la información lateral de canal para el canal original seleccionado.
5. Aparato según la reivindicación 3, en el que el medio (14) para calcular es operativo para llevar a cabo la codificación estéreo de intensidad o la codificación de indicación binaural, de manera que la información lateral de canal representa una distribución de energía o parámetros de indicación binaural para el canal original seleccionado, en el que un canal de mezclado descendente o un canal de mezclado descendente combinado es utilizable como un canal portador.
6. Aparato según una cualquiera de las reivindicaciones 1 a 5,
en el que la señal de audio multicanal incluye un canal izquierdo, un canal de suspensión periférica izquierdo, un canal derecho y un canal de suspensión periférica derecho,
en el que el medio (12) para proporcionar es operativo para proporcionar el primer canal de mezclado descendente como un canal de mezclado descendente izquierdo y para proporcionar el segundo canal de mezclado descendente como un canal de mezclado descendente derecho, estando formados los canales de mezclado descendente izquierdo y derecho de manera que el resultado, cuando se reproduce, es una representación estéreo de la señal de audio multicanal, y
en el que el medio (14) para calcular es operativo
para calcular la información lateral de canal para el canal izquierdo como el canal original seleccionado utilizando el canal de mezclado descendente izquierdo,
para calcular la información lateral de canal para el canal derecho como el canal original seleccionado utilizando el canal de mezclado descendente derecho,
para calcular la información lateral de canal para el canal de suspensión periférica izquierdo como el canal original seleccionado utilizando el canal de mezclado descendente izquierdo, y
para calcular la información lateral de canal para el canal de suspensión periférica derecho como el canal original seleccionado utilizando el canal de mezclado descendente derecho.
7. Aparato según una cualquiera de las reivindicaciones 1 a 6,
en el que los canales originales incluyen un canal central,
que incluye además un combinador (14a) para combinar el primer canal de mezclado descendente y el segundo canal de mezclado descendente para obtener el canal de mezclado descendente combinado; y
en el que el medio para calcular la información lateral de canal para el canal central como el canal original seleccionado es operativo para calcular (14b) la información lateral de canal de manera que el canal de mezclado descendente combinado cuando se pondera utilizando la información lateral de canal da como resultado una aproximación del canal central original.
8. Aparato según una cualquiera de las reivindicaciones 1 a 6, en el que el medio (12) para proporcionar es operativo para derivar el primer canal de mezclado descendente y el segundo canal de mezclado descendente a partir de los canales originales utilizando una primera combinación ponderada lineal predeterminada para el primer canal de mezclado descendente y utilizando una segunda combinación ponderada lineal predeterminada para el segundo canal de mezclado descendente.
9. Aparato según la reivindicación 7, en el que la primera combinación ponderada lineal predeterminada se define como sigue:
Lc = t \cdot(L + a \cdot Ls + b \cdot C);
o
en el que la segunda combinación ponderada lineal predeterminada se define como sigue:
Rc = t \cdot(R + a \cdot Rs + b \cdot C),
en el que Lc es el primer canal de mezclado descendente, en el que Rc es el segundo canal de mezclado descendente, en el que t, a y b son factores de ponderación inferiores a 1, en el que L es un canal izquierdo original, en el que C es un canal central original, en el que R es un canal derecho original, en el que Ls es un canal de suspensión periférica izquierdo original y en el que Rs es un canal de suspensión periférica derecho original.
10. Aparato según una cualquiera de las reivindicaciones 1 a 8, en el que el medio (12) para proporcionar es operativo para recibir los canales de mezclado descendente primero y segundo suministrados externamente.
11. Aparato según una cualquiera de las reivindicaciones 1 a 10, en el que el primer canal de mezclado descendente y el segundo canal de mezclado descendente son canales compuestos estando compuestos de los canales originales en varios grados, en el que el medio para calcular es operativo, para utilizar, para calcular la información lateral de canal, el canal de mezclado descendente entre ambos canales de mezclado descendente, que se influye más fuertemente por el canal original seleccionado cuando se compara con el otro canal de mezclado descendente.
12. Aparato según una cualquiera de las reivindicaciones 1 a 11, en el que el medio (18) para generar es operativo para formar los datos de salida de manera que los datos de salida cumplen con una sintáxis de datos de salida para utilizarse por un decodificador de nivel bajo para procesar el primer canal de mezclado descendente o una señal derivada del primer canal de mezclado descendente o el segundo canal de mezclado descendente o una señal derivada del segundo canal de mezclado descendente para obtener una representación estéreo decodificada de la señal de audio multicanal.
13. Aparato según la reivindicación 12, en el que la sintáxis de datos de salida se trama de manera que la misma incluye un campo de datos especial para ignorarse por un decodificador de nivel bajo y en el que el medio para generar es operativo para insertar la información lateral de canal en el campo de datos especial.
14. Aparato según la reivindicación 13, en el que la sintáxis es la sintáxis mp3 y el campo de datos especial es un campo de datos auxiliar.
15. Aparato según una cualquiera de las reivindicaciones 12 a 14, en el que el medio (18) para generar es operativo para insertar la información lateral de canal en los datos de salida de manera que la información lateral de canal solo se utiliza por un decodificador de alto nivel pero se ignora por el decodificador de bajo nivel.
16. Aparato según una cualquiera de las reivindicaciones 2 a 15, que comprende además un codificador (16) para codificar el primer canal de mezclado descendente para obtener la señal derivada del primer canal de mezclado descendente o para codificar el segundo canal de mezclado descendente para obtener la señal derivada del segundo canal de mezclado descendente.
17. Aparato según la reivindicación 16, en el que el codificador (16) es un codificador perceptual que incluye medios para convertir una señal a codificarse en una representación espectral, medios para cuantificar la representación espectral utilizando un modelo psicoacústico y medios para codificar por entropía una representación espectral cuantificada para obtener una representación espectral cuantificada codificada por entropía como la señal derivada del primer canal de mezclado descendente o la señal derivada del segundo canal de mezclado descendente.
18. Aparato según la reivindicación 17, en el que el codificador (16) perceptual es un codificador según la capa III (mp3) de MPEG-1/2 o la codificación de audio avanzada MPEG-2/4 (AAC).
19. Aparato según una cualquiera de las reivindicaciones 1 a 18, en el que el medio (14) para calcular es operativo para calcular los valores de energía de mezclado descendente para el canal de mezclado descendente o el canal de mezclado descendente combinado,
para calcular un valor de energía original para el canal original seleccionado, y
para calcular un factor de ganancia como la información lateral de canal, derivándose el factor de ganancia a partir del valor de energía de mezclado descendente y del valor de energía original.
20. Aparato según una cualquiera de las reivindicaciones 1 a 19, en el que el medio (14) para calcular es operativo para calcular los parámetros de la información lateral de canal dependiente de la frecuencia, de manera que para una pluralidad de bandas de frecuencia, se obtiene una pluralidad de diferentes parámetros de información lateral de canal.
21. Método para procesar una señal de audio multicanal, teniendo la señal de audio multicanal al menos tres canales originales, que comprende:
proporcionar (12) un primer canal de mezclado descendente como un canal de mezclado descendente izquierdo y un segundo canal de mezclado descendente como un canal de mezclado descendente derecho, derivándose el primer y segundo canales de mezclado descendente de los canales originales de manera que los canales de mezclado descendente izquierdo y derecho, dan como resultado cuando se reproducen una representación estéreo de la señal de audio multicanal;
calcular (14) la información lateral de canal para un canal original seleccionado de las señales originales de manera que un canal de mezclado descendente o un canal de mezclado descendente combinado que incluye el primer y segundo canal de mezclado descendente, cuando se ponderan utilizando la información lateral de canal, dan como resultado una aproximación del canal original seleccionado; y
generar (18) los datos de salida, incluyendo los datos de salida la información lateral de canal.
22. Aparato para el procesamiento inverso de datos de entrada, incluyendo los datos de entrada información lateral de canal, un canal de mezclado descendente izquierdo o una señal derivada del canal de mezclado descendente izquierdo y un canal de mezclado descendente derecho o una señal derivada del canal de mezclado descendente derecho, en el que el canal de mezclado descendente izquierdo y el canal de mezclado descendente derecho se derivan de al menos tres canales originales de una señal de audio multicanal y dan como resultado cuando se reproducen una representación estéreo de la señal de audio multicanal y en el que la información lateral de canal se calcula de manera que un canal de mezclado descendente o un canal de mezclado descendente combinado que incluye el canal de mezclado descendente izquierdo y el canal de mezclado descendente derecho, cuando se ponderan utilizando la información lateral de canal, dan como resultando una aproximación del canal original seleccionado, comprendiendo el aparato:
un lector (24) de datos de entrada para leer los datos de entrada para obtener el canal de mezclado descendente izquierdo o una señal derivada del canal de mezclado descendente izquierdo y el canal de mezclado descendente derecho o una señal derivada del canal de mezclado descendente derecho y la información lateral de canal; y
un reconstructor (32) de canal para reconstruir la aproximación del canal original seleccionado utilizando la información lateral de canal y el canal de mezclado descendente o el canal de mezclado descendente combinado para obtener la aproximación del canal original seleccionado.
23. Aparato según la reivindicación 22, que comprende además un decodificador (24) perceptual para decodificar la señal derivada del canal de mezclado descendente izquierdo para obtener la versión decodificada del canal de mezclado descendente izquierdo y para decodificar la señal derivada del canal de mezclado descendente derecho para obtener una versión decodificada del canal de mezclado descendente derecho.
24. Aparato según la reivindicación 22 ó 23, que comprende además un combinador para combinar el canal de mezclado descendente izquierdo y el canal de mezclado descendente derecho para obtener el canal de mezclado descendente combinado.
25. Aparato según una de las reivindicaciones 22 a 24,
en el que la señal de audio original incluye un canal izquierdo, un canal de suspensión periférica izquierdo, un canal derecho, un canal de suspensión periférica derecho y un canal central y
en el que los datos de entrada incluyen la información lateral de canal para al menos tres del canal izquierdo, el canal de suspensión periférica izquierdo, el canal derecho, el canal de suspensión periférica derecho y el canal central,
en el que el reconstructor (32) de canal es operativo
para reconstruir una aproximación del canal izquierdo utilizando la información lateral de canal para el canal izquierdo y el canal de mezclado descendente izquierdo,
para reconstruir una aproximación para el canal de suspensión periférica izquierdo utilizando la información lateral de canal para el canal de suspensión periférica izquierdo y el canal de mezclado descendente izquierdo,
para reconstruir una aproximación para el canal derecho utilizando la información lateral de canal para el canal derecho y el canal de mezclado descendente derecho, y
para reconstruir una aproximación para el canal de suspensión periférica derecho utilizando la información lateral de canal para el canal de suspensión periférica derecho y el canal de mezclado descendente derecho.
26. Aparato según una cualquiera de las reivindicaciones 22 a 25, en el que el reconstructor de canal es operativo para reconstruir una aproximación para el canal central utilizando la información lateral de canal para el canal central y el canal de mezclado descendente combinado.
27. Método de procesamiento inverso de datos de entrada, incluyendo los datos de entrada la información lateral de canal, un canal de mezclado descendente izquierdo o una señal derivada del canal de mezclado descendente izquierdo y un canal de mezclado descendente derecho o una señal derivada del canal de mezclado descendente derecho, en el que el canal de mezclado descendente izquierdo y el canal de mezclado descendente derecho se derivan de al menos tres canales originales de una señal de audio multicanal y en el que la información lateral de canal se calcula de manera que un canal de mezclado descendente o un canal de mezclado descendente combinado incluyendo el canal de mezclado descendente izquierdo y el canal de mezclado descendente derecho, cuando se ponderan utilizan la información lateral de canal, dan como resultando una aproximación del canal original seleccionado, comprendiendo el método:
leer (24) los datos de entrada para obtener el canal de mezclado descendente izquierdo o una señal derivada del canal de mezclado descendente izquierdo y el canal de mezclado descendente derecho o una señal derivada del de mezclado descendente derecho y la información lateral de canal; y
reconstruir (32) la aproximación del canal original seleccionado utilizando la información lateral de canal y el canal de mezclado descendente o el canal de mezclado descendente combinado para obtener la aproximación del canal original seleccionado.
28. Programa informático que tiene un código de programa para llevar a cabo un método según la reivindicación 21 o la reivindicación 27, cuando se ejecuta en un ordenador.
ES04787072T 2003-10-02 2004-09-30 Codificacion/decodificacion multicanal compatible. Expired - Lifetime ES2278348T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US679085 1996-07-12
US10/679,085 US7447317B2 (en) 2003-10-02 2003-10-02 Compatible multi-channel coding/decoding by weighting the downmix channel

Publications (1)

Publication Number Publication Date
ES2278348T3 true ES2278348T3 (es) 2007-08-01

Family

ID=34394093

Family Applications (1)

Application Number Title Priority Date Filing Date
ES04787072T Expired - Lifetime ES2278348T3 (es) 2003-10-02 2004-09-30 Codificacion/decodificacion multicanal compatible.

Country Status (18)

Country Link
US (11) US7447317B2 (es)
EP (1) EP1668959B1 (es)
JP (1) JP4547380B2 (es)
KR (1) KR100737302B1 (es)
CN (1) CN1864436B (es)
AT (1) ATE350879T1 (es)
BR (5) BR122018069728B1 (es)
CA (1) CA2540851C (es)
DE (1) DE602004004168T2 (es)
DK (1) DK1668959T3 (es)
ES (1) ES2278348T3 (es)
HK (1) HK1092001A1 (es)
IL (1) IL174286A (es)
MX (1) MXPA06003627A (es)
NO (8) NO347074B1 (es)
PT (1) PT1668959E (es)
RU (1) RU2327304C2 (es)
WO (1) WO2005036925A2 (es)

Families Citing this family (155)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
US8605911B2 (en) 2001-07-10 2013-12-10 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
EP1423847B1 (en) 2001-11-29 2005-02-02 Coding Technologies AB Reconstruction of high frequency components
US7240001B2 (en) * 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
SE0202770D0 (sv) 2002-09-18 2002-09-18 Coding Technologies Sweden Ab Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks
KR20050116828A (ko) * 2003-03-24 2005-12-13 코닌클리케 필립스 일렉트로닉스 엔.브이. 다채널 신호를 나타내는 주 및 부 신호의 코딩
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
US7460990B2 (en) * 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
KR20070001139A (ko) * 2004-02-17 2007-01-03 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 분배 시스템, 오디오 인코더, 오디오 디코더 및이들의 동작 방법들
DE102004009628A1 (de) * 2004-02-27 2005-10-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Beschreiben einer Audio-CD und Audio-CD
CA2992097C (en) 2004-03-01 2018-09-11 Dolby Laboratories Licensing Corporation Reconstructing audio signals with multiple decorrelation techniques and differentially coded parameters
US20090299756A1 (en) * 2004-03-01 2009-12-03 Dolby Laboratories Licensing Corporation Ratio of speech to non-speech audio such as for elderly or hearing-impaired listeners
US7813513B2 (en) * 2004-04-05 2010-10-12 Koninklijke Philips Electronics N.V. Multi-channel encoder
DE602005006777D1 (de) * 2004-04-05 2008-06-26 Koninkl Philips Electronics Nv Mehrkanal-codierer
KR101183862B1 (ko) * 2004-04-05 2012-09-20 코닌클리케 필립스 일렉트로닉스 엔.브이. 스테레오 신호를 처리하기 위한 방법 및 디바이스, 인코더 장치, 디코더 장치 및 오디오 시스템
SE0400998D0 (sv) * 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Method for representing multi-channel audio signals
EP1914723B1 (en) * 2004-05-19 2010-07-07 Panasonic Corporation Audio signal encoder and audio signal decoder
US8843378B2 (en) * 2004-06-30 2014-09-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-channel synthesizer and method for generating a multi-channel output signal
CN1922655A (zh) * 2004-07-06 2007-02-28 松下电器产业株式会社 音频信号编码装置、音频信号解码装置、方法及程序
US7751804B2 (en) * 2004-07-23 2010-07-06 Wideorbit, Inc. Dynamic creation, selection, and scheduling of radio frequency communications
TWI393120B (zh) * 2004-08-25 2013-04-11 Dolby Lab Licensing Corp 用於音訊信號編碼及解碼之方法和系統、音訊信號編碼器、音訊信號解碼器、攜帶有位元流之電腦可讀取媒體、及儲存於電腦可讀取媒體上的電腦程式
JP4555299B2 (ja) * 2004-09-28 2010-09-29 パナソニック株式会社 スケーラブル符号化装置およびスケーラブル符号化方法
SE0402652D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Methods for improved performance of prediction based multi- channel reconstruction
EP1710799B1 (en) * 2005-02-01 2012-06-20 Panasonic Corporation Reproduction apparatus
EP1691348A1 (en) * 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametric joint-coding of audio sources
MX2007011915A (es) * 2005-03-30 2007-11-22 Koninkl Philips Electronics Nv Codificacion de audio multicanal.
MX2007011995A (es) * 2005-03-30 2007-12-07 Koninkl Philips Electronics Nv Codificacion y decodificacion de audio.
US7961890B2 (en) * 2005-04-15 2011-06-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung, E.V. Multi-channel hierarchical audio coding with compact side information
DE602006011600D1 (de) * 2005-04-28 2010-02-25 Panasonic Corp Audiocodierungseinrichtung und audiocodierungsverfahren
WO2006126843A2 (en) * 2005-05-26 2006-11-30 Lg Electronics Inc. Method and apparatus for decoding audio signal
US8170883B2 (en) * 2005-05-26 2012-05-01 Lg Electronics Inc. Method and apparatus for embedding spatial information and reproducing embedded signal for an audio signal
JP4988717B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
MX2007015118A (es) 2005-06-03 2008-02-14 Dolby Lab Licensing Corp Aparato y metodo para codificacion de senales de audio con instrucciones de decodificacion.
US8494667B2 (en) * 2005-06-30 2013-07-23 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
CA2613731C (en) * 2005-06-30 2012-09-18 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
EP1908057B1 (en) * 2005-06-30 2012-06-20 LG Electronics Inc. Method and apparatus for decoding an audio signal
US8626503B2 (en) * 2005-07-14 2014-01-07 Erik Gosuinus Petrus Schuijers Audio encoding and decoding
ATE433182T1 (de) * 2005-07-14 2009-06-15 Koninkl Philips Electronics Nv Audiokodierung und audiodekodierung
US7562021B2 (en) * 2005-07-15 2009-07-14 Microsoft Corporation Modification of codewords in dictionary used for efficient coding of digital media spectral data
US7630882B2 (en) * 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
US8160888B2 (en) 2005-07-19 2012-04-17 Koninklijke Philips Electronics N.V Generation of multi-channel audio signals
JP4568363B2 (ja) * 2005-08-30 2010-10-27 エルジー エレクトロニクス インコーポレイティド オーディオ信号デコーディング方法及びその装置
ATE455348T1 (de) * 2005-08-30 2010-01-15 Lg Electronics Inc Vorrichtung und verfahren zur dekodierung eines audiosignals
JP4859925B2 (ja) * 2005-08-30 2012-01-25 エルジー エレクトロニクス インコーポレイティド オーディオ信号デコーディング方法及びその装置
US7788107B2 (en) * 2005-08-30 2010-08-31 Lg Electronics Inc. Method for decoding an audio signal
EP1921606B1 (en) * 2005-09-02 2011-10-19 Panasonic Corporation Energy shaping device and energy shaping method
US20080255857A1 (en) * 2005-09-14 2008-10-16 Lg Electronics, Inc. Method and Apparatus for Decoding an Audio Signal
US20080221907A1 (en) * 2005-09-14 2008-09-11 Lg Electronics, Inc. Method and Apparatus for Decoding an Audio Signal
TWI462086B (zh) * 2005-09-14 2014-11-21 Lg Electronics Inc 音頻訊號之解碼方法及其裝置
JP2009518659A (ja) * 2005-09-27 2009-05-07 エルジー エレクトロニクス インコーポレイティド マルチチャネルオーディオ信号の符号化/復号化方法及び装置
JP5478826B2 (ja) * 2005-10-03 2014-04-23 シャープ株式会社 表示装置
CN101283249B (zh) * 2005-10-05 2013-12-04 Lg电子株式会社 信号处理的方法和装置以及编码和解码方法及其装置
US7696907B2 (en) 2005-10-05 2010-04-13 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
US7672379B2 (en) * 2005-10-05 2010-03-02 Lg Electronics Inc. Audio signal processing, encoding, and decoding
US7751485B2 (en) * 2005-10-05 2010-07-06 Lg Electronics Inc. Signal processing using pilot based coding
KR100878833B1 (ko) * 2005-10-05 2009-01-14 엘지전자 주식회사 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치
US7646319B2 (en) * 2005-10-05 2010-01-12 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
US7653533B2 (en) * 2005-10-24 2010-01-26 Lg Electronics Inc. Removing time delays in signal paths
KR100644715B1 (ko) * 2005-12-19 2006-11-10 삼성전자주식회사 능동적 오디오 매트릭스 디코딩 방법 및 장치
US8111830B2 (en) * 2005-12-19 2012-02-07 Samsung Electronics Co., Ltd. Method and apparatus to provide active audio matrix decoding based on the positions of speakers and a listener
WO2007080211A1 (en) * 2006-01-09 2007-07-19 Nokia Corporation Decoding of binaural audio signals
KR100803212B1 (ko) 2006-01-11 2008-02-14 삼성전자주식회사 스케일러블 채널 복호화 방법 및 장치
KR101218776B1 (ko) 2006-01-11 2013-01-18 삼성전자주식회사 다운믹스된 신호로부터 멀티채널 신호 생성방법 및 그 기록매체
US7752053B2 (en) 2006-01-13 2010-07-06 Lg Electronics Inc. Audio signal processing using pilot based coding
US8411869B2 (en) * 2006-01-19 2013-04-02 Lg Electronics Inc. Method and apparatus for processing a media signal
EP1974344A4 (en) * 2006-01-19 2011-06-08 Lg Electronics Inc METHOD AND APPARATUS FOR DECODING A SIGNAL
KR100878816B1 (ko) * 2006-02-07 2009-01-14 엘지전자 주식회사 부호화/복호화 장치 및 방법
US20090177479A1 (en) * 2006-02-09 2009-07-09 Lg Electronics Inc. Method for Encoding and Decoding Object-Based Audio Signal and Apparatus Thereof
DE602007004451D1 (de) 2006-02-21 2010-03-11 Koninkl Philips Electronics Nv Audiokodierung und audiodekodierung
KR100904437B1 (ko) * 2006-02-23 2009-06-24 엘지전자 주식회사 오디오 신호의 처리 방법 및 장치
KR100773560B1 (ko) 2006-03-06 2007-11-05 삼성전자주식회사 스테레오 신호 생성 방법 및 장치
KR100773562B1 (ko) * 2006-03-06 2007-11-07 삼성전자주식회사 스테레오 신호 생성 방법 및 장치
US8626515B2 (en) * 2006-03-30 2014-01-07 Lg Electronics Inc. Apparatus for processing media signal and method thereof
CN101361122B (zh) * 2006-04-03 2012-12-19 Lg电子株式会社 处理媒体信号的装置及其方法
US8027479B2 (en) 2006-06-02 2011-09-27 Coding Technologies Ab Binaural multi-channel decoder in the context of non-energy conserving upmix rules
ES2380059T3 (es) * 2006-07-07 2012-05-08 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y método para combinar múltiples fuentes de audio codificadas paramétricamente
KR101438387B1 (ko) 2006-07-12 2014-09-05 삼성전자주식회사 서라운드 확장 데이터 부호화 및 복호화 방법 및 장치
KR100763920B1 (ko) 2006-08-09 2007-10-05 삼성전자주식회사 멀티채널 신호를 모노 또는 스테레오 신호로 압축한 입력신호를 2채널의 바이노럴 신호로 복호화하는 방법 및 장치
US7907579B2 (en) * 2006-08-15 2011-03-15 Cisco Technology, Inc. WiFi geolocation from carrier-managed system geolocation of a dual mode device
US20080235006A1 (en) * 2006-08-18 2008-09-25 Lg Electronics, Inc. Method and Apparatus for Decoding an Audio Signal
US9319741B2 (en) 2006-09-07 2016-04-19 Rateze Remote Mgmt Llc Finding devices in an entertainment system
US8607281B2 (en) 2006-09-07 2013-12-10 Porto Vinci Ltd. Limited Liability Company Control of data presentation in multiple zones using a wireless home entertainment hub
US9386269B2 (en) 2006-09-07 2016-07-05 Rateze Remote Mgmt Llc Presentation of data on multiple display devices using a wireless hub
US9233301B2 (en) 2006-09-07 2016-01-12 Rateze Remote Mgmt Llc Control of data presentation from multiple sources using a wireless home entertainment hub
US20080061578A1 (en) * 2006-09-07 2008-03-13 Technology, Patents & Licensing, Inc. Data presentation in multiple zones using a wireless home entertainment hub
US8966545B2 (en) 2006-09-07 2015-02-24 Porto Vinci Ltd. Limited Liability Company Connecting a legacy device into a home entertainment system using a wireless home entertainment hub
US8935733B2 (en) * 2006-09-07 2015-01-13 Porto Vinci Ltd. Limited Liability Company Data presentation using a wireless home entertainment hub
US8005236B2 (en) * 2006-09-07 2011-08-23 Porto Vinci Ltd. Limited Liability Company Control of data presentation using a wireless home entertainment hub
JP5337941B2 (ja) * 2006-10-16 2013-11-06 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ マルチチャネル・パラメータ変換のための装置および方法
SG175632A1 (en) * 2006-10-16 2011-11-28 Dolby Sweden Ab Enhanced coding and parameter representation of multichannel downmixed object coding
KR100847453B1 (ko) * 2006-11-20 2008-07-21 주식회사 대우일렉트로닉스 입체 음향을 위한 적응 간섭 제거 방법
US8265941B2 (en) * 2006-12-07 2012-09-11 Lg Electronics Inc. Method and an apparatus for decoding an audio signal
CN101578656A (zh) * 2007-01-05 2009-11-11 Lg电子株式会社 用于处理音频信号的装置和方法
JP5291096B2 (ja) * 2007-06-08 2013-09-18 エルジー エレクトロニクス インコーポレイティド オーディオ信号処理方法及び装置
US7761290B2 (en) 2007-06-15 2010-07-20 Microsoft Corporation Flexible frequency and time partitioning in perceptual transform coding of audio
US8046214B2 (en) 2007-06-22 2011-10-25 Microsoft Corporation Low complexity decoder for complex transform coding of multi-channel sound
US7885819B2 (en) * 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
KR101464977B1 (ko) * 2007-10-01 2014-11-25 삼성전자주식회사 메모리 관리 방법, 및 멀티 채널 데이터의 복호화 방법 및장치
US8170218B2 (en) 2007-10-04 2012-05-01 Hurtado-Huyssen Antoine-Victor Multi-channel audio treatment system and method
CN101578655B (zh) * 2007-10-16 2013-06-05 松下电器产业株式会社 流合成装置、解码装置、方法
US8249883B2 (en) * 2007-10-26 2012-08-21 Microsoft Corporation Channel extension coding for multi-channel source
KR101438389B1 (ko) * 2007-11-15 2014-09-05 삼성전자주식회사 오디오 매트릭스 디코딩 방법 및 장치
WO2009066959A1 (en) 2007-11-21 2009-05-28 Lg Electronics Inc. A method and an apparatus for processing a signal
WO2009075510A1 (en) * 2007-12-09 2009-06-18 Lg Electronics Inc. A method and an apparatus for processing a signal
TWI424755B (zh) * 2008-01-11 2014-01-21 Dolby Lab Licensing Corp 矩陣解碼器
KR100998913B1 (ko) * 2008-01-23 2010-12-08 엘지전자 주식회사 오디오 신호의 처리 방법 및 이의 장치
EP2083584B1 (en) * 2008-01-23 2010-09-15 LG Electronics Inc. A method and an apparatus for processing an audio signal
US8615316B2 (en) * 2008-01-23 2013-12-24 Lg Electronics Inc. Method and an apparatus for processing an audio signal
WO2009116280A1 (ja) * 2008-03-19 2009-09-24 パナソニック株式会社 ステレオ信号符号化装置、ステレオ信号復号装置およびこれらの方法
KR101614160B1 (ko) 2008-07-16 2016-04-20 한국전자통신연구원 포스트 다운믹스 신호를 지원하는 다객체 오디오 부호화 장치 및 복호화 장치
EP2154911A1 (en) * 2008-08-13 2010-02-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. An apparatus for determining a spatial output multi-channel audio signal
KR101335975B1 (ko) * 2008-08-14 2013-12-04 돌비 레버러토리즈 라이쎈싱 코오포레이션 복수의 오디오 입력 신호를 리포맷팅하는 방법
EP2351024A1 (en) * 2008-10-01 2011-08-03 GVBB Holdings S.A.R.L Decoding apparatus, decoding method, encoding apparatus, encoding method, and editing apparatus
EP2175670A1 (en) 2008-10-07 2010-04-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Binaural rendering of a multi-channel audio signal
WO2010042024A1 (en) * 2008-10-10 2010-04-15 Telefonaktiebolaget Lm Ericsson (Publ) Energy conservative multi-channel audio coding
KR101513042B1 (ko) * 2008-12-02 2015-04-17 엘지전자 주식회사 신호 전송 방법 및 전송 장치
JP5309944B2 (ja) * 2008-12-11 2013-10-09 富士通株式会社 オーディオ復号装置、方法、及びプログラム
EP2380172B1 (en) 2009-01-16 2013-07-24 Dolby International AB Cross product enhanced harmonic transposition
US20100324915A1 (en) * 2009-06-23 2010-12-23 Electronic And Telecommunications Research Institute Encoding and decoding apparatuses for high quality multi-channel audio codec
US8774417B1 (en) * 2009-10-05 2014-07-08 Xfrm Incorporated Surround audio compatibility assessment
EP2323130A1 (en) * 2009-11-12 2011-05-18 Koninklijke Philips Electronics N.V. Parametric encoding and decoding
JP5604933B2 (ja) * 2010-03-30 2014-10-15 富士通株式会社 ダウンミクス装置およびダウンミクス方法
PL3779977T3 (pl) * 2010-04-13 2023-11-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Dekoder audio do przetwarzania audio stereo z wykorzystaniem zmiennego kierunku predykcji
DE102010015630B3 (de) * 2010-04-20 2011-06-01 Institut für Rundfunktechnik GmbH Verfahren zum Erzeugen eines abwärtskompatiblen Tonformates
MX2013010537A (es) * 2011-03-18 2014-03-21 Koninkl Philips Nv Codificador y decodificador de audio con funcionalidad de configuracion.
RU2618383C2 (ru) * 2011-11-01 2017-05-03 Конинклейке Филипс Н.В. Кодирование и декодирование аудиообъектов
US9131313B1 (en) * 2012-02-07 2015-09-08 Star Co. System and method for audio reproduction
EP2645748A1 (en) 2012-03-28 2013-10-02 Thomson Licensing Method and apparatus for decoding stereo loudspeaker signals from a higher-order Ambisonics audio signal
CN104364842A (zh) * 2012-04-18 2015-02-18 诺基亚公司 立体声音频信号编码器
US9288603B2 (en) 2012-07-15 2016-03-15 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for backward-compatible audio coding
US9473870B2 (en) 2012-07-16 2016-10-18 Qualcomm Incorporated Loudspeaker position compensation with 3D-audio hierarchical coding
US9516446B2 (en) 2012-07-20 2016-12-06 Qualcomm Incorporated Scalable downmix design for object-based surround codec with cluster analysis by synthesis
US9761229B2 (en) 2012-07-20 2017-09-12 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for audio object clustering
JP2015529415A (ja) * 2012-08-16 2015-10-05 タートル ビーチ コーポレーション 多次元的パラメトリック音声のシステムおよび方法
RU2676242C1 (ru) * 2013-01-29 2018-12-26 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Декодер для формирования аудиосигнала с улучшенной частотной характеристикой, способ декодирования, кодер для формирования кодированного сигнала и способ кодирования с использованием компактной дополнительной информации для выбора
US9818412B2 (en) 2013-05-24 2017-11-14 Dolby International Ab Methods for audio encoding and decoding, corresponding computer-readable media and corresponding audio encoder and decoder
CA3211308A1 (en) 2013-05-24 2014-11-27 Dolby International Ab Coding of audio scenes
US10499176B2 (en) 2013-05-29 2019-12-03 Qualcomm Incorporated Identifying codebooks to use when coding spatial components of a sound field
EP2830061A1 (en) 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
EP2830051A3 (en) * 2013-07-22 2015-03-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, methods and computer program using jointly encoded residual signals
TWI634547B (zh) 2013-09-12 2018-09-01 瑞典商杜比國際公司 在包含至少四音訊聲道的多聲道音訊系統中之解碼方法、解碼裝置、編碼方法以及編碼裝置以及包含電腦可讀取的媒體之電腦程式產品
EP2866227A1 (en) 2013-10-22 2015-04-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder
KR102160254B1 (ko) 2014-01-10 2020-09-25 삼성전자주식회사 액티브다운 믹스 방식을 이용한 입체 음향 재생 방법 및 장치
US9344825B2 (en) * 2014-01-29 2016-05-17 Tls Corp. At least one of intelligibility or loudness of an audio program
US9922656B2 (en) 2014-01-30 2018-03-20 Qualcomm Incorporated Transitioning of ambient higher-order ambisonic coefficients
US10770087B2 (en) 2014-05-16 2020-09-08 Qualcomm Incorporated Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals
CN104486033B (zh) * 2014-12-03 2017-09-29 重庆邮电大学 一种基于c‑ran平台的下行多模信道编码系统及方法
EP3067885A1 (en) * 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding a multi-channel signal
WO2016142002A1 (en) 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
EP3295687B1 (en) * 2015-05-14 2019-03-13 Dolby Laboratories Licensing Corporation Generation and playback of near-field audio content
PT3539127T (pt) * 2016-11-08 2020-12-04 Fraunhofer Ges Forschung Dispositivo de downmix e método para executar o downmix de pelo menos dois canais e codificador multicanal e descodificador multicanal
CN111034225B (zh) * 2017-08-17 2021-09-24 高迪奥实验室公司 使用立体混响信号的音频信号处理方法和装置
CN111615044B (zh) * 2019-02-25 2021-09-14 宏碁股份有限公司 声音信号的能量分布修正方法及其系统
CN113544774B (zh) * 2019-03-06 2024-08-20 弗劳恩霍夫应用研究促进协会 降混器及降混方法
US10779105B1 (en) 2019-05-31 2020-09-15 Apple Inc. Sending notification and multi-channel audio over channel limited link for independent gain control

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5040217A (en) * 1989-10-18 1991-08-13 At&T Bell Laboratories Perceptual coding of audio signals
EP0631458B1 (en) * 1993-06-22 2001-11-07 Deutsche Thomson-Brandt Gmbh Method for obtaining a multi-channel decoder matrix
DE69428939T2 (de) * 1993-06-22 2002-04-04 Deutsche Thomson-Brandt Gmbh Verfahren zur Erhaltung einer Mehrkanaldekodiermatrix
CA2124379C (en) 1993-06-25 1998-10-27 Thomas F. La Porta Distributed processing architecture for control of broadband and narrowband communications networks
DE4409368A1 (de) * 1994-03-18 1995-09-21 Fraunhofer Ges Forschung Verfahren zum Codieren mehrerer Audiosignale
JP3397001B2 (ja) * 1994-06-13 2003-04-14 ソニー株式会社 符号化方法及び装置、復号化装置、並びに記録媒体
EP0688113A2 (en) * 1994-06-13 1995-12-20 Sony Corporation Method and apparatus for encoding and decoding digital audio signals and apparatus for recording digital audio
EP1251501B1 (en) 1995-10-09 2004-09-08 Matsushita Electric Industrial Co., Ltd. An optical disk with an optical barcode and reproduction apparatus
JP3790550B2 (ja) 1996-02-08 2006-06-28 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴイ 5チャネル送信及び2チャネル送信に対応可能な7チャネル送信
US5812971A (en) * 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping
DE19628293C1 (de) * 1996-07-12 1997-12-11 Fraunhofer Ges Forschung Codieren und Decodieren von Audiosignalen unter Verwendung von Intensity-Stereo und Prädiktion
SG54379A1 (en) * 1996-10-24 1998-11-16 Sgs Thomson Microelectronics A Audio decoder with an adaptive frequency domain downmixer
US6449368B1 (en) * 1997-03-14 2002-09-10 Dolby Laboratories Licensing Corporation Multidirectional audio decoding
JP3657120B2 (ja) 1998-07-30 2005-06-08 株式会社アーニス・サウンド・テクノロジーズ 左,右両耳用のオーディオ信号を音像定位させるための処理方法
JP2000214887A (ja) * 1998-11-16 2000-08-04 Victor Co Of Japan Ltd 音声符号化装置、光記録媒体、音声復号装置、音声伝送方法及び伝送媒体
US6928169B1 (en) * 1998-12-24 2005-08-09 Bose Corporation Audio signal processing
US6442517B1 (en) * 2000-02-18 2002-08-27 First International Digital, Inc. Methods and system for encoding an audio sequence with synchronized data and outputting the same
JP4304401B2 (ja) * 2000-06-07 2009-07-29 ソニー株式会社 マルチチャンネルオーディオ再生装置
US20030035553A1 (en) 2001-08-10 2003-02-20 Frank Baumgarte Backwards-compatible perceptual coding of spatial cues
US7116787B2 (en) 2001-05-04 2006-10-03 Agere Systems Inc. Perceptual synthesis of auditory scenes
US7006636B2 (en) 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis
JP4062905B2 (ja) * 2001-10-24 2008-03-19 ヤマハ株式会社 ディジタル・ミキサ
US7333930B2 (en) * 2003-03-14 2008-02-19 Agere Systems Inc. Tonal analysis for perceptual audio coding using a compressed spectral representation
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
EP1817767B1 (en) * 2004-11-30 2015-11-11 Agere Systems Inc. Parametric coding of spatial audio with object-based side information

Also Published As

Publication number Publication date
NO342804B1 (no) 2018-08-06
NO20191058A1 (no) 2006-06-30
RU2006114742A (ru) 2007-11-20
US20190110146A1 (en) 2019-04-11
NO20180990A1 (no) 2006-06-30
US20180359588A1 (en) 2018-12-13
US7447317B2 (en) 2008-11-04
NO20180991A1 (no) 2006-06-30
US10237674B2 (en) 2019-03-19
NO345265B1 (no) 2020-11-23
US20190239018A1 (en) 2019-08-01
US20190379990A1 (en) 2019-12-12
NO344483B1 (no) 2020-01-13
RU2327304C2 (ru) 2008-06-20
US20130016843A1 (en) 2013-01-17
US10455344B2 (en) 2019-10-22
EP1668959A2 (en) 2006-06-14
DE602004004168D1 (de) 2007-02-15
IL174286A (en) 2010-12-30
HK1092001A1 (en) 2007-01-26
DE602004004168T2 (de) 2007-10-11
NO344760B1 (no) 2020-04-14
NO20180993A1 (no) 2006-06-30
US11343631B2 (en) 2022-05-24
JP4547380B2 (ja) 2010-09-22
KR100737302B1 (ko) 2007-07-09
BR122018069726B1 (pt) 2019-03-19
US10299058B2 (en) 2019-05-21
BR122018069728B1 (pt) 2019-03-19
CA2540851C (en) 2012-05-01
BR122018069731B1 (pt) 2019-07-09
US20050074127A1 (en) 2005-04-07
BR122018069730B1 (pt) 2019-03-19
JP2007507731A (ja) 2007-03-29
PT1668959E (pt) 2007-04-30
NO347074B1 (no) 2023-05-08
BRPI0414757B1 (pt) 2018-12-26
NO344093B1 (no) 2019-09-02
BRPI0414757A (pt) 2006-11-28
US9462404B2 (en) 2016-10-04
CN1864436A (zh) 2006-11-15
NO344635B1 (no) 2020-02-17
US10425757B2 (en) 2019-09-24
US20180359589A1 (en) 2018-12-13
NO20180980A1 (no) 2006-06-30
IL174286A0 (en) 2006-08-01
CA2540851A1 (en) 2005-04-21
KR20060060052A (ko) 2006-06-02
DK1668959T3 (da) 2007-04-10
US20090003612A1 (en) 2009-01-01
MXPA06003627A (es) 2006-06-05
EP1668959B1 (en) 2007-01-03
NO20200106A1 (no) 2006-06-30
US10206054B2 (en) 2019-02-12
NO20061898L (no) 2006-06-30
US20160078872A1 (en) 2016-03-17
WO2005036925A2 (en) 2005-04-21
ATE350879T1 (de) 2007-01-15
US8270618B2 (en) 2012-09-18
US20190239016A1 (en) 2019-08-01
US10165383B2 (en) 2018-12-25
NO344091B1 (no) 2019-09-02
WO2005036925A3 (en) 2005-07-14
US20190239017A1 (en) 2019-08-01
NO20180978A1 (no) 2006-06-30
AU2004306509A1 (en) 2005-04-21
CN1864436B (zh) 2011-05-11
US10433091B2 (en) 2019-10-01

Similar Documents

Publication Publication Date Title
ES2278348T3 (es) Codificacion/decodificacion multicanal compatible.
ES2306076T3 (es) Aparato y metodo para construir una señal de salida multicanal o para generar una señal de downmix.
AU2004306509B2 (en) Compatible multi-channel coding/decoding