ES2208297T3 - Generacion de matrices para codificacion y descodificacion sin perdidas de señales de audio multicanal. - Google Patents

Generacion de matrices para codificacion y descodificacion sin perdidas de señales de audio multicanal.

Info

Publication number
ES2208297T3
ES2208297T3 ES00917191T ES00917191T ES2208297T3 ES 2208297 T3 ES2208297 T3 ES 2208297T3 ES 00917191 T ES00917191 T ES 00917191T ES 00917191 T ES00917191 T ES 00917191T ES 2208297 T3 ES2208297 T3 ES 2208297T3
Authority
ES
Spain
Prior art keywords
channel
matrix
signal
signals
regressive
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
ES00917191T
Other languages
English (en)
Inventor
Peter Graham Craven
Malcolm James Law
John Robert Stuart
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby Laboratories Licensing Corp
Original Assignee
Dolby Laboratories Licensing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from GBGB9907919.6A external-priority patent/GB9907919D0/en
Priority claimed from GBGB9907918.8A external-priority patent/GB9907918D0/en
Application filed by Dolby Laboratories Licensing Corp filed Critical Dolby Laboratories Licensing Corp
Application granted granted Critical
Publication of ES2208297T3 publication Critical patent/ES2208297T3/es
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H20/00Arrangements for broadcast or for distribution combined with broadcast
    • H04H20/86Arrangements characterised by the broadcast information itself
    • H04H20/88Stereophonic broadcast systems
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00992Circuits for stereophonic or quadraphonic recording or reproducing
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00007Time or data compression or expansion
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00007Time or data compression or expansion
    • G11B2020/00014Time or data compression or expansion the compressed signal being an audio signal
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • G11B2020/10537Audio or video recording
    • G11B2020/10546Audio or video recording specifically adapted for audio data
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/20Disc-shaped record carriers
    • G11B2220/25Disc-shaped record carriers characterised in that the disc is based on a specific recording technology
    • G11B2220/2537Optical discs
    • G11B2220/2562DVDs [digital versatile discs]; Digital video discs; MMCDs; HDCDs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • General Physics & Mathematics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Algebra (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Stereophonic System (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

Un método de descodificación, que comprende: - obtener un número N de señales de canal de entrada; - transformar las señales de canal de entrada mediante una matriz, que es puesta en práctica como una cascada de cuantificadores de matriz primitiva para proporcionar un número N de señales de canal de salida de la matriz; y - ordenar el número N de señales de canal de salida descodificadas, que responden a las señales de canal de salida de la matriz, en respuesta a la información de ordenación de canal derivada de las señales del canal de entrada.

Description

Generación de matrices para codificación y descodificación sin pérdidas de señales de audio multicanal.
Campo de la invención
La invención de refiere a la codificación y descodificación de flujos de señales digitales, en particular flujos de audio digitales, con referencia al matrizado de señales múltiples.
Antecedentes de la invención
La compresión sin pérdida es en la actualidad un medio establecido para reducir el régimen de datos requeridos para almacenar o transmitir una señal de audio digital. Un método para reducir dicho régimen de datos de una señal multicanal es aplicar el matrizado de modo que la información dominante esté concentrada en alguno de los canales transmitidos, mientras que los otros canales portan relativamente poca información. Por ejemplo, una señal de audio de dos canales puede tener casi la misma forma de onda en los canales izquierdo y derecho si se transporta una imagen sonora central, en cuyo caso es más eficiente codificar la suma y diferencia de los dos canales. Este procedimiento se describe con algún detalle en el documento WO-A 96/37048, que incluye el uso de una cascada de "cuantificadores de matriz primitiva" para conseguir el matrizado de manera perfectamente invertible o sin pérdida.
El procedimiento descrito en el documento WO-A 96/37048 contempla también el uso de cuantificadores de matriz para aplicar una matriz a una señal digital original multicanal, con objeto de derivar señales digitales matrizadas que representan llegada de palabras, más adecuadas para escucha doméstica general. Estas señales matrizadas pueden ser registradas sobre un portador tal como un DVD, y el reproductor ordinario enviará simplemente cada señal matrizada a un altavoz. Sin embargo, el reproductor avanzado puede invertir el efecto de los cuantificadores de matriz, y reconstruir así la señal digital original con objeto de reproducirla de una manera alternativa.
En una aplicación comercial de DVD-Audio se requiere combinar los dos conceptos anteriores, de modo que un sistema de transmisión que utilice compresión sin pérdida pueda proporcionar también una señal matrizada y una señal original. En esta aplicación, la señal matrizada requerida tiene dos canales, mientras que la señal original tiene más de dos canales, por lo que debe ser proporcionada así información adicional para permitir que la señal multicanal sea recuperada; no obstante, la información adicional no debe imponer un exceso de carga para los descodificadores que deseen descodificar sólo la señal matrizada de dos canales.
En la actualidad, las señales de audio digitales son transmitidas frecuentemente con 24 bitios, y las microplaquetas populares de "Tratamiento de señal digital" (Digital Signal Processing = DSP) diseñadas para audio, tales como la serie Motorola 56000, manejan también fácilmente la palabra de 24 bitios. Sin embargo, el tratamiento descrito en el documento WO-A 96/37048 puede generar números que requieren una palabra de anchura mayor que la señal original. Dado que el uso del cálculo de "doble precisión" es de coste prohibitivo, se necesita un método para permitir que el tratamiento sea llevado a cabo sustancialmente sin que se requiera un aumento en la anchura de la palabra.
Finalmente el consumidor que ha adquirido un equipo diseñado para proporcionar reproducción sin pérdidas, le gustaría reasegurarse de que la señal recupera es en realidad sin pérdidas. Paridad convencional y comprobaciones CRC dentro de la corriente codificada mostrarán errores debido a la corrupción de datos dentro del flujo, pero no mostrarán los errores debido al matrizado u otro desajuste algorítmico entre un codificador y un descodificador.
Sumario de la invención
De acuerdo con un primer aspecto de la invención, se proporciona una flujo dividido en dos subflujos, el primero de ellos proporciona información relativa a una señal de "mezcla regresiva" obtenida mediante matrizado, y que contiene menos canales que una señal digital multicanal original, y el segundo subflujo proporciona información adicional que permite que la señal digital multicanal original sea recuperada sin pérdidas por un descodificador. En el contexto en que ambas subflujos sean transportados con el uso de compresión sin pérdidas, un descodificador que descodifique sólo la señal de mezcla regresiva necesita descomprimir sólo el primer subflujo, y puede por tanto utilizar menores recursos de cálculo que los requeridos para descodificar la señal digital multicanal.
En una variante de este primer aspecto, el primer subflujo puede ser reemplazado por una pluralidad de subflujos, lo que permite seleccionar una pluralidad de representaciones matrizadas diferentes. No obstante, de nuevo aquí, el último subflujo contendrá información adicional que permita que una señal digital, multicanal, original, y completa, sea reproducida sin pérdidas.
En una puesta en práctica preferida del primer aspecto, un codificador proporciona la señal de mezcla regresiva con el uso de una cascada de uno o más cuantificadores de matriz primitiva, cada uno de los cuales ejecuta una matriz de n por n, seguido de la selección de m canales requeridos para la mezcla regresiva.
Un descodificador multicanal tomará las señales de ambos subflujos, y aplicará una cascada de matrices primitivas inversas con objeto de recuperar la señal multicanal original. Esto podría ser considerado natural para ordenar los canales que son introducidos en la cascada del descodificador, de modo que los canales procedentes del primer subflujo sean colocados al principio. Sin embargo, esto puede dar por resultado una ordenación de canal incorrecta en la salida de la cascada del descodificador, de modo que preferiblemente, una permutación de canal es especificada por el codificador, y es ejecutada por el descodificador, para recuperar el orden de canal correcto.
Preferiblemente, cualquier truncamiento o redondeo dentro del matrizado debe ser calculado con el uso de oscilación. En este caso, para codificación sin pérdidas, la señal oscilatoria debe estar disponible para el descodificador con objeto de que pueda invertir los cálculos ejecutados por el codificador y recuperar así la señal original sin pérdidas. La oscilación puede ser calculada con el uso de un método de "autooscilador", como se contempla en el documento WO-A 96/37048: pero en el contexto de un esquema de compresión sin pérdidas, el autooscilador puede ser evitado mediante disposición de un generador de oscilación en el flujo codificado, que permita que el descodificador sincronice su procedimiento de oscilación con el que fue utilizado por el codificador.
Por tanto, de acuerdo con un segundo aspecto de la invención, se proporciona un sistema de compresión que incluye un generador de oscilación en el flujo de bitios codificado. El generador de oscilación es utilizado para sincronizar un generador de secuencia pseudoaleatoria en el descodificador con un generador funcionalmente idéntico en un codificador.
En una importante aplicación de la invención, la mezcla regresiva tiene dos canales, y es derivada más convenientemente mediante la aplicación de dos cuantificadores de matriz primitiva a la señal digital multicanal original. En realizaciones que ponen en práctica el segundo aspecto de la invención, la oscilación es requerida por cada cuantificador; además, debe disponerse oscilación diferente para los dos cuantificadores, y la función de distribución de probabilidad preferida (PDF) para cada oscilación es triangular. Un modo eficiente para proporcionar dos de dichas señales oscilatorias triangulares PDF (TPDF), citada aquí como "oscilación en rombo", es sumar y restar dos señales rectangulares independientes PDF (RPDF). Para más detalles y generalización a más canales, véase la publicación de R. Wannmaker, "Efficient Generation of Multichannel Dither Signals" (Generación eficiente de señales vibratorias de multicanal). AES 103rd Convention, New York, 1997, publicación previa núm. 4533.
De acuerdo con ello, en una puesta en práctica preferida del segundo aspecto, el codificador utiliza un único generador de secuencia para proporcionar dos señales vibratorias RPDF independientes, y la suma y diferencia de estas señales es utilizada para proporcionar la oscilación requerida por los dos cuantificadores de matriz primitiva utilizados para derivar una mezcla regresiva de dos canales.
El documento WO-A 96/37048 describe el uso de cuantificadores de matriz primitiva dentro de un sistema de compresión sin pérdidas, y anteriormente se ha citado aquí la puesta en práctica preferida del primer aspecto, que utiliza también cuantificadores de matriz primitiva para situar la información requerida para una señal de "mezcla regresiva" en un subflujo separado.
De acuerdo con ello, en un tercer aspecto de la invención se proporcionan codificadores y descodificadores que contienen cuantificadores de matriz primitiva libre, el codificador tiene una lógica que acepta una mezcla regresiva como una matriz de coeficientes, asigna un número de cuantificadores de matriz primitiva para proporcionar dicha mezcla regresiva, y opcionalmente asigna otro número para proporcionar un matrizado que reduzca el régimen de datos. El codificador proporciona una flujo que contiene las condiciones de los cuantificadores de matriz primitiva que se han de utilizar, y opcionalmente puede incluir la adición de oscilación. En una puesta en práctica preferida, la oscilación es generada como dos secuencias de oscilación RPDF, y el codificador especifica un coeficiente por cada secuencia de oscilación. El oscilador en rombo se puede obtener así por especificación de dos coeficientes del mismo signo, en el caso de un primer cuantificador de matriz primitiva, y dos coeficientes de signo opuesto en el caso de un segundo cuantificador de matriz primitiva.
En una puesta en práctica o implementación elemental del tercer aspecto, las matrices primitivas son elegidas de modo que las señales de mezcla descendente sean transmitidas directamente en el primer subflujo. Sin embargo, esto puede no resultar óptimo por varias razones. Considerando los n canales de un subespacio multicanal, que definen un espacio de vector n-dimensional, las señales que resultan en una salida no cero de una mezcla regresiva formarán un subespacio. Si la mezcla regresiva tiene m-canales, el subespacio será por lo general también de dimensión m. Las señales del primer subflujo deben entonces transportar el subespacio m-dimensional óptimamente, lo que puede requerir que sus canales transmitidos sean una representación matricial de los canales de mezcla regresiva. Estas facilidades de matrizado son necesarias en general incluso por un descodificador diseñado para recuperar sólo señales de mezcla regresiva.
Las señales de audio son transportadas normalmente con el uso como máximo de 24 bitios, y en un sistema de reproducción sin pérdida tal como el Meridian Lossless Packing® (MLP) se garantiza que la salida no excederá a 24 bitios, debido a que la entrada original no es superior a 24 bitios. Una descripción del MLP puede ser obtenida en las condiciones del disco DVD sólo de lectura, parte 4: Condiciones de audio, paquete PCM, Información de Referencia MLP, Versión 1.0 Marzo de 1999, y en el documento WO-A 96/37048. En el caso de la mezcla regresiva, el nivel de salida es definido por la matriz en el descodificador. En principio, se pueden convertir a escala los coeficientes de la matriz, de modo que la salida nunca pueda exceder al umbral de saturación definido por una palabra de 24 bitios, pero en la práctica esto da por resultado un nivel de salida inaceptablemente bajo. Además, no es aceptable para el codificador limitar o recortar las señales de la mezcla regresiva, ya que esto no puede ser hecho sin afectar a la señal multicanal reconstruida, que entonces no sería sin pérdida. Un nivel de salida que exceda al umbral de saturación es citado aquí como "sobrecarga". Una sobrecarga ocasional de la señal de la mezcla regresiva es considerada aceptable, excepto que la sobrecarga digital, si se permite su "acortamiento arrollado", es extremadamente rechazable. La consecuencia de acortamiento arrollado se expone más adelante con más detalle. Por tanto, en una implementación preferida del primer aspecto de la invención, un descodificador que descodifique una señal de mezcla regresiva tiene facilidades de limitación de recorte o similar, después del cálculo de la matriz, de modo que los efectos de la sobrecarga no sean rechazables.
Otra consecuencia del uso tradicional de 24 bitios en las señales de audio de alta calidad es la disponibilidad de microplaquetas de tratamiento DSP con anchura de palabra interior de 24 bitios. Cada cuantificador de matriz primitiva, como se describe en el documento WO-A 96/37048 modifica un canal de una señal multicanal por adición de proporciones de los otros canales. Dicho cuantificador de matriz primitiva tiene una ganancia de paso directo de una unidad. En un cuarto aspecto, la invención proporciona un cuantificador de matriz primitiva que acepta un coeficiente de ganancia para el canal modificado, y tiene un camino de datos adicional conocido como desviación de lsb_ (desviación de bitio menos significativo, lsb, less significative bit). La ganancia puede establecerse en un valor inferior a la unidad, con objeto de evitar la sobrecarga. La salida cuantificada del cuantificador de matriz primitiva contendrá entonces menos información que su entrada, con la información restante contenida en bitios menos significativos adicionales (LSBs), que son generados por aplicación del coeficiente de ganancia. Algunos o todos estos LSBs son transmitidos luego separadamente a través del camino de datos desviación de lsb. En particular, en el caso de un coeficiente de ganancia de \pm1/2, es generado un único LSB, que puede ser transportados a través de la desviación de LSB.
En un quinto aspecto de la invención, que proporciona una característica de "comprob_sin pérdida", es calculado un valor de comprobación sobre la entrada de multicanal al codificador, que es transportado en el flujo codificado. El descodificador calcula un valor de comprobación similar a partir de la salida descodificada, y lo compara con el valor de comprobación transportado dentro del flujo, típicamente para proporcionar una indicación visual tal como una luz de "Sin pérdida", que indica al oyente que la reproducción es realmente sin pérdida. En el caso de una flujo con una mezcla regresiva de acuerdo con el primer aspecto de la invención, la mezcla regresiva no es una reproducción sin pérdida de una señal original. No obstante, si una oscilación sincronizada es proporcionada en el descodificador de acuerdo con el segundo aspecto, y si el matrizado del descodificador es descrito con precisión, tal como por ejemplo, los cuantificadores de matriz de acuerdo con el tercer aspecto de la invención, entonces la reproducción de la mezcla regresiva es completamente determinista, y puede ser simulada en el codificador y escuchada por un ingeniero o productor especialistas. Por tanto, el codificador puede calcular un valor comprobado sobre la mezcla regresiva simulada, y esta palabra puede ser comprobada por el descodificador, confirmando así la reproducción sin pérdida de la misma mezcla regresiva que fue escuchada o estaba disponible para la audición en el procedimiento de codificación.
Un codificador que incorpore, por ejemplo, el "precuantificador" descrito en la publicación de P.G. Craven y J.R. Stuart, "Cascadable lossy data compression using a Lossless Kernel", en la Revista Audio Eng. Soc. Abstracts, Marzo de 1997, vol. 45 núm. 5, pág. 404, publicación preliminar núm. 4416 citada aquí como "AES 1997", y que puede por tanto alterar la señal multicanal original antes de la codificación, tiene una elección en el cálculo del valor comprobado. Si calcula el valor de comprobación a partir de la señal original, una indicación de reproducción sin pérdida tal como la "luz de sin pérdida" en un descodificador no se iluminará durante los pasajes que han sido alterados. Una alternativa es hacer a la señal alterada disponible para la audición como parte del procedimiento de codificación, y calcular el valor comprobado a partir de la señal alterada. Esto es compatible con el caso de mezcla regresiva: en ambas situaciones la luz de sin pérdida indica la reproducción sin pérdida de una señal que estaba disponible para la audición en la etapa de codificación.
En una puesta en práctica preferida, el valor de comprobación es una palabra de comprobación de paridad, que es calculada sobre todos los canales. En una realización que incorpora el primer aspecto de la invención, el primer subflujo que contiene una palabra de comprobación de paridad que es calculada a partir de la mezcla regresiva simulada, antes de cualquier modificación tal como recorte, es aplicada para evitar la sobrecarga, mientras que el segundo subflujo contiene una palabra de control de paridad calculada a partir de la señal de multicanal completa. Antes de calcular la paridad, la palabra que representa cada valor de canal es girada un número de bitios igual al número de canal, de modo que un error que afecte a dos canales idénticos tiene una alta probabilidad de ser detectado.
A través de esta memoria descriptiva, se hace referencia más particular a la codificación de procedimientos que registran una flujo codificado sobre un medio de almacenamiento, tal como un DVD, y a procedimientos de descodificación que recuperan el flujo codificado desde dicho medio de almacenamiento. Se entiende, no obstante, que los codificadores puestos en práctica de acuerdo con la invención pueden ser utilizados para enviar flujos codificados con el uso esencialmente de cualquier medio de transmisión, que incluyen bandas de base o caminos de comunicación modulada a través del espectro, desde frecuencias supersónicas a ultravioletas, o pueden ser utilizados para registrar flujos codificados sobre medios de almacenamiento con el uso esencialmente de cualquier tecnología de grabación, incluidas técnicas magnéticas y ópticas. De igual modo, descodificadores puestos en práctica de acuerdo con la invención pueden ser utilizados para flujos codificados obtenidos de dichos medios.
Breve descripción de los dibujos
Seguidamente se describirán ejemplos de la presente invención con referencia a los dibujos que se acompañan, en los que:
-la fig. 1 es una vista general de un codificador de seis canales sin pérdidas, que comprende una matriz que es utilizada para codificar los canales matrizados en dos subflujos, que luego son empacados en un único flujo y registrado en DVD;
-la fig. 2 muestra un descodificador de canal que descodifica las dos subflujos producidos por el codificador de la fig. 1, para proporcionar una reconstrucción sin pérdida de los seis canales originales;
-la fig. 3 muestra un descodificador de dos canales que descodifica sólo el primer subflujo, para proporcionar una mezcla regresiva de dos canales;
-la fig. 4a muestra una cascada de dos cuantificadores de matriz primitiva modificando dos canales de señales de cuatro canales;
-la fig. 4b muestra una cascada similar de dos cuantificadores de matriz primitiva, configurada para invertir el tratamiento de la fig. 4a;
-la fig. 5a muestra un cuantificador de matriz primitiva que incorpora un oscilador;
-la fig. 5b muestra un cuantificador de matriz primitiva inversa que incorpora un oscilador;
-la fig. 6a muestra un cuantificador de matriz primitiva modificado para proporcionar una disposición de "desviación de LSB", y separar la transmisión desviada en el caso de cualquier tratamiento ulterior sin pérdida;
-la fig. 6b es complementaria de la fig. 6a, y muestra la transmisión separada del LSB desviado en el caso de cualquier tratamiento sin pérdida inverso, y un cuantificador de matriz primitiva que integra el LSB desviado y que reconstituye la señal original;
-la fig. 7a muestra un esquema de bloques de una parte de una realización de un codificador MLP con desviación de LSB;
-la fig. 7b muestra una realización de un descodificador complementario del codificador de la fig. 7a;
-la fig. 8 muestra un cuantificador de matriz primitiva que está especificado para uso en una realización de un descodificador de sistema MLP;
-la fig. 9 muestra un codificador sin pérdida precedido por un precuantificador, con una salida para audición y un valor de "comprobación sin pérdida" calculado a partir de la salida precuantificada;
-la fig. 10 muestra un aparato para codificar muestras de señal con régimen marcado de 48 kHz y 96 kHz, que comprende un codificador sin pérdida precedido por un muestreador.
Descripción detallada de la invención Codificación y descodificación de mezcla regresiva
El artículo "Lossless Coding for Audio Discs" (Codificación sin pérdidas para discos de audio), de la Revista Audio Eng. Soc., Septiembre 1996, vol. 44, núm. 9, págs. 706 a 720, y la solicitud de patente internacional WO-A 96/37048, contienen exposiciones de algunos de los principios utilizados en la compresión sin pérdidas.
Una aplicación comercial importante de la compresión sin pérdidas es en DVD-Audio, donde hay dos clases de reproductores: el reproductor de multicanal que proporciona 6 salidas utilizadas típicamente para excitar un trazado de altavoces de "5.1", y el reproductor de dos canales, que proporciona dos salidas para oyentes con dos altavoces, o para uso portátil con auriculares.
Por tanto, el DVD-Audio tiene la capacidad de portar una señal audio grabada dos veces, una como señal multicanal, y de nuevo como señal de dos canales. Sin embargo, el transporte de la señal doble tiene implicaciones adversas en el momento de la reproducción. En muchos casos, la grabación original es presentada sólo como señal multicanal, y a los dos canales de oyente se les da una mezcla regresiva derivada del multicanal principal.
Si la señal de audio registrada es portada como muestras convencionales de modulación de código de impulsos (PCM), el disco puede portar ventajosamente la grabación multicanal más coeficientes de mezcla regresiva, que permiten al reproductor derivar una mezcla regresiva de dos canales como una combinación lineal de los canales de las señales de multicanal. Por ejemplo, una mezcla regresiva consistente en los dos canales L_{0} y R_{0} podría ser calculada a partir de una señal de multicanal que contenga canales frontal-izquierdo, frontal-derecho, circundante-izquierdo, circundante-derecho, central, y de efectos de baja frecuencia, indicados con L_{f}, R_{f}, L_{s}, R_{s}, C, y L_{fe}, respectivamente, con el uso de la ecuación matriz:
1
El cálculo de la mezcla regresiva dentro del reproductor es, no obstante, menos atractiva cuando es utilizada compresión sin pérdida. Todos los seis canales de la señal multicanal deben ser descodificados antes de que la ecuación matriz anterior pueda ser aplicada, y el cálculo general de descodificación de seis canales es excesivo en este contexto.
Un ejemplo de solución a este problema se muestra en las figs. 1, 2, y 3. En la fig. 1, la señal multicanal presentada al descodificador es enviada a la "Matriz 1", en este caso una matriz de 6 x 6, cuyas salidas m_{0} ... m_{5} están divididas en dos subconjuntos {m_{0}, m_{1}} y {m_{2}, m_{3}, m_{4}, m_{5}}. Estos subconjuntos son luego codificados por el "Núcleo codificador 0" y "Núcleo codificador 1", en dos subflujos separados designados como "subflujo 0" y "subflujo 1". Cada subflujo es enviado luego a través de la memoria intermedia FIFO (primero en entrar, primero en salir), y los subflujos son combinados en el "empaquetador" para producir un flujo de salida compuesto, que puede estar sobre un medio tal como un DVD, como se muestra en la figura. La razón de usar una memoria intermedia FIFO se expone en la patente de EE.UU. núm. 6.023.233, y se ilustra en la publicación de M.A. Gerzon, P.V. Craven, J.R. Stuart, M.J. Law, y R.J. Wilson "The MLP Lossless Compression System" (El sistema de compresión sin pérdida MLP) presentada en la 17ª Conferencia Internacional sobre Codificación de Audio de Alta Calidad, Florencia, Septiembre de 1998, citada aquí como "AES 1998".
Para reproducir la señal multicanal codificada por el codificador mostrado en la fig. 1, se utiliza un descodificador tal como el mostrado en la fig. 2. En este descodificador, un "desempaquetador" recibe un flujo codificado procedente de un medio de transmisión o de almacenamiento tal como un DVD, como se ilustra, reconoce la corrección del flujo codificado, y lo separa en dos subflujos. Cada subflujo es pasado a través de una memoria intermedia FIFO y de un "núcleo descodificador" con objeto de proporcionar las señales m_{0}... m_{5}. Estas señales son pasadas luego a través de la inversa de la Matriz 1 con objeto de proporcionar la señal multicanal original.
Para reproducir una mezcla regresiva de dos canales, se utiliza un descodificador como el ilustrado en la fig. 3. Aquí, las subflujos son separados, pero sólo el subflujo 0 es retenido, registrado momentáneamente, y descodificado, para proporcionar las señales m_{0} y m_{1}. Desde éstas, la Matriz 0 deriva las deseadas señales L_{0} y R_{0}, suponiendo que el descoficador haya colocado la información correcta en m_{0} y m_{1} para que esto sea posible. Por ejemplo, si las dos filas superiores de la Matriz 1 en el codificador de la fig. 1 contienen coeficientes de mezcla descendente, tal como los de la matriz de 2 x 6 mostrados anteriormente, las señales m_{0} y m_{1} serán las señales de la mezcla regresiva requeridas L_{0} y R_{0}. En este caso, la Matriz 0 de la fig. 3 es redundante, y puede ser reemplazada por la matriz de identidad u omitida.
Una característica distintiva de la presente invención es que puede ser sin pérdida de principio a fin, de modo que la señal de salida multicanal obtenida del descodificador de la fig. 2 sea idéntica bitio por bitio a la señal de entrada proporcionada al codificador de la fig. 1. Por tanto, los núcleos codificador y descodificador, si están presentes, deben ser sin pérdida, y se requiere también que la Matriz 1 y su inversa sean también sin pérdida. Los núcleos del codificador y descodificador sin pérdida pueden ser puestos en práctica esencialmente de cualquier manera que proporcione codificación sin pérdida, pero en realizaciones preferidas, estos procedimientos son puestos en práctica de acuerdo con los que se describen en el documento WO-A 96/37048. Consideraciones en cuanto a dicha puesta en práctica se exponen en detalle más adelante.
Esta característica distintiva de codificación sin pérdida permite que un DVD u otro medio transporte y codifique un flujo de forma que permita la recuperación sin pérdida de una señal multicanal original, y permite también la recuperación sencilla de una representación matrizada o mezcla regresiva de la señal original, con el uso esencialmente del mismo espacio de almacenamiento o anchura de banda que de otro modo se requeriría para transportar sólo la señal multicanal original. En realizaciones prácticas, el espacio de almacenamiento requerido o anchura de banda de una señal comprimida sin pérdida que incorpora una mezcla regresiva, puede ser muy ligeramente mayor que el requerido por la señal multicanal comprimida sola, debido a la información adicional transportada en el flujo codificado que necesita el descodificador para invertir la mezcla regresiva, y debido al hecho de que los PMQs utilizados para codificar la mezcla regresiva no están disponibles para optimizar el procedimiento de codificación.
Un método para ejecutar el matrizado sin pérdida es mediante el uso de una cascada de cuantificadores de matriz primitiva (PMQs), que se describen como "matrices primitivas" en el documento WO-A-96/37048. Estas PMQs son matrices que se utilizan para modificar la señal en un canal, con el uso de valores de señal obtenidos de otros canales, de manera que sea invertible. En particular, el documento WO-A 96/37048 describe cómo puede ser ejecutado el matrizado inverso sin pérdida por inversión del efecto de cada cuantificador en orden inverso. Esto se ilustra en la fig. 4a, que muestra dos PMQs en cascada para uso en un codificador, y la fig. 4b muestra los dos PMQs inversos en orden opuesto. En situaciones sencillas en las que hay, en particular, sólo dos cuantificadores de matriz primitiva, las señales S1, S2, S3, y S4 pueden ser identificadas con canales originales tales como L_{f}, R_{f}, L_{5}, R_{5}, etc., y las señales modificadas S1' y S2' pueden ser identificadas con L_{0} y R_{0}, o con las señales m_{0} y m_{1}.
Para verificar la reconstrucción bitio por bitio de la señal original, obsérvese que el cuantificador Q_{2} de la fig. 4b es alimentado con la misma señal que el cuantificador Q_{2} en la fig. 4a. Suponiendo que son idénticos, producen por tanto la misma salida q_{2}. En la fig. 4a, la señal S2' es formada como S2' = S2 - q_{2}, mientras que la fig. 4 ejecuta la restauración S2 = S2' + q_{2}. Con S2 así restaurado, el cuantificador Q_{1} de la fig. 4b es alimentado con la misma señal que el cuantificador Q_{1} de la fig. 4a, y la señal S1 es restablecida de manera similar a como es restablecida S2.
Los cuantificadores Q_{1} y Q_{2} son necesarios con objeto de evitar que la longitud de la palabra de las señales modificadas S1' y S2' excedan a la de las señales de entrada S1 y S2, de modo que el contenido de información no aumente.
La fig. 4 muestra justamente cuatro canales a efectos de sencillez, pero se apreciará cómo puede ser aplicado este principio a cualquier número de canales, y cómo un número mayor de PMQs puede ser utilizado en cascada. Cada PMQ modifica justamente un canal de audio, y en la fig. 4 sólo son modificados los primeros dos canales. En la práctica, cualquiera o todos los canales pueden ser modificados, y no hay restricción en el orden o prohibición de que un canal dado sea modificado más de una vez. En el caso de mezcla regresiva de dos canales, sería normal que sean modificados al menos los primeros dos canales.
Se verá que cada PMQ en la fig. 4 tiene una ganancia de unidad para el canal que modifica. No es posible sintetizar la matriz más general procedente de una cascada de dichos PMQs. El documento WO-A 96/37048 explica que el conjunto se limita a matrices que tengan un determinante igual a uno. En el caso general, es necesario convertir a escala las ecuaciones de mezcla regresiva, con objeto de obtener un determinante que tenga una magnitud de unidad. Por ejemplo, en el caso de las ecuaciones de mezcla regresiva mostradas anteriormente, deben ser convertidas a escala 3/4, de modo que la Matriz 1 en el codificador será:
2
mientras que la Matriz 0 en el descodificador de dos canales pone en práctica la conversión a escala:
3
Es evidente que la matriz 0 no puede ser puesta en práctica como una cascada de PMQs, debido a que su determinante no tiene una magnitud de unidad. Esto no es un problema, ya que la Matriz 0 no se requiere para proporcionar reconstrucción sin pérdida de una señal original. Una arquitectura que permite a un descodificador de dos canales implementar una Matriz 0, ya sea como cascada estricta de PMQs para descodificar sin pérdida una señal original de dos canales, o como una matriz más general para aplicaciones de mezcla regresiva, se muestra en la fig. 8 y se describe más adelante.
Para calcular los coeficientes para los PMQs que forman la Matriz 0, puede ser adoptado el siguiente procedimiento. Por mezcla regresiva se indica la matriz de coeficientes de mezcla regresiva; por ejemplo, en el caso antes considerado tendremos:
4
Entonces, para j = 1 ... 6 se calcula
Coef_{1,j}= \frac{Mez.regre. _{1,j}}{Mez.regre. _{1,1}}
luego se calcula
Coef_{2,1}= \ - \ \frac{Mez.regre. _{2,1}}{coef_{1,2}mezc.regre_{2,1} \ - \ mezc.regre_{2,2}}
y luego para j = 3 ... 6 se calcula
coef_{2,1} = \ - \ \frac{Mez.regr_{2,j}}{coef_{1,2}mezc.regre_{2,1} \ - \ mezc.regr_{2,2}} \ - \ coef_{2,1}coef_{1j}
Los coeficientes m_coef en las figs. 4a y 4b para i j vienen dados por la expresión:
m-coef \ [i, j] = \ - \ coef_{i. .j}
donde el signo menos surge debido a la resta en la fig. 4a.
En el descodificador multicanal de la fig. 2, la Matriz 1 inversa puede ser puesta en práctica como en la fig. 4, con el uso de los mismos valores m_coef [i, j] que en el codificador, pero con el orden invertido de PMQs y con la resta en cada PMQ codificado reemplazada por una suma, como se muestra. Nótese que las entradas m_{0} ... m_{5} a la cascada de los PMQs son derivadas en este caso de dos subflujos.
Aunque la invención hasta aquí descrita es particularmente relevante en el contexto de la compresión, es aplicable en general y no se limita a sistemas de compresión. Igualmente, el principio antes descrito no se limita a dos subflujos. Por ejemplo, con el uso de tres subflujos, una señal de nueve canales puede ser transportada sin pérdida, con la información requerida para descodificar una mezcla regresiva de seis canales portada en los primeros dos subflujos, y la información requerida pata descodificar una mezcla regresiva de dos canales (como combinación lineal de los seis canales) portada sólo en el primer subflujo.
En aplicaciones comerciales actuales, la matriz que define las señales L_{0}, R_{0} de mezcla regresiva en términos de L_{f}, R_{f}, L_{s}, R_{s}, C, y L_{fe}, tendrá en general los mayores coeficientes multiplicadores de L_{f} y R_{f}, como en el caso del ejemplo anterior. No obstante, esta situación no puede ser garantizada debido a que los coeficientes dominantes pueden multiplicar algunas de las otras señales. Si los coeficientes de L_{f} y de R_{f} son verdaderamente pequeños, el requerimiento de que un PMQ tenga una ganancia de unidad para el canal que modifica introduce un problema debido a que uno o más de otros canales deben ser convertidos a escala de acuerdo con ello. Si una conversión a escala sencilla, como antes se ha mostrado, es utilizada para hacer frente a este problema, otros coeficientes de la matriz excederán a la unidad, y como resultado puede producirse una sobrecarga u otros problemas.
A este problema puede hacerse frente por medio de una permutación de los canales en el codificador, de modo que por ejemplo, un "primer" canal cuyo coeficiente en L_{0} es mayor, podría ser puesto al comienzo de la secuencia, y un "segundo" canal cuyo coeficiente en R_{0} es mayor es puesto en segundo lugar. En este ejemplo, se supone que los canales primero y segundo no son iguales. Esta reordenación hace posible por lo general para el codificador proporcionar las señales matrizadas m_{0} y m_{1}, que son proporcionales a L_{0} y R_{0} mediante el uso de dos PMQs cuyos coeficientes no excedan sustancialmente a la unidad, para modificar los primeros dos canales.
Con dicha permutación en el codificador, el descodificador multicanal de la fig. 2 requerirá una permutación inversa, con objeto de reproducir las señales en el orden correcto. El reacoplamiento de los canales de salida está dispuesto en un descodificador MLP, instruido por la información asign_can en el flujo codificado. En el caso de que el codificador utilice una permutación, puede instruir al descodificador para aplicar la permutación inversa, mediante la especificación del reacoplamiento apropiado.
\newpage
La permutación inversa es aplicada después del matrizado del descodificador, si el codificador aplica una permutación antes del matrizado. Otra posibilidad sería aplicar la permutación en el descodificador antes del matrizado, si la permutación es aplicada en el codificador después del matrizado. Adicionalmente, sería posible para un descodificador de un flujo MLP aplicar la permutación antes del matrizado, si los coeficientes de la matriz son también permutados.
Hay ciertas condiciones improbables pero posibles de mezcla regresiva, que no son tratadas por las estrategias antes expuestas. Una posibilidad es que L_{0} y R_{0} puedan tener coeficientes que sean iguales o casi iguales, o dicho en otros términos, que la mezcla regresiva sea mono o casi mono. En esta situación, el procedimiento expuesto es insatisfactorio debido a que el denominador de la expresión coef_{2,1} se hace cero o casi cero, de lo que resultan coeficientes grandes y alta probabilidad de sobrecarga. Este problema puede ser resuelto por elección de m_{0} y m_{1} diferentemente. En cuanto a considerar las señales como elementos de un espacio vector, las señales L_{0} y R_{0} abarcarán un subespacio bidimensional del espacio de vector Euclídeo de 6 dimensiones, o en general un espacio de vector Euclídeo de n dimensiones, del que los canales de la señal multicanal forman una base ortonormal. Las señales m_{0} y m_{1} deben abarcar este subespacio si L_{0} y R_{0} han de ser reconstruidas. Es razonable elegir m_{0} y m_{1} de modo que sean ortogonales o aproximadamente ortogonales entre sí, en el subespacio abarcado por L_{0} y R_{0}. Habiendo determinado m_{0} en términos de canales de entrada, estos canales pueden ser permutados antes de la matriz, de modo que el canal cuyo coeficiente en m_{0} es mayor, o sustancialmente mayor, venga primero. Luego es calculado un PMQ como antes, de modo que el primer canal transmitido es una versión convertida a escala del valor deseado de m_{0}. Entonces es necesario calcular un PMQ para proporcionar una versión convertida a escala de m_{1}. De nuevo, una permutación previa puede ser deseable con objeto de reducir al mínimo la magnitud de los coeficientes. Esta permutación de las señales que han de ser matrizadas es semejante al procedimiento de "pivotación parcial" conocido por los expertos en la técnica de los cálculos de matriz, y no será descrito aquí con más detalle. Inicialmente, a m_{0} y m_{1} puede dárselos una conversión a escala arbitraria. Luego, el procedimiento anterior para la determinación del coeficiente puede ser utilizado por reemplazo de la matriz de mezcla regresiva con la matriz que proporciona m_{0} y m_{1} en términos de canales originales. Los coeficientes determinados mediante este procedimiento determinarán entonces la conversión a escala real de m_{0} y m_{1}.
En el caso degenerado, en el que L_{0} y R_{0} sean señales idénticas o sean versiones convertidas a escala entre sí, el subespacio abarcado por L_{0} y R_{0} será unidimensional. En este caso, m_{0} puede ser elegido arbitrariamente dentro del subespacio, y m_{1} puede ser elegido para que sea ortogonal a m_{0}, pero desde fuera del subespacio. La matriz 0 en un descodificador de dos canales reconstituirá entonces L_{0} u R_{0} como versión convertida a escala de m_{0}, e ignorará a m_{1}.
En el sistema de compresión sin pérdida MLP, los coeficientes de la Matriz 0 son portados en el primer subflujo. El subflujo 0 y los coeficientes de la Matriz 1 son portados enteramente en el segundo subflujo, o subflujo 1, aunque algunos de estos coeficientes son utilizados para multiplicar señales descodificadas procedentes del primer subflujo.
Codificación de mezcla regresiva combinada con reducción del régimen de datos
Codificadores sin pérdida que usan matrizado son tratados extensamente en el documento WO-A 96/37048, en los que la finalidad del matrizado es reducir la correlación entre los canales transmitidos, y con ello reducir el régimen de los datos transmitidos. En este caso, en que una mezcla regresiva ha de ser codificada como antes se ha descrito, el matrizado es especificado parcialmente por el requerimiento de mezcla regresiva, pero sigue habiendo una considerable libertad en las características.
Primeramente, al elegir m_{0} y m_{1}, la condición de que sean aproximadamente ortogonales permite aún un giro arbitrario dentro del subespacio abarcado por L_{0} y R_{0}. Esta libertad puede ser utilizada para reducir al mínimo el régimen de los datos requerido para codificar el primer subflujo, o subflujo 0, usando por ejemplo los métodos expuestos en el documento WO-A 96/37048, que reducen al mínimo el régimen de los datos tomado mediante cualquier señal de dos o más canales.
En segundo lugar, suponiendo por ejemplo, una señal multicanal de 6 canales, el matrizado de los cuatro canales que no son modificados para proporcionar la mezcla regresiva está aún completamente sin especificar. Una vez más, los métodos descritos en el documento WO-A 96/37048 pueden ser utilizados para reducir al mínimo el régimen de datos requerido para codificar el segundo subflujo, o subflujo 1, En el caso de una implementación de PMQ, pueden ser utilizados dos PMQs para derivar la mezcla regresiva, y los restantes PMQs pueden ser utilizados para reducir al mínimo el régimen de datos de los restantes cuatro canales, del mismo modo que para cualquier otra señal de cuatro canales. En el sistema de compresión MLP, se dispone en total de seis PMQs, lo que permite que cuatro sean asignados a esta tarea.
Oscilación
En la actualidad, en los círculos audiófilos es considerado extremadamente importante que cualquier cuantificación que afecte a la reproducción de una señal de audio se haga con el uso de oscilación. Típicamente, un pequeño valor de oscilación pseudoaleatoria es añadido a la señal antes de ser pasada ésta al cuantificador. Véase, por ejemplo, la publicación de S.P. Lipshitz, R.A Wannamaker, y J. Vanderkooy, "Quantization and Dither: A Theoretical Survey" (Cuantificación y oscilación: un estudio teórico), Revista Audio Eng. Soc., Mayo 1992, vol. 40, págs. 355 a 375.
Los cuantificadores de matriz primitiva ejecutan inherentemente cuantificación. En el caso de codificación y descodificación sin pérdida, la ausencia de oscilación no es un problema debido a que el matrizado sin pérdida en el descodificador invierte exactamente el matrizado ejecutado en el codificador, incluido cualquier efecto de cuantificación. Sin embargo, al proporcionar una mezcla regresiva como antes se ha descrito, la Matriz 0 no invierte el efecto de la Matriz 1, y la mezcla regresiva contendrá efectos de cuantificación procedentes de ambas matrices.
Para hacer que la cuantificación de la mezcla regresiva resulte benigna, debe ser añadida oscilación mediante ambas matrices. Sin embargo, la adición de oscilación en la Matriz 1 del codificador afectará a la señal transmitida, y con ello será afectada la descodificación de la señal multicanal. Por tanto, para una descodificación sin pérdida, la Matriz inversa 1 en el descodificador multicanal debe compensar el efecto de oscilación en el matrizado codificado.
Las figs. 5a y 5b muestran un par complementario de cuantificadores de matriz primitiva que incluyen oscilación, en este caso para una señal de tres canales. Los dos cuantificadores de matriz difieren sólo en que la señal q_{1} es restada en el cuantificador mostrado en la fig. 5a, mientras que la misma señal es añadida en el cuantificador mostrado en la fig. 5b. Se aprecia fácilmente que dado que la señal proporcionada por la caja marcada con "oscilación" es la misma en ambos casos, el PMQ de la fig. 5b anulará la acción del PMQ de la fig. 5a. Por tanto, puede ser construido un codificador como se muestra en la fig. 1 en la que la "Matriz 1" sea una cascada de PMQs como se muestra en la fig. 5a, y puede ser construido el descodificador multicanal de la fig. 2 en el que la "Matriz Inversa 1" es una cascada de orden invertido de PMQs como se muestra en la fig. 5b. Esto asegurará que la señal multicanal sea reconstruida sin pérdida.
Para la mejor calidad de la reproducción de mezcla regresiva, los requerimientos convencionales de oscilación deben ser satisfechos, tanto en la "Matriz 1" del codificador como en la "Matriz 0" del descodificador. Por ejemplo, en el codificador, el generador de oscilación de las figs. 5a y 5b podría proporcionar ventajosamente oscilación TPDF con amplitud de pico a pico igual a dos operaciones de cuantificación del cuantificador Q. Si los primeros dos PMQs en el codificador proporcionan la señal de mezcla regresiva, entonces no es necesario añadir oscilación a los últimos PMQs.
La Matriz 0 puede ser un tipo de matriz diferente, pero no obstante incluirá un cálculo, que aumenta la longitud de la palabra, seguido por cuantificación, y es normal añadir oscilación antes de cada cuantificación.
El requerimiento de oscilación idéntica en los cuantificadores de codificación y descodificación de las figs. 5a y 5b puede ser logrado por el codificador, registrando de vez en cuando un "germen" que transporta el estado de un generador de secuencia pseudoaleatoria dentro del flujo, y el descodificador lee el germen y con ello sincroniza su propio generador de secuencia.
En el MLP, el generador de secuencia es un registro de desplazamiento circular de 23 bitios, que genera una secuencia binaria pseudoaleatoria (PRBS) con el uso de la expresión:
b_{23}\oplusb_{5}\oplus 1
donde: b_{x} representa el bitio x del registrador de desplazamiento, y
\hskip0.6cm
\oplus representa la operación O-exclusiva.
Por tanto, el germen en el flujo tiene una longitud de 23 bitios. El registrador de desplazamiento es desplazado 16 bitios sobre cada período de muestra. Esto permite que sea generado un nuevo número de 16 bitios pseudoaleatorio con una PDF rectangular, por cada muestra de señal. Sin embargo dado que es preferida la TPDF oscilatoria, los 16 bitios son divididos en muestras oscilatorias de 8 bitios. Cada una de estas muestras de 8 bitios tiene una PDF rectangular, pero el codificador tiene la opción de sumar y restar estas dos muestras para proporcionar otras dos muestras oscilatorias sin correlacionar que tengan una PDF triangular. Este procedimiento es conocido como "Oscilación romboidal" y es explicado en la referencia antes citada de Wannamaker, AES preprint no. 4533. El codificador puede utilizar estas dos muestras PDF triangulares para añadir oscilación a dos PMQs que proporcionan la señal de mezcla regresiva.
Consideraciones de audiofilia no requieren que la oscilación aplicada a la Matriz 0 para recuperar la señal de mezcla regresiva esté sincronizada con el correspondiente procedimiento en el codificador. En realidad, es indeseable que se aplique la misma oscilación, o que la Matriz 0 aplique cualquier oscilación que esté correlacionada con la oscilación aplicada en la Matriz 1. En el sistema MLP, el descodificador de mezcla regresiva genera una señal oscilatoria con el uso del mismo algoritmo que el descodificador multicanal, pero la oscilación es diferente debido a que el germen es diferente: el germen para la oscilación de la Matriz 0 es portado en el subflujo 0, mientras que el germen para la oscilación de la Matriz 1 es portado en el subflujo 1.
En el sistema MLP, la cuantificación y la aritmética de la Matriz 0 son especificados justamente de modo tan preciso como para la Matriz 1, y con la oscilación controlada también por el codificador, éste tiene un conocimiento preciso de las señales L_{0} y R_{0} recuperadas por el descodificador, hasta el último bitio. Se volverá a tratar esto más adelante.
Saturación de mezcla regresiva
Con frecuencia es considerado comercialmente importante codificar una señal de audio al nivel máximo que el canal digital pueda manejar. Los picos en la música en vivo pueden ser muy "incontrolados", y el nivel medio debe ser mantenido muy por debajo del recorte digital para que los picos de una señal en vivo no produzcan sobrecarga. No obstante, el ingeniero de grabación profesional está bien equipado con herramientas para la modificación de la forma de onda, tales como circuitos recortadores y limitadores, que le permiten producir una señal "controlada" que module un canal de modo muy completo, al tiempo que asegura que no se sobrecargarán picos.
Se entiende que la sobrecarga digital puede dar por resultado aberraciones extremadamente desagradables causadas por los efectos "envolventes". Por ejemplo, en el complemento de dos convencional de audio de 24 bitios, el valor máximo positivo es representado por 7fffff hexadecimal. Un efecto sencillo para aumentar este valor mediante un nivel de cuantificación resultará 800000 hexadecimal, que es interpretado como la desviación negativa máxima. Por tanto, pequeñas sobrecargas pueden generar transiciones a escala total que tienen un gran contenido de energía de alta frecuencia, lo que suena de modo extremadamente desagradable y con frecuencia produce la quema de los altavoces agudos.
En el contexto del dominio del DVD, se supone que es producido un centro principal multicanal "controlado", y presentado para codificación sin pérdidas. Dicho en otros términos, se supone que cualquier problema de sobrecarga al producir la señal multicanal ya ha sido tratado. La tarea continúa para producir una mezcla regresiva aceptable de L_{0} R_{0}.
La sobrecarga en la salida del descodificador de dos canales de la fig. 3 puede ser evitada mediante reducción a escala suficientemente de los coeficientes de la "Matriz 0". No obstante, dicha reducción a escala presenta dos problemas. El primero es que la cuantía de la conversión a escala requerida no es conocida hasta que es examinado todo el material del programa, lo que resulta inconveniente en la etapa de jerarquización. El segundo es que dicha conversión a escala es probable dé por resultado una mezcla regresiva que sea inaceptablemente silenciosa por las normas comerciales. Esto se debe a que cualquier recorte o limitación previos de la señal multicanal no es necesariamente efectiva en la limitación de la relación entre pico y promedio de una mezcla regresiva derivada de la señal multicanal.
No es posible ajustar la mezcla regresiva en la etapa de codificación, ya que esto alteraría la transmisión de m_{0} y m_{1}, y la recuperación de la señal multicanal no sería entonces sin pérdida.
De acuerdo con ello, la invención proporciona un descodificador de mezcla regresiva que tiene la capacidad de generar interiormente una señal de mezcla regresiva que cuenta con una amplitud mayor de la que puede manejar una salida digital, y de incorporar un recortador o limitador antes de la salida final, de modo que la sobrecarga de la señal de la mezcla regresiva se maneje sin efectos desagradables.
En el sistema MLP, la anchura de palabra de salida es especificada como de 24 bitios, y la mayor parte de los caminos de señal interiores, que incluyen los caminos entre los PMQ están especificados también con anchura de 24 bitios. Sin embargo, después del último PMQ en el descodificador, hay dispuesto un desplazador que desplaza a la derecha o a la izquierda un número variable de bitios especificado por la información "desplaz_salida" portada de vez en cuando en el flujo codificado. Si al codificador se le proporciona una entrada y una condición de la mezcla regresiva, de lo que resulta que la mezcla regresiva requiere más de 24 bitios, el codificador reduce a escala las características de la mezcla regresiva, para evitar sobrecarga dentro del matrizado. Esta reducción a escala es mediante una potencia de dos, de modo que la amplitud correcta pueda ser restaurada en el descodificador mediante la condición de un desplazamiento positivo a la izquierda en la información "desplaz_salida". El desplazador en el codificador genera así una señal de mezcla regresiva de la amplitud correcta, que puede ser demasiado grande para la salida de 24 bitios. Por tanto, se coloca un recortador entre el desplazador y la salida, para evitar el indeseable efecto de "enrollamiento" antes citado. El recortador puede ser puesto en práctica convenientemente con el uso de las facilidades proporcionadas en muchas microplaquetas DSP, mediante las cuales un valor en un acumulador puede ser almacenado en una memoria con el uso de "aritmética de saturación".
En este caso surge una sinergia adicional si el emplazamiento de memoria en la que es almacenado el acumulador puede ser calculado en dependencia de la información "asignac_canal" en el flujo. Esto efectúa la permutación inversa de los canales requeridos en un descodificador, sin tener que poner en práctica una operación separada.
Desvio de bitio menos significativo (LSB)
Si una señal de entrada emplea el margen completo de 24 bitios, un intento por modificar un canal que utilice un PMQ de acuerdo con las figs. 4 o 5 es probable conduzca a una señal que exceda el margen de 24 bitios. Este margen ampliado, que es interno para los procedimientos de codificación y descodificación sin pérdida, puede ser aceptado económicamente aún en un procesador que utilice aritmética de 24 bitios mediante el uso de la arquitectura de la fig. 6.
La fig. 6a muestra, a la izquierda, un PMQ que incorpora un desplazador. Se supone que los caminos de señal tienen en general una anchura de 24 bitios, pero después de la sustracción de la señal cuantificada q de S1 se proporciona un camino de datos de 25 bitios para permitir espacio para la adición. La señal es desplazada luego aritméticamente hacia la derecha un bitio, y el LSB desplazado desde la parte inferior de la palabra se le da salida separadamente desde la salida principal S1', que contiene los restantes 24 bitios de orden alto.
El LSB así desplazado hacia fuera debe ser portado, por supuesto con la señal. Para descodificar las señales S1, S2, y S3, el LSB junto con las señales S1', S2, y S3 debe ser presentado al PMQ inverso mostrado a la derecha de la fig. 6b. Aquí, el LSB es adjuntado a S1', y el resultado es desplazado hacia la izquierda un bitio, de modo que el LSB portado separadamente es el LSB de la palabra desplazada, con lo que se proporciona una señal de 25 bitios a la que se añade la señal cuantificada q. El resultado de esta adición sólo tiene una anchura de 24 bitios, gracias a la reconstrucción sin pérdida de la señal S1 enviada como entrada al PMQ mostrado en la fig. 6a, partiendo de que S1 es una señal de 24 bitios.
Como se muestra a la derecha de la fig. 6a y a la izquierda de la fig. 6b, es posible insertar otros tratamientos sin pérdida y tratamiento sin pérdida inversos del camino de anchura de 24 bitios entre los dos PMQs complementarios, con tal de que haya un camino de desviación de modo que el LSB sea transportado separadamente. Por ejemplo, un esquema de bloque parcial de un codificador de MLP se muestra en la fig. 7a, y el correspondiente codificador se muestra en la fig. 7b. Un descorrelacionador y un codificador de entropía viene después de la matriz mostrada en la fig. 7a; por tanto, en este ejemplo, el "Tratamiento sin pérdida" mostrado en la fig. 6a incluirá estos elementos. De igual modo y con referencia a la fig. 7b, el "Tratamiento sin pérdida inverso" mostrado en la fig. 6b podría incluir un descodificador de entropía y un recorrelacionador. Como se muestra en las figs. 7a y 7b, se tiene cuidado para proteger el LSB desviado a través del procedimiento, para almacenarlo y recuperarlo del flujo o subflujo codificado.
Algunas veces, el matrizado del sistema MLP no causa sobrecarga, pero el descorrelacionador, aunque diseñado en general para reducir la amplitud de la señal, la aumenta en muestras particulares y con ello se produce un problema de sobrecarga. En este caso, un PMQ del tipo mostrado en la fig. 6a puede ser utilizado para reducir la amplitud de la señal y proporcionar así 6 dB de espacio para otros tratamientos. Los coeficientes mostrados en la fig. 6 pueden ser puestos a cero cuando se utilice un PMQ sólo para esta finalidad.
Es claro que el esquema de la fig. 6a podría ser generalizado para permitir que más de un bitio sea desplazado fuera de un PMQ y transmitido como una señal desviada. Esto no se hace en el sistema MLP.
El procedimiento mostrado en la fig. 6a es sin pérdida, y el correspondiente procedimiento inverso sin pérdida mostrado en la fig. 6b es también sin pérdida. Por tanto, es posible encajar en uno solo este procedimiento. Por ejemplo, el "Procedimiento sin pérdida" mostrado a la derecha de la fig. 6a podría incluir un PMQ de la clase mostrada a la izquierda de la fig. 6a, y el efecto codificador de este PMQ encajado podría se invertido mediante la inclusión en el "Procedimiento sin pérdida inverso" mostrado a la izquierda de la fig. 6b, de un PMQ de la clase mostrada a la derecha de la fig. 6b. En este caso, un bitio LSB desviado será generado en cada etapa, de modo que dos LSBs desviados deben ser transportados en torno a cualquier otro procedimiento.
En un codificador de MLP hay hasta seis PMQs en cascada, y cualquiera o todos ellos puede estar configurados para proporcionar un LSB desviado. Por tanto, el subflujo puede portar hasta seis LSBs desviados, procedentes de cada PMQ. Aunque cada LSB desviado procede de un PMQ diferente, no se precisa que vengan de canales diferentes, y el codificador puede elegir ocasionalmente asignar dos o más de dichos PMQs a un canal, y obtener así un espacio adicional de 12 dB o más para ese canal.
Hay variantes de la topología mostrada en las figs. 6a y 6b que tienen un efecto equivalente. La sustracción de la señal q en la fig. 6a, y la adición de la señal q en la fig. 6b, podrían ser intercambiadas. La sustracción puede ser evitada por inversión del signo de los coeficientes, por inversión del signo de la oscilación si se utiliza ésta, y si es necesario efectuando un ajuste en el cuantificador Q, por ejemplo, por reemplazo de un cuantificador que redondea por defecto por un cuantificador que redondea por exceso. Otra variación es colocar el cuantificador Q en el camino hacia delante, como se muestra en la fig. 23a del documento WO-A 96/37048, en lugar de en el lado de la cadena, teniendo cuidado de nuevo en la elección de los cuantificadores que redondean por exceso o por defecto. En la fig. 6b, el desplazamiento de la señal S1' y del LSB juntos, puede ser efectuado en cambio como un desplazamiento a la izquierda de la señal S1', con lo que se produce un LSB cero, y luego se suma el LSB transmitido separadamente. En este caso, la adición del LSB transmitido separadamente puede ser combinada con la adición de la señal cuantificada q, o ejecutada después. En realizaciones para el sistema MLP, la adición debe producir un número de 24 bitios.
La fig. 8 muestra el descodificador PMQ especificado para el sistema MLP, configurado para recuperar tres canales S1, S2, y S3, con el segundo canal S2 modificado. Esto incorpora algunas de las variaciones antes expuestas, y además utiliza una multiplicación general para efectuar el desplazamiento a la izquierda. El codificador especifica los valores de coeficiente y los incluye en el flujo. Por tanto, para desplazar la señal S2' a la izquierda un bitio, el codificador podría establecer el coeficiente m_coef[2,2] igual a +2. El sistema MLP utiliza coeficientes de 16 bitios dentro del margen [-2, +2]; por tanto, el valor exacto +2 no está disponible y en su lugar, el codificador especifica -2. Por tanto, la descodificación PMQ invierte la señal en este caso, y el codificador debe también invertir la señal para compensar.
Como antes se ha expuesto, es ventajoso tener dos señales oscilantes rectangulares RPDF sin relacionar, con objeto de proporcionar dos señales oscilantes triangulares TPDF por adición y sustracción. En el matrizado MLP, las dos señales oscilantes RPDF de 8 bitios obtenidas del generador de secuencia son signos extendidos a 24 bitios, y tratadas como si fuesen dos canales extra. Estos canales oscilantes nunca son modificados por PMQs. Se apreciará que la oscilación de la fig. 8 viene dada por:
m_coef [2,4] oscil 0 + m_coef [2, 5] oscil 1
Esta oscilación es igual que la oscilación identificada como tal en la fig. 6b. Si m_coef [2, 4] y m_coef [2, 5] tienen la misma magnitud, la oscilación tendrá la deseada función de distribución de probabilidad (PDF). Por tanto, si se utilizan dos PMQs para proporcionar una mezcla regresiva, el codificador especificará que m_coef [2, 4] y m_coef [2, 5] tendrán el mismo signo en un PMQ, y signos opuestos en el otro PMQ, y proporcionan así señales oscilatorias TPDF sin relacionar por el método de "Vibración en rombo" antes expuesto.
En la fig. 8, si se consideran las muestras de señal de entrada como enteros de 24 bitios, entonces los valores de salida de los multiplicadores tendrán en general 14 bitios después del punto binario, debido a que los coeficientes m_coef [2, j] pueden tener hasta 14 bitios después del punto binario. Se supone por el momento que el cuantificador Q_{ss} cuantifica hasta un valor entero de 24 bitios. En este caso, si los dos valores oscilatorios RPDF de 8 bitios son justificados a la derecha en las palabras de 24 bitios Oscilación 0 y Oscilación 1, las magnitudes correctas para m_coef [2, 4] y m_coef [2, 5] son 2^{-8}.
Si se utilizan PMQs adicionales para reducir el régimen de bitios del flujo sin afectar a las señales de la mezcla regresiva, será normal no utilizar oscilación en el vibrador, y por tanto los valores de m_coef [i, j] utilizados para multiplicar los canales de oscilación en los PMQs serán cero. Esto sugiere que podría obtenerse una economía mediante la no inclusión de capacidad de oscilación en todos los PMQs. Sin embargo, esta economía no tiene lugar en las puesta en práctica de sistemas MLP, debido a que las ventajas obtenidas con la regularidad de la estructura en realizaciones prácticas superan mucho el coste de un par adicional de multiplicaciones.
En el MLP, los PMQs en cascada de acuerdo con la fig. 8 son utilizados para ambas Matrices 0 y 1. En el caso de la Matriz 1 será normal que el coeficiente del canal sea modificado, que en el caso ilustrado es m_coef [2, 2], para tener el valor -2 cuando se utilice el desvío de LSB, y +1 o -1 cuando no se utilice dicho desvío de LSB. Esta elección es hecha por el codificador, y el coeficiente es incluido en el flujo para uso por el descodificador.
Cuando se utiliza el descodificador de 2 canales para reproducir una mezcla regresiva, la Matriz 0 proporciona el matrizado y/o la conversión a escala de las señales m_{0} y m_{1} para proporcionar L_{0} y R_{0}. Coeficientes generales, no limitados a potencias de dos, son requeridos entonces en los PMQs. De nuevo, la regularidad en el descodificador y la flexibilidad en el codificador, son razones para adoptar la arquitectura de la fig. 8 uniformemente.
En la Matriz 0, la conversión a escala del canal modificado puede ser llevada a cabo por conversión a escala de todos los coeficientes, excepto los de oscilación, que contribuyen a ello. Si se precisa aumento de escala, existe una posibilidad de que la escala requerida exceda al margen de coeficientes disponible de [-2, 2], o que se produzca una sobrecarga de señal dentro del matrizado. Esto puede ser tratado mediante la reducción de la escala por una potencia de 2, con el uso entonces del "despl_salida" para restablecer el nivel deseado.
En el MLP con mezcla regresiva, no es normal portar los LSBs desviados en el primer subflujo, o Subflujo 0, ya que el descodificador de la mezcla regresiva no intenta la reproducción sin pérdida. El segundo subflujo, Subflujo 1, porta toda la información requerida para el matrizado del descodificador multicanal, incluidos los coeficientes, los generadores de oscilación, y los LSBs desviados, incluidos los LSBs que cayeron de los canales portados por el Subflujo 0.
Una característica de la fig. 8 que no afecta a la exposición anterior es que el cuantificador Q_{ss} es capaz de cuantificar a tamaño de paso, que es una potencia de 2, poniendo así el punto de corte uno o más bitios por encima del LSB. Esta facilidad está incluida con objeto de optimizar el tratamiento de las señales de entrada que no emplean el o los bitios menos significativos de la palabra de 24 bitios. En el MLP, la característica de desvío de LSB es utilizada sólo cuando el tamaño de la operación de cuantificación se fija en la unidad.
Integridad del flujo y "Comprobación de sin pérdida"
Un sistema de codificación con pérdida proporciona una salida que no es una reconstrucción exacta de la señal de entrada. La comprobación de la integridad, por ejemplo, una comprobación de redundancia cíclica (CRC) o una comprobación de paridad debe limitarse a una comprobación de la corriente codificada, de modo que los errores de transmisión puedan ser señalizados. La relación entre la señal de entrada y su reconstrucción final es algo desconocida, y es afectada tanto por las pérdidas inherentes en los procedimientos de codificación y de descodificación con dichas pérdidas, y a los errores relacionados con la plataforma causados por el comportamiento aritmético del procesador de descodificación, posiblemente diferente del procesador de codificación.
En el sistema MLP, una palabra de paridad conocida como valor de "comprobación sin pérdida" es calculada por cada segmento de la señal de entrada, e incluida en el flujo codificado. Se supone que el descodificador calculará una palabra de paridad similar e indicará que se ha producido un error si esta palabra calculada no coincide con la palabra incluida en el flujo. A diferencia de las comprobaciones que son posibles en un sistema de codificación con pérdida, las comprobaciones hechas en un sistema de codificación sin pérdida son capaces de mostrar fallos debido a sobrecarga, u otros fallos algorítmicos dentro del algoritmo, inconsistencias relacionadas con la plataforma, y errores de transmisión.
En realizaciones preferidas, un reproductor es capaz de informar al usuario de dichos errores: por ejemplo, podría iluminarse una luz de "Sin pérdida" cuando coinciden dos palabras de comprobación, o de otro modo extinguirse dicha luz. Dado que el fallo podría ser momentáneo puede ser utilizado un circuito de estiramiento de impulso, de modo que el usuario tenga tiempo para reconocer el fallo, por ejemplo, la luz podría extinguirse durante dos segundos al recibir un fallo sencillo.
En el sistema MLP, un valor de Comprobación sin pérdida es una palabra de paridad de 8 bitios, que es calculada para todos los canales y todas las muestras dentro de un segmento de típicamente 1280 palabras. En términos de características del MLP, este segmento incluye todas las muestras entre dos "puntos de reiniciación" consecutivos. Dado que el sistema MLP supone palabras de 24 bitios, la paridad será calculada naturalmente como palabra de 24 bitios, pero esta palabra de paridad es dividida en tres octetos y éstos son hechos O-exclusivo juntos con objeto de proporcionar el valor de comprobación sin pérdida. Antes de calcular la paridad, cada palabra de señal de 24 bitios es girada un número de bitios igual a su número de canal. Este giro evita el problema de que un error que afecte a dos canales idénticos pueda de otro modo no ser detectado.
Una puesta en práctica alternativa es tomar la paridad de todos los octetos dentro de cada segmento de cada canal, para producir un octeto de paridad de 8 bitios, y girar cada octeto de paridad su número de canal antes de hacerlos juntos O-exclusivos. Esto puede resultar más económico en procesadores que no tengan una longitud de palabra de 24 bitios.
En el sistema MLP con un subflujo sencillo, el valor de comprobación sin pérdida se refiere a la señal original que está siendo reproducida sin pérdida. Cuando el MLP está portando una mezcla regresiva, el segundo subflujo porta
el valor de comprobación sin pérdida relativo a la señal original, y ésta será comprobada por un descodificador de canal.
En este caso de mezcla regresiva, el primer subflujo porta también un valor de comprobación sin pérdida, pero éste se refiere sólo a la mezcla regresiva. Aunque la salida de dicha mezcla no es una reproducción sin pérdida de una señal original, es determinable en virtud de las condiciones precisas de las cuantificaciones en la Matriz 0 y las condiciones precisas de la oscilación. Por tanto, el codificador puede determinar la mezcla regresiva que será reproducida por un descodificador, y puede calcular el valor de la "comprobación sin pérdida" a partir de la mezcla regresiva simulada. En el contexto del dominio DVD-Audio, se pretende que el codificador haga a la mezcla regresiva simulada disponible para la audición, y por tanto el oyente puede asegurar que la señal recuperada en su reproductor es idéntica bitio a bitio a la señal escuchada por el ingeniero director o el productor de grabación.
Una excepción surge en el caso de sobrecarga, que como antes se ha descrito es manejada mediante recorte o limitación en el reproductor. Dado que el comportamiento del recorte o la limitación no está definido con precisión, el valor de comprobación sin pérdida es calculado a partir de la señal, inmediatamente antes de cualquier saturación o limitación. En el sistema MLP, donde como antes se ha expuesto, el descodificador incorpora un desplazador después del PMQ final, y puede poner en práctica el recorte mediante el almacenamiento de un acumulador en la memoria con el uso de aritmética de saturación, la Comprobación sin Pérdida puede ser calculada directamente a partir del valor en el acumulador, lo cual no resulta así afectado por la saturación.
Algunas veces, como se muestra en la fig. 9, un codificador sin pérdida puede ser precedido por un precuantificador, para reducir el régimen de datos transmitidos. Información adicional correspondiente a la precuantificación puede ser obtenida en las referencias AES 1997 y AES 1998 antes citadas. En estas situaciones, la reproducción de la señal original recibida por el precuantificador no será sin pérdidas, pero la reproducción de la señal precuantificada será sin pérdidas. De nuevo ha de decirse que la señal precuantificada debe hacerse disponible para su audición, y el valor de Comprobación sin Pérdida debe ser calculado a partir de la señal precuantificada, de modo que el oyente pueda estar seguro de que la señal recuperada en su reproductor es bitio por bitio idéntica a la señal que fue escuchada, o al menos estaba disponible para audición en la etapa de establecimiento de categoría.
Estrategias para la elección de matriz del codificador
Para codificar una mezcla regresiva de dos canales, las señales m_{0} y m_{1} deben estar en el subespacio abarcado por los canales L_{0} y R_{0} de la mezcla regresiva. Hay una considerable flexibilidad dentro de este criterio, pero algunas elecciones son mejores que otras. El codificador debe evitar que la elección de m_{0} y m_{1} sean linealmente casi dependientes por varias razones. La primera es que la Matriz 0 tendría probablemente coeficientes grandes, y la recuperación de la mezcla regresiva sería ruidosa. La segunda es que al resolver las ecuaciones para determinar los PMQs comprimidos en la Matriz 1, el codificador probablemente generará coeficientes superiores al margen admisible. La tercera es que el matrizado de las señales afecta al régimen de datos para la compresión sin pérdida, y es ineficiente para transmitir separadamente señales que son muy similares entre sí.
Como antes se ha dicho, un modo para evitar lo peor de estos problemas es elegir m_{0} y m_{1} de modo que sean ortogonales entre sí. Es decir, que m_{0} y m_{1} son definidos en términos de señales de entrada por una matriz cuyas filas son ortogonales entre sí. Este criterio deja aún cierta flexibilidad, que puede ser resuelta, por ejemplo, mediante la toma de m_{0} proporcional a L_{0}. Considérese, por ejemplo, la condición de la mezcla regresiva:
5
Aquí, el coeficiente mayor que contribuye a L_{0} es el de L_{1}, que tiene un valor igual a 0,75. Por tanto si se genera m_{0} igual a L_{0} convertido a escala según 1/0,75 = 1,333, tendremos:
6
que puede ser puesto en práctica mediante un PMQ que deje el primer canal sin modificar.
La señal m_{1} debe ser una combinación lineal de L_{0} y R_{0}. Una combinación lineal que es ortogonal a L_{0}, y por tanto ortogonal también a m_{0} viene dada por:
m_{1} (sin convertir a escala) = R_{0} -\lambdaL_{0}
donde:
\hskip3mm
\lambda
\hskip3mm
=
\hskip3mm
\frac{L_{0} \cdot L_{0}}{ L_{0}\cdot L_{0}}
\hskip1cm
y
el símbolo indica la conversión o producto escalar de dos vectores.
El valor resultante es equivalente a tomar los productos escalares de los vectores de fila en la matriz de mezcla regresiva. Si utilizados la mezcla regresiva para indicar la matriz de mezcla regresiva, entonces el valor escalar \lambda podrá ser expresado como:
\lambda= \frac{mezc.regres_{2} \ \cdot \ mezc.regres_{1}}{mezc.regres_{1} \ \cdot \ mezc.regres_{1}}
donde mezc.regres_{1} indica el vector de primera fila de la matriz;
\hskip0.4cm
mezc.regres_{2} indica el vector de segunda fila de la matriz; y
con el uso de la matriz de mezcla regresiva del ejemplo antes mostrado, \lambda = 0,1849. Por tanto:
7
El segundo PMQ que generará m_{1} recibe la señal proporcionada por el primer PMQ, del que el primer canal es m_{0} en vez de L_{f}. Por tanto, m_{1} debe ser reexpresado en términos de m_{0}, R_{f}, etc.:
8
Aquí, el coeficiente mayor, 0,8000, se multiplica por R_{s}, el cuarto canal de entrada. Por tanto, se aplica una permutación como antes se ha expuesto, para intercambiar los canales de entrada segundo y cuarto, y situar así R_{s} en la segunda posición, de modo que m_{1} aparecerá en la segunda posición en la salida de la matriz:
9
Finalmente, se hace una conversión a escala de modo que el coeficiente de R_{s} sea unitario:
10
Esta es ahora la forma correcta para la puesta en práctica mediante un segundo PQM.
Los ejemplos anteriores muestran una de las diversas estrategias que pueden ser empleadas por un codificador. Una estrategia más sencilla es calcular m_{0} como antes, definir luego m_{1}, además de convertir a escala, por sustracción de una proporción de \lambda de L_{0}, de R_{0}, de modo que el coeficiente de L_{f} es cero. En este ejemplo particular, la pobreza de las características de la mezcla regresiva original resulta en esta situación que es satisfecha con \lambda = 0:
11
El valor cero del primer coeficiente evita la necesidad, cuando se calcula el segundo PMQ, de considerar el efecto del primer PMQ. Es decir, que m_{0} puede ser sustituido por L_{f} en la ecuación anterior, sin hacer ningún otro cambio. Con la aplicación de la conversión a escala y la permutación como antes se ha expuesto, se obtiene:
12
que es de la forma correcta para la puesta en práctica mediante el segundo PMQ.
Aunque el procedimiento antes simplificado no proporciona ortogonalidad, se evita generar m_{0} y m_{1}, que son casi dependientes linealmente, por ejemplo si los propios L_{0} y R_{0} fuesen casi dependientes linealmente. En la posibilidad de que L_{0} y R_{0} sean realmente dependientes linealmente (es decir, versiones convertidas a escala de cada uno), deben ser comprobados y tratados como un caso especial.
Alternativamente, en un codificador más avanzado, la condición ortogonal anterior puede ser reemplazada por la condición de que la correlación cruzada de las señales m_{0} y m_{1} sea aproximadamente cero. Esta condición puede ser satisfecha por una apropiada elección de \lambda. La condición de correlación cruzada cero minimiza la energía en m_{1}, y en ausencia de dependencia de la frecuencia, esto sería efectivo para reducir al mínimo el régimen de los datos transmitidos. Como se explica en el documento WO-A 96/37048, el régimen de los datos en presencia de la variación espectral depende más de la información contenida que de la energía. Con señales audio típicas, la energía y la correlación cruzada estará dominada por señales grandes de frecuencia baja, que tienen escaso contenido de información habida cuenta de su anchura de banda baja. Por tanto, es mejor aplicar una ponderación espectral, que típicamente realzará las frecuencias altas, antes de calcular la correlación cruzada. De modo ideal, la ponderación espectral estará adaptada a la propia señal, pero es complicado determinar una ponderación óptima o casi óptima, y en la práctica una ponderación fija será suficiente. Por ejemplo, un filtro digital cuya transformación z es:
( 1 - z^{-1}) ^{2}
tendrá una respuesta que se eleva a 12 dB por octava en la parte de frecuencia baja y media de la banda de audio, que será así suficiente en general para suprimir un dominio indebido por señales grandes de frecuencia baja.
En el documento WO-A 96/37048, las direcciones preferidas para las señales transmitidas fueron descritas como que son los vectores propios de una matriz, que en ausencia de la dependencia de frecuencia habrán sido la matriz de correlación de las señales. Dicha elección conducirá a correlación cero entre las señales transmitidas. Sin embargo, el cálculo de los vectores propios consume tiempo, y el procedimiento antes expuesto en el que la correlación cero se consigue simplemente por sustracción, conduce a un régimen de datos que teóricamente difiere poco del resultante de un cálculo de vector propio.
Los procedimientos expuestos para elegir las direcciones de las señales transmitidas pueden ser aplicados en general a codificadores que no calculen una mezcla regresiva, o al tratamiento de los restantes canales una vez que la mezcla regresiva ha sido extraída.
Seguidamente se describirá un procedimiento en el que las direcciones de vector de los canales transmitidos son elegidas una a una. Se elige un primer canal de entrada, y otros canales son restados de él con coeficientes elegidos para minimizar la energía que queda después de la sustracción. Un cuantificador de matriz primitiva pone en práctica la sustracción y proporciona una señal de salida. Luego se elige otro canal de entrada, y de nuevo los otros canales son restados mediante un PMQ. El PMQ proporciona la siguiente señal de salida, que tiene coeficientes elegidos para minimizar la energía en ellos. El procedimiento se repite hasta que todos los canales de entrada han sido tratados, o hasta que han sido utilizados todos los PMQs disponibles, o hasta que se considere que no es ventajoso aplicar otras transformaciones de matriz. Cualesquiera otros canales de entrada que no hayan sido modificados por los PMQs son pasados a la salida sin modificación.
Una mejora en este procedimiento sería elegir la sustracción, de modo que se minimice alguna medida de entropía, o contenido de información de la señal, en vez de simplemente minimizar la energía. En el documento WO-A 96/37048, la entropía fue estimada por toma de sobrefrecuencia integral del logaritmo del espectro, y sería enteramente posible calcular cada minimización con respecto a este criterio. La minimización de energía espectralmente ponderada sería una alternativa computacionalmente menos intensa, y hay varios modos para calcular una ponderación espectral apropiada en dependencia de la señal. Más económico aún sería el uso de una ponderación de frecuencia fija, por ejemplo, proporcionada por un filtro digital que tenga una transformación-z de (1 - z ^{-1}) ^{2}.
Los expertos en la técnica del álgebra de matrices numéricas apreciarán que el procedimiento expuesto es algo similar al uso de la ortogonalización de Gram-Schmidt, para proporcionar un juego de vectores ortogonales. Por analogía, podría ser considerado innecesario, cuando se considere la sustracción, incluir vectores que ya hayan sido tratados, ya que por construcción, éstos son ortogonales con respecto a los vectores que aún no han sido tratados. No obstante, en general esto no será cierto cuando una mezcla regresiva esté siendo codificada, ni lo será si la minimización es de entropía en vez de energía. Por tanto y en general, cada PMQ restará ambas señales que ya han sido tratadas y los canales de entrada que aún tienen que ser tratados.
Hasta ahora, el orden en que son elegidos los canales para modificación ha sido considerado como arbitrario. En muchos casos, el orden puede tener un efecto escaso en el régimen de datos final, pero puede afectar sustancialmente al tamaño de los coeficientes en la sustracción. Dado que el sistema MLP limita los coeficientes a un valor máximo de 2, esta consideración es importante. Si la minimización es de energía, o de energía con una ponderación espectral fija, este cálculo resulta extremadamente rápido, y es enteramente posible efectuar una selección arbitraria sobre una base de prueba, y rechazar esa y probar con otra si los coeficientes son demasiado grandes. Otro sistema heurístico es elegir para modificación el canal cuya energía, o energía ponderada espectralmente, sea la menor.
Si el PMQ es puesto en práctica como en la fig. 8, sería normal elegir un coeficiente de +1 o de -1 para el canal que se está modificando. Si la sustracción genera señales de sobrecarga, el coeficiente puede ser reducido. Sería normal en un MLP reducirlo a -0,5, con el uso del método de desvío del LSB antes descrito. Esto proporcionará un espacio adicional de 6 dB, que en general será suficiente. Si no es así hay varias posibilidades más. La transformación de matriz considerada normal puede ser modificada o abandonada: es decir, el canal de entrada puede ser transmitido sin modificación. Si se dispone de otro PMQ, puede estar configurado también para operación de desviación del LSB, y asignado al canal en consideración, lo que permite otro aumento de espacio de 6 dB. El PMQ adicional será aplicado antes al PMQ que efectúa la sustracción. El PMQ adicional, que se requiere simplemente para reducir la amplitud de señal, normalmente en el sistema MLP aplica un coeficiente de -0,5 al canal que se está modificando, y de otro modo tiene coeficientes cero.
Un caso particular en el que dos o incluso tres PMQs pueden ser necesarios para tratar un canal, es aquél en el que unas condiciones de mezcla regresiva tienen varios coeficientes sustancialmente de la misma magnitud. Por ejemplo, aunque el PMQ que proporciona m_{0} en el ejemplo anterior tiene todos los coeficientes inferiores a la unidad, la suma de las magnitudes absolutas de los coeficientes es 2,627. Por tanto, aunque el PMQ que proporciona m_{0} utilice desviación del LSB y convierta a escala el canal a 0,5, existe aún la posibilidad de un aumento en la magnitud de la señal de un factor 1,313. Esto puede suceder si sobre un período de muestra dado, los canales de la entrada proporcionan modulación completa simultáneamente, y cada uno tiene el mismo signo que su coeficiente en el PMQ, o si cada uno tiene signo opuesto a su coeficiente. La sobrecarga puede ser evitada por asignación de un PMQ adicional, poniendo en práctica una desviación del LSB antes del PMQ que proporciona m_{0}.
A efectos de claridad, la anterior descripción menciona sólo los PMQs implementados por el codificador. Se entiende que por cada PMQ que utiliza, el codificador debe especificar un correspondiente PMQ para ser utilizado en la Matriz 1 por el descodificador sin pérdida, y que los PMQs del descodificador deben ser aplicados en orden inverso. En el caso de desviación del LSB, un codificador PMQ que aplique un coeficiente de -0,5 al canal que se está modificando implica un descodificador PMQ que aplique un coeficiente de -2,0 a ese canal. En el caso de mezcla regresiva, el codificador debe especificar los coeficientes para la Matriz 0 en dependencia de las elecciones hechas para m_{0} y m_{1}. Además, si un canal ha sido convertido a escala, el factor de escala debe ser tenido en cuenta al calcular los coeficientes de la mezcla regresiva subsiguiente que multiplicarán el canal.
Codificación de contenido de régimen mezclado
Las características de DVD-Audio permiten llevar a cabo una grabación sobre el disco utilizando dos frecuencias de muestreo. Por ejemplo, los canales frontales L_{f}, R_{f} pueden ser codificados con un régimen de muestreo de 96 kHz, mientras que los otros canales pueden serlo a 48 kHz, con objeto de reducir el régimen de datos. No obstante, la descripción anterior de la transmisión simultánea de información de mezcla regresiva en el primer subflujo supone que todos los canales son muestreados simultáneamente, y en particular, con el mismo régimen de muestreo.
El artículo de P.G. Craven, M.J. Law, J.R. y Stuart, "Lossless Compresión using IIR Prediction Filters" (Compresión sin pérdida con el uso de filtros de predicción IIR), en la Revista Audio Eng. Soc., Resúmenes, Marzo de 1887, vol. 45, núm. 5, pág, 404, publicación preliminar núm. 4415, explican que cuando se utiliza la compresión sin pérdida no es necesario reducir el régimen de muestreo con objeto de ahorrar datos. Es suficiente limitar la anchura de banda de la señal debido a que el codificador sin pérdida responderá automáticamente a la reducción en el contenido de información de la señal, y la codificará con un régimen de bitios inferior.
Una señal sin muestrear tiene inherentemente una anchura de banda limitada. Por ejemplo, una señal muestreada a 96 kHz tiene la capacidad de reproducir frecuencias hasta cerca de 48 kHz, pero dicha señal tendrá muy escasa energía por encima de los 24 kHz si es derivada mediante elevación del valor de muestreo a 48 kHz de una señal muestreada. De acuerdo con ello, cuando es utilizada la compresión sin pérdida sobre un material de "régimen mezclado", es posible sin un efecto adverso significativo en el régimen de datos, elevar el muestreo de cualesquiera canales que estén representados con un régimen inferior, por ejemplo, 48 kHz, antes de la codificación, de modo que todos los canales sean codificados con el mismo régimen de muestreo, por ejemplo, 96 kHz. Este régimen de muestreo unificado hace posibles las operaciones de matriz requeridas para la puesta en práctica de la invención.
La "elevación del valor de muestreo" es conocida también como "interpolación" en las publicaciones sobre Tratamiento de Señales Digitales, y son bien conocidas las técnicas para ejecutarlo. La fig. 10 muestra un descodificador adaptado para incluir esta característica. Dado que la filtración implica retrasos, a los canales L_{f} y R_{f} que no requieren elevación del valor de muestreo se les proporciona un retardo compensatorio.
La filtración por interpolación no es en general sin pérdida, pero en una realización preferida los filtros de "elevación del valor de muestreo" de la fig. 10 son del tipo conocido como "filtros de banda media". Cuando se utilizan para interpolación, los filtros de banda media proporcionan una salida con el doble de puntos de muestreo que los de la entrada. Los puntos de salida de número par corresponden a los puntos de entrada, y contienen valores de muestra idénticos a los valores de entrada, mientras que los puntos de número impar quedan a mitad de camino entre los valores de entrada, y contienen valores interpolados.
Cuando un flujo es codificado de este modo, el reproductor tiene dos opciones. Puede reproducir dicho flujo como si todos los canales fuesen muestreados originalmente a 96 kHz, ignorando así la procedencia diferente de las muestras pares e impares. Alternativamente, el reproductor puede seleccionar sólo las muestras pares, en el caso de canales que originalmente fueron presentados al codificador con 48 kHz. En este caso, el reproductor tiene acceso a una reconstrucción sin pérdida del contenido de régimen mezclado que fue presentado al codificador. Para que esto sea posible, el flujo codificado debe contener unas características de aquellos canales que fueron presentados originalmente al régimen de muestreo inferior, y una indicación de qué muestras han de ser consideradas "pares", y cuáles "impares". Esta últimas pueden ser implícitas si el flujo contiene una estructura en bloque en la que el número de muestras en el bloque es siempre par. En el sistema DVD-Audio, el uso de "unidades de acceso" y de "unidades de presentación" proporciona dicha estructura.
Las características del sistema DVD-Audio hacen que éste sirva igualmente para contenido de régimen mezclado a 88,2 kHz y a 44,1 kHz. La característica de codificación de régimen mezclado antes descrita puede ser aplicada también en este caso de manera similar.
Puesta en práctica de la invención
Las funciones requeridas para poner en práctica los diversos aspectos de la invención pueden ser ejecutadas por componentes que son materializados según una amplia variedad de formas, que incluyen componentes lógicos distintos, uno o más ASICs y/o procesadores controlados por programa. La manera en que estos componentes es puesta en práctica no es crítica. Por ejemplo, las operaciones requeridas para poner en práctica dichos aspectos de la invención pueden ser efectuadas por un aparato que comprende uno o más terminales para recibir y enviar señales que representan información digital, memorias de acceso aleatorio para almacenar la información digital, un medio para registrar uno o más programas de instrucción, y un procesador que ejecuta los programas de instrucciones. Dichos programas de instrucciones pueden ser grabados en una cierta variedad de máquinas de medios de lectura, u otros productos de fabricación, que incluyen varios tipos de memoria sólo de lectura, cinta magnética, disco magnético, disco óptico, o transportados por una banda de base o caminos de comunicación modulados a través del espectro, a frecuencias desde supersónica a ultravioleta.
Varias características de los procedimientos y aparatos de codificación y descodificación han sido descritos anteriormente. Se entiende que aunque estas características han sido puestas en práctica separadamente, está previsto que puedan ser combinadas para beneficio de las diferentes ventajas que ellas proporcionan.

Claims (15)

1. Un método de descodificación, que comprende:
- obtener un número N de señales de canal de entrada;
- transformar las señales de canal de entrada mediante una matriz, que es puesta en práctica como una cascada de cuantificadores de matriz primitiva para proporcionar un número N de señales de canal de salida de la matriz; y
- ordenar el número N de señales de canal de salida descodificadas, que responden a las señales de canal de salida de la matriz, en respuesta a la información de ordenación de canal derivada de las señales del canal de entrada.
2. Un método de acuerdo con la reivindicación 1, en el que la ordenación se ejecuta después de la transformación.
3. Un método de acuerdo con la reivindicación 1, en el que la ordenación se ejecuta antes de la transformación.
4. Un método de acuerdo con una cualquiera de las reivindicaciones 1 a 3, en el que las señales del canal de entrada representan señales de canal frontal-izquierdo, frontal-derecho, circundante-izquierdo, circundante-derecho, central, y de efectos de baja frecuencia, de un sistema de audio de seis canales.
5. Un método de acuerdo con una cualquiera de las reivindicaciones 1 a 4, en el que uno de los cuantificadores de matriz primitiva en la cascada de cuantificadores de matriz primitiva es un cuantificador de primera matriz primitiva, que trata una señal de primer canal que responde a una de las señales de canal de entrada, y cuyo método comprende:
- multiplicar la señal del primer canal dentro del cuantificador de primera matriz primitiva por un coeficiente de ganancia obtenido de las señales de canal de entrada; y
- combinar la primera señal de canal cuantificada con uno o más bitios menos significativos obtenidos de las señales del canal de entrada.
6. Un método de codificación, que comprende:
- obtener un número N de señales de canal de entrada;
- transformar las señales del canal de entrada mediante una matriz que es puesta en práctica como una cascada de cuantificadores de matriz primitiva, para proporcionar un número N de señales de canal de salida de la matriz;
- ordenar un número N de señales de canal de salida codificadas, que responden a las señales del canal de salida de la matriz, en respuesta a la información de ordenación de canal; y
- generar una pluralidad de subflujos que transportan información que representa las señales del canal de salida de codificación y la información de ordenación de canal, y en los que un primer subflujo representa un subconjunto estricto de las señales del canal de salida de la matriz, y contiene las condiciones de una mezcla regresiva.
7. Un método de acuerdo con la reivindicación 6, que deriva la información de ordenación de canal de las condiciones de la mezcla regresiva.
8. Un método de acuerdo con la reivindicación 7, que deriva la información de ordenación de canal de modo que una señal de canal que tenga el coeficiente mayor en las condiciones de la mezcla regresiva, es ordenada para ser una señal de primer canal, que es representada en el primer subflujo.
9. Un método de acuerdo con una cualquiera de las reivindicaciones 6 a 8, que aplica un cuantificador de matriz primitiva en la cascada de cuantificadores de matriz primitiva para modificar una señal de canal representada en un segundo subflujo en la pluralidad de éstos, de modo que dicho segundo subflujo es comprimido sin pérdida.
10. Un método de acuerdo con una cualquiera de las reivindicaciones 6 a 9, en el que uno de los cuantificadores de matriz primitiva en la cascada de cuantificadores de matriz primitiva, en un primer cuantificador de matriz primitiva que trata una señal de primer canal que responde a una de las señales de canal de entrada, y cuyo método comprende:
- multiplicar la señal del primer canal dentro del primer cuantificador de matriz primitiva por un coeficiente de ganancia; y
- generar la pluralidad de subflujos para incluir el coeficiente de ganancia y uno o más bitios menos significativos que exceda al número de bitios asignados al primer canal, que resulta de la multiplicación de la señal del primer canal.
11. Un medio legible por una máquina que porta un programa de instrucciones a efectuar por la máquina, para la ejecución del método de acuerdo con una cualquiera de las reivindicaciones 1 a 10.
12. Un aparato que comprende medios para ejecutar el método de acuerdo con una cualquiera de las reivindicaciones 1 a 10.
13. Un aparato de acuerdo con la reivindicación 12, que comprende un medio que almacena un programa de instrucciones, y un procesador acoplado al medio para efectuar el programa de instrucciones que ha de ejecutar el método.
14. Un medio que porta información formateada como una pluralidad de subflujos, que representa una pluralidad de señales de canal codificadas por una información de matriz que tiene una pluralidad de señales de canal de salida de matriz, en el que un primer subflujo de la pluralidad de ellos representa un subconjunto estricto de las señales de canal de salida de matriz, y contiene unas condiciones de la mezcla regresiva, y en el que la información portada sobre el medio comprende además información que transporta una orden de las señales de canal representadas en la pluralidad de subflujos.
15. Un medio de acuerdo con la reivindicación 14, en el que la información portada sobre el medio comprende un coeficiente de ganancia, información en una señal de primer canal multiplicada por el coeficiente de ganancia, y uno o más bitios menos significativos de la señal de primer canal, que resultan de la señal de primer canal multiplicada y que superan al número de bitios asignados al dicho primer canal.
ES00917191T 1999-04-07 2000-04-07 Generacion de matrices para codificacion y descodificacion sin perdidas de señales de audio multicanal. Expired - Lifetime ES2208297T3 (es)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
GB9907919 1999-04-07
GBGB9907919.6A GB9907919D0 (en) 1999-04-07 1999-04-07 Lossless packing
GB9907918 1999-04-07
GBGB9907918.8A GB9907918D0 (en) 1999-04-07 1999-04-07 Lossless packing

Publications (1)

Publication Number Publication Date
ES2208297T3 true ES2208297T3 (es) 2004-06-16

Family

ID=26315389

Family Applications (1)

Application Number Title Priority Date Filing Date
ES00917191T Expired - Lifetime ES2208297T3 (es) 1999-04-07 2000-04-07 Generacion de matrices para codificacion y descodificacion sin perdidas de señales de audio multicanal.

Country Status (15)

Country Link
US (3) US6611212B1 (es)
EP (4) EP2391146A3 (es)
JP (1) JP4610087B2 (es)
KR (1) KR100915120B1 (es)
AR (1) AR023424A1 (es)
AT (1) ATE255785T1 (es)
AU (1) AU781629B2 (es)
CA (3) CA2742649C (es)
DE (1) DE60006953T2 (es)
DK (1) DK1173925T3 (es)
ES (1) ES2208297T3 (es)
MY (2) MY123651A (es)
SG (2) SG2012056305A (es)
TW (1) TWI226041B (es)
WO (1) WO2000060746A2 (es)

Families Citing this family (113)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001314181A (ja) * 2000-05-10 2001-11-13 Mi Tec:Kk キレート化合物含有酒類
SE0001727L (sv) * 2000-05-10 2001-11-11 Global Ip Sound Ab Överföring över paketförmedlade nät
US7644003B2 (en) * 2001-05-04 2010-01-05 Agere Systems Inc. Cue-based audio coding/decoding
US6804565B2 (en) * 2001-05-07 2004-10-12 Harman International Industries, Incorporated Data-driven software architecture for digital sound processing and equalization
US20020191522A1 (en) * 2001-05-07 2002-12-19 Media Tek, Inc. DVD audio encoder and decoder
US7447321B2 (en) 2001-05-07 2008-11-04 Harman International Industries, Incorporated Sound processing system for configuration of audio signals in a vehicle
US7451006B2 (en) * 2001-05-07 2008-11-11 Harman International Industries, Incorporated Sound processing system using distortion limiting techniques
CN100364234C (zh) * 2001-11-29 2008-01-23 联发科技股份有限公司 声讯的播放系统与无失真压缩编码系统
US6934677B2 (en) 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
EP1585947B1 (en) * 2002-05-03 2020-01-01 Harman International Industries, Incorporated Sound detection and localization system
US6935959B2 (en) * 2002-05-16 2005-08-30 Microsoft Corporation Use of multiple player real-time voice communications on a gaming device
US7299190B2 (en) 2002-09-04 2007-11-20 Microsoft Corporation Quantization and inverse quantization for audio
JP4676140B2 (ja) * 2002-09-04 2011-04-27 マイクロソフト コーポレーション オーディオの量子化および逆量子化
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
CA2588791A1 (en) * 2003-11-27 2005-06-09 Yul Anderson Vsr surround tube headphone
US7460990B2 (en) 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
JP2005215162A (ja) * 2004-01-28 2005-08-11 Dainippon Printing Co Ltd 音響信号の再生装置
DE102004009628A1 (de) * 2004-02-27 2005-10-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Beschreiben einer Audio-CD und Audio-CD
ATE390683T1 (de) 2004-03-01 2008-04-15 Dolby Lab Licensing Corp Mehrkanalige audiocodierung
WO2005098824A1 (en) * 2004-04-05 2005-10-20 Koninklijke Philips Electronics N.V. Multi-channel encoder
US8032360B2 (en) * 2004-05-13 2011-10-04 Broadcom Corporation System and method for high-quality variable speed playback of audio-visual media
KR100918741B1 (ko) * 2004-07-27 2009-09-24 삼성전자주식회사 이동 통신 시스템에서 채널 부호화 장치 및 방법
US7706415B2 (en) * 2004-07-29 2010-04-27 Microsoft Corporation Packet multiplexing multi-channel audio
US7930184B2 (en) * 2004-08-04 2011-04-19 Dts, Inc. Multi-channel audio coding/decoding of random access points and transients
US8204261B2 (en) * 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
SE0402649D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Advanced methods of creating orthogonal signals
CN101053017B (zh) * 2004-11-04 2012-10-10 皇家飞利浦电子股份有限公司 多通道音频信号的编码和解码
EP1817767B1 (en) * 2004-11-30 2015-11-11 Agere Systems Inc. Parametric coding of spatial audio with object-based side information
KR100682904B1 (ko) * 2004-12-01 2007-02-15 삼성전자주식회사 공간 정보를 이용한 다채널 오디오 신호 처리 장치 및 방법
US7903824B2 (en) * 2005-01-10 2011-03-08 Agere Systems Inc. Compact side information for parametric coding of spatial audio
EP1691348A1 (en) * 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametric joint-coding of audio sources
RU2411594C2 (ru) 2005-03-30 2011-02-10 Конинклейке Филипс Электроникс Н.В. Кодирование и декодирование аудио
DE102005014477A1 (de) * 2005-03-30 2006-10-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Datenstroms und zum Erzeugen einer Multikanal-Darstellung
US7751572B2 (en) 2005-04-15 2010-07-06 Dolby International Ab Adaptive residual audio coding
JP4988717B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
US8214220B2 (en) * 2005-05-26 2012-07-03 Lg Electronics Inc. Method and apparatus for embedding spatial information and reproducing embedded signal for an audio signal
WO2006126843A2 (en) * 2005-05-26 2006-11-30 Lg Electronics Inc. Method and apparatus for decoding audio signal
US7958424B2 (en) * 2005-06-22 2011-06-07 Trident Microsystems (Far East) Ltd. Multi-channel LDPC decoder architecture
JP2009500657A (ja) * 2005-06-30 2009-01-08 エルジー エレクトロニクス インコーポレイティド オーディオ信号をエンコーディング及びデコーディングするための装置とその方法
WO2007004833A2 (en) * 2005-06-30 2007-01-11 Lg Electronics Inc. Method and apparatus for encoding and decoding an audio signal
EP1946294A2 (en) 2005-06-30 2008-07-23 LG Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
US7630882B2 (en) * 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
US7562021B2 (en) * 2005-07-15 2009-07-14 Microsoft Corporation Modification of codewords in dictionary used for efficient coding of digital media spectral data
KR20080049735A (ko) * 2005-08-30 2008-06-04 엘지전자 주식회사 오디오 신호의 디코딩 방법 및 장치
WO2007027056A1 (en) 2005-08-30 2007-03-08 Lg Electronics Inc. A method for decoding an audio signal
US7765104B2 (en) * 2005-08-30 2010-07-27 Lg Electronics Inc. Slot position coding of residual signals of spatial audio coding application
US7788107B2 (en) * 2005-08-30 2010-08-31 Lg Electronics Inc. Method for decoding an audio signal
US8577483B2 (en) * 2005-08-30 2013-11-05 Lg Electronics, Inc. Method for decoding an audio signal
US7770090B1 (en) 2005-09-14 2010-08-03 Trident Microsystems (Far East) Ltd. Efficient decoders for LDPC codes
CN101278331B (zh) * 2005-10-03 2013-03-13 夏普株式会社 显示装置
US7672379B2 (en) * 2005-10-05 2010-03-02 Lg Electronics Inc. Audio signal processing, encoding, and decoding
US7646319B2 (en) * 2005-10-05 2010-01-12 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
US7751485B2 (en) * 2005-10-05 2010-07-06 Lg Electronics Inc. Signal processing using pilot based coding
US7696907B2 (en) * 2005-10-05 2010-04-13 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
KR100857120B1 (ko) * 2005-10-05 2008-09-05 엘지전자 주식회사 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치
WO2007040365A1 (en) 2005-10-05 2007-04-12 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
US8073703B2 (en) * 2005-10-07 2011-12-06 Panasonic Corporation Acoustic signal processing apparatus and acoustic signal processing method
US7974713B2 (en) 2005-10-12 2011-07-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Temporal and spatial shaping of multi-channel audio signals
US20080255859A1 (en) * 2005-10-20 2008-10-16 Lg Electronics, Inc. Method for Encoding and Decoding Multi-Channel Audio Signal and Apparatus Thereof
US7716043B2 (en) 2005-10-24 2010-05-11 Lg Electronics Inc. Removing time delays in signal paths
EP1946310A4 (en) 2005-10-26 2011-03-09 Lg Electronics Inc METHOD FOR CODING AND DECODING A MULTI CHANNEL AUDIO SIGNAL AND DEVICE THEREFOR
US7752053B2 (en) * 2006-01-13 2010-07-06 Lg Electronics Inc. Audio signal processing using pilot based coding
US8208641B2 (en) * 2006-01-19 2012-06-26 Lg Electronics Inc. Method and apparatus for processing a media signal
US7831434B2 (en) * 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
US8190425B2 (en) * 2006-01-20 2012-05-29 Microsoft Corporation Complex cross-correlation parameters for multi-channel audio
US7953604B2 (en) * 2006-01-20 2011-05-31 Microsoft Corporation Shape and scale parameters for extended-band frequency coding
US9306852B2 (en) * 2006-01-27 2016-04-05 Avaya Inc. Coding and packet distribution for alternative network paths in telecommunications networks
US8285556B2 (en) * 2006-02-07 2012-10-09 Lg Electronics Inc. Apparatus and method for encoding/decoding signal
US7907579B2 (en) * 2006-08-15 2011-03-15 Cisco Technology, Inc. WiFi geolocation from carrier-managed system geolocation of a dual mode device
MY145497A (en) * 2006-10-16 2012-02-29 Dolby Sweden Ab Enhanced coding and parameter representation of multichannel downmixed object coding
BRPI0715312B1 (pt) 2006-10-16 2021-05-04 Koninklijke Philips Electrnics N. V. Aparelhagem e método para transformação de parâmetros multicanais
US20080175137A1 (en) * 2007-01-23 2008-07-24 Mediatek Inc. Method for encoding data written to optical storage media
US7761290B2 (en) 2007-06-15 2010-07-20 Microsoft Corporation Flexible frequency and time partitioning in perceptual transform coding of audio
US8046214B2 (en) * 2007-06-22 2011-10-25 Microsoft Corporation Low complexity decoder for complex transform coding of multi-channel sound
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
BRPI0816557B1 (pt) * 2007-10-17 2020-02-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Codificação de áudio usando upmix
US8249883B2 (en) * 2007-10-26 2012-08-21 Microsoft Corporation Channel extension coding for multi-channel source
KR101158096B1 (ko) * 2008-11-18 2012-06-22 삼성전자주식회사 다중 송수신 안테나 시스템에서 서로 다른 변조 차수를 갖는 복수의 레이어의 재정렬 방법, 신호 검출 방법 및 그 수신 장치
GB2466673B (en) 2009-01-06 2012-11-07 Skype Quantization
GB2466671B (en) 2009-01-06 2013-03-27 Skype Speech encoding
GB2466675B (en) * 2009-01-06 2013-03-06 Skype Speech coding
BR112012007138B1 (pt) 2009-09-29 2021-11-30 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Decodificador de sinal de áudio, codificador de sinal de áudio, método para prover uma representação de mescla ascendente de sinal, método para prover uma representação de mescla descendente de sinal e fluxo de bits usando um valor de parâmetro comum de correlação intra- objetos
US9305550B2 (en) * 2009-12-07 2016-04-05 J. Carl Cooper Dialogue detector and correction
US9138178B2 (en) * 2010-08-05 2015-09-22 Ace Communications Limited Method and system for self-managed sound enhancement
KR101756838B1 (ko) * 2010-10-13 2017-07-11 삼성전자주식회사 다채널 오디오 신호를 다운 믹스하는 방법 및 장치
EP2477188A1 (en) * 2011-01-18 2012-07-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoding and decoding of slot positions of events in an audio signal frame
US9171549B2 (en) 2011-04-08 2015-10-27 Dolby Laboratories Licensing Corporation Automatic configuration of metadata for use in mixing audio programs from two encoded bitstreams
CN107025909B (zh) 2011-10-21 2020-12-29 三星电子株式会社 能量无损编码方法和设备以及能量无损解码方法和设备
GB2524424B (en) 2011-10-24 2016-04-27 Graham Craven Peter Lossless buried data
WO2013120510A1 (en) 2012-02-14 2013-08-22 Huawei Technologies Co., Ltd. A method and apparatus for performing an adaptive down- and up-mixing of a multi-channel audio signal
ITTO20120274A1 (it) * 2012-03-27 2013-09-28 Inst Rundfunktechnik Gmbh Dispositivo per il missaggio di almeno due segnali audio.
TWI505262B (zh) * 2012-05-15 2015-10-21 Dolby Int Ab 具多重子流之多通道音頻信號的有效編碼與解碼
WO2013192111A1 (en) 2012-06-19 2013-12-27 Dolby Laboratories Licensing Corporation Rendering and playback of spatial audio using channel-based audio systems
EP2873073A1 (en) * 2012-07-12 2015-05-20 Dolby Laboratories Licensing Corporation Embedding data in stereo audio using saturation parameter modulation
KR101660004B1 (ko) * 2012-08-03 2016-09-27 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 멀티채널 다운믹스/업믹스 케이스들에 대해 매개변수 개념을 이용한 멀티-인스턴스 공간-오디오-오브젝트-코딩을 위한 디코더 및 방법
US9373335B2 (en) 2012-08-31 2016-06-21 Dolby Laboratories Licensing Corporation Processing audio objects in principal and supplementary encoded audio signals
WO2014127279A1 (en) 2013-02-14 2014-08-21 Singer Howard M Methods, systems, and media for indicating digital media content quality to a user
CN109712630B (zh) * 2013-05-24 2023-05-30 杜比国际公司 包括音频对象的音频场景的高效编码
TWI557724B (zh) 2013-09-27 2016-11-11 杜比實驗室特許公司 用於將 n 聲道音頻節目編碼之方法、用於恢復 n 聲道音頻節目的 m 個聲道之方法、被配置成將 n 聲道音頻節目編碼之音頻編碼器及被配置成執行 n 聲道音頻節目的恢復之解碼器
EP2854133A1 (en) 2013-09-27 2015-04-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Generation of a downmix signal
CN106463125B (zh) * 2014-04-25 2020-09-15 杜比实验室特许公司 基于空间元数据的音频分割
US9794712B2 (en) 2014-04-25 2017-10-17 Dolby Laboratories Licensing Corporation Matrix decomposition for rendering adaptive audio using high definition audio codecs
WO2016050900A1 (en) * 2014-10-03 2016-04-07 Dolby International Ab Smart access to personalized audio
WO2016168408A1 (en) 2015-04-17 2016-10-20 Dolby Laboratories Licensing Corporation Audio encoding and rendering with discontinuity compensation
TWI596955B (zh) * 2015-07-09 2017-08-21 元鼎音訊股份有限公司 具有測試功能之助聽器
WO2017019674A1 (en) 2015-07-28 2017-02-02 Dolby Laboratories Licensing Corporation Audio discontinuity detection and correction
GB2547877B (en) * 2015-12-21 2019-08-14 Graham Craven Peter Lossless bandsplitting and bandjoining using allpass filters
US10146500B2 (en) * 2016-08-31 2018-12-04 Dts, Inc. Transform-based audio codec and method with subband energy smoothing
AU2017357454B2 (en) 2016-11-08 2021-02-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for downmixing or upmixing a multichannel signal using phase compensation
US10522155B2 (en) * 2017-02-21 2019-12-31 Cirrus Logic, Inc. Pulse code modulation (PCM) data-marking
TWI739297B (zh) * 2020-02-06 2021-09-11 瑞昱半導體股份有限公司 音訊處理裝置及音訊處理方法
WO2023191796A1 (en) * 2022-03-31 2023-10-05 Zeku, Inc. Apparatus and method for data compression and data upsampling

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4113506A1 (de) * 1991-04-25 1992-10-29 Thomson Brandt Gmbh Verfahren zur kompatiblen uebertragung von progressiv abgetasteten bildsignalen im zwischenzeilen-format
US5396228A (en) * 1992-01-16 1995-03-07 Mobile Telecommunications Technologies Methods and apparatus for compressing and decompressing paging data
EP0631458B1 (en) * 1993-06-22 2001-11-07 Deutsche Thomson-Brandt Gmbh Method for obtaining a multi-channel decoder matrix
US5684714A (en) * 1995-05-08 1997-11-04 Kabushiki Kaisha Toshiba Method and system for a user to manually alter the quality of a previously encoded video sequence
US5623424A (en) * 1995-05-08 1997-04-22 Kabushiki Kaisha Toshiba Rate-controlled digital video editing method and system which controls bit allocation of a video encoder by varying quantization levels
GB9509831D0 (en) * 1995-05-15 1995-07-05 Gerzon Michael A Lossless coding method for waveform data
US5963256A (en) * 1996-01-11 1999-10-05 Sony Corporation Coding according to degree of coding difficulty in conformity with a target bit rate
US5731837A (en) * 1996-01-25 1998-03-24 Thomson Multimedia, S.A. Quantization circuitry as for video signal compression systems
US5715187A (en) * 1996-03-04 1998-02-03 Holtek Microelectronics, Inc. Method and apparatus for integer multiplication
US5839100A (en) * 1996-04-22 1998-11-17 Wegener; Albert William Lossless and loss-limited compression of sampled data signals
US5832490A (en) * 1996-05-31 1998-11-03 Siemens Medical Systems, Inc. Lossless data compression technique that also facilitates signal analysis
US5848106A (en) * 1996-12-16 1998-12-08 Ericsson, Inc. Receiver decoder circuitry, and associated method, for decoding an encoded signal
GB2323754B (en) * 1997-01-30 2002-03-20 Peter Graham Craven Lossless compression using iir prediction filters
KR100251453B1 (ko) * 1997-08-26 2000-04-15 윤종용 고음질 오디오 부호화/복호화장치들 및 디지털다기능디스크
US6023233A (en) * 1998-03-20 2000-02-08 Craven; Peter G. Data rate control for variable rate compression systems

Also Published As

Publication number Publication date
TWI226041B (en) 2005-01-01
CA2365529C (en) 2011-08-30
EP1370114A3 (en) 2004-03-17
AR023424A1 (es) 2002-09-04
MY123651A (en) 2006-05-31
EP2391146A3 (en) 2011-12-14
EP2391146A2 (en) 2011-11-30
EP2339756A2 (en) 2011-06-29
CA2742649C (en) 2014-11-04
ATE255785T1 (de) 2003-12-15
US20050007262A1 (en) 2005-01-13
JP2002541524A (ja) 2002-12-03
US6774820B2 (en) 2004-08-10
MY149792A (en) 2013-10-14
US20040070523A1 (en) 2004-04-15
DE60006953T2 (de) 2004-10-28
DK1173925T3 (da) 2004-03-29
CA2365529A1 (en) 2000-10-12
SG2012056305A (en) 2015-09-29
SG144695A1 (en) 2008-08-28
CA2742649A1 (en) 2000-10-12
DE60006953D1 (de) 2004-01-15
AU781629B2 (en) 2005-06-02
KR20010113782A (ko) 2001-12-28
WO2000060746A3 (en) 2001-03-08
KR100915120B1 (ko) 2009-09-03
EP1173925A2 (en) 2002-01-23
AU3828400A (en) 2000-10-23
EP2339756A3 (en) 2011-12-21
EP1370114A2 (en) 2003-12-10
US6611212B1 (en) 2003-08-26
US7193538B2 (en) 2007-03-20
EP1173925B1 (en) 2003-12-03
CA2859333A1 (en) 2000-10-12
WO2000060746A2 (en) 2000-10-12
JP4610087B2 (ja) 2011-01-12

Similar Documents

Publication Publication Date Title
ES2208297T3 (es) Generacion de matrices para codificacion y descodificacion sin perdidas de señales de audio multicanal.
ES2203694T3 (es) Metodo de codificacion sin perdidas para datos en forma de ondas.
ES2454670T3 (es) Generación de una señal multicanal codificada y decodificación de una señal multicanal codificada
EP2859548B1 (en) Doubly compatible lossless audio bandwidth extension
ES2093250T5 (es) Descodificador para la presentacion por un numero variable de canales de campos de sonido multidimensional.
Gerzon et al. A high-rate buried-data channel for audio CD
US20130016843A1 (en) Compatible multi-channel coding/decoding
WO1994018762A1 (en) Transmission of digital data words representing a signal waveform
AU2005204293B2 (en) Matrix improvements to lossless encoding and decoding
CA2585240C (en) Lossless coding method for waveform data
JP4534112B2 (ja) 符号化装置および方法、復号装置および方法、記録媒体、並びにプログラム