ES2093250T5 - Descodificador para la presentacion por un numero variable de canales de campos de sonido multidimensional. - Google Patents

Descodificador para la presentacion por un numero variable de canales de campos de sonido multidimensional.

Info

Publication number
ES2093250T5
ES2093250T5 ES92903819T ES92903819T ES2093250T5 ES 2093250 T5 ES2093250 T5 ES 2093250T5 ES 92903819 T ES92903819 T ES 92903819T ES 92903819 T ES92903819 T ES 92903819T ES 2093250 T5 ES2093250 T5 ES 2093250T5
Authority
ES
Spain
Prior art keywords
channels
signals
channel
presentation
subband
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
ES92903819T
Other languages
English (en)
Other versions
ES2093250T3 (es
Inventor
Mark Franklin Davis
Craig Campbell Todd
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby Laboratories Licensing Corp
Original Assignee
Dolby Laboratories Licensing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=27093203&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=ES2093250(T5) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Dolby Laboratories Licensing Corp filed Critical Dolby Laboratories Licensing Corp
Publication of ES2093250T3 publication Critical patent/ES2093250T3/es
Application granted granted Critical
Publication of ES2093250T5 publication Critical patent/ES2093250T5/es
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic

Landscapes

  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Analogue/Digital Conversion (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Television Receiver Circuits (AREA)
  • Television Systems (AREA)
  • Time-Division Multiplex Systems (AREA)

Abstract

LA INVENCION SE REFIERE EN GENERAL A LA REPRESENTACION DE SEÑALES MULTIPLEX. DE MANERA MAS PARTICULAR, ESTA INVENCION SE REFIERE A LA DECODIFICACION DE SEÑALES DE AUDIO MULTIPLEX QUE REPRESENTAN CAMPOS ACUSTICOS MULTIDIMENSIONALES MEDIANTE UNO O MAS CANALES DE SALIDA, EN DONDE LA COMPLEJIDAD DE LA DECODIFICACION ES LIGERAMENTE PROPORCIONAL AL NUMERO DE CANALES UTILIZADAS PARA PRESENTAR LA SEÑAL DECODIFICADA QUE PUEDE SER DIFERENTE DEL NUMERO DE CANALES DE SALIDA.

Description

Descodificador para la presentación por un número variable de canales de campos de sonido multidimensional.
Campo técnico
La invención se refiere en general a la reproducción de señales multicanal. Más en particular, la invención se refiere a la descodificación de señales acústicas multicanal que representan campos de sonido multidimensionales expedidos por dos o más canales de expedición, en que la complejidad de la descodificación es aproximadamente proporcional al número de canales usado para presentar la señal descodificada, que puede diferir del número de canales de expedición.
Antecedentes de la técnica
Un objetivo para una reproducción de alta fidelidad de sonidos grabados o transmitidos es la presentación en otro tiempo o posición tan fielmente como sea posible de una representación de un campo de sonido "original", dadas las limitaciones del sistema de presentación o reproducción. Un campo de sonido es definido como un conjunto de presiones de sonido que son una función del tiempo y el espacio. De este modo, la reproducción de alta fidelidad pretende recrear las presiones acústicas que existían en el campo de sonido original en una región en torno a un oyente.
Idealmente, las diferencias entre el campo de sonido original y el campo de sonido reproducido son inaudibles, o si no son inaudibles pasan por lo menos relativamente desapercibidas para la mayoría de los oyentes. Dos medidas generales de fidelidad son la "calidad del sonido" y la "localización del campo de sonido".
La calidad del sonido incluye características de reproducción tales como el intervalo de frecuencias (anchura de banda), la precisión de los niveles relativos de amplitud a través del intervalo de frecuencias (timbre), el intervalo de niveles de amplitud de sonido (intervalo dinámico), la precisión de la fase y la amplitud armónicas (nivel de distorsión), y el nivel de amplitud y la frecuencia de sonidos espúreos y artificios no presentes en el sonido original (ruido). Aunque la mayoría de los aspectos de la calidad del sonido son susceptibles de ser medidos por instrumentos, en los sistemas prácticos las características del sistema de audición humano (efectos psicoacústicos) hacen inaudibles o hacen pasar relativamente desapercibidas ciertas desviaciones medibles o mensurables respecto a los sonidos "originales".
La localización del campo de sonido es una medida de fidelidad espacial. La preservación de la dirección aparente (tanto acimut como elevación) y de la distancia de una fuente de sonido es conocida algunas veces como localización angular y de profundidad, respectivamente. En el caso de ciertas grabaciones de orquestas y otras grabaciones, esta localización pretende transmitir al oyente la situación física real de los músicos y sus instrumentos. Con respecto a otras grabaciones, en particular grabaciones de múltiples pistas producidas en un estudio, la direccionalidad angular y la profundidad pueden no albergar ninguna relación con cualquier disposición "real" de fuentes de sonido y la localización es meramente una parte de la impresión artística general que se pretende transmitir al oyente. Por ejemplo, una voz que parece originarse en un punto específico en el espacio puede ser añadida a un campo de sonido pregrabado. En cualquier caso, un propósito de los sistemas de reproducción multicanal de alta fidelidad es reproducir aspectos espaciales de un campo de sonido en desarrollo, sea real o sintetizado. En lo que respecta a la calidad del sonido, en los sistemas prácticos las variaciones medibles en la localización son, bajo ciertas condiciones, inaudibles o pasan relativamente desapercibidas debido a las características de la audición humana.
Es suficiente reconocer que un productor de campos de sonido puede desarrollar señales grabadas o transmitidas que, en conjunción con un sistema de reproducción, presentarán a un oyente humano un campo de sonido que posee características específicas en calidad de sonido y localización del campo de sonido. El campo de sonido presentado al oyente puede constituir una aproximación estrecha del campo de sonido ideal pretendido por el productor o puede desviarse de él dependiendo de muchos factores que incluyen el equipo de reproducción y el entorno acústico de reproducción.
Un campo de sonido capturado para la transmisión o la reproducción es representado habitualmente en algún punto por una o más señales eléctricas. Tales señales constituyen usualmente uno o más canales en el punto de captura del campo de sonido ("canales de captura"), en el punto de transmisión o grabación del campo de sonido ("canales de transmisión"), y en el punto de presentación del campo de sonido ("canales de presentación"). Aunque dentro de algunos límites cuando el número de estos canales de sonido se incrementa, la capacidad para reproducir campos de sonido complejos se incrementa, consideraciones prácticas imponen límites al número de tales canales.
En la mayoría de los casos, si no en todos, el productor de campos de sonido trabaja en un sistema relativamente bien definido en el cual hay entornos y configuraciones de canales de presentación conocidos. Por ejemplo, se espera generalmente que una grabación estereofónica de dos canales sea presentada a través o bien de dos canales de presentación ("estereofónica") o de un canal de presentación ("monofónica"). La grabación es optimizada habitualmente para sonar bien a la mayoría de los oyentes que tienen un equipo de reproducción o bien estereofónico o bien monofónico. Como otro ejemplo, una grabación de múltiples canales en estéreo con sonido de ambiente para películas es realizada suponiendo que los cines tendrán o bien una disposición conocida, generalmente estándar para presentar los canales izquierdo, central, derecho, bajo y de ambiente o bien, alternativamente, una reproducción monofónica "Academy" clásica. Tales grabaciones son realizadas también suponiendo que serán reproducidas por equipos domésticos de reproducción que abarcan desde sistemas de un único canal de presentación tales como un pequeño altavoz en un equipo de televisión hasta sistemas relativamente sofisticados de múltiples canales de presentación con sonido de ambiente.
Se usan a veces diversas técnicas para reducir el número de canales de transmisión requeridos para transportar señales que representan campos de sonido multidimensionales. Un ejemplo de una técnica tal es un sistema de matrices 4-2-4 que combina cuatro canales en dos canales de transmisión para la transmisión o el almacenamiento, de los cuales son extraídos cuatro canales de presentación para la reproducción. Idealmente, tales técnicas no deben crear variaciones audibles en el campo de sonido cuando es presentado.
Tales técnicas pueden ser usadas sin desviarse del alcance de la presente invención; sin embargo, puede no ser siempre deseable hacerlo. El uso de estas técnicas hace necesario desarrollar el concepto de un "canal de expedición". Un canal de expedición representa un canal discreto de codificador, o un conjunto de información que es codificada independientemente. Un canal de expedición corresponde a un canal de transmisión en sistemas que no usan técnicas para reducir el número de canales de transmisión. Por ejemplo, un sistema de matrices 4-2-4 lleva cuatro canales de expedición sobre dos canales de transmisión, ostensiblemente para la reproducción utilizando cuatro canales de presentación. La presente invención está dirigida hacia la selección de un número de canales de presentación que difiere del número de canales de expedición.
Un ejemplo de una técnica simple que genera un canal de presentación en respuesta a dos canales de expedición es la suma de dos canales de expedición para formar un canal de presentación. Si una señal es muestreada y codificada digitalmente utilizando la modulación por impulsos codificados (MIC), la suma de dos canales de expedición puede ser realizada en el dominio digital añadiendo muestras de MIC que representan a cada canal y convirtiendo las muestras sumadas en una señal analógica mediante la utilización de un convertidor de digital a analógico (CDA). La suma de dos señales codificadas en MIC puede ser realizada también en el dominio analógico convirtiendo las muestras de MIC para cada canal de expedición en una señal analógica mediante la utilización de dos convertidores CDA y sumando las dos señales analógicas. Se prefiere habitualmente realizar la suma en el dominio digital porque un sumador digital es generalmente más preciso y menos costoso de implementar que utilizar un segundo CDA de alta precisión.
Esta técnica se hace mucho más compleja, sin embargo, si las muestras de señales son codificadas digitalmente en una forma no lineal en vez de ser codificadas en MIC lineal. Formas no lineales puede ser generadas por métodos de codificación tales como cuantificación logarítmica, normalización de representaciones en coma flotante, y asignación adaptativa de bits para representar cada muestra.
Las representaciones no lineales son usadas frecuentemente en sistemas de codificador/descodifica-
dor para reducir la cantidad de información requerida para representar la señal codificada. Tales representaciones pueden ser transportadas por canales de transmisión con capacidad de información reducida, tales como vías de transmisión de menor anchura de banda o ruidosas, o por medios de grabación con menor capacidad de almacenamiento.
Las representaciones no lineales no necesitan reducir los requerimientos de información. Pueden ser usadas varias formas de empaquetamiento de la información sólo para facilitar la detección y corrección de errores de transmisión. Los términos amplios "formateado" y "formatear" serán usados aquí para hacer referencia a representaciones no lineales y para obtener tales representaciones, respectivamente. Los términos "desformateado" y "desformatear" harán referencia a representaciones lineales reconstruidas y a la obtención de tales representaciones lineales reconstruidas, respectivamente.
Debe mencionarse que lo que constituye una representación "lineal" depende de los métodos de procesamiento de señales empleados. Por ejemplo, una representación en coma flotante es lineal para un procesador de señales digitales (PSD) que puede realizar aritmética con operandos en coma flotante, pero tal representación es no lineal para un PSD que sólo puede realizar aritmética de enteros. El significado de "lineal" será discutido adicionalmente en conexión con los modos para llevar a cabo la invención, más adelante.
Un descodificador debe utilizar técnicas de desformateado inversas a las técnicas de formateado utilizadas para formatear la información para obtener una representación como la MIC que puede ser sumada como se ha descrito arriba.
Dos técnicas de codificación que utilizan el formateado para reducir los requerimientos de información son la codificación de subbanda y la codificación de transformada. Los codificadores de subbanda y de transformada intentan reducir la cantidad de información transmitida en bandas de frecuencia particulares en que la imprecisión de codificación o el ruido de codificación resultante es enmascarado psicoacústicamente por componentes espectrales contiguos. Los efectos de enmascaramiento psicoacústico usualmente pueden ser explotados de modo más eficiente si las anchuras de banda de las bandas de frecuencia son elegidas de modo conmensurable con las anchuras de banda de las "bandas críticas" del oído humano. Véase, en general, el Audio Engineering Handbook, K. Blair Benson ed., McGraw-Hill, San Francisco, 1988, páginas 1.40-1.42 y 4.8-4.10. En toda la descripción que sigue, el término "subbanda" se referirá a partes de la anchura de banda de la señal útil, implementadas bien por un codificador de subbanda auténtica, por un codificador de transformada, o por otra técnica. El término "codificador de subbanda" se referirá a los codificadores de subbanda auténtica, codificadores de transformada, u otras técnicas que trabajan sobre dichas "subbandas".
Las señales en una forma formateada no pueden ser sumadas directamente; por lo tanto, cada uno de los dos canales de expedición debe ser descodificado antes de que puedan ser combinados por suma. Generalmente, las técnicas de descodificación tales como la descodificación de subbanda son relativamente costosas de implementar. Por lo tanto, la presentación monofónica de una señal de dos canales cuesta aproximadamente el doble que una presentación monofónica de una señal de un canal. El coste es aproximadamente el doble porque se necesita un descodificador costoso para cada canal de expedición.
Un método de la técnica anterior que evita gravar el coste de la presentación monofónica de señales de dos canales es la aplicación de matrices. Es importante distinguir la aplicación de matrices para reducir el número de canales de presentación de la aplicación de matrices para reducir el número de canales de transmisión. Aunque son matemáticamente similares, cada técnica está dirigida a muy diferentes aspectos de la transmisión y reproducción de señales.
Un ejemplo simple de la aplicación de matrices codifica dos canales, A y B, en unos canales de expedición de SUMA y DIFERENCIA de acuerdo con
SUMA = A + B,
y
DIFERENCIA = A - B.
Para una reproducción estereofónica de dos canales, un sistema de presentación puede obtener la señal de dos canales original utilizando dos descodificadores para descodificar cada canal de expedición y desaplicando las matrices de los canales descodificados de acuerdo con
A' = 1/2 \cdot(SUMA + DIFERENCIA),
y
B' = 1/2 \cdot(SUMA - DIFERENCIA).
La notación A' y B' es usada para representar el hecho de que en los sistemas prácticos, las señales recuperadas al desaplicar las matrices generalmente no corresponden exactamente a las señales originales a las que se aplicaron matrices.
Para una reproducción monofónica, un sistema de presentación puede obtener una suma de la señal original de dos canales utilizando sólo un descodificador para descodificar el canal de expedición de SUMA.
Aunque la aplicación de matrices resuelve el problema del coste desproporcionado de la presentación monofónica de dos canales de expedición, sufre de lo que puede ser percibido como modulación de ruido de canales cruzados cuando se usa en conjunción con técnicas de codificación que reducen los requerimientos de información de la señal codificada. Por ejemplo, la "compresión-expansión" puede ser usada para señales analógicas, y varios métodos de reducción de la velocidad de transmisión de bits pueden ser usados para señales digitales. La aplicación de tales técnicas estimula el ruido en la señal de salida del descodificador. La intención y la expectativa es que este ruido sea enmascarado por la señal acústica que lo estimuló, y por lo tanto que sea inaudible. Cuando tales técnicas son empleadas en señales a las que se han aplicado matrices, la señal de salida de las matrices puede ser incapaz de enmascarar el ruido.
Supóngase que un codificador por matrices codifica los canales A y B, en que sólo el canal B contiene una señal acústica. Normalmente, se introducirá ruido en los canales de SUMA y DIFERENCIA cuando las señales de SUMA y DIFERENCIA son codificadas para la transmisión con un compresor-expansor analógico o una técnica digital de reducción de la velocidad de transmisión de bits. Durante la descodificación, el canal de presentación A' se obtendrá a partir de la suma de los canales de expedición de SUMA y DIFERENCIA. Aunque el canal de presentación A' no contendrá ninguna señal acústica, contendrá la suma del ruido de modulación analógica o el ruido de codificación digital introducido independientemente en cada uno de los canales de expedición de SUMA y de DIFERENCIA. El canal de presentación A' no contendrá ninguna señal acústica para enmascarar psicoacústicamente el ruido. Además, el ruido en el canal A' puede no ser enmascarado por la señal acústica en el canal B' porque el oído puede discernir habitualmente el ruido de las señales acústicas, especialmente cuando el ruido y la señal tienen diferente localización angular.
Otro método de la técnica anterior está expuesto en el documento EP-A-0.372.601 y en Kate, y col., "Digital Audio Carrying Extra Information," ICASSP 90 Proceedings, Abril de 1990, vol. 2, páginas 1097-1100. De acuerdo con esta técnica, una señal acústica primaria es dividida en señales de subbanda y cada señal de subbanda es cuantificada utilizando un valor qstep de paso de cuantificación tal que el ruido de cuantificación resultante está estimado que sea justo inaudible. Una señal auxiliar, preferentemente una que está correlacionada con la señal acústica primaria, es dividida en señales de subbanda y cada señal de subbanda es atenuada y cuantificada en un intervalo de valores desde -1/2 qstep hasta +1/2 qstep y añadida a la respectiva señal de subbanda acústica primaria cuantificada. Las señales de subbanda compuestas son pasadas a través de un banco de filtro de síntesis para generar una señal de banda ancha que tenga un formato compatible con los receptores existentes.
Los receptores con descodificadores especiales pueden recuperar la señal acústica auxiliar cuantificada. El descodificador especial divide la señal de banda ancha en señales de subbanda, determina el mismo valor qstep de paso de cuantificación utilizado en el codificador para recuperar las señales de subbanda acústicas primarias cuantificadas, y obtiene las señales de subbanda acústicas auxiliares a partir de la diferencia entre las dos. La señal acústica auxiliar es recuperada invirtiendo los efectos de la atenuación aplicada en el codificador y aplicando un banco de filtro de síntesis a las señales de subbanda resultantes.
Los receptores existentes pueden reproducir la señal acústica primaria sin descodificadores especiales; la señal acústica especial no es percibida porque está combinada en la señal de banda ancha de una manera tal que está enmascarada por la energía espectral en la señal acústica primaria.
Por un lado, esta técnica proporciona unos costes de implementación muy bajos para receptores que no reproducen la señal acústica auxiliar porque no se necesita ningún descodificador especial. Por otro lado, esta técnica produce unos costes de implementación muy elevados para receptores que reproducen la señal auxiliar, independientemente del número de canales de presentación, porque se necesita tanto un banco de filtro de análisis como un banco de filtro de síntesis para cada señal acústica auxiliar. Además, esta técnica requiere una cuantificación perceptiva y requiere el uso de un formato de señales de banda ancha que puede imponer unos requerimientos de velocidad de transmisión de bits y/o de anchura de banda de canal que no sean óptimos.
Las técnicas usadas para controlar el número de canales de presentación se convierten en un problema aún mayor cuando están implicados más de dos canales de expedición. Por ejemplo, las bandas sonoras de películas contienen típicamente cuatro canales: izquierdo, central, derecho y de ambiente. Algunas propuestas actuales para películas futuras y aplicaciones avanzadas de televisión sugieren cinco canales más un sexto subcanal de frecuencias bajas de anchura de banda limitada. Cuando unas señales de múltiples canales en una forma formateada son expedidas a los consumidores para la reproducción en equipos domésticos monofónicos y de dos canales, surge la cuestión de cómo obtener de modo económico una señal apta para la presentación de uno y dos canales al tiempo que se evita el efecto de modulación de ruido de canales cruzados descrito arriba.
Descripción de la invención
Es un objetivo de la presente invención procurar la descodificación de uno o más canales de expedición de señales codificadas para representar en una forma formateada un campo de sonido multidimensional sin artificios percibidos como modulación de ruido de canales cruzados, en que la complejidad o coste de la descodificación es aproximadamente proporcional al número de canales de presentación. Aunque un descodificador que incorpora la presente invención puede ser implementado utilizando técnicas analógicas o digitales o incluso una combinación híbrida de tales técnicas, la invención es implementada de modo más conveniente utilizando técnicas digitales y las realizaciones preferidas descritas aquí son implementaciones digitales.
De acuerdo con las enseñanzas de la presente invención, en una realización, un descodificador de transformada recibe una señal codificada en una forma formateada que comprende uno o más canales de expedición. Una representación desformateada es generada para cada canal de expedición. Cada canal de información desformateada es distribuido en una o más transformadas inversas para la síntesis de la señal de salida, una transformada inversa para cada canal de presentación.
Como se ha descrito arriba, la presente invención se aplica a codificadores de subbanda implementados por una de varias técnicas. Una implementación preferida utiliza una transformada, más en particular una transformada del dominio de tiempo al dominio de frecuencias de acuerdo con la técnica de cancelación de la enajenación en el dominio de tiempo (TDAC, del inglés "Time Domain Aliasing Cancellation"). Véase Princen y Bradley, "Analysis/Synthesis Filter Bank Design Based on Time Domain Aliasing Cancellation," IEEE Trans. on Acoust., Speech, Signal Proc., vol. ASSP-34, 1986, páginas 1153-1161. Un ejemplo de un sistema de codificador/descodificador por transformada que utiliza una transformada TDAC es proporcionado en la publicación de solicitud de patente internacional número WO 90/09022, publicada el 9 de Agosto de 1990.
Las diversas características de la invención y sus realizaciones preferidas son expuestas en mayor detalle en los siguientes modos para llevar a cabo la invención y en los dibujos adjuntos.
Breve descripción de los dibujos
La figura 1 es un diagrama de bloques funcional que ilustra la estructura básica de una realización que incorpora la invención, distribuyendo cuatro canales de expedición en dos canales de presentación.
\newpage
La figura 2 es un diagrama de bloques funcional que ilustra la estructura básica de un descodificador de subbanda de un único canal.
La figura 3 es un diagrama de bloques funcional que ilustra la estructura básica de un descodificador de subbanda de múltiples canales que distribuye cuatro canales de expedición descodificados en dos canales de presentación.
La figura 4 es una diagrama de bloques funcional que ilustra la estructura básica de una realización que incorpora la invención, distribuyendo cuatro canales de expedición en un canal de presentación.
Modos para llevar a cabo la invención
La figura 2 ilustra la estructura básica de un típico descodificador 200 de subbanda de un único canal. Las señales de subbanda codificadas recibidas del canal 202 de expedición son desformateadas a una forma lineal por el desformateador 204, y el sintetizador 206 genera a lo largo del canal 208 de presentación una representación de anchura de banda completa de la señal recibida. Debe apreciarse que una implementación práctica de un descodificador puede incorporar características adicionales tales como un circuito intermedio para el canal 202 de expedición, y un convertidor de digital a analógico y un filtro de paso bajo para el canal 208 de presentación, que no se muestran.
Como se ha mencionado brevemente arriba, el desformateador 204 debe obtener una representación lineal utilizando un método inverso al usado por un codificador acompañante que generó la representación no lineal. En una realización práctica, tales representaciones no lineales son usadas generalmente para reducir los requerimientos de información impuestos sobre los canales de transmisión y los medios de almacenamiento. El desformateado incluye generalmente operaciones simples que pueden ser realizadas de forma relativamente rápida y son relativamente baratas de implementar.
El sintetizador 206 representa un banco de filtro de síntesis para descodificadores digitales de subbanda auténtica, y representa una transformada inversa para descodificadores digitales de transformada. La síntesis de señales para cualquier tipo de descodificador es intensiva desde el punto de vista de cálculo, requiriendo muchas operaciones complejas. De este modo, el sintetizador 206 requiere típicamente mucho más tiempo para sus operaciones e incurre en costes de implementación mucho mayores que los requeridos por el desformateador 204.
La figura 3 ilustra la estructura básica de un descodificador típico que recibe y descodifica cuatro canales de expedición para la presentación por dos canales de expedición. La señal codificada recibida de cada uno de los canales 302a-302d de expedición es pasada a través de respectivamente uno de los descodificadores 300a-300d, que comprenden cada uno respectivamente uno de los desformateadores 304a-304d y respectivamente uno de los sintetizadores 306a-306d, respectivamente. La señal sintetizada es pasada desde cada descodificador a lo largo de respectivamente una de las vías 308a-308d al distribuidor 310, que combina los cuatro canales sintetizados en dos canales de presentación 312a y 312b. El distribuidor 310 incluye generalmente operaciones simples que pueden ser realizadas de modo relativamente rápido utilizando instrumentos que son relativamente baratos de implementar.
La mayoría del coste requerido para implementar el descodificador ilustrado en la figura 3 está representado por los sintetizadores. El número de sintetizadores es igual al número de canales de expedición; así, el coste de implementación es aproximadamente proporcional al número de canales de expedición.
La síntesis de señales es lineal si, ignorando pequeños errores de redondeo aritméticos, las señales combinadas antes de la síntesis producen la misma señal de salida que la producida combinando las señales después de la síntesis. La síntesis es lineal para muchas implementaciones de los descodificadores; por lo tanto, es posible a menudo poner un distribuidor entre los desformateadores y los sintetizadores de un tal descodificador de múltiples canales. Una estructura tal está descrita más plenamente a continuación y está ilustrada en la figura 1. De esta manera, el coste de la implementación es aproximadamente proporcional al número de canales de presentación. Esto es altamente deseable en aplicaciones tales como las propuestas para sistemas de televisión avanzados que pueden recibir cinco canales de expedición, pero que proporcionarán sólo uno o dos canales de presentación.
En este contexto, es posible apreciar mejor el significado del término "lineal" descrito arriba. Brevemente, cualquier representación es considerada lineal si satisface dos criterios: (1) puede constituir una entrada directa para el sintetizador, y (2) permite formar directamente combinaciones lineales tales como suma o resta que satisfacen la propiedad de linealidad para síntesis de señales descrita arriba.
La figura 1 ilustra una realización de un descodificador de acuerdo con la presente invención, que forma dos canales de presentación a partir de cuatro canales de expedición. El descodificador recibe información codificada desde cuatro canales 102a-102d de expedición que desformatea utilizando los desformateadores 104a-104d, uno para cada canal de expedición. El distribuidor 108 combina las señales desformateadas recibidas de las vías 106a-106d en dos señales, que pasa por las vías 110a y 110b a los sintetizadores 112a y 112b, respectivamente. Cada uno de los sintetizadores genera una señal que pasa respectivamente por uno de los canales 114a y 114b de presentación.
Una persona experimentada en la técnica debe apreciar fácilmente que la presente invención puede ser aplicada a una amplia variedad de implementaciones de un descodificador de subbanda auténtica y de transformada. Los detalles de la implementación para desformateadores y sintetizadores están más allá del alcance de esta descripción; sin embargo, uno puede obtener detalles de implementación por referencia a cualquiera de varias solicitudes de patente internacional: publicación número WO 90/09022 publicada el 9 de Agosto de 1990, publicación número WO 90/09064 publicada el 9 de Agosto de 1990, y publicación número WO 91/16769 publicada el 31 de Octubre de 1991.
Una realización de un descodificador de transformada de acuerdo con la presente invención comprende unos desformateadores y sintetizadores sustancialmente similares a los descritos en la publicación número WO 90/09022. De acuerdo con esta realización, en referencia a la figura 1, una señal binaria en serie que comprende coeficientes de transformada en el dominio de frecuencias, agrupados en subbandas, es recibida desde cada uno de los canales 102a-102d de expedición. Cada desformateador 104a-104d almacena transitoriamente la señal binaria en bloques de información, establece el número de bits asignados adaptativamente a cada coeficiente de la transformada en el dominio de frecuencias por el codificador de la señal binaria, y reconstruye una representación lineal para cada coeficiente de la transformada en el dominio de frecuencias. El distribuidor 108 recibe los coeficientes linealizados de la transformada en el dominio de frecuencias desde las vías 106a-106d, los combina como sea apropiado, y distribuye la información del dominio de frecuencias entre las vías 110a y 110b. Cada uno de los sintetizadores 112a y 112b genera muestras en el dominio de tiempo en respuesta a la información en el dominio de frecuencias recibida desde las vías 110a y 110b por aplicación de una transformada de Fourier rápida inversa que implementa la transformada TDAC inversa mencionada arriba. Aunque no se muestran características subsiguientes en la figura 1, las muestras en el dominio de tiempo son pasadas por los canales 114a y 114b de presentación, son almacenadas transitoriamente y combinadas para formar una representación en el dominio de tiempo de la señal codificada original, y convertidas subsiguientemente de la forma digital a la forma analógica por un CDA.
Suponiendo que los cuatro canales 102a-102d de expedición en la figura 1 representan los canales izquierdo (L), central (C), derecho (R), y de ambiente (S) de un sistema acústico de cuatro canales, una realización típica del distribuidor 108 combina estos canales para formar una representación estereofónica de dos canales como sigue:
(1)L' = L + 0,7071 \cdot C + 0,5 \cdot S
(2)R' = R + 0,7071 \cdot C + 0,5 \cdot S
donde
L' = canal izquierdo de presentación, y
R' = canal derecho de presentación.
Para un descodificador de transformada, estas combinaciones representan la suma de los coeficientes de la transformada en el dominio de frecuencias. Se entiende que normalmente se combinan sólo coeficientes que representan el mismo intervalo de frecuencias espectrales. Por ejemplo, supóngase que cada canal de expedición transporta una representación en el dominio de frecuencias de una señal de 20 kHz de anchura de banda transformada por una transformada de 256 puntos. El coeficiente X(0) de la transformada en el dominio de frecuencias para cada canal de expedición representa la energía espectral de la señal codificada transportada por el respectivo canal de expedición centrada en torno a 0 Hz, y el coeficiente X(1) para cada canal de expedición representa la energía espectral de la señal codificada para el respectivo canal de expedición centrada en torno a 78,1 Hz (20 kHz/256). De este modo, el coeficiente X(1) para el canal L' de presentación está formado a partir de la suma ponderada de los coeficientes X(1) a partir de cada canal de expedición de acuerdo con la ecuación 1. Las ecuaciones 1 y 2 pueden ser reescritas como
(3)X(i) _{L'} = X(i) _{L} + 0,7071 \cdot X(i) _{C} + 0,5 \cdot X(i) _{S}
(4)X(i) _{R'} = X(i) _{R} + 0,7071 \cdot X(i) _{C} + 0,5 \cdot X(i) _{S}
en donde X(i)_{Z} = coeficiente i de la transformada para el canal Z.
Para un descodificador de subbanda auténtica, estas combinaciones representan la suma de las correspondientes muestras en el dominio de tiempo en cada subbanda. De este modo, las ecuaciones 1 y 2 pueden ser reescritas como
(5)x_{j} (nt) _{L'} = x_{j} (nt) _{L} + 0,7071 \cdot x_{j} (nt) _{C} + 0,5 \cdot x_{j} (nt) _{S}
(6)x_{j} (nt) _{R'} = x_{j} (nt) _{R} + 0,7071 \cdot x_{j} (nt) _{C} + 0,5 \cdot x_{j} (nt) _{S}
donde x_{j}(nt)_{Z} = muestra de la señal en el instante de tiempo nt en la subbanda j del canal Z.
La figura 4 representa una aplicación de la presente invención utilizada para formar un canal 414 de presentación a partir de cuatro canales 402a-402d de expedición. Una ecuación combinatoria típica para el distribuidor 408 en esta aplicación es
(7)M' = 0,7071 \cdot L + C + 0,7071 \cdot R + S
donde M' = canal monofónico de presentación.
Las formas precisas de las combinaciones proporcionadas por el distribuidor variarán de acuerdo con la aplicación.
Aunque se prevé que la presente invención será usada normalmente para obtener un número de canales de presentación menor que el de canales de expedición existentes, la invención no está limitada a ello. El número de canales de presentación puede ser el mismo o mayor que el número de canales de expedición, siendo utilizado el distribuidor para preparar los canales de presentación de acuerdo con las necesidades de una aplicación deseada.

Claims (3)

1. Un descodificador para descodificar señales acústicas multicanal que representan un campo de sonido multidimensional expedido por una pluralidad de canales de expedición, transportando cada canal de expedición información en forma de una representación no lineal de coeficientes de transformada de dominio de frecuencia, que comprende: unos medios (116, 416) de recepción para recibir dicha pluralidad de canales de expedición (102a-102d; 402a-402d), unos medios (104a-104d; 404a-404d) de desformateado que responden a dichos medios de recepción para desformatear dicha representación no lineal de coeficientes de transformada de cada canal de expedición a una representación lineal respectiva de dichos coeficientes de transformada, y unos medios (112a-112b; 412) de síntesis para aplicar un dominio de frecuencia a la transformada de dominio de tiempo para generar señales de salida en respuesta a dichas representaciones lineales de coeficientes de transformada, caracterizado porque unos medios (108, 408) de distribución, interpuestos entre dichos medios de desformateado y dichos medios de síntesis que responden a dichos medios de desformateado generan una o más señales intermedias, en que por lo menos una señal intermedia es generada a partir de la suma de coeficientes de transformada que representan las mismas frecuencias espectrales de dos o más de dichas representaciones lineales, y dichos medios de síntesis generan una señal de salida respectiva en respuesta a cada una de dichas señales intermedias.
2. Un descodificador para descodificar señales acústicas multicanal que representan un campo de sonido multidimensional expedido por una pluralidad de canales de expedición, transportando cada canal de expedición información en forma de una representación no lineal de señales de subbanda, que comprende: unos medios (116; 416) de recepción para recibir dicha pluralidad de canales de expedición (102a-102d; 402a-402d), unos medios (104a-104d; 404a-404d) de desformateado que responden a dichos medios de recepción para desformatear dicha representación no lineal de señales de subbanda de cada canal de expedición en una representación lineal respectiva de señales de subbanda, y unos medios (112a-112b; 412) de síntesis para aplicar un banco de filtro de síntesis de subbanda para generar señales de salida en respuesta a dichas representaciones lineales de señales de subbanda, caracterizado porque unos medios (108; 408) de distribución, interpuestos entre dichos medios de desformateado y dichos medios de síntesis que responden a dichos medios de desformateado generan una o más señales intermedias, en que por lo menos una señal intermedia es generada a partir de la suma de muestras de dominio de tiempo correspondientes en cada subbanda correspondiente de dos o más de dichas representaciones lineales, y dichos medios de síntesis generan una señal de salida respectiva en respuesta a cada una de dichas señales intermedias.
3. Un descodificador de acuerdo con la reivindicación 1 ó 2, en que dicha representación lineal tiene unos requerimientos de capacidad de información mayores que dichos canales de expedición de información formateada.
ES92903819T 1991-01-08 1992-01-08 Descodificador para la presentacion por un numero variable de canales de campos de sonido multidimensional. Expired - Lifetime ES2093250T5 (es)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US63889691A 1991-01-08 1991-01-08
US638896 1991-01-08
US07/718,356 US5274740A (en) 1991-01-08 1991-06-21 Decoder for variable number of channel presentation of multidimensional sound fields
US718356 1991-06-21

Publications (2)

Publication Number Publication Date
ES2093250T3 ES2093250T3 (es) 1996-12-16
ES2093250T5 true ES2093250T5 (es) 2005-04-01

Family

ID=27093203

Family Applications (1)

Application Number Title Priority Date Filing Date
ES92903819T Expired - Lifetime ES2093250T5 (es) 1991-01-08 1992-01-08 Descodificador para la presentacion por un numero variable de canales de campos de sonido multidimensional.

Country Status (12)

Country Link
US (2) US5274740A (es)
EP (1) EP0519055B2 (es)
JP (1) JP3197012B2 (es)
KR (1) KR100228687B1 (es)
AT (1) ATE144364T1 (es)
AU (1) AU649786B2 (es)
CA (1) CA2077668C (es)
DE (1) DE69214523T3 (es)
DK (1) DK0519055T4 (es)
ES (1) ES2093250T5 (es)
SG (1) SG49884A1 (es)
WO (1) WO1992012608A1 (es)

Families Citing this family (79)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
USRE40280E1 (en) 1988-12-30 2008-04-29 Lucent Technologies Inc. Rate loop processor for perceptual encoder/decoder
US5632005A (en) * 1991-01-08 1997-05-20 Ray Milton Dolby Encoder/decoder for multidimensional sound fields
US5274740A (en) * 1991-01-08 1993-12-28 Dolby Laboratories Licensing Corporation Decoder for variable number of channel presentation of multidimensional sound fields
EP0559348A3 (en) 1992-03-02 1993-11-03 AT&T Corp. Rate control loop processor for perceptual encoder/decoder
WO1995022816A1 (en) * 1992-06-29 1995-08-24 Corporate Computer Systems, Inc. Method and apparatus for adaptive power adjustment of mixed modulation radio transmission
DE4236989C2 (de) * 1992-11-02 1994-11-17 Fraunhofer Ges Forschung Verfahren zur Übertragung und/oder Speicherung digitaler Signale mehrerer Kanäle
US5561736A (en) * 1993-06-04 1996-10-01 International Business Machines Corporation Three dimensional speech synthesis
US5463424A (en) * 1993-08-03 1995-10-31 Dolby Laboratories Licensing Corporation Multi-channel transmitter/receiver system providing matrix-decoding compatible signals
EP0678226B1 (en) * 1993-10-27 2003-05-14 Koninklijke Philips Electronics N.V. Transmission and reception of a first and a second signal component
US5850500A (en) 1995-06-28 1998-12-15 Kabushiki Kaisha Toshiba Recording medium comprising a plurality of different languages which are selectable independently of each other
EP0836190B1 (en) 1993-10-29 1999-08-11 Kabushiki Kaisha Toshiba Information recording disk medium and reproduction apparatus
JPH07264144A (ja) * 1994-03-16 1995-10-13 Toshiba Corp 信号圧縮符号化装置および圧縮信号復号装置
JP3277679B2 (ja) * 1994-04-15 2002-04-22 ソニー株式会社 高能率符号化方法と高能率符号化装置及び高能率復号化方法と高能率復号化装置
US5577258A (en) * 1994-07-13 1996-11-19 Bell Communications Research, Inc. Apparatus and method for preprocessing multimedia presentations to generate a delivery schedule
US5594911A (en) * 1994-07-13 1997-01-14 Bell Communications Research, Inc. System and method for preprocessing and delivering multimedia presentations
US5818943A (en) * 1994-10-25 1998-10-06 U.S. Philips Corporation Transmission and reception of a first and a second main signal component
JP3072709B2 (ja) 1994-11-21 2000-08-07 インターナショナル・ビジネス・マシーンズ・コーポレ−ション 要求伝達方法
CA2206129C (en) * 1994-12-20 2009-11-10 Dolby Laboratories Licensing Corporation Method and apparatus for applying waveform prediction to subbands of a perceptual coding system
JP2766466B2 (ja) * 1995-08-02 1998-06-18 株式会社東芝 オーディオ方式、その再生方法、並びにその記録媒体及びその記録媒体への記録方法
US5852800A (en) * 1995-10-20 1998-12-22 Liquid Audio, Inc. Method and apparatus for user controlled modulation and mixing of digitally stored compressed data
JP3793235B2 (ja) * 1996-02-08 2006-07-05 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 2チャネル伝送及び1チャネル伝送に適合するnチャネル伝送
KR100370412B1 (ko) * 1996-04-17 2003-04-07 삼성전자 주식회사 복잡도 조절이 가능한 오디오 복호화방법 및 이를이용한오디오복호화기
US6252965B1 (en) * 1996-09-19 2001-06-26 Terry D. Beard Multichannel spectral mapping audio apparatus and method
KR100206333B1 (ko) * 1996-10-08 1999-07-01 윤종용 두개의 스피커를 이용한 멀티채널 오디오 재생장치및 방법
SG54379A1 (en) * 1996-10-24 1998-11-16 Sgs Thomson Microelectronics A Audio decoder with an adaptive frequency domain downmixer
US7085387B1 (en) * 1996-11-20 2006-08-01 Metcalf Randall B Sound system and method for capturing and reproducing sounds originating from a plurality of sound sources
US6236730B1 (en) * 1997-05-19 2001-05-22 Qsound Labs, Inc. Full sound enhancement using multi-input sound signals
US5890125A (en) * 1997-07-16 1999-03-30 Dolby Laboratories Licensing Corporation Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method
US6233550B1 (en) 1997-08-29 2001-05-15 The Regents Of The University Of California Method and apparatus for hybrid coding of speech at 4kbps
KR100486208B1 (ko) * 1997-09-09 2005-06-16 삼성전자주식회사 돌비에이.시.-쓰리디코더의시간영역알리아싱제거장치및방법
US6141645A (en) * 1998-05-29 2000-10-31 Acer Laboratories Inc. Method and device for down mixing compressed audio bit stream having multiple audio channels
US6757659B1 (en) * 1998-11-16 2004-06-29 Victor Company Of Japan, Ltd. Audio signal processing apparatus
US6765930B1 (en) 1998-12-11 2004-07-20 Sony Corporation Decoding apparatus and method, and providing medium
US6239348B1 (en) * 1999-09-10 2001-05-29 Randall B. Metcalf Sound system and method for creating a sound event based on a modeled sound field
US6931370B1 (en) * 1999-11-02 2005-08-16 Digital Theater Systems, Inc. System and method for providing interactive audio in a multi-channel audio environment
FR2802329B1 (fr) * 1999-12-08 2003-03-28 France Telecom Procede de traitement d'au moins un flux binaire audio code organise sous la forme de trames
US7003467B1 (en) * 2000-10-06 2006-02-21 Digital Theater Systems, Inc. Method of decoding two-channel matrix encoded audio to reconstruct multichannel audio
US7660424B2 (en) * 2001-02-07 2010-02-09 Dolby Laboratories Licensing Corporation Audio channel spatial translation
US7451006B2 (en) 2001-05-07 2008-11-11 Harman International Industries, Incorporated Sound processing system using distortion limiting techniques
US6804565B2 (en) 2001-05-07 2004-10-12 Harman International Industries, Incorporated Data-driven software architecture for digital sound processing and equalization
US7447321B2 (en) 2001-05-07 2008-11-04 Harman International Industries, Incorporated Sound processing system for configuration of audio signals in a vehicle
US6934677B2 (en) * 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
CA2773294C (en) 2002-05-03 2013-03-12 Harman International Industries, Incorporated Sound detection and localization system
US7502743B2 (en) 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
JP4676140B2 (ja) 2002-09-04 2011-04-27 マイクロソフト コーポレーション オーディオの量子化および逆量子化
AU2003275290B2 (en) 2002-09-30 2008-09-11 Verax Technologies Inc. System and method for integral transference of acoustical events
JP2004335931A (ja) * 2003-05-12 2004-11-25 Alps Electric Co Ltd Cpp型巨大磁気抵抗効果素子
US7542815B1 (en) 2003-09-04 2009-06-02 Akita Blue, Inc. Extraction of left/center/right information from two-channel stereo sources
GB2410164A (en) * 2004-01-16 2005-07-20 Anthony John Andrews Sound feature positioner
US7460990B2 (en) 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
KR101079066B1 (ko) 2004-03-01 2011-11-02 돌비 레버러토리즈 라이쎈싱 코오포레이션 멀티채널 오디오 코딩
JP4495209B2 (ja) * 2004-03-12 2010-06-30 ノキア コーポレイション 符号化済みマルチチャンネルオーディオ信号に基づくモノオーディオ信号の合成
KR100923478B1 (ko) * 2004-03-12 2009-10-27 노키아 코포레이션 부호화된 다중채널 오디오 신호에 기반하여 모노 오디오신호를 합성하는 방법 및 장치
US8009837B2 (en) * 2004-04-30 2011-08-30 Auro Technologies Nv Multi-channel compatible stereo recording
US8626494B2 (en) * 2004-04-30 2014-01-07 Auro Technologies Nv Data compression format
KR100644617B1 (ko) * 2004-06-16 2006-11-10 삼성전자주식회사 7.1 채널 오디오 재생 방법 및 장치
US7636448B2 (en) * 2004-10-28 2009-12-22 Verax Technologies, Inc. System and method for generating sound events
WO2006091540A2 (en) * 2005-02-22 2006-08-31 Verax Technologies Inc. System and method for formatting multimode sound content and metadata
US8428956B2 (en) * 2005-04-28 2013-04-23 Panasonic Corporation Audio encoding device and audio encoding method
CN101167124B (zh) * 2005-04-28 2011-09-21 松下电器产业株式会社 语音编码装置和语音编码方法
US8190425B2 (en) 2006-01-20 2012-05-29 Microsoft Corporation Complex cross-correlation parameters for multi-channel audio
US7831434B2 (en) 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
US8607281B2 (en) 2006-09-07 2013-12-10 Porto Vinci Ltd. Limited Liability Company Control of data presentation in multiple zones using a wireless home entertainment hub
US20080061578A1 (en) * 2006-09-07 2008-03-13 Technology, Patents & Licensing, Inc. Data presentation in multiple zones using a wireless home entertainment hub
US9386269B2 (en) 2006-09-07 2016-07-05 Rateze Remote Mgmt Llc Presentation of data on multiple display devices using a wireless hub
US9319741B2 (en) * 2006-09-07 2016-04-19 Rateze Remote Mgmt Llc Finding devices in an entertainment system
US8935733B2 (en) * 2006-09-07 2015-01-13 Porto Vinci Ltd. Limited Liability Company Data presentation using a wireless home entertainment hub
US8966545B2 (en) * 2006-09-07 2015-02-24 Porto Vinci Ltd. Limited Liability Company Connecting a legacy device into a home entertainment system using a wireless home entertainment hub
US8005236B2 (en) 2006-09-07 2011-08-23 Porto Vinci Ltd. Limited Liability Company Control of data presentation using a wireless home entertainment hub
US9233301B2 (en) * 2006-09-07 2016-01-12 Rateze Remote Mgmt Llc Control of data presentation from multiple sources using a wireless home entertainment hub
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
TWI449442B (zh) 2009-01-14 2014-08-11 Dolby Lab Licensing Corp 用於無回授之頻域主動矩陣解碼的方法與系統
US20100223552A1 (en) * 2009-03-02 2010-09-02 Metcalf Randall B Playback Device For Generating Sound Events
US9082395B2 (en) 2009-03-17 2015-07-14 Dolby International Ab Advanced stereo coding based on a combination of adaptively selectable left/right or mid/side stereo coding and of parametric stereo coding
TWI484481B (zh) 2009-05-27 2015-05-11 杜比國際公司 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體
US11657788B2 (en) 2009-05-27 2023-05-23 Dolby International Ab Efficient combined harmonic transposition
TWI557723B (zh) 2010-02-18 2016-11-11 杜比實驗室特許公司 解碼方法及系統
KR101809272B1 (ko) * 2011-08-03 2017-12-14 삼성전자주식회사 다 채널 오디오 신호의 다운 믹스 방법 및 장치

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2073556B (en) * 1980-02-23 1984-02-22 Nat Res Dev Sound reproduction systems
US4700362A (en) * 1983-10-07 1987-10-13 Dolby Laboratories Licensing Corporation A-D encoder and D-A decoder system
FR2577084B1 (fr) * 1985-02-01 1987-03-20 Trt Telecom Radio Electr Systeme de bancs de filtres d'analyse et de synthese d'un signal
US5046098A (en) * 1985-03-07 1991-09-03 Dolby Laboratories Licensing Corporation Variable matrix decoder with three output channels
US4941177A (en) * 1985-03-07 1990-07-10 Dolby Laboratories Licensing Corporation Variable matrix decoder
US4774496A (en) * 1986-02-28 1988-09-27 American Telephone And Telegraph Company, At&T Bell Laboratories Digital encoder and decoder synchronization in the presence of data dropouts
US4726019A (en) * 1986-02-28 1988-02-16 American Telephone And Telegraph Company, At&T Bell Laboratories Digital encoder and decoder synchronization in the presence of late arriving packets
US4882755A (en) * 1986-08-21 1989-11-21 Oki Electric Industry Co., Ltd. Speech recognition system which avoids ambiguity when matching frequency spectra by employing an additional verbal feature
NL8700985A (nl) * 1987-04-27 1988-11-16 Philips Nv Systeem voor sub-band codering van een digitaal audiosignaal.
US5040212A (en) * 1988-06-30 1991-08-13 Motorola, Inc. Methods and apparatus for programming devices to recognize voice commands
NL8901032A (nl) * 1988-11-10 1990-06-01 Philips Nv Coder om extra informatie op te nemen in een digitaal audiosignaal met een tevoren bepaald formaat, een decoder om deze extra informatie uit dit digitale signaal af te leiden, een inrichting voor het opnemen van een digitaal signaal op een registratiedrager, voorzien van de coder, en een registratiedrager verkregen met deze inrichting.
US5142656A (en) * 1989-01-27 1992-08-25 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
US5109417A (en) * 1989-01-27 1992-04-28 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
EP0400222A1 (en) * 1989-06-02 1990-12-05 ETAT FRANCAIS représenté par le Ministère des Postes, des Télécommunications et de l'Espace Digital transmission system using subband coding of a digital signal
NL9000338A (nl) * 1989-06-02 1991-01-02 Koninkl Philips Electronics Nv Digitaal transmissiesysteem, zender en ontvanger te gebruiken in het transmissiesysteem en registratiedrager verkregen met de zender in de vorm van een optekeninrichting.
GB8913758D0 (en) * 1989-06-15 1989-08-02 British Telecomm Polyphonic coding
US5036538A (en) * 1989-11-22 1991-07-30 Telephonics Corporation Multi-station voice recognition and processing system
US5274740A (en) * 1991-01-08 1993-12-28 Dolby Laboratories Licensing Corporation Decoder for variable number of channel presentation of multidimensional sound fields
EP0520068B1 (en) * 1991-01-08 1996-05-15 Dolby Laboratories Licensing Corporation Encoder/decoder for multidimensional sound fields

Also Published As

Publication number Publication date
ES2093250T3 (es) 1996-12-16
AU649786B2 (en) 1994-06-02
SG49884A1 (en) 1998-06-15
CA2077668A1 (en) 1992-07-09
DK0519055T4 (da) 2005-01-10
WO1992012608A1 (en) 1992-07-23
ATE144364T1 (de) 1996-11-15
EP0519055A1 (en) 1992-12-23
JPH05505504A (ja) 1993-08-12
EP0519055B1 (en) 1996-10-16
KR920704540A (ko) 1992-12-19
DK0519055T3 (da) 1997-03-24
CA2077668C (en) 2001-02-27
US5400433A (en) 1995-03-21
KR100228687B1 (ko) 1999-11-01
US5274740A (en) 1993-12-28
DE69214523T3 (de) 2005-03-03
JP3197012B2 (ja) 2001-08-13
DE69214523D1 (de) 1996-11-21
DE69214523T2 (de) 1997-03-27
AU1194292A (en) 1992-08-17
EP0519055B2 (en) 2004-11-03

Similar Documents

Publication Publication Date Title
ES2093250T5 (es) Descodificador para la presentacion por un numero variable de canales de campos de sonido multidimensional.
US6021386A (en) Coding method and apparatus for multiple channels of audio information representing three-dimensional sound fields
US5632005A (en) Encoder/decoder for multidimensional sound fields
ES2682073T3 (es) Codificación conjunta paramétrica de fuentes de audio
US6072878A (en) Multi-channel surround sound mastering and reproduction techniques that preserve spatial harmonics
US20180151185A1 (en) Audio encoding and decoding
ES2729624T3 (es) Reducción de la correlación entre canales de fondo ambisónicos de orden superior (HOA)
JP5185340B2 (ja) マルチチャネルオーディオ信号を表示するための装置と方法
ES2300567T3 (es) Representacion parametrica de audio espacial.
CA2327281C (en) Low bit-rate spatial coding method and system
US7489788B2 (en) Recording a three dimensional auditory scene and reproducing it for the individual listener
US6169973B1 (en) Encoding method and apparatus, decoding method and apparatus and recording medium
KR20140000240A (ko) 고차 앰비소닉 오디오 데이터를 위한 데이터 구조
TW201442522A (zh) 屬於第1階保真立體音響訊號且具有第0階和第1階係數的輸入訊號指向性之增進方法及裝置
JP2000507062A (ja) マルチチャネル・スペクトル・マッピング・オーディオ装置及び方法
ES2968494T3 (es) Determinación de codificación de parámetros de audio espacial y decodificación asociada
Arteaga Introduction to ambisonics
WO1994018762A1 (en) Transmission of digital data words representing a signal waveform
US7043312B1 (en) CD playback augmentation for higher resolution and multi-channel sound
AU682913B2 (en) Encoder/decoder for multidimensional sound fields
Zinemanas et al. Improving Csound’s Ambisonics decoders
KR20070017441A (ko) 저 비트속도 공간 코딩방법 및 시스템
Hawksford A Compilation of Technical Papers on Stereo and Spatial Audio
AU2002325063A1 (en) Recording a three dimensional auditory scene and reproducing it for the individual listener

Legal Events

Date Code Title Description
FG2A Definitive protection

Ref document number: 519055

Country of ref document: ES