ES2093250T5 - Descodificador para la presentacion por un numero variable de canales de campos de sonido multidimensional. - Google Patents
Descodificador para la presentacion por un numero variable de canales de campos de sonido multidimensional.Info
- Publication number
- ES2093250T5 ES2093250T5 ES92903819T ES92903819T ES2093250T5 ES 2093250 T5 ES2093250 T5 ES 2093250T5 ES 92903819 T ES92903819 T ES 92903819T ES 92903819 T ES92903819 T ES 92903819T ES 2093250 T5 ES2093250 T5 ES 2093250T5
- Authority
- ES
- Spain
- Prior art keywords
- channels
- signals
- channel
- presentation
- subband
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
Landscapes
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
- Analogue/Digital Conversion (AREA)
- Electrophonic Musical Instruments (AREA)
- Stereo-Broadcasting Methods (AREA)
- Television Receiver Circuits (AREA)
- Television Systems (AREA)
- Time-Division Multiplex Systems (AREA)
Abstract
LA INVENCION SE REFIERE EN GENERAL A LA REPRESENTACION DE SEÑALES MULTIPLEX. DE MANERA MAS PARTICULAR, ESTA INVENCION SE REFIERE A LA DECODIFICACION DE SEÑALES DE AUDIO MULTIPLEX QUE REPRESENTAN CAMPOS ACUSTICOS MULTIDIMENSIONALES MEDIANTE UNO O MAS CANALES DE SALIDA, EN DONDE LA COMPLEJIDAD DE LA DECODIFICACION ES LIGERAMENTE PROPORCIONAL AL NUMERO DE CANALES UTILIZADAS PARA PRESENTAR LA SEÑAL DECODIFICADA QUE PUEDE SER DIFERENTE DEL NUMERO DE CANALES DE SALIDA.
Description
Descodificador para la presentación por un número
variable de canales de campos de sonido multidimensional.
La invención se refiere en general a la
reproducción de señales multicanal. Más en particular, la invención
se refiere a la descodificación de señales acústicas multicanal que
representan campos de sonido multidimensionales expedidos por dos o
más canales de expedición, en que la complejidad de la
descodificación es aproximadamente proporcional al número de canales
usado para presentar la señal descodificada, que puede diferir del
número de canales de expedición.
Un objetivo para una reproducción de alta
fidelidad de sonidos grabados o transmitidos es la presentación en
otro tiempo o posición tan fielmente como sea posible de una
representación de un campo de sonido "original", dadas las
limitaciones del sistema de presentación o reproducción. Un campo de
sonido es definido como un conjunto de presiones de sonido que son
una función del tiempo y el espacio. De este modo, la reproducción
de alta fidelidad pretende recrear las presiones acústicas que
existían en el campo de sonido original en una región en torno a un
oyente.
Idealmente, las diferencias entre el campo de
sonido original y el campo de sonido reproducido son inaudibles, o
si no son inaudibles pasan por lo menos relativamente desapercibidas
para la mayoría de los oyentes. Dos medidas generales de fidelidad
son la "calidad del sonido" y la "localización del campo de
sonido".
La calidad del sonido incluye características de
reproducción tales como el intervalo de frecuencias (anchura de
banda), la precisión de los niveles relativos de amplitud a través
del intervalo de frecuencias (timbre), el intervalo de niveles de
amplitud de sonido (intervalo dinámico), la precisión de la fase y
la amplitud armónicas (nivel de distorsión), y el nivel de amplitud
y la frecuencia de sonidos espúreos y artificios no presentes en el
sonido original (ruido). Aunque la mayoría de los aspectos de la
calidad del sonido son susceptibles de ser medidos por instrumentos,
en los sistemas prácticos las características del sistema de
audición humano (efectos psicoacústicos) hacen inaudibles o hacen
pasar relativamente desapercibidas ciertas desviaciones medibles o
mensurables respecto a los sonidos "originales".
La localización del campo de sonido es una medida
de fidelidad espacial. La preservación de la dirección aparente
(tanto acimut como elevación) y de la distancia de una fuente de
sonido es conocida algunas veces como localización angular y de
profundidad, respectivamente. En el caso de ciertas grabaciones de
orquestas y otras grabaciones, esta localización pretende
transmitir al oyente la situación física real de los músicos y sus
instrumentos. Con respecto a otras grabaciones, en particular
grabaciones de múltiples pistas producidas en un estudio, la
direccionalidad angular y la profundidad pueden no albergar ninguna
relación con cualquier disposición "real" de fuentes de sonido
y la localización es meramente una parte de la impresión artística
general que se pretende transmitir al oyente. Por ejemplo, una voz
que parece originarse en un punto específico en el espacio puede ser
añadida a un campo de sonido pregrabado. En cualquier caso, un
propósito de los sistemas de reproducción multicanal de alta
fidelidad es reproducir aspectos espaciales de un campo de sonido en
desarrollo, sea real o sintetizado. En lo que respecta a la calidad
del sonido, en los sistemas prácticos las variaciones medibles en la
localización son, bajo ciertas condiciones, inaudibles o pasan
relativamente desapercibidas debido a las características de la
audición humana.
Es suficiente reconocer que un productor de
campos de sonido puede desarrollar señales grabadas o transmitidas
que, en conjunción con un sistema de reproducción, presentarán a un
oyente humano un campo de sonido que posee características
específicas en calidad de sonido y localización del campo de sonido.
El campo de sonido presentado al oyente puede constituir una
aproximación estrecha del campo de sonido ideal pretendido por el
productor o puede desviarse de él dependiendo de muchos factores que
incluyen el equipo de reproducción y el entorno acústico de
reproducción.
Un campo de sonido capturado para la transmisión
o la reproducción es representado habitualmente en algún punto por
una o más señales eléctricas. Tales señales constituyen usualmente
uno o más canales en el punto de captura del campo de sonido
("canales de captura"), en el punto de transmisión o grabación
del campo de sonido ("canales de transmisión"), y en el punto
de presentación del campo de sonido ("canales de
presentación"). Aunque dentro de algunos límites cuando el número
de estos canales de sonido se incrementa, la capacidad para
reproducir campos de sonido complejos se incrementa, consideraciones
prácticas imponen límites al número de tales canales.
En la mayoría de los casos, si no en todos, el
productor de campos de sonido trabaja en un sistema relativamente
bien definido en el cual hay entornos y configuraciones de canales
de presentación conocidos. Por ejemplo, se espera generalmente que
una grabación estereofónica de dos canales sea presentada a través
o bien de dos canales de presentación ("estereofónica") o de un
canal de presentación ("monofónica"). La grabación es
optimizada habitualmente para sonar bien a la mayoría de los oyentes
que tienen un equipo de reproducción o bien estereofónico o bien
monofónico. Como otro ejemplo, una grabación de múltiples canales en
estéreo con sonido de ambiente para películas es realizada
suponiendo que los cines tendrán o bien una disposición conocida,
generalmente estándar para presentar los canales izquierdo, central,
derecho, bajo y de ambiente o bien, alternativamente, una
reproducción monofónica "Academy" clásica. Tales grabaciones
son realizadas también suponiendo que serán reproducidas por equipos
domésticos de reproducción que abarcan desde sistemas de un único
canal de presentación tales como un pequeño altavoz en un equipo de
televisión hasta sistemas relativamente sofisticados de múltiples
canales de presentación con sonido de ambiente.
Se usan a veces diversas técnicas para reducir el
número de canales de transmisión requeridos para transportar señales
que representan campos de sonido multidimensionales. Un ejemplo de
una técnica tal es un sistema de matrices
4-2-4 que combina cuatro canales en
dos canales de transmisión para la transmisión o el almacenamiento,
de los cuales son extraídos cuatro canales de presentación para la
reproducción. Idealmente, tales técnicas no deben crear variaciones
audibles en el campo de sonido cuando es presentado.
Tales técnicas pueden ser usadas sin desviarse
del alcance de la presente invención; sin embargo, puede no ser
siempre deseable hacerlo. El uso de estas técnicas hace necesario
desarrollar el concepto de un "canal de expedición". Un canal
de expedición representa un canal discreto de codificador, o un
conjunto de información que es codificada independientemente. Un
canal de expedición corresponde a un canal de transmisión en
sistemas que no usan técnicas para reducir el número de canales de
transmisión. Por ejemplo, un sistema de matrices
4-2-4 lleva cuatro canales de
expedición sobre dos canales de transmisión, ostensiblemente para la
reproducción utilizando cuatro canales de presentación. La presente
invención está dirigida hacia la selección de un número de canales
de presentación que difiere del número de canales de expedición.
Un ejemplo de una técnica simple que genera un
canal de presentación en respuesta a dos canales de expedición es la
suma de dos canales de expedición para formar un canal de
presentación. Si una señal es muestreada y codificada digitalmente
utilizando la modulación por impulsos codificados (MIC), la suma de
dos canales de expedición puede ser realizada en el dominio digital
añadiendo muestras de MIC que representan a cada canal y
convirtiendo las muestras sumadas en una señal analógica mediante la
utilización de un convertidor de digital a analógico (CDA). La suma
de dos señales codificadas en MIC puede ser realizada también en el
dominio analógico convirtiendo las muestras de MIC para cada canal
de expedición en una señal analógica mediante la utilización de dos
convertidores CDA y sumando las dos señales analógicas. Se prefiere
habitualmente realizar la suma en el dominio digital porque un
sumador digital es generalmente más preciso y menos costoso de
implementar que utilizar un segundo CDA de alta precisión.
Esta técnica se hace mucho más compleja, sin
embargo, si las muestras de señales son codificadas digitalmente en
una forma no lineal en vez de ser codificadas en MIC lineal. Formas
no lineales puede ser generadas por métodos de codificación tales
como cuantificación logarítmica, normalización de representaciones
en coma flotante, y asignación adaptativa de bits para representar
cada muestra.
Las representaciones no lineales son usadas
frecuentemente en sistemas de codificador/descodifica-
dor para reducir la cantidad de información requerida para representar la señal codificada. Tales representaciones pueden ser transportadas por canales de transmisión con capacidad de información reducida, tales como vías de transmisión de menor anchura de banda o ruidosas, o por medios de grabación con menor capacidad de almacenamiento.
dor para reducir la cantidad de información requerida para representar la señal codificada. Tales representaciones pueden ser transportadas por canales de transmisión con capacidad de información reducida, tales como vías de transmisión de menor anchura de banda o ruidosas, o por medios de grabación con menor capacidad de almacenamiento.
Las representaciones no lineales no necesitan
reducir los requerimientos de información. Pueden ser usadas varias
formas de empaquetamiento de la información sólo para facilitar la
detección y corrección de errores de transmisión. Los términos
amplios "formateado" y "formatear" serán usados aquí para
hacer referencia a representaciones no lineales y para obtener tales
representaciones, respectivamente. Los términos
"desformateado" y "desformatear" harán referencia a
representaciones lineales reconstruidas y a la obtención de tales
representaciones lineales reconstruidas, respectivamente.
Debe mencionarse que lo que constituye una
representación "lineal" depende de los métodos de
procesamiento de señales empleados. Por ejemplo, una representación
en coma flotante es lineal para un procesador de señales digitales
(PSD) que puede realizar aritmética con operandos en coma flotante,
pero tal representación es no lineal para un PSD que sólo puede
realizar aritmética de enteros. El significado de "lineal" será
discutido adicionalmente en conexión con los modos para llevar a
cabo la invención, más adelante.
Un descodificador debe utilizar técnicas de
desformateado inversas a las técnicas de formateado utilizadas para
formatear la información para obtener una representación como la MIC
que puede ser sumada como se ha descrito arriba.
Dos técnicas de codificación que utilizan el
formateado para reducir los requerimientos de información son la
codificación de subbanda y la codificación de transformada. Los
codificadores de subbanda y de transformada intentan reducir la
cantidad de información transmitida en bandas de frecuencia
particulares en que la imprecisión de codificación o el ruido de
codificación resultante es enmascarado psicoacústicamente por
componentes espectrales contiguos. Los efectos de enmascaramiento
psicoacústico usualmente pueden ser explotados de modo más eficiente
si las anchuras de banda de las bandas de frecuencia son elegidas de
modo conmensurable con las anchuras de banda de las "bandas
críticas" del oído humano. Véase, en general, el Audio
Engineering Handbook, K. Blair Benson ed.,
McGraw-Hill, San Francisco, 1988, páginas
1.40-1.42 y 4.8-4.10. En toda la
descripción que sigue, el término "subbanda" se referirá a
partes de la anchura de banda de la señal útil, implementadas bien
por un codificador de subbanda auténtica, por un codificador de
transformada, o por otra técnica. El término "codificador de
subbanda" se referirá a los codificadores de subbanda auténtica,
codificadores de transformada, u otras técnicas que trabajan sobre
dichas "subbandas".
Las señales en una forma formateada no pueden ser
sumadas directamente; por lo tanto, cada uno de los dos canales de
expedición debe ser descodificado antes de que puedan ser combinados
por suma. Generalmente, las técnicas de descodificación tales como
la descodificación de subbanda son relativamente costosas de
implementar. Por lo tanto, la presentación monofónica de una señal
de dos canales cuesta aproximadamente el doble que una presentación
monofónica de una señal de un canal. El coste es aproximadamente el
doble porque se necesita un descodificador costoso para cada canal
de expedición.
Un método de la técnica anterior que evita gravar
el coste de la presentación monofónica de señales de dos canales es
la aplicación de matrices. Es importante distinguir la aplicación de
matrices para reducir el número de canales de presentación de la
aplicación de matrices para reducir el número de canales de
transmisión. Aunque son matemáticamente similares, cada técnica está
dirigida a muy diferentes aspectos de la transmisión y reproducción
de señales.
Un ejemplo simple de la aplicación de matrices
codifica dos canales, A y B, en unos canales de expedición de SUMA y
DIFERENCIA de acuerdo con
SUMA = A +
B,
y
DIFERENCIA = A
-
B.
Para una reproducción estereofónica de dos
canales, un sistema de presentación puede obtener la señal de dos
canales original utilizando dos descodificadores para descodificar
cada canal de expedición y desaplicando las matrices de los canales
descodificados de acuerdo con
A' = 1/2
\cdot(SUMA +
DIFERENCIA),
y
B' = 1/2
\cdot(SUMA -
DIFERENCIA).
La notación A' y B' es usada para representar el
hecho de que en los sistemas prácticos, las señales recuperadas al
desaplicar las matrices generalmente no corresponden exactamente a
las señales originales a las que se aplicaron matrices.
Para una reproducción monofónica, un sistema de
presentación puede obtener una suma de la señal original de dos
canales utilizando sólo un descodificador para descodificar el canal
de expedición de SUMA.
Aunque la aplicación de matrices resuelve el
problema del coste desproporcionado de la presentación monofónica de
dos canales de expedición, sufre de lo que puede ser percibido como
modulación de ruido de canales cruzados cuando se usa en conjunción
con técnicas de codificación que reducen los requerimientos de
información de la señal codificada. Por ejemplo, la
"compresión-expansión" puede ser usada para
señales analógicas, y varios métodos de reducción de la velocidad
de transmisión de bits pueden ser usados para señales digitales. La
aplicación de tales técnicas estimula el ruido en la señal de salida
del descodificador. La intención y la expectativa es que este ruido
sea enmascarado por la señal acústica que lo estimuló, y por lo
tanto que sea inaudible. Cuando tales técnicas son empleadas en
señales a las que se han aplicado matrices, la señal de salida de
las matrices puede ser incapaz de enmascarar el ruido.
Supóngase que un codificador por matrices
codifica los canales A y B, en que sólo el canal B contiene una
señal acústica. Normalmente, se introducirá ruido en los canales de
SUMA y DIFERENCIA cuando las señales de SUMA y DIFERENCIA son
codificadas para la transmisión con un
compresor-expansor analógico o una técnica digital
de reducción de la velocidad de transmisión de bits. Durante la
descodificación, el canal de presentación A' se obtendrá a partir de
la suma de los canales de expedición de SUMA y DIFERENCIA. Aunque el
canal de presentación A' no contendrá ninguna señal acústica,
contendrá la suma del ruido de modulación analógica o el ruido de
codificación digital introducido independientemente en cada uno de
los canales de expedición de SUMA y de DIFERENCIA. El canal de
presentación A' no contendrá ninguna señal acústica para enmascarar
psicoacústicamente el ruido. Además, el ruido en el canal A' puede
no ser enmascarado por la señal acústica en el canal B' porque el
oído puede discernir habitualmente el ruido de las señales
acústicas, especialmente cuando el ruido y la señal tienen diferente
localización angular.
Otro método de la técnica anterior está expuesto
en el documento EP-A-0.372.601 y en
Kate, y col., "Digital Audio Carrying Extra Information,"
ICASSP 90 Proceedings, Abril de 1990, vol. 2, páginas
1097-1100. De acuerdo con esta técnica, una señal
acústica primaria es dividida en señales de subbanda y cada señal de
subbanda es cuantificada utilizando un valor qstep de paso de
cuantificación tal que el ruido de cuantificación resultante está
estimado que sea justo inaudible. Una señal auxiliar,
preferentemente una que está correlacionada con la señal acústica
primaria, es dividida en señales de subbanda y cada señal de
subbanda es atenuada y cuantificada en un intervalo de valores desde
-1/2 qstep hasta +1/2 qstep y añadida a la respectiva
señal de subbanda acústica primaria cuantificada. Las señales de
subbanda compuestas son pasadas a través de un banco de filtro de
síntesis para generar una señal de banda ancha que tenga un formato
compatible con los receptores existentes.
Los receptores con descodificadores especiales
pueden recuperar la señal acústica auxiliar cuantificada. El
descodificador especial divide la señal de banda ancha en señales de
subbanda, determina el mismo valor qstep de paso de
cuantificación utilizado en el codificador para recuperar las
señales de subbanda acústicas primarias cuantificadas, y obtiene las
señales de subbanda acústicas auxiliares a partir de la diferencia
entre las dos. La señal acústica auxiliar es recuperada invirtiendo
los efectos de la atenuación aplicada en el codificador y aplicando
un banco de filtro de síntesis a las señales de subbanda
resultantes.
Los receptores existentes pueden reproducir la
señal acústica primaria sin descodificadores especiales; la señal
acústica especial no es percibida porque está combinada en la señal
de banda ancha de una manera tal que está enmascarada por la energía
espectral en la señal acústica primaria.
Por un lado, esta técnica proporciona unos costes
de implementación muy bajos para receptores que no reproducen la
señal acústica auxiliar porque no se necesita ningún descodificador
especial. Por otro lado, esta técnica produce unos costes de
implementación muy elevados para receptores que reproducen la señal
auxiliar, independientemente del número de canales de presentación,
porque se necesita tanto un banco de filtro de análisis como un
banco de filtro de síntesis para cada señal acústica auxiliar.
Además, esta técnica requiere una cuantificación perceptiva y
requiere el uso de un formato de señales de banda ancha que puede
imponer unos requerimientos de velocidad de transmisión de bits y/o
de anchura de banda de canal que no sean óptimos.
Las técnicas usadas para controlar el número de
canales de presentación se convierten en un problema aún mayor
cuando están implicados más de dos canales de expedición. Por
ejemplo, las bandas sonoras de películas contienen típicamente
cuatro canales: izquierdo, central, derecho y de ambiente. Algunas
propuestas actuales para películas futuras y aplicaciones avanzadas
de televisión sugieren cinco canales más un sexto subcanal de
frecuencias bajas de anchura de banda limitada. Cuando unas señales
de múltiples canales en una forma formateada son expedidas a los
consumidores para la reproducción en equipos domésticos monofónicos
y de dos canales, surge la cuestión de cómo obtener de modo
económico una señal apta para la presentación de uno y dos canales
al tiempo que se evita el efecto de modulación de ruido de canales
cruzados descrito arriba.
Es un objetivo de la presente invención procurar
la descodificación de uno o más canales de expedición de señales
codificadas para representar en una forma formateada un campo de
sonido multidimensional sin artificios percibidos como modulación de
ruido de canales cruzados, en que la complejidad o coste de la
descodificación es aproximadamente proporcional al número de canales
de presentación. Aunque un descodificador que incorpora la presente
invención puede ser implementado utilizando técnicas analógicas o
digitales o incluso una combinación híbrida de tales técnicas, la
invención es implementada de modo más conveniente utilizando
técnicas digitales y las realizaciones preferidas descritas aquí son
implementaciones digitales.
De acuerdo con las enseñanzas de la presente
invención, en una realización, un descodificador de transformada
recibe una señal codificada en una forma formateada que comprende
uno o más canales de expedición. Una representación desformateada es
generada para cada canal de expedición. Cada canal de información
desformateada es distribuido en una o más transformadas inversas
para la síntesis de la señal de salida, una transformada inversa
para cada canal de presentación.
Como se ha descrito arriba, la presente invención
se aplica a codificadores de subbanda implementados por una de
varias técnicas. Una implementación preferida utiliza una
transformada, más en particular una transformada del dominio de
tiempo al dominio de frecuencias de acuerdo con la técnica de
cancelación de la enajenación en el dominio de tiempo (TDAC, del
inglés "Time Domain Aliasing Cancellation"). Véase Princen y
Bradley, "Analysis/Synthesis Filter Bank Design Based on Time
Domain Aliasing Cancellation," IEEE Trans. on Acoust., Speech,
Signal Proc., vol. ASSP-34, 1986, páginas
1153-1161. Un ejemplo de un sistema de
codificador/descodificador por transformada que utiliza una
transformada TDAC es proporcionado en la publicación de solicitud de
patente internacional número WO 90/09022, publicada el 9 de Agosto
de 1990.
Las diversas características de la invención y
sus realizaciones preferidas son expuestas en mayor detalle en los
siguientes modos para llevar a cabo la invención y en los dibujos
adjuntos.
La figura 1 es un diagrama de bloques funcional
que ilustra la estructura básica de una realización que incorpora la
invención, distribuyendo cuatro canales de expedición en dos canales
de presentación.
\newpage
La figura 2 es un diagrama de bloques funcional
que ilustra la estructura básica de un descodificador de subbanda de
un único canal.
La figura 3 es un diagrama de bloques funcional
que ilustra la estructura básica de un descodificador de subbanda
de múltiples canales que distribuye cuatro canales de expedición
descodificados en dos canales de presentación.
La figura 4 es una diagrama de bloques funcional
que ilustra la estructura básica de una realización que incorpora la
invención, distribuyendo cuatro canales de expedición en un canal de
presentación.
La figura 2 ilustra la estructura básica de un
típico descodificador 200 de subbanda de un único canal. Las señales
de subbanda codificadas recibidas del canal 202 de expedición son
desformateadas a una forma lineal por el desformateador 204, y el
sintetizador 206 genera a lo largo del canal 208 de presentación una
representación de anchura de banda completa de la señal recibida.
Debe apreciarse que una implementación práctica de un descodificador
puede incorporar características adicionales tales como un circuito
intermedio para el canal 202 de expedición, y un convertidor de
digital a analógico y un filtro de paso bajo para el canal 208 de
presentación, que no se muestran.
Como se ha mencionado brevemente arriba, el
desformateador 204 debe obtener una representación lineal utilizando
un método inverso al usado por un codificador acompañante que generó
la representación no lineal. En una realización práctica, tales
representaciones no lineales son usadas generalmente para reducir
los requerimientos de información impuestos sobre los canales de
transmisión y los medios de almacenamiento. El desformateado incluye
generalmente operaciones simples que pueden ser realizadas de forma
relativamente rápida y son relativamente baratas de implementar.
El sintetizador 206 representa un banco de filtro
de síntesis para descodificadores digitales de subbanda auténtica, y
representa una transformada inversa para descodificadores digitales
de transformada. La síntesis de señales para cualquier tipo de
descodificador es intensiva desde el punto de vista de cálculo,
requiriendo muchas operaciones complejas. De este modo, el
sintetizador 206 requiere típicamente mucho más tiempo para sus
operaciones e incurre en costes de implementación mucho mayores que
los requeridos por el desformateador 204.
La figura 3 ilustra la estructura básica de un
descodificador típico que recibe y descodifica cuatro canales de
expedición para la presentación por dos canales de expedición. La
señal codificada recibida de cada uno de los canales
302a-302d de expedición es pasada a través de
respectivamente uno de los descodificadores
300a-300d, que comprenden cada uno respectivamente
uno de los desformateadores 304a-304d y
respectivamente uno de los sintetizadores 306a-306d,
respectivamente. La señal sintetizada es pasada desde cada
descodificador a lo largo de respectivamente una de las vías
308a-308d al distribuidor 310, que combina los
cuatro canales sintetizados en dos canales de presentación 312a y
312b. El distribuidor 310 incluye generalmente operaciones simples
que pueden ser realizadas de modo relativamente rápido utilizando
instrumentos que son relativamente baratos de implementar.
La mayoría del coste requerido para implementar
el descodificador ilustrado en la figura 3 está representado por los
sintetizadores. El número de sintetizadores es igual al número de
canales de expedición; así, el coste de implementación es
aproximadamente proporcional al número de canales de expedición.
La síntesis de señales es lineal si, ignorando
pequeños errores de redondeo aritméticos, las señales combinadas
antes de la síntesis producen la misma señal de salida que la
producida combinando las señales después de la síntesis. La síntesis
es lineal para muchas implementaciones de los descodificadores; por
lo tanto, es posible a menudo poner un distribuidor entre los
desformateadores y los sintetizadores de un tal descodificador de
múltiples canales. Una estructura tal está descrita más plenamente a
continuación y está ilustrada en la figura 1. De esta manera, el
coste de la implementación es aproximadamente proporcional al número
de canales de presentación. Esto es altamente deseable en
aplicaciones tales como las propuestas para sistemas de televisión
avanzados que pueden recibir cinco canales de expedición, pero que
proporcionarán sólo uno o dos canales de presentación.
En este contexto, es posible apreciar mejor el
significado del término "lineal" descrito arriba. Brevemente,
cualquier representación es considerada lineal si satisface dos
criterios: (1) puede constituir una entrada directa para el
sintetizador, y (2) permite formar directamente combinaciones
lineales tales como suma o resta que satisfacen la propiedad de
linealidad para síntesis de señales descrita arriba.
La figura 1 ilustra una realización de un
descodificador de acuerdo con la presente invención, que forma dos
canales de presentación a partir de cuatro canales de expedición. El
descodificador recibe información codificada desde cuatro canales
102a-102d de expedición que desformatea utilizando
los desformateadores 104a-104d, uno para cada canal
de expedición. El distribuidor 108 combina las señales
desformateadas recibidas de las vías 106a-106d en
dos señales, que pasa por las vías 110a y 110b a los sintetizadores
112a y 112b, respectivamente. Cada uno de los sintetizadores genera
una señal que pasa respectivamente por uno de los canales 114a y
114b de presentación.
Una persona experimentada en la técnica debe
apreciar fácilmente que la presente invención puede ser aplicada a
una amplia variedad de implementaciones de un descodificador de
subbanda auténtica y de transformada. Los detalles de la
implementación para desformateadores y sintetizadores están más allá
del alcance de esta descripción; sin embargo, uno puede obtener
detalles de implementación por referencia a cualquiera de varias
solicitudes de patente internacional: publicación número WO 90/09022
publicada el 9 de Agosto de 1990, publicación número WO 90/09064
publicada el 9 de Agosto de 1990, y publicación número WO 91/16769
publicada el 31 de Octubre de 1991.
Una realización de un descodificador de
transformada de acuerdo con la presente invención comprende unos
desformateadores y sintetizadores sustancialmente similares a los
descritos en la publicación número WO 90/09022. De acuerdo con esta
realización, en referencia a la figura 1, una señal binaria en serie
que comprende coeficientes de transformada en el dominio de
frecuencias, agrupados en subbandas, es recibida desde cada uno de
los canales 102a-102d de expedición. Cada
desformateador 104a-104d almacena transitoriamente
la señal binaria en bloques de información, establece el número de
bits asignados adaptativamente a cada coeficiente de la transformada
en el dominio de frecuencias por el codificador de la señal binaria,
y reconstruye una representación lineal para cada coeficiente de la
transformada en el dominio de frecuencias. El distribuidor 108
recibe los coeficientes linealizados de la transformada en el
dominio de frecuencias desde las vías 106a-106d, los
combina como sea apropiado, y distribuye la información del dominio
de frecuencias entre las vías 110a y 110b. Cada uno de los
sintetizadores 112a y 112b genera muestras en el dominio de tiempo
en respuesta a la información en el dominio de frecuencias recibida
desde las vías 110a y 110b por aplicación de una transformada de
Fourier rápida inversa que implementa la transformada TDAC inversa
mencionada arriba. Aunque no se muestran características
subsiguientes en la figura 1, las muestras en el dominio de tiempo
son pasadas por los canales 114a y 114b de presentación, son
almacenadas transitoriamente y combinadas para formar una
representación en el dominio de tiempo de la señal codificada
original, y convertidas subsiguientemente de la forma digital a la
forma analógica por un CDA.
Suponiendo que los cuatro canales
102a-102d de expedición en la figura 1 representan
los canales izquierdo (L), central (C), derecho (R), y de ambiente
(S) de un sistema acústico de cuatro canales, una realización típica
del distribuidor 108 combina estos canales para formar una
representación estereofónica de dos canales como sigue:
(1)L' = L +
0,7071 \cdot C + 0,5 \cdot
S
(2)R' = R +
0,7071 \cdot C + 0,5 \cdot
S
donde
L' = canal izquierdo de
presentación,
y
R' = canal derecho de
presentación.
Para un descodificador de transformada, estas
combinaciones representan la suma de los coeficientes de la
transformada en el dominio de frecuencias. Se entiende que
normalmente se combinan sólo coeficientes que representan el mismo
intervalo de frecuencias espectrales. Por ejemplo, supóngase que
cada canal de expedición transporta una representación en el dominio
de frecuencias de una señal de 20 kHz de anchura de banda
transformada por una transformada de 256 puntos. El coeficiente
X(0) de la transformada en el dominio de frecuencias para
cada canal de expedición representa la energía espectral de la señal
codificada transportada por el respectivo canal de expedición
centrada en torno a 0 Hz, y el coeficiente X(1) para cada
canal de expedición representa la energía espectral de la señal
codificada para el respectivo canal de expedición centrada en torno
a 78,1 Hz (20 kHz/256). De este modo, el coeficiente X(1)
para el canal L' de presentación está formado a partir de la suma
ponderada de los coeficientes X(1) a partir de cada canal de
expedición de acuerdo con la ecuación 1. Las ecuaciones 1 y 2 pueden
ser reescritas como
(3)X(i)
_{L'} = X(i) _{L} + 0,7071 \cdot X(i) _{C} + 0,5 \cdot
X(i) _{S}
(4)X(i)
_{R'} = X(i) _{R} + 0,7071 \cdot X(i) _{C} + 0,5 \cdot
X(i) _{S}
en donde X(i)_{Z} =
coeficiente i de la transformada para el canal
Z.
Para un descodificador de subbanda auténtica,
estas combinaciones representan la suma de las correspondientes
muestras en el dominio de tiempo en cada subbanda. De este modo, las
ecuaciones 1 y 2 pueden ser reescritas como
(5)x_{j} (nt)
_{L'} = x_{j} (nt) _{L} + 0,7071 \cdot x_{j} (nt) _{C} + 0,5 \cdot
x_{j} (nt) _{S}
(6)x_{j} (nt)
_{R'} = x_{j} (nt) _{R} + 0,7071 \cdot x_{j} (nt) _{C} + 0,5 \cdot
x_{j} (nt) _{S}
donde
x_{j}(nt)_{Z} = muestra de la señal en el instante
de tiempo nt en la subbanda j del canal
Z.
La figura 4 representa una aplicación de la
presente invención utilizada para formar un canal 414 de
presentación a partir de cuatro canales 402a-402d de
expedición. Una ecuación combinatoria típica para el distribuidor
408 en esta aplicación es
(7)M' = 0,7071
\cdot L + C + 0,7071 \cdot R + S
donde M' = canal monofónico de
presentación.
Las formas precisas de las combinaciones
proporcionadas por el distribuidor variarán de acuerdo con la
aplicación.
Aunque se prevé que la presente invención será
usada normalmente para obtener un número de canales de presentación
menor que el de canales de expedición existentes, la invención no
está limitada a ello. El número de canales de presentación puede ser
el mismo o mayor que el número de canales de expedición, siendo
utilizado el distribuidor para preparar los canales de presentación
de acuerdo con las necesidades de una aplicación deseada.
Claims (3)
1. Un descodificador para descodificar señales
acústicas multicanal que representan un campo de sonido
multidimensional expedido por una pluralidad de canales de
expedición, transportando cada canal de expedición información en
forma de una representación no lineal de coeficientes de
transformada de dominio de frecuencia, que comprende: unos medios
(116, 416) de recepción para recibir dicha pluralidad de canales de
expedición (102a-102d; 402a-402d),
unos medios (104a-104d; 404a-404d)
de desformateado que responden a dichos medios de recepción para
desformatear dicha representación no lineal de coeficientes de
transformada de cada canal de expedición a una representación lineal
respectiva de dichos coeficientes de transformada, y unos medios
(112a-112b; 412) de síntesis para aplicar un dominio
de frecuencia a la transformada de dominio de tiempo para generar
señales de salida en respuesta a dichas representaciones lineales de
coeficientes de transformada, caracterizado porque unos
medios (108, 408) de distribución, interpuestos entre dichos medios
de desformateado y dichos medios de síntesis que responden a dichos
medios de desformateado generan una o más señales intermedias, en
que por lo menos una señal intermedia es generada a partir de la
suma de coeficientes de transformada que representan las mismas
frecuencias espectrales de dos o más de dichas representaciones
lineales, y dichos medios de síntesis generan una señal de salida
respectiva en respuesta a cada una de dichas señales
intermedias.
2. Un descodificador para descodificar señales
acústicas multicanal que representan un campo de sonido
multidimensional expedido por una pluralidad de canales de
expedición, transportando cada canal de expedición información en
forma de una representación no lineal de señales de subbanda, que
comprende: unos medios (116; 416) de recepción para recibir dicha
pluralidad de canales de expedición (102a-102d;
402a-402d), unos medios (104a-104d;
404a-404d) de desformateado que responden a dichos
medios de recepción para desformatear dicha representación no lineal
de señales de subbanda de cada canal de expedición en una
representación lineal respectiva de señales de subbanda, y unos
medios (112a-112b; 412) de síntesis para aplicar un
banco de filtro de síntesis de subbanda para generar señales de
salida en respuesta a dichas representaciones lineales de señales de
subbanda, caracterizado porque unos medios (108; 408) de
distribución, interpuestos entre dichos medios de desformateado y
dichos medios de síntesis que responden a dichos medios de
desformateado generan una o más señales intermedias, en que por lo
menos una señal intermedia es generada a partir de la suma de
muestras de dominio de tiempo correspondientes en cada subbanda
correspondiente de dos o más de dichas representaciones lineales, y
dichos medios de síntesis generan una señal de salida respectiva en
respuesta a cada una de dichas señales intermedias.
3. Un descodificador de acuerdo con la
reivindicación 1 ó 2, en que dicha representación lineal tiene unos
requerimientos de capacidad de información mayores que dichos
canales de expedición de información formateada.
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US63889691A | 1991-01-08 | 1991-01-08 | |
US638896 | 1991-01-08 | ||
US07/718,356 US5274740A (en) | 1991-01-08 | 1991-06-21 | Decoder for variable number of channel presentation of multidimensional sound fields |
US718356 | 1991-06-21 |
Publications (2)
Publication Number | Publication Date |
---|---|
ES2093250T3 ES2093250T3 (es) | 1996-12-16 |
ES2093250T5 true ES2093250T5 (es) | 2005-04-01 |
Family
ID=27093203
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES92903819T Expired - Lifetime ES2093250T5 (es) | 1991-01-08 | 1992-01-08 | Descodificador para la presentacion por un numero variable de canales de campos de sonido multidimensional. |
Country Status (12)
Country | Link |
---|---|
US (2) | US5274740A (es) |
EP (1) | EP0519055B2 (es) |
JP (1) | JP3197012B2 (es) |
KR (1) | KR100228687B1 (es) |
AT (1) | ATE144364T1 (es) |
AU (1) | AU649786B2 (es) |
CA (1) | CA2077668C (es) |
DE (1) | DE69214523T3 (es) |
DK (1) | DK0519055T4 (es) |
ES (1) | ES2093250T5 (es) |
SG (1) | SG49884A1 (es) |
WO (1) | WO1992012608A1 (es) |
Families Citing this family (79)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
USRE40280E1 (en) | 1988-12-30 | 2008-04-29 | Lucent Technologies Inc. | Rate loop processor for perceptual encoder/decoder |
US5632005A (en) * | 1991-01-08 | 1997-05-20 | Ray Milton Dolby | Encoder/decoder for multidimensional sound fields |
US5274740A (en) * | 1991-01-08 | 1993-12-28 | Dolby Laboratories Licensing Corporation | Decoder for variable number of channel presentation of multidimensional sound fields |
EP0559348A3 (en) | 1992-03-02 | 1993-11-03 | AT&T Corp. | Rate control loop processor for perceptual encoder/decoder |
WO1995022816A1 (en) * | 1992-06-29 | 1995-08-24 | Corporate Computer Systems, Inc. | Method and apparatus for adaptive power adjustment of mixed modulation radio transmission |
DE4236989C2 (de) * | 1992-11-02 | 1994-11-17 | Fraunhofer Ges Forschung | Verfahren zur Übertragung und/oder Speicherung digitaler Signale mehrerer Kanäle |
US5561736A (en) * | 1993-06-04 | 1996-10-01 | International Business Machines Corporation | Three dimensional speech synthesis |
US5463424A (en) * | 1993-08-03 | 1995-10-31 | Dolby Laboratories Licensing Corporation | Multi-channel transmitter/receiver system providing matrix-decoding compatible signals |
EP0678226B1 (en) * | 1993-10-27 | 2003-05-14 | Koninklijke Philips Electronics N.V. | Transmission and reception of a first and a second signal component |
US5850500A (en) | 1995-06-28 | 1998-12-15 | Kabushiki Kaisha Toshiba | Recording medium comprising a plurality of different languages which are selectable independently of each other |
EP0836190B1 (en) | 1993-10-29 | 1999-08-11 | Kabushiki Kaisha Toshiba | Information recording disk medium and reproduction apparatus |
JPH07264144A (ja) * | 1994-03-16 | 1995-10-13 | Toshiba Corp | 信号圧縮符号化装置および圧縮信号復号装置 |
JP3277679B2 (ja) * | 1994-04-15 | 2002-04-22 | ソニー株式会社 | 高能率符号化方法と高能率符号化装置及び高能率復号化方法と高能率復号化装置 |
US5577258A (en) * | 1994-07-13 | 1996-11-19 | Bell Communications Research, Inc. | Apparatus and method for preprocessing multimedia presentations to generate a delivery schedule |
US5594911A (en) * | 1994-07-13 | 1997-01-14 | Bell Communications Research, Inc. | System and method for preprocessing and delivering multimedia presentations |
US5818943A (en) * | 1994-10-25 | 1998-10-06 | U.S. Philips Corporation | Transmission and reception of a first and a second main signal component |
JP3072709B2 (ja) | 1994-11-21 | 2000-08-07 | インターナショナル・ビジネス・マシーンズ・コーポレ−ション | 要求伝達方法 |
CA2206129C (en) * | 1994-12-20 | 2009-11-10 | Dolby Laboratories Licensing Corporation | Method and apparatus for applying waveform prediction to subbands of a perceptual coding system |
JP2766466B2 (ja) * | 1995-08-02 | 1998-06-18 | 株式会社東芝 | オーディオ方式、その再生方法、並びにその記録媒体及びその記録媒体への記録方法 |
US5852800A (en) * | 1995-10-20 | 1998-12-22 | Liquid Audio, Inc. | Method and apparatus for user controlled modulation and mixing of digitally stored compressed data |
JP3793235B2 (ja) * | 1996-02-08 | 2006-07-05 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 2チャネル伝送及び1チャネル伝送に適合するnチャネル伝送 |
KR100370412B1 (ko) * | 1996-04-17 | 2003-04-07 | 삼성전자 주식회사 | 복잡도 조절이 가능한 오디오 복호화방법 및 이를이용한오디오복호화기 |
US6252965B1 (en) * | 1996-09-19 | 2001-06-26 | Terry D. Beard | Multichannel spectral mapping audio apparatus and method |
KR100206333B1 (ko) * | 1996-10-08 | 1999-07-01 | 윤종용 | 두개의 스피커를 이용한 멀티채널 오디오 재생장치및 방법 |
SG54379A1 (en) * | 1996-10-24 | 1998-11-16 | Sgs Thomson Microelectronics A | Audio decoder with an adaptive frequency domain downmixer |
US7085387B1 (en) * | 1996-11-20 | 2006-08-01 | Metcalf Randall B | Sound system and method for capturing and reproducing sounds originating from a plurality of sound sources |
US6236730B1 (en) * | 1997-05-19 | 2001-05-22 | Qsound Labs, Inc. | Full sound enhancement using multi-input sound signals |
US5890125A (en) * | 1997-07-16 | 1999-03-30 | Dolby Laboratories Licensing Corporation | Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method |
US6233550B1 (en) | 1997-08-29 | 2001-05-15 | The Regents Of The University Of California | Method and apparatus for hybrid coding of speech at 4kbps |
KR100486208B1 (ko) * | 1997-09-09 | 2005-06-16 | 삼성전자주식회사 | 돌비에이.시.-쓰리디코더의시간영역알리아싱제거장치및방법 |
US6141645A (en) * | 1998-05-29 | 2000-10-31 | Acer Laboratories Inc. | Method and device for down mixing compressed audio bit stream having multiple audio channels |
US6757659B1 (en) * | 1998-11-16 | 2004-06-29 | Victor Company Of Japan, Ltd. | Audio signal processing apparatus |
US6765930B1 (en) | 1998-12-11 | 2004-07-20 | Sony Corporation | Decoding apparatus and method, and providing medium |
US6239348B1 (en) * | 1999-09-10 | 2001-05-29 | Randall B. Metcalf | Sound system and method for creating a sound event based on a modeled sound field |
US6931370B1 (en) * | 1999-11-02 | 2005-08-16 | Digital Theater Systems, Inc. | System and method for providing interactive audio in a multi-channel audio environment |
FR2802329B1 (fr) * | 1999-12-08 | 2003-03-28 | France Telecom | Procede de traitement d'au moins un flux binaire audio code organise sous la forme de trames |
US7003467B1 (en) * | 2000-10-06 | 2006-02-21 | Digital Theater Systems, Inc. | Method of decoding two-channel matrix encoded audio to reconstruct multichannel audio |
US7660424B2 (en) * | 2001-02-07 | 2010-02-09 | Dolby Laboratories Licensing Corporation | Audio channel spatial translation |
US7451006B2 (en) | 2001-05-07 | 2008-11-11 | Harman International Industries, Incorporated | Sound processing system using distortion limiting techniques |
US6804565B2 (en) | 2001-05-07 | 2004-10-12 | Harman International Industries, Incorporated | Data-driven software architecture for digital sound processing and equalization |
US7447321B2 (en) | 2001-05-07 | 2008-11-04 | Harman International Industries, Incorporated | Sound processing system for configuration of audio signals in a vehicle |
US6934677B2 (en) * | 2001-12-14 | 2005-08-23 | Microsoft Corporation | Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands |
US7240001B2 (en) | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
CA2773294C (en) | 2002-05-03 | 2013-03-12 | Harman International Industries, Incorporated | Sound detection and localization system |
US7502743B2 (en) | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
JP4676140B2 (ja) | 2002-09-04 | 2011-04-27 | マイクロソフト コーポレーション | オーディオの量子化および逆量子化 |
AU2003275290B2 (en) | 2002-09-30 | 2008-09-11 | Verax Technologies Inc. | System and method for integral transference of acoustical events |
JP2004335931A (ja) * | 2003-05-12 | 2004-11-25 | Alps Electric Co Ltd | Cpp型巨大磁気抵抗効果素子 |
US7542815B1 (en) | 2003-09-04 | 2009-06-02 | Akita Blue, Inc. | Extraction of left/center/right information from two-channel stereo sources |
GB2410164A (en) * | 2004-01-16 | 2005-07-20 | Anthony John Andrews | Sound feature positioner |
US7460990B2 (en) | 2004-01-23 | 2008-12-02 | Microsoft Corporation | Efficient coding of digital media spectral data using wide-sense perceptual similarity |
KR101079066B1 (ko) | 2004-03-01 | 2011-11-02 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 멀티채널 오디오 코딩 |
JP4495209B2 (ja) * | 2004-03-12 | 2010-06-30 | ノキア コーポレイション | 符号化済みマルチチャンネルオーディオ信号に基づくモノオーディオ信号の合成 |
KR100923478B1 (ko) * | 2004-03-12 | 2009-10-27 | 노키아 코포레이션 | 부호화된 다중채널 오디오 신호에 기반하여 모노 오디오신호를 합성하는 방법 및 장치 |
US8009837B2 (en) * | 2004-04-30 | 2011-08-30 | Auro Technologies Nv | Multi-channel compatible stereo recording |
US8626494B2 (en) * | 2004-04-30 | 2014-01-07 | Auro Technologies Nv | Data compression format |
KR100644617B1 (ko) * | 2004-06-16 | 2006-11-10 | 삼성전자주식회사 | 7.1 채널 오디오 재생 방법 및 장치 |
US7636448B2 (en) * | 2004-10-28 | 2009-12-22 | Verax Technologies, Inc. | System and method for generating sound events |
WO2006091540A2 (en) * | 2005-02-22 | 2006-08-31 | Verax Technologies Inc. | System and method for formatting multimode sound content and metadata |
US8428956B2 (en) * | 2005-04-28 | 2013-04-23 | Panasonic Corporation | Audio encoding device and audio encoding method |
CN101167124B (zh) * | 2005-04-28 | 2011-09-21 | 松下电器产业株式会社 | 语音编码装置和语音编码方法 |
US8190425B2 (en) | 2006-01-20 | 2012-05-29 | Microsoft Corporation | Complex cross-correlation parameters for multi-channel audio |
US7831434B2 (en) | 2006-01-20 | 2010-11-09 | Microsoft Corporation | Complex-transform channel coding with extended-band frequency coding |
US8607281B2 (en) | 2006-09-07 | 2013-12-10 | Porto Vinci Ltd. Limited Liability Company | Control of data presentation in multiple zones using a wireless home entertainment hub |
US20080061578A1 (en) * | 2006-09-07 | 2008-03-13 | Technology, Patents & Licensing, Inc. | Data presentation in multiple zones using a wireless home entertainment hub |
US9386269B2 (en) | 2006-09-07 | 2016-07-05 | Rateze Remote Mgmt Llc | Presentation of data on multiple display devices using a wireless hub |
US9319741B2 (en) * | 2006-09-07 | 2016-04-19 | Rateze Remote Mgmt Llc | Finding devices in an entertainment system |
US8935733B2 (en) * | 2006-09-07 | 2015-01-13 | Porto Vinci Ltd. Limited Liability Company | Data presentation using a wireless home entertainment hub |
US8966545B2 (en) * | 2006-09-07 | 2015-02-24 | Porto Vinci Ltd. Limited Liability Company | Connecting a legacy device into a home entertainment system using a wireless home entertainment hub |
US8005236B2 (en) | 2006-09-07 | 2011-08-23 | Porto Vinci Ltd. Limited Liability Company | Control of data presentation using a wireless home entertainment hub |
US9233301B2 (en) * | 2006-09-07 | 2016-01-12 | Rateze Remote Mgmt Llc | Control of data presentation from multiple sources using a wireless home entertainment hub |
US7885819B2 (en) | 2007-06-29 | 2011-02-08 | Microsoft Corporation | Bitstream syntax for multi-process audio decoding |
TWI449442B (zh) | 2009-01-14 | 2014-08-11 | Dolby Lab Licensing Corp | 用於無回授之頻域主動矩陣解碼的方法與系統 |
US20100223552A1 (en) * | 2009-03-02 | 2010-09-02 | Metcalf Randall B | Playback Device For Generating Sound Events |
US9082395B2 (en) | 2009-03-17 | 2015-07-14 | Dolby International Ab | Advanced stereo coding based on a combination of adaptively selectable left/right or mid/side stereo coding and of parametric stereo coding |
TWI484481B (zh) | 2009-05-27 | 2015-05-11 | 杜比國際公司 | 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體 |
US11657788B2 (en) | 2009-05-27 | 2023-05-23 | Dolby International Ab | Efficient combined harmonic transposition |
TWI557723B (zh) | 2010-02-18 | 2016-11-11 | 杜比實驗室特許公司 | 解碼方法及系統 |
KR101809272B1 (ko) * | 2011-08-03 | 2017-12-14 | 삼성전자주식회사 | 다 채널 오디오 신호의 다운 믹스 방법 및 장치 |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2073556B (en) * | 1980-02-23 | 1984-02-22 | Nat Res Dev | Sound reproduction systems |
US4700362A (en) * | 1983-10-07 | 1987-10-13 | Dolby Laboratories Licensing Corporation | A-D encoder and D-A decoder system |
FR2577084B1 (fr) * | 1985-02-01 | 1987-03-20 | Trt Telecom Radio Electr | Systeme de bancs de filtres d'analyse et de synthese d'un signal |
US5046098A (en) * | 1985-03-07 | 1991-09-03 | Dolby Laboratories Licensing Corporation | Variable matrix decoder with three output channels |
US4941177A (en) * | 1985-03-07 | 1990-07-10 | Dolby Laboratories Licensing Corporation | Variable matrix decoder |
US4774496A (en) * | 1986-02-28 | 1988-09-27 | American Telephone And Telegraph Company, At&T Bell Laboratories | Digital encoder and decoder synchronization in the presence of data dropouts |
US4726019A (en) * | 1986-02-28 | 1988-02-16 | American Telephone And Telegraph Company, At&T Bell Laboratories | Digital encoder and decoder synchronization in the presence of late arriving packets |
US4882755A (en) * | 1986-08-21 | 1989-11-21 | Oki Electric Industry Co., Ltd. | Speech recognition system which avoids ambiguity when matching frequency spectra by employing an additional verbal feature |
NL8700985A (nl) * | 1987-04-27 | 1988-11-16 | Philips Nv | Systeem voor sub-band codering van een digitaal audiosignaal. |
US5040212A (en) * | 1988-06-30 | 1991-08-13 | Motorola, Inc. | Methods and apparatus for programming devices to recognize voice commands |
NL8901032A (nl) * | 1988-11-10 | 1990-06-01 | Philips Nv | Coder om extra informatie op te nemen in een digitaal audiosignaal met een tevoren bepaald formaat, een decoder om deze extra informatie uit dit digitale signaal af te leiden, een inrichting voor het opnemen van een digitaal signaal op een registratiedrager, voorzien van de coder, en een registratiedrager verkregen met deze inrichting. |
US5142656A (en) * | 1989-01-27 | 1992-08-25 | Dolby Laboratories Licensing Corporation | Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio |
US5109417A (en) * | 1989-01-27 | 1992-04-28 | Dolby Laboratories Licensing Corporation | Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio |
EP0400222A1 (en) * | 1989-06-02 | 1990-12-05 | ETAT FRANCAIS représenté par le Ministère des Postes, des Télécommunications et de l'Espace | Digital transmission system using subband coding of a digital signal |
NL9000338A (nl) * | 1989-06-02 | 1991-01-02 | Koninkl Philips Electronics Nv | Digitaal transmissiesysteem, zender en ontvanger te gebruiken in het transmissiesysteem en registratiedrager verkregen met de zender in de vorm van een optekeninrichting. |
GB8913758D0 (en) * | 1989-06-15 | 1989-08-02 | British Telecomm | Polyphonic coding |
US5036538A (en) * | 1989-11-22 | 1991-07-30 | Telephonics Corporation | Multi-station voice recognition and processing system |
US5274740A (en) * | 1991-01-08 | 1993-12-28 | Dolby Laboratories Licensing Corporation | Decoder for variable number of channel presentation of multidimensional sound fields |
EP0520068B1 (en) * | 1991-01-08 | 1996-05-15 | Dolby Laboratories Licensing Corporation | Encoder/decoder for multidimensional sound fields |
-
1991
- 1991-06-21 US US07/718,356 patent/US5274740A/en not_active Expired - Lifetime
-
1992
- 1992-01-08 DK DK92903819T patent/DK0519055T4/da active
- 1992-01-08 AU AU11942/92A patent/AU649786B2/en not_active Expired
- 1992-01-08 AT AT92903819T patent/ATE144364T1/de not_active IP Right Cessation
- 1992-01-08 CA CA002077668A patent/CA2077668C/en not_active Expired - Lifetime
- 1992-01-08 DE DE69214523T patent/DE69214523T3/de not_active Expired - Lifetime
- 1992-01-08 SG SG1996008135A patent/SG49884A1/en unknown
- 1992-01-08 ES ES92903819T patent/ES2093250T5/es not_active Expired - Lifetime
- 1992-01-08 EP EP92903819A patent/EP0519055B2/en not_active Expired - Lifetime
- 1992-01-08 WO PCT/US1992/000134 patent/WO1992012608A1/en active IP Right Grant
- 1992-01-08 JP JP50383692A patent/JP3197012B2/ja not_active Expired - Lifetime
- 1992-01-08 KR KR1019920702096A patent/KR100228687B1/ko not_active IP Right Cessation
-
1993
- 1993-12-28 US US08/175,051 patent/US5400433A/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
ES2093250T3 (es) | 1996-12-16 |
AU649786B2 (en) | 1994-06-02 |
SG49884A1 (en) | 1998-06-15 |
CA2077668A1 (en) | 1992-07-09 |
DK0519055T4 (da) | 2005-01-10 |
WO1992012608A1 (en) | 1992-07-23 |
ATE144364T1 (de) | 1996-11-15 |
EP0519055A1 (en) | 1992-12-23 |
JPH05505504A (ja) | 1993-08-12 |
EP0519055B1 (en) | 1996-10-16 |
KR920704540A (ko) | 1992-12-19 |
DK0519055T3 (da) | 1997-03-24 |
CA2077668C (en) | 2001-02-27 |
US5400433A (en) | 1995-03-21 |
KR100228687B1 (ko) | 1999-11-01 |
US5274740A (en) | 1993-12-28 |
DE69214523T3 (de) | 2005-03-03 |
JP3197012B2 (ja) | 2001-08-13 |
DE69214523D1 (de) | 1996-11-21 |
DE69214523T2 (de) | 1997-03-27 |
AU1194292A (en) | 1992-08-17 |
EP0519055B2 (en) | 2004-11-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2093250T5 (es) | Descodificador para la presentacion por un numero variable de canales de campos de sonido multidimensional. | |
US6021386A (en) | Coding method and apparatus for multiple channels of audio information representing three-dimensional sound fields | |
US5632005A (en) | Encoder/decoder for multidimensional sound fields | |
ES2682073T3 (es) | Codificación conjunta paramétrica de fuentes de audio | |
US6072878A (en) | Multi-channel surround sound mastering and reproduction techniques that preserve spatial harmonics | |
US20180151185A1 (en) | Audio encoding and decoding | |
ES2729624T3 (es) | Reducción de la correlación entre canales de fondo ambisónicos de orden superior (HOA) | |
JP5185340B2 (ja) | マルチチャネルオーディオ信号を表示するための装置と方法 | |
ES2300567T3 (es) | Representacion parametrica de audio espacial. | |
CA2327281C (en) | Low bit-rate spatial coding method and system | |
US7489788B2 (en) | Recording a three dimensional auditory scene and reproducing it for the individual listener | |
US6169973B1 (en) | Encoding method and apparatus, decoding method and apparatus and recording medium | |
KR20140000240A (ko) | 고차 앰비소닉 오디오 데이터를 위한 데이터 구조 | |
TW201442522A (zh) | 屬於第1階保真立體音響訊號且具有第0階和第1階係數的輸入訊號指向性之增進方法及裝置 | |
JP2000507062A (ja) | マルチチャネル・スペクトル・マッピング・オーディオ装置及び方法 | |
ES2968494T3 (es) | Determinación de codificación de parámetros de audio espacial y decodificación asociada | |
Arteaga | Introduction to ambisonics | |
WO1994018762A1 (en) | Transmission of digital data words representing a signal waveform | |
US7043312B1 (en) | CD playback augmentation for higher resolution and multi-channel sound | |
AU682913B2 (en) | Encoder/decoder for multidimensional sound fields | |
Zinemanas et al. | Improving Csound’s Ambisonics decoders | |
KR20070017441A (ko) | 저 비트속도 공간 코딩방법 및 시스템 | |
Hawksford | A Compilation of Technical Papers on Stereo and Spatial Audio | |
AU2002325063A1 (en) | Recording a three dimensional auditory scene and reproducing it for the individual listener |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FG2A | Definitive protection |
Ref document number: 519055 Country of ref document: ES |