ES2272062T3 - Metodo y sistema de codificacion espacial de velocidad baja de bits. - Google Patents
Metodo y sistema de codificacion espacial de velocidad baja de bits. Download PDFInfo
- Publication number
- ES2272062T3 ES2272062T3 ES99915275T ES99915275T ES2272062T3 ES 2272062 T3 ES2272062 T3 ES 2272062T3 ES 99915275 T ES99915275 T ES 99915275T ES 99915275 T ES99915275 T ES 99915275T ES 2272062 T3 ES2272062 T3 ES 2272062T3
- Authority
- ES
- Spain
- Prior art keywords
- signal
- acoustic
- subband
- output channels
- decoder
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 title claims description 63
- 239000002131 composite material Substances 0.000 claims abstract description 88
- 239000013598 vector Substances 0.000 claims abstract description 47
- 230000004044 response Effects 0.000 claims description 32
- 235000009508 confectionery Nutrition 0.000 claims description 22
- 230000008569 process Effects 0.000 claims description 15
- 230000002441 reversible effect Effects 0.000 claims description 13
- 238000012545 processing Methods 0.000 claims description 9
- 230000008447 perception Effects 0.000 claims description 7
- 239000011800 void material Substances 0.000 claims description 4
- 238000001228 spectrum Methods 0.000 abstract description 2
- 230000033458 reproduction Effects 0.000 description 24
- 230000003595 spectral effect Effects 0.000 description 24
- 230000000694 effects Effects 0.000 description 20
- 238000010586 diagram Methods 0.000 description 13
- 230000003044 adaptive effect Effects 0.000 description 9
- 238000011002 quantification Methods 0.000 description 7
- 230000000873 masking effect Effects 0.000 description 6
- 239000000654 additive Substances 0.000 description 5
- 230000000996 additive effect Effects 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 5
- 150000001875 compounds Chemical class 0.000 description 5
- 230000008034 disappearance Effects 0.000 description 5
- 238000013139 quantization Methods 0.000 description 5
- 238000005070 sampling Methods 0.000 description 5
- OVOUKWFJRHALDD-UHFFFAOYSA-N 2-[2-(2-acetyloxyethoxy)ethoxy]ethyl acetate Chemical compound CC(=O)OCCOCCOCCOC(C)=O OVOUKWFJRHALDD-UHFFFAOYSA-N 0.000 description 4
- 230000001934 delay Effects 0.000 description 4
- 230000007547 defect Effects 0.000 description 3
- 230000003111 delayed effect Effects 0.000 description 3
- 230000005236 sound signal Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000001427 coherent effect Effects 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- BHTRKEVKTKCXOH-UHFFFAOYSA-N Taurochenodesoxycholsaeure Natural products OC1CC2CC(O)CCC2(C)C2C1C1CCC(C(CCC(=O)NCCS(O)(=O)=O)C)C1(C)CC2 BHTRKEVKTKCXOH-UHFFFAOYSA-N 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 238000009395 breeding Methods 0.000 description 1
- 230000001488 breeding effect Effects 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000015654 memory Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000010363 phase shift Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- AWDRATDZQPNJFN-VAYUFCLWSA-N taurodeoxycholic acid Chemical compound C([C@H]1CC2)[C@H](O)CC[C@]1(C)[C@@H]1[C@@H]2[C@@H]2CC[C@H]([C@@H](CCC(=O)NCCS(O)(=O)=O)C)[C@@]2(C)[C@@H](O)C1 AWDRATDZQPNJFN-VAYUFCLWSA-N 0.000 description 1
- 229950005578 tidiacic Drugs 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S1/00—Two-channel systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/66—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
- H04B1/667—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using a division in frequency subbands
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Stereophonic System (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Detection And Prevention Of Errors In Transmission (AREA)
- Communication Control (AREA)
- Error Detection And Correction (AREA)
Abstract
Un sistema de codificación espacial de veloci- dad baja de bits para codificar una pluralidad de corrien- tes de audio que representan un campo acústico en una señal codificada y descodificar dicha señal codificada, incluyen- do dicho sistema un codificador y un descodificador, com- prendiendo dicho codificador: un generador (710) de señales de subbandas que genera una pluralidad de señales de subbandas en respuesta a dicha pluralidad de corrientes de audio, representando cada señal de subbanda una subbanda respectiva de frecuen- cias de una respectiva de dichas corrientes de audio, un combinador (902) de señales que genera una señal compuesta que representa la combinación de señales de subbandas en subbandas respectivas de frecuencias, un detector (902) de dirección de campo acústico que genera una señal de control de dirección para dicha señal compuesta que indica la dirección principal de dicho campo acústico en subbandas respectivas, un codificador y dispositivo de asignación de bits (730; 904, 908, 910, 912) que genera información codificada asignando bits a dicha señal compuesta y dicha señal de control de dirección, y un formateador (740) que ensambla dicha informa- ción codificada en una señal codificada, y comprendiendo dicho descodificador un desformateador (810) que deriva la señal compuesta y la señal de control de dirección de dicha señal codificada, un generador inverso (840) de subbandas que deriva señales de subbandas en respuesta a dicha señal compuesta y dicha señal de control de dirección, una entrada de información que describe el número de canales de salida de dicho descodificador y la posición o posición virtual de los transductores acústicos conecta- dos a los canales de salida respectivos, en el que hay tres o más canales de salida, y un generador (1014) de señal que genera una corriente de audio en no más de dos canales de salida en cualquier instante en respuesta a dichas señales de subban- das e información de reproducción.
Description
Método y sistema de codificación espacial de
velocidad baja de bits.
La invención se refiere en general a la
grabación, transmisión y reproducción de campos acústicos
multidimensionales destinados a la audición humana. Más
particularmente, la invención se refiere a mejoras en un sistema de
codificación perceptiva, codificadores y descodificadores para él y
métodos para él, en el que señales codificadas son transportadas
por una audioseñal compuesta y un vector direccional. La invención
está adaptada particularmente para el uso en sistemas que necesitan
velocidades de bits extremadamente bajas.
Las Patentes de Estados Unidos 5.583.962,
5.632.005 y 5.633.981 describen dos sistemas de codificación
perceptiva de velocidad reducida de bits para audioseñales,
designados en ellas como "Tipo I" y "Tipo II". Cada una de
dichas patentes 5.583.962, 5.632.005 y 5.633.981 es incorporada por
la presente mediante referencia en su totalidad. Según un principio
fundamental para ambos sistemas, un codificador genera señales de
subbandas de frecuencias en respuesta a corrientes de audioseñales
de entrada, correspondiendo las subbandas generalmente a las bandas
críticas del oído humano.
En el codificador del sistema de Tipo I descrito
en dichas patentes, cada corriente de audio es codificada
independientemente cuando hay un número suficiente de bits
disponibles. Cuando hay una escasez de bits, los componentes de
señales en algunas o todas de las subbandas son combinados en una
señal compuesta y una pluralidad de factores de escala, un factor
de escala para cada corriente de audio de entrada, cada factor de
escala basado en alguna medida de los componentes de señal de
subbanda en cada una de las corriente de audio. El descodificador
de Tipo I reconstruye una representación de las corrientes de
señales originales a partir de la señal compuesta y los factores de
escala. El sistema de Tipo I proporciona así un ahorro de bits o
ganancia de codificación respecto a un sistema discreto dedicado en
el que cada corriente de audio es codificada independientemente. El
sistema de Tipo I es empleado en codificación AC-3,
que forma la base de el sistema de codificación perceptiva Dolby
Digital, en la que 5,1 canales de audio (izquierdo, central,
derecho, envolvente izquierdo, envolvente derecho y un canal de
infragraves de anchura de banda limitada) son codificados en una
corriente de datos de velocidad de bits reducida.
En el codificador del sistema de Tipo II
descrito en dichas patentes, cada corriente de audio es codificada
independientemente cuando hay un número suficiente de bits
disponibles. Cuando hay una escasez de bits, los componentes de
señales en algunas o todas de las subbandas son combinados en una
señal compuesta y uno o más vectores direccionales, indicando los
vectores direccionales la una o más direcciones principales de un
campo acústico representado por las corrientes de audio. El
descodificador de Tipo II reconstruye una representación del campo
acústico representado por las corrientes de señales originales a
partir de la señal compuesta y del uno o más vectores
direccionales. Así, el sistema de Tipo II proporciona un ahorro de
bits o ganancia de codificación respecto a un sistema discreto
dedicado, en el que cada corriente de audio es codificada
independientemente, y respecto al sistema de Tipo I en el que la
señal compuesta está asociada con factores de escala para cada
corriente de audio.
Los sistemas de Tipo I y Tipo II descritos en
dichas patentes son adaptables de varios modos. Un aspecto de su
adaptabilidad es que una o más de las subbandas de frecuencias
pueden operar algo del tiempo en un modo "discreto" tal que
todos los componentes de subbanda de las corrientes de audio en la
subbanda de frecuencias son codificados y descodificados
independientemente cada uno, mientras que una escasez de bits, por
ejemplo, causa que los componentes de subbanda de las corrientes de
audio en una subbanda de frecuencias particular sean codificados
según el método de Tipo I o el método de Tipo II.
También es conocido cambiar en vaivén
adaptablemente desde un modo de funcionamiento de Tipo I a uno de
Tipo II dentro de una o más subbandas de frecuencias. Tales
disposiciones son el sujeto de la Solicitud de Patente de Estados
Unidos de Mark Frankling Davis, nº de serie 08/895.496, presentada
el 16 de julio de 1.997, titulada "Método y aparato para
codificar y descodificar canales de audio múltiples a velocidades
bajas de bits". Como el método de Tipo II necesita menos bits
que el método de Tipo I, una escasez de bits a corto plazo puede
ser superada empleando codificación y descodificación Tipo II.
La presente invención se refiere a codificación
de Tipo II, codificadores y descodificadores para ella, y a
entornos en los que tales descodificadores son empleados
ventajosamente. En particular, la presente invención está dirigida
a nuevos aspectos de codificadores y descodificadores de Tipo II y a
entornos de descodificadores que no son descritos en dichas
patentes 5.583.962, 5.632.005 y 5.633.981. Aunque las realizaciones
específicas descritas aquí se refieren a una versión simplificada
de Tipo II en la que los codificadores y descodificadores son
preferiblemente dispositivos de Tipo II dedicados y es empleado un
vector direccional único, ciertos aspectos de las mejoras en la
codificación de Tipo II, que son el sujeto de la invención, pueden
ser empleados en formas más complejas de sistemas de Tipo II que
incluyen las disposiciones adaptables descritas en dichas patentes
5.583.962, 5.632.005 y 5.633.981 y en un sistema de Tipo I/Tipo II
adaptable tal como el descrito en dicha solicitud de Davis en
tramitación junto con la presente. La naturaleza espacial de la
codificación, por medio de un vector direccional, en la versión
simplificada de vector direccional único del codificador de Tipo II
sugiere que podría ser denominado un "codificador espacial". En
todo este documento, la versión de vector único de codificación de
Tipo II de dichas patentes 5.583.962, 5.632.005 y 5.633.981 es
denominada "codificación espacial".
El inventor cree que, dentro de un intervalo de
tiempo suficientemente corto del orden de un número pequeño de
milisegundos, el oído humano es capaz de escuchar el sonido solo
procedente de una sola dirección en una banda crítica aunque estén
presentes sonidos procedentes de direcciones múltiples, cada uno en
frecuencias diferentes dentro de la banda crítica. Por
consiguiente, para un sistema en el que el vector direccional es
capaz de cambiar dentro de un intervalo de tiempo suficientemente
corto, la forma básica de vector direccional único del sistema de
Tipo II materializado en un codificador espacial es adecuada para
representar el campo acústico aunque sea incapaz de reproducir
continua y simultáneamente todos los de una multiplicidad de
canales. Este efecto es ilustrado conceptualmente en la Figura 1;
el oyente 101 está percibiendo que los sonidos dentro de una
subbanda proceden del punto 111 aunque los sonidos dentro de la
subbanda proceden realmente de todos los altavoces 102 a 110.
Este efecto de "dirección única" tiene
alguna semejanza superficial con el efecto de "localización
aditiva" bien conocido. Según este último efecto, como es
descrito por Blauert ("Audición espacial: la psicofísica de la
localización acústica humana" de Jens Blauert, la Prensa del MIT,
Cambridge, Massachusetts, edición revisada, 1.997), dos o más
fuentes de sonido que radian señales coherentes dentro de una cierta
amplitud entre sí y dentro de un cierto tiempo entre sí producen la
percepción de una señal ficticia única. Particularmente, véanse las
páginas 204, 271 y 272 del texto de Blauert. Según Blauert, a medida
que un par de señales inicialmente coherentes resultan menos y
menos coherentes, un oyente es crecientemente capaz de detectar
señales distintas. Particularmente, véanse las páginas 240 y 242
del texto de Blauert. Sin embargo, según el efecto de dirección
única del presente inventor, a medida que la separación en
frecuencia entre señales múltiples disminuye hasta dentro de una
banda crítica, y el intervalo de tiempo es suficientemente corto,
también disminuye la capacidad de un oyente para percibirlas como
procedentes de direcciones distintas.
El inventor reconoce que hay un compromiso entre
la brevedad del intervalo de tiempo y las exigencias adicionales de
velocidad de bit (debidas a frecuencias de muestreo más altas) que
pueden ser necesarias a medida que el intervalo de tiempo es
reducido (véase la discusión posterior en la página 21). Así, para
un sistema de velocidad muy baja de bits en el que la frecuencia de
muestreo es menor que la óptima para el efecto de dirección única,
alguna pérdida en percepción y precisión en la ubicación de sonido
del oyente de multiseñal multidireccional puede ocurrir en algunos
estados de señales. No obstante, es probable que la reproducción
resultante proporcione una experiencia auditiva multidireccional
agradable y aceptable. La presente invención es particularmente
útil para uso con sistemas de transmisión o grabación en los que las
velocidades de bits son extremadamente limitadas tales como, por
ejemplo, audio por vía de Internet.
Un aspecto de la presente invención está basado
en el reconocimiento de que los defectos percibidos hasta ahora de
la codificación espacial, principalmente un efecto de
"desaparición de señal" ("signal ducking "), son virtudes
de hecho cuando la codificación espacial es empleada en una
disposición de reproducción acústica en la que el oyente u oyentes
están situados previsiblemente dentro de un área auditiva
predeterminada. La invención es particularmente adecuada para uso
en entornos auditivos en los que uno o quizás dos oyentes están
situados previsiblemente en lo que podría ser caracterizado como
"un lugar dulce de codificación espacial" como se explica
después en relación con las Figuras 2, 3 y 4. La capacidad de la
codificación espacial para producir un campo acústico sin defectos
dentro de un área auditiva tal, un lugar dulce de codificación
espacial, es un resultado inesperado. En el lugar dulce de
codificación espacial, el efecto de desaparición de señal no es
percibido psicoacústicamente por un oyente u oyentes. Es obtenido un
campo acústico estable, normal.
La Figura 2 muestra un oyente 202 situado en un
área auditiva previsible, un punto lugar 204 de codificación
espacial, idealizado, esencialmente circular, dentro de cinco
altavoces: izquierdo (206), central (208), derecho (210),
envolvente izquierdo (212) y envolvente derecho (214), una
disposición típica de reproducción de "sonido envolvente".
En sistemas acústicos de ordenador personal
("multimedia"), típicamente solo son empleados dos altavoces,
altavoces izquierdo y derecho situados adyacentes a, o cerca de, el
monitor de ordenador (y, opcionalmente, un altavoz de infragraves
que puede estar situado a distancia, tal como el suelo; en la
presente invención, el altavoz de infragraves es ignorado). Los dos
altavoces crean un área auditiva óptima relativamente pequeña. La
Figura 3 muestra un oyente 302 situado en un área auditiva
previsible, un lugar dulce 304 idealizado de codificación espacial,
enfrente de un monitor 306 de ordenador que tiene altavoces
izquierdo (308) y derecho (310) en sus lados. Sistemas acústicos de
ordenador más complicados pueden emplear más de dos altavoces en la
manera de la disposición de la Figura 2 (el monitor de ordenador
estaría situado en el mismo sitio que el altavoz central, entre los
altavoces izquierdo y derecho).
Un área auditiva óptima pequeña similar es
creada por algunos televisores en los que un par de altavoces están
situados a cada lado de la pantalla. La Figura 4 muestra un oyente
402 situado en un área auditiva previsible, un lugar dulce
idealizado 404 de codificación espacial enfrente de un televisor 406
que tiene altavoces incorporados izquierdo (408) y derecho (410)
adyacentes a su tubo 412 de imagen. Sistemas acústicos de televisión
más complicados pueden emplear más de dos altavoces en la manera de
la disposición de la Figura 2. Por ejemplo, la televisión podría
tener altavoces izquierdo, central y derecho integrados dentro de su
caja, o esos altavoces podrían ser externos a la caja del televisor
junto con los altavoces envolventes.
El sistema Dolby AC-3 y muchos
otros sistemas no aprovechan totalmente la posición previsible de un
oyente enfrente de un sistema acústico de ordenador o televisión,
malgastando de tal modo bits en tales entornos. Aunque la
codificación espacial es particularmente útil en entornos tales como
los mostrados en las Figuras 1, 2 y 3, la codificación espacial
también es útil en entornos más grandes, comprendiéndose que el
tamaño del área auditiva previsible aumenta a medida que aumenta la
separación entre los altavoces. La codificación espacial también
puede ser útil en entornos más grandes incluso para oyentes fuera
del área auditiva previsible cuando es empleada solo durante
intervalos de tiempo breves con escasez de bits.
En un sistema de sonido envolvente simplificado
que emplea un codificador espacial (o sea, un sistema de Tipo II
que emplea solo un vector direccional único), solo necesita ser
transmitida información suficiente para satisfacer a un oyente en
un área auditiva previsible o lugar dulce de codificación espacial.
No necesita hacerse ningún intento de proporcionar toda la
información necesaria para recrear, por ejemplo, todos los cinco
canales como reproducciones exactas de los cinco canales de entrada,
como es efectuado en el sistema AC-3. Esto produce
una reducción significativa de bits. Así, el codificador espacial es
muy eficiente en no codificar nada que no pueda ser oído en el área
auditiva previsible en cualquier instante. Este sistema simplificado
puede funcionar incluso, supóngase, para dos oyentes siempre que
estén próximos entre sí y dentro de la ubicación previsible.
El efecto secundario de "desaparición de
señal" de este tratamiento simplificado es que si el oyente sale
de la ubicación previsible y pone un oído en cualquier altavoz
particular, un sonido puede aparecer y desaparecer cuando cambia el
contenido de programa: el efecto de desaparición de señal (la señal
procedente de un altavoz particular puede "desaparecer" o ser
modulada por señales procedentes de otros canales). El efecto es
exactamente lo que un clarinetista ha sabido siempre: sus
creaciones tranquilas para la audiencia desaparecen con cada toque
de trombón y reaparecen milagrosamente siempre que están libres
nuevamente. Aunque tal efecto secundario sería inaceptable en
teatros comerciales de gran audiencia y en teatros caseros con
oyentes distribuidos por toda la habitación (más bien que dentro de
un lugar dulce de codificación espacial relativamente pequeño tal
como se muestra en la Figura 3), el efecto es benigno e inaudible
para uno o dos oyentes en un área auditiva previsible. Sin embargo,
como se observó antes, la codificación espacial puede ser útil en
teatros comerciales de gran audiencia y en teatros caseros con
oyentes distribuidos por toda la habitación siempre que sea empleada
solo durante intervalos breves de tiempo como, por ejemplo, durante
estados de escasez extrema de bits.
El efecto secundario de desaparición de señal de
la codificación espacial es inaudible dentro del área auditiva
previsible, permitiendo así que las exigencias de bits del
codificador sean limitadas solo a las absolutamente necesarias para
generar una impresión auditiva agradable dentro de ese área. Aunque
no pretende proporcionar un resultado de "conductor recto con
ganancia", un buen efecto práctico agradable es percibido dentro
del lugar dulce de codificación espacial con buena localización y
defectos mínimos.
Para aumentar el efecto de sonido envolvente de
una disposición de reproducción acústica de ordenador o televisión
de dos altavoces, es conveniente "espacializar" las señales
descodificadas de codificador espacial empleando un
"espacializador" que tiene un anulador de diafonía acústica (o
alimentación cruzada). Cuando es presentado por dos altavoces por
vía de medios convencionales, el material estereofónico produce
imágenes sónicas que están restringidas a los propios altavoces y
al espacio entre ellos. Este efecto resulta de la alimentación
cruzada de la señal acústica procedente de cada altavoz al oído
lejano de un oyente situado enfrente del monitor de ordenador.
Aplicando las señales de canales envolventes a un anulador de
diafonía acústica y sumando las señales procesadas con las señales
izquierda y derecha principales, es posible representar la
percepción de que información de sonido envolvente está procediendo
de ubicaciones de altavoces virtuales detrás o al lado de un oyente
cuando solo son empleados dos altavoces situados delante (las
señales de canales izquierdo y derecho proceden de las ubicaciones
de altavoces reales como lo harían ordinariamente).
El origen del anulador de diafonía acústica es
atribuido generalmente a B.S. Atal y Manfred Schroeder de Bell
Telephone Laboratories (por ejemplo, véase la Patente de EE.UU.
3.236.949 que es incorporada por la presente mediante referencia en
su totalidad). Como es descrito originalmente por Schroeder y Atal,
el efecto de alimentación cruzada acústica puede ser mitigado
introduciendo una señal de anulación apropiada desde el altavoz
opuesto. Como la propia señal de anulación se alimentará de forma
cruzada acústicamente, también debe ser anulada por una señal
apropiada procedente del altavoz que emite originalmente, y así
sucesivamente.
La Figura 5A es un esquema de bloques
funcionales que muestra un tipo de espacializador que tiene una red
de anulación de diafonía de audio de la presente invención que puede
ser empleada. Son recibidas cinco audioseñales de entrada:
izquierda, central derecha, envolvente izquierda y envolvente
derecha, tal como en el sistema Dolby Digital AC-3.
Las entradas son aplicadas, respectivamente a filtros de bloqueo de
corriente continua opcionales 502, 504, 506, 508 y 510. Retardos
opcionales 512, 514 y 516 en las líneas de entrada izquierda,
central y derecha tienen retardos de tiempo que corresponden al
retardo de tiempo, si lo hay, en la red 520 de anulación de
diafonía. Ordinariamente, no habrá retardo de tiempo en la red 520 y
los retardos 512, 514 y 516 son omitidos a no ser que la red 520
incluya, por ejemplo, un compresor/limitador de amplitud. En este
ejemplo, las entradas a la red 520 de anulación son las entradas
envolvente izquierda y envolvente derecha. Una realización
simplificada de la red 520 de anulación es descrita en relación con
la realización de la Figura 5C. Refiriéndose nuevamente a la Figura
5A, un primer sumador aditivo lineal 522 recibe la corriente de
audio retardada de canal izquierdo. Un segundo sumador aditivo
lineal 524 recibe la corriente de audio retardada de canal derecho.
La corriente de audio retardada de canal central es aplicada al
sumador 522 y al sumador 524. La corriente de audio procesada de
canal envolvente izquierdo procedente de la red 520 también es
aplicada al sumador 522. La corriente de audio procesada de canal
envolvente derecho procedente de la red 520 también es aplicada al
sumador 524. Solo las corrientes de audio de canales envolventes
izquierdo y derecho son procesadas por la red de anulación. Los
canales frontales izquierdo y derecho son sumados a los canales
envolventes izquierdo y derecho procesados por red de anulación,
respectivamente. El canal central es sumado en fase a las salidas
izquierda y derecha sin ningún procesamiento adicional.
La disposición de la Figura 5A también puede ser
empleada cuando hay cuatro señales de entrada (canales izquierdo,
central y derecho y un solo canal envolvente) tal como es
proporcionada por un descodificador Dolby Surround (Envolvente) o
Dolby Surround Pro Logic. En ese caso, el único canal envolvente
debería ser descorrelacionado en dos señales seudoestereofónicas
que, a su vez, son aplicadas a las entradas del anulador. Puede ser
usada una conversión seudoestereofónica simple que emplea
desplazamiento de fase tal que una señal está desfasada con la
otra. Muchas otras técnicas de conversión seudoestereofónica son
conocidas en la técnica.
La Figura 5B muestra alternativas adicionales al
espacializador de la Figura 5A. En la Figura 5B, los canales
frontales izquierdo y derecho son ensanchados ligeramente por mezcla
antifase parcial en el bloque 526. La mezcla antifase para
ensanchar la "etapa" estereofónica aparente es una técnica bien
conocida en la tecnología. Como otra opción, el canal central puede
ser anulado para minimizar el timbre falso que resulta de hacer que
la señal central sea oída dos veces por cada oído (una vez desde el
altavoz cercano y otra vez desde el altavoz lejano). Más bien que
requerir una realización de anulador separado, las señales de
alimentación cruzada acústica de canal central pueden ser anuladas
aplicándolas a la red de anulación de diafonía de canales
envolventes. Así, la señal de canal central es mezclada en las
entradas envolvente izquierda y envolvente derecha a la red 520 de
anulación de diafonía por vía de los sumadores aditivos lineales 526
y 528, respectivamente.
La Figura 5C es un esquema de bloques
funcionales que muestra los elementos básicos de un anulador simple
de diafonía acústica utilizable en las disposiciones de la Figura 5A
o la Figura 5B. Otros anuladores más complejos pueden ser
empleados. Cada retardo 530 y 532 es típicamente de unos 140 \mus
(microsegundos) para altavoces situados hacia delante con respecto
a un oyente en ángulos de ±15 grados, un ángulo típico para el
entorno de monitor de ordenador de la Figura 3 y el entorno de
televisión de la Figura 4. Cada uno de los filtros 534 y 536 es
simplemente un factor K de atenuación independiente de la
frecuencia, típicamente 0,9 aproximadamente. La entrada de cada
derivación 538 y 540 de alimentación cruzada es tomada de la salida
de un sumador aditivo (542 y 544, respectivamente) en una
disposición de realimentación negativa de canal cruzado (cada
derivación es restada en el sumador respectivo), para generar un
anulador de cada señal de anulador anterior, como se explicó
anteriormente. Este es un sumador de diafonía acústica muy simple
para realizar digitalmente: dos sumas, dos multiplicaciones y un
par de memorias intermedias anulares de 6 muestras para los
retardos. Es preferido que, si se usa, el anulador de diafonía
acústica sea implementado digitalmente en software y ejecutado en
tiempo real en un ordenador personal asociado con el monitor 306 en
la Figura 3 o en un microprocesador en el televisor 406 de la
Figura 4.
De acuerdo con la presente invención, un
codificador produce una señal de audioinformación compuesta que
representa el campo acústico a ser reproducido y un vector
direccional o "señal de control de dirección". La señal de
audioinformación compuesta tiene su espectro de frecuencias separado
en un número de subbandas que corresponden preferiblemente a las
bandas críticas del oído humano. La señal de control de dirección
tiene un componente relativo a la dirección dominante del campo
acústico en cada una de las subbandas.
Aunque la invención puede ser implementada
usando técnicas analógicas o digitales o incluso una disposición
híbrida de tales técnicas, la invención es implementada más
convenientemente usando técnicas digitales y las realizaciones
preferidas descritas aquí son implementaciones digitales.
En una realización de la invención, un
codificador recibe una pluralidad de corrientes de audio,
representando cada una un canal de entrada, así como
características de localización de cada uno de esos canales de
entrada. El descodificador recibe una señal codificada así como la
posición o la posición virtual del transductor acústico para cada
canal de salida, y suministra una corriente de señal para cada canal
de salida para reproducir lo más exactamente posible el campo
acústico representado por las señales de canales de entrada. Como el
esquema de codificación espacial de la presente invención está
basado en la premisa de que solo sonido procedente de una dirección
única es oído en cualquier instante, el descodificador no necesita
aplicar una señal a más de dos transductores acústico en cualquier
instante. La información codificada incluye para cada subbanda una
representación total de todos los canales de entrada. La
representación total comprende una señal de audioinformación
compuesta, que representa el nivel de campo acústico global neto, y
a una señal de control de dirección que comprende información de
localización para el campo acústico. Esta información de
localización es denominada aquí como un vector direccional neto.
En el descodificador, también es el caso de que
solo una dirección obtiene bits, así que dentro de cada crítica
solo uno o dos canales de presentación obtienen bits durante cada
intervalo de tiempo (un canal de presentación es adecuado cuando
ocurre que la dirección de campo acústico es congruente con la
dirección de canal de presentación; en caso contrario, dos canales
de presentación son necesarios para situar la dirección de campo
acústico).
Un aspecto de la invención es un sistema de
codificación espacial de velocidad baja de bits para codificar una
pluralidad de corrientes de audio que representan un campo acústico
en un señal codificada y descodificar la señal codificada,
incluyendo el sistema un codificador y un descodificador. El
codificador comprende:
un generador de señales de subbandas que genera
una pluralidad de señales de subbandas en respuesta a la pluralidad
de corrientes de audio, representando cada señal de subbanda una
subbanda respectiva de frecuencias de una respectiva de las
corrientes de audio,
un combinador de señales que genera una señal
compuesta que representa la combinación de señales de subbandas en
subbandas respectivas de frecuencias,
un detector de dirección de campo acústico que
genera una señal de control de dirección para la señal compuesta que
indica la dirección principal del campo acústico en subbandas
respectivas,
un codificador y dispositivo de asignación de
bits que genera información codificada asignando bits a la señal
compuesta y a la señal de control de dirección, y
un formateador que ensambla la información
codificada en una señal codificada.
El descodificador comprende:
un desformateador que deriva la señal compuesta
y la señal de control de dirección de la señal codificada,
un generador inverso de subbandas que deriva
señales de subbandas en respuesta a la señal compuesta y la señal de
control de dirección,
una entrada de información que describe el
número de canales de salida del descodificador y la posición o
posición virtual de los transductores acústicos conectados a los
canales de salida respectivos, en el que hay tres o más canales de
salida, y
un generador de señal que genera una corriente
de audio en no más de dos canales de salida en cualquier instante en
respuesta a las señales de subbandas y la información de
reproducción.
Otro aspecto de la invención es un sistema de
codificación espacial de velocidad baja de bits para codificar una
pluralidad de corrientes de audio que representan un campo acústico
en una señal codificada, descodificar la señal codificada y
reproducir una semejanza auditiva del campo acústico, incluyendo el
sistema un codificador y un descodificador. El codificador
comprende:
un generador de señales de subbandas que genera
una pluralidad de señales de subbandas en respuesta a la pluralidad
de corrientes de audio, representando cada señal de subbanda una
subbanda respectiva de frecuencias de una respectiva de las
corrientes de audio,
un combinador de señales que genera una señal
compuesta que representa la combinación de señales de subbandas en
cada subbanda de frecuencias,
un detector de dirección de campo acústico que
genera una señal de control de dirección para la señal compuesta
que indica la dirección principal del campo acústico en cada
subbanda,
un codificador y dispositivo de asignación de
bits que genera información codificada asignando bits a la señal
compuesta y la señal de control de dirección, y
un formateador que ensambla la información
codificada en una señal codificada.
El descodificador comprende:
un desformateador que deriva la señal compuesta
y la señal de control de dirección de la señal codificada,
un generador inverso de subbandas que deriva
señales de subbandas en respuesta a la señal compuesta y la señal de
control de derivación,
una entrada de información que describe el
número de canales de salida del descodificador y la posición o la
posición virtual de los transductores acústicos conectados a los
canales de salida respectivos, y
un generador de señal que genera una corriente
de audio en uno o más canales de salida en respuesta a las señales
de subbandas y la información de reproducción.
El sistema comprende además:
una pluralidad de transductores acústicos
acoplados a los canales de salida del descodificador y dispuestos a
fin de generar una semejanza auditiva del campo acústico para un
oyente u oyentes dentro de un área auditiva de lugar dulce de
codificación espacial.
Otro aspecto más de la invención es un
descodificador para uso en un sistema de codificación espacial de
velocidad baja de bits para descodificar una señal codificada
derivada de una pluralidad de corrientes de audio que representan
un campo acústico generando una pluralidad de señales de subbandas
en respuesta a la pluralidad de corrientes de audio, representando
cada señal de subbanda una subbanda respectiva de frecuencias de una
respectiva de las corrientes de audio, generar una señal compuesta
que representa la combinación de señales de subbandas en subbandas
respectivas de frecuencias, generar una señal de control de
dirección para la señal compuesta que indica la dirección principal
del campo acústico en las subbandas respectivas, generar información
codificada asignando bits a la señal compuesta y la señal de
control de dirección, y ensamblar la información codificada en una
señal codificada. El descodificador comprende:
un desformateador que deriva la señal compuesta
y la señal de control de dirección de la señal codificada,
un generador inverso de subbandas que deriva
señales de subbandas en respuesta a la señal compuesta y la señal de
control de dirección,
una entrada de información que describe el
número de canales de salida del descodificador y la posición o la
posición virtual de los transductores acústico conectados a los
canales de salida respectivos, en el que hay tres o más canales de
salida, y
un generador de señal que genera una corriente
de audio en no más de dos canales de salida en cualquier instante
en respuesta a las señales de subbandas y la información de
reproducción.
Un aspecto adicional más de la invención es un
descodificador y sistema de reproducción para uso en un sistema de
codificación espacial de velocidad baja de bits para descodificar y
reproducir una señal codificada derivada de una pluralidad de
corrientes de audio que representan un campo acústico generando una
pluralidad de señales de subbandas en respuesta a la pluralidad de
corrientes de audio, representando cada señal de subbanda una
subbanda respectiva de frecuencias de una respectiva de las
corrientes de audio, generar una señal compuesta que representa la
combinación de señales de subbandas en subbandas respectivas de
frecuencias, generar una señal de control de dirección para la
señal compuesta que indica la dirección principal del campo acústico
en subbandas respectivas, generar información codificada asignando
bits a la señal compuesta y la señal de control de dirección, y
ensamblar la información codificada en una señal codificada. El
descodificador y sistema de reproducción comprende:
un desformateador que deriva la señal compuesta
y la señal de control de dirección de la señal codificada,
un generador inverso de subbandas que deriva
señales de subbandas en respuesta a la señal compuesta y la señal de
control de dirección,
una entrada de información que describe el
número de canales de salida del descodificador y la posición o
posición virtual de los transductores acústico conectados a los
canales de salida respectivos, y
un generador de señal que genera una corriente
de audio en uno o más canales de salida en respuesta a las señales
de subbandas y la información de reproducción, y
una pluralidad de transductores acústicos
acoplados a los canales de salida del decodificador y dispuestos a
fin de generar una semejanza auditiva del campo acústico para un
oyente u oyentes dentro de un área auditiva de lugar dulce de
codificación espacial.
Las diversas características de la invención y
sus realización preferidas son expuestas con más detalle en el
"Modos óptimos de realizar la invención" siguiente y en los
dibujos adjuntos.
La Figura 1 es un diagrama conceptual que
ilustra una persona escuchando un campo acústico producido por
canales de presentación múltiples pero que percibe que un sonido
procede de un punto.
La Figura 2 es una representación esquemática de
vista en planta de un oyente situado en un lugar dulce idealizado de
codificación espacial entre una disposición de reproducción de
"sonido envolvente" de cinco altavoces.
La Figura 3 es una representación esquemática de
vista en planta de un oyente situado en un lugar dulce idealizado de
codificación espacial enfrente de un monitor de ordenador que tiene
altavoces en sus lados.
La Figura 4 es una representación esquemática de
vista en planta de un oyente situado en un lugar dulce idealizado
de codificación espacial enfrente de un televisor que tiene
altavoces adyacentes a su tubo de imagen.
La Figura 5A s una esquema de bloques
funcionales de un espacializador que emplea un anulador de diafonía
acústica.
\newpage
La Figura 5B es un esquema de bloques
funcionales de un espacializador modificado que emplea un anulador
de diafonía acústica.
La Figura 5C es un esquema de bloques
funcionales de un anulador simple de diafonía acústica de cuatro
puertos según la técnica anterior.
La Figura 6 es un esquema de bloques conceptual
que muestra la codificación y la descodificación espacial.
La Figura 7 es un esquema de bloques funcionales
que ilustra la estructura básica de un codificador de subbandas.
La Figura 8 es un esquema de bloques funcionales
que ilustra la estructura básica de un descodificador de
subbandas.
La Figura 9 es un esquema de bloques funcionales
que ilustra la estructura básica de la invención como se refiere a
la codificación de subbandas.
La Figura 10 es un esquema de bloques
funcionales que ilustra la estructura básica de la invención como se
refiere a la descodificación de subbandas.
La Figura 11 es una representación gráfica
hipotética de un sistema de reproducción en tres dimensiones con
cinco canales de presentación.
La Figura 12A es un diagrama esquemático de
bloques funcionales de un descodificador espacial que funciona en
conjunción con un entorno de reproducción previsible.
La Figura 12B es un diagrama esquemático de
bloques funcionales de un descodificador espacial que funciona en
conjunción con otro entorno de reproducción previsible.
La Figura 6 es una ilustración conceptual de una
realización del sistema de codificación de Tipo II. Un codificador
que comprende los procesos604 y 606 recibe señales de subbandas que
representan un campo acústico por una pluralidad de canales 602 de
entrada desde un codificador de subbandas (véase la Figura 7), y
recibe por el trayecto 603 información referente a como el campo
acústico es representado en cada uno de esos canales de entrada. El
proceso 604 combina las señales en una señal de audioinformación
compuesta que pasa por el trayecto 608. El proceso 606 establece
una señal de control de dirección que representa la dirección
aparente del campo acústico que él pasa por el trayecto 610. Un
descodificador que comprende el proceso 612 recibe por el trayecto
613 información relativa al número de canales de salida y a la
configuración espacial real o virtual de los transductores
acústicos de canales de salida en el sistema de presentación, recibe
una señal compuesta de canales por los trayectos 608 y 610, y
genera señales de salida a lo largo de los canales 614 de salida
para presentación del campo acústico.
En aplicaciones prácticas del codificador
espacial, la información al codificador es una multiplicidad de
corrientes de señales que representan canales de entrada. El
codificador se ocupa del campo acústico reproducido deseado; por
tanto, debe recibir información respecto a como se pretende que esos
canales de entrada se relacionen con ese campo acústico. Por
ejemplo, en el caso de una fuente de cinco canales que tiene
reproducción izquierda, central, derecha, envolvente izquierda y
envolvente derecha mediante ubicaciones de altavoces generalmente
estandarizadas, el vector direccional neto puede ser derivado de las
señales de cinco canales destinadas a ser aplicadas a esas
ubicaciones de altavoces.
Un descodificador de codificación espacial, que
recibe información respecto al entorno de reproducción o
presentación, puede usar el vector direccional neto para producir
un conjunto de señales para la reproducción o presentación
pretendida de cinco canales o para otro entorno de reproducción o
presentación que usa un número diferente de canales y/o posiciones
de altavoces. Por ejemplo, la señal de audioinformación compuesta y
el vector direccional neto pueden ser descodificados para un
entorno de monitor de ordenador con dos altavoces. Como se trató
antes, la descodificación puede incluir un "espacializador" de
modo que la presentación resultante proporciona el efecto
psicoacústico de un campo acústico no limitado a los dos altavoces y
al espacio entre ellos.
La invención no está limitada al uso con algún
esquema particular para generar canales de entrada múltiples ni
algún esquema particular para captar o recrear campos acústicos. La
invención acepta como una entrada al codificador cualquier conjunto
de canales de entrada múltiples con información necesaria para
definir como el productor de los canales de entrada pretendía que
produzcan un campo acústico, por ejemplo, su dirección pretendida
con respecto al oyente. El codificador convierte esa información y
esos canales acústicos en una señal de audioinformación compuesta y
una señal de control de dirección de vector direccional neto de modo
que el descodificador puede proporcionar como una salida un
conjunto de canales de presentación que producen el campo acústico
posible óptimo que corresponden a las capacidades del equipo y
entorno de reproducción o presentación. El número de canales
producidos por el descodificador es impuesto por características del
sistema de presentación y, por tanto, no es necesariamente igual que
el número de canales de entrada.
La presente invención es aplicable a
codificadores de subbandas implementados por cualquiera de muchas
técnicas bien conocidas. Una implementación preferida usa una
transformada, más particularmente una transformada del dominio de
tiempo al dominio de frecuencia según la técnica de Anulación de
Distorsión de Alias en el Dominio de Tiempo (TDAC: Time Domain
Aliasing Cancellation). Véase "Diseño de batería de filtros de
análisis/síntesis basado en la Anulación de Distorsión de Alias en
el Dominio de Tiempo" de Princen y Bradley, Memorias del IEEE
sobre acústica, voz, procesamiento de señales, volumen
ASSP-34, 1.986, páginas 1.153-1.161.
Un ejemplo de un sistema de codificador/descodificador por
transformada que utiliza una transformada de TDAC es proporcionado
en la Patente de Estados Unidos 5.109.417, que es incorporado por la
presente mediante referencia en su totalidad.
Como se muestra en la Figura 7, la codificación
típica de subbandas de canal único comprende dividir una corriente
de señal de entrada en subbandas mediante la batería 710 de filtros,
convertir la información de subbandas en palabras de código
cuantificadas mediante el codificador 730 y ensamblar las palabras
de código cuantificadas en una forma adecuada para transmisión o
almacenamiento por el formateador 740. Si la batería de filtros es
implementada por filtros digitales o transformadas discretas, la
señal de entrada es muestreada y digitalizada por el muestreador
700 antes de la filtración en la batería de filtros. Si la batería
de filtros es implementada por filtros analógicos, las señales de
subbandas pueden ser muestreadas y digitalizada por el muestreador
720 para codificación digital por el codificador 730. En un aspecto,
la presente invención se refiere al codificador 730 para canales
múltiples de información. Por ejemplo, cada una de las entradas 602
en la Figura 6 constituye información de subbanda como se aplica al
codificador 730.
Como se muestra en la Figura 8, la
descodificación digital típica de subbandas de canal único comprende
separar las palabras de código formateadas mediante el
desformateador 810, recuperar la información de subbandas mediante
el descodificador 820 y unir la información de subbandas en una
señal de canal único mediante la batería 840 de filtros inversos.
Si la batería de filtros inversos es implementada por filtros
analógicos y la señal es codificada digitalmente, la información de
subbandas es convertida en forma analógica por el convertidor 830
antes de la filtración en la batería de filtros inversos. Si la
batería de filtros inversos es implementada por filtros digitales o
transformadas discretas, la señal digital es convertida a forma
analógica porel convertidor 850. En otro aspecto, la presente
invención se refiere al descodificador 820 para canales múltiples de
información.
La dirección de subbanda combina componentes
espectrales de subbanda procedentes de uno o más canales en una
señal compuesta. La representación compuesta para la subbanda es
transmitida o grabada en lugar de los componentes espectrales de
subbanda de canal individual representados por la subbanda de canal
compuesto. Hay dos métodos equivalentes para formar un canal
compuesto. El mismo resultado es obtenido usando cualquiera de los
dos métodos. Un método es aplicar primero criterios de
enmascaramiento intrabanda a cada canal para reducir el número de
bits necesarios para cada canal eliminando la codificación de
componentes de señal enmascarados y después, segundo, combinar los
canales de bits reducidos para crear una señal compuesta. El otro
método, descrito después con más detalle, es combinar primero las
señales de canales originales para crear la señal compuesta y
después, segundo, aplicar criterios de enmascaramiento intrabanda a
la señal compuesta para reducir bits eliminando la codificación de
componentes de señal enmascarados. Se cree que la señal compuesta
resultante es igual o esencialmente igual en cualquiera de los dos
casos. En ambos casos, el codificador espacial tiene en cuenta dos
tipos de enmascaramiento: enmascaramiento de canal cruzado y
enmascaramiento intrabanda dentro del canal compuesto resultante.
Así, la invención pretende incluir el uso de cualquiera de los dos
método para formar una señal compuesta.
La señal de control de dirección (o vector
direccional neto) representa la dirección dominante aparente de los
componentes espectrales procedentes de todos los canales.
De acuerdo con las enseñanzas de la presente
invención para técnicas de codificación digital, los valores
numéricos que representan los componentes espectrales son
cuantificados en palabras de código, en las que un número variable
de bits pueden ser asignados adaptablemente al menos a algunas de
las palabras de código procedentes de un grupo común de bits. La
asignación de bits está basada en si, debido al contenido de señal
actual, los errores de cuantificación en algunas subbandas
degradarán la calidad de codificación de señal en un grado mayor
que los errores de cuantificación en otras subbandas. Más
particularmente, más bits son asignados a los componentes
espectrales dentro de subbandas cuyo ruido de cuantificación está
menos sometido al enmascaramiento psicoacústico que el ruido de
cuantificación en otras subbandas.
De acuerdo con las enseñanzas de la presente
invención para descodificación, la dirección inversa usa la señal
de control de dirección para recuperar una representación de los
canales dirigidos desde el canal compuesto. Como la codificación
espacial según la presente invención usa un vector direccional único
y, en vista del principio fundamental de que un oyente solo oye
sonido procedente de una dirección en cualquier instante, solo uno
o dos canales necesitan ser generados para presentación en un
sistema específico de presentación. El número de canales para el
descodificador es impuesto por características del sistema de
presentación y, por tanto, no es necesariamente igual que el número
de canales de entrada.
También de acuerdo con las enseñanzas de la
presente invención para técnicas de descodificación digital, un
proceso de asignación adaptable de bits sustancialmente similar al
usado durante la codificación es realizado para establecer el
número de bits asignados a cada palabra de código cuantificada. Esta
información es usada para reconstruir los componentes espectrales
de subbandas.
\newpage
La Figura 9 es un diagrama esquemático de
bloques funcionales de un codificador de codificación espacial (o
sea, un codificador simplificado de Tipo II de vector único). El
codificador puede ser implementado usando diversas técnicas de
codificación analógica y digital. La invención implementada más
convenientemente usando técnicas digitales y las realizaciones
descritas aquí son implementaciones digitales.
Las implementaciones digitales pueden emplear
técnicas de asignación adaptable de bits. La descripción siguiente
de una realización preferida describe tanto los conceptos de
asignación adaptable de bits como de dirección de subbandas, sin
embargo, debería comprenderse que implementaciones digitales de
codificación espacial pueden ser utilizadas con esquemas de
asignación de bits que no son adaptables.
Refiriéndose a la Figura 9, los componentes de
señales de subbandas para cada uno de la pluralidad de canales de
entrada 1 a N en el trayecto 901 de entrada son procesados por un
generador 902 de dirección aparente y señal compuesta para
establecer una señal de control de dirección de dirección aparente y
una señal compuesta. El proceso también recibe información fuente
que indica como el campo acústico fuente es representado en cada
uno de los canales de entrada (información que describe la
información espacial pretendida para cada señal de canal). La
información fuente y de reproducción puede ser, diversamente,
permanente o programable. El codificador puede incluir
instrucciones permanentes respecto al entorno fuente y/o de
reproducción o tales instrucciones pueden ser proporcionadas desde
fuera del codificador por vía de trayectos de entrada como se
muestra en la Figura 9. Una señal de audioinformación compuesta
que representa el campo acústico fuente es derivada de las señales
de entrada de subbandas y la información fuente. Una señal de
control de dirección en forma de un vector direccional único, que
comprende información de localización para el campo acústico, es
derivada de las señales de entrada de subbandas y la información
fuente.
La salida de señal compuesta del bloque 902 es
aplicada también a un cuantificador 904 de nivel aproximado que
cuantifica la información espectral de subbandas del canal compuesto
único. Un dispositivo 908 de asignación adaptable de bits asigna un
número de bits a diversas subbandas en respuesta a información de
cuantificación aproximada recibida desde el cuantificador 904 de
nivel aproximado y el número de bits disponibles para asignación
recibidos desde el grupo común 910 de bits. Un cuantificador 912
cuantifica adaptablemente la información espectral de señal
compuesta en palabras de código cuantificadas en respuesta a la
señal compuesta, la salida del cuantificador de nivel aproximado y
la salida del dispositivo de asignación adaptable de bits. Aunque
un algoritmo adecuado es descrito después, el algoritmo mediante el
que el codificador asigna bits adaptablemente no es crítico para la
presente invención. El cuantificador 912 también cuantifica la señal
de control de dirección. El cuantificador 912 proporciona como
salidas la información de dirección, palabras de código
cuantificadas e información de cuantificación aproximada,
respectivamente, a lo largo de los trayectos 914 a 918.
La Figura 10 es un diagrama esquemático de
bloques funcionales de un descodificador de codificación espacial.
Un calculador 1002 de asignación adaptable de bits establece el
número de bits asignados a cada palabra de código durante la
cuantificación en respuesta a información de cuantificación
aproximada recibida desde la salida 918 de codificador y al número
de bits disponibles para asignación recibidos desde un grupo común
1004 de bits; un descuantificador 1006 descuantifica la señal de
control de dirección recibida desde la salida 914 de codificador y
recupera información de componentes espectrales en respuesta a las
palabras de código cuantificadas recibidas desde la salida 916 de
codificador, la información de cuantificación aproximada recibida
desde la salida 918 de codificador y la información de asignación de
bits recibida desde el calculador 1002 de asignación adaptable de
bits, y proporciona en sus salidas la información de vector
direccional único en el trayecto 1008, los exponentes de subbandas
de canal compuesto en la línea 1010 y los componentes espectrales
de canal compuesto en el trayecto 1012. Esas salidas son aplicadas a
un generador inverso 1014 de dirección aparente y señal compuesta
que también recibe información de reproducción que describe un
número previsto de canales de salida y la posición o posición
virtual de los transductores (tales como altavoces) conectados a
los canales de salida. La información de reproducción puede ser
permanente o programable. El descodificador puede incluir
instrucciones permanentes referentes al entorno de reproducción o
tales instrucciones pueden ser proporcionadas desde fuera del
descodificador por vía de un trayecto de entrada como se muestra en
la Figura 10. El generador 1014 reconstruye las subbandas en
respuesta a la información espectral compuesta y de dirección
recibida por los trayectos 1008-1012,
proporcionando, dentro de cada intervalo de tiempo en el que es
recibido un conjunto de señales de subbandas y vector direccional,
un conjunto completo de subbandas para uno o dos canales de
información espectral de subbandas, cada canal representado como
porciones de un trayecto 1016 designado Ch1, ..., ChN. La
activación de solo uno o dos canales para cada subbanda durante el
intervalo de tiempo es suficiente para reproducir sonido procedente
de una dirección única dentro de cada subbanda. En otras palabras,
con respecto a cualquier subbanda particular, solo uno o dos canales
serán activos durante cada intervalo
de tiempo.
de tiempo.
La realización preferida de la presente
invención, como se refiere a codificación y descodificación, es
presentada con más detalle en las secciones siguientes.
Realizaciones y estructuras alternativas para la presente invención
son presentadas en toda la discusión.
Refiriéndose nuevamente a la Figura 9, que
ilustra un codificador de subbandas de Tipo II, puede verse que el
generador 902 de dirección aparente y señal compuesta recibe canales
múltiples de información de subbandas a lo largo del trayecto 901.
Si los bloques de subbandas son derivados por una transformada
discreta tal como la transformada discreta de Fourier, cada
subbanda consistirá en uno o más coeficientes de transformada
discreta. Una disposición de subbandas particular para una señal de
20 kHz de anchura de banda utiliza una transformada de 512 puntos y
una frecuencia de muestreo de señal de entrada de 48 kHz. Las
subbandas corresponden generalmente a las bandas críticas del oído.
Otros agrupamientos de subbandas, frecuencias de muestreo y
longitudes de transformada pueden ser utilizados sin separarse del
alcance de la presente invención.
Como se trató antes, se cree que el efecto de
dirección única funciona cuando hay un intervalo de tiempo
suficientemente breve. En el caso de una frecuencia de muestreo de
48 kHz y una transformada de 512 puntos, cada bloque de
transformada tiene un intervalo de tiempo de 10 milisengundos
aproximadamente (en el caso de una transformada de TDAC, esto es
solo una aproximación en vista del promediado de bloque a bloque
inherente en el proceso de TDAC). Así, una sucesión de señales de
subbandas compuestas son generadas cada 10 milisegundos
aproximadamente. Cada bloque compuesto puede tener un vector
direccional único asociado con el o, alternativamente, vectores
direccionales pueden ser generados sobre una base regular más o
menos frecuentemente que el período de bloque. Como una alternativa
más, uno o más vectores direccionales adicionales pueden ser
generados dentro de un período de bloque solo cuando ocurre un
desplazamiento en la dirección dominante mayor que un umbral
(supóngase, más de 30 grados). El inventor ha hallado que un
sistema basado en transformada de TDCA (anulación de distorsión de
alias en el dominio de tiempo) que tiene longitudes de bloques de
unos 10 milisegundos y un vector direccional único durante cada
período de bloque proporciona una experiencia agradable de
reproducción musical.
El proceso de generador de dirección aparente y
señal compuesta combina los componentes espectrales procedentes de
canales múltiples para formar una subbanda de canal único compuesto,
reduciendo de tal modo el número de componentes espectrales que
deben ser cuantificados y transmitidos. Una señal de control de
dirección, que transporta información sobre la dirección aparente
del campo acústico (una dirección única) dentro de un intervalo de
tiempo, es pasada con los componente espectrales de canal compuesto
codificado para permitir que el descuantificador receptor recupere
los componentes espectrales para uno o dos canales, que es
suficiente para una reproducción de dirección única. Debería
apreciarse que, en general, los componentes espectrales recuperados
desde el canal compuesto y la señal de control de dirección única
no son idénticos que los componentes espectrales que un receptor
descodificaría a partir de canales discretos o a partir de un canal
compuesto y factores de escala para cada canal (como en un sistema
de Tipo I).
Los bits ahorrados codificando una subbanda de
canal compuesto y vector de dirección única auxiliar, más bien que
codificando subbandas de canales discretos o una subbanda de canal
compuesto y factores de escala de canal (como en el sistema de Tipo
I), son usados por el proceso de asignación adaptable de bits, por
ejemplo, para asignar a otra subbandas y por el cuantificador para
cuantificar la señal de control de dirección.
Los componentes espectrales de las subbandas en
uno o más canales son combinados. Según dichas patentes 5.583.962,
5.632.005 y 5.633.981, un método preferido dispone cada valor de
componente espectral en la subbanda compuesta igual a la media de
los valores de componentes espectrales correspondientes en los
canales dirigidos y métodos alternativos pueden formar otras
combinaciones lineales o sumas ponderadas de los valores de
componentes espectrales en los canales dirigidos.
La señal de control de dirección representa la
dirección espacial primaria (o sea, dominante) de los componentes
de subbanda en el canal compuesto. Según la versión simplificada del
sistema de Tipo II que es el sujeto de esta invención, durante cada
intervalo de tiempo, un método básico construye un vector único que
representa solo la dirección espacial primaria o dominante para cada
subbanda en la señal compuesta.
El concepto de este método básico puede ser
comprendido mejor refiriéndose a la Figura 11 que ilustra un sistema
de reproducción hipotético que comprende cinco canales de
presentación. Cada uno de estos canales de presentación, que
corresponde a uno de los canales de entrada, representa un altavoz
situado en la superficie de una espera unitaria. El oyente
propuesto está situado en el centro de la esfera. Uno de los canales
es designado RF. La dirección aparente al oyente del canal RF es
representado por el vector unitario \overline{DI}.
Según este método básico de codificación, el
vector \overrightarrow{V}_{j} de señal de control de dirección
representa la dirección principal (dominante) del campo acústico
para la subbanda j de señal compuesta. Aunque un sistema de
coordenadas cartesianas es una representación preferida para la
dirección, otras representaciones tales como coordenadas polares
pueden ser usadas sin apartarse del espíritu de la invención. Cada
vector direccional de canal es ponderado por nivel. La señal de
control de dirección puede ser expresada como
(1)\overrightarrow{V}_{j} =
\sum\limits_{i=1}^{S}LI_{ij}\cdot \overrightarrow{DI}_{i} =
\overrightarrow{LI}_{j}\cdot
\overline{DI}
donde
\overrightarrow{DI}_{i} = vector unitario
direccional para el canal i,
LI_{ij} = nivel calculado para la subbanda j
en el canal i,
S = número total de canales,
\overrightarrow{V}_{j} = vector de señal de
control de dirección para la subbanda j,
\overline{DI}= vectores unitarios
direccionales para todos los canales de entrada, y
\overrightarrow{LI}_{j} = niveles calculados
para la subbanda j en todos los canales de entrada.
Detalles adicionales de un codificador de Tipo
II utilizable en la presente invención son expuestos en dichas
patentes 5.583.962, 5.632.005 y 5.633.981.
En el descodificador de codificación espacial
mostrado en la Figura 10, el generador inverso 1014 de dirección
aparente y señal compuesta reconstruye una representación de
dirección única del canal compuesto en respuesta a una señal de
control de dirección, los niveles de cuantificación aproximados y
los valores de componentes espectrales recibidos por los trayectos
1008 a 1012, respectivamente.
Como se explicó antes, la invención de
codificación de Tipo II emplea una forma de vector unidireccional de
la señal de control de dirección. Para aproximar la dirección de la
señal codificada, el proceso de reconstrucción debe tener en cuenta
el número y la posición de los altavoces instalados en el sitio de
descodificación. El vector \overrightarrow{DO}_{i} de
dirección para cada canal i de presentación es proporcionado como la
entrada de información de reproducción al generador inverso 1014 de
dirección aparente y señal compuesta. El proceso de reconstrucción
genera preferiblemente componentes espectrales para solo uno o dos
canales de presentación, que es suficiente para obtener un campo
acústico con la orientación espacial de la subbanda de señal
compuesta representada por la señal de control de dirección.
Aplicando la Ecuación 1 al sistema de
presentación, la señal de control de dirección puede ser expresada
como
(4)\overrightarrow{V}_{j} =
\sum\limits_{i=1}^{S}LO_{ij}\cdot \overrightarrow{DO}_{i} =
\overrightarrow{LO}_{j}\cdot
\overline{DO}
Donde,
\overrightarrow{DO}_{i} = vector unitario
direccional para el canal i de presentación,
LO_{ij} = nivel calculado para la subbanda j
en el canal i,
S = número total de canales de presentación,
\overrightarrow{V}_{j} = vector de señal de
control de dirección para la subbanda j,
\overline{DO} = vectores unitarios
direccionales para todos los canales de presentación,
y
\overrightarrow{LO}_{j} = niveles calculados
para la subbanda j en todos los canales de
presentación.
Una restricción adicional impuesta a los niveles
calculados LO es que la sonoridad del campo acústico producido por
el sistema de presentación debería ser igual que la sonoridad del
campo acústico original. Más particularmente, una restricción es
impuesta a cada vector \overrightarrow{LO}_{j} tal que la
sonoridad o nivel total del campo acústico para cada subbanda
producida por el sistema de presentación es igual que el nivel de la
subbanda en el campo acústico original.
Detalles adicionales de un descodificador de
Tipo II utilizable en la presente invención son expuestos en dichas
patentes 5.583.962, 5.632.005 y 5.633.981.
La Figura 12A es un diagrama esquemático de
bloques funcionales de un descodificador espacial que funciona en
conjunción con un entorno de reproducción previsible. La información
de dirección, las palabras de código cuantificadas y la información
de cuantificación aproximada, respectivamente, a lo largo de los
trayectos de entrada 1202, 1204 y 1206, son aplicadas a un
descodificador espacial 1208. Las señales de entrada pueden ser
transportadas al descodificador espacial por cualquiera de diversas
técnicas de transmisión o almacenamiento que incluyen, por ejemplo,
transmisión cableada e inalámbrica, soportes magnéticos y soportes
ópticos. Como se explicó antes, las señales de entrada son
codificadas de acuerdo con la versión de vector único del sistema
de Tipo II. El descodificador 1208 suministra cuatro o cinco señales
de salida que pueden ser aplicadas a un espacializador opcional
1210 que emplea un anulador de diafonía acústica. La implementación
particular del espacializador 1210 no es crítica; disposiciones
adecuadas son descritas en relación con las Figuras 5A, 5B y 5C. La
salida del espacializador 1210, si se emplea un espacializador, es
aplicada a los altavoces izquierdo y derecho 1212 y 1214 (por vía
de medios amplificadores y acopladores adecuados que no son
mostrados), en caso contrario, las salidas del descodificador 1208
son aplicadas a los altavoces por vía de medios amplificadores y
acopladores adecuados (no mostrados). Los altavoces, situados por
ejemplo en la manera de la Figura 3 o la Figura 4, producen un
lugar dulce oblongo 1216 de codificación espacial (mostrado
idealizado) en el que está situado un oyente 1217. Si se desea, el
espacializador 1210 puede, si es usado, formar una parte integral
del descodificador 1208.
La Figura 12B es un diagrama esquemático de
bloques funcionales de un descodificador espacial que funciona en
conjunción con otro entorno de reproducción previsible. La
información de dirección, las palabras de código cuantificadas y la
información de cuantificación aproximada, a lo largo de los
trayectos de entrada 1202, 1204 y 1206 respectivamente, son
aplicadas a un descodificador espacial 1208 como en la disposición
de la Figura 12A. La disposición de la Figura 12B difiere en que el
entorno de reproducción es una disposición estándar de sonido
envolvente de cinco altavoces. En este caso, no es necesario ningún
espacializador. Las salidas del descodificador espacial 1208 son
aplicadas a los cinco altavoces: izquierdo (1218), central (1220),
derecho (1222), envolvente izquierdo (1224) y envolvente derecho
(1226) que producen un lugar dulce circular 1228 de codificación
espacial (mostrado idealizado) en el que está situado un oyente
1230.
Claims (28)
1. Un sistema de codificación espacial de
velocidad baja de bits para codificar una pluralidad de corrientes
de audio que representan un campo acústico en una señal codificada y
descodificar dicha señal codificada, incluyendo dicho sistema un
codificador y un descodificador, comprendiendo dicho
codificador:
un generador (710) de señales de subbandas que
genera una pluralidad de señales de subbandas en respuesta a dicha
pluralidad de corrientes de audio, representando cada señal de
subbanda una subbanda respectiva de frecuencias de una respectiva de
dichas corrientes de audio,
un combinador (902) de señales que genera una
señal compuesta que representa la combinación de señales de
subbandas en subbandas respectivas de frecuencias,
un detector (902) de dirección de campo acústico
que genera una señal de control de dirección para dicha señal
compuesta que indica la dirección principal de dicho campo acústico
en subbandas respectivas,
un codificador y dispositivo de asignación de
bits (730; 904, 908, 910, 912) que genera información codificada
asignando bits a dicha señal compuesta y dicha señal de control de
dirección, y
un formateador (740) que ensambla dicha
información codificada en una señal codificada, y
comprendiendo dicho descodificador
un desformateador (810) que deriva la señal
compuesta y la señal de control de dirección de dicha señal
codificada,
un generador inverso (840) de subbandas que
deriva señales de subbandas en respuesta a dicha señal compuesta y
dicha señal de control de dirección,
una entrada de información que describe el
número de canales de salida de dicho descodificador y la posición o
posición virtual de los transductores acústicos conectados a los
canales de salida respectivos, en el que hay tres o más canales de
salida, y
un generador (1014) de señal que genera una
corriente de audio en no más de dos canales de salida en cualquier
instante en respuesta a dichas señales de subbandas e información de
reproducción.
2. El sistema según la reivindicación 1,
comprendiendo además
una pluralidad de transductores acústicos (206,
208, 210, 212, 214; 1212, 1214; 1219, 1220, 1222, 1224) acoplados a
los canales de salida de dicho descodificador y dispuestos a fin de
generar una semejanza auditiva de dicho campo acústico para un
oyente u oyentes dentro de un área auditiva de lugar dulce de
codificación espacial.
3. El sistema según la reivindicación 1 o la
reivindicación 2, comprendiendo además un espacializador (1210) que
incluye un anulador (520) de alimentación cruzada acústica para
procesar corrientes de audio en dichos canales de salida,
suministrando el espacializador (1210) un número reducido de canales
de salida que tienen corrientes de audio con características tales
que cuando acoplados a los transductores acústicos (206, 208, 210,
212, 214; 1212, 1214; 1219, 1220, 1222, 1224), proporcionan la
impresión auditiva de un campo acústico similar a la que se habría
producido si el número original de canales de salida estuvieran
acoplados a un número mayor de transductores acústicos (206, 208,
210, 212, 214; 1212, 1214; 1219, 1220, 1222, 1224).
4. El sistema según la reivindicación 1 o la
reivindicación 2, en el que dicha señal de control de dirección
comprende un vector direccional para cada subbanda.
5. El sistema según la reivindicación 1 o la
reivindicación 2, en el que dicha subbanda respectiva de frecuencias
tiene una anchura de banda correspondiente a una banda crítica
respectiva del sistema auditivo humano.
6. El sistema según la reivindicación 1 o la
reivindicación 2, en el que dichos bits son asignados según
principios psicoacústicos.
7. El sistema según la reivindicación 2, en el
que dicho descodificador comprende además un espacializador (1210)
que incluye un anulador (520) de alimentación cruzada acústica para
procesar corrientes de audio en dichos canales de salida, mediante
lo cual la semejanza auditiva de dicho campo acústico generado
dentro del área auditiva de lugar dulce de codificación espacial
representa la percepción de un campo acústico de sonido envolvente o
escena ancha.
8. Un descodificador para uso en un sistema de
codificación espacial de velocidad baja de bits para descodificar
una señal codificada derivada de una pluralidad de corrientes de
audio que representan un campo acústico generando una pluralidad de
señales de subbandas en respuesta a la pluralidad de corrientes de
audio, representando cada señal de subbanda una subbanda respectiva
de frecuencias de una respectiva de dichas corrientes de audio,
generar una señal compuesta que representa la combinación de señales
de subbandas en subbandas respectivas de frecuencias, generar una
señal de control de dirección para la señal compuesta que indica la
dirección principal de dicho campo acústico en subbandas
respectivas, generar información codificada asignando bits a la
señal compuesta y a la señal de control de dirección, y ensamblar la
información codificada en una señal codificada, comprendiendo
un desformateador (810) que deriva la señal
compuesta y la señal de control de dirección de dicha señal
codificada,
un generador inverso (840) de subbandas que
deriva señales de subbandas en respuesta a dicha señal compuesta y
dicha señal de control de dirección,
una entrada de información que describe el
número de canales de salida de dicho descodificador y la posición o
posición virtual de los transductores acústicos (206, 208, 210, 212,
214; 1212, 1214; 1219, 1220, 1222, 1224) conectados a los canales de
salida respectivos, en el que hay tres o más canales de salida,
y
un generador (1014) de señal que genera una
corriente de audio en no más de dos canales de salida en respuesta a
dicha señales de subbandas e información de reproducción.
9. El descodificador según la reivindicación 8,
comprendiendo además
un generador (1014) de señal que genera una
corriente de audio en uno o más canales de salida en respuesta a
dichas señales de subbandas e información de reproducción, y
una pluralidad de transductores acústicos (206,
208, 210, 212, 214; 1212, 1214; 1219, 1220, 1222, 1224) acoplados a
los canales de salida de dicho descodificador y dispuestos a fin de
generar una semejanza auditiva de dicho campo acústico para un
oyente u oyentes dentro de un área auditiva de lugar dulce de
codificación espacial.
10. El descodificador de la reivindicación 8 o
la reivindicación 9, comprendiendo además un espacializador (1210)
que incluye un anulador (520) de alimentación cruzada acústica para
procesar corrientes de audio en dichos canales de salida,
proporcionando el espacializador (1210) un número reducido de
canales de salida que tienen corrientes de audio con
características tales que cuando acoplados a transductores acústicos
(206, 208, 210, 212, 214; 1212, 1214; 1219, 1220, 1222, 1224),
proporcionan la impresión auditiva de un campo acústico similar al
que se habría producido si el número original de canales de salida
estuvieran acoplados a un número mayor de transductores acústicos
(206, 208, 210, 212, 214; 1212, 1214; 1219, 1220, 1222, 1224).
11. El descodificador de la reivindicación 8 o
la reivindicación 9, en el que dicha señal de control de dirección
comprende un vector direccional para cada subbanda.
12. El descodificador de la reivindicación 8 o
la reivindicación 9, en el que dicha subbanda respectiva de
frecuencias tiene una anchura de banda correspondiente a una banda
crítica respectiva del sistema auditivo humano.
13. El descodificador de la reivindicación 8 o
la reivindicación 9, en el que dichos bits son asignados según
principios psicoacústicos.
14. El descodificador de la reivindicación 8 o
la reivindicación 9, en el que dicho descodificador comprende
además un espacializador (1210) que incluye un anulador (520) de
alimentación cruzada acústica para procesar las corrientes de audio
en dichos canales de salida, mediante lo cual la semejanza auditiva
de dicho campo acústico generado dentro del área auditiva de lugar
dulce de codificación espacial representa la percepción de un campo
acústico de sonido envolvente o escena ancha.
15. Un método de codificación espacial de
velocidad baja de bits para codificar una pluralidad de corrientes
de audio que representan un campo acústico en una señal codificada y
descodificar dicha señal codificada, incluyendo dicho método
codificado y descodificada, incluyendo dicho método codificación y
descodificación, comprendiendo dicha codificación:
generar una pluralidad de señales de subbandas
en respuesta a dicha pluralidad de corrientes de audio,
representando cada señal de subbanda una subbanda respectiva de
frecuencias de una respectiva de dichas corrientes de audio,
generar una señal compuesta que representa la
combinación de señales de subbandas en subbandas respectivas de
frecuencias,
generar una señal de control de dirección para
dicha señal compuesta que indica la dirección principal de dicho
campo acústico en subbandas respectivas,
generar información codificada asignando bits a
dicha señal compuesta y a dicha señal de control de dirección, y
ensamblar dicha información codificada en una
señal codificada; y
comprendiendo dicha descodificación:
derivar la señal compuesta y la señal de control
de dirección de dicha señal codificada,
derivar señales de subbandas en respuesta a
dicha señal compuesta y a dicha señal de control de dirección,
suministrar información de reproducción que
describe el número de canales de salida de dicho descodificador y
la posición o posición virtual de los transductores acústicos (206,
208, 210, 212, 214; 1212, 1214; 1219, 1220, 1222, 1224) conectados
a los canales de salida respectivos, en el que hay tres o más
canales de salida, y
generar una corriente de audio en no más de dos
canales de salida en cualquier instante en respuesta a dichas
señales de subbandas e información de reproducción.
16. El método según la reivindicación 15,
comprendiendo además
acoplar dichos canales de salida a una
pluralidad de transductores acústicos (206, 208, 210, 212, 214;
1212, 1214; 1219, 1220, 1222, 1224) dispuestos a fin de generar una
semejanza auditiva de dicho campo acústico para un oyente u oyentes
dentro de un área auditiva de lugar dulce de codificación
espacial.
17. El método según la reivindicación 15 o la
reivindicación 16, comprendiendo además procesar corrientes de
audio en dichos canales de salida con un espacializador (1210) que
incluye un anulador (250) de alimentación cruzada acústica,
proporcionando dicho procesamiento un número reducido de canales de
salida que tienen corrientes de audio con características tales
que, cuando acopladas a los transductores acústicos (206, 208, 210,
212, 214; 1212, 1214; 1219, 1220, 1222, 1224), proporcionan la
impresión auditiva de un campo acústico similar al que se habría
producido si el número original de canales de salida estuvieran
acoplados a un número mayor de transductores acústicos (206, 208,
210, 212, 214; 1212, 1214; 1219, 1220, 1222, 1224).
18. El método según la reivindicación 15 o la
reivindicación 16, en el que dicha señal de control de dirección
comprende un vector direccional para cada subbanda.
19. El método según la reivindicación 15 o la
reivindicación 16, en el que dicha subbanda respectiva de
frecuencias tiene una anchura de banda correspondiente a una banda
crítica respectiva del sistema auditivo humano.
20. El método según la reivindicación 15 o la
reivindicación 16, en el que dichos bits son asignados según
principios psicoacústicos.
21. El método según la reivindicación 16, en el
que dicha descodificación comprende además procesar las corrientes
de audio en dichos canales de salida con un espacializador (1210)
que incluye un anulador (520) de alimentación cruzada acústica,
mediante lo cual la semejanza auditiva de dicho campo acústico
generado dentro del área auditiva de lugar dulce de codificación
espacial representa la percepción de un campo acústico de sonido
envolvente o escena ancha.
22. Un método de descodificación espacial de
velocidad baja de bits para descodificar una señal codificada
derivada de una pluralidad de corrientes de audio que representan un
campo acústico generando una pluralidad de señales de subbandas en
respuesta a la pluralidad de corrientes de audio, representando cada
señal de subbanda una subbanda respectiva de frecuencias de una
respectiva de dichas corrientes de audio, generar una señal
compuesta que representa la combinación de señales de subbandas en
subbandas respectivas de frecuencias, generar una señal de control
de dirección para la señal compuesta que indica la dirección
principal de dicho campo acústico en subbandas respectivas, generar
información codificada asignando bits a la señal compuesta y a la
señal de control de dirección, y ensamblar la información codificada
en una señal codificada, comprendiendo:
derivar la señal compuesta y la señal de control
de dirección de dicha señal codificada,
derivar señales de subbandas en respuesta a
dicha señal compuesta y dicha señal de control de dirección,
suministrar información de reproducción que
describe el número de canales de salida de dicho descodificador y
la posición o posición vertical de los transductores acústicos (206,
208, 210, 212, 214; 1212, 1214; 1219, 1220, 1222, 1224) conectados
a los canales de salida respectivos, en el que hay tres o más
canales de salida, y
generar una corriente de audio en no más de dos
canales de salida en cualquier instante en respuesta a dichas
señales de subbandas e información de reproducción.
23. El método de la reivindicación 22,
comprendiendo además
acoplar una pluralidad de transductores
acústicos (206, 208, 210, 212, 214; 1212, 1214; 1219, 1220, 1222,
1224) a los canales de salida de dichos transductores acústicos
(206, 208, 210, 212, 214; 1212, 1214; 1219, 1220, 1222, 1224)
dispuestos a fin de generar una semejanza auditiva de dicho campo
acústico para un oyente u oyentes dentro de un área auditiva de
lugar dulce de codificación espacial.
\newpage
24. El método de la reivindicación 22 o la
reivindicación 23, comprendiendo además procesar las corrientes de
audio en dichos canales de salida con un espacializador (1210) que
incluye un anulador (520) de alimentación cruzada acústica,
proporcionando dicho procesamiento un número reducido de canales de
salida que tienen corrientes de audio con características tales
que, cuando acopladas a los transductores acústicos (206, 208, 210,
212, 214; 1212, 1214; 1219, 1220, 1222, 1224), proporcionan la
impresión auditiva de un campo acústico similar al que se habría
producido si el número original de canales de salida estuvieran
acoplados a un número mayor de transductores acústicos (206, 208,
210, 212, 214; 1212, 1214; 1219, 1220, 1222, 1224).
25. El método de la reivindicación 22 o la
reivindicación 23, en el que dicha señal de control de dirección
comprende un vector direccional para cada subbanda.
26. El método de la reivindicación 22 o la
reivindicación 23, en el que dicha subbanda respectiva de
frecuencias tiene una anchura de banda correspondiente a una banda
crítica respectiva del sistema auditivo humano.
27. El método de la reivindicación 22 o la
reivindicación 23, en el que dichos bits son asignados según
principios psicoacústicos.
28. El método de la reivindicación 23,
comprendiendo además procesar corrientes de audio en dichos canales
de salida con un espacializador (1210) que incluye un anulador (520)
de alimentación cruzada acústica, mediante lo cual la semejanza
auditiva de dicho campo acústico generado dentro del área auditiva
de lugar dulce de codificación espacial representa la percepción de
un campo acústico de sonido envolvente o escena ancha.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/056,503 US6016473A (en) | 1998-04-07 | 1998-04-07 | Low bit-rate spatial coding method and system |
US56503 | 1998-04-07 |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2272062T3 true ES2272062T3 (es) | 2007-04-16 |
Family
ID=22004835
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES99915275T Expired - Lifetime ES2272062T3 (es) | 1998-04-07 | 1999-04-05 | Metodo y sistema de codificacion espacial de velocidad baja de bits. |
Country Status (14)
Country | Link |
---|---|
US (1) | US6016473A (es) |
EP (2) | EP1677576A3 (es) |
JP (1) | JP2002511683A (es) |
KR (1) | KR100828952B1 (es) |
CN (1) | CN1142705C (es) |
AT (1) | ATE343311T1 (es) |
AU (1) | AU749062B2 (es) |
CA (1) | CA2327281C (es) |
DE (1) | DE69933659T2 (es) |
DK (1) | DK1070438T3 (es) |
ES (1) | ES2272062T3 (es) |
HK (1) | HK1036728A1 (es) |
TW (1) | TW439051B (es) |
WO (1) | WO1999052326A1 (es) |
Families Citing this family (59)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6323909B1 (en) * | 1998-10-28 | 2001-11-27 | Hughes Electronics Corporation | Method and apparatus for transmitting high definition television programming using a digital satellite system transport and MPEG-2 packetized elementary streams (PES) |
US6687663B1 (en) * | 1999-06-25 | 2004-02-03 | Lake Technology Limited | Audio processing method and apparatus |
AU2337101A (en) * | 1999-12-27 | 2001-07-09 | Martin Pineau | Method and apparatus for producing spatially distributed sound into a set of headphones |
US6725110B2 (en) * | 2000-05-26 | 2004-04-20 | Yamaha Corporation | Digital audio decoder |
US6647149B2 (en) | 2001-01-03 | 2003-11-11 | Electronics For Imaging, Inc. | Methods and apparatus for securely transmitting and processing digital image data |
US20030035553A1 (en) * | 2001-08-10 | 2003-02-20 | Frank Baumgarte | Backwards-compatible perceptual coding of spatial cues |
US7583805B2 (en) * | 2004-02-12 | 2009-09-01 | Agere Systems Inc. | Late reverberation-based synthesis of auditory scenes |
US7116787B2 (en) * | 2001-05-04 | 2006-10-03 | Agere Systems Inc. | Perceptual synthesis of auditory scenes |
US7644003B2 (en) * | 2001-05-04 | 2010-01-05 | Agere Systems Inc. | Cue-based audio coding/decoding |
US7292901B2 (en) * | 2002-06-24 | 2007-11-06 | Agere Systems Inc. | Hybrid multi-channel/cue coding/decoding of audio signals |
JP2003061198A (ja) * | 2001-08-10 | 2003-02-28 | Pioneer Electronic Corp | オーディオ再生装置 |
JP4016681B2 (ja) * | 2002-03-18 | 2007-12-05 | ヤマハ株式会社 | 効果付与装置 |
EP1500084B1 (en) * | 2002-04-22 | 2008-01-23 | Koninklijke Philips Electronics N.V. | Parametric representation of spatial audio |
US7443987B2 (en) * | 2002-05-03 | 2008-10-28 | Harman International Industries, Incorporated | Discrete surround audio system for home and automotive listening |
US20030233230A1 (en) * | 2002-06-12 | 2003-12-18 | Lucent Technologies Inc. | System and method for representing and resolving ambiguity in spoken dialogue systems |
US20060120534A1 (en) | 2002-10-15 | 2006-06-08 | Jeong-Il Seo | Method for generating and consuming 3d audio scene with extended spatiality of sound source |
CN1748443B (zh) * | 2003-03-04 | 2010-09-22 | 诺基亚有限公司 | 多声道音频扩展支持 |
CN100546233C (zh) * | 2003-04-30 | 2009-09-30 | 诺基亚公司 | 用于支持多声道音频扩展的方法和设备 |
KR100556365B1 (ko) * | 2003-07-07 | 2006-03-03 | 엘지전자 주식회사 | 음성 인식장치 및 방법 |
RU2374703C2 (ru) * | 2003-10-30 | 2009-11-27 | Конинклейке Филипс Электроникс Н.В. | Кодирование или декодирование аудиосигнала |
US7805313B2 (en) * | 2004-03-04 | 2010-09-28 | Agere Systems Inc. | Frequency-based coding of channels in parametric multi-channel coding systems |
JP3815482B2 (ja) * | 2004-03-09 | 2006-08-30 | セイコーエプソン株式会社 | データ転送制御装置及び電子機器 |
SE0400997D0 (sv) * | 2004-04-16 | 2004-04-16 | Cooding Technologies Sweden Ab | Efficient coding of multi-channel audio |
DE602004028171D1 (de) | 2004-05-28 | 2010-08-26 | Nokia Corp | Mehrkanalige audio-erweiterung |
WO2006006809A1 (en) | 2004-07-09 | 2006-01-19 | Electronics And Telecommunications Research Institute | Method and apparatus for encoding and cecoding multi-channel audio signal using virtual source location information |
KR100663729B1 (ko) | 2004-07-09 | 2007-01-02 | 한국전자통신연구원 | 가상 음원 위치 정보를 이용한 멀티채널 오디오 신호부호화 및 복호화 방법 및 장치 |
US7720230B2 (en) * | 2004-10-20 | 2010-05-18 | Agere Systems, Inc. | Individual channel shaping for BCC schemes and the like |
US8204261B2 (en) * | 2004-10-20 | 2012-06-19 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Diffuse sound shaping for BCC schemes and the like |
US7787631B2 (en) * | 2004-11-30 | 2010-08-31 | Agere Systems Inc. | Parametric coding of spatial audio with cues based on transmitted channels |
EP1817767B1 (en) | 2004-11-30 | 2015-11-11 | Agere Systems Inc. | Parametric coding of spatial audio with object-based side information |
JP5017121B2 (ja) | 2004-11-30 | 2012-09-05 | アギア システムズ インコーポレーテッド | 外部的に供給されるダウンミックスとの空間オーディオのパラメトリック・コーディングの同期化 |
US7903824B2 (en) * | 2005-01-10 | 2011-03-08 | Agere Systems Inc. | Compact side information for parametric coding of spatial audio |
KR100755471B1 (ko) * | 2005-07-19 | 2007-09-05 | 한국전자통신연구원 | 가상음원위치정보에 기반한 채널간 크기 차이 양자화 및역양자화 방법 |
EP1905034B1 (en) * | 2005-07-19 | 2011-06-01 | Electronics and Telecommunications Research Institute | Virtual source location information based channel level difference quantization and dequantization |
ATE455348T1 (de) * | 2005-08-30 | 2010-01-15 | Lg Electronics Inc | Vorrichtung und verfahren zur dekodierung eines audiosignals |
MX2008002713A (es) | 2005-08-30 | 2008-03-18 | Lg Electronics Inc | Aparato y metodo para codificar y decodificar senales de audio. |
US7653533B2 (en) | 2005-10-24 | 2010-01-26 | Lg Electronics Inc. | Removing time delays in signal paths |
US9426596B2 (en) | 2006-02-03 | 2016-08-23 | Electronics And Telecommunications Research Institute | Method and apparatus for control of randering multiobject or multichannel audio signal using spatial cue |
WO2007104882A1 (fr) * | 2006-03-15 | 2007-09-20 | France Telecom | Dispositif et procede de codage par analyse en composante principale d'un signal audio multi-canal |
FR2898725A1 (fr) * | 2006-03-15 | 2007-09-21 | France Telecom | Dispositif et procede de codage gradue d'un signal audio multi-canal selon une analyse en composante principale |
SG175632A1 (en) * | 2006-10-16 | 2011-11-28 | Dolby Sweden Ab | Enhanced coding and parameter representation of multichannel downmixed object coding |
JP5337941B2 (ja) | 2006-10-16 | 2013-11-06 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | マルチチャネル・パラメータ変換のための装置および方法 |
US8705748B2 (en) * | 2007-05-04 | 2014-04-22 | Creative Technology Ltd | Method for spatially processing multichannel signals, processing module, and virtual surround-sound systems |
US8140331B2 (en) * | 2007-07-06 | 2012-03-20 | Xia Lou | Feature extraction for identification and classification of audio signals |
KR101403340B1 (ko) * | 2007-08-02 | 2014-06-09 | 삼성전자주식회사 | 변환 부호화 방법 및 장치 |
WO2009049895A1 (en) * | 2007-10-17 | 2009-04-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio coding using downmix |
WO2009067741A1 (en) * | 2007-11-27 | 2009-06-04 | Acouity Pty Ltd | Bandwidth compression of parametric soundfield representations for transmission and storage |
PT2146344T (pt) | 2008-07-17 | 2016-10-13 | Fraunhofer Ges Forschung | Esquema de codificação/descodificação de áudio com uma derivação comutável |
EP2486567A1 (en) | 2009-10-09 | 2012-08-15 | Dolby Laboratories Licensing Corporation | Automatic generation of metadata for audio dominance effects |
US9578419B1 (en) * | 2010-09-01 | 2017-02-21 | Jonathan S. Abel | Method and apparatus for estimating spatial content of soundfield at desired location |
WO2013186593A1 (en) | 2012-06-14 | 2013-12-19 | Nokia Corporation | Audio capture apparatus |
CN105917674B (zh) * | 2013-10-30 | 2019-11-22 | 华为技术有限公司 | 用于处理音频信号的方法和移动装置 |
DE102013223201B3 (de) * | 2013-11-14 | 2015-05-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Verfahren und Vorrichtung zum Komprimieren und Dekomprimieren von Schallfelddaten eines Gebietes |
RU2722391C2 (ru) * | 2015-11-17 | 2020-05-29 | Долби Лэборетериз Лайсенсинг Корпорейшн | Система и способ слежения за движением головы для получения параметрического бинаурального выходного сигнала |
EP3378239B1 (en) * | 2015-11-17 | 2020-02-19 | Dolby Laboratories Licensing Corporation | Parametric binaural output system and method |
WO2017132082A1 (en) | 2016-01-27 | 2017-08-03 | Dolby Laboratories Licensing Corporation | Acoustic environment simulation |
GB2574873A (en) * | 2018-06-21 | 2019-12-25 | Nokia Technologies Oy | Determination of spatial audio parameter encoding and associated decoding |
USD982375S1 (en) | 2019-06-06 | 2023-04-04 | Sharkninja Operating Llc | Food preparation device |
CN116724351A (zh) * | 2023-03-27 | 2023-09-08 | 北京小米移动软件有限公司 | 一种量化编码方法、装置、设备及存储介质 |
Family Cites Families (36)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US30278A (en) * | 1860-10-02 | graham | ||
US29490A (en) * | 1860-08-07 | hutchinson | ||
US871992A (en) * | 1906-11-01 | 1907-11-26 | Glazier Stove Company | Hydrocarbon-burner. |
US1124580A (en) * | 1911-07-03 | 1915-01-12 | Edward H Amet | Method of and means for localizing sound reproduction. |
US1850130A (en) * | 1928-10-31 | 1932-03-22 | American Telephone & Telegraph | Talking moving picture system |
US1793772A (en) * | 1929-02-26 | 1931-02-24 | Thomas L Talley | Apparatus and method for localization of sound on screens |
US2361490A (en) * | 1941-12-29 | 1944-10-31 | Rca Corp | Sound reproducing system |
BE529308A (es) * | 1953-10-08 | |||
US3067287A (en) * | 1957-06-19 | 1962-12-04 | Percival William Spencer | Stereophonic sound transmission systems |
US3067292A (en) * | 1958-02-03 | 1962-12-04 | Jerry B Minter | Stereophonic sound transmission and reproduction |
DE1130899B (de) * | 1958-12-12 | 1962-06-07 | Siemens Ag | Verfahren und Anordnung zum Aufzeichnen und Abtasten von Magnetogrammen |
US3272906A (en) * | 1960-10-25 | 1966-09-13 | Zenith Radio Corp | Audio reproduction system |
US3845572A (en) * | 1972-08-02 | 1974-11-05 | Singer Co | Modular vehicle trainer sound system having a plurality of separately controllable sound generators and a polyphonic speaker array |
JPS5235282B2 (es) * | 1972-09-09 | 1977-09-08 | ||
JPS5317283B2 (es) * | 1973-03-07 | 1978-06-07 | ||
US3848092A (en) * | 1973-07-02 | 1974-11-12 | R Shamma | System for electronic modification of sound |
JPS5248001B2 (es) * | 1973-08-20 | 1977-12-07 | ||
DE2354286A1 (de) * | 1973-10-30 | 1975-05-07 | Plank Kg Ernst | Projektor |
US3973839A (en) * | 1974-12-30 | 1976-08-10 | Mca Systems, Inc. | Special effects generation and control system for motion pictures |
US4236039A (en) * | 1976-07-19 | 1980-11-25 | National Research Development Corporation | Signal matrixing for directional reproduction of sound |
US4256389A (en) * | 1978-09-27 | 1981-03-17 | Paramount Sound Systems Corporation | Method and system of controlling sound and effects devices by a film strip |
US4251688A (en) * | 1979-01-15 | 1981-02-17 | Ana Maria Furner | Audio-digital processing system for demultiplexing stereophonic/quadriphonic input audio signals into 4-to-72 output audio signals |
US4455649A (en) * | 1982-01-15 | 1984-06-19 | International Business Machines Corporation | Method and apparatus for efficient statistical multiplexing of voice and data signals |
DE3233882A1 (de) * | 1982-09-13 | 1984-03-15 | Robert Bosch Gmbh, 7000 Stuttgart | System zur fernsehmaessigen uebertragung |
CA1253255A (en) * | 1983-05-16 | 1989-04-25 | Nec Corporation | System for simultaneously coding and decoding a plurality of signals |
BG60225B2 (bg) * | 1988-09-02 | 1993-12-30 | Qsound Ltd. | Метод и устройство за формиране на звукови изображения |
NL8901032A (nl) * | 1988-11-10 | 1990-06-01 | Philips Nv | Coder om extra informatie op te nemen in een digitaal audiosignaal met een tevoren bepaald formaat, een decoder om deze extra informatie uit dit digitale signaal af te leiden, een inrichting voor het opnemen van een digitaal signaal op een registratiedrager, voorzien van de coder, en een registratiedrager verkregen met deze inrichting. |
DE69026278T3 (de) * | 1989-01-27 | 2002-08-08 | Dolby Laboratories Licensing Corp., San Francisco | Adaptiv Bitzuordnung für Audio-Koder und Dekoder |
US5109417A (en) * | 1989-01-27 | 1992-04-28 | Dolby Laboratories Licensing Corporation | Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio |
NL9000338A (nl) * | 1989-06-02 | 1991-01-02 | Koninkl Philips Electronics Nv | Digitaal transmissiesysteem, zender en ontvanger te gebruiken in het transmissiesysteem en registratiedrager verkregen met de zender in de vorm van een optekeninrichting. |
GB8913758D0 (en) * | 1989-06-15 | 1989-08-02 | British Telecomm | Polyphonic coding |
US5632005A (en) * | 1991-01-08 | 1997-05-20 | Ray Milton Dolby | Encoder/decoder for multidimensional sound fields |
WO1992012607A1 (en) | 1991-01-08 | 1992-07-23 | Dolby Laboratories Licensing Corporation | Encoder/decoder for multidimensional sound fields |
NL9100173A (nl) * | 1991-02-01 | 1992-09-01 | Philips Nv | Subbandkodeerinrichting, en een zender voorzien van de kodeerinrichting. |
DE4209544A1 (de) * | 1992-03-24 | 1993-09-30 | Inst Rundfunktechnik Gmbh | Verfahren zum Übertragen oder Speichern digitalisierter, mehrkanaliger Tonsignale |
US6052470A (en) * | 1996-09-04 | 2000-04-18 | Victor Company Of Japan, Ltd. | System for processing audio surround signal |
-
1998
- 1998-04-07 US US09/056,503 patent/US6016473A/en not_active Expired - Lifetime
-
1999
- 1999-04-05 AT AT99915275T patent/ATE343311T1/de not_active IP Right Cessation
- 1999-04-05 EP EP06004008A patent/EP1677576A3/en not_active Withdrawn
- 1999-04-05 ES ES99915275T patent/ES2272062T3/es not_active Expired - Lifetime
- 1999-04-05 CA CA002327281A patent/CA2327281C/en not_active Expired - Fee Related
- 1999-04-05 CN CNB998046108A patent/CN1142705C/zh not_active Expired - Fee Related
- 1999-04-05 EP EP99915275A patent/EP1070438B1/en not_active Expired - Lifetime
- 1999-04-05 DK DK99915275T patent/DK1070438T3/da active
- 1999-04-05 JP JP2000542954A patent/JP2002511683A/ja active Pending
- 1999-04-05 DE DE69933659T patent/DE69933659T2/de not_active Expired - Fee Related
- 1999-04-05 KR KR1020007011123A patent/KR100828952B1/ko not_active IP Right Cessation
- 1999-04-05 AU AU33829/99A patent/AU749062B2/en not_active Ceased
- 1999-04-05 WO PCT/US1999/007456 patent/WO1999052326A1/en active IP Right Grant
- 1999-04-07 TW TW088105488A patent/TW439051B/zh not_active IP Right Cessation
-
2001
- 2001-10-30 HK HK01107548A patent/HK1036728A1/xx not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
AU3382999A (en) | 1999-10-25 |
EP1677576A2 (en) | 2006-07-05 |
HK1036728A1 (en) | 2002-01-11 |
CA2327281C (en) | 2008-02-05 |
US6016473A (en) | 2000-01-18 |
AU749062B2 (en) | 2002-06-20 |
DE69933659D1 (de) | 2006-11-30 |
CN1295778A (zh) | 2001-05-16 |
EP1070438A1 (en) | 2001-01-24 |
JP2002511683A (ja) | 2002-04-16 |
CA2327281A1 (en) | 1999-10-14 |
CN1142705C (zh) | 2004-03-17 |
DK1070438T3 (da) | 2007-02-12 |
EP1070438B1 (en) | 2006-10-18 |
EP1677576A3 (en) | 2007-06-27 |
WO1999052326A1 (en) | 1999-10-14 |
DE69933659T2 (de) | 2007-08-23 |
KR100828952B1 (ko) | 2008-05-13 |
TW439051B (en) | 2001-06-07 |
KR20010042497A (ko) | 2001-05-25 |
ATE343311T1 (de) | 2006-11-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2272062T3 (es) | Metodo y sistema de codificacion espacial de velocidad baja de bits. | |
ES2907377T3 (es) | Aparato, procedimiento y programa informático para la codificación, la decodificación, el procesamiento de escenas y otros procedimientos relacionados con la codificación de audio espacial basada en DirAC | |
JP4589962B2 (ja) | レベル・パラメータを生成する装置と方法、及びマルチチャネル表示を生成する装置と方法 | |
CN105917674B (zh) | 用于处理音频信号的方法和移动装置 | |
KR100206333B1 (ko) | 두개의 스피커를 이용한 멀티채널 오디오 재생장치및 방법 | |
ES2093250T5 (es) | Descodificador para la presentacion por un numero variable de canales de campos de sonido multidimensional. | |
JP5165707B2 (ja) | 低ビットレート用パラメトリック表現の生成方法 | |
Davis | The AC-3 multichannel coder | |
JP6612753B2 (ja) | 高チャンネル数マルチチャンネルオーディオのためのマルチプレットベースのマトリックスミキシング | |
CN101356573B (zh) | 对双耳音频信号的解码的控制 | |
CN1655651B (zh) | 用于合成听觉场景的方法和设备 | |
JP5337941B2 (ja) | マルチチャネル・パラメータ変換のための装置および方法 | |
US20090292544A1 (en) | Binaural spatialization of compression-encoded sound data | |
KR20080015886A (ko) | 디코딩 명령으로 오디오 신호를 인코딩하기 위한 장치 및방법 | |
JP2004529515A (ja) | マルチチャンネル・オーディオを再構築するために2チャンネル・マトリックス符号化オーディオを復号する方法 | |
US20110188660A1 (en) | Method for enlarging a location with optimal three dimensional audio perception | |
CN112567765B (zh) | 空间音频捕获、传输和再现 | |
CN112823534B (zh) | 信号处理设备和方法以及程序 | |
US20090103737A1 (en) | 3d sound reproduction apparatus using virtual speaker technique in plural channel speaker environment | |
Peters et al. | Scene-based audio implemented with higher order ambisonics (HOA) | |
KR20070017441A (ko) | 저 비트속도 공간 코딩방법 및 시스템 | |
KR20050060552A (ko) | 입체 음향 시스템 및 입체 음향 구현 방법 | |
Gerzon | Compatibility of and conversion between multispeaker systems | |
ES2360740T3 (es) | Codificación y decodificación de objetos de audio. |