ES2272062T3

ES2272062T3 - Metodo y sistema de codificacion espacial de velocidad baja de bits.

Info

Publication number: ES2272062T3
Application number: ES99915275T
Authority: ES
Inventors: Ray Milton Dolby
Original assignee: Dolby Laboratories Licensing Corp
Current assignee: Dolby Laboratories Licensing Corp
Priority date: 1998-04-07
Filing date: 1999-04-05
Publication date: 2007-04-16
Anticipated expiration: 2019-04-05
Also published as: AU3382999A; EP1677576A2; HK1036728A1; CA2327281C; US6016473A; AU749062B2; DE69933659D1; CN1295778A; EP1070438A1; JP2002511683A; CA2327281A1; CN1142705C; DK1070438T3; EP1070438B1; EP1677576A3; WO1999052326A1; DE69933659T2; KR100828952B1; TW439051B; KR20010042497A

Abstract

Un sistema de codificación espacial de veloci- dad baja de bits para codificar una pluralidad de corrien- tes de audio que representan un campo acústico en una señal codificada y descodificar dicha señal codificada, incluyen- do dicho sistema un codificador y un descodificador, com- prendiendo dicho codificador: un generador (710) de señales de subbandas que genera una pluralidad de señales de subbandas en respuesta a dicha pluralidad de corrientes de audio, representando cada señal de subbanda una subbanda respectiva de frecuen- cias de una respectiva de dichas corrientes de audio, un combinador (902) de señales que genera una señal compuesta que representa la combinación de señales de subbandas en subbandas respectivas de frecuencias, un detector (902) de dirección de campo acústico que genera una señal de control de dirección para dicha señal compuesta que indica la dirección principal de dicho campo acústico en subbandas respectivas, un codificador y dispositivo de asignación de bits (730; 904, 908, 910, 912) que genera información codificada asignando bits a dicha señal compuesta y dicha señal de control de dirección, y un formateador (740) que ensambla dicha informa- ción codificada en una señal codificada, y comprendiendo dicho descodificador un desformateador (810) que deriva la señal compuesta y la señal de control de dirección de dicha señal codificada, un generador inverso (840) de subbandas que deriva señales de subbandas en respuesta a dicha señal compuesta y dicha señal de control de dirección, una entrada de información que describe el número de canales de salida de dicho descodificador y la posición o posición virtual de los transductores acústicos conecta- dos a los canales de salida respectivos, en el que hay tres o más canales de salida, y un generador (1014) de señal que genera una corriente de audio en no más de dos canales de salida en cualquier instante en respuesta a dichas señales de subban- das e información de reproducción.

Description

Método y sistema de codificación espacial de velocidad baja de bits.

Campo técnico

La invención se refiere en general a la grabación, transmisión y reproducción de campos acústicos multidimensionales destinados a la audición humana. Más particularmente, la invención se refiere a mejoras en un sistema de codificación perceptiva, codificadores y descodificadores para él y métodos para él, en el que señales codificadas son transportadas por una audioseñal compuesta y un vector direccional. La invención está adaptada particularmente para el uso en sistemas que necesitan velocidades de bits extremadamente bajas.

Técnica antecedente

Las Patentes de Estados Unidos 5.583.962, 5.632.005 y 5.633.981 describen dos sistemas de codificación perceptiva de velocidad reducida de bits para audioseñales, designados en ellas como "Tipo I" y "Tipo II". Cada una de dichas patentes 5.583.962, 5.632.005 y 5.633.981 es incorporada por la presente mediante referencia en su totalidad. Según un principio fundamental para ambos sistemas, un codificador genera señales de subbandas de frecuencias en respuesta a corrientes de audioseñales de entrada, correspondiendo las subbandas generalmente a las bandas críticas del oído humano.

En el codificador del sistema de Tipo I descrito en dichas patentes, cada corriente de audio es codificada independientemente cuando hay un número suficiente de bits disponibles. Cuando hay una escasez de bits, los componentes de señales en algunas o todas de las subbandas son combinados en una señal compuesta y una pluralidad de factores de escala, un factor de escala para cada corriente de audio de entrada, cada factor de escala basado en alguna medida de los componentes de señal de subbanda en cada una de las corriente de audio. El descodificador de Tipo I reconstruye una representación de las corrientes de señales originales a partir de la señal compuesta y los factores de escala. El sistema de Tipo I proporciona así un ahorro de bits o ganancia de codificación respecto a un sistema discreto dedicado en el que cada corriente de audio es codificada independientemente. El sistema de Tipo I es empleado en codificación AC-3, que forma la base de el sistema de codificación perceptiva Dolby Digital, en la que 5,1 canales de audio (izquierdo, central, derecho, envolvente izquierdo, envolvente derecho y un canal de infragraves de anchura de banda limitada) son codificados en una corriente de datos de velocidad de bits reducida.

En el codificador del sistema de Tipo II descrito en dichas patentes, cada corriente de audio es codificada independientemente cuando hay un número suficiente de bits disponibles. Cuando hay una escasez de bits, los componentes de señales en algunas o todas de las subbandas son combinados en una señal compuesta y uno o más vectores direccionales, indicando los vectores direccionales la una o más direcciones principales de un campo acústico representado por las corrientes de audio. El descodificador de Tipo II reconstruye una representación del campo acústico representado por las corrientes de señales originales a partir de la señal compuesta y del uno o más vectores direccionales. Así, el sistema de Tipo II proporciona un ahorro de bits o ganancia de codificación respecto a un sistema discreto dedicado, en el que cada corriente de audio es codificada independientemente, y respecto al sistema de Tipo I en el que la señal compuesta está asociada con factores de escala para cada corriente de audio.

Los sistemas de Tipo I y Tipo II descritos en dichas patentes son adaptables de varios modos. Un aspecto de su adaptabilidad es que una o más de las subbandas de frecuencias pueden operar algo del tiempo en un modo "discreto" tal que todos los componentes de subbanda de las corrientes de audio en la subbanda de frecuencias son codificados y descodificados independientemente cada uno, mientras que una escasez de bits, por ejemplo, causa que los componentes de subbanda de las corrientes de audio en una subbanda de frecuencias particular sean codificados según el método de Tipo I o el método de Tipo II.

También es conocido cambiar en vaivén adaptablemente desde un modo de funcionamiento de Tipo I a uno de Tipo II dentro de una o más subbandas de frecuencias. Tales disposiciones son el sujeto de la Solicitud de Patente de Estados Unidos de Mark Frankling Davis, nº de serie 08/895.496, presentada el 16 de julio de 1.997, titulada "Método y aparato para codificar y descodificar canales de audio múltiples a velocidades bajas de bits". Como el método de Tipo II necesita menos bits que el método de Tipo I, una escasez de bits a corto plazo puede ser superada empleando codificación y descodificación Tipo II.

Descripción de la invención

La presente invención se refiere a codificación de Tipo II, codificadores y descodificadores para ella, y a entornos en los que tales descodificadores son empleados ventajosamente. En particular, la presente invención está dirigida a nuevos aspectos de codificadores y descodificadores de Tipo II y a entornos de descodificadores que no son descritos en dichas patentes 5.583.962, 5.632.005 y 5.633.981. Aunque las realizaciones específicas descritas aquí se refieren a una versión simplificada de Tipo II en la que los codificadores y descodificadores son preferiblemente dispositivos de Tipo II dedicados y es empleado un vector direccional único, ciertos aspectos de las mejoras en la codificación de Tipo II, que son el sujeto de la invención, pueden ser empleados en formas más complejas de sistemas de Tipo II que incluyen las disposiciones adaptables descritas en dichas patentes 5.583.962, 5.632.005 y 5.633.981 y en un sistema de Tipo I/Tipo II adaptable tal como el descrito en dicha solicitud de Davis en tramitación junto con la presente. La naturaleza espacial de la codificación, por medio de un vector direccional, en la versión simplificada de vector direccional único del codificador de Tipo II sugiere que podría ser denominado un "codificador espacial". En todo este documento, la versión de vector único de codificación de Tipo II de dichas patentes 5.583.962, 5.632.005 y 5.633.981 es denominada "codificación espacial".

El inventor cree que, dentro de un intervalo de tiempo suficientemente corto del orden de un número pequeño de milisegundos, el oído humano es capaz de escuchar el sonido solo procedente de una sola dirección en una banda crítica aunque estén presentes sonidos procedentes de direcciones múltiples, cada uno en frecuencias diferentes dentro de la banda crítica. Por consiguiente, para un sistema en el que el vector direccional es capaz de cambiar dentro de un intervalo de tiempo suficientemente corto, la forma básica de vector direccional único del sistema de Tipo II materializado en un codificador espacial es adecuada para representar el campo acústico aunque sea incapaz de reproducir continua y simultáneamente todos los de una multiplicidad de canales. Este efecto es ilustrado conceptualmente en la Figura 1; el oyente 101 está percibiendo que los sonidos dentro de una subbanda proceden del punto 111 aunque los sonidos dentro de la subbanda proceden realmente de todos los altavoces 102 a 110.

Este efecto de "dirección única" tiene alguna semejanza superficial con el efecto de "localización aditiva" bien conocido. Según este último efecto, como es descrito por Blauert ("Audición espacial: la psicofísica de la localización acústica humana" de Jens Blauert, la Prensa del MIT, Cambridge, Massachusetts, edición revisada, 1.997), dos o más fuentes de sonido que radian señales coherentes dentro de una cierta amplitud entre sí y dentro de un cierto tiempo entre sí producen la percepción de una señal ficticia única. Particularmente, véanse las páginas 204, 271 y 272 del texto de Blauert. Según Blauert, a medida que un par de señales inicialmente coherentes resultan menos y menos coherentes, un oyente es crecientemente capaz de detectar señales distintas. Particularmente, véanse las páginas 240 y 242 del texto de Blauert. Sin embargo, según el efecto de dirección única del presente inventor, a medida que la separación en frecuencia entre señales múltiples disminuye hasta dentro de una banda crítica, y el intervalo de tiempo es suficientemente corto, también disminuye la capacidad de un oyente para percibirlas como procedentes de direcciones distintas.

El inventor reconoce que hay un compromiso entre la brevedad del intervalo de tiempo y las exigencias adicionales de velocidad de bit (debidas a frecuencias de muestreo más altas) que pueden ser necesarias a medida que el intervalo de tiempo es reducido (véase la discusión posterior en la página 21). Así, para un sistema de velocidad muy baja de bits en el que la frecuencia de muestreo es menor que la óptima para el efecto de dirección única, alguna pérdida en percepción y precisión en la ubicación de sonido del oyente de multiseñal multidireccional puede ocurrir en algunos estados de señales. No obstante, es probable que la reproducción resultante proporcione una experiencia auditiva multidireccional agradable y aceptable. La presente invención es particularmente útil para uso con sistemas de transmisión o grabación en los que las velocidades de bits son extremadamente limitadas tales como, por ejemplo, audio por vía de Internet.

Un aspecto de la presente invención está basado en el reconocimiento de que los defectos percibidos hasta ahora de la codificación espacial, principalmente un efecto de "desaparición de señal" ("signal ducking "), son virtudes de hecho cuando la codificación espacial es empleada en una disposición de reproducción acústica en la que el oyente u oyentes están situados previsiblemente dentro de un área auditiva predeterminada. La invención es particularmente adecuada para uso en entornos auditivos en los que uno o quizás dos oyentes están situados previsiblemente en lo que podría ser caracterizado como "un lugar dulce de codificación espacial" como se explica después en relación con las Figuras 2, 3 y 4. La capacidad de la codificación espacial para producir un campo acústico sin defectos dentro de un área auditiva tal, un lugar dulce de codificación espacial, es un resultado inesperado. En el lugar dulce de codificación espacial, el efecto de desaparición de señal no es percibido psicoacústicamente por un oyente u oyentes. Es obtenido un campo acústico estable, normal.

La Figura 2 muestra un oyente 202 situado en un área auditiva previsible, un punto lugar 204 de codificación espacial, idealizado, esencialmente circular, dentro de cinco altavoces: izquierdo (206), central (208), derecho (210), envolvente izquierdo (212) y envolvente derecho (214), una disposición típica de reproducción de "sonido envolvente".

En sistemas acústicos de ordenador personal ("multimedia"), típicamente solo son empleados dos altavoces, altavoces izquierdo y derecho situados adyacentes a, o cerca de, el monitor de ordenador (y, opcionalmente, un altavoz de infragraves que puede estar situado a distancia, tal como el suelo; en la presente invención, el altavoz de infragraves es ignorado). Los dos altavoces crean un área auditiva óptima relativamente pequeña. La Figura 3 muestra un oyente 302 situado en un área auditiva previsible, un lugar dulce 304 idealizado de codificación espacial, enfrente de un monitor 306 de ordenador que tiene altavoces izquierdo (308) y derecho (310) en sus lados. Sistemas acústicos de ordenador más complicados pueden emplear más de dos altavoces en la manera de la disposición de la Figura 2 (el monitor de ordenador estaría situado en el mismo sitio que el altavoz central, entre los altavoces izquierdo y derecho).

Un área auditiva óptima pequeña similar es creada por algunos televisores en los que un par de altavoces están situados a cada lado de la pantalla. La Figura 4 muestra un oyente 402 situado en un área auditiva previsible, un lugar dulce idealizado 404 de codificación espacial enfrente de un televisor 406 que tiene altavoces incorporados izquierdo (408) y derecho (410) adyacentes a su tubo 412 de imagen. Sistemas acústicos de televisión más complicados pueden emplear más de dos altavoces en la manera de la disposición de la Figura 2. Por ejemplo, la televisión podría tener altavoces izquierdo, central y derecho integrados dentro de su caja, o esos altavoces podrían ser externos a la caja del televisor junto con los altavoces envolventes.

El sistema Dolby AC-3 y muchos otros sistemas no aprovechan totalmente la posición previsible de un oyente enfrente de un sistema acústico de ordenador o televisión, malgastando de tal modo bits en tales entornos. Aunque la codificación espacial es particularmente útil en entornos tales como los mostrados en las Figuras 1, 2 y 3, la codificación espacial también es útil en entornos más grandes, comprendiéndose que el tamaño del área auditiva previsible aumenta a medida que aumenta la separación entre los altavoces. La codificación espacial también puede ser útil en entornos más grandes incluso para oyentes fuera del área auditiva previsible cuando es empleada solo durante intervalos de tiempo breves con escasez de bits.

En un sistema de sonido envolvente simplificado que emplea un codificador espacial (o sea, un sistema de Tipo II que emplea solo un vector direccional único), solo necesita ser transmitida información suficiente para satisfacer a un oyente en un área auditiva previsible o lugar dulce de codificación espacial. No necesita hacerse ningún intento de proporcionar toda la información necesaria para recrear, por ejemplo, todos los cinco canales como reproducciones exactas de los cinco canales de entrada, como es efectuado en el sistema AC-3. Esto produce una reducción significativa de bits. Así, el codificador espacial es muy eficiente en no codificar nada que no pueda ser oído en el área auditiva previsible en cualquier instante. Este sistema simplificado puede funcionar incluso, supóngase, para dos oyentes siempre que estén próximos entre sí y dentro de la ubicación previsible.

El efecto secundario de "desaparición de señal" de este tratamiento simplificado es que si el oyente sale de la ubicación previsible y pone un oído en cualquier altavoz particular, un sonido puede aparecer y desaparecer cuando cambia el contenido de programa: el efecto de desaparición de señal (la señal procedente de un altavoz particular puede "desaparecer" o ser modulada por señales procedentes de otros canales). El efecto es exactamente lo que un clarinetista ha sabido siempre: sus creaciones tranquilas para la audiencia desaparecen con cada toque de trombón y reaparecen milagrosamente siempre que están libres nuevamente. Aunque tal efecto secundario sería inaceptable en teatros comerciales de gran audiencia y en teatros caseros con oyentes distribuidos por toda la habitación (más bien que dentro de un lugar dulce de codificación espacial relativamente pequeño tal como se muestra en la Figura 3), el efecto es benigno e inaudible para uno o dos oyentes en un área auditiva previsible. Sin embargo, como se observó antes, la codificación espacial puede ser útil en teatros comerciales de gran audiencia y en teatros caseros con oyentes distribuidos por toda la habitación siempre que sea empleada solo durante intervalos breves de tiempo como, por ejemplo, durante estados de escasez extrema de bits.

El efecto secundario de desaparición de señal de la codificación espacial es inaudible dentro del área auditiva previsible, permitiendo así que las exigencias de bits del codificador sean limitadas solo a las absolutamente necesarias para generar una impresión auditiva agradable dentro de ese área. Aunque no pretende proporcionar un resultado de "conductor recto con ganancia", un buen efecto práctico agradable es percibido dentro del lugar dulce de codificación espacial con buena localización y defectos mínimos.

Para aumentar el efecto de sonido envolvente de una disposición de reproducción acústica de ordenador o televisión de dos altavoces, es conveniente "espacializar" las señales descodificadas de codificador espacial empleando un "espacializador" que tiene un anulador de diafonía acústica (o alimentación cruzada). Cuando es presentado por dos altavoces por vía de medios convencionales, el material estereofónico produce imágenes sónicas que están restringidas a los propios altavoces y al espacio entre ellos. Este efecto resulta de la alimentación cruzada de la señal acústica procedente de cada altavoz al oído lejano de un oyente situado enfrente del monitor de ordenador. Aplicando las señales de canales envolventes a un anulador de diafonía acústica y sumando las señales procesadas con las señales izquierda y derecha principales, es posible representar la percepción de que información de sonido envolvente está procediendo de ubicaciones de altavoces virtuales detrás o al lado de un oyente cuando solo son empleados dos altavoces situados delante (las señales de canales izquierdo y derecho proceden de las ubicaciones de altavoces reales como lo harían ordinariamente).

El origen del anulador de diafonía acústica es atribuido generalmente a B.S. Atal y Manfred Schroeder de Bell Telephone Laboratories (por ejemplo, véase la Patente de EE.UU. 3.236.949 que es incorporada por la presente mediante referencia en su totalidad). Como es descrito originalmente por Schroeder y Atal, el efecto de alimentación cruzada acústica puede ser mitigado introduciendo una señal de anulación apropiada desde el altavoz opuesto. Como la propia señal de anulación se alimentará de forma cruzada acústicamente, también debe ser anulada por una señal apropiada procedente del altavoz que emite originalmente, y así sucesivamente.

La Figura 5A es un esquema de bloques funcionales que muestra un tipo de espacializador que tiene una red de anulación de diafonía de audio de la presente invención que puede ser empleada. Son recibidas cinco audioseñales de entrada: izquierda, central derecha, envolvente izquierda y envolvente derecha, tal como en el sistema Dolby Digital AC-3. Las entradas son aplicadas, respectivamente a filtros de bloqueo de corriente continua opcionales 502, 504, 506, 508 y 510. Retardos opcionales 512, 514 y 516 en las líneas de entrada izquierda, central y derecha tienen retardos de tiempo que corresponden al retardo de tiempo, si lo hay, en la red 520 de anulación de diafonía. Ordinariamente, no habrá retardo de tiempo en la red 520 y los retardos 512, 514 y 516 son omitidos a no ser que la red 520 incluya, por ejemplo, un compresor/limitador de amplitud. En este ejemplo, las entradas a la red 520 de anulación son las entradas envolvente izquierda y envolvente derecha. Una realización simplificada de la red 520 de anulación es descrita en relación con la realización de la Figura 5C. Refiriéndose nuevamente a la Figura 5A, un primer sumador aditivo lineal 522 recibe la corriente de audio retardada de canal izquierdo. Un segundo sumador aditivo lineal 524 recibe la corriente de audio retardada de canal derecho. La corriente de audio retardada de canal central es aplicada al sumador 522 y al sumador 524. La corriente de audio procesada de canal envolvente izquierdo procedente de la red 520 también es aplicada al sumador 522. La corriente de audio procesada de canal envolvente derecho procedente de la red 520 también es aplicada al sumador 524. Solo las corrientes de audio de canales envolventes izquierdo y derecho son procesadas por la red de anulación. Los canales frontales izquierdo y derecho son sumados a los canales envolventes izquierdo y derecho procesados por red de anulación, respectivamente. El canal central es sumado en fase a las salidas izquierda y derecha sin ningún procesamiento adicional.

La disposición de la Figura 5A también puede ser empleada cuando hay cuatro señales de entrada (canales izquierdo, central y derecho y un solo canal envolvente) tal como es proporcionada por un descodificador Dolby Surround (Envolvente) o Dolby Surround Pro Logic. En ese caso, el único canal envolvente debería ser descorrelacionado en dos señales seudoestereofónicas que, a su vez, son aplicadas a las entradas del anulador. Puede ser usada una conversión seudoestereofónica simple que emplea desplazamiento de fase tal que una señal está desfasada con la otra. Muchas otras técnicas de conversión seudoestereofónica son conocidas en la técnica.

La Figura 5B muestra alternativas adicionales al espacializador de la Figura 5A. En la Figura 5B, los canales frontales izquierdo y derecho son ensanchados ligeramente por mezcla antifase parcial en el bloque 526. La mezcla antifase para ensanchar la "etapa" estereofónica aparente es una técnica bien conocida en la tecnología. Como otra opción, el canal central puede ser anulado para minimizar el timbre falso que resulta de hacer que la señal central sea oída dos veces por cada oído (una vez desde el altavoz cercano y otra vez desde el altavoz lejano). Más bien que requerir una realización de anulador separado, las señales de alimentación cruzada acústica de canal central pueden ser anuladas aplicándolas a la red de anulación de diafonía de canales envolventes. Así, la señal de canal central es mezclada en las entradas envolvente izquierda y envolvente derecha a la red 520 de anulación de diafonía por vía de los sumadores aditivos lineales 526 y 528, respectivamente.

La Figura 5C es un esquema de bloques funcionales que muestra los elementos básicos de un anulador simple de diafonía acústica utilizable en las disposiciones de la Figura 5A o la Figura 5B. Otros anuladores más complejos pueden ser empleados. Cada retardo 530 y 532 es típicamente de unos 140 \mus (microsegundos) para altavoces situados hacia delante con respecto a un oyente en ángulos de ±15 grados, un ángulo típico para el entorno de monitor de ordenador de la Figura 3 y el entorno de televisión de la Figura 4. Cada uno de los filtros 534 y 536 es simplemente un factor K de atenuación independiente de la frecuencia, típicamente 0,9 aproximadamente. La entrada de cada derivación 538 y 540 de alimentación cruzada es tomada de la salida de un sumador aditivo (542 y 544, respectivamente) en una disposición de realimentación negativa de canal cruzado (cada derivación es restada en el sumador respectivo), para generar un anulador de cada señal de anulador anterior, como se explicó anteriormente. Este es un sumador de diafonía acústica muy simple para realizar digitalmente: dos sumas, dos multiplicaciones y un par de memorias intermedias anulares de 6 muestras para los retardos. Es preferido que, si se usa, el anulador de diafonía acústica sea implementado digitalmente en software y ejecutado en tiempo real en un ordenador personal asociado con el monitor 306 en la Figura 3 o en un microprocesador en el televisor 406 de la Figura 4.

De acuerdo con la presente invención, un codificador produce una señal de audioinformación compuesta que representa el campo acústico a ser reproducido y un vector direccional o "señal de control de dirección". La señal de audioinformación compuesta tiene su espectro de frecuencias separado en un número de subbandas que corresponden preferiblemente a las bandas críticas del oído humano. La señal de control de dirección tiene un componente relativo a la dirección dominante del campo acústico en cada una de las subbandas.

Aunque la invención puede ser implementada usando técnicas analógicas o digitales o incluso una disposición híbrida de tales técnicas, la invención es implementada más convenientemente usando técnicas digitales y las realizaciones preferidas descritas aquí son implementaciones digitales.

En una realización de la invención, un codificador recibe una pluralidad de corrientes de audio, representando cada una un canal de entrada, así como características de localización de cada uno de esos canales de entrada. El descodificador recibe una señal codificada así como la posición o la posición virtual del transductor acústico para cada canal de salida, y suministra una corriente de señal para cada canal de salida para reproducir lo más exactamente posible el campo acústico representado por las señales de canales de entrada. Como el esquema de codificación espacial de la presente invención está basado en la premisa de que solo sonido procedente de una dirección única es oído en cualquier instante, el descodificador no necesita aplicar una señal a más de dos transductores acústico en cualquier instante. La información codificada incluye para cada subbanda una representación total de todos los canales de entrada. La representación total comprende una señal de audioinformación compuesta, que representa el nivel de campo acústico global neto, y a una señal de control de dirección que comprende información de localización para el campo acústico. Esta información de localización es denominada aquí como un vector direccional neto.

En el descodificador, también es el caso de que solo una dirección obtiene bits, así que dentro de cada crítica solo uno o dos canales de presentación obtienen bits durante cada intervalo de tiempo (un canal de presentación es adecuado cuando ocurre que la dirección de campo acústico es congruente con la dirección de canal de presentación; en caso contrario, dos canales de presentación son necesarios para situar la dirección de campo acústico).

Un aspecto de la invención es un sistema de codificación espacial de velocidad baja de bits para codificar una pluralidad de corrientes de audio que representan un campo acústico en un señal codificada y descodificar la señal codificada, incluyendo el sistema un codificador y un descodificador. El codificador comprende:

un generador de señales de subbandas que genera una pluralidad de señales de subbandas en respuesta a la pluralidad de corrientes de audio, representando cada señal de subbanda una subbanda respectiva de frecuencias de una respectiva de las corrientes de audio,

un combinador de señales que genera una señal compuesta que representa la combinación de señales de subbandas en subbandas respectivas de frecuencias,

un detector de dirección de campo acústico que genera una señal de control de dirección para la señal compuesta que indica la dirección principal del campo acústico en subbandas respectivas,

un codificador y dispositivo de asignación de bits que genera información codificada asignando bits a la señal compuesta y a la señal de control de dirección, y

un formateador que ensambla la información codificada en una señal codificada.

El descodificador comprende:

un desformateador que deriva la señal compuesta y la señal de control de dirección de la señal codificada,

un generador inverso de subbandas que deriva señales de subbandas en respuesta a la señal compuesta y la señal de control de dirección,

una entrada de información que describe el número de canales de salida del descodificador y la posición o posición virtual de los transductores acústicos conectados a los canales de salida respectivos, en el que hay tres o más canales de salida, y

un generador de señal que genera una corriente de audio en no más de dos canales de salida en cualquier instante en respuesta a las señales de subbandas y la información de reproducción.

Otro aspecto de la invención es un sistema de codificación espacial de velocidad baja de bits para codificar una pluralidad de corrientes de audio que representan un campo acústico en una señal codificada, descodificar la señal codificada y reproducir una semejanza auditiva del campo acústico, incluyendo el sistema un codificador y un descodificador. El codificador comprende:

un combinador de señales que genera una señal compuesta que representa la combinación de señales de subbandas en cada subbanda de frecuencias,

un detector de dirección de campo acústico que genera una señal de control de dirección para la señal compuesta que indica la dirección principal del campo acústico en cada subbanda,

un codificador y dispositivo de asignación de bits que genera información codificada asignando bits a la señal compuesta y la señal de control de dirección, y

El descodificador comprende:

un generador inverso de subbandas que deriva señales de subbandas en respuesta a la señal compuesta y la señal de control de derivación,

una entrada de información que describe el número de canales de salida del descodificador y la posición o la posición virtual de los transductores acústicos conectados a los canales de salida respectivos, y

un generador de señal que genera una corriente de audio en uno o más canales de salida en respuesta a las señales de subbandas y la información de reproducción.

El sistema comprende además:

una pluralidad de transductores acústicos acoplados a los canales de salida del descodificador y dispuestos a fin de generar una semejanza auditiva del campo acústico para un oyente u oyentes dentro de un área auditiva de lugar dulce de codificación espacial.

Otro aspecto más de la invención es un descodificador para uso en un sistema de codificación espacial de velocidad baja de bits para descodificar una señal codificada derivada de una pluralidad de corrientes de audio que representan un campo acústico generando una pluralidad de señales de subbandas en respuesta a la pluralidad de corrientes de audio, representando cada señal de subbanda una subbanda respectiva de frecuencias de una respectiva de las corrientes de audio, generar una señal compuesta que representa la combinación de señales de subbandas en subbandas respectivas de frecuencias, generar una señal de control de dirección para la señal compuesta que indica la dirección principal del campo acústico en las subbandas respectivas, generar información codificada asignando bits a la señal compuesta y la señal de control de dirección, y ensamblar la información codificada en una señal codificada. El descodificador comprende:

una entrada de información que describe el número de canales de salida del descodificador y la posición o la posición virtual de los transductores acústico conectados a los canales de salida respectivos, en el que hay tres o más canales de salida, y

Un aspecto adicional más de la invención es un descodificador y sistema de reproducción para uso en un sistema de codificación espacial de velocidad baja de bits para descodificar y reproducir una señal codificada derivada de una pluralidad de corrientes de audio que representan un campo acústico generando una pluralidad de señales de subbandas en respuesta a la pluralidad de corrientes de audio, representando cada señal de subbanda una subbanda respectiva de frecuencias de una respectiva de las corrientes de audio, generar una señal compuesta que representa la combinación de señales de subbandas en subbandas respectivas de frecuencias, generar una señal de control de dirección para la señal compuesta que indica la dirección principal del campo acústico en subbandas respectivas, generar información codificada asignando bits a la señal compuesta y la señal de control de dirección, y ensamblar la información codificada en una señal codificada. El descodificador y sistema de reproducción comprende:

una entrada de información que describe el número de canales de salida del descodificador y la posición o posición virtual de los transductores acústico conectados a los canales de salida respectivos, y

un generador de señal que genera una corriente de audio en uno o más canales de salida en respuesta a las señales de subbandas y la información de reproducción, y

una pluralidad de transductores acústicos acoplados a los canales de salida del decodificador y dispuestos a fin de generar una semejanza auditiva del campo acústico para un oyente u oyentes dentro de un área auditiva de lugar dulce de codificación espacial.

Las diversas características de la invención y sus realización preferidas son expuestas con más detalle en el "Modos óptimos de realizar la invención" siguiente y en los dibujos adjuntos.

Descripción breve de los dibujos

La Figura 1 es un diagrama conceptual que ilustra una persona escuchando un campo acústico producido por canales de presentación múltiples pero que percibe que un sonido procede de un punto.

La Figura 2 es una representación esquemática de vista en planta de un oyente situado en un lugar dulce idealizado de codificación espacial entre una disposición de reproducción de "sonido envolvente" de cinco altavoces.

La Figura 3 es una representación esquemática de vista en planta de un oyente situado en un lugar dulce idealizado de codificación espacial enfrente de un monitor de ordenador que tiene altavoces en sus lados.

La Figura 4 es una representación esquemática de vista en planta de un oyente situado en un lugar dulce idealizado de codificación espacial enfrente de un televisor que tiene altavoces adyacentes a su tubo de imagen.

La Figura 5A s una esquema de bloques funcionales de un espacializador que emplea un anulador de diafonía acústica.

\newpage

La Figura 5B es un esquema de bloques funcionales de un espacializador modificado que emplea un anulador de diafonía acústica.

La Figura 5C es un esquema de bloques funcionales de un anulador simple de diafonía acústica de cuatro puertos según la técnica anterior.

La Figura 6 es un esquema de bloques conceptual que muestra la codificación y la descodificación espacial.

La Figura 7 es un esquema de bloques funcionales que ilustra la estructura básica de un codificador de subbandas.

La Figura 8 es un esquema de bloques funcionales que ilustra la estructura básica de un descodificador de subbandas.

La Figura 9 es un esquema de bloques funcionales que ilustra la estructura básica de la invención como se refiere a la codificación de subbandas.

La Figura 10 es un esquema de bloques funcionales que ilustra la estructura básica de la invención como se refiere a la descodificación de subbandas.

La Figura 11 es una representación gráfica hipotética de un sistema de reproducción en tres dimensiones con cinco canales de presentación.

La Figura 12A es un diagrama esquemático de bloques funcionales de un descodificador espacial que funciona en conjunción con un entorno de reproducción previsible.

La Figura 12B es un diagrama esquemático de bloques funcionales de un descodificador espacial que funciona en conjunción con otro entorno de reproducción previsible.

Modos óptimos de realizar la invención

La Figura 6 es una ilustración conceptual de una realización del sistema de codificación de Tipo II. Un codificador que comprende los procesos604 y 606 recibe señales de subbandas que representan un campo acústico por una pluralidad de canales 602 de entrada desde un codificador de subbandas (véase la Figura 7), y recibe por el trayecto 603 información referente a como el campo acústico es representado en cada uno de esos canales de entrada. El proceso 604 combina las señales en una señal de audioinformación compuesta que pasa por el trayecto 608. El proceso 606 establece una señal de control de dirección que representa la dirección aparente del campo acústico que él pasa por el trayecto 610. Un descodificador que comprende el proceso 612 recibe por el trayecto 613 información relativa al número de canales de salida y a la configuración espacial real o virtual de los transductores acústicos de canales de salida en el sistema de presentación, recibe una señal compuesta de canales por los trayectos 608 y 610, y genera señales de salida a lo largo de los canales 614 de salida para presentación del campo acústico.

En aplicaciones prácticas del codificador espacial, la información al codificador es una multiplicidad de corrientes de señales que representan canales de entrada. El codificador se ocupa del campo acústico reproducido deseado; por tanto, debe recibir información respecto a como se pretende que esos canales de entrada se relacionen con ese campo acústico. Por ejemplo, en el caso de una fuente de cinco canales que tiene reproducción izquierda, central, derecha, envolvente izquierda y envolvente derecha mediante ubicaciones de altavoces generalmente estandarizadas, el vector direccional neto puede ser derivado de las señales de cinco canales destinadas a ser aplicadas a esas ubicaciones de altavoces.

Un descodificador de codificación espacial, que recibe información respecto al entorno de reproducción o presentación, puede usar el vector direccional neto para producir un conjunto de señales para la reproducción o presentación pretendida de cinco canales o para otro entorno de reproducción o presentación que usa un número diferente de canales y/o posiciones de altavoces. Por ejemplo, la señal de audioinformación compuesta y el vector direccional neto pueden ser descodificados para un entorno de monitor de ordenador con dos altavoces. Como se trató antes, la descodificación puede incluir un "espacializador" de modo que la presentación resultante proporciona el efecto psicoacústico de un campo acústico no limitado a los dos altavoces y al espacio entre ellos.

La invención no está limitada al uso con algún esquema particular para generar canales de entrada múltiples ni algún esquema particular para captar o recrear campos acústicos. La invención acepta como una entrada al codificador cualquier conjunto de canales de entrada múltiples con información necesaria para definir como el productor de los canales de entrada pretendía que produzcan un campo acústico, por ejemplo, su dirección pretendida con respecto al oyente. El codificador convierte esa información y esos canales acústicos en una señal de audioinformación compuesta y una señal de control de dirección de vector direccional neto de modo que el descodificador puede proporcionar como una salida un conjunto de canales de presentación que producen el campo acústico posible óptimo que corresponden a las capacidades del equipo y entorno de reproducción o presentación. El número de canales producidos por el descodificador es impuesto por características del sistema de presentación y, por tanto, no es necesariamente igual que el número de canales de entrada.

La presente invención es aplicable a codificadores de subbandas implementados por cualquiera de muchas técnicas bien conocidas. Una implementación preferida usa una transformada, más particularmente una transformada del dominio de tiempo al dominio de frecuencia según la técnica de Anulación de Distorsión de Alias en el Dominio de Tiempo (TDAC: Time Domain Aliasing Cancellation). Véase "Diseño de batería de filtros de análisis/síntesis basado en la Anulación de Distorsión de Alias en el Dominio de Tiempo" de Princen y Bradley, Memorias del IEEE sobre acústica, voz, procesamiento de señales, volumen ASSP-34, 1.986, páginas 1.153-1.161. Un ejemplo de un sistema de codificador/descodificador por transformada que utiliza una transformada de TDAC es proporcionado en la Patente de Estados Unidos 5.109.417, que es incorporado por la presente mediante referencia en su totalidad.

Como se muestra en la Figura 7, la codificación típica de subbandas de canal único comprende dividir una corriente de señal de entrada en subbandas mediante la batería 710 de filtros, convertir la información de subbandas en palabras de código cuantificadas mediante el codificador 730 y ensamblar las palabras de código cuantificadas en una forma adecuada para transmisión o almacenamiento por el formateador 740. Si la batería de filtros es implementada por filtros digitales o transformadas discretas, la señal de entrada es muestreada y digitalizada por el muestreador 700 antes de la filtración en la batería de filtros. Si la batería de filtros es implementada por filtros analógicos, las señales de subbandas pueden ser muestreadas y digitalizada por el muestreador 720 para codificación digital por el codificador 730. En un aspecto, la presente invención se refiere al codificador 730 para canales múltiples de información. Por ejemplo, cada una de las entradas 602 en la Figura 6 constituye información de subbanda como se aplica al codificador 730.

Como se muestra en la Figura 8, la descodificación digital típica de subbandas de canal único comprende separar las palabras de código formateadas mediante el desformateador 810, recuperar la información de subbandas mediante el descodificador 820 y unir la información de subbandas en una señal de canal único mediante la batería 840 de filtros inversos. Si la batería de filtros inversos es implementada por filtros analógicos y la señal es codificada digitalmente, la información de subbandas es convertida en forma analógica por el convertidor 830 antes de la filtración en la batería de filtros inversos. Si la batería de filtros inversos es implementada por filtros digitales o transformadas discretas, la señal digital es convertida a forma analógica porel convertidor 850. En otro aspecto, la presente invención se refiere al descodificador 820 para canales múltiples de información.

La dirección de subbanda combina componentes espectrales de subbanda procedentes de uno o más canales en una señal compuesta. La representación compuesta para la subbanda es transmitida o grabada en lugar de los componentes espectrales de subbanda de canal individual representados por la subbanda de canal compuesto. Hay dos métodos equivalentes para formar un canal compuesto. El mismo resultado es obtenido usando cualquiera de los dos métodos. Un método es aplicar primero criterios de enmascaramiento intrabanda a cada canal para reducir el número de bits necesarios para cada canal eliminando la codificación de componentes de señal enmascarados y después, segundo, combinar los canales de bits reducidos para crear una señal compuesta. El otro método, descrito después con más detalle, es combinar primero las señales de canales originales para crear la señal compuesta y después, segundo, aplicar criterios de enmascaramiento intrabanda a la señal compuesta para reducir bits eliminando la codificación de componentes de señal enmascarados. Se cree que la señal compuesta resultante es igual o esencialmente igual en cualquiera de los dos casos. En ambos casos, el codificador espacial tiene en cuenta dos tipos de enmascaramiento: enmascaramiento de canal cruzado y enmascaramiento intrabanda dentro del canal compuesto resultante. Así, la invención pretende incluir el uso de cualquiera de los dos método para formar una señal compuesta.

La señal de control de dirección (o vector direccional neto) representa la dirección dominante aparente de los componentes espectrales procedentes de todos los canales.

De acuerdo con las enseñanzas de la presente invención para técnicas de codificación digital, los valores numéricos que representan los componentes espectrales son cuantificados en palabras de código, en las que un número variable de bits pueden ser asignados adaptablemente al menos a algunas de las palabras de código procedentes de un grupo común de bits. La asignación de bits está basada en si, debido al contenido de señal actual, los errores de cuantificación en algunas subbandas degradarán la calidad de codificación de señal en un grado mayor que los errores de cuantificación en otras subbandas. Más particularmente, más bits son asignados a los componentes espectrales dentro de subbandas cuyo ruido de cuantificación está menos sometido al enmascaramiento psicoacústico que el ruido de cuantificación en otras subbandas.

De acuerdo con las enseñanzas de la presente invención para descodificación, la dirección inversa usa la señal de control de dirección para recuperar una representación de los canales dirigidos desde el canal compuesto. Como la codificación espacial según la presente invención usa un vector direccional único y, en vista del principio fundamental de que un oyente solo oye sonido procedente de una dirección en cualquier instante, solo uno o dos canales necesitan ser generados para presentación en un sistema específico de presentación. El número de canales para el descodificador es impuesto por características del sistema de presentación y, por tanto, no es necesariamente igual que el número de canales de entrada.

También de acuerdo con las enseñanzas de la presente invención para técnicas de descodificación digital, un proceso de asignación adaptable de bits sustancialmente similar al usado durante la codificación es realizado para establecer el número de bits asignados a cada palabra de código cuantificada. Esta información es usada para reconstruir los componentes espectrales de subbandas.

\newpage

La Figura 9 es un diagrama esquemático de bloques funcionales de un codificador de codificación espacial (o sea, un codificador simplificado de Tipo II de vector único). El codificador puede ser implementado usando diversas técnicas de codificación analógica y digital. La invención implementada más convenientemente usando técnicas digitales y las realizaciones descritas aquí son implementaciones digitales.

Las implementaciones digitales pueden emplear técnicas de asignación adaptable de bits. La descripción siguiente de una realización preferida describe tanto los conceptos de asignación adaptable de bits como de dirección de subbandas, sin embargo, debería comprenderse que implementaciones digitales de codificación espacial pueden ser utilizadas con esquemas de asignación de bits que no son adaptables.

Refiriéndose a la Figura 9, los componentes de señales de subbandas para cada uno de la pluralidad de canales de entrada 1 a N en el trayecto 901 de entrada son procesados por un generador 902 de dirección aparente y señal compuesta para establecer una señal de control de dirección de dirección aparente y una señal compuesta. El proceso también recibe información fuente que indica como el campo acústico fuente es representado en cada uno de los canales de entrada (información que describe la información espacial pretendida para cada señal de canal). La información fuente y de reproducción puede ser, diversamente, permanente o programable. El codificador puede incluir instrucciones permanentes respecto al entorno fuente y/o de reproducción o tales instrucciones pueden ser proporcionadas desde fuera del codificador por vía de trayectos de entrada como se muestra en la Figura 9. Una señal de audioinformación compuesta que representa el campo acústico fuente es derivada de las señales de entrada de subbandas y la información fuente. Una señal de control de dirección en forma de un vector direccional único, que comprende información de localización para el campo acústico, es derivada de las señales de entrada de subbandas y la información fuente.

La salida de señal compuesta del bloque 902 es aplicada también a un cuantificador 904 de nivel aproximado que cuantifica la información espectral de subbandas del canal compuesto único. Un dispositivo 908 de asignación adaptable de bits asigna un número de bits a diversas subbandas en respuesta a información de cuantificación aproximada recibida desde el cuantificador 904 de nivel aproximado y el número de bits disponibles para asignación recibidos desde el grupo común 910 de bits. Un cuantificador 912 cuantifica adaptablemente la información espectral de señal compuesta en palabras de código cuantificadas en respuesta a la señal compuesta, la salida del cuantificador de nivel aproximado y la salida del dispositivo de asignación adaptable de bits. Aunque un algoritmo adecuado es descrito después, el algoritmo mediante el que el codificador asigna bits adaptablemente no es crítico para la presente invención. El cuantificador 912 también cuantifica la señal de control de dirección. El cuantificador 912 proporciona como salidas la información de dirección, palabras de código cuantificadas e información de cuantificación aproximada, respectivamente, a lo largo de los trayectos 914 a 918.

La Figura 10 es un diagrama esquemático de bloques funcionales de un descodificador de codificación espacial. Un calculador 1002 de asignación adaptable de bits establece el número de bits asignados a cada palabra de código durante la cuantificación en respuesta a información de cuantificación aproximada recibida desde la salida 918 de codificador y al número de bits disponibles para asignación recibidos desde un grupo común 1004 de bits; un descuantificador 1006 descuantifica la señal de control de dirección recibida desde la salida 914 de codificador y recupera información de componentes espectrales en respuesta a las palabras de código cuantificadas recibidas desde la salida 916 de codificador, la información de cuantificación aproximada recibida desde la salida 918 de codificador y la información de asignación de bits recibida desde el calculador 1002 de asignación adaptable de bits, y proporciona en sus salidas la información de vector direccional único en el trayecto 1008, los exponentes de subbandas de canal compuesto en la línea 1010 y los componentes espectrales de canal compuesto en el trayecto 1012. Esas salidas son aplicadas a un generador inverso 1014 de dirección aparente y señal compuesta que también recibe información de reproducción que describe un número previsto de canales de salida y la posición o posición virtual de los transductores (tales como altavoces) conectados a los canales de salida. La información de reproducción puede ser permanente o programable. El descodificador puede incluir instrucciones permanentes referentes al entorno de reproducción o tales instrucciones pueden ser proporcionadas desde fuera del descodificador por vía de un trayecto de entrada como se muestra en la Figura 10. El generador 1014 reconstruye las subbandas en respuesta a la información espectral compuesta y de dirección recibida por los trayectos 1008-1012, proporcionando, dentro de cada intervalo de tiempo en el que es recibido un conjunto de señales de subbandas y vector direccional, un conjunto completo de subbandas para uno o dos canales de información espectral de subbandas, cada canal representado como porciones de un trayecto 1016 designado Ch1, ..., ChN. La activación de solo uno o dos canales para cada subbanda durante el intervalo de tiempo es suficiente para reproducir sonido procedente de una dirección única dentro de cada subbanda. En otras palabras, con respecto a cualquier subbanda particular, solo uno o dos canales serán activos durante cada intervalo
de tiempo.

La realización preferida de la presente invención, como se refiere a codificación y descodificación, es presentada con más detalle en las secciones siguientes. Realizaciones y estructuras alternativas para la presente invención son presentadas en toda la discusión.

Refiriéndose nuevamente a la Figura 9, que ilustra un codificador de subbandas de Tipo II, puede verse que el generador 902 de dirección aparente y señal compuesta recibe canales múltiples de información de subbandas a lo largo del trayecto 901. Si los bloques de subbandas son derivados por una transformada discreta tal como la transformada discreta de Fourier, cada subbanda consistirá en uno o más coeficientes de transformada discreta. Una disposición de subbandas particular para una señal de 20 kHz de anchura de banda utiliza una transformada de 512 puntos y una frecuencia de muestreo de señal de entrada de 48 kHz. Las subbandas corresponden generalmente a las bandas críticas del oído. Otros agrupamientos de subbandas, frecuencias de muestreo y longitudes de transformada pueden ser utilizados sin separarse del alcance de la presente invención.

Como se trató antes, se cree que el efecto de dirección única funciona cuando hay un intervalo de tiempo suficientemente breve. En el caso de una frecuencia de muestreo de 48 kHz y una transformada de 512 puntos, cada bloque de transformada tiene un intervalo de tiempo de 10 milisengundos aproximadamente (en el caso de una transformada de TDAC, esto es solo una aproximación en vista del promediado de bloque a bloque inherente en el proceso de TDAC). Así, una sucesión de señales de subbandas compuestas son generadas cada 10 milisegundos aproximadamente. Cada bloque compuesto puede tener un vector direccional único asociado con el o, alternativamente, vectores direccionales pueden ser generados sobre una base regular más o menos frecuentemente que el período de bloque. Como una alternativa más, uno o más vectores direccionales adicionales pueden ser generados dentro de un período de bloque solo cuando ocurre un desplazamiento en la dirección dominante mayor que un umbral (supóngase, más de 30 grados). El inventor ha hallado que un sistema basado en transformada de TDCA (anulación de distorsión de alias en el dominio de tiempo) que tiene longitudes de bloques de unos 10 milisegundos y un vector direccional único durante cada período de bloque proporciona una experiencia agradable de reproducción musical.

El proceso de generador de dirección aparente y señal compuesta combina los componentes espectrales procedentes de canales múltiples para formar una subbanda de canal único compuesto, reduciendo de tal modo el número de componentes espectrales que deben ser cuantificados y transmitidos. Una señal de control de dirección, que transporta información sobre la dirección aparente del campo acústico (una dirección única) dentro de un intervalo de tiempo, es pasada con los componente espectrales de canal compuesto codificado para permitir que el descuantificador receptor recupere los componentes espectrales para uno o dos canales, que es suficiente para una reproducción de dirección única. Debería apreciarse que, en general, los componentes espectrales recuperados desde el canal compuesto y la señal de control de dirección única no son idénticos que los componentes espectrales que un receptor descodificaría a partir de canales discretos o a partir de un canal compuesto y factores de escala para cada canal (como en un sistema de Tipo I).

Los bits ahorrados codificando una subbanda de canal compuesto y vector de dirección única auxiliar, más bien que codificando subbandas de canales discretos o una subbanda de canal compuesto y factores de escala de canal (como en el sistema de Tipo I), son usados por el proceso de asignación adaptable de bits, por ejemplo, para asignar a otra subbandas y por el cuantificador para cuantificar la señal de control de dirección.

Los componentes espectrales de las subbandas en uno o más canales son combinados. Según dichas patentes 5.583.962, 5.632.005 y 5.633.981, un método preferido dispone cada valor de componente espectral en la subbanda compuesta igual a la media de los valores de componentes espectrales correspondientes en los canales dirigidos y métodos alternativos pueden formar otras combinaciones lineales o sumas ponderadas de los valores de componentes espectrales en los canales dirigidos.

La señal de control de dirección representa la dirección espacial primaria (o sea, dominante) de los componentes de subbanda en el canal compuesto. Según la versión simplificada del sistema de Tipo II que es el sujeto de esta invención, durante cada intervalo de tiempo, un método básico construye un vector único que representa solo la dirección espacial primaria o dominante para cada subbanda en la señal compuesta.

El concepto de este método básico puede ser comprendido mejor refiriéndose a la Figura 11 que ilustra un sistema de reproducción hipotético que comprende cinco canales de presentación. Cada uno de estos canales de presentación, que corresponde a uno de los canales de entrada, representa un altavoz situado en la superficie de una espera unitaria. El oyente propuesto está situado en el centro de la esfera. Uno de los canales es designado RF. La dirección aparente al oyente del canal RF es representado por el vector unitario \overline{DI}.

Según este método básico de codificación, el vector \overrightarrow{V}_{j} de señal de control de dirección representa la dirección principal (dominante) del campo acústico para la subbanda j de señal compuesta. Aunque un sistema de coordenadas cartesianas es una representación preferida para la dirección, otras representaciones tales como coordenadas polares pueden ser usadas sin apartarse del espíritu de la invención. Cada vector direccional de canal es ponderado por nivel. La señal de control de dirección puede ser expresada como

(1)\overrightarrow{V}_{j} = \sum\limits_{i=1}^{S}LI_{ij}\cdot \overrightarrow{DI}_{i} = \overrightarrow{LI}_{j}\cdot \overline{DI}

donde

\overrightarrow{DI}_{i} = vector unitario direccional para el canal i,

LI_{ij} = nivel calculado para la subbanda j en el canal i,

S = número total de canales,

\overrightarrow{V}_{j} = vector de señal de control de dirección para la subbanda j,

\overline{DI}= vectores unitarios direccionales para todos los canales de entrada, y

\overrightarrow{LI}_{j} = niveles calculados para la subbanda j en todos los canales de entrada.

Detalles adicionales de un codificador de Tipo II utilizable en la presente invención son expuestos en dichas patentes 5.583.962, 5.632.005 y 5.633.981.

En el descodificador de codificación espacial mostrado en la Figura 10, el generador inverso 1014 de dirección aparente y señal compuesta reconstruye una representación de dirección única del canal compuesto en respuesta a una señal de control de dirección, los niveles de cuantificación aproximados y los valores de componentes espectrales recibidos por los trayectos 1008 a 1012, respectivamente.

Como se explicó antes, la invención de codificación de Tipo II emplea una forma de vector unidireccional de la señal de control de dirección. Para aproximar la dirección de la señal codificada, el proceso de reconstrucción debe tener en cuenta el número y la posición de los altavoces instalados en el sitio de descodificación. El vector \overrightarrow{DO}_{i} de dirección para cada canal i de presentación es proporcionado como la entrada de información de reproducción al generador inverso 1014 de dirección aparente y señal compuesta. El proceso de reconstrucción genera preferiblemente componentes espectrales para solo uno o dos canales de presentación, que es suficiente para obtener un campo acústico con la orientación espacial de la subbanda de señal compuesta representada por la señal de control de dirección.

Aplicando la Ecuación 1 al sistema de presentación, la señal de control de dirección puede ser expresada como

(4)\overrightarrow{V}_{j} = \sum\limits_{i=1}^{S}LO_{ij}\cdot \overrightarrow{DO}_{i} = \overrightarrow{LO}_{j}\cdot \overline{DO}

Donde,

\overrightarrow{DO}_{i} = vector unitario direccional para el canal i de presentación,

LO_{ij} = nivel calculado para la subbanda j en el canal i,

S = número total de canales de presentación,

\overline{DO} = vectores unitarios direccionales para todos los canales de presentación, y

\overrightarrow{LO}_{j} = niveles calculados para la subbanda j en todos los canales de presentación.

Una restricción adicional impuesta a los niveles calculados LO es que la sonoridad del campo acústico producido por el sistema de presentación debería ser igual que la sonoridad del campo acústico original. Más particularmente, una restricción es impuesta a cada vector \overrightarrow{LO}_{j} tal que la sonoridad o nivel total del campo acústico para cada subbanda producida por el sistema de presentación es igual que el nivel de la subbanda en el campo acústico original.

Detalles adicionales de un descodificador de Tipo II utilizable en la presente invención son expuestos en dichas patentes 5.583.962, 5.632.005 y 5.633.981.

La Figura 12A es un diagrama esquemático de bloques funcionales de un descodificador espacial que funciona en conjunción con un entorno de reproducción previsible. La información de dirección, las palabras de código cuantificadas y la información de cuantificación aproximada, respectivamente, a lo largo de los trayectos de entrada 1202, 1204 y 1206, son aplicadas a un descodificador espacial 1208. Las señales de entrada pueden ser transportadas al descodificador espacial por cualquiera de diversas técnicas de transmisión o almacenamiento que incluyen, por ejemplo, transmisión cableada e inalámbrica, soportes magnéticos y soportes ópticos. Como se explicó antes, las señales de entrada son codificadas de acuerdo con la versión de vector único del sistema de Tipo II. El descodificador 1208 suministra cuatro o cinco señales de salida que pueden ser aplicadas a un espacializador opcional 1210 que emplea un anulador de diafonía acústica. La implementación particular del espacializador 1210 no es crítica; disposiciones adecuadas son descritas en relación con las Figuras 5A, 5B y 5C. La salida del espacializador 1210, si se emplea un espacializador, es aplicada a los altavoces izquierdo y derecho 1212 y 1214 (por vía de medios amplificadores y acopladores adecuados que no son mostrados), en caso contrario, las salidas del descodificador 1208 son aplicadas a los altavoces por vía de medios amplificadores y acopladores adecuados (no mostrados). Los altavoces, situados por ejemplo en la manera de la Figura 3 o la Figura 4, producen un lugar dulce oblongo 1216 de codificación espacial (mostrado idealizado) en el que está situado un oyente 1217. Si se desea, el espacializador 1210 puede, si es usado, formar una parte integral del descodificador 1208.

La Figura 12B es un diagrama esquemático de bloques funcionales de un descodificador espacial que funciona en conjunción con otro entorno de reproducción previsible. La información de dirección, las palabras de código cuantificadas y la información de cuantificación aproximada, a lo largo de los trayectos de entrada 1202, 1204 y 1206 respectivamente, son aplicadas a un descodificador espacial 1208 como en la disposición de la Figura 12A. La disposición de la Figura 12B difiere en que el entorno de reproducción es una disposición estándar de sonido envolvente de cinco altavoces. En este caso, no es necesario ningún espacializador. Las salidas del descodificador espacial 1208 son aplicadas a los cinco altavoces: izquierdo (1218), central (1220), derecho (1222), envolvente izquierdo (1224) y envolvente derecho (1226) que producen un lugar dulce circular 1228 de codificación espacial (mostrado idealizado) en el que está situado un oyente 1230.

Claims

1. Un sistema de codificación espacial de velocidad baja de bits para codificar una pluralidad de corrientes de audio que representan un campo acústico en una señal codificada y descodificar dicha señal codificada, incluyendo dicho sistema un codificador y un descodificador, comprendiendo dicho codificador:

un generador (710) de señales de subbandas que genera una pluralidad de señales de subbandas en respuesta a dicha pluralidad de corrientes de audio, representando cada señal de subbanda una subbanda respectiva de frecuencias de una respectiva de dichas corrientes de audio,

un combinador (902) de señales que genera una señal compuesta que representa la combinación de señales de subbandas en subbandas respectivas de frecuencias,

un detector (902) de dirección de campo acústico que genera una señal de control de dirección para dicha señal compuesta que indica la dirección principal de dicho campo acústico en subbandas respectivas,

un codificador y dispositivo de asignación de bits (730; 904, 908, 910, 912) que genera información codificada asignando bits a dicha señal compuesta y dicha señal de control de dirección, y

un formateador (740) que ensambla dicha información codificada en una señal codificada, y

comprendiendo dicho descodificador

un desformateador (810) que deriva la señal compuesta y la señal de control de dirección de dicha señal codificada,

un generador inverso (840) de subbandas que deriva señales de subbandas en respuesta a dicha señal compuesta y dicha señal de control de dirección,

una entrada de información que describe el número de canales de salida de dicho descodificador y la posición o posición virtual de los transductores acústicos conectados a los canales de salida respectivos, en el que hay tres o más canales de salida, y

un generador (1014) de señal que genera una corriente de audio en no más de dos canales de salida en cualquier instante en respuesta a dichas señales de subbandas e información de reproducción.

2. El sistema según la reivindicación 1, comprendiendo además

una pluralidad de transductores acústicos (206, 208, 210, 212, 214; 1212, 1214; 1219, 1220, 1222, 1224) acoplados a los canales de salida de dicho descodificador y dispuestos a fin de generar una semejanza auditiva de dicho campo acústico para un oyente u oyentes dentro de un área auditiva de lugar dulce de codificación espacial.

3. El sistema según la reivindicación 1 o la reivindicación 2, comprendiendo además un espacializador (1210) que incluye un anulador (520) de alimentación cruzada acústica para procesar corrientes de audio en dichos canales de salida, suministrando el espacializador (1210) un número reducido de canales de salida que tienen corrientes de audio con características tales que cuando acoplados a los transductores acústicos (206, 208, 210, 212, 214; 1212, 1214; 1219, 1220, 1222, 1224), proporcionan la impresión auditiva de un campo acústico similar a la que se habría producido si el número original de canales de salida estuvieran acoplados a un número mayor de transductores acústicos (206, 208, 210, 212, 214; 1212, 1214; 1219, 1220, 1222, 1224).

4. El sistema según la reivindicación 1 o la reivindicación 2, en el que dicha señal de control de dirección comprende un vector direccional para cada subbanda.

5. El sistema según la reivindicación 1 o la reivindicación 2, en el que dicha subbanda respectiva de frecuencias tiene una anchura de banda correspondiente a una banda crítica respectiva del sistema auditivo humano.

6. El sistema según la reivindicación 1 o la reivindicación 2, en el que dichos bits son asignados según principios psicoacústicos.

7. El sistema según la reivindicación 2, en el que dicho descodificador comprende además un espacializador (1210) que incluye un anulador (520) de alimentación cruzada acústica para procesar corrientes de audio en dichos canales de salida, mediante lo cual la semejanza auditiva de dicho campo acústico generado dentro del área auditiva de lugar dulce de codificación espacial representa la percepción de un campo acústico de sonido envolvente o escena ancha.

8. Un descodificador para uso en un sistema de codificación espacial de velocidad baja de bits para descodificar una señal codificada derivada de una pluralidad de corrientes de audio que representan un campo acústico generando una pluralidad de señales de subbandas en respuesta a la pluralidad de corrientes de audio, representando cada señal de subbanda una subbanda respectiva de frecuencias de una respectiva de dichas corrientes de audio, generar una señal compuesta que representa la combinación de señales de subbandas en subbandas respectivas de frecuencias, generar una señal de control de dirección para la señal compuesta que indica la dirección principal de dicho campo acústico en subbandas respectivas, generar información codificada asignando bits a la señal compuesta y a la señal de control de dirección, y ensamblar la información codificada en una señal codificada, comprendiendo

una entrada de información que describe el número de canales de salida de dicho descodificador y la posición o posición virtual de los transductores acústicos (206, 208, 210, 212, 214; 1212, 1214; 1219, 1220, 1222, 1224) conectados a los canales de salida respectivos, en el que hay tres o más canales de salida, y

un generador (1014) de señal que genera una corriente de audio en no más de dos canales de salida en respuesta a dicha señales de subbandas e información de reproducción.

9. El descodificador según la reivindicación 8, comprendiendo además

un generador (1014) de señal que genera una corriente de audio en uno o más canales de salida en respuesta a dichas señales de subbandas e información de reproducción, y

10. El descodificador de la reivindicación 8 o la reivindicación 9, comprendiendo además un espacializador (1210) que incluye un anulador (520) de alimentación cruzada acústica para procesar corrientes de audio en dichos canales de salida, proporcionando el espacializador (1210) un número reducido de canales de salida que tienen corrientes de audio con características tales que cuando acoplados a transductores acústicos (206, 208, 210, 212, 214; 1212, 1214; 1219, 1220, 1222, 1224), proporcionan la impresión auditiva de un campo acústico similar al que se habría producido si el número original de canales de salida estuvieran acoplados a un número mayor de transductores acústicos (206, 208, 210, 212, 214; 1212, 1214; 1219, 1220, 1222, 1224).

11. El descodificador de la reivindicación 8 o la reivindicación 9, en el que dicha señal de control de dirección comprende un vector direccional para cada subbanda.

12. El descodificador de la reivindicación 8 o la reivindicación 9, en el que dicha subbanda respectiva de frecuencias tiene una anchura de banda correspondiente a una banda crítica respectiva del sistema auditivo humano.

13. El descodificador de la reivindicación 8 o la reivindicación 9, en el que dichos bits son asignados según principios psicoacústicos.

14. El descodificador de la reivindicación 8 o la reivindicación 9, en el que dicho descodificador comprende además un espacializador (1210) que incluye un anulador (520) de alimentación cruzada acústica para procesar las corrientes de audio en dichos canales de salida, mediante lo cual la semejanza auditiva de dicho campo acústico generado dentro del área auditiva de lugar dulce de codificación espacial representa la percepción de un campo acústico de sonido envolvente o escena ancha.

15. Un método de codificación espacial de velocidad baja de bits para codificar una pluralidad de corrientes de audio que representan un campo acústico en una señal codificada y descodificar dicha señal codificada, incluyendo dicho método codificado y descodificada, incluyendo dicho método codificación y descodificación, comprendiendo dicha codificación:

generar una pluralidad de señales de subbandas en respuesta a dicha pluralidad de corrientes de audio, representando cada señal de subbanda una subbanda respectiva de frecuencias de una respectiva de dichas corrientes de audio,

generar una señal compuesta que representa la combinación de señales de subbandas en subbandas respectivas de frecuencias,

generar una señal de control de dirección para dicha señal compuesta que indica la dirección principal de dicho campo acústico en subbandas respectivas,

generar información codificada asignando bits a dicha señal compuesta y a dicha señal de control de dirección, y

ensamblar dicha información codificada en una señal codificada; y

comprendiendo dicha descodificación:

derivar la señal compuesta y la señal de control de dirección de dicha señal codificada,

derivar señales de subbandas en respuesta a dicha señal compuesta y a dicha señal de control de dirección,

suministrar información de reproducción que describe el número de canales de salida de dicho descodificador y la posición o posición virtual de los transductores acústicos (206, 208, 210, 212, 214; 1212, 1214; 1219, 1220, 1222, 1224) conectados a los canales de salida respectivos, en el que hay tres o más canales de salida, y

generar una corriente de audio en no más de dos canales de salida en cualquier instante en respuesta a dichas señales de subbandas e información de reproducción.

16. El método según la reivindicación 15, comprendiendo además

acoplar dichos canales de salida a una pluralidad de transductores acústicos (206, 208, 210, 212, 214; 1212, 1214; 1219, 1220, 1222, 1224) dispuestos a fin de generar una semejanza auditiva de dicho campo acústico para un oyente u oyentes dentro de un área auditiva de lugar dulce de codificación espacial.

17. El método según la reivindicación 15 o la reivindicación 16, comprendiendo además procesar corrientes de audio en dichos canales de salida con un espacializador (1210) que incluye un anulador (250) de alimentación cruzada acústica, proporcionando dicho procesamiento un número reducido de canales de salida que tienen corrientes de audio con características tales que, cuando acopladas a los transductores acústicos (206, 208, 210, 212, 214; 1212, 1214; 1219, 1220, 1222, 1224), proporcionan la impresión auditiva de un campo acústico similar al que se habría producido si el número original de canales de salida estuvieran acoplados a un número mayor de transductores acústicos (206, 208, 210, 212, 214; 1212, 1214; 1219, 1220, 1222, 1224).

18. El método según la reivindicación 15 o la reivindicación 16, en el que dicha señal de control de dirección comprende un vector direccional para cada subbanda.

19. El método según la reivindicación 15 o la reivindicación 16, en el que dicha subbanda respectiva de frecuencias tiene una anchura de banda correspondiente a una banda crítica respectiva del sistema auditivo humano.

20. El método según la reivindicación 15 o la reivindicación 16, en el que dichos bits son asignados según principios psicoacústicos.

21. El método según la reivindicación 16, en el que dicha descodificación comprende además procesar las corrientes de audio en dichos canales de salida con un espacializador (1210) que incluye un anulador (520) de alimentación cruzada acústica, mediante lo cual la semejanza auditiva de dicho campo acústico generado dentro del área auditiva de lugar dulce de codificación espacial representa la percepción de un campo acústico de sonido envolvente o escena ancha.

22. Un método de descodificación espacial de velocidad baja de bits para descodificar una señal codificada derivada de una pluralidad de corrientes de audio que representan un campo acústico generando una pluralidad de señales de subbandas en respuesta a la pluralidad de corrientes de audio, representando cada señal de subbanda una subbanda respectiva de frecuencias de una respectiva de dichas corrientes de audio, generar una señal compuesta que representa la combinación de señales de subbandas en subbandas respectivas de frecuencias, generar una señal de control de dirección para la señal compuesta que indica la dirección principal de dicho campo acústico en subbandas respectivas, generar información codificada asignando bits a la señal compuesta y a la señal de control de dirección, y ensamblar la información codificada en una señal codificada, comprendiendo:

derivar señales de subbandas en respuesta a dicha señal compuesta y dicha señal de control de dirección,

suministrar información de reproducción que describe el número de canales de salida de dicho descodificador y la posición o posición vertical de los transductores acústicos (206, 208, 210, 212, 214; 1212, 1214; 1219, 1220, 1222, 1224) conectados a los canales de salida respectivos, en el que hay tres o más canales de salida, y

23. El método de la reivindicación 22, comprendiendo además

acoplar una pluralidad de transductores acústicos (206, 208, 210, 212, 214; 1212, 1214; 1219, 1220, 1222, 1224) a los canales de salida de dichos transductores acústicos (206, 208, 210, 212, 214; 1212, 1214; 1219, 1220, 1222, 1224) dispuestos a fin de generar una semejanza auditiva de dicho campo acústico para un oyente u oyentes dentro de un área auditiva de lugar dulce de codificación espacial.

\newpage

24. El método de la reivindicación 22 o la reivindicación 23, comprendiendo además procesar las corrientes de audio en dichos canales de salida con un espacializador (1210) que incluye un anulador (520) de alimentación cruzada acústica, proporcionando dicho procesamiento un número reducido de canales de salida que tienen corrientes de audio con características tales que, cuando acopladas a los transductores acústicos (206, 208, 210, 212, 214; 1212, 1214; 1219, 1220, 1222, 1224), proporcionan la impresión auditiva de un campo acústico similar al que se habría producido si el número original de canales de salida estuvieran acoplados a un número mayor de transductores acústicos (206, 208, 210, 212, 214; 1212, 1214; 1219, 1220, 1222, 1224).

25. El método de la reivindicación 22 o la reivindicación 23, en el que dicha señal de control de dirección comprende un vector direccional para cada subbanda.

26. El método de la reivindicación 22 o la reivindicación 23, en el que dicha subbanda respectiva de frecuencias tiene una anchura de banda correspondiente a una banda crítica respectiva del sistema auditivo humano.

27. El método de la reivindicación 22 o la reivindicación 23, en el que dichos bits son asignados según principios psicoacústicos.

28. El método de la reivindicación 23, comprendiendo además procesar corrientes de audio en dichos canales de salida con un espacializador (1210) que incluye un anulador (520) de alimentación cruzada acústica, mediante lo cual la semejanza auditiva de dicho campo acústico generado dentro del área auditiva de lugar dulce de codificación espacial representa la percepción de un campo acústico de sonido envolvente o escena ancha.