MXPA01012991A

MXPA01012991A - Mezcla descendente del canal central interactivo de voz a audio remanente (vra).

Info

Publication number: MXPA01012991A
Application number: MXPA01012991A
Authority: MX
Inventors: Michael A Vaudrey
Original assignee: Hearing Enhancement Co Llc
Priority date: 1999-06-15
Filing date: 2000-06-13
Publication date: 2002-07-02
Also published as: AU761690C; US6442278B1; CN1369189A; IL147057A0; BR0011645A; AU761690B2; CA2374849A1; CN1284410C; NO20016090D0; US6650755B2; EP1190598A1; AR024352A1; WO2000078094A1; NO20016090L; JP2003501985A; AU5733000A; US20030002683A1; TW480894B; JP4818554B2

Abstract

La presente invencion se refiere a un metodo para descodificar una senal de audio que incluye la recepcion de una senal de audio digital que tiene una pluralidad de canales (221- 226 o CENTRAL, TODOS LOS OTROS ALTAVOCES) definidos en esta, en donde una de la pluralidad de canales es un canal central (C o CENTRAL) y al menos una de la otra pluralidad de canales es un canal de audio remanente; comparacion del canal central (C o CENTRAL) con al menos una de la otra pluralidad de canales (221-224 o TODOS LOS OTROS ALTAVOCES); y el ajuste automaticamente (232, 233) del canal central y al menos una de la pluralidad de otros canales cuando no se encuentra un valor predeterminado para la relacion.

Description

MEZCLA DESCENDENTE DEL CANAL CENTRAL INTERACTIVO DE VOZ A AUDIO REMANENTE (VRA) Campo de la Invención Las modalidades de la presente invención generalmente se refieren a un método y aparato para procesar señales de audio, y en forma más particular, a un método y aparato para procesar las señales de audio para mejorar la experiencia de recepción para un amplio rango de usuarios finales.

Antecedentes de la Invención Los usuarios finales con equipo costoso o de "alta terminal" que incluyen amplificadores de canales múltiples y sistemas de altavoces múltiples, actualmente tienen una capacidad limitada para ajustar el volumen en la señal del canal central de un sistema de audio de canales múltiples independientemente de las señales de audio en los otros canales remanentes. Puesto que muchos cines tienen la mayoría del diálogo en el canal central y otros efectos de sonido localizados en otros canales, esta capacidad de ajuste limitada permite al usuario final alcanzar la amplitud de la mayoría de canales de diálogo de modo que es más inteligible REF. : 135044 ¡.?.? durante secciones con efectos de sonido fuerte. Actualmente, este ajuste limitado tiene deficiencias importantes. Primero, es una capacidad de ajuste que está disponible únicamente para los usuarios finales que tienen un reproductor de DVD y un sistema de altavoces de canales múltiples tal como un sistema de teatro en casa de seis altavoces que permite ajustar el nivel de volumen de todos los altavoces independientemente. j Además, es un ajuste que necesitará ser modificado continuamente durante la perturbación transitoria en una señal de audio preferida (por ejemplo, señal de diálogo o voz) y señal de audio remanente (todos los otros canales) . La deficiencia final es que los ajustes de voz a audio remanente (por sus siglas en inglés, VRA) que fueron aceptables durante un segmento de audio del programa del cine no pueden ser buenos para otro segmento de audio si el nivel de audio remanente se incrementa demasiado o el nivel del diálogo se reduce demasiado. Es un hecho que una gran mayoría de usuarios finales no tiene y ni tendrá por muchos años un teatro en casa que permita esta capacidad de ajuste, es decir, descodificador Dolby Digital, preamplificador variable de seis canales y sistema de múltiples altavoces. Además, los usuarios finales no tienen la capacidad para asegurar que la AiM¿'',¡J..JlA.a i j 4U?U* *... r r. J-*. »- , * -..-.....«».. . _. . *~.Mt~r? - -* -,. . > „i«. jj j i j . relación de VRA seleccionada al comienzo del programa permanecerá igual para el programa completo. La FIG 3 ilustra el procedimiento de posicionamiento espacial propuesto de un sistema de teatro en casa común. Aunque no existen reglas escritas para la producción de audio en los canales espaciales 5.1, existen industrias estándares. Como se usa aquí, el término 'canales espaciales se refiere a la ubicación física de un dispositivo de salida (por ejemplo, altavoces) y cómo el sonido desde el dispositivo de salida se reparte al usuario final. Una de estas normas es localizar la mayoría del diálogo en el canal central 226. De manera similar otros efectos de sonido que requieren el posicionamiento espacial se colocarán en cualquiera de los otro cuatro altavoces marcados L 221, R 222, Ls, 223, y Rs 224 para izquierda, derecha, borde izquierdo y borde derecho. Además, para evitar el daño al centro de amplitud de altavoces, los efectos de baja frecuencia (LFE) se colocan en el canal 0.1 dirigido hacia un altavoz secundario de bajas frecuencias 225. La compresión de audio digital permite al productor proveer al usuario final con un intervalo dinámico mayor para el audio que no fue posible a través de la transmisión análoga. Este intervalo dinámico mayor origina más diálogo al sonido demasiado bajo en la presencia de efectos de sonido muy fuerte. El siguiente ejemplo proporciona una explicación. Se supone que una transmisión análoga (o grabación) tiene la capacidad para transmitir amplitudes de intervalo dinámico 5 hasta 95 dB y el diálogo típicamente se registra a 80 dB. Los segmentos fuertes del audio remanente pueden opacar el diálogo cuando este audio remanente alcanza el límite superior mientras alguien está parlando. Sin embargo, esta situación se agrava cuando la compresión de audio digital permite un intervalo dinámico hasta 105 dB. Claramente, el diálogo permanecerá al mismo nivel (80 dB) con respecto a otros sonidos, solamente ahora el audio remanente fuerte puede ser reproducido de manera más realista en términos de su amplitud. Los usuarios lamentan que los niveles de diálogo que se han registrado demasiado bajos en el DVD son muy comunes. De hecho, el diálogo IS al nivel adecuado es más apropiado y realista que el que existe para los registros análogos con intervalo dinámico limitado. Aún para los consumidores quienes actualmente tienen sistemas de teatro en casa apropiadamente calibrados, el diálogo es frecuentemente encubierto por las secciones de audio remanentes fuertes en muchas películas DVD producidas hoy en día. Un pequeño grupo de consumidores son capaces de encontrar algunos mejoramientos en la inteligibilidad incrementando el volumen del canal central y/o disminuyendo el volumen de todos los otros canales. Sin embargo, este ajuste establecido solamente es aceptable para ciertos 5 pasajes de audio e interrumpe los niveles de la calibración adecuada. Los niveles del altavoz típicamente se calibran para producir cierto nivel de presión de sonido (SPL)s en la ubicación del enfoque. Esta calibración adecuada asegura que el enfoque sea tal realista como sea posible. 10 Infortunadamente esto significa que los sonidos fuertes se reproducen muy fuerte. Durante el enfoque de media noche, esto no puede ser deseable. Sin embargo, cualquier ajuste de los niveles de los altavoces interrumpe la calibración.

BREVE DESCRIPCIÓN DE LA INVENCIÓN Un método para descodificar una señal de audio que incluye la recepción de una señal de audio digital que tiene una pluralidad de canales definidos en esta, en donde uno de la pluralidad de canales es un canal central y al menos uno de la otra de dicha pluralidad de canales es un canal de audio remanente; comparando el canal central con al menos uno de la otra pluralidad de canales para determinar una relación del canal central a la otra de la pluralidad de canales; y ajustar automáticamente el canal central y al menos uno de la pluralidad de otros canales cuando no se encuentra un valor predeterminado para la relación.

BREVE DESCRIPCIÓN DE LOS DIBUJOS La FIG. 1 ilustra una propuesta general de acuerdo con la presente invención para la separación pertinente de la información de voz desde el audio de fondo general en un programa transmitido o grabado. 10 La FIG. 2 ilustra una modalidad ejemplar de acuerdo con la presente invención para la recepción y reproducción de las señales del programa codificado. La FIG. 3 ilustra el procedimiento de posicionamiento espacial propuesto de un sistema de teatro en 15 casa común. La FIG. 4 ilustra un sistema donde el usuario final tiene la opción para seleccionar la característica de nivelación de voz a audio remanente (VRA) automático o la característica del audio calibrado de acuerdo con la presente invención. La FIG. 5 ilustra una modalidad de un diagrama conceptual de cómo una mezcla descendente se podrá implementar de acuerdo con la presente invención.

La FIG. 6 ilustra una modalidad alternativa de un diagrama conceptual de cómo una mezcla descendente se podrá implementar de acuerdo con la presente invención. La FIG. 7 representa un codificador de la técnica previa de Dolby Digital y codificador con coeficientes de mezcla descendente estandarizados. La FIG. 8 ilustra los niveles ajustables por el usuario final en cada uno de los canales 5.1 codificados de acuerdo con la presente invención. La FIG. 9 ilustra una caja de interconexión representada en la FIG. 8, de acuerdo con una modalidad de la presente invención. La FIG. 10 ilustra el proceso para la colocación de la música en los canales izquierdo y derecho y la voz en el canal central con ajustes en el canal central previo al mezclado descendente. La FIG. 11 ilustra una modalidad alternativa del sistema ilustrado en la FIG. 10 de acuerdo con los principios de la presente invención.

DESCRIPCIÓN DETALLADA La presente invención describe un método y aparato para ajustar el nivel del canal central de un programa de ^ audio de canales múltiples, con respecto a los canales remanentes del programa de audio de canales múltiples para la capacidad de voz a audio remanente preferida. Además, la presente invención describe un método y 5 aparato para volver a grabar cintas originales viejas y grabar cintas originales nuevas de medios de audio de tal manera que permite al usuario final ajustar la voz a audio remanente preferido. Como se usa aquí, el término * cinta original" se refiere a los medios de audio generados en el primer paso completo en el proceso de grabación de audio. Además, el término "usuario final" se refiere a un consumidor u oyente de una transmisión o grabación de sonido o una persona o personas que reciben la señal de audio en los medios de audio que se distribuyen por grabado o transmisión.

Adicionalmente, el término w audio preferido" se refiere al componente de vos, información de voz o componente de voz primario de la señal de audio y el término * audio remanente" se refiere al fondo, musical, o componente sin voz de la señal de audio. 20 La invención descrita aquí no se limita a cualquier audio particular CODEC (compresión/descompresión) estándar y se puede usar con cualquier audio CODEC tal como *Digital *áÍÍ¡M?É ¡ BSk¡Ékl¡Ét& .t -Í .? . di? ¡l_;líí .. ¿ i .~rr„ r r. L....... .-ir-i». -: -. -- -. • . -. ... ^ ^ .... . .. ,:. .!, i - - ___ .. ... ... »»- .-, .. .^ ». i .i- .í- ^ Theater Sound" (DTS), 'Dolby Digital", 'Sony Dynamic Digital Sound" (SDDS), "Pulse Code Modulation" (PCM), etc.

Importancia de la Relación de Audio Preferido a Audio Remanente La presente invención comienza con la realización que el intervalo preferencial de la recepción de una relación de una señal de audio preferida con relación a cualquier audio remanente es de preferencia más grande, y ciertamente más grande que lo siempre esperado. Este descubrimiento significativo es el resultado de una prueba de muestras pequeñas de la población con respecto a sus preferencias de la relación del nivel de señal de audio preferido a un nivel de señal de todo el audio remanente.

Ajuste Específico del Intervalo Deseado para Oyentes Normales o con Problemas de Audición Búsquedas muy directas se han conducido en el área del entendimiento de cómo los usuarios normales y con problemas de audición perjudicado perciben la relación entre el diálogo y el audio remanente para diferentes tipos de programación de audio. Se ha encontrado que la población varía a pliamente en el intervalo de ajuste deseado entre la voz y el aµdio remanente J3e han conducido dos experimentos en una muestra aleatoria de la población incluyendo niños de escuela primaria, niños de escuela intermedia, ciudadanos de edad madura y personas ancianas. Un total de 71 personas se sometieron a prueba. La prueba consistió de solicitar al usuario para ajustar el nivel de voz y el nivel de audio remanente para un juego de fútbol (donde el audio remanente fue el ruido de la multitud) y una canción popular (donde el audio remanente fue la música) . Una métrica musical llamada la relacipn de VRA (voz a audio remanente) se formó dividiendo el valor lineal del volumen del diálogo o voz por el valor pineal del volumen del audio remanente para cada selección. "parias cosas se hicieron claras como un resultado de esta pr?eba. Primero, ninguna de dos personas prefieren la relación i «fiéntica para voz y audio remanente para tanto los medios dep|orti:vos como la música. Esto es muy importante 20 puesto que la población tiene confianza en los procedimientos para proporcionar un VRA (el cual no se puede ajustar por el consumidor que gustará a cada uno. Esto no puede ocurrir claramente, dado los resultados de estas pruebas. Segundo, l É i? ? iMi *aa-tt^^a^ VRA que varían ampliamente no se ha reportado o discutido en la literatura o técnica previa. En estas pruebas, un grupo de hombres de mayor edad se seleccionó y solicitó hacer un ajuste (la prueba fue realizada más tarde en un grupo de estudiantes) entre un ruido de fondo determinado y la voz de un locutor, en el cual solamente el último podrá ser variado y el anterior se ajusta a 6. Los resultados con el grupo de mayor edad fueron como sigue: Tabla I Individuo Ajuste 1 7.50 2 4.50 3 4.00 4 7.50 5 3.00 6 7.00 7 6.50 8 7.75 9 5.50 10 7.00 Para ilustrar adicionalmente el hecho de que personas de todas las edades tienen diferentes necesidades y preferencias del oído, un grupo de 21 estudiantes de universidad se seleccionó para escuchar una mezcla de voz y 5 fondo y para seleccionar, haciendo un ajuste al nivel de voz, la relación de la voz al fondo. El ruido de fondo, en este caso ruido de multitud en un juego de fútbol, se determinó a un ajuste de seis (6.00) y a los estudiantes se les dejó ajustar el volumen de la voz del locutor minuto a minuto lo cual se ha registrado separadamente y fue pura voz o en su mayor parte pura voz. En otras palabras, se seleccionaron los estudiantes para hacer la misma prueba que hizo el grupo de hombres de mayor edad. Todos los estudiantes estuvieron en su adolescencia final o cercanos a los veinte. Los resultados fueron como sigue: Tabla II Estudiante us te de Vo z 1 4 , . 75 20 2 3 . . 75 3 4 , . 25 4 4 , . 50 5 5 , . 20 ^ lmi u****».*,.^ í ? lí ?^ t^un ** Continuación de la Tabla II Estudiante Ajuste de Voz 6 5.72 7 4.25 5 8 6.70 9 3.25 10 6.00 11 5.00 12 5.25 10 13 3.00 14 4.25 15 3.25 16 3.00 17 6.00 15 18 2.00 19 4.00 20 5.50 21 6.00 Las edades del grupo de mayor edad (como se ve en la Tabla I) variaron desde 36 a 59 con el predominio de los individuos que están en el grupo de 40 ó 50 años de edad. Como se indica por los resultados de la prueba, el ajuste promedio tiende a ser razonablemente alto indicando menos pérdida de la audición a través del tablero. El intervalo de nuevo varió desde 3.00 a 7.75, una amplitud de 4.75 la cual confirmó las decisiones del intervalo de variación en la relación de voz a fondo de recepción preferida de la persona o cualquier señal preferida a audio remanente (PSRA) . El período total para el ajuste del volumen para ambos grupos de sujetos varió desde 2.0 a 7.75. Estos niveles representan los valores actuales en el mecanismo de ajuste del volumen usado para realizar este experimento. Los mismos proporcionan una indicación del intervalo de la señal a valores de ruido (cuando se compara con el nivel de "ruido" 6.0) que pueden ser deseables de usuarios diferentes. Para obtener un mejor entendimiento de cómo esto se relaciona a variaciones menos fuertes relativas elegidas por usuarios diferentes, se considera que la variación del control de volumen no lineal desde 2.0 a 7.75 representa un incremento de 20 dB o diez (10) veces. Así, para aún esta pequeña muestra de la población y tipo único de programación de audio se encontró que los diferentes oyentes prefieren quitar drásticamente los diferentes niveles de "señal preferida" con respecto a "audio remanente". Esta preferencia se corta a través de los grupos de edad que muestran que es consistente con la preferencia individual y capacidades de audición básica, lo cual es hasta ahora totalmente inesperado. Como los resultados de prueba muestran, el intervalo de los estudiantes (como se ve en la Tabla II) sin audición se debilita originado por la edad seleccionada que varía considerablemente desde un ajuste inferior de 2.00 a uno alto de 6.70, una amplitud de 4.70 o casi la mitad del intervalo total desde 1 a 10.. La prueba es ilustrativa de cómo el "tamaño único ajusta toda" la mentalidad de la mayoría de señales de audio transmitidas y grabadas falla muy corta que da al oyente individual la capacidad de ajustar la mezcla para seguir su o sus preferencias y necesidades de audición. De nuevo, los estudiantes tienen una amplia extensión en sus ajustes cuando el grupo de más edad demuestra las diferencias individuales en preferencias y necesidades de audición. Un resultado de esta prueba es que las preferencias de audición se disparan ampliamente. La prueba adicional ha confirmado este resultado sobre un grupo de muestra más grande. Además, los resultados varían dependiendo del tipo de audio. Por ejemplo, cuando la fuente de audio fue música, la relación de voz a audio remanente varía de aproximadamente cero a aproximadamente (-** 10, mientras que cuando la fuente de audio fue programación de deportes, la misma relación varía entre aproximadamente cero y en forma aproximada 20. Además, la desviación estándar se incrementa por un factor de casi tres, en tanto que el promedio se incrementa por más de dos veces aquel de la música. r El resultado final de la prueba anterior es que si uno selecciona una relación de audio a audio remanente preferida y fija que siempre, uno ha creado más probablemente un programa de audio que es menor que el deseado para una fracción significante de la población. Y, como se estableció anteriormente, la relación óptima puede ser tanto una función variante de periodo a largo plazo como de corto plazo. En consecuencia, el control completo sobre esta relación de audio preferido a audio remanente es deseable para satisfacer las necesidades de recepción de oyentes "normales" o sin daño de audición. Además, al proporcionar al usuario final con el control final sobre esta relación permite que el usuario final optimice su o sus experiencias de recepción. El ajuste independiente del usuario final de la señal de audio preferida y la señal de audio remanente será la manifestación evidente de un aspecto de la presente invención. Para ilustrar los detalles de la presente invención, se considera la aplicación en donde la señal de audio preferida es la información de voz relevante.

Creación de la Señal de Audio Preferida y la Señal de Audio 5 Remanente La Figura 1 ilustra un alcance general para separar la información de voz relevante de audio de fondo general en un programa grabado o transmitido. Primero necesitará ser una determinación hecha por el director de programación como para la definición de voz relevante. Un actor, grupo de actores, o comentaristas se deben identificar como los altavoces relevantes. Una vez que los altavoces relevantes se identifican, sus voces serán recogidas por el micrófono de voz 1. El micrófono de voz 1 necesitará ser o un micrófono de conversación cerrado (en el caso de comentaristas) o un micrófono de escopeta altamente direccional usado en la grabación de sonido. Además de ser altamente direccional, estos micrófonos 1 necesitarán ser banda de voz limitada, preferiblemente de 200-5000 Hz. La combinación de direccionalidad y filtración del paso de banda minimiza el ruido de fondo acústicamente acoplado a la información de voz relevante en el registro. En el caso de ciertos tipos de programación, la necesidad de prevenir el acoplamiento acústico se puede evitar registrando la voz relevante de diálogo fuera de línea y mezcla del diálogo en donde sea apropiado con la porción de vídeo del programa. Los micrófonos de fondo 2 deberán ser totalmente de banda ancha para proporcionar la calidad de audio total de información de fondo, tal como música. Una cámara 3 se usará para proporcionar la porción de vídeo del programa. Las señales de audio (voz y voz relevante) se codificarán con la señal de vídeo en el codificador 4. En general, la señal de audio se separa usualmente de la señal de vídeo simplemente modulándola con una frecuencia portadora diferente. Puesto que la mayoría de las transmisiones son ahora en estéreo, una forma para codificar la información de voz relevante con el fondo es para multiplicar la información de voz relevante en los canales estereofónicos separados en mucho la misma forma de canales de frente izquierda y frente derecha se adicionan a dos canales estereofónicos para producir una grabación de disco cuadrafónico. Aunque esto deberá crear la necesidad de anchura de banda transmitida adicional, para el medio registrado esto no deberá presentar un problema, mientras que el circuito de audio en el reproductor de cinta o disco de vídeo se designa para desmodular la información de voz relevante . Una vez que las señales se codifican, por cualquier medio apropiado considerado, las señales codificadas se envían para transmisión por el sistema de transmisión 5 sobre la antena 13, o se graban en la cinta o disco por el sistema de grabación 6. En el caso de información de audio y vídeo grabada, la información de fondo y de voz se podría colocar simplemente en las pistas de grabación separadas.

Recepción y Desmodulación de la Señal de Audio Preferida y el Audio Remanente La Figura 2 ilustra una modalidad ejemplar para recibir y reproducir las señales del programa codificado. Un sistema de recepción 7 desmodula la principal frecuencia portadora de las señales de audio/vídeo codificadas, en el caso de información transmitida. En el caso de medios de grabación 14, las cabezas de un VCR o el lector láser de un reproductor de CD 8 podrían producir las señales de audio/vídeo codificadas. En cualquier caso, estas señales se podrían enviar a un sistema de descodificación 9. El descodificador 9 podría separar las señales en vídeo, audio de voz, y audio de fondo usando técnicas de descodificación estándar tales como la detección de envolvente en combinación con la desmodulacíón de división de tiempo o frecuencia. La señal de audio de fondo se envía a un amplificador 10 de ganancia variable 5 separada, que el oyente puede ajustar a su o sus preferencias. La señal de voz se envía a un amplificador de ganancia variable 11, que se puede ajustar por el oyente a su o sus necesidades particulares, como se describió anteriormente . 10 Las dos señales ajustadas se suman por un amplificador sumador 12 de ganancia unitaria para producir la salida de audio final. Alternativamente, las dos señales ajustadas se suman por el amplificador sumador 12 de ganancia unitaria y se ajustan además por amplificador de ganancia variable 15 para producir la salida de audio final. De esta manera el oyente puede ajustar voz relevante a niveles de fondo para optimizar el programa de audio a su o sus requerimientos de recepción única en el periodo de reproducción del programa de audio. Cuando cada periodo el mismo oyente reproduce el mismo audio, la relación de ajuste puede necesitar cambiar debido a cambios en la audición del oyente. El ajuste permanece infinitamente ajustable para acomodar esta flexibilidad.

Característica de Ajuste de VRA automático para el canal central Alguna ganancia del nivel de canal central o reducción de los niveles de altavoces remanentes proporciona mejoras en inteligibilidad del habla para aquellos usuarios finales que tienen un sistema de audio de canales múltiples tales como un sistema de audio de canal 5.1 que tiene aquella capacidad de ajuste. Nótese que todos los consumidores no tienen un sistema, y la presente invención permitirá a todos los consumidores tener esta capacidad. La Figura 4 ilustra un sistema de donde el usuario final tiene la opción de seleccionar la característica de nivelación de VRA automática o la característica de audio calibrado. El sistema incluye un descodificador calibrado 231, conmutadores 235 y 237, un procesador 232 y una pluralidad de amplificadores 234, 238, y 236. Como se muestra en la Figura 4, el sistema es calibrado al mover el conmutador 235 a la posición B la cual se considera la posición de operación normal en donde todos los canales de salida del descodificado 5.1 van directamente a las entradas del altavoz 5.1 vía el amplificador de potencia 236. El descodificador podría ser calibrado entonces de modo que los niveles del altavoz fueron apropiados para el sistema de teatro en casa. Como se mencionó de manera anticipada estos niveles de altavoces no pueden ser apropiados para observar durante la noche. Alternativamente, el conmutador 235 se puede mover a la posición A la cual permite que el usuario final seleccione una relación de VRA deseada y tenga mantenido automáticamente ajustando los niveles relativos del canal central con respecto a los niveles de los otros canales de audio. Durante los segmentos del programa de audio que no viola el VRA seleccionado por el usuario, los altavoces reproducen sonido de audio en el formato calibrado original. La característica de autonivelación sólo "contribuye" cuando el audio remanente llega a ser demasiado fuerte o la voz llega a ser demasiado suave. Durante estos momentos, el nivel de voz se puede elevar, el audio remanente se puede bajar, o una combinación de ambos. Esto se realiza por el procesador 232 de "VRA real de comprobación". El procesador 232 de VRA real de comprobación incluye todo el hardware y software necesarios y combinaciones de los mismos para preformar las funciones mencionadas anteriormente. Si el usuario final selecciona tener la característica de retención de auto VRA í.i i ,* A ?.?. fa.«á » - -. »J»» haciéndolo posible vía el conmutador 235, entonces los niveles del canal 5.1 se comparan en el bloque 232 de VRA real de comprobación. Si el nivel central promedio está en una relación suficiente a aquella de los otros canales (los 5 cuales podrían ser calibrados al revés para unir SPL predicho y acústico de ambiente en la locación de observación) entonces el nivel calibrado normal es reproducido a través del amplificador 236 vía el conmutador rápido 237. Si la relación se predice para ser objetable entonces el conmutador rápido 237 liberará el canal central a su ajuste de nivel automático y otros altavoces a su propio ajuste de nivel automático. De acuerdo con la presente invención: 1) estas características de VRA-HOLD automático se aplican directamente a la salida de canales de audio de 5.1; 2) el nivel central que es comúnmente ajustable en teatros en casa se puede ajustar a una relación específica con respecto a los canales remanentes y mantenida en la presencia de oscilaciones; 3) los niveles calibrados se reproducen cuando el VRA seleccionado por el usuario no es violado y son nivelados automáticamente cuando está, por lo cual se reproduce el audio de una manera más realista, pero que se adapta todavía a los cambios oscilantes por el cambio ^IÍ ßÍáUIÍIÍÉ¡¡¡tf?m?iÍ.?iá A A*Í??rét. - - ^ .._«.. , . , . .^_. ... . _ _. , *r »., rr. rrr. .~~J*L ./.» -*> - . »- „ .-«_.«, rt¡Jt Í .Lr temporalmente de la calibración; y 4) se permite que el usuario final seleccione el VRA automático (o manual) o el sistema calibrado, por lo cual se elimina la necesidad para la recalibración después del ajuste del canal central. También se señala que aunque los niveles pueden ser automáticamente ajustados, esta característica también puede ser invalidada para proporcionar un ajuste de ganancia manual simple como se muestra en la Figura 4.

Ajuste del Canal Central para Mezclado Descendente para Arreglos de Altavoces Sin Canal Central Como se mencionó anteriormente, muchos usuarios finales no tienen sistemas de teatro en casa. Sin embargo, los reproductores de DVD llegan a ser más populares y la televisión digital será transmitida en el futuro cercano. Estos formatos de audio digital requerirán que el usuario final tenga un descodificador del canal 5.1 para escuchar a cualquier audio transmitido, sin embargo, los mismos no pueden tener el lujo de comprar un sistema de teatro en casa totalmente ajustado y calibrado con canales de audio 5.1. Los siguientes aspectos de la presente invención toman ventaja del hecho que los productores serán canales 5.1 de liberación de audio para usuarios finales quienes pueden no tener capacidad de reproducción total, en tanto que todavía les permitirá ajustar el nivel de relación de voz a audio remanente VRA. Además, este aspecto de la presente invención es mejorado al permitir que el usuario final elija 5 las características que mantendrán o sostendrán aquella relación sin tener un sistema ajustable de altavoces múltiples . La FIG. 5 ilustra un diagrama conceptual de cómo una mezcla descendente podría ser implementada de acuerdo con una modalidad de la presente invención. Como se muestra, el mezclado descendente se realiza por una unidad de interconexión 241 que recibe una corriente de bitios canal 5.1 (en este caso Dolby Digital) desde el puerto de salida de un reproductor de DVD, u otro dispositivo similar. La señal luego se envía a un descodificador de audio de costumbre para el ajuste por el usuario del canal central 243 de acuerdo con un VRA seleccionado por el usuario. La señal de salida luego se envía a un estéreo de cuatro canales, o cualquier otro arreglo de altavoces 244 que no proporciona un altavoz de canal central. La FIG. 6 ilustra una modalidad alternativa de un diagrama conceptual de cómo una mezcla descendente se implementaría de acuerdo con la presente invención. El ^¡yßjjlí^^^Ki^t^c^ mezclado descendente para los sistemas de audio de teatro no en casa proporciona un método para que todos los usuarios se beneficien de un VRA seleccionable. El diálogo ajustado, se distribuye a los altavoces del canal no central de tal manera 5 como para dejar el posicionamiento espacial propuesto del programa de audio tan intacto como sea posible. Sin embargo, el nivel de diálogo simplemente será mayor. Como se muestra, un convertidor 252 D/A del N-canal convierte la señal digital desde el descodificador de audio de costumbre para el ajuste por el usuario del mezclado descendente 243 del canal central a una señal análoga. La señal análoga luego se envía a un dispositivo 253 reproductor de audio de N-altavoz. Existen directrices bien especificadas para el mezclado descendente de canales de audio 5.1 (Dolby Digital) a 4 canales (Dolby Pro-Logic) , a 2 canales (estereofónico) , o a 1 canal (mono) . Las combinaciones apropiadas de los canales 5.1 en las relaciones propias se seleccionarán para producir el posicionamiento espacial óptimo para cualquier sistema de reproducción que el consumidor tiene. El problema con los métodos existentes de mezclado descendente es que los mismos son transparentes a y no controlables por el usuario final. Esto puede presentar problemas con la inteligibilidad, dada la manera en la cual el intervalo dinámico se utiliza en las mezclas de audio del canal 5.1 más reciente. Como un ejemplo, considerar una película que se ha producido en los canales 5.1 que tiene un segmento donde el audio remanente obstruye el diálogo haciéndolo difícil de entender. Si el consumidor tiene 6 altavoces y un preamplificador ajustable de 6 canales, la inteligibilidad acústica se puede mejorar y mantener como se describió anteriormente. Sin embargo, el consumidor que tiene solamente reproducción estereofónica recibirá una versión de mezclado descendente de los canales 5.1 conforme al diagrama mostrado en la FIG. 7 (tomado de las Dolby Digi tal Broadcast Implementation Guidelines) . De hecho, el nivel del canal central se atenúa por una cantidad que se especifica en la corriente de bitios DD (ya sea -3, -4.5 ó -6 dB) . Esto reducirá adicionalmente la inteligibilidad en los segmentos que contienen audio remanente fuerte en los otros canales. Este aspecto de la presente invención evita el proceso de mezclado descendente colocando la ganancia ajustable en cada uno de los canales espaciales antes de que los mismos se mezclen descendentemente a los aparatos de reproducción del usuario. Í???.? M.én? A La FIG. 8 ilustra los niveles ajustables por el usuario final en cada uno de los canales 5.1 descodificados. Típicamente, el mezclado descendente del canal de efectos de baja frecuencia (LFE) no se da para prevenir la saturación de los componentes electrónicos y reduce la inteligibilidad. Sin embargo, con el ajuste por el usuario disponible antes que ocurra el mezclado descendente, es posible incluir el LFE en el mezclado descendente en una relación especificada por el usuario final. Permitiendo al usuario final ajustar el nivel de cada canal (ajustadores de nivel 276a-g) permite a los usuarios finales que tienen algún número de altavoces de reproducción para tomar ventaja del ajuste de nivel de voz previamente solo disponible para aquellas personas quienes tienen canales de reproducción 5.1. Como se muestra anteriormente, este aparato se puede usar de manera externa a cualquier descodificador 271 si es un descodificador independiente, dentro de un DVD, o dentro de una televisión, sin consideración del número de canales de reproducción en el sistema de teatro en casa. El usuario final debe simplemente mandar al descodificador 271 para suministrar una salida (5.1) y la "caja de ..fe . i.í. interconexión" realizará el ajuste y mezclado descendente, previamente realizado por el descodificador. La FIG. 9 ilustra esta caja de interconexión 282. Esto puede tomarse como su entrada, los canales 5.1 de audio descodificados desde cualquier descodificador, aplican la ganancia independiente a cada canal, y el mezclado descendente de acuerdo con el número de altavoces de reproducción que el consumidor tiene. Además, este aspecto de la presente invención se puede incorporar en cualquier descodificador colocando las ganancias independientes del canal ajustable por el usuario en cada uno de los canales 5.1 antes de que se realice algún mezclado descendente. Esto no puede mejorar la inteligibilidad del diálogo debido a que para cualquier situación de mezcla descendente, el canal central se mezcla en el otro canal que contiene el audio remanente. Se debería notar también que los mecanismos VRA-HOLD automáticos descritos previamente serán muy aplicables a esta modalidad. Una vez que se selecciona el VRA para ajustar cada ganancia del amplificador, la característica del VRA-HOLD debería mantener la relación previa al mezclado descendente. Puesto que la relación se selecciona mientras la recepción de cualquier aparato de reproducción de mezcla descendente, la graduación en los circuitos de la mezcla descendente se compensará por el ajuste del nivel central adicional aplicado por el consumidor. Así, ninguna compensación adicional es necesaria como un resultado del proceso de mezclado descendente por si mismo. También se notará que la filtración de banda del canal central antes del mezclado descendente y la amplificación ajustada por el usuario removerá los sonidos bajos en frecuencia que son acústicos y sonidos altos en frecuencia que son acústicos (200 Hz o 4000 Hz por ejemplo) y puede mejorar la inteligibilidad en algunos pasos. También es muy probable que el contenido removido para mejorar la inteligibilidad en el canal central, también exista en los canales izquierdo y derecho puesto que los mismos se proponen para la reproducción de música y efectos que podrían de otra manera estar fuera de la anchura de banda acústica en toda forma. Esto asegurará que ninguna pérdida en la fidelidad o sonidos de audio remanentes ocurra mientras también se mejora la inteligibilidad acústica. Este aspecto de la presente invención: 1) permite al consumidor tener cualquier número de altavoces para tomar ventaja del ajuste de relación VRA actualmente disponible para aquellos que tienen altavoces de reproducción 5.1; 2) permite a los mismo consumidores ajustar un nivel deseado en el canal central con respecto al audio remanente en los otros canales, y tener que permanecer con la misma relación para transientes a través de la característica VRA-HOLD; y 3) se puede aplicar a cualquier salida de cualquier descodificador de canal 5.1 sin modificar la corriente de bitios o incrementar la anchura de banda de transmisión requerida, es decir, es independiente del hardware.

Grabación de Tres Canales Para Reproducción de VRA Para proporcionar ejemplos de las ideas descritas en esta, es necesario elegir cierto medio en ciertas aplicaciones del medio. Sin embargo, los ejemplos específicos no evitan otras formas de medios o técnicas de grabación ligeramente modificadas desde el alcance de esta invención. Además, mientras el punto central de esta invención se discute en términos del audio de tres canales convertido a audio de dos canales, no está fuera del alcance de esta invención para imaginar grabaciones de canales múltiples producidas de tal manera que se propone una mezcla descendente específica para el propósito del ajuste de VRA. El objetivo del mecanismo de ajuste de VRA se proporciona al usuario final con la capacidad para controlar de manera separada los niveles de la voz o diálogo y audio remanente para los propósitos de mejorar la inteligibilidad. La característica anterior de la invención descrita anteriormente, toma ventaja del hecho que muchas producciones 5 de canales múltiples colocan la mayoría del diálogo en el canal central. Además, muchos usuarios no tienen el acceso al ajuste necesitado para elevar el nivel del canal central en tales programas de canales múltiples. Por lo tanto como se estableció anteriormente, explícitamente nada diferente se requiera del productor para proporcionar al usuario final con una capacidad de ajuste de VRA limitada. Como se describe posteriormente, un método de producción se describe, el cual asegura un mecanismo de ajuste de VRA más efectivo usando los componentes discutidos primero. Además, usando el mecanismo el mismo hardware exacto como se describió anteriormente, además, muchas grabaciones viejas de audio se pueden remasterizar usando esta nueva técnica de producción, permitiendo así a los usuarios los medios con los cuales ajustar el VRA usando el hardware descrito anteriormente para las reproducciones del canal 5.1 actual. El primer ejemplo que se usa para describir los detalles de este método de producción es la música popular típica. La grabación de cinta original típicamente contiene una variedad de pistas de audio las cuales pueden incluir tambores, guitarra, graves y voz. Estas pistas son, de paso, sincronizadas en un medio de grabación sencillo así su reproducción constituirá una canción completa. Cuando se producen los discos actuales CDs (o DVD-audio) , estas pistas se mezclan en un programa estereofónico en la discreción del productor, con la voz del mezclado con la música remanente. Con la práctica de producción estereofónica moderna, es imposible para el usuario final tener cualquier control sobre la relación de voz a audio remanente. Sin embargo, si el productor fuera a colocar la mezcla de música (sin voz) como se desea espacialmente en los canales izquierdo y derecho mientras se coloca la voz en el canal central, los "programas" separados se podrían ajustar independientemente de la reproducción por el usuario final. (Esta producción se puede realizar usando el DVD-audio estándar que incluye programación de canales múltiples) . Ahora, si el DVD se produjo de esta manera (con la música en la izquierda y derecha y la voz en el centro) , este se puede reproducir por el dispositivo de mezcla descendente discutido anteriormente desde el canal 5.1 a canales 2, con el ajuste en el canal central previo al mezclado descendente. Esta modalidad particular se muestra en la FIG 9.

La FIG. 10 ilustra el proceso para colocar la música en los canales izquierdo y derecho y la voz en el canal central con los ajustes en el canal central previo a la mezcla descendente. El proceso comienza con la creación de un programa de audio de cinta original 90 que consiste de la voz y audio remanente. Las señales del programa de audio de cinta original 90 se mezclan y se condicionan igualmente en los canales izquierdo y derecho como se muestra en el bloque 91. Un medio de audio de tres canales 92 se crea de modo que los programas de audio izquierdo y derecho residen en las posiciones izquierda y derecha del medio de audio, mientras que la voz reside en el canal central del medio de audio. El medio se produce con el nivel de voz a un nivel de reproducción estándar con respecto al nivel de audio total del resto del programa. Esto asegurará que en la reproducción, el usuario final puede experimentar la mezcla estándar ajustando los niveles de voz y audio remanente al mismo valor. El dispositivo de reproducción de audio 93 suministra todos los canales 5.1 de audio al nivel del hardware de ajuste/mezcla descendente 94 que se describe en la invención previa. La mezcla descendente se puede ajustar para suministrar un programa estereofónico desde el programa de audio del canal 5.1. Puesto que la producción de más música no requiere efectos de baja frecuencia o borde, la mezcla descendente es simplemente combinar el nivel de voz ajustado con los programas de música izquierdo y derecho para la reproducción de VRA. Este método de producción de audio de canales múltiples depende del hecho que muchos, si no la mayoría, de los usuarios finales estarán mezclando descendentemente a unos pocos números de canales que es más apropiado para el tipo de programación. La música es un ejemplo excelente de esto puesto que la imaginación estereofónica típicamente es suficiente para las realizaciones de audio puras. Este método simplemente toma ventaja del espacio extra que está disponible con un medio DVD de mayor capacidad para colocar una pista de diálogo adecuada para el mezclado descendente. Esta modalidad no requiere algunos cambios a los componentes del sistema mencionados anteriormente para el ajuste del nivel del canal central sino utiliza un componente del sistema para la capacidad de VRA. La FIG. 11 ilustra una modalidad alternativa de la modalidad descrita en la FIG. 10 y de acuerdo con la presente invención. Puede ser deseable para los productores producir (y a los usuarios finales como experiencia) voz que es espacialmente colocada. Para mantener la voz y el audio remanente separados entre sí de todas las vías al usuario y para tener la capacidad de posicionamiento espacial, se deben transmitir cuatro canales de audio al usuario final (para la 5 reproducción espacial completa) . Estos canales de audio incluyen audio izquierdo, audio derecho, voz izquierda y voz derecha. Como se muestra en la FIG. 10, una cinta original tiene toda la música y grabación de posicionamiento espacial completa. Un medio de grabación de canales múltiples se creó, tal como audio DVD 5.1, de modo que el audio izquierdo (sin la voz) está en un canal único (tal como L) , el audio derecho está en un R, la voz izquierda está en el canal de borde izquierdo y la voz derecha está en el canal de borde derecho. El uso de los canales de borde para la voz pura es de manera pura arbitraria y cualquiera de los canales separados se pueden usar para cualquiera de las señales anteriores sin la pérdida de la generalidad. Durante la producción, y a través de un procedimiento de estandarización, la colocación de cada uno de los componentes del audio se decidirá para el tipo de medio; se asume que la voz izquierda y derecha están en el borde izquierdo y derecho mientras que el audio izquierdo y derecho están en los canales frontales izquierdo y derecho. La FIG. 11 ilustra la mezcla descendente especial requerida y como difiere de la FIG. 10. Existe una ganancia de audio que se suministra tanto a las señales de audio izquierda y derecha y una ganancia de voz que se aplica tanto a las señales de voz izquierda como derecha. Esto permite la capacidad de ajuste de VRA requerida. El programa izquierdo luego se crea combinando la voz izquierda y el audio izquierdo mientras que el programa derecho se crea combinando el audio derecho y la voz derecha como se muestra. Como una consecuencia de lo anterior, un programa estereofónico puro se suministrará mientras que un usuario final aún será capaz de ajustar la relación de VRA. Las modalidades de la presente invención describen un método para grabar usando canales múltiples donde la voz se debería colocar para asegurar que las técnicas de mezclado descendente son compatibles con los componentes del sistema de ajuste del canal central. Se sugiere que la voz se coloque en el canal central para el mezclado descendente a la reproducción estereofónica. Esto no evita el uso de otros canales para el diálogo o para el audio remanente. Se requiere un ajuste similar y técnica de mezclado descendente para recrear el programa total con el posicionamiento espacial deseado, sin consideración de los canales en los cuales los mismos se grabaron originalmente. Sin embargo, si los componentes del sistema no se designan para exceptuar el formato predeterminado, la mezcla descendente será incompatible con la producción y el resultado final será impredecible. Asegurando que la producción se realiza usando el canal central como un canal de diálogo dedicado, y los usuarios finales pueden ajustar el VRA por cualquier escenario de mezcla descendente usando componentes del sistema similares. El ajuste de VRA para un segmento de voz de canales múltiples (requiriendo la reproducción en varios canales) puede ocurrir todavía para cualquier formato de audio de canales múltiples ya que se produce una voz en el DVD separadamente del audio remanente. Esto requiere la producción de canales múltiples de tanto la voz como el audio remanente y se limitará por el número de canales del formato de audio que se permitirá usar.

Se hace constar que con relación a esta fecha el mejor método conocido por la solicitante para llevar a la práctica la citada invención es el que resulta claro de la descripción de la invención.

Claims

REIVINDICACIONES Habiéndose descrito la invención como antecede se reclama como propiedad lo contenido en las siguientes reivindicaciones : 5 1. Un método para descodificar una señal de audio caracterizado porque comprende: recibir una señal de audio digital que tiene una pluralidad de canales definidos en esta, en donde una de la 10 pluralidad de canales es un canal central y al menos una de la otra pluralidad de canales es un canal de audio remanente; comparar el canal central con al menos una de la otra pluralidad de canales para determinar una relación del canal central a la otra pluralidad de canales y; 15 ajustar automáticamente el canal central y al menos una de la pluralidad de otros canales cuando no se encuentra un valor predeterminado para la relación.
2. El método de conformidad con la reivindicación 1, caracterizado porque comprende adicionalmente el paso de 20 ajuste del canal central y al menos una de la pluralidad de otros canales cuando el valor de la relación excede el valor predeterminado .
3. El método de conformidad con la reivindicación 1, caracterizado porque comprende adicionalmente el paso de ajuste del canal central y al menos una de la pluralidad de otros canales cuando el valor de la relación es inferior al valor predeterminado.
4. El método de conformidad con la reivindicación 1, caracterizado porque el canal central es un un canal de voz en su mayor parte.
5. El método de conformidad con la reivindicación 1, caracterizado porque el canal central es un canal de voz.
6. El método de conformidad con la reivindicación 1, caracterizado porque al menos una de la otra pluralidad de canales comprende un canal sin voz.
7. Un sistema de audio para optimizar una reproducción de un programa de audio para los usuarios finales caracterizado porque comprende: un receptor que recibe una señal de audio codificada, la señal de audio codificada incluye una señal de audio preferida y una señal de audio remanente; un descodificador acoplado al receptor y que descodifica la señal de audio codificada para reconstruir una señal de audio preferida y una señal de audio remanente; i ií.-.Ht. A ?*A I I liilliÉiifi i! un primer amplificador ajustable por el usuario acoplado al descodificador y que ajusta la señal de audio preferida; un segundo amplificador ajustable por el usuario acoplado al descodificador y que ajusta la señal de audio remanente; un procesador conectado al descodificador que compara una relación de la señal de audio preferida a la señal de audio remanente y produce un valor; y un controlador para ajustar automáticamente la relación de la señal de audio preferido a la señal de audio remanente cuando un valor predeterminado de la relación no se encuentra.
8. El sistema de conformidad con la reivindicación 7, caracterizado porque la señal de audio preferida se ajusta cuando la relación excede el valor predeterminado.
9. El sistema de conformidad con la reivindicación 7, caracterizado porque la señal de audio preferida se ajusta cuando la relación es inferior al valor predeterminado.
10. El sistema de conformidad con la reivindicación 7, caracterizado porque la señal de audio remanente se ajusta cuando la relación excede el valor predeterminado. l,.i .¿.r?. ? ? ..
11. El sistema de conformidad con la reivindicación 7, caracterizado porque la señal de audio remanente se ajusta cuando la relación es inferior al valor predeterminado.
12. El sistema de conformidad con la reivindicación 1, caracterizado porque la señal de audio preferida incluye una señal de voz en su mayor parte.
13. El sistema de conformidad con la reivindicación 1, caracterizado porque la señal de audio preferida incluye una señal de voz.
14. El sistema de conformidad con la reivindicación 1, caracterizado porque la señal de audio remanente incluye una señal sin voz.