MXPA01012991A - Mezcla descendente del canal central interactivo de voz a audio remanente (vra). - Google Patents

Mezcla descendente del canal central interactivo de voz a audio remanente (vra).

Info

Publication number
MXPA01012991A
MXPA01012991A MXPA01012991A MXPA01012991A MXPA01012991A MX PA01012991 A MXPA01012991 A MX PA01012991A MX PA01012991 A MXPA01012991 A MX PA01012991A MX PA01012991 A MXPA01012991 A MX PA01012991A MX PA01012991 A MXPA01012991 A MX PA01012991A
Authority
MX
Mexico
Prior art keywords
audio
audio signal
channels
voice
channel
Prior art date
Application number
MXPA01012991A
Other languages
English (en)
Inventor
Michael A Vaudrey
Original Assignee
Hearing Enhancement Co Llc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hearing Enhancement Co Llc filed Critical Hearing Enhancement Co Llc
Publication of MXPA01012991A publication Critical patent/MXPA01012991A/es

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R25/00Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
    • H04R25/40Arrangements for obtaining a desired directivity characteristic
    • H04R25/407Circuits for combining signals of a plurality of transducers

Landscapes

  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Stereophonic System (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

La presente invencion se refiere a un metodo para descodificar una senal de audio que incluye la recepcion de una senal de audio digital que tiene una pluralidad de canales (221- 226 o CENTRAL, TODOS LOS OTROS ALTAVOCES) definidos en esta, en donde una de la pluralidad de canales es un canal central (C o CENTRAL) y al menos una de la otra pluralidad de canales es un canal de audio remanente; comparacion del canal central (C o CENTRAL) con al menos una de la otra pluralidad de canales (221-224 o TODOS LOS OTROS ALTAVOCES); y el ajuste automaticamente (232, 233) del canal central y al menos una de la pluralidad de otros canales cuando no se encuentra un valor predeterminado para la relacion.

Description

MEZCLA DESCENDENTE DEL CANAL CENTRAL INTERACTIVO DE VOZ A AUDIO REMANENTE (VRA) Campo de la Invención Las modalidades de la presente invención generalmente se refieren a un método y aparato para procesar señales de audio, y en forma más particular, a un método y aparato para procesar las señales de audio para mejorar la experiencia de recepción para un amplio rango de usuarios finales.
Antecedentes de la Invención Los usuarios finales con equipo costoso o de "alta terminal" que incluyen amplificadores de canales múltiples y sistemas de altavoces múltiples, actualmente tienen una capacidad limitada para ajustar el volumen en la señal del canal central de un sistema de audio de canales múltiples independientemente de las señales de audio en los otros canales remanentes. Puesto que muchos cines tienen la mayoría del diálogo en el canal central y otros efectos de sonido localizados en otros canales, esta capacidad de ajuste limitada permite al usuario final alcanzar la amplitud de la mayoría de canales de diálogo de modo que es más inteligible REF. : 135044 ¡.?.? durante secciones con efectos de sonido fuerte. Actualmente, este ajuste limitado tiene deficiencias importantes. Primero, es una capacidad de ajuste que está disponible únicamente para los usuarios finales que tienen un reproductor de DVD y un sistema de altavoces de canales múltiples tal como un sistema de teatro en casa de seis altavoces que permite ajustar el nivel de volumen de todos los altavoces independientemente. j Además, es un ajuste que necesitará ser modificado continuamente durante la perturbación transitoria en una señal de audio preferida (por ejemplo, señal de diálogo o voz) y señal de audio remanente (todos los otros canales) . La deficiencia final es que los ajustes de voz a audio remanente (por sus siglas en inglés, VRA) que fueron aceptables durante un segmento de audio del programa del cine no pueden ser buenos para otro segmento de audio si el nivel de audio remanente se incrementa demasiado o el nivel del diálogo se reduce demasiado. Es un hecho que una gran mayoría de usuarios finales no tiene y ni tendrá por muchos años un teatro en casa que permita esta capacidad de ajuste, es decir, descodificador Dolby Digital, preamplificador variable de seis canales y sistema de múltiples altavoces. Además, los usuarios finales no tienen la capacidad para asegurar que la AiM¿'',¡J..JlA.a i j 4U?U* *... r r. J-*. »- , * -..-.....«».. . _. . *~.Mt~r? - -* -,. . > „i«. jj j i j . relación de VRA seleccionada al comienzo del programa permanecerá igual para el programa completo. La FIG 3 ilustra el procedimiento de posicionamiento espacial propuesto de un sistema de teatro en casa común. Aunque no existen reglas escritas para la producción de audio en los canales espaciales 5.1, existen industrias estándares. Como se usa aquí, el término 'canales espaciales se refiere a la ubicación física de un dispositivo de salida (por ejemplo, altavoces) y cómo el sonido desde el dispositivo de salida se reparte al usuario final. Una de estas normas es localizar la mayoría del diálogo en el canal central 226. De manera similar otros efectos de sonido que requieren el posicionamiento espacial se colocarán en cualquiera de los otro cuatro altavoces marcados L 221, R 222, Ls, 223, y Rs 224 para izquierda, derecha, borde izquierdo y borde derecho. Además, para evitar el daño al centro de amplitud de altavoces, los efectos de baja frecuencia (LFE) se colocan en el canal 0.1 dirigido hacia un altavoz secundario de bajas frecuencias 225. La compresión de audio digital permite al productor proveer al usuario final con un intervalo dinámico mayor para el audio que no fue posible a través de la transmisión análoga. Este intervalo dinámico mayor origina más diálogo al sonido demasiado bajo en la presencia de efectos de sonido muy fuerte. El siguiente ejemplo proporciona una explicación. Se supone que una transmisión análoga (o grabación) tiene la capacidad para transmitir amplitudes de intervalo dinámico 5 hasta 95 dB y el diálogo típicamente se registra a 80 dB. Los segmentos fuertes del audio remanente pueden opacar el diálogo cuando este audio remanente alcanza el límite superior mientras alguien está parlando. Sin embargo, esta situación se agrava cuando la compresión de audio digital permite un intervalo dinámico hasta 105 dB. Claramente, el diálogo permanecerá al mismo nivel (80 dB) con respecto a otros sonidos, solamente ahora el audio remanente fuerte puede ser reproducido de manera más realista en términos de su amplitud. Los usuarios lamentan que los niveles de diálogo que se han registrado demasiado bajos en el DVD son muy comunes. De hecho, el diálogo IS al nivel adecuado es más apropiado y realista que el que existe para los registros análogos con intervalo dinámico limitado. Aún para los consumidores quienes actualmente tienen sistemas de teatro en casa apropiadamente calibrados, el diálogo es frecuentemente encubierto por las secciones de audio remanentes fuertes en muchas películas DVD producidas hoy en día. Un pequeño grupo de consumidores son capaces de encontrar algunos mejoramientos en la inteligibilidad incrementando el volumen del canal central y/o disminuyendo el volumen de todos los otros canales. Sin embargo, este ajuste establecido solamente es aceptable para ciertos 5 pasajes de audio e interrumpe los niveles de la calibración adecuada. Los niveles del altavoz típicamente se calibran para producir cierto nivel de presión de sonido (SPL)s en la ubicación del enfoque. Esta calibración adecuada asegura que el enfoque sea tal realista como sea posible. 10 Infortunadamente esto significa que los sonidos fuertes se reproducen muy fuerte. Durante el enfoque de media noche, esto no puede ser deseable. Sin embargo, cualquier ajuste de los niveles de los altavoces interrumpe la calibración.
BREVE DESCRIPCIÓN DE LA INVENCIÓN Un método para descodificar una señal de audio que incluye la recepción de una señal de audio digital que tiene una pluralidad de canales definidos en esta, en donde uno de la pluralidad de canales es un canal central y al menos uno de la otra de dicha pluralidad de canales es un canal de audio remanente; comparando el canal central con al menos uno de la otra pluralidad de canales para determinar una relación del canal central a la otra de la pluralidad de canales; y ajustar automáticamente el canal central y al menos uno de la pluralidad de otros canales cuando no se encuentra un valor predeterminado para la relación.
BREVE DESCRIPCIÓN DE LOS DIBUJOS La FIG. 1 ilustra una propuesta general de acuerdo con la presente invención para la separación pertinente de la información de voz desde el audio de fondo general en un programa transmitido o grabado. 10 La FIG. 2 ilustra una modalidad ejemplar de acuerdo con la presente invención para la recepción y reproducción de las señales del programa codificado. La FIG. 3 ilustra el procedimiento de posicionamiento espacial propuesto de un sistema de teatro en 15 casa común. La FIG. 4 ilustra un sistema donde el usuario final tiene la opción para seleccionar la característica de nivelación de voz a audio remanente (VRA) automático o la característica del audio calibrado de acuerdo con la presente invención. La FIG. 5 ilustra una modalidad de un diagrama conceptual de cómo una mezcla descendente se podrá implementar de acuerdo con la presente invención.
La FIG. 6 ilustra una modalidad alternativa de un diagrama conceptual de cómo una mezcla descendente se podrá implementar de acuerdo con la presente invención. La FIG. 7 representa un codificador de la técnica previa de Dolby Digital y codificador con coeficientes de mezcla descendente estandarizados. La FIG. 8 ilustra los niveles ajustables por el usuario final en cada uno de los canales 5.1 codificados de acuerdo con la presente invención. La FIG. 9 ilustra una caja de interconexión representada en la FIG. 8, de acuerdo con una modalidad de la presente invención. La FIG. 10 ilustra el proceso para la colocación de la música en los canales izquierdo y derecho y la voz en el canal central con ajustes en el canal central previo al mezclado descendente. La FIG. 11 ilustra una modalidad alternativa del sistema ilustrado en la FIG. 10 de acuerdo con los principios de la presente invención.
DESCRIPCIÓN DETALLADA La presente invención describe un método y aparato para ajustar el nivel del canal central de un programa de ^ audio de canales múltiples, con respecto a los canales remanentes del programa de audio de canales múltiples para la capacidad de voz a audio remanente preferida. Además, la presente invención describe un método y 5 aparato para volver a grabar cintas originales viejas y grabar cintas originales nuevas de medios de audio de tal manera que permite al usuario final ajustar la voz a audio remanente preferido. Como se usa aquí, el término * cinta original" se refiere a los medios de audio generados en el primer paso completo en el proceso de grabación de audio. Además, el término "usuario final" se refiere a un consumidor u oyente de una transmisión o grabación de sonido o una persona o personas que reciben la señal de audio en los medios de audio que se distribuyen por grabado o transmisión.
Adicionalmente, el término w audio preferido" se refiere al componente de vos, información de voz o componente de voz primario de la señal de audio y el término * audio remanente" se refiere al fondo, musical, o componente sin voz de la señal de audio. 20 La invención descrita aquí no se limita a cualquier audio particular CODEC (compresión/descompresión) estándar y se puede usar con cualquier audio CODEC tal como *Digital *áÍÍ¡M?É ¡ BSk¡Ékl¡Ét& .t -Í .? . di? ¡l_;líí .. ¿ i .~rr„ r r. L....... .-ir-i». -: -. -- -. • . -. ... ^ ^ .... . .. ,:. .!, i - - ___ .. ... ... »»- .-, .. .^ ». i .i- .í- ^ Theater Sound" (DTS), 'Dolby Digital", 'Sony Dynamic Digital Sound" (SDDS), "Pulse Code Modulation" (PCM), etc.
Importancia de la Relación de Audio Preferido a Audio Remanente La presente invención comienza con la realización que el intervalo preferencial de la recepción de una relación de una señal de audio preferida con relación a cualquier audio remanente es de preferencia más grande, y ciertamente más grande que lo siempre esperado. Este descubrimiento significativo es el resultado de una prueba de muestras pequeñas de la población con respecto a sus preferencias de la relación del nivel de señal de audio preferido a un nivel de señal de todo el audio remanente.
Ajuste Específico del Intervalo Deseado para Oyentes Normales o con Problemas de Audición Búsquedas muy directas se han conducido en el área del entendimiento de cómo los usuarios normales y con problemas de audición perjudicado perciben la relación entre el diálogo y el audio remanente para diferentes tipos de programación de audio. Se ha encontrado que la población varía a pliamente en el intervalo de ajuste deseado entre la voz y el aµdio remanente J3e han conducido dos experimentos en una muestra aleatoria de la población incluyendo niños de escuela primaria, niños de escuela intermedia, ciudadanos de edad madura y personas ancianas. Un total de 71 personas se sometieron a prueba. La prueba consistió de solicitar al usuario para ajustar el nivel de voz y el nivel de audio remanente para un juego de fútbol (donde el audio remanente fue el ruido de la multitud) y una canción popular (donde el audio remanente fue la música) . Una métrica musical llamada la relacipn de VRA (voz a audio remanente) se formó dividiendo el valor lineal del volumen del diálogo o voz por el valor pineal del volumen del audio remanente para cada selección. "parias cosas se hicieron claras como un resultado de esta pr?eba. Primero, ninguna de dos personas prefieren la relación i «fiéntica para voz y audio remanente para tanto los medios dep|orti:vos como la música. Esto es muy importante 20 puesto que la población tiene confianza en los procedimientos para proporcionar un VRA (el cual no se puede ajustar por el consumidor que gustará a cada uno. Esto no puede ocurrir claramente, dado los resultados de estas pruebas. Segundo, l É i? ? iMi *aa-tt^^a^ VRA que varían ampliamente no se ha reportado o discutido en la literatura o técnica previa. En estas pruebas, un grupo de hombres de mayor edad se seleccionó y solicitó hacer un ajuste (la prueba fue realizada más tarde en un grupo de estudiantes) entre un ruido de fondo determinado y la voz de un locutor, en el cual solamente el último podrá ser variado y el anterior se ajusta a 6. Los resultados con el grupo de mayor edad fueron como sigue: Tabla I Individuo Ajuste 1 7.50 2 4.50 3 4.00 4 7.50 5 3.00 6 7.00 7 6.50 8 7.75 9 5.50 10 7.00 Para ilustrar adicionalmente el hecho de que personas de todas las edades tienen diferentes necesidades y preferencias del oído, un grupo de 21 estudiantes de universidad se seleccionó para escuchar una mezcla de voz y 5 fondo y para seleccionar, haciendo un ajuste al nivel de voz, la relación de la voz al fondo. El ruido de fondo, en este caso ruido de multitud en un juego de fútbol, se determinó a un ajuste de seis (6.00) y a los estudiantes se les dejó ajustar el volumen de la voz del locutor minuto a minuto lo cual se ha registrado separadamente y fue pura voz o en su mayor parte pura voz. En otras palabras, se seleccionaron los estudiantes para hacer la misma prueba que hizo el grupo de hombres de mayor edad. Todos los estudiantes estuvieron en su adolescencia final o cercanos a los veinte. Los resultados fueron como sigue: Tabla II Estudiante us te de Vo z 1 4 , . 75 20 2 3 . . 75 3 4 , . 25 4 4 , . 50 5 5 , . 20 ^ lmi u****».*,.^ í ? lí ?^ t^un ** Continuación de la Tabla II Estudiante Ajuste de Voz 6 5.72 7 4.25 5 8 6.70 9 3.25 10 6.00 11 5.00 12 5.25 10 13 3.00 14 4.25 15 3.25 16 3.00 17 6.00 15 18 2.00 19 4.00 20 5.50 21 6.00 Las edades del grupo de mayor edad (como se ve en la Tabla I) variaron desde 36 a 59 con el predominio de los individuos que están en el grupo de 40 ó 50 años de edad. Como se indica por los resultados de la prueba, el ajuste promedio tiende a ser razonablemente alto indicando menos pérdida de la audición a través del tablero. El intervalo de nuevo varió desde 3.00 a 7.75, una amplitud de 4.75 la cual confirmó las decisiones del intervalo de variación en la relación de voz a fondo de recepción preferida de la persona o cualquier señal preferida a audio remanente (PSRA) . El período total para el ajuste del volumen para ambos grupos de sujetos varió desde 2.0 a 7.75. Estos niveles representan los valores actuales en el mecanismo de ajuste del volumen usado para realizar este experimento. Los mismos proporcionan una indicación del intervalo de la señal a valores de ruido (cuando se compara con el nivel de "ruido" 6.0) que pueden ser deseables de usuarios diferentes. Para obtener un mejor entendimiento de cómo esto se relaciona a variaciones menos fuertes relativas elegidas por usuarios diferentes, se considera que la variación del control de volumen no lineal desde 2.0 a 7.75 representa un incremento de 20 dB o diez (10) veces. Así, para aún esta pequeña muestra de la población y tipo único de programación de audio se encontró que los diferentes oyentes prefieren quitar drásticamente los diferentes niveles de "señal preferida" con respecto a "audio remanente". Esta preferencia se corta a través de los grupos de edad que muestran que es consistente con la preferencia individual y capacidades de audición básica, lo cual es hasta ahora totalmente inesperado. Como los resultados de prueba muestran, el intervalo de los estudiantes (como se ve en la Tabla II) sin audición se debilita originado por la edad seleccionada que varía considerablemente desde un ajuste inferior de 2.00 a uno alto de 6.70, una amplitud de 4.70 o casi la mitad del intervalo total desde 1 a 10.. La prueba es ilustrativa de cómo el "tamaño único ajusta toda" la mentalidad de la mayoría de señales de audio transmitidas y grabadas falla muy corta que da al oyente individual la capacidad de ajustar la mezcla para seguir su o sus preferencias y necesidades de audición. De nuevo, los estudiantes tienen una amplia extensión en sus ajustes cuando el grupo de más edad demuestra las diferencias individuales en preferencias y necesidades de audición. Un resultado de esta prueba es que las preferencias de audición se disparan ampliamente. La prueba adicional ha confirmado este resultado sobre un grupo de muestra más grande. Además, los resultados varían dependiendo del tipo de audio. Por ejemplo, cuando la fuente de audio fue música, la relación de voz a audio remanente varía de aproximadamente cero a aproximadamente (-** 10, mientras que cuando la fuente de audio fue programación de deportes, la misma relación varía entre aproximadamente cero y en forma aproximada 20. Además, la desviación estándar se incrementa por un factor de casi tres, en tanto que el promedio se incrementa por más de dos veces aquel de la música. r El resultado final de la prueba anterior es que si uno selecciona una relación de audio a audio remanente preferida y fija que siempre, uno ha creado más probablemente un programa de audio que es menor que el deseado para una fracción significante de la población. Y, como se estableció anteriormente, la relación óptima puede ser tanto una función variante de periodo a largo plazo como de corto plazo. En consecuencia, el control completo sobre esta relación de audio preferido a audio remanente es deseable para satisfacer las necesidades de recepción de oyentes "normales" o sin daño de audición. Además, al proporcionar al usuario final con el control final sobre esta relación permite que el usuario final optimice su o sus experiencias de recepción. El ajuste independiente del usuario final de la señal de audio preferida y la señal de audio remanente será la manifestación evidente de un aspecto de la presente invención. Para ilustrar los detalles de la presente invención, se considera la aplicación en donde la señal de audio preferida es la información de voz relevante.
Creación de la Señal de Audio Preferida y la Señal de Audio 5 Remanente La Figura 1 ilustra un alcance general para separar la información de voz relevante de audio de fondo general en un programa grabado o transmitido. Primero necesitará ser una determinación hecha por el director de programación como para la definición de voz relevante. Un actor, grupo de actores, o comentaristas se deben identificar como los altavoces relevantes. Una vez que los altavoces relevantes se identifican, sus voces serán recogidas por el micrófono de voz 1. El micrófono de voz 1 necesitará ser o un micrófono de conversación cerrado (en el caso de comentaristas) o un micrófono de escopeta altamente direccional usado en la grabación de sonido. Además de ser altamente direccional, estos micrófonos 1 necesitarán ser banda de voz limitada, preferiblemente de 200-5000 Hz. La combinación de direccionalidad y filtración del paso de banda minimiza el ruido de fondo acústicamente acoplado a la información de voz relevante en el registro. En el caso de ciertos tipos de programación, la necesidad de prevenir el acoplamiento acústico se puede evitar registrando la voz relevante de diálogo fuera de línea y mezcla del diálogo en donde sea apropiado con la porción de vídeo del programa. Los micrófonos de fondo 2 deberán ser totalmente de banda ancha para proporcionar la calidad de audio total de información de fondo, tal como música. Una cámara 3 se usará para proporcionar la porción de vídeo del programa. Las señales de audio (voz y voz relevante) se codificarán con la señal de vídeo en el codificador 4. En general, la señal de audio se separa usualmente de la señal de vídeo simplemente modulándola con una frecuencia portadora diferente. Puesto que la mayoría de las transmisiones son ahora en estéreo, una forma para codificar la información de voz relevante con el fondo es para multiplicar la información de voz relevante en los canales estereofónicos separados en mucho la misma forma de canales de frente izquierda y frente derecha se adicionan a dos canales estereofónicos para producir una grabación de disco cuadrafónico. Aunque esto deberá crear la necesidad de anchura de banda transmitida adicional, para el medio registrado esto no deberá presentar un problema, mientras que el circuito de audio en el reproductor de cinta o disco de vídeo se designa para desmodular la información de voz relevante . Una vez que las señales se codifican, por cualquier medio apropiado considerado, las señales codificadas se envían para transmisión por el sistema de transmisión 5 sobre la antena 13, o se graban en la cinta o disco por el sistema de grabación 6. En el caso de información de audio y vídeo grabada, la información de fondo y de voz se podría colocar simplemente en las pistas de grabación separadas.
Recepción y Desmodulación de la Señal de Audio Preferida y el Audio Remanente La Figura 2 ilustra una modalidad ejemplar para recibir y reproducir las señales del programa codificado. Un sistema de recepción 7 desmodula la principal frecuencia portadora de las señales de audio/vídeo codificadas, en el caso de información transmitida. En el caso de medios de grabación 14, las cabezas de un VCR o el lector láser de un reproductor de CD 8 podrían producir las señales de audio/vídeo codificadas. En cualquier caso, estas señales se podrían enviar a un sistema de descodificación 9. El descodificador 9 podría separar las señales en vídeo, audio de voz, y audio de fondo usando técnicas de descodificación estándar tales como la detección de envolvente en combinación con la desmodulacíón de división de tiempo o frecuencia. La señal de audio de fondo se envía a un amplificador 10 de ganancia variable 5 separada, que el oyente puede ajustar a su o sus preferencias. La señal de voz se envía a un amplificador de ganancia variable 11, que se puede ajustar por el oyente a su o sus necesidades particulares, como se describió anteriormente . 10 Las dos señales ajustadas se suman por un amplificador sumador 12 de ganancia unitaria para producir la salida de audio final. Alternativamente, las dos señales ajustadas se suman por el amplificador sumador 12 de ganancia unitaria y se ajustan además por amplificador de ganancia variable 15 para producir la salida de audio final. De esta manera el oyente puede ajustar voz relevante a niveles de fondo para optimizar el programa de audio a su o sus requerimientos de recepción única en el periodo de reproducción del programa de audio. Cuando cada periodo el mismo oyente reproduce el mismo audio, la relación de ajuste puede necesitar cambiar debido a cambios en la audición del oyente. El ajuste permanece infinitamente ajustable para acomodar esta flexibilidad.
Característica de Ajuste de VRA automático para el canal central Alguna ganancia del nivel de canal central o reducción de los niveles de altavoces remanentes proporciona mejoras en inteligibilidad del habla para aquellos usuarios finales que tienen un sistema de audio de canales múltiples tales como un sistema de audio de canal 5.1 que tiene aquella capacidad de ajuste. Nótese que todos los consumidores no tienen un sistema, y la presente invención permitirá a todos los consumidores tener esta capacidad. La Figura 4 ilustra un sistema de donde el usuario final tiene la opción de seleccionar la característica de nivelación de VRA automática o la característica de audio calibrado. El sistema incluye un descodificador calibrado 231, conmutadores 235 y 237, un procesador 232 y una pluralidad de amplificadores 234, 238, y 236. Como se muestra en la Figura 4, el sistema es calibrado al mover el conmutador 235 a la posición B la cual se considera la posición de operación normal en donde todos los canales de salida del descodificado 5.1 van directamente a las entradas del altavoz 5.1 vía el amplificador de potencia 236. El descodificador podría ser calibrado entonces de modo que los niveles del altavoz fueron apropiados para el sistema de teatro en casa. Como se mencionó de manera anticipada estos niveles de altavoces no pueden ser apropiados para observar durante la noche. Alternativamente, el conmutador 235 se puede mover a la posición A la cual permite que el usuario final seleccione una relación de VRA deseada y tenga mantenido automáticamente ajustando los niveles relativos del canal central con respecto a los niveles de los otros canales de audio. Durante los segmentos del programa de audio que no viola el VRA seleccionado por el usuario, los altavoces reproducen sonido de audio en el formato calibrado original. La característica de autonivelación sólo "contribuye" cuando el audio remanente llega a ser demasiado fuerte o la voz llega a ser demasiado suave. Durante estos momentos, el nivel de voz se puede elevar, el audio remanente se puede bajar, o una combinación de ambos. Esto se realiza por el procesador 232 de "VRA real de comprobación". El procesador 232 de VRA real de comprobación incluye todo el hardware y software necesarios y combinaciones de los mismos para preformar las funciones mencionadas anteriormente. Si el usuario final selecciona tener la característica de retención de auto VRA í.i i ,* A ?.?. fa.«á » - -. »J»» haciéndolo posible vía el conmutador 235, entonces los niveles del canal 5.1 se comparan en el bloque 232 de VRA real de comprobación. Si el nivel central promedio está en una relación suficiente a aquella de los otros canales (los 5 cuales podrían ser calibrados al revés para unir SPL predicho y acústico de ambiente en la locación de observación) entonces el nivel calibrado normal es reproducido a través del amplificador 236 vía el conmutador rápido 237. Si la relación se predice para ser objetable entonces el conmutador rápido 237 liberará el canal central a su ajuste de nivel automático y otros altavoces a su propio ajuste de nivel automático. De acuerdo con la presente invención: 1) estas características de VRA-HOLD automático se aplican directamente a la salida de canales de audio de 5.1; 2) el nivel central que es comúnmente ajustable en teatros en casa se puede ajustar a una relación específica con respecto a los canales remanentes y mantenida en la presencia de oscilaciones; 3) los niveles calibrados se reproducen cuando el VRA seleccionado por el usuario no es violado y son nivelados automáticamente cuando está, por lo cual se reproduce el audio de una manera más realista, pero que se adapta todavía a los cambios oscilantes por el cambio ^IÍ ßÍáUIÍIÍÉ¡¡¡tf?m?iÍ.?iá A A*Í??rét. - - ^ .._«.. , . , . .^_. ... . _ _. , *r »., rr. rrr. .~~J*L ./.» -*> - . »- „ .-«_.«, rt¡Jt Í .Lr temporalmente de la calibración; y 4) se permite que el usuario final seleccione el VRA automático (o manual) o el sistema calibrado, por lo cual se elimina la necesidad para la recalibración después del ajuste del canal central. También se señala que aunque los niveles pueden ser automáticamente ajustados, esta característica también puede ser invalidada para proporcionar un ajuste de ganancia manual simple como se muestra en la Figura 4.
Ajuste del Canal Central para Mezclado Descendente para Arreglos de Altavoces Sin Canal Central Como se mencionó anteriormente, muchos usuarios finales no tienen sistemas de teatro en casa. Sin embargo, los reproductores de DVD llegan a ser más populares y la televisión digital será transmitida en el futuro cercano. Estos formatos de audio digital requerirán que el usuario final tenga un descodificador del canal 5.1 para escuchar a cualquier audio transmitido, sin embargo, los mismos no pueden tener el lujo de comprar un sistema de teatro en casa totalmente ajustado y calibrado con canales de audio 5.1. Los siguientes aspectos de la presente invención toman ventaja del hecho que los productores serán canales 5.1 de liberación de audio para usuarios finales quienes pueden no tener capacidad de reproducción total, en tanto que todavía les permitirá ajustar el nivel de relación de voz a audio remanente VRA. Además, este aspecto de la presente invención es mejorado al permitir que el usuario final elija 5 las características que mantendrán o sostendrán aquella relación sin tener un sistema ajustable de altavoces múltiples . La FIG. 5 ilustra un diagrama conceptual de cómo una mezcla descendente podría ser implementada de acuerdo con una modalidad de la presente invención. Como se muestra, el mezclado descendente se realiza por una unidad de interconexión 241 que recibe una corriente de bitios canal 5.1 (en este caso Dolby Digital) desde el puerto de salida de un reproductor de DVD, u otro dispositivo similar. La señal luego se envía a un descodificador de audio de costumbre para el ajuste por el usuario del canal central 243 de acuerdo con un VRA seleccionado por el usuario. La señal de salida luego se envía a un estéreo de cuatro canales, o cualquier otro arreglo de altavoces 244 que no proporciona un altavoz de canal central. La FIG. 6 ilustra una modalidad alternativa de un diagrama conceptual de cómo una mezcla descendente se implementaría de acuerdo con la presente invención. El ^¡yßjjlí^^^Ki^t^c^ mezclado descendente para los sistemas de audio de teatro no en casa proporciona un método para que todos los usuarios se beneficien de un VRA seleccionable. El diálogo ajustado, se distribuye a los altavoces del canal no central de tal manera 5 como para dejar el posicionamiento espacial propuesto del programa de audio tan intacto como sea posible. Sin embargo, el nivel de diálogo simplemente será mayor. Como se muestra, un convertidor 252 D/A del N-canal convierte la señal digital desde el descodificador de audio de costumbre para el ajuste por el usuario del mezclado descendente 243 del canal central a una señal análoga. La señal análoga luego se envía a un dispositivo 253 reproductor de audio de N-altavoz. Existen directrices bien especificadas para el mezclado descendente de canales de audio 5.1 (Dolby Digital) a 4 canales (Dolby Pro-Logic) , a 2 canales (estereofónico) , o a 1 canal (mono) . Las combinaciones apropiadas de los canales 5.1 en las relaciones propias se seleccionarán para producir el posicionamiento espacial óptimo para cualquier sistema de reproducción que el consumidor tiene. El problema con los métodos existentes de mezclado descendente es que los mismos son transparentes a y no controlables por el usuario final. Esto puede presentar problemas con la inteligibilidad, dada la manera en la cual el intervalo dinámico se utiliza en las mezclas de audio del canal 5.1 más reciente. Como un ejemplo, considerar una película que se ha producido en los canales 5.1 que tiene un segmento donde el audio remanente obstruye el diálogo haciéndolo difícil de entender. Si el consumidor tiene 6 altavoces y un preamplificador ajustable de 6 canales, la inteligibilidad acústica se puede mejorar y mantener como se describió anteriormente. Sin embargo, el consumidor que tiene solamente reproducción estereofónica recibirá una versión de mezclado descendente de los canales 5.1 conforme al diagrama mostrado en la FIG. 7 (tomado de las Dolby Digi tal Broadcast Implementation Guidelines) . De hecho, el nivel del canal central se atenúa por una cantidad que se especifica en la corriente de bitios DD (ya sea -3, -4.5 ó -6 dB) . Esto reducirá adicionalmente la inteligibilidad en los segmentos que contienen audio remanente fuerte en los otros canales. Este aspecto de la presente invención evita el proceso de mezclado descendente colocando la ganancia ajustable en cada uno de los canales espaciales antes de que los mismos se mezclen descendentemente a los aparatos de reproducción del usuario. Í???.? M.én? A La FIG. 8 ilustra los niveles ajustables por el usuario final en cada uno de los canales 5.1 descodificados. Típicamente, el mezclado descendente del canal de efectos de baja frecuencia (LFE) no se da para prevenir la saturación de los componentes electrónicos y reduce la inteligibilidad. Sin embargo, con el ajuste por el usuario disponible antes que ocurra el mezclado descendente, es posible incluir el LFE en el mezclado descendente en una relación especificada por el usuario final. Permitiendo al usuario final ajustar el nivel de cada canal (ajustadores de nivel 276a-g) permite a los usuarios finales que tienen algún número de altavoces de reproducción para tomar ventaja del ajuste de nivel de voz previamente solo disponible para aquellas personas quienes tienen canales de reproducción 5.1. Como se muestra anteriormente, este aparato se puede usar de manera externa a cualquier descodificador 271 si es un descodificador independiente, dentro de un DVD, o dentro de una televisión, sin consideración del número de canales de reproducción en el sistema de teatro en casa. El usuario final debe simplemente mandar al descodificador 271 para suministrar una salida (5.1) y la "caja de ..fe . i.í. interconexión" realizará el ajuste y mezclado descendente, previamente realizado por el descodificador. La FIG. 9 ilustra esta caja de interconexión 282. Esto puede tomarse como su entrada, los canales 5.1 de audio descodificados desde cualquier descodificador, aplican la ganancia independiente a cada canal, y el mezclado descendente de acuerdo con el número de altavoces de reproducción que el consumidor tiene. Además, este aspecto de la presente invención se puede incorporar en cualquier descodificador colocando las ganancias independientes del canal ajustable por el usuario en cada uno de los canales 5.1 antes de que se realice algún mezclado descendente. Esto no puede mejorar la inteligibilidad del diálogo debido a que para cualquier situación de mezcla descendente, el canal central se mezcla en el otro canal que contiene el audio remanente. Se debería notar también que los mecanismos VRA-HOLD automáticos descritos previamente serán muy aplicables a esta modalidad. Una vez que se selecciona el VRA para ajustar cada ganancia del amplificador, la característica del VRA-HOLD debería mantener la relación previa al mezclado descendente. Puesto que la relación se selecciona mientras la recepción de cualquier aparato de reproducción de mezcla descendente, la graduación en los circuitos de la mezcla descendente se compensará por el ajuste del nivel central adicional aplicado por el consumidor. Así, ninguna compensación adicional es necesaria como un resultado del proceso de mezclado descendente por si mismo. También se notará que la filtración de banda del canal central antes del mezclado descendente y la amplificación ajustada por el usuario removerá los sonidos bajos en frecuencia que son acústicos y sonidos altos en frecuencia que son acústicos (200 Hz o 4000 Hz por ejemplo) y puede mejorar la inteligibilidad en algunos pasos. También es muy probable que el contenido removido para mejorar la inteligibilidad en el canal central, también exista en los canales izquierdo y derecho puesto que los mismos se proponen para la reproducción de música y efectos que podrían de otra manera estar fuera de la anchura de banda acústica en toda forma. Esto asegurará que ninguna pérdida en la fidelidad o sonidos de audio remanentes ocurra mientras también se mejora la inteligibilidad acústica. Este aspecto de la presente invención: 1) permite al consumidor tener cualquier número de altavoces para tomar ventaja del ajuste de relación VRA actualmente disponible para aquellos que tienen altavoces de reproducción 5.1; 2) permite a los mismo consumidores ajustar un nivel deseado en el canal central con respecto al audio remanente en los otros canales, y tener que permanecer con la misma relación para transientes a través de la característica VRA-HOLD; y 3) se puede aplicar a cualquier salida de cualquier descodificador de canal 5.1 sin modificar la corriente de bitios o incrementar la anchura de banda de transmisión requerida, es decir, es independiente del hardware.
Grabación de Tres Canales Para Reproducción de VRA Para proporcionar ejemplos de las ideas descritas en esta, es necesario elegir cierto medio en ciertas aplicaciones del medio. Sin embargo, los ejemplos específicos no evitan otras formas de medios o técnicas de grabación ligeramente modificadas desde el alcance de esta invención. Además, mientras el punto central de esta invención se discute en términos del audio de tres canales convertido a audio de dos canales, no está fuera del alcance de esta invención para imaginar grabaciones de canales múltiples producidas de tal manera que se propone una mezcla descendente específica para el propósito del ajuste de VRA. El objetivo del mecanismo de ajuste de VRA se proporciona al usuario final con la capacidad para controlar de manera separada los niveles de la voz o diálogo y audio remanente para los propósitos de mejorar la inteligibilidad. La característica anterior de la invención descrita anteriormente, toma ventaja del hecho que muchas producciones 5 de canales múltiples colocan la mayoría del diálogo en el canal central. Además, muchos usuarios no tienen el acceso al ajuste necesitado para elevar el nivel del canal central en tales programas de canales múltiples. Por lo tanto como se estableció anteriormente, explícitamente nada diferente se requiera del productor para proporcionar al usuario final con una capacidad de ajuste de VRA limitada. Como se describe posteriormente, un método de producción se describe, el cual asegura un mecanismo de ajuste de VRA más efectivo usando los componentes discutidos primero. Además, usando el mecanismo el mismo hardware exacto como se describió anteriormente, además, muchas grabaciones viejas de audio se pueden remasterizar usando esta nueva técnica de producción, permitiendo así a los usuarios los medios con los cuales ajustar el VRA usando el hardware descrito anteriormente para las reproducciones del canal 5.1 actual. El primer ejemplo que se usa para describir los detalles de este método de producción es la música popular típica. La grabación de cinta original típicamente contiene una variedad de pistas de audio las cuales pueden incluir tambores, guitarra, graves y voz. Estas pistas son, de paso, sincronizadas en un medio de grabación sencillo así su reproducción constituirá una canción completa. Cuando se producen los discos actuales CDs (o DVD-audio) , estas pistas se mezclan en un programa estereofónico en la discreción del productor, con la voz del mezclado con la música remanente. Con la práctica de producción estereofónica moderna, es imposible para el usuario final tener cualquier control sobre la relación de voz a audio remanente. Sin embargo, si el productor fuera a colocar la mezcla de música (sin voz) como se desea espacialmente en los canales izquierdo y derecho mientras se coloca la voz en el canal central, los "programas" separados se podrían ajustar independientemente de la reproducción por el usuario final. (Esta producción se puede realizar usando el DVD-audio estándar que incluye programación de canales múltiples) . Ahora, si el DVD se produjo de esta manera (con la música en la izquierda y derecha y la voz en el centro) , este se puede reproducir por el dispositivo de mezcla descendente discutido anteriormente desde el canal 5.1 a canales 2, con el ajuste en el canal central previo al mezclado descendente. Esta modalidad particular se muestra en la FIG 9.
La FIG. 10 ilustra el proceso para colocar la música en los canales izquierdo y derecho y la voz en el canal central con los ajustes en el canal central previo a la mezcla descendente. El proceso comienza con la creación de un programa de audio de cinta original 90 que consiste de la voz y audio remanente. Las señales del programa de audio de cinta original 90 se mezclan y se condicionan igualmente en los canales izquierdo y derecho como se muestra en el bloque 91. Un medio de audio de tres canales 92 se crea de modo que los programas de audio izquierdo y derecho residen en las posiciones izquierda y derecha del medio de audio, mientras que la voz reside en el canal central del medio de audio. El medio se produce con el nivel de voz a un nivel de reproducción estándar con respecto al nivel de audio total del resto del programa. Esto asegurará que en la reproducción, el usuario final puede experimentar la mezcla estándar ajustando los niveles de voz y audio remanente al mismo valor. El dispositivo de reproducción de audio 93 suministra todos los canales 5.1 de audio al nivel del hardware de ajuste/mezcla descendente 94 que se describe en la invención previa. La mezcla descendente se puede ajustar para suministrar un programa estereofónico desde el programa de audio del canal 5.1. Puesto que la producción de más música no requiere efectos de baja frecuencia o borde, la mezcla descendente es simplemente combinar el nivel de voz ajustado con los programas de música izquierdo y derecho para la reproducción de VRA. Este método de producción de audio de canales múltiples depende del hecho que muchos, si no la mayoría, de los usuarios finales estarán mezclando descendentemente a unos pocos números de canales que es más apropiado para el tipo de programación. La música es un ejemplo excelente de esto puesto que la imaginación estereofónica típicamente es suficiente para las realizaciones de audio puras. Este método simplemente toma ventaja del espacio extra que está disponible con un medio DVD de mayor capacidad para colocar una pista de diálogo adecuada para el mezclado descendente. Esta modalidad no requiere algunos cambios a los componentes del sistema mencionados anteriormente para el ajuste del nivel del canal central sino utiliza un componente del sistema para la capacidad de VRA. La FIG. 11 ilustra una modalidad alternativa de la modalidad descrita en la FIG. 10 y de acuerdo con la presente invención. Puede ser deseable para los productores producir (y a los usuarios finales como experiencia) voz que es espacialmente colocada. Para mantener la voz y el audio remanente separados entre sí de todas las vías al usuario y para tener la capacidad de posicionamiento espacial, se deben transmitir cuatro canales de audio al usuario final (para la 5 reproducción espacial completa) . Estos canales de audio incluyen audio izquierdo, audio derecho, voz izquierda y voz derecha. Como se muestra en la FIG. 10, una cinta original tiene toda la música y grabación de posicionamiento espacial completa. Un medio de grabación de canales múltiples se creó, tal como audio DVD 5.1, de modo que el audio izquierdo (sin la voz) está en un canal único (tal como L) , el audio derecho está en un R, la voz izquierda está en el canal de borde izquierdo y la voz derecha está en el canal de borde derecho. El uso de los canales de borde para la voz pura es de manera pura arbitraria y cualquiera de los canales separados se pueden usar para cualquiera de las señales anteriores sin la pérdida de la generalidad. Durante la producción, y a través de un procedimiento de estandarización, la colocación de cada uno de los componentes del audio se decidirá para el tipo de medio; se asume que la voz izquierda y derecha están en el borde izquierdo y derecho mientras que el audio izquierdo y derecho están en los canales frontales izquierdo y derecho. La FIG. 11 ilustra la mezcla descendente especial requerida y como difiere de la FIG. 10. Existe una ganancia de audio que se suministra tanto a las señales de audio izquierda y derecha y una ganancia de voz que se aplica tanto a las señales de voz izquierda como derecha. Esto permite la capacidad de ajuste de VRA requerida. El programa izquierdo luego se crea combinando la voz izquierda y el audio izquierdo mientras que el programa derecho se crea combinando el audio derecho y la voz derecha como se muestra. Como una consecuencia de lo anterior, un programa estereofónico puro se suministrará mientras que un usuario final aún será capaz de ajustar la relación de VRA. Las modalidades de la presente invención describen un método para grabar usando canales múltiples donde la voz se debería colocar para asegurar que las técnicas de mezclado descendente son compatibles con los componentes del sistema de ajuste del canal central. Se sugiere que la voz se coloque en el canal central para el mezclado descendente a la reproducción estereofónica. Esto no evita el uso de otros canales para el diálogo o para el audio remanente. Se requiere un ajuste similar y técnica de mezclado descendente para recrear el programa total con el posicionamiento espacial deseado, sin consideración de los canales en los cuales los mismos se grabaron originalmente. Sin embargo, si los componentes del sistema no se designan para exceptuar el formato predeterminado, la mezcla descendente será incompatible con la producción y el resultado final será impredecible. Asegurando que la producción se realiza usando el canal central como un canal de diálogo dedicado, y los usuarios finales pueden ajustar el VRA por cualquier escenario de mezcla descendente usando componentes del sistema similares. El ajuste de VRA para un segmento de voz de canales múltiples (requiriendo la reproducción en varios canales) puede ocurrir todavía para cualquier formato de audio de canales múltiples ya que se produce una voz en el DVD separadamente del audio remanente. Esto requiere la producción de canales múltiples de tanto la voz como el audio remanente y se limitará por el número de canales del formato de audio que se permitirá usar.
Se hace constar que con relación a esta fecha el mejor método conocido por la solicitante para llevar a la práctica la citada invención es el que resulta claro de la descripción de la invención.

Claims (14)

  1. REIVINDICACIONES Habiéndose descrito la invención como antecede se reclama como propiedad lo contenido en las siguientes reivindicaciones : 5 1. Un método para descodificar una señal de audio caracterizado porque comprende: recibir una señal de audio digital que tiene una pluralidad de canales definidos en esta, en donde una de la 10 pluralidad de canales es un canal central y al menos una de la otra pluralidad de canales es un canal de audio remanente; comparar el canal central con al menos una de la otra pluralidad de canales para determinar una relación del canal central a la otra pluralidad de canales y; 15 ajustar automáticamente el canal central y al menos una de la pluralidad de otros canales cuando no se encuentra un valor predeterminado para la relación.
  2. 2. El método de conformidad con la reivindicación 1, caracterizado porque comprende adicionalmente el paso de 20 ajuste del canal central y al menos una de la pluralidad de otros canales cuando el valor de la relación excede el valor predeterminado .
  3. 3. El método de conformidad con la reivindicación 1, caracterizado porque comprende adicionalmente el paso de ajuste del canal central y al menos una de la pluralidad de otros canales cuando el valor de la relación es inferior al valor predeterminado.
  4. 4. El método de conformidad con la reivindicación 1, caracterizado porque el canal central es un un canal de voz en su mayor parte.
  5. 5. El método de conformidad con la reivindicación 1, caracterizado porque el canal central es un canal de voz.
  6. 6. El método de conformidad con la reivindicación 1, caracterizado porque al menos una de la otra pluralidad de canales comprende un canal sin voz.
  7. 7. Un sistema de audio para optimizar una reproducción de un programa de audio para los usuarios finales caracterizado porque comprende: un receptor que recibe una señal de audio codificada, la señal de audio codificada incluye una señal de audio preferida y una señal de audio remanente; un descodificador acoplado al receptor y que descodifica la señal de audio codificada para reconstruir una señal de audio preferida y una señal de audio remanente; i ií.-.Ht. A ?*A I I liilliÉiifi i! un primer amplificador ajustable por el usuario acoplado al descodificador y que ajusta la señal de audio preferida; un segundo amplificador ajustable por el usuario acoplado al descodificador y que ajusta la señal de audio remanente; un procesador conectado al descodificador que compara una relación de la señal de audio preferida a la señal de audio remanente y produce un valor; y un controlador para ajustar automáticamente la relación de la señal de audio preferido a la señal de audio remanente cuando un valor predeterminado de la relación no se encuentra.
  8. 8. El sistema de conformidad con la reivindicación 7, caracterizado porque la señal de audio preferida se ajusta cuando la relación excede el valor predeterminado.
  9. 9. El sistema de conformidad con la reivindicación 7, caracterizado porque la señal de audio preferida se ajusta cuando la relación es inferior al valor predeterminado.
  10. 10. El sistema de conformidad con la reivindicación 7, caracterizado porque la señal de audio remanente se ajusta cuando la relación excede el valor predeterminado. l,.i .¿.r?. ? ? ..
  11. 11. El sistema de conformidad con la reivindicación 7, caracterizado porque la señal de audio remanente se ajusta cuando la relación es inferior al valor predeterminado.
  12. 12. El sistema de conformidad con la reivindicación 1, caracterizado porque la señal de audio preferida incluye una señal de voz en su mayor parte.
  13. 13. El sistema de conformidad con la reivindicación 1, caracterizado porque la señal de audio preferida incluye una señal de voz.
  14. 14. El sistema de conformidad con la reivindicación 1, caracterizado porque la señal de audio remanente incluye una señal sin voz.
MXPA01012991A 1999-06-15 2000-06-13 Mezcla descendente del canal central interactivo de voz a audio remanente (vra). MXPA01012991A (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US13924299P 1999-06-15 1999-06-15
US09/580,203 US6442278B1 (en) 1999-06-15 2000-05-26 Voice-to-remaining audio (VRA) interactive center channel downmix
PCT/US2000/016068 WO2000078094A1 (en) 1999-06-15 2000-06-13 Voice-to-remaining audio (vra) interactive center channel downmix

Publications (1)

Publication Number Publication Date
MXPA01012991A true MXPA01012991A (es) 2002-07-02

Family

ID=26837025

Family Applications (1)

Application Number Title Priority Date Filing Date
MXPA01012991A MXPA01012991A (es) 1999-06-15 2000-06-13 Mezcla descendente del canal central interactivo de voz a audio remanente (vra).

Country Status (13)

Country Link
US (2) US6442278B1 (es)
EP (1) EP1190598A1 (es)
JP (1) JP4818554B2 (es)
CN (1) CN1284410C (es)
AR (1) AR024352A1 (es)
AU (1) AU761690C (es)
BR (1) BR0011645A (es)
CA (1) CA2374849A1 (es)
IL (1) IL147057A0 (es)
MX (1) MXPA01012991A (es)
NO (1) NO20016090L (es)
TW (1) TW480894B (es)
WO (1) WO2000078094A1 (es)

Families Citing this family (61)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6442278B1 (en) * 1999-06-15 2002-08-27 Hearing Enhancement Company, Llc Voice-to-remaining audio (VRA) interactive center channel downmix
JP2001268700A (ja) * 2000-03-17 2001-09-28 Fujitsu Ten Ltd 音響装置
US7212872B1 (en) * 2000-05-10 2007-05-01 Dts, Inc. Discrete multichannel audio with a backward compatible mix
US20040096065A1 (en) * 2000-05-26 2004-05-20 Vaudrey Michael A. Voice-to-remaining audio (VRA) interactive center channel downmix
JP4304401B2 (ja) * 2000-06-07 2009-07-29 ソニー株式会社 マルチチャンネルオーディオ再生装置
KR20020076312A (ko) * 2000-12-18 2002-10-09 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 재생 디바이스
US6804565B2 (en) * 2001-05-07 2004-10-12 Harman International Industries, Incorporated Data-driven software architecture for digital sound processing and equalization
US7447321B2 (en) * 2001-05-07 2008-11-04 Harman International Industries, Incorporated Sound processing system for configuration of audio signals in a vehicle
US7177432B2 (en) * 2001-05-07 2007-02-13 Harman International Industries, Incorporated Sound processing system with degraded signal optimization
US7451006B2 (en) * 2001-05-07 2008-11-11 Harman International Industries, Incorporated Sound processing system using distortion limiting techniques
US7668317B2 (en) * 2001-05-30 2010-02-23 Sony Corporation Audio post processing in DVD, DTV and other audio visual products
JP2003102100A (ja) * 2001-09-20 2003-04-04 Pioneer Electronic Corp デジタル音響再生装置、音響装置、および音響再生システム
EP1585947B1 (en) * 2002-05-03 2020-01-01 Harman International Industries, Incorporated Sound detection and localization system
JP3800139B2 (ja) * 2002-07-09 2006-07-26 ヤマハ株式会社 レベル調節方法、プログラムおよび音声信号装置
KR100981699B1 (ko) * 2002-07-12 2010-09-13 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 코딩
US7006645B2 (en) * 2002-07-19 2006-02-28 Yamaha Corporation Audio reproduction apparatus
WO2004029935A1 (en) * 2002-09-24 2004-04-08 Rad Data Communications A system and method for low bit-rate compression of combined speech and music
WO2004059643A1 (en) * 2002-12-28 2004-07-15 Samsung Electronics Co., Ltd. Method and apparatus for mixing audio stream and information storage medium
KR20040060718A (ko) * 2002-12-28 2004-07-06 삼성전자주식회사 오디오 스트림 믹싱 방법, 그 장치 및 그 정보저장매체
US20040208324A1 (en) * 2003-04-15 2004-10-21 Cheung Kwok Wai Method and apparatus for localized delivery of audio sound for enhanced privacy
US8849185B2 (en) 2003-04-15 2014-09-30 Ipventure, Inc. Hybrid audio delivery system and method therefor
US7251337B2 (en) * 2003-04-24 2007-07-31 Dolby Laboratories Licensing Corporation Volume control in movie theaters
US7551745B2 (en) * 2003-04-24 2009-06-23 Dolby Laboratories Licensing Corporation Volume and compression control in movie theaters
JP4486646B2 (ja) * 2003-05-28 2010-06-23 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション オーディオ信号の感知音量を計算し調整する方法、装置及びコンピュータプログラム
KR100429688B1 (ko) * 2003-06-21 2004-05-03 주식회사 휴맥스 모자이크 이피지 서비스에서의 오디오 송신 및 수신방법
US7398207B2 (en) * 2003-08-25 2008-07-08 Time Warner Interactive Video Group, Inc. Methods and systems for determining audio loudness levels in programming
US7190795B2 (en) * 2003-10-08 2007-03-13 Henry Simon Hearing adjustment appliance for electronic audio equipment
CN100518269C (zh) 2004-04-08 2009-07-22 皇家飞利浦电子股份有限公司 用于控制声级的设备和方法
US8009837B2 (en) * 2004-04-30 2011-08-30 Auro Technologies Nv Multi-channel compatible stereo recording
US8626494B2 (en) * 2004-04-30 2014-01-07 Auro Technologies Nv Data compression format
JP2006109290A (ja) * 2004-10-08 2006-04-20 Matsushita Electric Ind Co Ltd 復号化装置
US8199933B2 (en) 2004-10-26 2012-06-12 Dolby Laboratories Licensing Corporation Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
US8090120B2 (en) * 2004-10-26 2012-01-03 Dolby Laboratories Licensing Corporation Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
US8077815B1 (en) 2004-11-16 2011-12-13 Adobe Systems Incorporated System and method for processing multi-channel digital audio signals
US7787631B2 (en) * 2004-11-30 2010-08-31 Agere Systems Inc. Parametric coding of spatial audio with cues based on transmitted channels
WO2006089148A2 (en) * 2005-02-17 2006-08-24 Panasonic Automotive Systems Company Of America Division Of Panasonic Corporation Of North America Method and apparatus for optimizing reproduction of audio source material in an audio system
BRPI0622303B1 (pt) * 2005-04-18 2016-03-01 Basf Se copolímeros cp na forma de um polímero obtido por polimerização com radical de pelo menos três monômeros m diferentes monoetilenicamente insaturados
WO2006126843A2 (en) 2005-05-26 2006-11-30 Lg Electronics Inc. Method and apparatus for decoding audio signal
JP4988717B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
US8285556B2 (en) * 2006-02-07 2012-10-09 Lg Electronics Inc. Apparatus and method for encoding/decoding signal
TWI517562B (zh) * 2006-04-04 2016-01-11 杜比實驗室特許公司 用於將多聲道音訊信號之全面感知響度縮放一期望量的方法、裝置及電腦程式
CN101410892B (zh) * 2006-04-04 2012-08-08 杜比实验室特许公司 改进的离散余弦变换域中的音频信号响度测量及修改
MY141426A (en) 2006-04-27 2010-04-30 Dolby Lab Licensing Corp Audio gain control using specific-loudness-based auditory event detection
JP4945199B2 (ja) * 2006-08-29 2012-06-06 株式会社タムラ製作所 音声調整装置、方法及びプログラム
US8849433B2 (en) 2006-10-20 2014-09-30 Dolby Laboratories Licensing Corporation Audio dynamics processing using a reset
US8521314B2 (en) * 2006-11-01 2013-08-27 Dolby Laboratories Licensing Corporation Hierarchical control path with constraints for audio dynamics processing
BRPI0813723B1 (pt) * 2007-07-13 2020-02-04 Dolby Laboratories Licensing Corp método para controlar o nível de intensidade do som de eventos auditivos, memória legível por computador não transitória, sistema de computador e aparelho
KR101597375B1 (ko) 2007-12-21 2016-02-24 디티에스 엘엘씨 오디오 신호의 인지된 음량을 조절하기 위한 시스템
JP5341983B2 (ja) * 2008-04-18 2013-11-13 ドルビー ラボラトリーズ ライセンシング コーポレイション サラウンド体験に対する影響を最小限にしてマルチチャンネルオーディオにおけるスピーチの聴覚性を維持するための方法及び装置
US8577052B2 (en) * 2008-11-06 2013-11-05 Harman International Industries, Incorporated Headphone accessory
JP4844622B2 (ja) * 2008-12-05 2011-12-28 ソニー株式会社 音量補正装置、音量補正方法、音量補正プログラムおよび電子機器、音響装置
JP5564803B2 (ja) * 2009-03-06 2014-08-06 ソニー株式会社 音響機器及び音響処理方法
US8538042B2 (en) 2009-08-11 2013-09-17 Dts Llc System for increasing perceived loudness of speakers
TWI459828B (zh) * 2010-03-08 2014-11-01 Dolby Lab Licensing Corp 在多頻道音訊中決定語音相關頻道的音量降低比例的方法及系統
US9312829B2 (en) 2012-04-12 2016-04-12 Dts Llc System for adjusting loudness of audio signals in real time
CN105493182B (zh) * 2013-08-28 2020-01-21 杜比实验室特许公司 混合波形编码和参数编码语音增强
EP3154279A4 (en) * 2014-06-06 2017-11-01 Sony Corporation Audio signal processing apparatus and method, encoding apparatus and method, and program
CN106797523B (zh) * 2014-08-01 2020-06-19 史蒂文·杰伊·博尼 音频设备
US10978079B2 (en) * 2015-08-25 2021-04-13 Dolby Laboratories Licensing Corporation Audio encoding and decoding using presentation transform parameters
KR20180132032A (ko) 2015-10-28 2018-12-11 디티에스, 인코포레이티드 객체 기반 오디오 신호 균형화
JP6748247B2 (ja) * 2019-03-04 2020-08-26 ローム株式会社 オーディオ信号処理回路、それを用いた車載用オーディオ装置、オーディオコンポーネント装置、電子機器

Family Cites Families (93)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2783677A (en) 1953-06-29 1957-03-05 Ampex Electric Corp Stereophonic sound system and method
US3046337A (en) 1957-08-05 1962-07-24 Hamner Electronics Company Inc Stereophonic sound
US3110769A (en) 1959-01-17 1963-11-12 Telefunken Gmbh Stereo sound control system
JPS492161Y1 (es) * 1972-08-09 1974-01-19
GB1522599A (en) 1974-11-16 1978-08-23 Dolby Laboratories Inc Centre channel derivation for stereophonic cinema sound
US4074084A (en) 1975-11-05 1978-02-14 Berg Johannes C M Van Den Method and apparatus for receiving sound intended for stereophonic reproduction
US4150253A (en) 1976-03-15 1979-04-17 Inter-Technology Exchange Ltd. Signal distortion circuit and method of use
US4051331A (en) 1976-03-29 1977-09-27 Brigham Young University Speech coding hearing aid system utilizing formant frequency transformation
US4052559A (en) 1976-12-20 1977-10-04 Rockwell International Corporation Noise filtering device
US4406001A (en) 1980-08-18 1983-09-20 The Variable Speech Control Company ("Vsc") Time compression/expansion with synchronized individual pitch correction of separate components
US4405831A (en) 1980-12-22 1983-09-20 The Regents Of The University Of California Apparatus for selective noise suppression for hearing aids
US4454609A (en) 1981-10-05 1984-06-12 Signatron, Inc. Speech intelligibility enhancement
US4516257A (en) 1982-11-15 1985-05-07 Cbs Inc. Triphonic sound system
US4484345A (en) 1983-02-28 1984-11-20 Stearns William P Prosthetic device for optimizing speech understanding through adjustable frequency spectrum responses
US4622440A (en) 1984-04-11 1986-11-11 In Tech Systems Corp. Differential hearing aid with programmable frequency response
US4776016A (en) 1985-11-21 1988-10-04 Position Orientation Systems, Inc. Voice control system
US4809337A (en) 1986-06-20 1989-02-28 Scholz Research & Development, Inc. Audio noise gate
US5138498A (en) 1986-10-22 1992-08-11 Fuji Photo Film Co., Ltd. Recording and reproduction method for a plurality of sound signals inputted simultaneously
US4816905A (en) 1987-04-30 1989-03-28 Gte Laboratories Incorporated & Gte Service Corporation Telecommunication system with video and audio frames
JPH06101664B2 (ja) 1987-08-20 1994-12-12 パイオニア株式会社 再生波形等化回路
DE3730763A1 (de) 1987-09-12 1989-03-30 Blaupunkt Werke Gmbh Schaltung zur stoergeraeuschkompensation
US4941179A (en) 1988-04-27 1990-07-10 Gn Davavox A/S Method for the regulation of a hearing aid, a hearing aid and the use thereof
JP3017744B2 (ja) 1989-03-09 2000-03-13 パイオニア株式会社 ボイスチェンジ回路
US5212764A (en) 1989-04-19 1993-05-18 Ricoh Company, Ltd. Noise eliminating apparatus and speech recognition apparatus using the same
US5450146A (en) 1989-05-24 1995-09-12 Digital Theater Systems, L.P. High fidelity reproduction device for cinema sound
US5003605A (en) 1989-08-14 1991-03-26 Cardiodyne, Inc. Electronically augmented stethoscope with timing sound
US5144454A (en) 1989-10-31 1992-09-01 Cury Brian L Method and apparatus for producing customized video recordings
JPH03195300A (ja) * 1989-12-25 1991-08-26 Mitsubishi Electric Corp 音声再生装置
US5113447A (en) * 1990-01-05 1992-05-12 Electronic Engineering And Manufacturing, Inc. Method and system for optimizing audio imaging in an automotive listening environment
JPH03236691A (ja) 1990-02-14 1991-10-22 Hitachi Ltd テレビジョン受信機用音声回路
JP2538668Y2 (ja) 1990-03-02 1997-06-18 ブラザー工業株式会社 メッセージ機能付き音楽再生装置
US5216718A (en) 1990-04-26 1993-06-01 Sanyo Electric Co., Ltd. Method and apparatus for processing audio signals
EP0459362B1 (en) 1990-05-28 1997-01-08 Matsushita Electric Industrial Co., Ltd. Voice signal processor
DE69131739T2 (de) 1990-05-28 2001-10-04 Matsushita Electric Ind Co Ltd Einrichtung zur Sprachsignalverarbeitung für die Bestimmung eines Sprachsignals in einem verrauschten Sprachsignal
JP3006059B2 (ja) 1990-09-17 2000-02-07 ソニー株式会社 音場拡大装置
US5155510A (en) 1990-11-29 1992-10-13 Digital Theater Systems Corporation Digital sound system for motion pictures with analog sound track emulation
US5146504A (en) 1990-12-07 1992-09-08 Motorola, Inc. Speech selective automatic gain control
US5408686A (en) 1991-02-19 1995-04-18 Mankovitz; Roy J. Apparatus and methods for music and lyrics broadcasting
JP3068226B2 (ja) 1991-02-27 2000-07-24 株式会社リコス バックコーラス合成装置
US5210366A (en) 1991-06-10 1993-05-11 Sykes Jr Richard O Method and device for detecting and separating voices in a complex musical composition
JPH0537478A (ja) 1991-07-31 1993-02-12 Fujitsu Ten Ltd 音場制御装置
DE69317802T2 (de) 1992-01-21 1998-10-22 Koninkl Philips Electronics Nv Verfahren und Vorrichtung für Tonverbesserung unter Verwendung von Hüllung von multibandpassfiltrierten Signalen in Kammfiltern
US5384599A (en) 1992-02-21 1995-01-24 General Electric Company Television image format conversion system including noise reduction apparatus
US5812688A (en) 1992-04-27 1998-09-22 Gibson; David A. Method and apparatus for using visual images to mix sound
JPH05342762A (ja) 1992-06-12 1993-12-24 Sanyo Electric Co Ltd 音声再生回路
JPH087524B2 (ja) 1992-07-17 1996-01-29 株式会社日本ビデオセンター カラオケ採点表示装置
US5319713A (en) 1992-11-12 1994-06-07 Rocktron Corporation Multi dimensional sound circuit
US5325423A (en) 1992-11-13 1994-06-28 Multimedia Systems Corporation Interactive multimedia communication system
JPH06165079A (ja) * 1992-11-25 1994-06-10 Matsushita Electric Ind Co Ltd マルチチャンネルステレオ用ダウンミキシング装置
US5341253A (en) 1992-11-28 1994-08-23 Tatung Co. Extended circuit of a HiFi KARAOKE video cassette recorder having a function of simultaneous singing and recording
US5400409A (en) 1992-12-23 1995-03-21 Daimler-Benz Ag Noise-reduction method for noise-affected voice channels
DE69423922T2 (de) * 1993-01-27 2000-10-05 Koninkl Philips Electronics Nv Tonsignalverarbeitungsanordnung zur Ableitung eines Mittelkanalsignals und audiovisuelles Wiedergabesystem mit solcher Verarbeitungsanordnung
US5572591A (en) 1993-03-09 1996-11-05 Matsushita Electric Industrial Co., Ltd. Sound field controller
US5396560A (en) 1993-03-31 1995-03-07 Trw Inc. Hearing aid incorporating a novelty filter
US5434922A (en) 1993-04-08 1995-07-18 Miller; Thomas E. Method and apparatus for dynamic sound optimization
JP3206619B2 (ja) 1993-04-23 2001-09-10 ヤマハ株式会社 カラオケ装置
US5619383A (en) 1993-05-26 1997-04-08 Gemstar Development Corporation Method and apparatus for reading and writing audio and digital data on a magnetic tape
JP2951502B2 (ja) 1993-05-26 1999-09-20 パイオニア株式会社 カラオケ装置
JP3685812B2 (ja) 1993-06-29 2005-08-24 ソニー株式会社 音声信号送受信装置
US5644677A (en) 1993-09-13 1997-07-01 Motorola, Inc. Signal processing system for performing real-time pitch shifting and method therefor
US5485522A (en) 1993-09-29 1996-01-16 Ericsson Ge Mobile Communications, Inc. System for adaptively reducing noise in speech signals
BE1007617A3 (nl) 1993-10-11 1995-08-22 Philips Electronics Nv Transmissiesysteem met gebruik van verschillende codeerprincipes.
US5576843A (en) 1993-10-29 1996-11-19 Time Warner Entertainment Co., L.P. System and method for controlling play of multiple dialog audio tracks of a software carrier
US5469370A (en) 1993-10-29 1995-11-21 Time Warner Entertainment Co., L.P. System and method for controlling play of multiple audio tracks of a software carrier
US5569038A (en) 1993-11-08 1996-10-29 Tubman; Louis Acoustical prompt recording system and method
US5497425A (en) * 1994-03-07 1996-03-05 Rapoport; Robert J. Multi channel surround sound simulation device
TW247390B (en) 1994-04-29 1995-05-11 Audio Products Int Corp Apparatus and method for adjusting levels between channels of a sound system
JP3568584B2 (ja) 1994-06-28 2004-09-22 ローム株式会社 オーディオ装置
JPH0844686A (ja) * 1994-07-28 1996-02-16 Hitachi Ltd データ管理システム
US5533129A (en) * 1994-08-24 1996-07-02 Gefvert; Herbert I. Multi-dimensional sound reproduction system
US5706145A (en) 1994-08-25 1998-01-06 Hindman; Carl L. Apparatus and methods for audio tape indexing with data signals recorded in the guard band
JPH08102687A (ja) * 1994-09-29 1996-04-16 Yamaha Corp 音声送受信方式
US5668339A (en) 1994-10-26 1997-09-16 Daewoo Electronics Co., Ltd. Apparatus for multiplexing an audio signal in a video-song playback system
JP2897659B2 (ja) 1994-10-31 1999-05-31 ヤマハ株式会社 カラオケ装置
US5751903A (en) 1994-12-19 1998-05-12 Hughes Electronics Low rate multi-mode CELP codec that encodes line SPECTRAL frequencies utilizing an offset
JP3239672B2 (ja) 1995-02-15 2001-12-17 ヤマハ株式会社 自動演奏装置
JP3319211B2 (ja) 1995-03-23 2002-08-26 ヤマハ株式会社 音声変換機能付カラオケ装置
KR0155811B1 (ko) 1995-03-28 1998-12-15 김광호 컴팩트 디스크 플레이어 일체형 텔레비젼 수상기
US5684714A (en) 1995-05-08 1997-11-04 Kabushiki Kaisha Toshiba Method and system for a user to manually alter the quality of a previously encoded video sequence
KR100188089B1 (ko) 1995-07-10 1999-06-01 김광호 음성 강조 회로
US5872851A (en) 1995-09-18 1999-02-16 Harman Motive Incorporated Dynamic stereophonic enchancement signal processing system
US5852800A (en) 1995-10-20 1998-12-22 Liquid Audio, Inc. Method and apparatus for user controlled modulation and mixing of digitally stored compressed data
US5666350A (en) 1996-02-20 1997-09-09 Motorola, Inc. Apparatus and method for coding excitation parameters in a very low bit rate voice messaging system
US5727068A (en) * 1996-03-01 1998-03-10 Cinema Group, Ltd. Matrix decoding method and apparatus
US5809472A (en) 1996-04-03 1998-09-15 Command Audio Corporation Digital audio data transmission system based on the information content of an audio signal
US5822370A (en) 1996-04-16 1998-10-13 Aura Systems, Inc. Compression/decompression for preservation of high fidelity speech quality at low bandwidth
JPH09322078A (ja) 1996-05-24 1997-12-12 Toko Inc 画像伝送装置
US5912976A (en) * 1996-11-07 1999-06-15 Srs Labs, Inc. Multi-channel audio enhancement system for use in recording and playback and methods for providing same
US6005948A (en) * 1997-03-21 1999-12-21 Sony Corporation Audio channel mixing
WO1999012386A1 (en) * 1997-09-05 1999-03-11 Lexicon 5-2-5 matrix encoder and decoder system
US6026168A (en) * 1997-11-14 2000-02-15 Microtek Lab, Inc. Methods and apparatus for automatically synchronizing and regulating volume in audio component systems
US6311155B1 (en) * 2000-02-04 2001-10-30 Hearing Enhancement Company Llc Use of voice-to-remaining audio (VRA) in consumer applications
US6442278B1 (en) * 1999-06-15 2002-08-27 Hearing Enhancement Company, Llc Voice-to-remaining audio (VRA) interactive center channel downmix

Also Published As

Publication number Publication date
AU761690C (en) 2003-10-30
US6442278B1 (en) 2002-08-27
CN1369189A (zh) 2002-09-11
IL147057A0 (en) 2002-08-14
BR0011645A (pt) 2002-04-30
AU761690B2 (en) 2003-06-05
CA2374849A1 (en) 2000-12-21
CN1284410C (zh) 2006-11-08
NO20016090D0 (no) 2001-12-13
US6650755B2 (en) 2003-11-18
EP1190598A1 (en) 2002-03-27
AR024352A1 (es) 2002-10-02
WO2000078094A1 (en) 2000-12-21
NO20016090L (no) 2002-02-15
JP2003501985A (ja) 2003-01-14
AU5733000A (en) 2001-01-02
US20030002683A1 (en) 2003-01-02
TW480894B (en) 2002-03-21
JP4818554B2 (ja) 2011-11-16

Similar Documents

Publication Publication Date Title
AU761690C (en) Voice-to-remaining audio (VRA) interactive center channel downmix
EP2009785B1 (en) Method and apparatus for providing end user adjustment capability that accommodates hearing impaired and non-hearing impaired listener preferences
US7415120B1 (en) User adjustable volume control that accommodates hearing
US6912501B2 (en) Use of voice-to-remaining audio (VRA) in consumer applications
US7248935B2 (en) Information signal reproducing apparatus
AU2001231228A1 (en) Use of voice-to-remaining audio (VRA) in consumer applications
MXPA01012997A (es) Equipo auxiliar y protesis auditiva de voz a audio remanente (vra).
US20040096065A1 (en) Voice-to-remaining audio (VRA) interactive center channel downmix
JP2727339B2 (ja) 環境音響装置
Todd Loudness uniformity and dynamic range control for digital multichannel audio broadcasting
Nakahara Multichannel Monitoring Tutorial Booklet
WO1999053721A1 (en) Improved hearing enhancement system and method

Legal Events

Date Code Title Description
FG Grant or registration