MX2008008039A - Aparato y metodo para sintetizar tres canales de salida, utilizando dos canales de alimentacion - Google Patents

Aparato y metodo para sintetizar tres canales de salida, utilizando dos canales de alimentacion

Info

Publication number
MX2008008039A
MX2008008039A MX/A/2008/008039A MX2008008039A MX2008008039A MX 2008008039 A MX2008008039 A MX 2008008039A MX 2008008039 A MX2008008039 A MX 2008008039A MX 2008008039 A MX2008008039 A MX 2008008039A
Authority
MX
Mexico
Prior art keywords
channel
channels
output
signal components
signal
Prior art date
Application number
MX/A/2008/008039A
Other languages
English (en)
Inventor
Oliver Hellmuth
Herrejuergen
Harald Popp
Andreas Walter
Original Assignee
Fraunhofergesellschaft Zur Foerderung Der Angewandten Forschung EV
Oliver Hellmuth
Herre Juergen
Harald Popp
Andreas Walter
Filing date
Publication date
Application filed by Fraunhofergesellschaft Zur Foerderung Der Angewandten Forschung EV, Oliver Hellmuth, Herre Juergen, Harald Popp, Andreas Walter filed Critical Fraunhofergesellschaft Zur Foerderung Der Angewandten Forschung EV
Publication of MX2008008039A publication Critical patent/MX2008008039A/es

Links

Abstract

Para sintetizar al menos tres canales de salida utilizando dos canales de alimentación o entrada de estéreo, los canales de alimentación de estéreo se analizan (15) para detectar componentes de señal que ocurren en ambos canales de entrada. Un generador de señal (16) es operativo para introducir al menos una parte de los componentes de señal detectados en el segundo canal (12b) asociado con una segunda bocina en un esquema de bocinas pretendido, que se ubica entre una primera y una tercer bocina en el esquema de bocinas. Cuando, sin embargo, alimentar los componentes de señal detectados completos resultaría en una situación de recorte, entonces solo una parte de los componentes de señal detectados se alimenta en el segundo canal como un canal central real y el resto se ubica en el primer y tercer canales como un canal central ficticio.

Description

APARATO Y MÉTODO PARA SINTETIZAR TRES CANALES DE SALIDA, UTILIZANDO DOS CANALES DE ALIMENTACIÓN Especificación La presente invención se refiere a sintetizadores de múltiples canales y en particular a dispositivos que generan tres o más canales de salida, utilizando dos canales de alimentación estéreo. El material de audio de múltiples canales cada vez se está volviendo más popular también en el ambiente del consumidor doméstico. Esto primordialmente se debe al hecho de que películas en EVC ofrecen sonido 5.1 de mú. tiples canales y por lo tanto incluso los usuarios domésticos o en casa, frecuentemente instalan sistemas de reproducción de audio, que son capaces de reproducir audio de múltiples canales. Esta configuración consiste por ejemplo de 3 bocinas, L, C, R en el frente, 2 bocinas Ls, Rs en la parte posterior y un canal de mejora de baja frecuencia (LFE = low frequency enhancement) y proporciona varias ventajas bien conocidas sobre reproducción estéreo de 2 canales, por ejemplo: mejorada estabilidad de imagen frontal, incluso fuera de la posición de audición central óptima debido al canal central (más grande "zona de sonido óptimo" = posición de audición óptima) incrementado sentido de "participación" del oyente, creada por las bocinas posteriores. Sin embargo, existe una enorme cantidad de contenidos de audio existente, que sólo consiste de dos canales de audio (en "estéreo"), por ejemplo en Discos Compactos (CDs Compact Discs) . Para reproducir material de audio existente en dos canales sobre una configuración de múltiples canales 5.1, hay dos opciones básicas: 1. Reproducir las señales de estéreo de canal izquierdo y derecho sobre las bccinas L y P, respectivamente es decir reproducirlas en la forma existente. Esta solución no aprovecha la configuración de bocinas extendida (bocinas central y posterior) . 2. Se puede utilizar un método para convertir los dos canales del material del contenido a una señal de múltiples canales (esto puede suceder "al vuelo" o mediante pre-procesamiento) , que utiliza todas las cinco bocinas 5.1 y de esta forma se beneficia de las ventajas previamente discutidas de la configuración de múltiples canales. La solución #2 claramente tiene ventajas sobre #1, pero también contiene algunos problemas especialmente con respecto a la conversión de los dos canales frontales (Izquierdo y Derecho = LR) a tres canales frontales (Múltiples canales izquierdo, centro y derecho = L'C'R') . Una buena solución de conversión LR a L'C'R' deberá cumplir con los siguientes requerimientos: 1) Para volver a crear una imagen frontal similar pero más estable en L'C'R' que en el caso de reproducción LR, el Canal central deberá reproducir todos los eventos de sonido que usualmente se perciben que provienen desde la mitad entre la bocina Izquierda y Derecha, si el oyente esta es la "zona de sonido óptimo". Además, señales en las posiciones frontal izquierda deberán reproducirse por L'C' y señales en la posición frontal derecha serán reproducirdas por R'C', respectivamente (ver J.M. Jot and C Avendano , "Spatial Enhancement of Audio Recordings", AES 23rd Conference, Copenhagen, 2003) . 2 ) La suma de la energía acústica emitida por los canales L'C'R' deberá ser igual a la suma de la energía acústica de los canales fuente LR para lograr una impresión de sonido igualmente fuerte para copiar L'C'R como para LR. Considerando iguales características en todos los canales de reproducción, esto se traduce en "la suma de la energía eléctrica de los canales L'C'R1 deberá ser igual a la suma de la energía eléctrica de los canales fuente LR" . Debido al requerimiento #1 las señales de los canales Izquierdo y Derecho pueden mezclarse en un canal central (sencillo) . Esto es particularmente cierto, si las señales de canal Izquierdo y Derecho son casi idénticas, es decir representan una fuente de sonido ficticio a la mitad de la etapa de sonido frontal. Ésta imagen ficticia ahora se reemplaza por una imagen "real" generada por la bocina central. Debido al requerimiento #2, esta señal central deberá transportar la suma de la energía Izquierda y Derecha. Si el nivel de las señales de canal Izquierdo y el Derecho está acerca de la amplitud máxima que puede transmitirse por el canal (= 0 dBFS; dBFS = Escala Completa dB) , la suma de los niveles de ambos canales excederá el nivel máximo, que puede representarse por el canal/sistema. Esto usualmente resulta en el efecto indeseado de "recorte". La situación de recorte se ilustra en la Figura 6. Figura 6 ilustra una forma de onda en tiempo de una señal 60 procesada por un procesador que tiene un umbral máximo positivo 61a y un umbral máximo negativo 61b. Dependiendo de la capacidad del procesador digital que procesa la señal digital, el umbral máximo positivo y el umbral máximo negativo pueden ser +1 y -1. En forma alterna, cuando se utiliza procesador digital que representa los números en enteros, el umbral máximo positivo será 32768 correspondiente a 215, y el umbral máximo negativo será -32768 correspondiente a -215.
Ya que una señal de forma de onda en tiempo se representa por la secuencia de muestras, cada muestra es un número digital entre -32768 y +32768, es fácilmente claro que pueden obtenerse números superiores cuando por una cierta instancia de tiempo, el primer canal tiene un valor bastante elevado y el segundo canal también tiene un valor bastante elevado, y cuando estos valores bastante elevados se agregan en conjunto. Teóricamente, el número máximo que se obtiene por esta adición conjunta de los dos canales, puede ser 65536. Sin embargo, el procesador de señal digital no es capaz de representar este elevado númeío. Por el contrario, ei procesador digital sólo representará números iguales al umbral positivo máximo o el umbral negativo máximo. Por lo tanto, el procesador de señal digital realiza recorte en que un número superior o igual al umbral máximo positivo o el umbral máximo negativo se reemplaza por un número igual al umbral máximo positivo y el umbral máximo negativo, de manera tal que con respecto a la Figura 6, aparezca la situación ilustrada. Dentro de una porción del tiempo de recorte 62, la forma de onda 60 no tiene su forma natural (seno) pero se aplasta o recorta. Cuando esta forma de onda recortada se evalúa desde un punto de vista espectral, se vuelve claro que este recorte en dominio de tiempo resulta en fuertes componentes armónicos provocados por la alta magnitud de gradiente al inicio y al fin de la porción de tiempo de recorte 62. Este "recorte digital" no está relacionado a la configuración de reproducción, es decir el amplificador y las bocinas utilizadas para representación de la señal de audio. Sin embargo, cada combinación de amplifícador/bocma también tiene sólo un intervalo lineal limitado, y cuando este intervalo lineal se excede por una señal procesada, también se lleva cabo un tipo de recorte, que puede evitarse utilizando el concepto inventivo. En cualquier caso, la oc írrencia de recorte introduce fuertes distorsiones en la señal de audio, que degradan mucho la calidad de sonido percibido. De esta manera, la ocurrencia de recorte tiene que evitarse. Esto incluso es aún más, debido al hecho que la mejora de sonido al representar una señal de estéreo por una configuración de múltiples canales tales como un sistema de bocinas 5.1, es pequeña en comparación con las distorsiones de recorte muy molestas. Por lo tanto, cuando no se puede garantizar que no ocurra el recorte, se preferiría sólo utilizar las bocinas izquierda y derecha de una configuración de múltiples canales para representar una señal en estéreo o estereofónica . Existen soluciones en la técnica previa para superar este problema de recorte.
Una solución simple para superar este problema es reducir en escala todos los canales igualmente, a un nivel cuando ninguna señal de canal (en especial la señal central) exceda el límite de 0 dBFS. Esto puede realizarse estáticamente por un valor fijo predeterminado. En este caso, el valor fijo también debe ser válido para las situaciones del peor caso, en donde el canal Izquierdo y Derecho tienen niveles máximos. Para la conversión promedio LR a L'C'R', esto lleva a una versión significativamente más silenciosa L'C'R' que LR estéreo original, lo que es indeseable, especialmente cuando los usuarios cambian entre reproducción estéreo y de múltiples canales. Este comportamiento puede observarse en descodificadores de matriz comercialmente disponibles (Dolby ProLogicII y Logic7 Decoder) que pueden utilizarse como convertidores LR a L'C'R' . Ver la Publicación Dolby: "Dolby Surround Pro Logic II Decoder - Principies of Operation" , htp : //www. dolby . com/assets/pdf/tech_library/209 _Dolby_Surround_Pro_Logic_II_Decoder_Principles_of_Operation . pdf or Griesinger, D. : "Multichannel Matrix Surround Decoders for Two-Eared Listeners", lOlst AES Convention, Los Angeles, USA, 1996, Preprint 4402. Otra solución simple es utilizar compresión de intervalo dinámico, a fin de limitar en forma dinámica (dependiendo de la señal) la señal pico, en ocasiones referida como un "limitador". Una desventaja de este enfoque es que el intervalo dinámico real del programa de audio no es reproducido sino que es sujeto a compresión (ver Digital Audio Effects DAFX; Udo Zólzer, Editor; 2002; Wiley & Sons; p. 99ff : "Limiter") . El problema en reducción de escala es indeseable, ya que reduce el nivel o el volumen de la señal de sonido en comparación con el nivel de la señal original . Para evitar completamente cualquier ocurrencia incluso teórica de recorte, se tendrían que reducir en escala todos los canales por un factor de escala iguaZ a 0.5. Esto resulta en un nivel de salida fuertemente reducido de la señal de múltiples canales comparado con la señal original . Cuando sólo se escucha a esta señal de múltiples canales reducida en escala, se puede compensar esta reducción de nivel al incrementar la acción del amplificador de sonido. Sin embargo, cuando se cambia entre varias fuentes, la señal de estéreo (existente), aparecerán a un oyente como muy fuerte, cuando se reproduce utilizando la misma configuración del amplificador para la reproducción de múltiples canales. De esta manera, un usuario tendría que pensaran en reducir el ajuste de amplificación de su amplificador antes de cambiar de una representación de múltiples canales de una señal estéreo a una representación de estéreo real de la señal de estéreo a fin de no dañar sus oídos o el equipo. El otro método de la técnica previa que utiliza compresión de intervalo dinámico, evita efectivamente recorte. Sin embargo, se cambia la propia señal de audio. De esta manera, la compresión dinámica lleva a una señal de audio no auténtica que incluso cuando los artefactos introducidos no son muy molestos, es cuestionable desde el punto de vista de autenticidad. Un objeto de la presente invención es proporcionar un concepto mejorado para síntesis de múltiples canales utilizando dos canales de alimentación. Este objeto se logra por un aparato para sintetizar de acuerdo con la reivindicación 1, un método para sintetizar de acuerdo con la reivindicación 14, un programa de computadora de acuerdo con la reivindicación 15 o una representación de tres canales de acuerdo con la reivindicación 16. La presente invención se basa en el hallazgo de que para superar el problema de recorte y para lograr sin embargo las ventajas incurridas al reproducir una señal de estéreo utilizando tres o más canales de una configuración múltiples canales, el canal central generalmente se genera como es usual, es decir recibe eventos de sonidos ubicados en la mitad entre las bocinas izquierda y derecha, lo que también se denomina una representación "real central". Sin embargo, cuando el centro real entra al intervalo de recorte, sólo una porción de la energía de los componentes de señal que representan los eventos a la mitad de la configuración de audio, se alimenta al canal central. El resto de la energía de estos eventos de sonido se alimenta de nuevo a los canales primero y tercero (o izquierdo y derecho) o permanecer allí desde el inicio. De esta manera, para un cuadro de tiempo, cuando puede ocurrir recorte, cuando se realiza el procedimiento de conversión dos/tres ein modificaciones, el canal centr» 1 se ajusta en escala a nivel por debajo o igual a nivel máximo posible sin recortar. Sin embargo, la energía/parte faltante de la señal, que no puede representarse por el canal central, se reproduce con el canal izquierdo y el canal derecho como un "centro virtual" o "centro ficticio". La señal del centro real y el centro virtual se combinan entonces acústicamente durante la reproducción, volviendo a crear un centro pretendido sin recorte. Este "mezclado" del centro real y el centro virtual resulta en una imagen frontal más estable, mejorada de una señal de audio estéreo, es decir, en una zona de sonido óptimo, incrementada aunque la zona de sonido óptimo no es tan grande como cuando no hubiera un centro ficticio de hecho. Sin embargo, el proceso de la invención no tiene ningunos artefactos de recorte, ya que el resto de la energía no procesable dentro del segundo canal debido al problema de recorte no se pierde sino se representa por los canales izquierdo y derecho originales. Se nota aquí que, para cualesquiera situaciones, la energía de los canales izquierdo y derecho en la configuración de múltiples canales, es menor que la energía en los canales izquierdo y derecho originales, ya que la energía de canal central se toma de los canales izquierdo y cerecho . >-or lo tanto, aún cuando de acuerdo con la presente invención, una parte restante de la energía se alimenta de regreso a los canales de salida izquierdo y derecho, nunca existirá un problema de recorte en estos canales. Una ventaja adicional de la presente invención es que la generación de señal de la invención se realiza en una forma que, en una modalidad preferida, la energía total eléctrica o acústica de los tres canales de salida generados (y canales de salida adicionales generados opcionalmente tales como Ls , Rs, Cs, LFE, ...) se conserva respecto a la energía de la señal estéreo original. Puede ser garantizada la misma intensidad sonora percibida o volumen total independientemente de la forma de presentación de la señal, es decir si la señal se presenta utilizando una configuración estéreo que solo tiene dos bocinas o si la señal se representa usando una configuración de múltiples canales que tiene más de dos bocinas. Además, la generación de señal y distribución de energía de sonido de la invención al canal central y los canales izquierdo y derecho se aplica dinámicamente solo si sería inevitable el recorte, es decir el segundo canal central esté completamente sin cambio en situaciones, que no se afectan por recorte, es decir cuando los valores de muestreado del segundo canal permanecen por debajo o son solo igua.es al umbral máximo. Además, la combinación acústica resul ante del "centro real" y el "centro ficticio", produce una señal que es mucho más cercana a la configuración de tres canales óptima, es decir tres canales sien recorte o tres canales, en donde los valores de muestreado sin ningún umbral mínimo/máximo se permiten. La imagen de sonido de la invención por lo tanto en modalidades preferidas ni es diferente en nivel comparada con la señal de alimentación estéreo ni deja de ser auténtica como seria el caso cuando se utiliza un limitador o un recortador simple. Modalidades preferidas de la presente invención subsecuentemente se explican con respecto a los dibujos acompañantes en donde: La Figura 1 ilustra un aparato para sintetizar los canales superiores de acuerdo con la modalidad preferida de la presente invención; La Figura 2a es una modalidad preferida del generador de señales de la Figura 1, que tiene un post-procesador ; La Figura 2b es una implementación preferida del post -procesador de la Figura 2a; La Figura 3 es una modalidad adicional del generador de señal de la invención que tiene un control de conversión a dos canales iterativa, La Figura 4 es una modalidad adicional del generador de señal de la invención que opera completamente en el dominio de parámetros; La Figura 5 es un ejemplo para un sistema de sonido 5.1 que opcionalmente también tiene un canal central envolvente Cs; La Figura 6 es una ilustración de una forma de onda recortada; La Figura 7 es una ilustración esquemática de la situación de energía de la señal de alimentación de dos canales original y la señal de salida de tres canales antes y después de recorte; y La Figura 8 ilustra un analizador de canales de alimentación preferido. La Figura 1 ilustra una modalidad preferida de un aparato de la invención para sintetizar tres canales de salida utilizando dos canales de entrada, en donde un segundo canal de los tres canales de salida se pretende para una bocina en una configuración de reproducción de audio, que se ubica entre dos bocinas que se pretenden para recibir el primer canal de salida y el tercer canal de salida. Los canales de alimentación o de entrada se indican por 10a, este canal puede ser por ejemplo el canal izquierdo L, y 10b para el segundo canal, que puede ser ei canal derecho R. Los canales de salida se indican como 12a para el canal derecho, 12b para el canal central y 12c para el canal izquierdo. Canales de salida adicionales pueden generarse tales como el canal de salida envolvente izquierdo 14a, un canal de salida envolvente derecho 14b y un canal de mejora de baja frecuencia 14c. El arreglo de las bocinas correspondientes para estos canales, se ilustra en la Figura 5. A la mitad de estas bocinas 12a, 12b, 12c, 14a, 14b se encuentra una zona de sonido óptimo 50. Cuando un oyente se ubica dentro de la zona de sonido óptimo entonces tendrá una impresión óptima de sonido . Adicionalmente , se puede agregar un canal envolvente central 51 Cs, que se ubica entre el canal envolvente izquierdo 14a y el canal envolvente derecho 14a. La señal para el canal envolvente central 51 puede calcularse utilizando el mismo proceso que calcula la señal para el canal central 12b. Adicionalmente, los métodos de la invención por lo tanto también pueden aplicarse para el cálculo del canal envolvente central a fin de evitar el recorte en el canal envolvente central . Habrá de notarse que el proceso de la invención es utilizable para cada constelación de canales de audio en donde se utilizan dos canales de alimentación pretendidos para dos pociones espaciales diferentes en una configuración de reproducción, y en donde tres canales de salida se generan utilizando estos dos canales de alimentación, en donde el segundo canal de los tras canales se ubica entre dos bocinas adicionales en la configuración de reproducción, que se proporcionan con la primera y tercer señales de canal de alimentación . El aparato sintetizador de la invención de la Figura 1 incluye un analizador de canal de alimentación 15 para analizar los dos canales de alimentación a fin de determinar componentes de señal que ocurren en ambos canales de alimentación. Estos componentes de señal que ocurren en ambos canales de alimentación pueden utilizarse para construir el canal central real, es decir pueden representarse mediante el canal central C ilustrado en la Figura 5. Típicamente, una señal de estéreo incluye mucho de estos componentes de señal monofómca tales como un interlocutor o como cuando se consideran señales de música, un cantante o un solo instrumento ubicado frente a una orquesta y por lo tanto situado frente al auditorio. El aparato smtetizador de la invención adicionalmente incluye un generador de señal selectivo de tiempo y de frecuencia y además dependiente de señal 16, para generar los tres canales de salida 12a, 12b, 12c utilizando los dos canales de entrada 10a, 10b e información en componentes de señal detectados que ocurre en ambos canales de alimentación, como se proporciona mediante la línea 13. Particularmente, el generador de señal de la invención es operativo para alimentar componentes de señal detectados al menos parcialmente al segundo canal. Además, el generador es operativo para solo alimentar una porción de los componentes de señal detectados en el segundo canal, cuando existe una situación en donde una alimentación completa de los componentes de señal detectados resultará en exceder el umbral máximo. De esta manera, el segundo canal de salida tiene una porción de tiempo que solo incluye una parte de los componentes de señal detectados para evitar recorte, mientras que en una porción diferente del segundo canal de salida, los componentes de señal detectados completos se han alimentado al segundo canal de salida. El resto de los componentes de señal detectados se incluye en el primer y tercer canales de salida y por lo tanto para el "centro ficticio", cuando estos canales son representados mediante la configuración de bocinas por ejemplo mostrada en la Figura 5. Dependiendo de la implementación del concepto inventivo, la "porción" de los componentes de señal detectados ubicados en el segundo canal, y el resto de los componentes de señal detectados ubicados en el primer y tercer canales, pueden ser una porción de energía o porción de frecuencia o cualquier otra porción, de manera tal que el segundo canal solo incluye una porción de los componentes de señal detectados y no tenga ningún valor sobre el umbral máximo y por lo tanto no induzca, distorsiones de recorte. La Figura 2a ilustra una modalidad preferida del analizador de señal de la invención 16 de la Figura 1. Particularmente, en la modalidad de la Figura 2a, el analizador de señal incluye un convertidor 2-3 16 que realiza un proceso de conversión controlado por el analizador de canales de entrada 15 de la Figura 1. La salida del convertidor 2-3, L, R, C son canales convertidos. Sin embargo, el canal C puede estar sometido a recorte, ya que el canal C se genera utilizando un proceso de adición, en donde los componentes de señal del canal izquierdo y del canal derecho se agregan en conjunto. El canal central C se alimenta en un detector de recorte 16d, que alimenta a un post-procesador 16c, que también recibe información en componentes de señal detectados. Particularmente, el detector de recorte 16b es operativo para examinar la forma de onda de tiempo del canal central 12c. Dependiendo de la implementación, el detector de recorte puede construirse en formas diferentes. Cuando se considera que el generador de señal de la Figura 2A puede procesar números que tienen una magnitud superior a un umbral a máximo predeterminado, entonces el detector de recorte 16b simplemente examina la forma de onda en tiempo para ver, si existen números superiores que el umbral máximo de la etapa de procesamiento subsecuente. Cuando se detecta dicha situación, el post-procesador se activa mediante la línea de activación 16c para empezar el post-procesamiento, de manera tal que la energía de canal central se reduzca y la energía de los canales izquierdo y derecho se incrementa, de modo tal que los tres canales de salida 12a, 12b, 12c finalmente se envían de salida de salida por el post-procesador 16c. De esta manera, de acuerdo con la modalidad de la Figura 2a, el proceso de conversión LR a LCR se realiza como es usual. La señal de canal central de primera etapa interna 20b se analiza para verificar si ocurrirá recorte si se va a enviar de salida como una señal externa tal como un formato AES/EBU o como SPDIF. Cuando esto sucede, una parte de la señal 20b se retira en el post-procesador 16c resultando en una señal de canal central modificada 12b y distribuida en su lugar a los canales izquierdo y derecho intermedios 20a, 20c como una contribución "centro ficticio" . Después del post-procesamiento, la señal de canal central 12b de nuevo está por debajo de 0 dLFS . una modalidad preferida del post-procesador 16c se ilustra en la Figura 2b. El canal central 20b después de que el convertidor 16a se alimenta a un extractor parcial 25. El extractor parcial recibe información 13 de los componentes de señal detectados y una señal de control por la línea 16d del detector de recorte, que también puede incluir una indicación de una cantidad de extracción. En forma alterna, la cantidad de extracción por etapa de iteración puede fijarse independiente de que ocurra cualquier recorte, y un proceso iterativo de prueba/error puede aplicarse para extraer cantidades crecientes de los componentes de señal detectados en una forma de etapa-por-etapa, hasta que el detector de recorte 16b no detecte más recorte. Después, el canal central modificado 12b se envía de salida por el extractor parcial, y el resto de los componentes de señal detectados correspondientes a la parte extraída tienen que ser redistribuidos a los canales izquierdo y derecho 20c, 20a que se envían de salida por el convertidor después de multiplicar por 0.5. Para este objetivo, el post-procesador incluye dos multiplicadores 26 en cada ramificación o un multiplicador sencillo antes de ramificación, un sumador izquierdo 27a y un sumador derecho 27b. Cuando la detección de los componentes de señal ocurre en ambos canales de alimentación h. sido perfecta, entonces los canales izquierdo y derecho 20a, 20c no incluyen ningún "centro ficticio" . Sin embargo, al agregar los componentes extraídos (después de multiplicación por 0.5) a estos canales, se agrega un centro ficticio a los canales izquierdo y derecho. Subsecuentemente, una modalidad adicional de la presente invención y particularmente del generador de señal 16 de la Figura 1 se discute en conexión con la Figura 3. Los canales de alimentación se envían al convertidor 2-3 controlable, que recibe información en componentes de señal detectados para generar tres canales de salida en una primera etapa de iteración controlado por un controlador de iteración 30. La primera etapa será igual a la operación del convertidor en la Figura 2a, es decir el canal central 20b puede tener problemas de recorte. Esta situación de recorte será detectada por un detector de recorte 16b. En contraste con la modalidad de la Figura 2a, el detector de recorte 16b controla el convertidor 16a en una forma de retroalimentación mediante la línea de control del convertidor 31 para cambiar la regla de conversión en una cierta forma, de manera tal que el canal central generado 20b recibe, después de una o más etapas iteración como se controla por el controlador de iteración 30, solamente una porción permitida de los componentes de señal detectados, de manera tril que no ocurra más recorte . De esta manera, la modalidad de la Figura 3 ilustra un proceso iterativo. En un primer paso del proceso iterativo, la operación del convertidor se realiza como es usual. A la salida, un detector 16b verifica si ocurre recorte. Cuando se detecta recorte, este marco de tiempo se procesa de nuevo, ahora utilizando el proceso de re-mapeado o re-cartografiado y utilizando re-direccionamiento de una parte de la energía de señal central a los canales izquierdo y derecho como una contribución al centro ficticio. La modalidad de la Figura 4 opera completamente en el dominio de parámetros. Para este objetivo, se proporciona un calculador de parámetros de convertidor 40, que se conecta a un cambiador de parámetros 41. Adicionalmente , se proporciona un detector de recorte 42, que es operativo para examinar los canales izquierdo y derecho originales o los parámetros del convertidor calculados para encontrar, si ocurrirá recorte o no, después de un proceso de conversión simple o directo. Cuando el detector de recorte 42 detecta un peligro de recorte, controla un cambio de parámetro 41 mediante una línea de control 44 para proporcionar parámetros de conversión cambiados, que se proporcionan a un convertidor directo 16a, que entonces genera el primer, segundo y tercer canales de salida de manera tal que no ocurra recorte en el segundo canal y para un cuadro de tiempo o marco de tiempo en donde el detector de recorte 42 ha detectado originalmente un problema de recorte, los canales izquierdo y derecho 12c, 12a, tienen una contribución de centro ficticio. En contraste con las modalidades de la Figura 2 y la Figura 3, el proceso de la invención se lleva a cabo con base en parámetros de procesamiento, que se utilizan para derivar las señales de salida 20a, 20b, 20c o 12a, 12b, 12c de las señales estéreo de alimentación. De esta manera, para proporcionar implementaciones con aún menor complejidad computacional , también la detección de recorte y la manipulación de los niveles de señal o parte de ella o parte de estos se basa en los parámetros de procesamiento. Esto es en contraste con las modalidades de las Figuras 2 y 3, en donde el proceso de la invención se lleva a cabo en señales de canal de audio actuales que ya se habían creado para el canal central, después de que pudiera detectarse un posible recorte. El control/detección de recorte de la invención pueden realizarse por post-procesamiento . De esta manera, los parámetros de conversión pretendidos se analizan y modifican de acuerdo con el concepto de la invención, para proporcionar recorte después de la síntesis de las señales de audio de salida actual . Una forma alterna para controla, el cambio de parámetios 41 es mediante una forma iterativa. Parámetros de conversión pretendidos se analizan. Cuando después de la síntesis de la señal de audio real puede ocurrir recorte, los parámetros de conversión se modifican. Entonces, el proceso se inicia de nuevo y finalmente, las señales de canal de salida se sintetizan sin ningún recorte y con contribuciones de centro real y centro ficticio en los canales correspondientes. Subsecuentemente, se discutirá una implementación preferida del analizador de canal de alimentación. Para este objetivo, se hace referencia a la Figura 8, que ilustra este analizador de canales de alimentación preferido 15. Antes que nada, cuadros de superposición o subsecuentes que se siguen entre sí, se generan utilizando un bloque de formación de ventanas 80, de manera tal que a la salida del bloque 80, hay en la línea 81a, un bloque de valores del canal izquierdo y en la línea 81b, un bloque de valores de canal derecho. Después, se realiza un análisis de frecuencia para cada bloque individualmente. Para este objetivo, un analizador de frecuencia 82 se proporciona para cada canal . El analizador de frecuencia puede ser cualquier dispositivo para generar una representación de dominio de frecuencia de una señal de dominio de tiempo. Este analizador de frecuencia puede incluir una ' ransforn ada Fourier de corto plazo, un algoritmo FFT, o una transformada MDCT o cualquier otro dispositivo de transformación. En forma alterna, el bloque analizador de frecuencia 82 también puede incluir un banco de filtros sub-banda para generar por ejemplo 32 canales sub-banda o un número superior o inferior de canales sub-banda de un bloque de valores de señal de alimentación. Dependiendo de la implementación del banco de filtros de sub-banda, la funcionalidad del dispositivo de cuadros 80 y el bloque de análisis de frecuencia 82 puede implementarse en un banco de filtros sub-banda implementado digitalmente , sencillo. Después, una correlación cruzada a manera de banda se realiza como se indica por el dispositivo 84. De esta manera, el dispositivo de correlación cruzada determina una medida de correlación cruzada entre bandas correspondientes, es decir, bandas que tienen el mismo índice de frecuencia. La medida de correlación cruzada determinada por el bloque 84 puede tener un valor entre 0 y 1, en donde 0 indica que no hay correlación, y en donde 1 indica correlación completa. Cuando el dispositivo 84 envía de salida una medida de correlación cruzada baja, esto significa que los componentes de canal izquierdo y derecho en la banda respectiva son diferentes entre sí, de manera tal que esta banda no incluye componentes de señal que ocurren en ambas bandas,, que deberá insertarse en un canal central. Cuando sin embargo, la medida de correlación cruzada es alta, indicando que las señales en ambas bandas son muy similares entre sí, entonces esta banda tiene un componente de señal que ocurre en los canales izquierdo y derecho, de manera tal que esta banda deberá insertarse en el canal central . Un criterio adicional para decidir si señales en banda son similares entre sí, es la energía de señal. Por lo tanto, la modalidad preferida del analizador de los canales de alimentación de la invención, incluye un calculador de energía a manera de banda 85, que calcula la energía en cada banda y que envía de salida una medida de similaridad de energía indicando si las energías en las bandas correspondientes son similares entre sí o diferentes entre sí . La medida de similaridad de energía que se envía de salida por el dispositivo 85 y la medida de correlación cruzada que se envía de salida por el dispositivo 84, ambas se alimentan en una etapa de decisión final 86, que llega a una conclusión, que en un cierto cuadro, una cierta banda i ocurre en ambos canales o no. Cuando la etapa de decisión 86 determina que la señal ocurre en ambos canales, entonces esta porción de señal se alimenta al canal central para generar un "centro real " . La Figura 8 muestra una modalidad para implementar el analizador de canales de alimentación. Modalidades adicionales se conocen en la técnica y por ejemplo, ilustran en "Spatial enhancement of audio recordings", Jot and Avendano, 23rd International AES Conference, Copenhagen, Dinamarca, mayo 23-25, 2003. Particularmente, otros métodos para analizar dos canales para encontrar componentes de señal en estos canales, incluyen métodos de análisis estadístico o analítico, tales como el análisis de componente principal o el análisis de subespacio independiente u otros métodos conocidos en la técnica de análisis de audio. Todos estos métodos tienen en común que detectan componentes de señal que ocurren en ambos canales, los que deberán alimentarse en un canal central para generar un centro real . Subsecuentemente, se hace referencia a la Figura 7 para ilustrar una situación de energía antes y después que un proceso de conversión dos-tres sea implementado por el convertidor dos-tres 16a en las Figuras. Un canal de alimentación izquierdo L ilustrado 70 en la Figura 7 tiene una cierta energía. En este ejemplo, el canal de alimentación derecho de los dos canales de alimentación estéreo tiene una energía diferente (menor) como se ilustra en 71. Se considera que el analizador de canal ha encontrado que hay componentes de señal que ocurren en ambos canales. Estos componentes de señal que ocurren en ambos canales, tienen una energía como se ilustra en 72 en la Figura 7. Cuando toda la energía 72 se alimenta al canal central como se ilustra en 73, la energía de canal central sería aproximadamente un límite de energía, en donde el límite de energía cuando menos ilustra aproximadamente que la señal que tiene ésta alta energía tiene valores de amplitud sobre el umbral máximo de amplitud. Por lo tanto, solo una porción de la energía 72 se alimentan en el centro real, mientras que la porción excedente igualmente se (re- ) distribuye a los canales izquierdo y derecho sintetizados L' y R' como se ilustra por las flechas 76. En este contexto, habrá de notarse que hay diferentes formas para redistribuir energía del canal central, de regreso a los canales izquierdo y derecho o para introducir una cantidad correcta de energía desde un canal izquierdo original y un canal derecho original al canal central. Por ejemplo, se puede reducir en escala todos los componentes de señal detectados por un cierto factor de reducción de escala e introducir la señal reducida en escala al canal central . Esto tendría consecuencias iguales para los componentes de señal en cada banda, cuando se aplica un análisis selectivo de frecuencia. En forma alterna, también puede realizar un control de energía en banda. Esto significa que cuando se han detectado por ejemplo 10 bandas que tienen componentes de señal detectados, se pueden introducir solo 5 bandas en el canal central y dejar las 5 bandas restantes en los canales izquierdo y derecho, a fin de reducir la energía en el canal central. Dependiendo de ciertos requerimientos de implementación de los métodos de la invención, el método de la invención puede implementarse en equipo físico o en soporte lógico. La implementación puede realizarse utilizando un medio de almacenamiento digital, en particular un disco o un CD, que tiene señales de control legibles electrónicamente almacenadas, que pueden cooperar con un sistema de computadora programable tal que el método de la invención se realice. En general, la presente invención por lo tanto es un producto de programa de computadora con un código de programa almacenado en un portador legible por máquina, el código de programa se configura para realizar el método de la invención, cuando el producto de programa de computadora se ejecuta en una computadora. En otras palabras, la invención también es un programa de computadora que tiene un código de programa para realizar el método de la invención, cuando el programa de computadora se ejecuta en una computadora.

Claims (14)

  1. REIVINDICACIONES 1. Aparato para sintetizar tres canales de salida utilizando dos canales de entrada o de alimentación, en donde un segundo canal de los tres canales de salida se alimenta a una bocina en un esquema de representación de audio pretendida, que se ubica entre dos bocinas que se alimentan con el primer canal de salida y el tercer canal de salida, que comprende: un analizador para análisis de los dos canales de alimentación, para detectar componentes de señal que ocurren en ambos canales de alimentación para obtener componentes de señal detectados; y un generador de señal,-para generar los tres canales de salida utilizando los dos canales de entrada, en donde el generador de señal comprende: un convertidor dos -tres, para generar al menos un segundo canal intermedio incluyendo al menos una porción de los componentes de señal detectados; un detector de recorte, para detectar una porción del segundo canal que tiene una amplitud sobre el umbral máximo; y un controlador de convertidor dos-tres para controlar al convertidor dos-tres de manera tal que solo una porción de los componentes de señal detectados se alimente al segundo canal y el resto de los componentes de señal permanezca ubicado en el primer y el tercer canales de salida, cuando una alimentación completa de los componentes de señal detectados resulta en exceder un umbral máximo para el segundo canal .
  2. 2. Aparato de conformidad con la reivindicación 1, caracterizado porque el generador de señal es operativo para generar los tres canales de salida, de manera tal que para un cierto periodo de tiempo, una energía total de los tres canales de salida y potencialmente canales de salida adicionales generados, sea igual a una señal eléctrica o acústica de los dos canales de entrada.
  3. 3. Aparato de conformidad con la reivindicación 1 o 2, caracterizado porque el generador de señal es operativo para generar el segurdo canal de salida, de manera tal que la porción de los componentes de señal detectados alimentados al segundo canal es tan grande como sea posible, de manera tal que una energía del segundo canal de salida, que incluye solo porción de los componentes de señal detectados siempre tiene una amplitud máxima por debajo de o igual al umbral máximo.
  4. 4. Aparato de conformidad con cualquiera de las reivindicaciones precedentes, caracterizado porque el generador de señal se adapta de manera tal que el resto de los componentes de señal detectados, que no está en el segundo canal, se incluye en el primer y tercer canales.
  5. 5. Aparato de conformidad con cualquiera de las reivindicaciones precedentes, caracterizado porque el umbral máximo es una amplitud a escala completa determinada por el aparato para sintetizar o un dispositivo de procesamiento digital o analógico conectado al aparato para sintetizar.
  6. 6. Aparato de conformidad con la reivindicación 5, caracterizado porque el umbral máximo es igual al valor de muestreado positivo o negativo máximo permisible de una forma de onda de dominio de tiempo de una señal .
  7. 7. Aparato de conformidad con cualquiera de las reivindicaciones precedentes, caracterizado porque el analizador es operativo para determinar una medida de correlación cruzada entre al menos una porción del primer canal de alimentación y el segundo canal de alimentaciór y para detectar una porción que tiene una medida de correlación cruzada sobre un umbral de similaridad
  8. 8. Aparato de conformidad con cualquiera de las reivindicaciones precedentes, caracterizado porque el analizador es operativo para detectar una energía de una porción del primer canal y una porción del segundo canal y para detectar porciones de los canales que tienen energías iguales o diferentes en menos de un umbral de igualdad.
  9. 9. Aparato de conformidad con cualquiera de las reivindicaciones precedentes, caracterizado porque el analizador y el generador de señal son operativos para realizar un análisis y síntesis selectivos de tiempo o selectivos de frecuencia.
  10. 10. Aparato de conformidad con cualquiera de las reivindicaciones precedentes, caracterizado porque el primero y segundo canales son un canal izquierdo y un canal derecho de una representación en estéreo de una señal de audio, y en donde los tres canales de salida son un canal izquierdo frontal, un canal central y un canal derecho frontal, o un canal izquierdo posterior, un canal central posterior y un canal derecho posterior.
  11. 11. Método para sintetizar tres canales de salida utilizando dos canales de alimentación, en donde un segundo canal de los ties canaies de salida se alimejua a un bocina en un esquema de representación de audio pretendido, que se ubica entre dos Poemas que se alimentan con el primer canal de salida y el tercer canal de salida, que comprende: analizar los dos canales de entrada, para detectar componentes de señal que ocurren en ambos canales de alimentación; y generar los tres canales de salida utilizando los dos canales de alimentación, en donde la etapa de generar comprende : generar al menos un segundo canal intermedio que incluye al menos una porción de los componentes de señal detectados; detectar una porción del segundo canal que tiene una amplitud sobre el umbral máximo; y controlar la etapa de generar de manera tal que solo una porción de los componentes de señal detectados se alimente al segundo canal y un resto de los componentes de señal permanezca ubicado en el primer y tercer canales de salida, cuando una alimentación completa de los componentes de señal detectados resulte en exceder un umbral máximo para el segundo canal .
  12. 12. Aparato para sintetizar tres canales de salida utilizando dos canales de alimentación, en donde un segundo canal de los tres canales de salida se alimenta a una bocina en un esquema de representación de audio pretendida, que se ubica entre dos bocinas que se alimentan con el primer canal de salida y el tercer canal de salida, que comprende: un analizador para los dos canales de alimentación, para detectar componentes de señal que ocurren en ambos canales de alimentación, para obtener los componentes de señal detectados; y un generador de señal, para generar los tres canales de salida utilizando los dos canales de alimentación, en donde el generador de señal comprende: un detector de recorte, para determinar una porción de los canales de alimentación, en donde hay probabilidad de recorte; un convertidor dos-tres para generar tres canales intermedios, en donde un segundo canal intermedio incluye al menos una porción de los componentes de señal detectados; y un controlador para el convertidor dos- tres, de manera tal que un parámetro de generación para convertir la porción determinada por el detector de recorte, se controla de manera tal que el segundo canal siempre tiene una amplitud inferior o igual al umbral máximo.
  13. 13. Método para sintetizar tres canales de salida utilizando dos canales de alimentación o de entrada, en donde un segundo canal de los tres canales de salida se alimenta a una bocina en un esquema de representación de audio pretendido, que se ubica entre dos bocinas que se alimentan con el primer canal de salida y el tercer canal de salida, que comprende: analizar los dos canales de entrada para detectar componentes de señal que ocurren en ambos canales de entrada; y generar los tres careles de salida utilizando los dos canales de alimentación o de entrada, en donde la etapa de generar comprende: determinar una porción de los canales de entrada, en donde hay probabilidad de recorte; generar tres canales intermedios, en donde un segundo canal intermedio incluye al menos una porción de los componentes de señal detectados; y controlar la etapa de generar, de manera tal que un parámetro de generación para conversión de la porción determinada por el detector de recorte, se controla de manera tal que el segundo canal siempre tenga una amplitud inferior o igual al umbral máximo.
  14. 14. Programa de computadora para realizar, cuando se ejecuta en una computadora, un método para sintetizar de acuerdo con la reivindicación 11 o 13.
MX/A/2008/008039A 2008-06-19 Aparato y metodo para sintetizar tres canales de salida, utilizando dos canales de alimentacion MX2008008039A (es)

Publications (1)

Publication Number Publication Date
MX2008008039A true MX2008008039A (es) 2008-09-26

Family

ID=

Similar Documents

Publication Publication Date Title
EP1964442B1 (en) Apparatus and method for synthesizing three output channels using two input channels
US9326085B2 (en) Device and method for generating an ambience signal
US5065432A (en) Sound effect system
EP2191463B1 (en) A method and an apparatus of decoding an audio signal
CN110832881B (zh) 立体声虚拟低音增强
US9913036B2 (en) Apparatus and method and computer program for generating a stereo output signal for providing additional output channels
US7760886B2 (en) Apparatus and method for synthesizing three output channels using two input channels
US6882733B2 (en) Surround headphone output signal generator
JP5268581B2 (ja) 低域補完装置
MX2008008039A (es) Aparato y metodo para sintetizar tres canales de salida, utilizando dos canales de alimentacion
RU2384973C1 (ru) Устройство и способ синтезирования трех выходных каналов, используя два входных канала
US20140098651A1 (en) Recording apparatus with mastering function
KR20200017969A (ko) 오디오 장치 및 그 제어방법