MXPA05012785A - Metodo, aparato y programa de computadora para el calculo y ajuste de la sonoridad percibida de una senal de audio. - Google Patents

Metodo, aparato y programa de computadora para el calculo y ajuste de la sonoridad percibida de una senal de audio.

Info

Publication number
MXPA05012785A
MXPA05012785A MXPA05012785A MXPA05012785A MXPA05012785A MX PA05012785 A MXPA05012785 A MX PA05012785A MX PA05012785 A MXPA05012785 A MX PA05012785A MX PA05012785 A MXPA05012785 A MX PA05012785A MX PA05012785 A MXPA05012785 A MX PA05012785A
Authority
MX
Mexico
Prior art keywords
loudness
signal
sonority
calculation
perceptual
Prior art date
Application number
MXPA05012785A
Other languages
English (en)
Inventor
Brett Graham Crockett
Original Assignee
Dolby Lab Licensing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby Lab Licensing Corp filed Critical Dolby Lab Licensing Corp
Publication of MXPA05012785A publication Critical patent/MXPA05012785A/es

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/27Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/005Combinations of two or more types of control, e.g. gain control and tone control of digital or coded signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G5/00Tone control or bandwidth control in amplifiers
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G5/00Tone control or bandwidth control in amplifiers
    • H03G5/005Tone control or bandwidth control in amplifiers of digital signals
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G9/00Combinations of two or more types of control, e.g. gain control and tone control
    • H03G9/02Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers
    • H03G9/025Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers frequency-dependent volume compression or expansion, e.g. multiple-band systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Television Receiver Circuits (AREA)
  • Circuits Of Receivers In General (AREA)

Abstract

Una funcion o una combinacion de dos o mas funciones de moldeo de sonoridad especifica seleccionadas a partir de un grupo de dos o mas de estas funciones son empleadas para el calculo de la sonoridad perceptual de una senal de audio. La funcion o funciones pueden ser seleccionadas, por ejemplo, por una medicion del grado en el cual la senal de audio es de banda angosta o banda ancha. En forma alterna o con esta seleccion de un grupo de funciones, es calculado un valor de ganancia G[t], esta ganancia cuando es aplicada a la senal de audio, origina una sonoridad percibida que es sustancialmente la misma que en una sonoridad de referencia. El calculo de la ganancia emplea un ciclo de procesamiento iterativo que incluye el calculo de la sonoridad perceptual. La figura mas representativa de la invencion es la numero 3.

Description

METODO, APARATO Y PROGRAMA DE COMPUTADORA PARA EL CALCULO Y AJUSTE DE LA SONORIDAD PERCIBIDA DE UNA SEÑAL DE AUDIO Campo de la Invención La presente invención se refiere a mediciones de sonoridad de señales de audio y a los aparatos, métodos y programas de computadora para controlar la sonoridad de las señales de audio en respuesta a estas mediciones.
Técnica Anterior La sonoridad es un atributo subjetivamente percibido de la sensación auditiva mediante la cual el sonido puede ser ordenado en una escala que se extiende de silencio a sonido fuerte . Debido a que la sonoridad es una sensación percibida por un escucha, ésta no es adecuada para dirigir la medición física, por lo tanto, hace difícil su cuantificación. Además, debido al componente perceptual de la sonoridad, diferentes escuchas con una audición "normal" podrían tener distintas percepciones del mismo sonido. El único modo para reducir las variaciones introducidas por la percepción individual y para llegar a una medición general de la sonoridad del material de audio es conjuntar un grupo de escuchas y derivar una figura de sonoridad, o mediante un rango en forma estadística. Esto es claramente un procedimiento impráctico para las mediciones estándares de sonoridad de día-con-día.
Han existido muchos intentos para desarrollar un método satisfactorio y objetivo de medición de la sonoridad. Fletcher y Munson determinaron en 1933 que la audición humana es menos sensitiva en las bajas y altas frecuencias que a las frecuencias medias (o de voz) . Ellos también encontraron que el cambio relativo en sensibilidad disminuía a medida que el nivel del sonido aumentaba. Un medidor anterior de la sonoridad consistía de un micrófono, un amplificador, un medidor y una combinación de filtros diseñados para imitar burdamente la respuesta de frecuencia de la audición en niveles de sonido bajos, medios y altos. Aún cuando estos dispositivos proporcionaban una medición de la sonoridad de un nivel constante único, las mediciones aisladas de tono de sonidos más complejos no combinaban muy bien con las impresiones subjetivas de la sonoridad. Los medidores de nivel de sonido de este tipo han sido estandarizados aunque sólo son usados para tareas específicas, tal como el monitoreo y el control del ruido industrial . A principios de 1950, Zwicker y Stevens, entre otros, extendieron el trabajo de Fletcher y Munson para desarrollar un modelo más realista del proceso de percepción de la sonoridad. Stevens publicó el método "Calculation of the Loudness of Complex Noise" en Journal of the Acoustical Society of the America en 1956, y Zwicker publicó su artículo "Psychological and Methodical Basis of Loudness" en Acústica 1958. En 1959 Zwicker publicó un procedimiento gráfico para el cálculo de la sonoridad, así como también varios artículos similares muy poco tiempo después. Los métodos de Stevens y Zwicker fueron estandarizados como ISO 532, partes A y B (de manera respectiva) . Ambos métodos incorporan el fenómeno estándar psico-acústico, tal como el patrón de bandas críticas, el enmascaramiento de frecuencia y la sonoridad específica. Los métodos están basados en la división de sonidos complejos en componentes que caen dentro de las "bandas críticas" de frecuencias, permitiendo la posibilidad que algunos componentes de señal enmascaren a otros, y la adición de la sonoridad específica en cada banda crítica para llegar a la sonoridad total del sonido. Una investigación reciente, como es evidenciado en "Investigation into Loudness of Advertisements" de la Autoridad Australiana de Radiodifusión (ABA) (Julio del 2002) , ha mostrado que muchos anuncios (y algunos programas) se perciben que se escuchan demasiado fuerte con relación a otros programas, y por lo tanto, son muy molestos para los escuchas . La investigación de ABA sólo es el intento más reciente para dirigir el problema que ha existido durante años virtualmente a través de todo el material de radiodifusión y de todos los países . Estos resultados muestran que la molestia de la audiencia debido a la inconsistencia de la sonoridad a través del material del programa, podría ser reducida o eliminada, si fueran confiables, y que podrían ser realizadas y utilizadas, mediciones consistentes de la sonoridad del programa para reducir las molestas variaciones de la sonoridad. La escala de Bark es una unidad de medición utilizada en el concepto de las bandas críticas. La escala de banda crítica está basada en el hecho que la audición humana analiza un espectro amplio en partes que corresponden con subbandas críticas más pequeñas . La adición de una banda crítica a la siguiente, es de tal modo que el límite superior de la banda inferior crítica sea el límite inferior de la siguiente banda crítica más alta, lo que conduce a la escala de la relación de banda crítica. Si las bandas críticas fueron adicionadas de este modo, entonces una cierta frecuencia correspondería con cada punto de cruce . La primera banda crítica se extiende en el intervalo de 0 a 100 Hz, la segunda de 100 Hz a 200 Hz, la tercera de 200 Hz a 300 Hz y así sucesivamente hasta los 500 Hz en donde aumenta el intervalo de frecuencia de cada banda. El intervalo de frecuencia audible de 0 a 16 kHz puede ser subdividido en 24 bandas críticas de apoyo, las cuales aumentan el ancho de banda con el incremento de la frecuencia. Las bandas críticas son numeradas del 0 al 24 y tienen la unidad "B rk", que define la escala de Bark. La relación entre la velocidad de la banda critica y la frecuencia es importante para el entendimiento de muchas características del oído humano. Véase por ejemplo, Psychoacoustics-Facts and Models de E. Zwicker y H. Fastl, Springer-Verlag, Berlín, 1990. La escala del Ancho de Banda Equivalente Rectangular (ERB) es un modo para la medición de la frecuencia de la audición humana que es similar a la escala de Bark. Desarrollada por Moore, Glasberg y Baer, ésta es un refinamiento del trabajo de sonoridad de Zwicker. Véase Moore, Glasberg y Baer (B. C. J. Moore, B. Glasberg, T. Baer, "A Model for the Prediction of Thresholds, Loudness, and Partial Loudness," Journal of the Audio Engineeríng Society, Vol. 45, No.4, Abril de 1997, p . 224-240). La medición de las bandas críticas por debajo de 500 Hz es difícil debido a que en estas bajas frecuencias, la eficiencia y sensibilidad del sistema auditivo humano disminuye con rapidez. Las mediciones mejoradas del ancho de banda del filtro auditivo han conducido a la escala de proporción o razón-ERB. Estas mediciones utilizaban marcadores de ruido . de muesca para medir el ancho de banda de filtro auditivo. En general, para la escala ERB, el ancho de banda de filtro auditivo (expresada en unidades de ERB) es más pequeño que en la escala de Bark. La diferencia se vuelve más grande para frecuencias más bajas. La selectividad de frecuencia del sistema auditivo humano puede ser aproximada al subdividir la intensidad del sonido en partes que caen dentro de las bandas críticas. Esta aproximación conduce a la noción de las intensidades de banda critica. Si en lugar de una pendiente infinitamente inclinada de los filtros hipotéticos de banda crítica, fuera considerada la actual pendiente producida en el sistema auditivo humano; entonces, este procedimiento conduciría a un valor intermedio de intensidad denominado como excitación. En gran medida, estos valores no son utilizados como valores lineales sino como valores logarítmicos similares al nivel de presión de sonido. Los niveles de banda crítica y de excitación son los valores correspondientes que juegan un papel importante en muchos modelos como valores intermedios (Véase Psychoacoustics-Facts and Models, supra) . El nivel de la sonoridad podría ser medido en unidades de "fonio" (es decir, la unidad de medida de la sonorización) . Un 'fonio es definido como la sonoridad percibida de una onda sinusoidal pura de 1 kHz reproducida en un nivel de presión de sonido de 1 dB (SPL) , que corresponde con la raíz de la presión cuadrática media de 2xl0~5 Paséales. N fonios es la sonoridad percibida de un tono de 1 kHz reproducido en N dB SPL. Utilizando esta definición en comparación con la sonoridad de . los tonos en frecuencias distintas de 1 kHz con un tono en 1 kHz, el contorno de igual sonoridad puede ser determinado para un nivel dado de fonio.
La Figura 7 muestra contornos iguales de nivel de sonoridad para frecuencias entre 20 Hz y 12.5 kHz, y para niveles de fonios entre 4.2 fonios (se considera que es el umbral de audición) y 120 fonios (IS0226: 1987 (E) , "Acoustics-Normal Equal Loudness Level Contours") . El nivel de sonoridad también puede ser medido en unidades de "sonio" . Existe un mapeo de uno-a-uno entre las unidades de fonio y las unidades de sonio, como se indica en la Figura 7. Un sonio es definido como la sonoridad de una onda sinusoidal pura de 1 kHz reproducida en un nivel de presión de sonido de 40 dB (SPL) y es equivalente a 40 fonios . Las unidades de sonio son de manera que un incremento de dos veces en sonios corresponde con el doble de la sonoridad percibida. Por ejemplo, 4 sonios son percibidos como el doble de fuerte que 2 sonios. Por lo tanto, es más informativo si se expresan los niveles de sonoridad en sonios . Debido a que el sonio es una medida de la sonoridad de una señal de audio, la sonoridad específica es simplemente la sonoridad por unidad de frecuencia. De esta manera, cuando se utiliza la escala de frecuencia de Bark, la sonoridad específica tiene unidades de sonio por Bark y del mismo modo, cuando se utiliza la escala de frecuencia ERB las unidades son de sonio por ERB. A través del resto de este documento, los términos tales como "filtro" o "banco de -filtros" son utilizados en la presente para incluir esencialmente cualquier forma de filtrado recursivo y no recursivo tal como los filtros IIR o las transformadas, y la información "filtrada" es el resultado de la aplicación de estos filtros. Las modalidades descritas más adelante emplean bancos de filtros implementados mediante filtros IIR y transformadas.
Descripción de la Invención De acuerdo con un aspecto de la presente invención, un método que procesa una señal de audio incluye la producción, en respuesta a la señal de audio, de una señal de excitación y el cálculo de la sonoridad perceptual de la señal de audio en respuesta a la señal de excitación y una medición de las características de la señal de audio, en donde el cálculo selecciona, a partir de un grupo de dos o más funciones del modelo de sonoridad específica, o una combinación de dos o más funciones de modelo de sonoridad específica, la selección de las cuales es controlada a través de la medición de las características de la señal de entrada de audio . De acuerdo con otro aspecto de la presente invención, un método que procesa una señal de audio incluye la producción, en respuesta a la señal de audio, de una señal de excitación, y el cálculo, en respuesta al menos a la señal de excitación, de un valor de ganancia G[t] , el cual, si fuera aplicado a la señal de audio, podría originar una sonoridad percibida que es sustancialmente la misma que la sonoridad de referencia, el cálculo incluye un ciclo de procesamiento iterativo que comprende al menos un proceso no lineal . De acuerdo todavía con otro aspecto de la presente invención, un método para procesar una pluralidad de señales de audio incluye una pluralidad de procesos, cada uno de los cuales recibe una señal respectiva de las señales de audio, en donde cada proceso genera, en respuesta a la respectiva señal de audio, una señal de excitación, además, calcula en respuesta al menos a la señal de excitación, un valor de ganancia G[t] , el cual, si fuera aplicado a la señal de audio, podría originar una sonoridad percibida que sea sustancialmente la misma que la sonoridad de referencia, el cálculo comprende un ciclo de procesamiento iterativo que incluye al menos un proceso no lineal, y controla la amplitud de la respectiva señal de audio con la ganancia G[t] de modo que la sonoridad percibida que se origina de la respectiva señal de audio sea sustancialmente la misma que la sonoridad de referencia, y la aplicación de la misma sonoridad de referencia en cada uno de la pluralidad de procesos. En una modalidad que emplea aspectos de la invención, un método o dispositivo para el procesamiento de la señal recibe una señal de entrada de audio. La señal es filtrada en forma lineal por medio de un filtro o una función de filtro que simula las características del oído humano exterior y medio y un banco de filtros o función de banco de filtros que divide la señal filtrada en bandas de frecuencia que simulan el patrón de excitación generado a lo largo de la membrana basilar del oído interno. Para cada banda de frecuencia, la sonoridad específica es calculada utilizando una o más funciones o modelos de la sonoridad específica, la selección de la cual es controlada mediante las propiedades o características extraídas a partir de la señal de entrada de audio. La sonoridad específica para cada banda de frecuencia es combinada en una medición de sonoridad representativa de la señal de entrada de audio de banda ancha. Un valor único de la medición de la sonoridad podría ser calculado para algún intervalo de tiempo finito de la señal de entrada, o la medición de la sonoridad podría ser calculada en forma repetida en base a los intervalos o bloques de tiempo de la señal de entrada de audio . En otra modalidad que emplea aspectos de la invención, un método o dispositivo para el procesamiento de señal recibe una señal de entrada de audio. La señal es filtrada en forma lineal a través de un filtro o una función de filtro que simula las características del oído humano exterior medio y un banco de filtros o función de banco de filtros que divide la señal filtrada en bandas de frecuencia que simulan el patrón de excitación generado a lo largo de la membrana basilar del oído interno. Para cada banda de frecuencia, la sonoridad específica es calculada utilizando una o más funciones o modelos de sonoridad específica; la selección de la cual es controlada a través de las propiedades o características extraídas de la señal de entrada de audio. La sonoridad específica para cada banda de frecuencia es combinada en una medición de la sonoridad representativa de la señal de entrada de audio de banda ancha. La medición de la sonoridad es comparada con un valor de la sonoridad de referencia y la diferencia es utilizada para escalar o ajustar la ganacia de las señales de banda de frecuencia previamente introducidas al cálculo de la sonoridad específica. El cálculo de la sonoridad específica, el cálculo de la sonoridad y la comparación de referencia son repetidos hasta que el valor de la sonoridad y el valor de la sonoridad de referencia sean sustancialíñente equivalentes . Por lo tanto, la ganancia aplicada a las señales de banda de frecuencia representa la ganancia que, cuando es aplicada a la señal de entrada de audio, origina la sonoridad percibida de la señal de entrada de audio siendo esencialmente equivalente a la sonoridad de referencia. Un valor único de la medición de la sonoridad podría ser calculado para algún intervalo finito de la señal de entrada, o la medición de la sonoridad podría ser calculada en forma repetida en base a intervalos o bloques de tiempo de la señal de entrada de audio. Una aplicación recursiva de ganancia es preferida debido a la naturaleza no lineal de la sonoridad percibida, así como también, la estructura del proceso de medición de la sonoridad. Los distintos aspectos de la presente invención y sus modalidades preferidas podrían ser entendidos en mejor modo con referencia a la siguiente descripción y los dibujos que la acompañan, en los cuales los mismos números de referencia representan los mismos elementos en las distintas figuras. Los dibujos, que ilustran varios dispositivos o procesos, muestran los elementos principales que son útiles para el entendimiento de la presente invención. Por motivos de claridad, los dibujos omiten muchas otras características que podrían ser importantes en las modalidades prácticas y que son bien conocidas por aquellas personas de experiencia ordinaria en la técnica aunque no son importantes para el entendimiento de los conceptos de la presente invención. El procesamiento de señal para la práctica de la presente invención podría ser conseguido en una amplia variedad de modos que incluyen los programas ejecutados por microprocesadores, procesadores de señal digital, matrices lógicas y otras formas de conjuntos de circuitos de cómputo.
Breve Descripción de los Dibujos La Figura 1 es un diagrama esquemático funcional de bloque de una modalidad de un aspecto de la presente invención . La Figura 2 es un diagrama esquemático funcional de bloque de una modalidad de un aspecto adicional de la presente invención. La Figura 3 es un diagrama esquemático funcional de bloque de una modalidad todavía de un aspecto adicional de la presente invención. La Figura 4 es una respuesta característica idealizada de un filtro lineal P(z) adecuado como un filtro de transmisión en una modalidad de la presente invención, en el cual el eje vertical es la atenuación en decibeles (dB) y el eje horizontal es la frecuencia de base logarítmica de 10 en hertzios (Hz) . La Figura 5 muestra la relación entre la escala de frecuencia ERB (eje vertical) y la frecuencia en Hertzios (eje horizontal) . La Figura 6 muestra un conjunto de respuestas características idealizadas del filtro auditivo que aproxima el patrón de bandas críticas en la escala ERB. La escala horizontal es la frecuencia en Hertzios y la escala vertical es el nivel en decibeles . La Figura 7 muestra los contornos de la misma sonoridad del estándar IS0226. La escala horizontal es la frecuencia en Hertzios (la escala de base logarítmica de 10) y la escala vertical es el nivel de presión de sonido en decibeles . La Figura 8 muestra los contornos de la misma sonoridad del estándar IS0266 normalizado por el filtro de transmisión P(z) . La escala horizontal es la frecuencia en Hertzios (la escala de base logarítmica de 10) y la escala vertical es el nivel de presión de sonido en decibeles. La Figura 9 (líneas sólidas) muestra las gráficas de la sonoridad para el ruido de excitación uniforme y un tono de 1 kHz, en el cual las líneas sólidas están de acuerdo con una modalidad de la presente invención en la que los parámetros son elegidos para coincidir con los datos experimentales de acuerdo con Zwicker (cuadros y círculos) . La escala vertical es la sonoridad en sonios (de base logarítmica de 10) y la escala horizontal es el nivel de presión de sonido en decibeles. La Figura 10 es un diagrama esquemático funcional de bloque de una modalidad de un aspecto adicional de la presente invención. La Figura 11 es un diagrama esquemático funcional de bloque de una modalidad todavía de un aspecto adicional de la presente invención. La Figura 12 es un diagrama esquemático funcional de bloque de una modalidad de otro aspecto de la presente invenció . La Figura 13 es un diagrama esquemático funcional de bloque de una modalidad de otro aspecto de la presente invención.
Mejores Modos para Realizar la Invención Como se describe en mayor detalle más adelante, una modalidad de un primer aspecto de la presente invención, que se muestra en la Figura 1, incluye un controlador o función controladora de la sonoridad específica 124 ("Control de la Sonoridad Especifica") que analiza y deriva las características de una señal de entrada de audio. Las características de audio son utilizadas para controlar los parámetros en un convertidor o funciones de conversión de la sonoridad específica 120 ("Sonoridad Específica") . Medíante el ajuste de los parámetros de la sonoridad específica que utilizan las características de señal, la técnica de medición de la sonoridad objetivo de la presente invención podría ser combinada de manera más estrecha con los resultados de la sonoridad subjetiva producidos por la medición estadística de la sonoridad que utiliza múltiples escuchas humanos. El uso de las características de la señal, que controla los parámetros de la sonoridad, también podría reducir la ocurrencia de mediciones incorrectas que originan una sonoridad de señal que es considerada molesta para los escuchas . Como se describe en mayor detalle más adelante, una modalidad de un segundo aspecto de la presente invención, se muestra en la Figura 2, adiciona un dispositivo o función de ganancia 233 ("Actualización de Ganancia Iterativa")/ el propósito de la cual es ajustar en forma iterativa la ganancia de la señal de excitación de tiempo promedio derivada de la señal de entrada de audio hasta que la sonoridad asociada en 223 en la Figura 2 se hace coincidir con una sonoridad de referencia deseada en 230 en la Figura 2. Debido a que la medición objetiva de la sonoridad percibida involucra un proceso inherentemente no lineal, un ciclo iterativo podría ser empleado en forma ventajosa para determinar una ganancia apropiada a fin de hacer coincidir la sonoridad de la señal de entrada de audio con un nivel deseado de la sonoridad. No obstante, un ciclo de ganancia iterativa envuelve un sistema completo de medición de sonoridad, de manera que el ajuste de ganancia, que es aplicado a la señal original de entrada de audio para cada iteración de la sonoridad, seria costoso de implementar debido a la integración temporal requerida para generar una medición exacta de la sonoridad a largo plazo. En general, en este arreglo, la integración temporal requiere un nuevo cálculo para cada cambio de ganancia en la iteración. Sin embargo, como es explicado más adelante, en los aspectos de la invención mostrados en las modalidades de la Figura 2 y también en las Figuras 3 y 10-12, la integración temporal podría ser efectuada en vías de procesamiento lineal que preceden y/o siguen el proceso no lineal que forma parte de un ciclo de ganancia iterativa. Las vías de procesamiento lineal no necesitan formar parte del ciclo iterativo. Por lo tanto, por ejemplo en la modalidad de la Figura 2, la vía de medición de la sonoridad de la entrada 201 hacia un convertidor o función de conversión de sonoridad específica 220 ("Sonoridad Específica"), podría incluir la integración temporal en función promedio de tiempo 206 ("Promedio de Tiempo") y es lineal. En consecuencia, las iteraciones de ganancia sólo necesitan ser aplicadas a un conjunto reducido de dispositivos o funciones de medición de la sonoridad y no necesitan incluir alguna integración temporal . En la modalidad de la Figura 2, el filtro de transmisión o la función del filtro de transmisión 202 ("Filtro de Transmisión") , el banco de filtros o función de banco de filtros 204 ("Banco de Filtros"), el promedio de tiempo o la función de promedio de tiempo 206 ("Promedio de Tiempo") y el controlador de sonoridad específica o la función de control de sonoridad específica 224 ("Control de Sonoridad Específica") no son parte del ciclo iterativo, permitiendo que el control de ganancia iterativa sea implementado en sistemas de tiempo real eficientes y precisos. Con referencia una vez más a la Figura 1, se muestra un diagrama de bloque funcional de una modalidad de un medidor de sonoridad o un proceso de medición de sonoridad 100 de acuerdo con un primer aspecto de la presente invención. Una señal de audio para la cual una medición de la sonoridad será determinada, la cual es aplicada en la entrada 101 del medidor de sonoridad o el proceso de medición de sonoridad 100. La entrada es aplicada en dos vías, una primera vía (principal) que calcula la sonoridad específica en cada una de una pluralidad de bandas de frecuencia que simulan aquellas del patrón de excitación generado a lo largo de la membrana basilar del oído interno y una segunda vía (lateral) que tiene un controlador de sonoridad específica que selecciona las funciones o modelos de la sonoridad específica empleados en la vía principal . En una modalidad preferida, el procesamiento del audio es efectuado en el dominio digital. En consecuencia, la señal de entrada de audio es denotada por la secuencia discreta de tiempo x[n] , la cual ha sido muestreada a partir de la fuente de audio en alguna frecuencia de muestreo f¡¡. Se supone que la secuencia x[n] ha sido adecuadamente escalada, de modo que la potencia rms de x[n] en decibeles sea dada por es igual al nivel de presión de sonido en dB en la cual el audio está siendo oido por un escucha humano. Además, la señal de audio se supone que es monofónica debido a la simplicidad de la exposición. Sin embargo, la modalidad podría ser adaptada a un audio de múltiples canales en un modo descrito posteriormente. Filtro de Transmisión 102 En la vía principal, la señal de entrada de audio es aplicada a un filtro de transmisión o función del filtro de transmisión 102 ("Filtro de Transmisión"), la salida del cual es una versión filtrada de la señal de audio. El filtro de transmisión 102 simula el efecto de la transmisión de audio a través del oído externo y medio con la aplicación de un filtro lineal P{z) . Como se muestra en la Figura 4, una respuesta adecuada de la frecuencia de magnitud de P(z) es la unidad por debajo de 1 kHz, y por encima de 1 kHz, la respuesta sigue la inversa de la magnitud del escucha como es especificado en el estándar IS0226, con el umbral normalizado a una unidad equivalente a 1 kHz. Mediante la aplicación de un filtro de transmisión, el audio que es procesado por el proceso de medición de la sonoridad se asemeja de una manera más estrecha al audio que es percibido por el escucha humano, con lo cual se mejora la medición de la sonoridad objetiva. Por lo tanto, la salida del filtro de transmisión 102 es una versión de escala dependiente de la frecuencia de las muestras de audio de entrada de dominio de tiempo x[ri] Banco de Filtros 104 La señal filtrada de audio es aplicada en un banco de filtros o función de Banco de Filtros 104 ("Banco de Filtros") (Figura 1) . El Banco de Filtros 104 es diseñado para simular el patrón de excitación generado a lo largo de la membrana basilar del oído interno. El Banco de Filtros 104 podría incluir un conjunto de filtros lineales cuyo ancho de banda y separación sean constantes en la escala de frecuencia del Ancho de Banda Equivalente Rectangular (ERB) , como es definido por Moore, Glasberg y Baer (B . C. J. Moore, B. Glasberg, T. Baer, "A Model for the Prediction of Thresholds, Loudness, and Partial Loudness," supr ) . Aunque la escala de frecuencia ERB se hace coincidir en forma más estrecha a la percepción humana y muestra un funcionamiento mejorado para la producción de mediciones de la sonoridad objetiva que hacen coincidir los resultados de la sonoridad subjetiva, la escala de frecuencia de Bark podría ser empleada con un funcionamiento reducido. Para una frecuencia central / en hertzios, el ancho de la banda ERB en hertzios podría ser aproximado como: ERB (/) = 24.7 (4.37//1000+1) (1) A partir de esta relación, es definida una escala de frecuencia distorsionada, de manera que cualquier punto a lo largo de la escala distorsionada, el ERB correspondiente en unidades de la escala deformada sería igual a uno. La función de conversión de la frecuencia lineal en Hertzios a esta escala de frecuencia ERB es obtenida mediante la integración del recíproco de la Ecuación 1 : Esta también es útil para expresar la transformación de la escala ERB de regreso a la escala de frecuencia lineal al resolver la Ecuación 2a para /: en donde e se encuentra en unidades de la escala ERB. La Figura 5 muestra la relación entre la escala ERB y la frecuencia en hertzios. La respuesta de los filtros auditivos para el Banco de Filtros 104 podría ser caracterizada e implementada utilizando los filtros estándares IIR. De manera más específica, los filtros individuales auditivos en la frecuencia central fc en hertzios que son implementados en el Banco de Filtros 104 podrían ser definidos por la función de transferencia IIR de orden decimosegundo : q-Z-')q-2rfl cortfofl, // -' +rfly¾.) en donde (4b) (4d) = min{£,R-3eScflto-1(£K5esca/fl( +5.25), s/2>, rB = 0.985, (4e) /s es la frecuencia de muestreo en hertzios, y G es un factor de normalización para asegurar que cada filtro tenga una ganancia unitaria en el pico de su respuesta de frecuencia; elegido de manera que max{¾( ¡}=l. (4f) El Banco de Filtros 104 podría incluir M de estos filtros auditivos, referidos como bandas, en las frecuencias centrales fc[l] ... fc[M] uniformemente separadas a lo largo de la escala ERB. De manera más específica, fc[m] = fc[m -l]+ERB a Hz (Hz aEJlB (/ß[»1-1])+?) (5b) /.EM]</«, <5c> en donde ? es la separación deseada ERB del Banco de Filtros 104, y en donde min y /max son las frecuencias centrales deseadas, mínima y máxima, de manera respectiva. Uno podría elegir ? = 1, y tomando en cuenta el intervalo de frecuencia con respecto al cual el oído humano es sensible, podría establecerse que min = 50Hz y /max = 20,000Hz. Con estos parámetros, por ejemplo, la aplicación de las Ecuaciones 6a-c produce M=40 filtros auditivos. Las magnitudes de estos filtros auditivos M, que se aproximan al patrón de bandas críticas en la escala ERB son mostradas en la Figura 6. En forma alterna, las operaciones de filtrado podrían ser adecuadamente aproximadas utilizando una Transformada Discreta de Fourier de longitud finita, comúnmente referida como la Transformada Discreta de Fourier de Tiempo Corto (STDFT) , debido a que una implementaci n corre los filtros a la velocidad de muestreo de la señal de audio, referida como la implementación a toda potencia, se cree que proporciona una resolución más temporal de lo que es necesario para mediciones exactas de la sonoridad. Mediante la utilización de STDFT en lugar de la implementación a toda potencia, podría ser conseguida una mejora en la eficiencia y reducción en la complej idad computacional . La STDFT de la señal de entrada de audio x[n] es definida como : N-i *? ? ? =?t ??» + tT]e » , ( 6 ) n=0 en donde Je es el índice de frecuencia, t es el índice de bloque de tiempo, N es el tamaño DFT, T es el tamaño del salto, y w[n] es una ventana de longitud N normalizada, de modo que ?G-1 (7) ?*¾·]-1 Se observa que la variable t en la Ecuación 6 es un índice discreto que representa el bloque de tiempo de STDFT que es opuesto a una medición de tiempo en segundos. Cada incremento en t representa un salto de muestras T a lo largo de la señal x[n] . Las referencias subsiguientes al índice t asumen esta definición. Mientras que los ajustes de distintos parámetros y formas de ventana podría ser utilizados en función de los detalles de la implementación, para fs = 4100Hz, eligiendo N = 4096, G = 2048, y con w[n] que es una ventana de Hanning que produce resultados excelentes. La STDFT descrita con anterioridad podría ser más eficiente utilizando la Transformada Rápida de Fourier (FFT) . Con el fin de calcular la sonoridad de la señal de entrada de audio, es necesaria una medición de la energía de las señales de audio en cada filtro del Banco de Filtros 104. La salida de energía en tiempo corto de cada filtro en el Banco de Filtros 104 podría ser aproximada a través de la multiplicación de las respuestas del filtro en el dominio de frecuencia con el espectro de potencia de la señal de entrada : en donde m es el número de banda, t es el número de bloque, y P es el filtro de transmisión. Debe observarse que las formas para la respuesta de magnitud de los filtros auditivos distintos de los especificados en la Ecuación 3 podrían ser utilizadas en la Ecuación 8 para conseguir resultados similares. Por ejemplo, Moore y Glasberg proponen una forma de filtro descrita por una función exponencial que se efectúa en forma similar a la Ecuación 3. Además, con una ligera reducción en el funcionamiento, se podría aproximar cada filtro como un paso de banda de "pared de ladrillo" con un ancho de banda de un ERB, y como una aproximación adicional, el filtro de transmisión P podría ser sacado de la surnatoria. En este caso, la Ecuación 8 se simplifica a redondeo{ERB a HZ(HZ a£RB:(fc[m])-l/ 2)N I fs) (9b) (9c) k2 = redWiieo(ERB aHz(Hz aERB{fc[m])+l/2)N/fM) Por lo tanto, la salida de excitación del Banco de Filtros 104 es una representación del dominio de frecuencia de la energía E en las respectivas bandas ERB m por periodo de tiempo t. Canales Múltiples . Para el caso cuando la señal de entrada de audio sea de un formato de canales múltiples para que sea escuchada a través de múltiples altavoces, uno para cada canal, la excitación para cada canal individual primero podría ser calculada como se describió con anterioridad. Con el fin de calcular en forma subsiguiente la sonoridad percibida de todos los canales combinados, las excitaciones individuales podrían ser sumadas juntas en una excitación única para aproximar la excitación que alcanza los oídos de un escucha. Todo el procesamiento subsiguiente es entonces efectuado en base a esta excitación única sumada. Promedio de Tiempo 106 La investigación en pruebas psico-acústicas y subjetivas de sonoridad sugiere que cuando se compara la sonoridad entre varias señales de audio, los escuchas efectúan algún tipo de integración temporal de sonoridad de señal de término corto o "instantánea" para llegar al valor de la sonoridad percibida de largo plazo para uso en la comparación. Cuando se construye un modelo de percepción de sonoridad, otros han sugerido que esta integración temporal sea efectuada después que la excitación ha sido transformada en forma no lineal en una sonoridad específica. Sin embargo, los presentes inventores han determinado que esta integración temporal podría ser adecuadamente modelada utilizando el aplanamiento lineal sobre la excitación antes que sea transformada en la sonoridad específica. Al efectuar el aplanamiento antes del cálculo de la sonoridad específica, de acuerdo con un aspecto de la presente invención, se realiza una ventaja significativa cuando se calcula la ganancia que necesita ser aplicada a una señal con el fin de ajusfar su sonoridad medida en un modo prescrito. Como se explica más adelante, la ganancia puede ser calculada utilizando un ciclo iterativo que no sólo excluye el cálculo de excitación sino que, de preferencia, excluye esta integración temporal. De este modo, el ciclo de iteración podría generar la ganancia a través de cálculos que dependen solamente del cuadro de tiempo actual para el cual la ganancia está siendo calculada, que es opuesto a los cálculos que están en función de todo el intervalo de tiempo de la integración temporal. El resultado es el ahorro, tanto en el tiempo de procesamiento como de memoria. Las modalidades que calculan una ganancia utilizando un ciclo iterativo incluyen las descritas más adelante en conexión con las Figuras 2, 3 y 10-12. Regresando a la descripción de la Figura 1, el aplanamiento lineal de la excitación podría ser implementado en varias formas. Por ejemplo, el aplanamiento podría ser efectuado en forma recursiva utilizando un dispositivo o función de promedio de tiempo 106 ("Promedio de Tiempo") empleando las siguientes ecuaciones : É[m,t]=Em,t-l]+—^—{E[m,f\-É[m,t-1]) . (10a) s[»2,?] (10b) en donde las condiciones iniciales son É[m,-1]=Q y s[-77,-1]=0. Una característica única del filtro de aplanamiento es que mediante la variación del parámetro de aplanamiento Ám, la energía aplanada É[m,t] podría variar a partir del promedio real de tiempo de Eím, t] a un promedio de desvanecimiento de memoria de E[m, t] . Si entonces a partir de (10b) podría observarse que a[m,t]=t, y É[m,t] sería entonces igual al promedio real de tiempo de E[m, t] para los bloques de tiempo de 0 hasta t. Si 0 < Ám < 1, entonces, s{a?, t] —>1/ (1- p) cuando t—> 8 y É[m,t] sería simplemente el resultado de la aplicación de un polo más plano a E[m,t]. Para la aplicación en donde un número único que describe la sonoridad de largo plazo de un segmento de audio de longitud finita sea deseado, podría establecerse que Xm=l para toda m. Para una aplicación en tiempo real en donde uno podría rastrear la sonoridad de largo plazo y de variación de tiempo de un flujo continuo de audio en tiempo real, podría establecerse que 0 < Ám < 1 y se establece Xm en el mismo valor para toda m.
En el cálculo del promedio de tiempo de Eím, t] , podría ser deseable omitir los segmentos de tiempo corto que son considerados wdemasiado silenciosos" y no contribuyen a la sonoridad percibida. Para conseguir esto, una segunda magnitud o umbral más plano podría correrse en paralelo con la magnitud más plana en la Ecuación 10. Esta segunda magnitud más plana mantiene su valor actual si E[m, t] fuera pequeño con relación a É[m,t : X^m -l^ ?E[m,t]> 1010 ?E[m,t] m=l m=l ' [íj[7W.Í—1], de otro modo en donde tdB es el umbral relativo especificado en decibeles . Aunque no es crítico para la invención, ha sido encontrado que el valor de tdB= -24 produce buenos resultados. Si no existiera un segundo umbral más plano corriéndose en paralelo, entonces É[m,t]= É[m,t] . Sonoridad Específica 120 Queda para la energía de excitación promedio de tiempo de banda E[m, t] el ser convertida en una medición única de la sonoridad en unidades perceptuales, en este caso, la unidad de sonoridad denominada sonio. En el convertidor o función de conversión de sonoridad específica 120 ("Sonoridad Específica"), cada banda de la excitación es convertida en un valor de sonoridad específica, la cual es medida en sonios por ERB. En el combinador de sonoridad o en la función de combinación de sonoridad 122 ("Sonoridad") , los valores de la sonoridad especifica puedan ser integrados o sumados a través de las bandas para producir la sonoridad total preceptual . Modelos de Múltiples del Control de Sonoridad Específica 124/Sonoridad Específica 120 En un aspecto, la presente invención utiliza una pluralidad de modelos en el bloque 120 para convertir la excitación de banda en la sonoridad específica de banda. La información de control derivada de la señal de entrada de audio por medio del Control de Sonoridad Específica 124 en la vía lateral selecciona un modelo o controla el grado en el cual el modelo contribuye a la sonoridad específica. En el bloque 124, ciertas particularidades o características que son útiles para la selección de uno o más modelos de sonoridad específica de aquellos disponibles, son extraídos del audio. Las señales de control que indican qué modelo, o combinaciones de modelos, deben ser utilizados, son generadas a partir de las particularidades o características extraídas. En donde pueda ser deseable la utilización de más de un modelo, la información de control también podría indicar cómo deben ser combinados estos modelos .
Por ejemplo, la sonoridad especifica por banda N' [m, t] podría ser expresada como una combinación lineal de la sonoridad especifica por banda para cada modelo N'q[m, t] como : N'\mj = ¿«3[»í,íF;[»i,fl, (12) en donde Q indica el número total de modelos y la información de control q[m, t] representa la ponderación o contribución de cada modelo. La suma de las ponderaciones podría o no ser igual a uno, dependiendo de los modelos que están siendo utilizados. Aunque la invención no se limita estos modelos, se ha encontrado que dos modelos proporcionan resultados precisos. Un modelo se desempeña mejor cuando la señal de audio es caracterizada como de banda angosta y el otro se desempeña mejor cuando la señal de audio es caracterizada como de banda ancha. En forma inicial, en el cálculo de la sonoridad específica, el nivel de excitación en cada banda de É[m,t] podría ser transformado en un nivel equivalente de excitación a 1kHz que es especificado por los contornos de sonoridad equivalentes de IS0266 (Figura 7) normalizados por el filtro de transmisión P(z) (Figura 8) -. (13) ??™, =A**.(Elm,tlfc[m]), en donde lkHz{E,f) es una función que genera el nivel en 1kHz, que es igualmente fuerte en el nivel E en la frecuencia /. En la práctica, Li¡aiz{E,f) se implementa como una interpolación de una tabla de búsqueda de los contornos de la misma sonoridad, normalizados por el filtro de transmisión. La transformación a niveles equivalentes en 1 klíz, simplifica el siguiente cálculo de sonoridad específica. A continuación, la sonoridad específica en cada banda podría ser calculada como: N'[m,t]= [m ]N^[m,t]+(i- [m>t])N^[m,t], (i4 ) en donde WWB[m, t] y N t] son los valores de la sonoridad específica basados en el modelo de señal de banda angosta y de banda ancha, de manera respectiva. El valor a[m, t] es un factor de interpolación que se sitúa entre 0 y 1 que es calculado a partir de la señal de audio, los detalles de los cuales son descritos más adelante. Los valores de la sonoridad específica de banda angosta y de banda ancha N [m, t] y N'M [ , t] podrían ser estimados a partir de la excitación de banda utilizando las funciones exponenciales : en donde TQ ÍTZ es el nivel de excitación en el umbral en silencio para un tono de 1 kHz. A partir de los contornos de sonoridad equivalentes (Figuras 7 y 8) TQIMÍZ es igual a 4.2 dB . Se observa que ambas de estas funciones de sonoridad especifica son iguales a cero cuando la excitación es igual al umbral en silencio. Para excitaciones más grandes que el umbral en silencio, ambas funciones crecen en forma monotónica con una ley de potencia de acuerdo con la ley de la sensación de intensidad de Stevens . El exponente para la función de banda angosta es elegido para que sea más grande que el exponente de la función de banda ancha, produciendo que la función de banda angosta aumente de manera más rápida que la función de banda ancha. La selección específica de exponentes ß y las ganancias G para los casos de banda angosta y de banda ancha son discutidos más adelante. Sonoridad 122 La Sonoridad 122 utiliza la sonoridad específica de banda de la Sonoridad Específica 120 para crear una medición única de la sonoridad para la señal de audio, a saber, una salida en la terminal 123 que es un valor de la sonoridad en unidades perceptuales . La medición de la sonoridad puede tener unidades arbitrarias, con la condición que la comparación de los valores de sonoridad para distintas señales de audio indique cuál es la intensidad más fuerte y cuál es la más suave . La sonoridad total expresada en unidades de sonio podría ser calculada como la suma de la sonoridad específica para todas las bandas de frecuencia : SlH-A?NVn.Q9 (16) en donde ? es la separación ERB especificada en la Ecuación 6b. Los parámetros Gm y ¾B en la Ecuación 15a son elegidos, de modo que cuando a[m, t]=l, una gráfica de S en sonio contra SLP para un tono de 1 kHz se hace coincidir, de manera sustancial, con los correspondientes datos experimentales presentados por Zwxcker (los círculos en la Figura 9) (Zwicker, H. Fastl, "Psychoacoustics-Facts and Models", supra) . Los parámetros Gm y m en la Ecuación 15b son elegidos, de modo que cuando a[m, t]=0, una gráfica de N en sonios contra SLP para el ruido uniforme de excitación (el ruido con una potencia igual en cada ERB) se hace coincidir, de manera sustancial, con los resultados correspondientes de Zwicker (los cuadros en la Figura 9) . Al menos los cuadros que se colocan en los datos de Zwicker producen: (¾B=0.0404 (17a) y¾s=0.279 (17b) La Figura 9 (líneas sólidas) muestra las gráficas de la sonoridad para el ruido de excitación uniforme y para un tono de 1 kHz . Control de Sonoridad Específica 124 Como se mencionó con anterioridad, dos modelos de sonoridad específica son utilizados en una modalidad práctica (Ecuaciones 15a y 15b) , uno para señales de banda angosta y el otro para señales de banda ancha. El Control de Sonoridad Específica 124 en la vía lateral calcula una medición, a[m,t], del grado en el cual la señal de entrada se encuentra ya sea en la banda angosta o en la banda ancha en cada banda. En un sentido general, a[m, t] debe ser igual a uno cuando la señal sea de banda angosta junto a la frecuencia central fc[m de una banda y debe ser cero cuando la señal sea de banda ancha junto a la frecuencia central fc[m¡ de una banda. El control debe variar en forma continua entre los dos extremos para cambiar las mezclas de estas características. Como una simplificación, el control [m,t] podría ser elegido como constante a través de las bandas, en tal caso, [m, ] sería subsiguientemente referida como a[t] , omitiendo el índice de banda m. Entonces, el control de a [ti representa una medición de la manera como la señal de banda angosta se encuentra a través de todas las bandas . Aunque un método adecuado para la generación de este control se describe m s adelante, el método particular no es crítico y podrían emplearse otros métodos adecuados.
El control [t] podría ser calculado a partir de la excitación E[m,t] en la salida del Banco de Filtros 104, más que a través de algún otro procesamiento de la señal x[n] . La excitación E[m,t podría proporcionar una referencia adecuada a partir de la cual sea medida la "banda angosta" y wla banda ancha" de ?[??] , y como resultado, [t] podría ser generada con pocos cálculos adicionales. La "Uniformidad Espectral" es una característica de E[m, t] a partir de la cual a[t] podría ser calculada. La uniformidad espectral, como es definida por Jayant y Noli (N.S. Jayant, P. Noli, Digital Coding Of Waveforms, Prentice Hall, New Jersey, 1984), es la relación de la media geométrica con la media aritmética, en donde la media es tomada a través de la frecuencia (el índice m en el caso de E[m, t] ) . Cuando E[m,t\ sea constante a través de m, la media geométrica es igual a la media aritmética, y la uniformidad espectral es igual a uno. Esto corresponde con el caso de banda ancha. Si E[m,t] varía en forma significativa a través de m, entonces, la media geométrica es significativamente más pequeña que la media aritmética, y la uniformidad espectral se acerca a cero. Esto corresponde con el caso de la banda angosta. Mediante el cálculo de uno menos la uniformidad espectral, podría generarse una medición de la "banda angosta" en donde cero corresponde con la banda ancha y uno corresponde con la banda angosta. En especifico, puede calcularse uno menos la uniformidad espectral modificada E[m, t] : en donde P[m] es igual a la respuesta de frecuencia del filtro de transmisión P(z) muestreado en la frecuencia [m] //3. La normalización de E[m, t] mediante el filtro de transmisión podría proporcionar mejores resultados debido a que la aplicación del filtro de transmisión introduce una "protuberancia" en E[m, ] que tiende a inflar la medición de la "banda angosta". Además, el cálculo de la uniformidad espectral con respecto a un subconjunto de las bandas de E[m,t] puede producir mejores resultados. Los límites inferior y superior de la sumatoria en la Ecuación 18, M[t] Y Mu[t] , definen una región que puede ser más pequeña que el intervalo de todas las bandas M. Es deseable que M±[t1 y Mu[t] incluyan la porción de E[m, \ que contiene la mayoría de su energía, y que el intervalo definido por j[t] y Mu[t] no sea mayor de 24 unidades de ancho en base a la escala ERB. De manera más específica, (y recordando que c[ml es la frecuencia central de la banda m en Hz) , se desea: Hz a ERB <fe[Mu[t]])-Hz a ERB VAMtlf]]) = 24 (19a) y se requiere : Hz a ERB;(f£Mm = Hz a ERB (¿[l]) (19c) en donde CT[t] es el centroide espectral de E [m, t] medido en la escala ERB: En forma ideal, los límites de la sumatoria, Mjtt] y Mu[t] , están centrados alrededor de CT[-t] cuando son medidos en la escala ERB, aunque esto no siempre es posible cuando CT[t] se encuentre cerca a los límites inferior o superior de su intervalo. A continuación, JN7B[t] podría ser aplanada con respecto al tiempo en un modo análogo a la Ecuación lia: E[m,t] (20] en donde s[?] es igual al máximo de E [m, t] , definido en la Ecuación llb, con respecto a todas las m . Finalmente, a[t] es calculada a partir de ÑB[t] como sigue: en donde F{?}=12.2568x3-22.8320^+14.5869--2.9594 (21b) Aunque la forma exacta de F{?} no es crítica, el polinomio en la Ecuación 21b podría ser encontrado mediante la optimización de [t] contra la sonoridad medida en forma subjetiva de una gran variedad de material de audio. La Figura 2 muestra un diagrama de bloque funcional de una modalidad de un medidor de sonoridad o un proceso de medición de sonoridad 200 de acuerdo con un segundo aspecto de la presente invención. Los dispositivos o funciones 202, 204, 206, 220, 222, 223 y 224 de la Figura 2 corresponden con los respectivos dispositivos o funciones 102, 104, 106, 120, 122, 123 y 124 de la Figura 1. De acuerdo con un primer aspecto de la invención, del cual la Figura 1 muestra una modalidad, el medidor o el cálculo de la sonoridad genera un valor de sonoridad en unidades perceptuales . Con el fin de ajusfar la sonoridad de la señal de entrada, una medición útil es una ganancia G[t] , la cual cuando es multiplicada con la señal de entrada x[n] (como por ejemplo, en la modalidad de la Figura 3, descrita más adelante) , produce su sonoridad igual a un nivel de sonoridad de referencia Sref- La sonoridad de referencia Sref, puede ser especificada en forma arbitraria o medida por otro dispositivo o proceso que opere de acuerdo con el primer aspecto de la invención a partir de alguna señal de referencia de audio "conocida". Permitiendo que x¥{x[n~¡,t represente todo el cálculo efectuado en base a la señal x[ri\ para generar la sonoridad S[t] , se desea encontrar G[t] , de manera que Debido a que una porción del procesamiento incluido en ?{existe una solución de forma no cerrada ni lineal para G[t] , de modo que en su lugar, podría ser utilizada una técnica iterativa para encontrar una solución aproximada. En cada iteración i en el proceso, se permite que G± represente el estimado actual de G[t] . Para cada iteración, G± se actualiza, de modo que disminuye el error absoluto de la sonoridad de referencia : También existen muchas técnicas adecuadas para actualizar <¾ con el fin de conseguir la disminución anterior en el error. Uno de esos métodos es el descenso de gradiente (véase Nonlinear Programming de Dimitri P. Bertseakas, Athena Scientific, Belmont, MA 1995) en el cual <¾ es actualizada mediante una cantidad proporcional al error en la iteración previa : G, -GH + (snf -?{0?*}1 (25) En donde µ es el tamaño de la etapa de la iteración.
La iteración anterior continúa hasta que el error absoluto se encuentre por debajo de algún umbral, hasta que el número de iteraciones haya alcanzado algún límite máximo predefinido, o hasta que haya pasado un tiempo especifico. En este punto, G[t] es igual a G¿. Haciendo nuevamente referencia a las Ecuaciones 6-8, se observa que la excitación de la señal x[n] es obtenida a través de operaciones lineales sobre el cuadrado de la magnitud STDFT de la señal, \X[k,t] |2. Enseguida la excitación que se origina a partir de una señal modificada de ganancia Gx[n] es igual a la excitación de x[n] multiplicada por G2. Además, la integración temporal requerida para estimar la sonoridad percibida a largo plazo podría ser efectuada a través del promedio de tiempo lineal de la excitación, y por lo tanto, la excitación promedio de tiempo que corresponde con Gx[n] sería igual a la excitación de promedio de tiempo de x[n] multiplicada por G2. Como un resultado, no es necesario que el promedio de tiempo sea calculado una vez más con respecto a la totalidad de la historia de la señal de entrada para cada nueva evaluación de ?{ GiXLn] , t en el proceso iterativo descrito con anterioridad. En su lugar, la excitación promedio de tiempo E[m, t] podría ser calculada solamente una vez a partir de x[rí , y en la iteración, los valores actualizados de la sonoridad podría ser calculados mediante la aplicación del cuadrado de la ganancia actualizada directamente en E[m,t]. En específico, permitiendo que E{É[m, t] represente todo el procesamiento efectuado en la excitación promedio de tiempo É[m, t] para generar S[t] , la siguiente relación se mantiene para una ganancia general multiplicativa G: ?£ f?¾ V{Gxln],t] (26) Utilizando esta relación, el proceso iterativo podría ser simplificado mediante el reemplazo de ?{ GiX[ii) , t) con ??{ Gj_2É[ , i] . Esta simplificación no sería posible que tuviera la integración temporal requerida para estimar la sonoridad percibida a largo plazo que ha sido efectuada después de la transformación no lineal en la sonoridad específica . El proceso iterativo para el cálculo de G[t] se representa en la Figura 2. La sonoridad de salida S[t] en la terminal 223 podría ser sustraída en un combinador substractivo o en la función de combinación 231 de la sonoridad de referencia Sref en la terminal 230. La señal de error resultante 232 es alimentada en un actualizador de ganancia iterativa o función de actualización 223 ("Actualización de Ganancia Iterativa") que genera la siguiente ganancia <¾ en la iteración. El cuadrado de esta ganancia G±2 es entonces alimentado de regreso en la salida 234 al combinador multiplicativo 208, en donde Gj2 es multiplicada con la señal de excitación de promedio de tiempo del bloque 206. El siguiente valor de S[t] en la iteración es entonces calculado . a partir de esta versión modificada de ganancia de la excitación promedio de tiempo a través de los bloques 220 y 222. El ciclo descrito itera hasta que las condiciones de terminación sean cumplidas en el tiempo en el cual la ganancia G[t] en la terminal 235 es ajustada igual que el valor actual de G±. El valor final G[t] puede ser calculado a través del proceso iterativo descrito, por ejemplo, para cada FFT del cuadro t o sólo una vez en la finalización del segmento de audio después que la excitación ha sido promediada con respecto a la longitud total de este segmento . Si se deseara calcular la sonoridad de la señal modificada sin ganancia en conjunto con este proceso iterativo, la ganancia (¾ puede ser inicializada a uno en el comienzo de cada proceso iterativo para cada periodo de tiempo t. De este modo, el primer valor de S[t] calculado en el ciclo representa la sonoridad de la señal original y puede ser grabado como tal. Si no se deseara grabar este valor, sin embargo, G¿ puede ser inicializada con cualquier valor. En este caso, cuando G?[t] sea calculada con respecto a cuadros consecutivos de tiempo y no se deseara grabar la sonoridad de la señal original, podría ser deseable inicializar igual al valor de G[t) del período de tiempo previo. De este modo, si la señal no cambia en forma significativa a partir del periodo de tiempo previo, probablemente el valor G[t] tendrá que haber permanecido en una forma sustancialmente igual . Por lo tanto, sólo unas cuantas iteraciones serán requeridas para converger hacia el valor adecuado. Una vez que sean completadas las iteraciones, G[t] representa la ganancia que será aplicada a la señal de entrada de audio en 201 por medio de algún dispositivo externo, de manera que la sonoridad de la señal modificada se hace coincidir con la sonoridad de referencia. La Figura 3 muestra un arreglo adecuado en el cual la ganancia G[t] de la Actualización de Ganancia Iterativa 233 es aplicada a una entrada de control de un dispositivo o función de control de nivel de señal, tal como un amplificador de tensión controlada 236 (VCA) con el fin de proporcionar una señal de salida con ganancia ajustada. El VCA 234 en la Figura 3 puede ser reemplazado por un operador humano que controle un ajustador de ganancia en respuesta a una indicación sensorial de la ganancia G[t] en la línea 235. Una indicación sensorial podría ser proporcionada, por ejemplo, por un medidor. La ganancia G[t] podría ser sometida a un aplanamiento de tiempo (no se muestra) . Para algunas señales, una alternativa al aplanamiento descrita en las Ecuaciones 10 y 11 podría ser deseable para el cálculo de la sonoridad percibida a largo plazo. Los escuchas tienden a asociar la sonoridad a largo plazo de una señal con las porciones más fuertes de esta señal. Como resultado, el aplanamiento presentada en las Ecuaciones 10 y 11 podría sobreestimar la sonoridad percibida de una señal que contiene largos periodos de silencio relativo interrumpidos por segmentos más cortos de material más fuerte . Estas señales a menudo son encontradas en las pistas o bandas sonoras de una película con segmentos cortos de diálogo rodeados por periodos más largos de un ruido ambiental de la escena. Aún con la formación de umbrales presentados en la Ecuación 11, las porciones silenciosas de estas señales podrían contribuir en forma importante a la excitación promedio de tiempo E[ ,t] . Para tratar con este problema, una técnica estadística para el cálculo de la sonoridad de largo plazo podría ser empleada en un aspecto adicional de la presente invención. En primer lugar, la constante de tiempo de aplanamiento en las Ecuaciones 10 y 11 es muy pequeña y tdB se ajusta a menos infinito, de modo que E[m,t] representa la excitación "instantánea" . En este caso, el parámetro de aplanamiento Ám podría ser elegido para variar a través de las bandas jn a un modelo más exacto, la manera en la cual la percepción de la sonoridad instantánea varía a través de la frecuencia. Sin embargo, en la práctica la elección de lm para que sea constante a través de m todavía produce resultados aceptables. El resto del algoritmo descrito con anterioridad funciona sin cambio originando una señal instantánea de sonoridad S[t] , como es especificado en la Ecuación 16. Con respecto a algún intervalo t2 = t < t2 la sonoridad de largo plazo Sp[tlr es entonces definida como un valor que es más grande que S[t] para el porcentaje p de valores de tiempo en el intervalo y menor que S[t] para el porcentaje 100 -p de los valores de tiempo en el intervalo. Los experimentos han mostrado que el ajuste de p igual aproximadamente al 90% se hace coincidir en forma subjetiva con la sonoridad percibida de largo plazo. Con este ajuste, solamente el 10% de los valores de S[t] necesitan ser significativas para afectar la sonoridad de largo plazo. El otro 90% de los valores puede ser relativamente silencioso sin disminuir la medición de la sonoridad de largo plazo. El valor Sp\tx,t2~\ puede ser calculado mediante la clasificación en orden ascendente de los valores £>[t], t¿ < t < t2, en una lista Sorden{i) , 0 = i = t2-tlr en donde i representa el elemento i-nésimo de la lista clasificada. Entonces, la sonoridad de largo plazo es dada por el elemento que es el porcentaje p del modo en la lista: Por si mismo, el cálculo anterior es relativamente directo. Sin embargo, si alguien deseara calcular una ganancia Gp[tlf t2] la cual entonces es multiplicada por x[n] originando Sp[tlft2] que es igual a alguna sonoridad de referencia Sref, el cálculo se vuelve significativamente más complejo. Como antes, se requiere un procedimiento o enfoque iterativo, aunque ahora la medición de sonoridad de largo plazo Sp [t¿, fc2] está en función del intervalo total de los valores S[t] , tx = t = t2t cada uno de los cuales debe ser actualizado con cada actualización de (¾ en esta iteración. Con el fin de calcular estas actualizaciones, la señal É[m, t] debe ser almacenada con respecto al intervalo total ¾ < t t2. Además, debido a que la dependencia de S[t] sobre G¿ es no lineal, el ordenamiento relativo de S[t] , t2 < t < t2, podría cambiar con cada iteración, y por lo tanto, Sor¿¡en{i} también debe ser calculada una vez más. La necesidad para una nueva clasificación ya es evidente cuando se consideran los segmentos de señal de tiempo corto cuyo espectro se encuentra justo por debajo del umbral del escucha para una ganancia particular en la iteración. Cuando la ganancia sea incrementada, una porción significativa del espectro del segmento podría volverse audible, lo cual podría hacer la sonoridad total del segmento más grande que los otros segmentos de banda angosta de la señal que fue previamente audible. Cuando el intervalo t2 < t < t2 se vuelve más grande o si se deseara calcular la ganancia Gp[ti,t2 en forma continua como una función de una ventana de tiempo deslizante, los costos de cálculo y de memoria de este proceso iterativo podrían llegar a ser prohibitivos. Un ahorro significante en el cálculo y la memoria es conseguido mediante la realización en la que S[t] es una función que aumenta en forma monotónica de <¾. En otras palabras, el incremento de G¿ siempre aumenta la sonoridad de corto plazo en cada instante de tiempo. Con este conocimiento, la ganancia deseada de coincidencia Gp[t!,t2] puede ser calculada de manera eficiente como sigue. En primer lugar, se calcula la ganancia de coincidencia previamente definida G[t] a partir de E[m, t] utilizando la iteración descrita para todos los valores de t en el intervalo fc2 < t < t2. Se observa que para cada valor t, G[t] es calculada mediante la iteración en base al valor único É[m,t], A continuación, la ganancia de coincidencia de largo plazo Gpfti/ta] es calculada mediante la clasificación en orden ascendente de los valores G[t] , t± = t < t2, en una lista G0rden{i] 0 < i < t2-ti, y posteriormente se establece que (28) Ahora, argumentamos que Gp[tlrt2] es igual a la ganancia la cual cuando es multiplicada por x[ri¡ resulta en ¾[ta,t2] que es igual a la sonoridad de referencia deseada Sref. Se observa a partir de la Ecuación 28 que G[t]< Gplt1,t2\ para un porcentaje de 100-p de los valores de tiempo en el intervalo tz < t < t2 y que G[t]> Gp[t ,t2] para el otro porcentaje p. Para aquellos valores de G[t] de manera que G[t]< Gp[tx,t2l se observa que si Gp[tlt t2] fuera a ser aplicado en los valores correspondientes de É[m, t] más que G[t] , entonces, los valores resultantes de S[t] serían más grandes que la sonoridad de referencia deseada. Esto es cierto debido a que S [t] es una función de aumento en forma monotónica de la ganancia. En forma similar, si Gp[t1,t2] fuera a ser aplicada en los valores de É[m,t] que corresponden con G[t] , de manera que G[t]> GpLtx,t2 , los valores resultantes de S[t] serían menores que la sonoridad de referencia deseada. Por lo tanto, la aplicación de Gp [ti, t2] en todo los valores de E[m,t] en el intervalo t2 < t < t3 resulta en S[t] que es más grande que el porcentaje de 100-p de referencia deseada del tiempo y menor que el porcentaje p de referencia del tiempo. En otras palabras, Sp[ti,t2] es igual a la referencia deseada. Este método alternativo de cálculo de la ganancia de coincidencia hace obvia la necesidad de almacenar É[m, t] y S[t] con respecto al intervalo ti < t < t2. Solamente G[t] necesita ser almacenada. Además, para cada valor de Gp[ti,t2] que es calculado, la clasificación de G[t] con respecto al intervalo tx = t = t2 sólo necesita ser efectuada en una ocasión, que es opuesto al procedimiento previo en donde S[t] necesita ser clasificada nuevamente con cada iteración. En el caso en donde Gp[tx,t2l vaya a ser calculada en forma continua con respecto a alguna ventana deslizante de longitud T (es decir, t2 = t-T, t2 = t) , la lista Gorden{í} puede ser mantenida de manera eficiente simplemente removiendo y adicionando un valor único de la lista clasificada para cada nuevo instante de tiempo. Cuando el intervalo ti < t < t2 se vuelva extremadamente largo (la longitud, por ejemplo, de la totalidad de la canción o la película) , la memoria requerida para almacenar G[t] todavía podría ser prohibitiva. En este caso, Gp[tlr t2] podría ser aproximada a partir de un histograma discretizado de G[t] . En la práctica, este histograma es creado a partir de G[t] en unidades de decibeles . El histograma podría ser calculado como H[i] = el número de muestras en el intervalo t2 < t < t2 de manera que en donde es la resolución del histograma y dBmin es el mínimo del histograma. La ganancia de coincidencia es entonces aproximada como : (30a) en donde e J es el Indice máximo de histograma. Utilizando el histograma discretizado, solamente los valores de I necesitan ser almacenados, y Gp[ti,t2] se actualiza con facilidad con cada nuevo valor de G[t] . Otros métodos para la aproximación de Gp[tlrt2] a partir de G[t] podrían ser concebidos, y se pretende que esta invención incluya éstas técnicas. El aspecto clave de esta porción de la invención es efectuar algún tipo de aplanamiento sobre la ganancia de coincidencia G[t] para generar la ganancia de coincidencia de largo plazo Gp[tlft2] más que el procesamiento de la sonoridad instantánea S[t] para generar la sonoridad de largo plazo Sp[tlrt2] a partir de la cual Gp[tlrt2] sería entonces estimada a través de un proceso iterativo. Las Figuras 10 y 11 muestran sistemas similares a las Figuras 2 y 3, de manera respectiva, excepto en donde es utilizada el aplanamiento (el dispositivo o la función 237) de la ganancia de coincidencia G[t] para generar una señal de ganancia aplanada Gp[ti,t2] (señal 238) .
La sonoridad de referencia en la entrada 230 (Figuras 2, 3, 10, 11) podría ser "fijada" o "variable" y la fuente de la sonoridad de referencia podría ser interna o externa para un arreglo que incluye los aspectos de la invención. Por ejemplo, la sonoridad de referencia podría ser establecida por un usuario, en tal caso, su fuente serla externa y podría permanecer "fija" durante un período de tiempo hasta que vuelva a ser restablecida por el usuario. En forma alterna, la sonoridad de referencia podría ser una medición de la sonoridad de otra fuente de audio derivada de un proceso o dispositivo de medición de la sonoridad de acuerdo con la presente invención, tal como el arreglo que se muestra en el ejemplo de la Figura 1. El control de volumen normal de un dispositivo de producción de audio podría ser reemplazado por un proceso o dispositivo de acuerdo con los aspectos de la invención, tal como los ejemplos de la Figura 3 o de la Figura 11. En este caso, un deslizador o perilla, etc, de volumen operada por el usuario podría controlar la sonoridad de referencia en 230 de la Figura 3 o la Figura 11 y en consecuencia, el dispositivo de producción de audio tendría una sonoridad conmensurada con el ajuste del usuario del control de volumen. Un ejemplo de una referencia variable se muestra en la Figura 12 , en donde la sonoridad de referencia Sref es reemplazada por una referencia variable Sref [t] que es calculada, por ejemplo, a partir de la señal de sonoridad S[t] a través de un dispositivo o función de sonoridad de referencia variable 239 ("Sonoridad de Referencia Variable") . En este arreglo, en el inicio de cada iteración para cada periodo de tiempo t, la referencia variable Sref [t] podría ser calculada a partir de la sonoridad no modificada S[t] antes que cualquier ganancia haya sido aplicada a la excitación en 208. La dependencia de Sref [t] y S[t] a través de la función de referencia de sonoridad variable 239 podría tomar varias formas para conseguir distintos efectos. Por ejemplo, la función simplemente podría escalar S[t] para generar una referencia que es alguna relación fija de la sonoridad original. En forma alterna, la función podría producir una referencia más grande que S[t] cuando S[t] se encuentre por debajo de algún umbral y sería menor de S[t] cuando S[t] se encuentre por encima de algún umbral, reduciendo de esta manera el intervalo dinámico de la sonoridad percibida del audio. Cualquiera que sea la forma de esta función, la iteración descrita con anterioridad es efectuada para calcular G[t] de manera que La ganancia de coincidencia G[t] podría entonces ser aplanada como se describió con anterioridad o a través de alguna otra técnica adecuada para conseguir el efecto perceptual deseado. Finalmente, un retraso 240 entre la señal de audio 201 y el bloque VCA 236 podría ser introducido para compensar cualquier latencia o tiempo de espera en el cálculo de la ganancia aplanada. Este retraso también podría ser proporcionado en los arreglos de las Figuras 3 y 11. La señal de control de ganancia G[t] del arreglo de la Figura 3 y la señal de control de ganancia aplanada <¾"ti,t2] del arreglo de la Figura 11 podrían ser útiles en una diversidad de aplicaciones que incluyen, por ejemplo, la transmisión de televisión o radio satelital en donde varía la sonoridad percibida a través de distintos canales. En estos entornos, el aparato o método de la presente invención podría comparar la señal de audio de cada canal con un nivel de sonoridad de referencia (o la sonoridad de la señal de referencia) . Un operador o un dispositivo automático podrían utilizar la ganancia para ajustar la sonoridad de cada canal. Por lo tanto, todos los canales tendrían sus ancialmente la misma sonoridad percibida. La Figura 13 muestra un ejemplo de este arreglo en el cual el audio que proviene de una pluralidad de canales de televisión o audio, 1 hasta N, se aplica a las respectivas entradas 201 de un proceso o dispositivos 250, 252, cada uno de los cuales se encuentra de acuerdo con los aspectos de la invención como se muestra en las Figuras 3 u 11. El mismo nivel de la sonoridad de referencia es aplicado en cada uno de los procesos o dispositivos 250, 252 originando un primer canal ajustado por la sonoridad a través del audio del canal Nth en cada salida 236. La técnica de medición y ajuste de ganancia también puede ser aplicada a un dispositivo de medición de tiempo real que monitorea el material de entrada de audio, que efectúa el procesamiento que identifica el contenido de audio que contiene principalmente las señales de habla humana, y calcula una ganancia de manera que las señales de habla humana coincidan, de manera sustancial, con un nivel de referencia previamente definido. Las técnicas adecuadas para la identificación del habla en el material de audio son señaladas en la Solicitud de Patente de los Estados Unidos S.N. 10/233,073, presentada el 30 de Agosto del 2002 y divulgada como la Publicación de Solicitud de Patente de los Estados Unidos US 2004/0044525 Al, publicada el 4 de Marzo del 2004. La solicitud se incorpora en este documento como referencia en su totalidad. Debido a la molestia de la audiencia con el contenido fuerte del audio que tiende a ser enfocado sobre las porciones del habla del material de programa, un método de medición y ajuste de ganancia podría reducir en gran medida la diferencia del nivel de molestia en un audio comúnmente utilizado en el material de televisión, de película y de música.
Implemen ación La invención puede ser implementada en hardware o software, o una combinación de ambos (por ejemplo, en series lógicas programables) . A menos que sea especificado de otro modo, los algoritmos incluidos como parte de la invención no se encuentran inherentemente relacionados con ninguna computadora particular u otro tipo de aparato. En particular, varias máquinas de uso general pueden ser empleadas con programas escritos de acuerdo con las enseñanzas en este documento, o puede ser más conveniente construir aparatos más especializados (por ejemplo, circuitos integrados) para efectuar las etapas requeridas del método. Por lo tanto, la invención podría ser implementada en uno o más programas de computadora que se ejecuten en uno o más sistemas programables de computadora, cada uno de los cuales comprende por lo menos un procesador, al menos un sistema de almacenamiento de datos (que incluye una memoria volátil y una memoria no volátil y/o elementos de almacenamiento) , al menos un dispositivo o puerto de entrada y por lo menos un dispositivo o puerto de salida. El código de programa es aplicado a los datos de entrada para realizar las funciones descritas en este documento y para generar la información de salida. La información de salida es aplicada a uno o más dispositivos de salida, en un modo conocido. Cada programa podría ser implementado en cualquier lenguaje deseado de computadora (incluyendo lenguaje: máquina, ensamblador, de procedimiento, de alto nivel, o de programación orientada a objetos) para comunicarse con un sistema de cómputo. En cualquier caso, el lenguaje podría ser un lenguaje compilado o interpretado. De preferencia, cada programa de computadora es almacenado o descargado en un dispositivo o medios de almacenamiento (por ejemplo, en una memoria o medios de estado sólido, en medios magnéticos u ópticos) susceptible de ser leído por una computadora programable de uso general o especial para la configuración y operación de la computadora cuando el dispositivo o medios de almacenamiento sean leídos por el sistema de cómputo para efectuar los procedimientos descritos en los mismos. El sistema inventivo también puede ser considerado que es implementado como un medio de almacenamiento susceptible de ser leído por computadora, configurado con un programa de computadora, en donde el medio de almacenamiento configurado de este modo, provoca que el sistema de computadora funcione en un modo específico y predefinido para efectuar las funciones descritas en el mismo. Ha sido descrito un número de modalidades de la invención. Sin embargo, se entenderá que pueden realizarse varias modificaciones sin apartarse del espíritu y alcance de la invención. Por ejemplo, algunas de las etapas descritas con anterioridad podrían estar en orden independiente, y por lo tanto, pueden ser efectuadas en un orden distinto del que fue descrito. En consecuencia, otras modalidades se encuentran dentro del alcance de las siguientes reivindicaciones .

Claims (37)

  1. REIVINDICACIONES 1. Un método para el procesamiento de una señal de audio, caracterizado porque comprende la producción, en respuesta a la señal de audio, una señal de excitación, y el cálculo de la sonoridad perceptual de la señal de audio en respuesta a la señal de excitación y una medición de las características de la señal de audio, en donde el cálculo selecciona, a partir de un grupo de dos o más funciones de modelo de sonoridad específica, una función o una combinación de dos o más de las funciones de modelo de sonoridad específica, la selección de las cuales es controlada mediante la medición de las características de la señal de entrada de audio .
  2. 2. El método de conformidad con la reivindicación 1, caracterizado porque la medición de las características de la señal de audio es una medición del grado en el cual la señal de entrada es de banda angosta o de banda ancha.
  3. 3. El método de conformidad con la reivindicación 2, caracterizado además porque comprende el cálculo del grado en el cual la señal de entrada es de banda angosta o de banda ancha mediante el cálculo de la uniformidad espectral de la señal de entrada.
  4. 4. El método de conformidad con la reivindicación 1, caracterizado porque el cálculo selecciona a partir de o combina dos funciones de modelo de sonoridad específica, una primera función de modelo de sonoridad que es elegida por una medición de las características que se originan a partir de una señal de entrada de banda angosta, una segunda función de modelo de sonoridad que es elegida por una medición de las características que se originan a partir de una señal de entrada de banda ancha, y una combinación de la primera y de la segunda funciones de modelo de sonoridad que son seleccionadas por una medición de las características que se originan a partir de una señal de entrada parcialmente de banda angosta y parcialmente de banda ancha.
  5. 5. El método de conformidad con la reivindicación 4, caracterizado porque ambas de la primera y de la segunda funciones de modelo de sonoridad aumentan en forma monotónica por encima de un umbral en silencio con el incremento de la excitación de acuerdo con una ley de potencia, la primera función de modelo de sonoridad aumenta más rápido que la segunda función de modelo de sonoridad.
  6. 6. El método de conformidad con la reivindicación 1, caracterizado porque el cálculo selecciona a partir de un grupo de dos o más modelos de sonoridad específica, un modelo o una combinación de dos o más de los modelos de sonoridad específica en cada una de las respectivas bandas de frecuencia de la señal de excitación.
  7. 7. El método de conformidad con la reivindicación 1, caracterizado porque el cálculo selecciona a partir de un grupo de dos o más modelos de sonoridad específica, un modelo o una combinación de dos o más de los modelos de sonoridad específica en un grupo de las respectivas bandas de frecuencia de la señal de excitación.
  8. 8. El método de conformidad con la reivindicación 7, caracterizado porque el grupo de las respectivas bandas de frecuencia es la totalidad de las bandas de frecuencia de la señal de excitación.
  9. 9. El método de conformidad con la reivindicación 1, caracterizado porgue la medición de las características de la señal de audio es derivada de la señal de excitación.
  10. 10. El método de conformidad con la reivindicación 1, caracterizado porque el cálculo incluye el cómputo de la sonoridad específica en cada una de las respectivas bandas de frecuencia de la señal de excitación.
  11. 11. El método de conformidad con la reivindicación 10, caracterizado porque el cálculo además comprende la selección de la sonoridad específica de una banda de frecuencia a fin de proporcionar la sonoridad perceptual o la combinación de la sonoridad específica de un grupo de bandas de frecuencia con el objeto de proporcionar la sonoridad perceptual .
  12. 12. Un método para el procesamiento de una señal de audio, caracterizado porque comprende la producción, en respuesta a la señal de audio, de una señal de excitación, y el cálculo, en respuesta al menos a la señal de excitación, de un valor de ganancia G[t] , el cual si fuera aplicado a la señal de audio, originaría una sonoridad percibida que es sustancialmente la misma que la sonoridad de referencia, el cálculo incluye un ciclo de procesamiento iterativo que está constituido al menos de un proceso no lineal .
  13. 13. El método de conformidad con la reivindicación 12, caracterizado porque el ciclo de procesamiento iterativo comprende el cálculo de la sonoridad perceptual .
  14. 14. El método de conformidad con la reivindicación 12, caracterizado porque el cálculo también es en respuesta a una medición de las características de la señal de audio.
  15. 15. El método de conformidad con la reivindicación 14, caracterizado porque al menos un proceso no lineal incluye el cálculo de la sonoridad especifica que selecciona, a partir de un grupo de dos o más funciones de modelo de sonoridad específica, una función o una combinación de dos o más de las funciones de modelo de sonoridad específica, la selección de las cuales es controlada por la medición de las características de la señal de entrada de audio.
  16. 16. El método de conformidad con la reivindicación 12, caracterizado porque la señal de excitación es aplanada con respecto al tiempo y/o el método además comprende el aplanamiento de tiempo del valor de ganancia G[t] .
  17. 17. El método de conformidad con la reivindicación 16, caracterizado porque la señal de excitación es aplanada con respecto al tiempo en forma lineal.
  18. 18. El método de conformidad con la reivindicación 16, caracterizado además porgue comprende el aplanamiento del valor de ganancia G[t] , el aplanamiento emplea una técnica de histograma .
  19. 19. El método de conformidad con la reivindicación 12, caracterizado porque el ciclo de procesamiento iterativo incluye el aplanamiento de tiempo.
  20. 20. El método de conformidad con la cualquiera de las reivindicaciones 12 a 19, caracterizado porgue el ciclo de procesamiento iterativo incluye el ajuste de la magnitud de la señal de excitación en respuesta a una función de un valor de ganancia de iteración G±, de manera que la magnitud ajustada de la señal de excitación se incrementa con el aumento de los valores de Gi y disminuye con el decremento de los valores de Gi, el cálculo de la sonoridad perceptual en respuesta a la señal de excitación ajustada por magnitud, la comparación de la sonoridad perceptual calculada de la señal de audio con una sonoridad perceptual de referencia para generar una diferencia, y el ajuste del valor de ganancia G¿ en respuesta a la diferencia para asi reducir la diferencia entre la sonoridad perceptual calculada y la sonoridad perceptual de referencia.
  21. 21. El método de conformidad con la reivindicación 20, caracterizado porque el ciclo de procesamiento iterativo, de acuerdo con un algoritmo de minimización, ajusta en forma repetitiva la magnitud de la señal de excitación, calcula una sonoridad perceptual, compara la sonoridad perceptual calculada con la sonoridad perceptual de referencia, y ajusta el valor de ganancia G con un valor final G[t] .
  22. 22. El método de conformidad con la reivindicación 21, caracterizado porgue el algoritmo de minimización se encuentra de acuerdo con el método descendiente de gradiente de minimización.
  23. 23. El método de conformidad con cualquiera de las reivindicaciones 12 a 22, caracterizado además porque comprende el control de la amplitud de la señal de entrada de audio con la ganancia G[t] , de modo que la sonoridad percibida resultante de la señal de entrada de audio sea sustancialmente la misma que la sonoridad de referencia.
  24. 24. El método de conformidad con cualquiera de las reivindicaciones 12 a 23, caracterizado porque la sonoridad de referencia es establecida por un usuario.
  25. 25. El método de conformidad con cualquiera de las reivindicaciones 12 a 23, caracterizado porque la sonoridad de referencia es una sonoridad perceptual calculada mediante el proceso de conformidad con la reivindicación 13.
  26. 26. El método de conformidad con la reivindicación 1 ó 12, caracterizado porque la producción, en respuesta a la señal de audio, de una señal de excitación comprende el filtrado en forma lineal de la señal de audio mediante una función o funciones que simulan las características del oído humano medio y externo a fin de generar una señal de audio filtrada en forma lineal, y la división de la señal de audio linealmente filtrada en bandas de frecuencia que simulan el patrón de excitación generado a lo largo de la membrana basilar del oído interno para producir la señal de excitación.
  27. 27. El método de conformidad con la reivindicación 12, caracterizado porque al menos un proceso no lineal incluye el cálculo de la sonoridad específica en cada banda de frecuencia de la señal de excitación.
  28. 28. El método de conformidad con la reivindicación 27, caracterizado porque el cálculo de la sonoridad específica en cada banda de frecuencia de la señal de excitación selecciona a partir de un grupo de dos o más funciones de modelo de sonoridad específica, una función o una combinación de dos o más de las funciones de modelo de sonoridad específica, la selección de las cuales es controlada por la medición de las características de la señal de entrada de audio.
  29. 29. El método de conformidad con la reivindicación 20, caracterizado porque el cálculo de la sonoridad perceptual en respuesta a la señal de excitación ajustada por magnitud incluye el cálculo de la sonoridad específica en las respectivas bandas de frecuencia de la señal de excitación.
  30. 30. El método de conformidad con la reivindicación 29, caracterizado porque el cálculo de la sonoridad específica en cada banda de frecuencia de la señal de excitación selecciona a partir de un grupo de dos o más funciones de modelo de sonoridad específica, una función o una combinación de dos o más de las funciones de modelo de sonoridad específica, la selección de las cuales es controlada por la medición de las características de la señal de entrada de audio .
  31. 31. El método de conformidad con la reivindicación 30, caracterizado porque el cálculo de la sonoridad perceptual en respuesta a la señal de excitación ajustada por magnitud además comprende la combinación de la sonoridad específica para cada banda de frecuencia en una medición de la sonoridad perceptual .
  32. 32. El método de conformidad con cualquiera de las reivindicaciones 13, 20, 21 y 23, caracterizado porque la sonoridad perceptual de referencia es derivada de una medición de la sonoridad perceptual calculada.
  33. 33. El método de conformidad con la reivindicación 32, caracterizado porque la sonoridad perceptual de referencia es una versión escalada de la sonoridad perceptual calculada.
  34. 34. El método de conformidad con la reivindicación 32, caracterizado porque la sonoridad perceptual de referencia es mayor que la sonoridad perceptual calculada cuando la sonoridad perceptual calculada se encuentra por debajo de un umbral y es menor que la sonoridad perceptual calculada cuando ésta se encuentra por encima de un umbral.
  35. 35. Un método para el procesamiento de una pluralidad de señales de audio, caracterizado porque comprende una pluralidad de procesos, cada uno de los cuales recibe una respectiva señal de las señales de audio, en donde cada proceso produce, en respuesta a la respectiva señal de audio, una señal de excitación, calcula, en respuesta por lo menos a la señal de excitación, un valor de ganancia G[t] , el cual si fuera aplicado a la señal de audio, originaría una sonoridad percibida que es sustancialmente la misma que la sonoridad de referencia, el cálculo incluye un ciclo de procesamiento iterativo que incluye al menos un proceso no lineal, y controla la amplitud de la respectiva señal de audio con la ganancia G[t] , de modo que la sonoridad percibida que se origina de la respectiva señal de audio sea sustancialmente la misma que la sonoridad de referencia y la aplicación de la misma señal acústica de referencia a cada uno de la pluralidad de los procesos.
  36. 36. El aparato, caracterizado porque está adaptado para efectar los métodos de conformidad con cualquiera de las reivindicaciones 1 a 35.
  37. 37. Un programa de computadora almacenado en un medio susceptible de ser leído por computadora, caracterizado porque provoca que la computadora efectúe los métodos de conformidad con cualquiera de las reivindicaciones 1 a 35.
MXPA05012785A 2003-05-28 2004-05-27 Metodo, aparato y programa de computadora para el calculo y ajuste de la sonoridad percibida de una senal de audio. MXPA05012785A (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US47407703P 2003-05-28 2003-05-28
PCT/US2004/016964 WO2004111994A2 (en) 2003-05-28 2004-05-27 Method, apparatus and computer program for calculating and adjusting the perceived loudness of an audio signal

Publications (1)

Publication Number Publication Date
MXPA05012785A true MXPA05012785A (es) 2006-02-22

Family

ID=33551475

Family Applications (1)

Application Number Title Priority Date Filing Date
MXPA05012785A MXPA05012785A (es) 2003-05-28 2004-05-27 Metodo, aparato y programa de computadora para el calculo y ajuste de la sonoridad percibida de una senal de audio.

Country Status (19)

Country Link
US (1) US8437482B2 (es)
EP (1) EP1629463B1 (es)
JP (1) JP4486646B2 (es)
KR (1) KR101164937B1 (es)
CN (2) CN101819771B (es)
AT (1) ATE371246T1 (es)
AU (1) AU2004248544B2 (es)
BR (1) BRPI0410740A (es)
CA (1) CA2525942C (es)
DE (1) DE602004008455T2 (es)
DK (1) DK1629463T3 (es)
ES (1) ES2290764T3 (es)
HK (2) HK1083918A1 (es)
IL (1) IL172108A (es)
IN (1) IN2010KN02913A (es)
MX (1) MXPA05012785A (es)
PL (1) PL1629463T3 (es)
SG (1) SG185134A1 (es)
WO (1) WO2004111994A2 (es)

Families Citing this family (113)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7610205B2 (en) 2002-02-12 2009-10-27 Dolby Laboratories Licensing Corporation High quality time-scaling and pitch-scaling of audio signals
US7711123B2 (en) 2001-04-13 2010-05-04 Dolby Laboratories Licensing Corporation Segmenting audio signals into auditory events
US7461002B2 (en) 2001-04-13 2008-12-02 Dolby Laboratories Licensing Corporation Method for time aligning audio signals using characterizations based on auditory events
EP1707027B1 (en) * 2004-01-13 2008-04-09 Koninklijke Philips Electronics N.V. Audio signal enhancement
US8983834B2 (en) 2004-03-01 2015-03-17 Dolby Laboratories Licensing Corporation Multichannel audio coding
US7617109B2 (en) * 2004-07-01 2009-11-10 Dolby Laboratories Licensing Corporation Method for correcting metadata affecting the playback loudness and dynamic range of audio information
US7508947B2 (en) 2004-08-03 2009-03-24 Dolby Laboratories Licensing Corporation Method for combining audio signals using auditory scene analysis
CN101048935B (zh) 2004-10-26 2011-03-23 杜比实验室特许公司 控制音频信号的单位响度或部分单位响度的方法和设备
US7676362B2 (en) * 2004-12-31 2010-03-09 Motorola, Inc. Method and apparatus for enhancing loudness of a speech signal
KR100708123B1 (ko) * 2005-02-04 2007-04-16 삼성전자주식회사 자동으로 오디오 볼륨을 조절하는 방법 및 장치
TWI397903B (zh) 2005-04-13 2013-06-01 Dolby Lab Licensing Corp 編碼音訊之節約音量測量技術
US8280730B2 (en) 2005-05-25 2012-10-02 Motorola Mobility Llc Method and apparatus of increasing speech intelligibility in noisy environments
CA2610430C (en) 2005-06-03 2016-02-23 Dolby Laboratories Licensing Corporation Channel reconfiguration with side information
JP4981123B2 (ja) * 2006-04-04 2012-07-18 ドルビー ラボラトリーズ ライセンシング コーポレイション オーディオ信号の知覚音量及び/又は知覚スペクトルバランスの計算と調整
TWI517562B (zh) 2006-04-04 2016-01-11 杜比實驗室特許公司 用於將多聲道音訊信號之全面感知響度縮放一期望量的方法、裝置及電腦程式
JP5185254B2 (ja) * 2006-04-04 2013-04-17 ドルビー ラボラトリーズ ライセンシング コーポレイション Mdct領域におけるオーディオ信号音量測定と改良
AU2007243586B2 (en) 2006-04-27 2010-12-23 Dolby Laboratories Licensing Corporation Audio gain control using specific-loudness-based auditory event detection
EP2044804A4 (en) * 2006-07-08 2013-12-18 Personics Holdings Inc PERSONAL HEARING AID AND METHOD
US11450331B2 (en) 2006-07-08 2022-09-20 Staton Techiya, Llc Personal audio assistant device and method
WO2008018012A2 (en) * 2006-08-10 2008-02-14 Koninklijke Philips Electronics N.V. A device for and a method of processing an audio signal
WO2008051347A2 (en) 2006-10-20 2008-05-02 Dolby Laboratories Licensing Corporation Audio dynamics processing using a reset
CN101569092A (zh) 2006-12-21 2009-10-28 皇家飞利浦电子股份有限公司 用于处理音频数据的系统
JP4938862B2 (ja) * 2007-01-03 2012-05-23 ドルビー ラボラトリーズ ライセンシング コーポレイション ハイブリッドデジタル/アナログラウドネス補償音量調節
CA2679953C (en) 2007-06-19 2014-01-21 Dolby Laboratories Licensing Corporation Loudness measurement with spectral modifications
US9698743B2 (en) 2007-07-13 2017-07-04 Dolby Laboratories Licensing Corporation Time-varying audio-signal level using a time-varying estimated probability density of the level
CN101790758B (zh) 2007-07-13 2013-01-09 杜比实验室特许公司 用于控制音频信号的信号处理的设备和方法
DE102007035172A1 (de) 2007-07-27 2009-02-05 Siemens Medical Instruments Pte. Ltd. Hörsystem mit visualisierter psychoakustischer Größe und entsprechendes Verfahren
EP2188986B1 (en) * 2007-08-16 2016-04-06 DTS, Inc. Audio processing for compressed digital television
CN102017402B (zh) 2007-12-21 2015-01-07 Dts有限责任公司 用于调节音频信号的感知响度的系统
MY179314A (en) * 2008-04-18 2020-11-04 Dolby Laboratories Licensing Corp Method and apparatus for maintaining speech audibility in multi-channel audio with minimal impact on surround experience
US8831936B2 (en) * 2008-05-29 2014-09-09 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for speech signal processing using spectral contrast enhancement
US8538749B2 (en) * 2008-07-18 2013-09-17 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for enhanced intelligibility
EP2149985B1 (en) * 2008-07-29 2013-04-03 LG Electronics Inc. An apparatus for processing an audio signal and method thereof
CN102160115A (zh) 2008-09-19 2011-08-17 杜比实验室特许公司 对于资源受限客户机设备的上游质量增强信号处理
WO2010033387A2 (en) * 2008-09-19 2010-03-25 Dolby Laboratories Licensing Corporation Upstream signal processing for client devices in a small-cell wireless network
CN102273223B (zh) * 2008-11-14 2014-05-07 塔特公司 动态音量控制和多空间处理保护
US9380385B1 (en) 2008-11-14 2016-06-28 That Corporation Compressor based dynamic bass enhancement with EQ
EP2374211B1 (en) 2008-12-24 2012-04-04 Dolby Laboratories Licensing Corporation Audio signal loudness determination and modification in the frequency domain
US9202456B2 (en) * 2009-04-23 2015-12-01 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for automatic control of active noise cancellation
WO2010127024A1 (en) * 2009-04-30 2010-11-04 Dolby Laboratories Licensing Corporation Controlling the loudness of an audio signal in response to spectral localization
TWI503816B (zh) * 2009-05-06 2015-10-11 Dolby Lab Licensing Corp 調整音訊信號響度並使其具有感知頻譜平衡保持效果之技術
WO2010131470A1 (ja) * 2009-05-14 2010-11-18 シャープ株式会社 ゲイン制御装置及びゲイン制御方法、音声出力装置
WO2010138311A1 (en) 2009-05-26 2010-12-02 Dolby Laboratories Licensing Corporation Equalization profiles for dynamic equalization of audio data
WO2010138309A1 (en) 2009-05-26 2010-12-02 Dolby Laboratories Licensing Corporation Audio signal dynamic equalization processing control
US9055374B2 (en) * 2009-06-24 2015-06-09 Arizona Board Of Regents For And On Behalf Of Arizona State University Method and system for determining an auditory pattern of an audio segment
US9215538B2 (en) * 2009-08-04 2015-12-15 Nokia Technologies Oy Method and apparatus for audio signal classification
US8538042B2 (en) * 2009-08-11 2013-09-17 Dts Llc System for increasing perceived loudness of speakers
US9305550B2 (en) * 2009-12-07 2016-04-05 J. Carl Cooper Dialogue detector and correction
EP2367286B1 (en) * 2010-03-12 2013-02-20 Harman Becker Automotive Systems GmbH Automatic correction of loudness level in audio signals
WO2011141772A1 (en) * 2010-05-12 2011-11-17 Nokia Corporation Method and apparatus for processing an audio signal based on an estimated loudness
US9053697B2 (en) 2010-06-01 2015-06-09 Qualcomm Incorporated Systems, methods, devices, apparatus, and computer program products for audio equalization
WO2012109384A1 (en) 2011-02-10 2012-08-16 Dolby Laboratories Licensing Corporation Combined suppression of noise and out - of - location signals
US20120263317A1 (en) * 2011-04-13 2012-10-18 Qualcomm Incorporated Systems, methods, apparatus, and computer readable media for equalization
WO2012161717A1 (en) * 2011-05-26 2012-11-29 Advanced Bionics Ag Systems and methods for improving representation by an auditory prosthesis system of audio signals having intermediate sound levels
JP6147744B2 (ja) 2011-07-29 2017-06-14 ディーティーエス・エルエルシーDts Llc 適応音声了解度処理システムおよび方法
US9173025B2 (en) 2012-02-08 2015-10-27 Dolby Laboratories Licensing Corporation Combined suppression of noise, echo, and out-of-location signals
US9437213B2 (en) * 2012-03-05 2016-09-06 Malaspina Labs (Barbados) Inc. Voice signal enhancement
CN103325380B (zh) 2012-03-23 2017-09-12 杜比实验室特许公司 用于信号增强的增益后处理
US9373341B2 (en) 2012-03-23 2016-06-21 Dolby Laboratories Licensing Corporation Method and system for bias corrected speech level determination
US9312829B2 (en) 2012-04-12 2016-04-12 Dts Llc System for adjusting loudness of audio signals in real time
US9806688B2 (en) * 2012-04-12 2017-10-31 Dolby Laboratories Licensing Corporation System and method for leveling loudness variation in an audio signal
EP2693637A1 (en) * 2012-08-01 2014-02-05 Harman Becker Automotive Systems GmbH Automatic loudness control
US9729965B2 (en) 2012-08-01 2017-08-08 Dolby Laboratories Licensing Corporation Percentile filtering of noise reduction gains
US10043535B2 (en) 2013-01-15 2018-08-07 Staton Techiya, Llc Method and device for spectral expansion for an audio signal
US9559651B2 (en) 2013-03-29 2017-01-31 Apple Inc. Metadata for loudness and dynamic range control
US9391576B1 (en) * 2013-09-05 2016-07-12 Cirrus Logic, Inc. Enhancement of dynamic range of audio signal path
US9831843B1 (en) 2013-09-05 2017-11-28 Cirrus Logic, Inc. Opportunistic playback state changes for audio devices
JP6151619B2 (ja) * 2013-10-07 2017-06-21 クラリオン株式会社 音場測定装置、音場測定方法および音場測定プログラム
US10045135B2 (en) 2013-10-24 2018-08-07 Staton Techiya, Llc Method and device for recognition and arbitration of an input connection
US9832562B2 (en) * 2013-11-07 2017-11-28 Gn Hearing A/S Hearing aid with probabilistic hearing loss compensation
EP2871858B1 (en) * 2013-11-07 2019-06-19 GN Hearing A/S A hearing aid with probabilistic hearing loss compensation
US10043534B2 (en) 2013-12-23 2018-08-07 Staton Techiya, Llc Method and device for spectral expansion for an audio signal
JP6576934B2 (ja) * 2014-01-07 2019-09-18 ハーマン インターナショナル インダストリーズ インコーポレイテッド 圧縮済みオーディオ信号の信号品質ベース強調及び補償
US9525940B1 (en) 2014-03-05 2016-12-20 Cirrus Logic, Inc. Multi-path analog front end and analog-to-digital converter for a signal processing system
US9774342B1 (en) 2014-03-05 2017-09-26 Cirrus Logic, Inc. Multi-path analog front end and analog-to-digital converter for a signal processing system
US9503803B2 (en) 2014-03-26 2016-11-22 Bose Corporation Collaboratively processing audio between headset and source to mask distracting noise
US9306588B2 (en) 2014-04-14 2016-04-05 Cirrus Logic, Inc. Switchable secondary playback path
CN105336341A (zh) 2014-05-26 2016-02-17 杜比实验室特许公司 增强音频信号中的语音内容的可理解性
US10785568B2 (en) 2014-06-26 2020-09-22 Cirrus Logic, Inc. Reducing audio artifacts in a system for enhancing dynamic range of audio signal path
US10013992B2 (en) 2014-07-11 2018-07-03 Arizona Board Of Regents On Behalf Of Arizona State University Fast computation of excitation pattern, auditory pattern and loudness
US9337795B2 (en) 2014-09-09 2016-05-10 Cirrus Logic, Inc. Systems and methods for gain calibration of an audio signal path
US9596537B2 (en) 2014-09-11 2017-03-14 Cirrus Logic, Inc. Systems and methods for reduction of audio artifacts in an audio system with dynamic range enhancement
US9503027B2 (en) 2014-10-27 2016-11-22 Cirrus Logic, Inc. Systems and methods for dynamic range enhancement using an open-loop modulator in parallel with a closed-loop modulator
US9584911B2 (en) 2015-03-27 2017-02-28 Cirrus Logic, Inc. Multichip dynamic range enhancement (DRE) audio processing methods and apparatuses
US10109288B2 (en) * 2015-05-27 2018-10-23 Apple Inc. Dynamic range and peak control in audio using nonlinear filters
US9959856B2 (en) 2015-06-15 2018-05-01 Cirrus Logic, Inc. Systems and methods for reducing artifacts and improving performance of a multi-path analog-to-digital converter
CA2988645C (en) * 2015-06-17 2021-11-16 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Loudness control for user interactivity in audio coding systems
DE102015216822B4 (de) * 2015-09-02 2017-07-06 Sivantos Pte. Ltd. Verfahren zur Unterdrückung einer Rückkopplung in einem Hörgerät
US9590580B1 (en) * 2015-09-13 2017-03-07 Guoguang Electric Company Limited Loudness-based audio-signal compensation
DE102015217565A1 (de) 2015-09-15 2017-03-16 Ford Global Technologies, Llc Verfahren und Vorrichtung zur Verarbeitung von Audio-Signalen
US9955254B2 (en) 2015-11-25 2018-04-24 Cirrus Logic, Inc. Systems and methods for preventing distortion due to supply-based modulation index changes in an audio playback system
US9543975B1 (en) 2015-12-29 2017-01-10 Cirrus Logic, Inc. Multi-path analog front end and analog-to-digital converter for a signal processing system with low-pass filter between paths
US9880802B2 (en) 2016-01-21 2018-01-30 Cirrus Logic, Inc. Systems and methods for reducing audio artifacts from switching between paths of a multi-path signal processing system
US9998826B2 (en) 2016-06-28 2018-06-12 Cirrus Logic, Inc. Optimization of performance and power in audio system
US10545561B2 (en) 2016-08-10 2020-01-28 Cirrus Logic, Inc. Multi-path digitation based on input signal fidelity and output requirements
US10263630B2 (en) 2016-08-11 2019-04-16 Cirrus Logic, Inc. Multi-path analog front end with adaptive path
US9813814B1 (en) 2016-08-23 2017-11-07 Cirrus Logic, Inc. Enhancing dynamic range based on spectral content of signal
US9780800B1 (en) 2016-09-19 2017-10-03 Cirrus Logic, Inc. Matching paths in a multiple path analog-to-digital converter
US9762255B1 (en) 2016-09-19 2017-09-12 Cirrus Logic, Inc. Reconfiguring paths in a multiple path analog-to-digital converter
US9929703B1 (en) 2016-09-27 2018-03-27 Cirrus Logic, Inc. Amplifier with configurable final output stage
US9967665B2 (en) 2016-10-05 2018-05-08 Cirrus Logic, Inc. Adaptation of dynamic range enhancement based on noise floor of signal
US10321230B2 (en) 2017-04-07 2019-06-11 Cirrus Logic, Inc. Switching in an audio system with multiple playback paths
US10008992B1 (en) 2017-04-14 2018-06-26 Cirrus Logic, Inc. Switching in amplifier with configurable final output stage
US9917557B1 (en) 2017-04-17 2018-03-13 Cirrus Logic, Inc. Calibration for amplifier with configurable final output stage
CN107464563B (zh) * 2017-08-11 2020-08-04 广州迪宝乐电子有限公司 一种语音交互玩具
US10389323B2 (en) * 2017-12-18 2019-08-20 Tls Corp. Context-aware loudness control
EP3827429A4 (en) 2018-07-25 2022-04-20 Dolby Laboratories Licensing Corporation COMPRESSOR TARGET CURVE TO AVOID AMPLIFICATION NOISE
JP7195344B2 (ja) 2018-07-27 2022-12-23 ドルビー ラボラトリーズ ライセンシング コーポレイション パーベイシブ・リステニングのための強制ギャップ挿入
CN109547848B (zh) * 2018-11-23 2021-02-12 北京达佳互联信息技术有限公司 响度调整方法、装置、电子设备以及存储介质
JP2022527111A (ja) 2019-04-03 2022-05-30 ドルビー ラボラトリーズ ライセンシング コーポレイション スケーラブル音声シーンメディアサーバ
CN111640446B (zh) * 2020-06-24 2023-03-10 北京百瑞互联技术有限公司 一种基于音频编码器的响度均衡方法、编码器及蓝牙设备
US11916525B2 (en) * 2021-08-27 2024-02-27 Sennheiser Electronic Gmbh & Co. Kg Method for automatically controlling loudness of an audio signal, and device for automatically controlling loudness of an audio signal
WO2023122227A1 (en) * 2021-12-22 2023-06-29 University Of Maryland Audio control system

Family Cites Families (116)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2808475A (en) 1954-10-05 1957-10-01 Bell Telephone Labor Inc Loudness indicator
US4281218A (en) 1979-10-26 1981-07-28 Bell Telephone Laboratories, Incorporated Speech-nonspeech detector-classifier
DE3314570A1 (de) 1983-04-22 1984-10-25 Philips Patentverwaltung Gmbh, 2000 Hamburg Verfahren und anordnung zur einstellung der verstaerkung
US4739514A (en) 1986-12-22 1988-04-19 Bose Corporation Automatic dynamic equalizing
US4887299A (en) 1987-11-12 1989-12-12 Nicolet Instrument Corporation Adaptive, programmable signal processing hearing aid
US4953112A (en) 1988-05-10 1990-08-28 Minnesota Mining And Manufacturing Company Method and apparatus for determining acoustic parameters of an auditory prosthesis using software model
US5027410A (en) 1988-11-10 1991-06-25 Wisconsin Alumni Research Foundation Adaptive, programmable signal processing and filtering for hearing aids
JPH02118322U (es) 1989-03-08 1990-09-21
US5097510A (en) 1989-11-07 1992-03-17 Gs Systems, Inc. Artificial intelligence pattern-recognition-based noise reduction system for speech processing
US5369711A (en) 1990-08-31 1994-11-29 Bellsouth Corporation Automatic gain control for a headset
US5632005A (en) 1991-01-08 1997-05-20 Ray Milton Dolby Encoder/decoder for multidimensional sound fields
ES2087522T3 (es) 1991-01-08 1996-07-16 Dolby Lab Licensing Corp Descodificacion/codificacion para campos sonoros multidimensionales.
EP0517233B1 (en) 1991-06-06 1996-10-30 Matsushita Electric Industrial Co., Ltd. Music/voice discriminating apparatus
US5278912A (en) 1991-06-28 1994-01-11 Resound Corporation Multiband programmable compression system
US5363147A (en) 1992-06-01 1994-11-08 North American Philips Corporation Automatic volume leveler
GB2272615A (en) 1992-11-17 1994-05-18 Rudolf Bisping Controlling signal-to-noise ratio in noisy recordings
DE4335739A1 (de) 1992-11-17 1994-05-19 Rudolf Prof Dr Bisping Verfahren zur Steuerung des Signal-/Rausch-Abstandes bei rauschbehafteten Tonaufnahmen
US5548638A (en) 1992-12-21 1996-08-20 Iwatsu Electric Co., Ltd. Audio teleconferencing apparatus
US5457769A (en) 1993-03-30 1995-10-10 Earmark, Inc. Method and apparatus for detecting the presence of human voice signals in audio signals
US5706352A (en) 1993-04-07 1998-01-06 K/S Himpp Adaptive gain and filtering circuit for a sound reproduction system
US5434922A (en) 1993-04-08 1995-07-18 Miller; Thomas E. Method and apparatus for dynamic sound optimization
BE1007355A3 (nl) 1993-07-26 1995-05-23 Philips Electronics Nv Spraaksignaaldiscriminatieschakeling alsmede een audio-inrichting voorzien van een dergelijke schakeling.
IN184794B (es) 1993-09-14 2000-09-30 British Telecomm
JP2986345B2 (ja) 1993-10-18 1999-12-06 インターナショナル・ビジネス・マシーンズ・コーポレイション 音声記録指標化装置及び方法
US5530760A (en) 1994-04-29 1996-06-25 Audio Products International Corp. Apparatus and method for adjusting levels between channels of a sound system
US5500902A (en) 1994-07-08 1996-03-19 Stockham, Jr.; Thomas G. Hearing aid device incorporating signal processing techniques
GB9419388D0 (en) 1994-09-26 1994-11-09 Canon Kk Speech analysis
US5548538A (en) * 1994-12-07 1996-08-20 Wiltron Company Internal automatic calibrator for vector network analyzers
US5682463A (en) 1995-02-06 1997-10-28 Lucent Technologies Inc. Perceptual audio compression based on loudness uncertainty
CA2167748A1 (en) 1995-02-09 1996-08-10 Yoav Freund Apparatus and methods for machine learning hypotheses
EP0661905B1 (de) 1995-03-13 2002-12-11 Phonak Ag Verfahren zur Anpassung eines Hörgerätes, Vorrichtung hierzu und Hörgerät
US5727119A (en) 1995-03-27 1998-03-10 Dolby Laboratories Licensing Corporation Method and apparatus for efficient implementation of single-sideband filter banks providing accurate measures of spectral magnitude and phase
WO1996032710A1 (en) 1995-04-10 1996-10-17 Corporate Computer Systems, Inc. System for compression and decompression of audio signals for digital transmission
US6301555B2 (en) 1995-04-10 2001-10-09 Corporate Computer Systems Adjustable psycho-acoustic parameters
US5601617A (en) 1995-04-26 1997-02-11 Advanced Bionics Corporation Multichannel cochlear prosthesis with flexible control of stimulus waveforms
JPH08328599A (ja) 1995-06-01 1996-12-13 Mitsubishi Electric Corp Mpegオーディオ復号器
US5663727A (en) 1995-06-23 1997-09-02 Hearing Innovations Incorporated Frequency response analyzer and shaping apparatus and digital hearing enhancement apparatus and method utilizing the same
US5712954A (en) 1995-08-23 1998-01-27 Rockwell International Corp. System and method for monitoring audio power level of agent speech in a telephonic switch
US6002776A (en) 1995-09-18 1999-12-14 Interval Research Corporation Directional acoustic signal processor and method therefor
US5907622A (en) 1995-09-21 1999-05-25 Dougherty; A. Michael Automatic noise compensation system for audio reproduction equipment
US5822018A (en) * 1996-04-02 1998-10-13 Farmer; James O. Method and apparatus for normalizing signal levels in a signal processing system
US6108431A (en) * 1996-05-01 2000-08-22 Phonak Ag Loudness limiter
US6327366B1 (en) 1996-05-01 2001-12-04 Phonak Ag Method for the adjustment of a hearing device, apparatus to do it and a hearing device
US6430533B1 (en) 1996-05-03 2002-08-06 Lsi Logic Corporation Audio decoder core MPEG-1/MPEG-2/AC-3 functional algorithm partitioning and implementation
JPH09312540A (ja) 1996-05-23 1997-12-02 Pioneer Electron Corp ラウドネスボリュームコントロール装置
JP3765622B2 (ja) 1996-07-09 2006-04-12 ユナイテッド・モジュール・コーポレーション オーディオ符号化復号化システム
EP0820212B1 (de) 1996-07-19 2010-04-21 Bernafon AG Lautheitsgesteuerte Verarbeitung akustischer Signale
JP2953397B2 (ja) 1996-09-13 1999-09-27 日本電気株式会社 ディジタル補聴器の聴覚補償処理方法及びディジタル補聴器
US6570991B1 (en) 1996-12-18 2003-05-27 Interval Research Corporation Multi-feature speech/music discrimination system
US5862228A (en) 1997-02-21 1999-01-19 Dolby Laboratories Licensing Corporation Audio matrix encoding
US6125343A (en) 1997-05-29 2000-09-26 3Com Corporation System and method for selecting a loudest speaker by comparing average frame gains
US6272360B1 (en) 1997-07-03 2001-08-07 Pan Communications, Inc. Remotely installed transmitter and a hands-free two-way voice terminal device using same
US6185309B1 (en) * 1997-07-11 2001-02-06 The Regents Of The University Of California Method and apparatus for blind separation of mixed and convolved sources
KR100261904B1 (ko) 1997-08-29 2000-07-15 윤종용 헤드폰 사운드 출력장치
US6088461A (en) 1997-09-26 2000-07-11 Crystal Semiconductor Corporation Dynamic volume control system
US6404891B1 (en) * 1997-10-23 2002-06-11 Cardio Theater Volume adjustment as a function of transmission quality
US6233554B1 (en) 1997-12-12 2001-05-15 Qualcomm Incorporated Audio CODEC with AGC controlled by a VOCODER
US6298139B1 (en) 1997-12-31 2001-10-02 Transcrypt International, Inc. Apparatus and method for maintaining a constant speech envelope using variable coefficient automatic gain control
US6182033B1 (en) 1998-01-09 2001-01-30 At&T Corp. Modular approach to speech enhancement with an application to speech coding
US6353671B1 (en) 1998-02-05 2002-03-05 Bioinstco Corp. Signal processing circuit and method for increasing speech intelligibility
JP3505085B2 (ja) * 1998-04-14 2004-03-08 アルパイン株式会社 オーディオ装置
US6311155B1 (en) 2000-02-04 2001-10-30 Hearing Enhancement Company Llc Use of voice-to-remaining audio (VRA) in consumer applications
US6498855B1 (en) 1998-04-17 2002-12-24 International Business Machines Corporation Method and system for selectively and variably attenuating audio data
DE69910780T3 (de) 1998-06-08 2012-06-06 Cochlear Ltd. Hörhilfevorrichtung
EP0980064A1 (de) 1998-06-26 2000-02-16 Ascom AG Verfahren zur Durchführung einer maschinengestützten Beurteilung der Uebertragungsqualität von Audiosignalen
US6351731B1 (en) 1998-08-21 2002-02-26 Polycom, Inc. Adaptive filter featuring spectral gain smoothing and variable noise multiplier for noise reduction, and method therefor
US6823303B1 (en) 1998-08-24 2004-11-23 Conexant Systems, Inc. Speech encoder using voice activity detection in coding noise
US6411927B1 (en) 1998-09-04 2002-06-25 Matsushita Electric Corporation Of America Robust preprocessing signal equalization system and method for normalizing to a target environment
FI113935B (fi) 1998-09-25 2004-06-30 Nokia Corp Menetelmä äänitason kalibroimiseksi monikanavaisessa äänentoistojärjestelmässä ja monikanavainen äänentoistojärjestelmä
DE19848491A1 (de) 1998-10-21 2000-04-27 Bosch Gmbh Robert Rundfunkempfänger zum Empfang von Radio-Daten und Verfahren zur Beeinflussung einer Klangcharakteristik eines wiederzugebenden Audiosignals in einem Rundfunkempfänger
US6314396B1 (en) 1998-11-06 2001-11-06 International Business Machines Corporation Automatic gain control in a speech recognition system
DE69933929T2 (de) 1999-04-09 2007-06-06 Texas Instruments Inc., Dallas Bereitstellen von digitalen Audio- und Videoprodukten
WO2000065872A1 (en) 1999-04-26 2000-11-02 Dspfactory Ltd. Loudness normalization control for a digital hearing aid
US6263371B1 (en) 1999-06-10 2001-07-17 Cacheflow, Inc. Method and apparatus for seaming of streaming content
US6985594B1 (en) 1999-06-15 2006-01-10 Hearing Enhancement Co., Llc. Voice-to-remaining audio (VRA) interactive hearing aid and auxiliary equipment
US6442278B1 (en) 1999-06-15 2002-08-27 Hearing Enhancement Company, Llc Voice-to-remaining audio (VRA) interactive center channel downmix
US20030035549A1 (en) * 1999-11-29 2003-02-20 Bizjak Karl M. Signal processing system and method
FR2802329B1 (fr) 1999-12-08 2003-03-28 France Telecom Procede de traitement d'au moins un flux binaire audio code organise sous la forme de trames
US6351733B1 (en) 2000-03-02 2002-02-26 Hearing Enhancement Company, Llc Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process
DE10018666A1 (de) 2000-04-14 2001-10-18 Harman Audio Electronic Sys Vorrichtung und Verfahren zum geräuschabhängigen Anpassen eines akustischen Nutzsignals
US6889186B1 (en) 2000-06-01 2005-05-03 Avaya Technology Corp. Method and apparatus for improving the intelligibility of digitally compressed speech
JP2002051392A (ja) * 2000-08-01 2002-02-15 Alpine Electronics Inc 車内会話補助装置
AUPQ952700A0 (en) * 2000-08-21 2000-09-14 University Of Melbourne, The Sound-processing strategy for cochlear implants
JP3448586B2 (ja) 2000-08-29 2003-09-22 独立行政法人産業技術総合研究所 聴覚障害を考慮した音の測定方法およびシステム
US6625433B1 (en) 2000-09-29 2003-09-23 Agere Systems Inc. Constant compression automatic gain control circuit
US6807525B1 (en) 2000-10-31 2004-10-19 Telogy Networks, Inc. SID frame detection with human auditory perception compensation
EP1206104B1 (en) 2000-11-09 2006-07-19 Koninklijke KPN N.V. Measuring a talking quality of a telephone link in a telecommunications network
US7457422B2 (en) 2000-11-29 2008-11-25 Ford Global Technologies, Llc Method and implementation for detecting and characterizing audible transients in noise
FR2820573B1 (fr) 2001-02-02 2003-03-28 France Telecom Methode et dispositif de traitement d'une pluralite de flux binaires audio
DE10107385A1 (de) 2001-02-16 2002-09-05 Harman Audio Electronic Sys Vorrichtung zum geräuschabhängigen Einstellen der Lautstärken
US6915264B2 (en) 2001-02-22 2005-07-05 Lucent Technologies Inc. Cochlear filter bank structure for determining masked thresholds for use in perceptual audio coding
WO2001049068A2 (de) 2001-04-10 2001-07-05 Phonak Ag Verfahren zur anpassung eines hörgerätes an ein individuum
US7711123B2 (en) 2001-04-13 2010-05-04 Dolby Laboratories Licensing Corporation Segmenting audio signals into auditory events
US7283954B2 (en) 2001-04-13 2007-10-16 Dolby Laboratories Licensing Corporation Comparing audio using characterizations based on auditory events
US7461002B2 (en) 2001-04-13 2008-12-02 Dolby Laboratories Licensing Corporation Method for time aligning audio signals using characterizations based on auditory events
US7610205B2 (en) 2002-02-12 2009-10-27 Dolby Laboratories Licensing Corporation High quality time-scaling and pitch-scaling of audio signals
EP1251715B2 (en) 2001-04-18 2010-12-01 Sound Design Technologies Ltd. Multi-channel hearing instrument with inter-channel communication
JP4681163B2 (ja) * 2001-07-16 2011-05-11 パナソニック株式会社 ハウリング検出抑圧装置、これを備えた音響装置、及び、ハウリング検出抑圧方法
CA2354755A1 (en) * 2001-08-07 2003-02-07 Dspfactory Ltd. Sound intelligibilty enhancement using a psychoacoustic model and an oversampled filterbank
US7177803B2 (en) 2001-10-22 2007-02-13 Motorola, Inc. Method and apparatus for enhancing loudness of an audio signal
US7068723B2 (en) 2002-02-28 2006-06-27 Fuji Xerox Co., Ltd. Method for automatically producing optimal summaries of linear media
US7155385B2 (en) 2002-05-16 2006-12-26 Comerica Bank, As Administrative Agent Automatic gain control for adjusting gain during non-speech portions
US7447631B2 (en) 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
JP3832396B2 (ja) * 2002-07-17 2006-10-11 コニカミノルタフォトイメージング株式会社 駆動装置、位置制御装置およびカメラ
JP4257079B2 (ja) 2002-07-19 2009-04-22 パイオニア株式会社 周波数特性調整装置および周波数特性調整方法
DE10236694A1 (de) 2002-08-09 2004-02-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren
US7454331B2 (en) 2002-08-30 2008-11-18 Dolby Laboratories Licensing Corporation Controlling loudness of speech in signals that contain speech and other types of audio material
DE10308483A1 (de) 2003-02-26 2004-09-09 Siemens Audiologische Technik Gmbh Verfahren zur automatischen Verstärkungseinstellung in einem Hörhilfegerät sowie Hörhilfegerät
US7551745B2 (en) 2003-04-24 2009-06-23 Dolby Laboratories Licensing Corporation Volume and compression control in movie theaters
US7617109B2 (en) 2004-07-01 2009-11-10 Dolby Laboratories Licensing Corporation Method for correcting metadata affecting the playback loudness and dynamic range of audio information
CN101048935B (zh) 2004-10-26 2011-03-23 杜比实验室特许公司 控制音频信号的单位响度或部分单位响度的方法和设备
US8265295B2 (en) 2005-03-11 2012-09-11 Rane Corporation Method and apparatus for identifying feedback in a circuit
JP4981123B2 (ja) 2006-04-04 2012-07-18 ドルビー ラボラトリーズ ライセンシング コーポレイション オーディオ信号の知覚音量及び/又は知覚スペクトルバランスの計算と調整
JP5185254B2 (ja) 2006-04-04 2013-04-17 ドルビー ラボラトリーズ ライセンシング コーポレイション Mdct領域におけるオーディオ信号音量測定と改良
AU2007243586B2 (en) 2006-04-27 2010-12-23 Dolby Laboratories Licensing Corporation Audio gain control using specific-loudness-based auditory event detection
JP4938862B2 (ja) 2007-01-03 2012-05-23 ドルビー ラボラトリーズ ライセンシング コーポレイション ハイブリッドデジタル/アナログラウドネス補償音量調節

Also Published As

Publication number Publication date
US20070092089A1 (en) 2007-04-26
EP1629463B1 (en) 2007-08-22
CA2525942C (en) 2015-04-07
BRPI0410740A (pt) 2006-06-27
CA2525942A1 (en) 2004-12-23
DE602004008455D1 (de) 2007-10-04
ES2290764T3 (es) 2008-02-16
WO2004111994A2 (en) 2004-12-23
IN2010KN02913A (es) 2015-05-01
AU2004248544B2 (en) 2010-02-18
SG185134A1 (en) 2012-11-29
CN101819771A (zh) 2010-09-01
CN1795490A (zh) 2006-06-28
IL172108A (en) 2010-11-30
PL1629463T3 (pl) 2008-01-31
HK1105711A1 (en) 2008-02-22
KR101164937B1 (ko) 2012-07-12
ATE371246T1 (de) 2007-09-15
HK1083918A1 (en) 2006-07-14
DK1629463T3 (da) 2007-12-10
CN101819771B (zh) 2012-04-11
AU2004248544A1 (en) 2004-12-23
JP2007503796A (ja) 2007-02-22
KR20060013400A (ko) 2006-02-09
DE602004008455T2 (de) 2008-05-21
EP1629463A2 (en) 2006-03-01
WO2004111994A3 (en) 2005-08-11
US8437482B2 (en) 2013-05-07
JP4486646B2 (ja) 2010-06-23

Similar Documents

Publication Publication Date Title
MXPA05012785A (es) Metodo, aparato y programa de computadora para el calculo y ajuste de la sonoridad percibida de una senal de audio.
US11296668B2 (en) Methods and apparatus for adjusting a level of an audio signal
US8199933B2 (en) Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
WO2007120453A1 (en) Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
EP1835487B1 (en) Method, apparatus and computer program for calculating and adjusting the perceived loudness of an audio signal

Legal Events

Date Code Title Description
FG Grant or registration