ES2994834T3 - System and method for non-destructively normalizing loudness of audio signals within portable devices - Google Patents

System and method for non-destructively normalizing loudness of audio signals within portable devices Download PDF

Info

Publication number
ES2994834T3
ES2994834T3 ES22160243T ES22160243T ES2994834T3 ES 2994834 T3 ES2994834 T3 ES 2994834T3 ES 22160243 T ES22160243 T ES 22160243T ES 22160243 T ES22160243 T ES 22160243T ES 2994834 T3 ES2994834 T3 ES 2994834T3
Authority
ES
Spain
Prior art keywords
encoded
dynamic range
decoding device
dbfs
level
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES22160243T
Other languages
English (en)
Inventor
Jeffrey Riedmiller
Harald Mundt
Michael Schug
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby International AB
Dolby Laboratories Licensing Corp
Original Assignee
Dolby International AB
Dolby Laboratories Licensing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby International AB, Dolby Laboratories Licensing Corp filed Critical Dolby International AB
Application granted granted Critical
Publication of ES2994834T3 publication Critical patent/ES2994834T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G7/00Volume compression or expansion in amplifiers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/20Automatic control
    • H03G3/30Automatic control in amplifiers having semiconductor devices
    • H03G3/3089Control of digital or coded signals
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/20Automatic control
    • H03G3/30Automatic control in amplifiers having semiconductor devices
    • H03G3/32Automatic control in amplifiers having semiconductor devices the control being dependent upon ambient noise level or sound level
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G7/00Volume compression or expansion in amplifiers
    • H03G7/007Volume compression or expansion in amplifiers of digital or coded signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Stereophonic System (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

Muchos dispositivos de reproducción portátiles no pueden decodificar y reproducir contenido de audio codificado que tenga un ancho de banda amplio y un amplio rango dinámico con un volumen y una inteligibilidad constantes a menos que el contenido de audio codificado haya sido preparado especialmente para estos dispositivos. Este problema se puede superar incluyendo con el contenido codificado algunos metadatos que especifiquen un perfil de compresión de rango dinámico adecuado mediante valores absolutos o valores diferenciales en relación con otro perfil de compresión conocido. Un dispositivo de reproducción también puede aplicar de forma adaptativa ganancia y limitación al audio de reproducción. Se describen implementaciones en codificadores, transcodificadores y decodificadores. (Traducción automática con Google Translate, sin valor legal)

Description

DESCRIPCIÓN
Sistema y método para normalizar de manera no destructiva la sonoridad de señales de audio en dispositivos portátiles
Referencia cruzada a la aplicación relacionada
Esta solicitud es una solicitud divisional europea de la solicitud de patente europea EP18191911.9 (referencia: D10006EP04), cuyo formulario 1001 de la OEP fue presentado el 31 de agosto de 2018.
Campo técnico
La presente invención se refiere en general a la codificación y decodificación de señales de audio y se refiere más específicamente a técnicas que pueden usarse para codificar y decodificar señales de audio para una gama más amplia de dispositivos de reproducción y entornos de escucha.
Antecedentes de la técnica
La creciente popularidad de los dispositivos de mano y otros tipos de dispositivos portátiles ha creado nuevas oportunidades y desafíos para los creadores y distribuidores de contenido multimedia para reproducir en esos dispositivos, así como para los diseñadores y fabricantes de los dispositivos. Muchos dispositivos portátiles son capaces de reproducir una amplia gama de tipos y formatos de contenido multimedia, incluidos los que a menudo se asocian con contenido de audio de alta calidad, amplio ancho de banda y amplio rango dinámico para HDTV, Blu-ray o DVD. Se pueden usar dispositivos portátiles para reproducir este tipo de contenido de audio en sus propios transductores acústicos internos o en transductores externos como auriculares; sin embargo, por lo general no pueden reproducir este contenido con una sonoridad e inteligibilidad consistentes en diferentes formatos de medios y tipos de contenido.
La publicación Jeffrey C. Riedmiller: “An Analysis of Audio for Digital Cable Television Recommendations for the Digital Transition via Audio Metadata”, Dolby Laboratories Inc., documento técnico de la NCTA, 2001, páginas 1 18, aborda estos asuntos.
Divulgación de la invención
La presente invención está dirigida a proporcionar métodos mejorados para codificar y decodificar señales de audio para su reproducción en una variedad de dispositivos, incluidos dispositivos de mano y otros tipos de dispositivos portátiles.
Varios aspectos de la presente invención se exponen en las reivindicaciones independientes que se muestran a continuación.
Las diversas características de la presente invención y sus realizaciones preferidas pueden entenderse mejor con referencia a la siguiente discusión y los dibujos adjuntos en los que los mismos números de referencia se refieren a elementos similares en las diversas figuras. El contenido de la siguiente discusión y los dibujos se exponen solo como ejemplos y no debe entenderse que representan limitaciones sobre el alcance de la presente invención.
Breve descripción de los dibujos
La figura 1 es un diagrama de bloques esquemático de un dispositivo de reproducción.
La figura 2 es un diagrama de bloques esquemático de un dispositivo de codificación.
Las figuras 3 a 5 son diagramas de bloques esquemáticos de dispositivos de transcodificación.
La figura 6 es un diagrama de bloques esquemático de un dispositivo que puede usarse para implementar varios aspectos de la presente invención.
Modos de llevar a cabo la invención
A. Introducción
La presente invención está dirigida a la codificación y decodificación de información de audio para su reproducción en entornos de escucha desafiantes como los que encuentran los usuarios de dispositivos de mano y otros tipos de dispositivos portátiles. Algunos ejemplos de codificación y decodificación de audio se describen en estándares publicados, como los que se describen en el “Digital Audio Compression Standard (AC-3, E-AC3)”, revisión B, documento A/52B, 14 de junio de 2005, publicado por Advanced Televisión Systems Committee, Inc. (denominado en el presente documento “Estándar ATSC”), y en ISO/IEC 13818-7, Codificación de audio avanzada (AAC) (denominado en el presente documento “Estándar MPEG-2 AAC”) y ISO/IEC 14496-3, subparte 4 (denominado en el presente documento “Estándar de audio MPEG-4”) publicado por la Organización Internacional de Normalización (ISO). Los procesos de codificación y decodificación que cumplen a estos estándares se mencionan solo como ejemplos. Los principios de la presente invención se pueden usar con sistemas de codificación que cumplan también otras normas.
Los inventores descubrieron que las características disponibles de los dispositivos que cumplen algunos estándares de codificación a menudo no son suficientes para las aplicaciones y los entornos de escucha que son típicos de los dispositivos de mano y otros tipos de dispositivos portátiles. Cuando estos tipos de dispositivos se usan para decodificar el contenido de audio de las señales de entrada codificadas que cumplen con estos estándares, el contenido de audio decodificado a menudo se reproduce a niveles de sonoridad significativamente más bajos que los niveles de sonoridad del contenido de audio obtenidos mediante la decodificación de señales de entrada codificadas que se prepararon especialmente para su reproducción en estos dispositivos.
Las señales de entrada codificadas que cumplen con el estándar ATSC (denominadas en el presente documento “señales codificadas compatibles con ATSC”), por ejemplo, contienen información de audio codificada y metadatos que describen cómo se puede decodificar esta información. Algunos de los parámetros de metadatos identifican un perfil de compresión de rango dinámico que especifica cómo se puede comprimir el rango dinámico de la información de audio cuando se decodifica la información de audio codificada. El rango dinámico completo de la señal decodificada se puede retener o se puede comprimir en diversos grados en el momento de la decodificación para satisfacer las demandas de diferentes aplicaciones y entornos de escucha. Otros metadatos identifican alguna medida de sonoridad de la información de audio codificada, como un nivel de programa promedio o nivel de diálogo en la señal codificada. Estos metadatos pueden ser usados por un decodificador para ajustar amplitudes de la señal decodificada para lograr una sonoridad específica o un nivel de reproducción de referencia durante la reproducción. En algunas aplicaciones, se pueden especificar o asumir uno o más niveles de reproducción de referencia, mientras que en otras aplicaciones se le puede dar al usuario el control sobre el establecimiento del nivel de reproducción de referencia. Por ejemplo, los procesos de codificación usados para codificar y decodificar señales codificadas compatibles con ATSC asumen que el diálogo se reproducirá en uno de los dos niveles de reproducción de referencia. Un nivel está 31 dB por debajo de un nivel de recorte, que es el valor digital o valor de escala completa (FS) más grande posible, indicado aquí como -31 dBFS. El modo de decodificación que usa este nivel a veces se denomina “modo de línea” y está diseñado para usarse en aplicaciones y entornos donde son adecuados rangos dinámicos más amplios. El otro nivel se establece en -20 dBFS. El modo de decodificación que usa este segundo nivel a veces se denomina “modo RF”, que está diseñado para usarse en aplicaciones y entornos como los que se encuentran en la difusión por modulación de señales de radiofrecuencia (RF) donde se necesitan rangos dinámicos más estrechos para evitar la sobremodulación.
Para otro ejemplo, las señales codificadas que se adecúan a los estándares MPEG-2 AAC y audio MPEG-4 incluyen metadatos que identifican un nivel de sonoridad promedio para la información de audio codificada. Los procesos que decodifican señales codificadas compatibles con MPEG-2 AAC y audio MPEG-4 pueden permitir al oyente especificar el nivel de reproducción deseado. El decodificador usa el nivel de reproducción deseado y los metadatos de sonoridad promedio para ajustar las amplitudes de la señal decodificada de modo que se logre el nivel de reproducción deseado.
Cuando se usan dispositivos de mano y otros tipos de dispositivos portátiles para decodificar y reproducir el contenido de audio de señales codificadas compatibles con ATSC, compatibles con MPEG-2 AAC y compatibles con audio MPEG-4 de acuerdo con estos parámetros de metadatos, el rango dinámico y el nivel de sonoridad a menudo no son adecuados debido a los entornos de escucha adversos que se encuentran con este tipo de dispositivos o debido a las limitaciones eléctricas debido a los voltajes operativos más bajos que se usan en estos dispositivos.
Las señales codificadas que cumplen otros estándares usan tipos similares de metadatos y pueden incluir una disposición para especificar el nivel de sonoridad de reproducción previsto. A menudo, se encuentran los mismos problemas con los dispositivos portátiles que decodifican estas señales.
La presente invención se puede usar para mejorar la experiencia de escucha de los usuarios de dispositivos de mano y portátiles sin requerir contenido que haya sido preparado especialmente para estos dispositivos.
B. Descripción general del dispositivo
La figura 1 es un diagrama de bloques esquemático de un tipo de dispositivo 10 de receptor/decodificador que incorpora varios aspectos de la presente invención. El dispositivo 10 recibe una señal de entrada codificada de la ruta 11 de señal, aplica procesos adecuados en el desformateador 12 para extraer información de audio codificada y metadatos asociados de la señal de entrada, pasa la información de audio codificada al decodificador 14 y pasa los metadatos a lo largo de la ruta 13 de señal. La información de audio codificada incluye señales de subbanda codificadas que representan el contenido espectral de los estímulos auditivos y los metadatos especifican valores para una variedad de parámetros que incluyen uno o más parámetros de control de decodificación y uno o más parámetros que especifican la compresión del rango dinámico de acuerdo con un perfil de compresión de rango dinámico. El término “perfil de compresión de rango dinámico” se refiere a características tales como factores de ganancia, tiempos de ataque de compresión y tiempos de liberación de compresión que definen las características operativas de un compresor de rango dinámico.
El decodificador 14 aplica un proceso de decodificación a la información de audio codificada para obtener señales de subbanda decodificadas, que se pasan al control 16 de rango dinámico. El funcionamiento y las funciones del proceso de decodificación pueden adaptarse en respuesta a los parámetros de control de decodificación recibidos desde la ruta 13 de señal. Ejemplos de parámetros de control de decodificación que pueden usarse para adaptar el funcionamiento y funciones del proceso de decodificación son parámetros que identifican el número y la configuración de los canales de audio representados por la información de audio codificada.
El control 16 de rango dinámico ajusta opcionalmente el rango dinámico de la información de audio decodificada. Este ajuste puede activarse o desactivarse y adaptarse en respuesta a los metadatos recibidos desde la ruta 13 de señal y/o desde las señales de control que pueden proporcionarse en respuesta a la entrada de un oyente. Por ejemplo, se puede proporcionar una señal de control en respuesta a que un oyente accione un interruptor o seleccione una opción operativa para el dispositivo 10.
En implementaciones que cumplen con el estándar ATSC, el estándar MPEG-2 AAC o el estándar de audio MPEG-4, por ejemplo, la señal de entrada codificada incluye información de audio codificada organizada en una secuencia de segmentos o tramas. Cada trama contiene señales de subbanda codificadas que representan los componentes espectrales de una señal de audio con su rango dinámico completo. El control 16 de rango dinámico puede no realizar ninguna acción, lo que permite que la señal de audio se reproduzca con una cantidad máxima de rango dinámico, o puede modificar las señales de subbanda decodificadas para comprimir el rango dinámico en diversos grados.
El banco 18 de filtros de síntesis aplica un banco de filtros de síntesis a las señales de subbanda decodificadas, que pueden haber sido ajustadas por el control 16 de rango dinámico, y proporciona a su salida una señal de audio de dominio tiempo que puede ser una señal digital o analógica.
El limitador 20 de ganancia se usa en algunas implementaciones de la presente invención para ajustar la amplitud de la señal de audio de dominio tiempo. La salida del limitador 20 de ganancia pasa a lo largo de la ruta 21 para su posterior presentación por un transductor acústico.
La figura 2 es un diagrama de bloques esquemático de un dispositivo 30 de codificador/transmisor que incorpora varios aspectos de la presente invención. El dispositivo 30 recibe una señal de entrada de audio desde la ruta 31 de señal que representa estímulos auditivos. El dispositivo 30 aplica un banco de filtros de análisis a la señal de audio para obtener señales de subbanda en una representación de dominio frecuencia de la señal de audio de entrada o un conjunto de señales de ancho de banda limitado que representan la señal de audio de entrada. La calculadora 34 de metadatos analiza la señal de entrada de audio y/o una o más señales derivadas de la señal de entrada de audio, como una versión modificada de la señal de entrada de audio o las señales de subbanda del banco 32 de filtros de análisis para calcular metadatos que especifican valores para un variedad de parámetros que incluyen parámetros de control de codificación, uno o más parámetros de control de decodificación y uno o más parámetros que especifican la compresión del rango dinámico de acuerdo con un perfil de compresión de rango dinámico. La calculadora 34 de metadatos puede analizar señales de dominio tiempo, señales en el dominio frecuencia o una combinación de señales de dominio tiempo y de dominio frecuencia. Los cálculos realizados por la calculadora 34 de metadatos también pueden adaptarse en respuesta a uno o más parámetros de metadatos recibidos desde la ruta 33. El codificador 36 aplica un proceso de codificación a la salida del banco 32 de filtros de análisis para obtener información de audio codificada que incluye señales de subbanda codificadas, que se pasa al formateador 38. El proceso de codificación puede adaptarse en respuesta a los parámetros de control de codificación recibidos desde la ruta 33. El proceso de codificación también puede generar otros parámetros de control de decodificación a lo largo de la ruta 33 para que los usen los procesos realizados en el dispositivo 10 para decodificar la información de audio codificada. El formateador 38 ensambla la información de audio codificada y al menos algunos de los metadatos, incluidos uno o más parámetros de control de decodificación y uno o más parámetros que especifican la compresión del rango dinámico en una señal de salida codificada que tiene un formato adecuado para transmisión o almacenamiento.
En implementaciones que cumplen con el estándar ATSC, el estándar MPEG-2 AAC o el estándar de audio MPEG-4, por ejemplo, la señal de salida codificada incluye información de audio codificada organizada en una secuencia de segmentos o tramas. Cada trama contiene señales de subbanda codificadas que representan los componentes espectrales de una señal de audio con su rango dinámico completo y que tienen amplitudes para la reproducción a un nivel de reproducción de referencia.
El desformateador 12, el decodificador 14, el banco 18 de filtros de síntesis, el banco 32 de filtros de análisis, el codificador 36 y el formateador 38 pueden ser de diseño y funcionamiento convencionales. Algunos ejemplos incluyen los componentes correspondientes que cumplen con los estándares publicados mencionados anteriormente. Las implementaciones de los componentes especificados o sugeridos en estos estándares son adecuadas para usar con la presente invención pero no son necesarios. Ninguna implementación particular de estos componentes es crítica.
Las figuras 3 a 5 son diagramas de bloques esquemáticos de diferentes implementaciones de un dispositivo 40 de transcodificador que comprende algunos de los componentes en el dispositivo 10 y el dispositivo 30, descritos anteriormente. Estos componentes funcionan sustancialmente igual que sus contrapartes. El dispositivo 40 que se muestra en la figura 3 es capaz de transcodificar la señal de entrada codificada recibida desde la ruta 11 en una versión modificada que cumple el mismo estándar de codificación. En esta implementación, el dispositivo 40 recibe una señal de entrada codificada de la ruta 11 de señal, aplica procesos adecuados en el desformateador 12 para extraer la primera información de audio codificada y los metadatos asociados de la señal de entrada codificada, pasa la primera información de audio codificada al decodificador 14 y al formateador 38, y pasa los metadatos a lo largo de la ruta 43 de señal. La primera información de audio codificada incluye señales de subbanda codificadas que representan el contenido espectral de los estímulos auditivos y los metadatos especifican valores para una variedad de parámetros que incluyen uno o más parámetros de control de decodificación y uno o más parámetros que especifican la compresión del rango dinámico de acuerdo con un primer perfil de compresión de rango dinámico. El decodificador 14 aplica un proceso de decodificación a la primera información de audio codificada para obtener señales de subbanda decodificadas. El funcionamiento y las funciones del proceso de decodificación pueden adaptarse en respuesta a uno o más parámetros de control de decodificación recibidos desde la ruta 43 de señal. Las señales de subbanda pueden ser una representación en el dominio frecuencia de los estímulos auditivos o un conjunto de señales de ancho de banda limitado que representan los estímulos auditivos.
La calculadora 44 de metadatos analiza las señales de subbanda decodificadas y/o una o más señales derivadas de las señales de subbanda decodificadas para calcular uno o más valores de parámetro que especifican la compresión de rango dinámico de acuerdo con un segundo perfil de compresión de rango dinámico. Por ejemplo, una o más señales pueden obtenerse aplicando el banco 18 de filtros de síntesis a las señales de subbanda decodificadas. Los cálculos realizados por la calculadora 44 de metadatos pueden adaptarse en respuesta a los metadatos recibidos desde la ruta 43. El banco 18 de filtros de síntesis puede omitirse de esta implementación si su salida no es necesaria para el cálculo de metadatos.
Otra implementación del dispositivo 40 se muestra en la figura 4. Esta implementación es similar a la que se muestra en la figura 3 pero incluye el codificador 36. La inclusión del codificador 36 permite que el dispositivo 40 transcodifique la señal de entrada codificada recibida de la ruta 11, que cumple un primer estándar de codificación, en una señal de salida codificada que cumple un segundo estándar de codificación que puede ser igual o diferente del primer estándar de codificación siempre que las señales de subbanda de los dos estándares de codificación sean compatibles. Esto se puede hacer en esta implementación haciendo que el codificador 36 aplique un proceso de codificación a las señales de subbanda para obtener una segunda información de audio codificada que cumpla segundo estándar de codificación. La segunda información de audio codificada se pasa al formateador 38. El proceso de codificación puede adaptarse en respuesta a los metadatos recibidos desde la ruta 43. El proceso de codificación también puede generar otros metadatos a lo largo de la ruta 43 para que los usen los procesos realizados en el dispositivo 10 para decodificar la información de audio codificada. El formateador 38 ensambla los metadatos recibidos de la ruta 43 y la información de audio codificada que recibe en una señal de salida codificada que tiene un formato que es adecuado para transmisión o almacenamiento.
Otra implementación más del dispositivo 40 se muestra en la figura 5. Esta implementación incluye el banco 18 de filtros de síntesis, que se aplica a las señales de subbanda decodificadas para obtener una representación de dominio tiempo o de banda ancha de la información de audio codificada. La inclusión del banco 18 de filtros de síntesis y el banco 32 de filtros de análisis permite que el dispositivo 40 transcodifique entre esencialmente cualquier opción de estándares de codificación. La salida del banco 18 de filtros de síntesis se pasa al banco 32 de filtros de análisis, que genera señales de subbanda para que las codifique el codificador 36. El codificador 36 aplica un proceso de codificación a la salida del banco 32 de filtros de análisis para obtener una segunda información de audio codificada, que se pasa al formateador 38. El proceso de codificación también puede generar otros metadatos a lo largo de la ruta 43 para que los usen los procesos realizados en el dispositivo 10 para decodificar la información de audio codificada. La calculadora 44 de metadatos puede calcular valores de parámetro de metadatos a partir de su análisis de cualquiera o todas las señales de subbanda recibidas del decodificador 14, la salida del banco 18 de filtros de síntesis y la salida del banco 32 de filtros de análisis.
Algunos aspectos del dispositivo 10 y el dispositivo 30 se describen a continuación con más detalle. Estas descripciones se aplican a las características correspondientes del dispositivo 40. Estos aspectos se describen en términos de funciones y características de los métodos y dispositivos que cumplen el estándar ATSC mencionado anteriormente. Estas funciones y características específicas se tratan únicamente a modo de ejemplo. Los principios que subyacen a estas implementaciones son directamente aplicables a los métodos y dispositivos que cumplen otros estándares.
C. Receptor/Decodificador
Los problemas de reproducción descritos anteriormente se pueden abordar mediante el uso de una o más de las tres técnicas diferentes que se describen a continuación. La primera técnica usa la limitación de ganancia y puede implementarse mediante características solo en el dispositivo 10. La segunda y la tercera técnica usan compresión de rango dinámico y sus implementaciones requieren características tanto en el dispositivo 10 como en el dispositivo 30.
1. Limitador de ganancia
La primera técnica opera el dispositivo 10 en modo RF en lugar de en modo de línea para que decodifique una señal de entrada codificada compatible con ATSC con el control 16 de rango dinámico proporcionando niveles más altos de compresión de rango dinámico y un nivel de reproducción de referencia más alto. El limitador 20 de ganancia proporciona una ganancia adicional, elevando el nivel de reproducción de referencia efectivo a un valor de -14 dBFS a -8 dBFS. Los resultados empíricos indican que un nivel de referencia igual a -11 dBFS da buenos resultados para muchas aplicaciones.
El limitador 20 de ganancia también aplica una operación de limitación para evitar que la señal digital amplificada exceda 0 dBFS. Las características operativas del limitador pueden afectar la calidad percibida del audio reproducido pero ningún limitador en particular es crítico para la presente invención. El limitador puede implementarse esencialmente de cualquier forma que se desee. Preferiblemente, el limitador está diseñado para proporcionar una función de limitación “suave” en lugar de una función de recorte “duro”.
2. Valores diferenciales de compresión
La segunda técnica permite que el dispositivo 10 aplique uno o más parámetros de compresión de rango dinámico modificados en el control 16 de rango dinámico. El desformateador 12 obtiene valores de parámetro de compresión de rango dinámico (DRC) diferenciales de la señal de entrada codificada y pasa los valores de parámetro diferenciales junto con los valores de parámetro DRC convencionales a lo largo de la ruta 13 al control 16 de rango dinámico. El control 16 de rango dinámico calcula uno o más valores de parámetro DRC que necesita combinando aritméticamente los valores de parámetro DRC convencionales con los correspondientes valores de parámetro diferenciales DRC. No es necesario usar el limitador 20 de ganancia en esta situación. Los valores de parámetro diferenciales DRC son proporcionados en la señal de entrada codificada por el dispositivo 30 de codificador/transmisor que generó la señal de entrada codificada. Esto se describe a continuación.
Si la señal de entrada codificada no contiene estos valores diferenciales DRC, el dispositivo 10 puede usar el limitador 20 de ganancia de acuerdo con la primera técnica descrita anteriormente.
3. Perfil de compresión distinto
La tercera técnica permite que el dispositivo 10 aplique compresión de rango dinámico de acuerdo con un nuevo perfil de compresión de rango dinámico en el control 16 de rango dinámico. El desformateador 12 obtiene uno o más valores de parámetro DRC para el nuevo perfil de la señal de entrada codificada y los pasa a lo largo de la ruta 13 al control 16 de rango dinámico. No es necesario usar el limitador 20 de ganancia en esta situación. Los valores de parámetro DRC para el nuevo perfil de compresión de rango dinámico se proporcionan en la señal de entrada codificada por el dispositivo 30 de codificador/transmisor que generó la señal de entrada codificada. Esto se describe a continuación.
Si la señal de entrada codificada no contiene uno o más valores de parámetro DRC para el nuevo perfil DRC, el dispositivo 10 puede usar el limitador 20 de ganancia de acuerdo con la primera técnica descrita anteriormente. D. Codificador/Transmisor
1. Valores de compresión diferencial
Los procesos para la segunda técnica discutida anteriormente se implementan en el dispositivo 10 usando valores de parámetro diferenciales DRC que se extraen de la señal de entrada codificada. Estos valores de parámetro diferenciales son proporcionados por el dispositivo 30 que generó la señal codificada.
El dispositivo 30 proporciona un conjunto de valores de parámetro diferenciales DRC que representan la diferencia entre un conjunto de valores de parámetro DRC que estarán presentes en la señal codificada y un conjunto de valores de parámetro base correspondientes para un nuevo perfil DRC que se requieren para evitar que las muestras de señales de audio decodificadas excedan 0 dBFS para un nivel de reproducción de referencia más alto. Ningún método particular para calcular los valores de parámetro DRC es crítico para la presente invención. Métodos conocidos para calcular valores de parámetro que se adecúan al estándar ATSC se divulgan en “ATSC Recommended Practice: Techniques for Estalishing an Maintaining Audio Loudness for Digital Television”, documento A/85, 4 de noviembre de 2009, publicado por Advanced Television Systems Committee, Inc., especialmente la Sección 9 y el Anexo F, y en Robinson et al., “Dynamic Range Control via Metadata”, prepublicación n.° 5028, 107a Convención AES, Nueva York, septiembre de 1999.
Si la señal de salida codificada cumple con el estándar ATSC, el estándar MPEG-2 AAC o el estándar de audio MPEG-4, el nivel de reproducción de referencia aumenta a un valor de -14 dBFS a -8 dBFS. Los resultados empíricos indican que un nivel de referencia igual a -11 dBFS da buenos resultados para muchas aplicaciones. Para señales de salida codificadas compatibles con ATSC, la calculadora 34 de metadatos calcula un valor de parámetro diferencial para el parámetro base correspondiente “compr” especificado en el estándar. El formateador 38 puede ensamblar el valor de parámetro diferencial en porciones de cada trama de señal codificada indicada como “addbsi” (información de flujo de bits adicional) y/o “auxdata” (datos auxiliares). Si los valores de parámetro diferenciales se ensamblan en las porciones “addbsi” o “auxdata”, la señal codificada será compatible con todos los decodificadores compatibles con ATSC. Los decodificadores que no reconocen los valores de parámetro diferenciales aún pueden procesar y decodificar correctamente las tramas de señales codificadas ignorando las porciones “addbsi” y “auxdata”. Consúltese el documento A/52b citado anteriormente para obtener más detalles.
Para señales de salida codificadas que se adecúan a los estándares MPEG-2 AAC o audio MPEG-4, el formateador 38 puede ensamblar los valores de parámetro diferenciales en porciones de cada trama de señal codificada indicada como “Fill_Element” o “Data_Stream_Element” en los dos estándares. Si los valores de parámetro diferenciales se ensamblan en cualquiera de estas porciones, la señal codificada será compatible con todos los decodificadores compatibles con los estándares MPEG-2 AAC y audio MPEG-4. Consúltense los documentos ISO/IEC 13818-7 e ISO/IEC 14496-3 citados anteriormente para obtener más detalles.
Los valores de parámetro diferenciales pueden calcularse e insertarse en la señal codificada a una tasa mayor, igual o menor que la tasa a la que los valores de parámetro base correspondientes están en la señal codificada. La tasa de los valores diferenciales puede variar. También se pueden incluir en la señal codificada indicadores o bits que indican si un valor diferencial anterior debe ser reutilizado.
2. Perfil de compresión distinto
Los procesos para la tercera técnica discutida anteriormente se implementan en el dispositivo 10 usando valores de parámetro DRC para el nuevo perfil de compresión de rango dinámico que se extraen de la señal de entrada codificada. Estos valores de parámetro son proporcionados por el dispositivo 30 que generó la señal codificada. El dispositivo 30 deriva valores de parámetro DRC para un nuevo perfil DRC calculando los valores de parámetro necesarios para evitar que las muestras de señales de audio decodificadas excedan 0 dBFS para un nivel de reproducción de referencia superior.
Si la señal de salida codificada cumple con el estándar ATSC, el estándar MPEG-2 AAC o el estándar de audio MPEG-4, la calculadora 34 de metadatos calcula un valor de compresión DRC basándose en la suposición de que el nivel de reproducción de referencia aumenta a un valor de - 14 dBFS a -8 dBFS. Los resultados empíricos indican que un nivel de referencia igual a -11 dBFS da buenos resultados para muchas aplicaciones. El formateador 38 puede ensamblar el valor de parámetro para el perfil DRC en porciones de cada trama de señal codificada como se describe anteriormente para los parámetros diferenciales. El uso de estas porciones de las tramas permite que la señal codificada sea compatible con todos los decodificadores que se adecúen al estándar respectivo.
E. Implementación
Los dispositivos que incorporan diversos aspectos de la presente invención pueden implementarse de diversas maneras, incluido el software para su ejecución por un ordenador o algún otro dispositivo que incluya componentes más especializados, como un circuito de procesador de señal digital (DSP) acoplado a componentes similares a los que se encuentran en un ordenador de propósito general. La figura 6 es un diagrama de bloques esquemático de un dispositivo 70 que puede usarse para implementar aspectos de la presente invención. El procesador 72 proporciona recursos informáticos. La rAm 73 es una memoria de acceso aleatorio (RAM) del sistema usada por el procesador 72 para el procesamiento. La ROM 74 representa alguna forma de almacenamiento persistente tal como memoria de sólo lectura (ROM) para almacenar programas necesarios para operar el dispositivo 70 y posiblemente para llevar a cabo varios aspectos de la presente invención. El control de E/S 75 representa un circuito de interfaz para recibir señales de entrada y transmitir señales de salida a través de los canales de comunicación 76, 77. En la realización mostrada, todos los componentes principales del sistema se conectan al bus 71, que puede representar más de un bus físico o lógico; sin embargo, no se requiere una arquitectura de bus para implementar la presente invención.
En las realizaciones implementadas por un sistema de ordenador de propósito general, se pueden incluir componentes adicionales para conectarse a dispositivos como un teclado o ratón y un visualizador, y para controlar un dispositivo 78 de almacenamiento que tiene un medio de almacenamiento como una cinta magnética o un disco, o un medio óptico. El medio de almacenamiento se puede usar para grabar programas de instrucciones para sistemas operativos, utilidades y aplicaciones, y puede incluir programas que implementen varios aspectos de la presente invención.
Las funciones requeridas para poner en práctica varios aspectos de la presente invención pueden ser realizadas por componentes que se implementan en una amplia variedad de formas que incluyen componentes lógicos discretos, circuitos integrados, uno o más ASIC y/o procesadores controlados por programa. La manera en que se implementan estos componentes no es importante para la presente invención.
Las implementaciones de software de la presente invención pueden transmitirse mediante una variedad de medios legibles por máquina, como rutas de comunicación de banda base o modulada en todo el espectro, incluidas desde frecuencias supersónicas hasta ultravioleta, o medios de almacenamiento que transmiten información usando esencialmente cualquier tecnología de grabación, incluidas cintas magnéticas, tarjetas o disco, tarjetas ópticas o disco, y marcas detectables en medios, incluido el papel.

Claims (5)

REIVINDICACIONES
1. - Un método que comprende:
recibir, mediante un dispositivo de decodificación, información de audio codificada y metadatos asociados con una señal de audio, incluyendo los metadatos uno o más parámetros de control de decodificación, una medida de una sonoridad de la información de audio codificada y uno o más primeros valores de parámetro que especifican compresión de rango dinámico (DRC) de acuerdo con un primer perfil asociado con un primer nivel de reproducción de referencia, y uno o más segundos valores de parámetro que especifican DRC de acuerdo con un segundo perfil asociado con un segundo nivel de reproducción de referencia superior al primer nivel de reproducción de referencia y dentro de un rango de niveles de reproducción de referencia;
especificar, para el dispositivo de decodificación, un nivel de reproducción de referencia;
aplicar, mediante el dispositivo de decodificación, un proceso de decodificación a la información de audio codificada para obtener señales de subbanda que representan el contenido espectral de la señal de audio; modificar, mediante el dispositivo de decodificación, las señales de subbanda usando el uno o más segundos valores de parámetro DRC que especifican DRC de acuerdo con el segundo perfil para obtener señales de subbanda modificadas con características de rango dinámico cambiadas, en respuesta a especificar el nivel de reproducción de referencia, para el dispositivo de decodificación, al segundo nivel de reproducción de referencia; aplicar, mediante el dispositivo de decodificación, un banco de filtros de síntesis a las señales de subbanda modificadas para obtener una señal de audio de dominio tiempo; y
usar, mediante el dispositivo de decodificación, la medida de sonoridad para ajustar amplitudes de la señal de audio de dominio tiempo para lograr el nivel de reproducción de referencia para el dispositivo de decodificación.
2. - El método de la reivindicación 1, en el que el primer nivel de reproducción de referencia es -31 dBFS o -20 dBFS.
3. - El método de la reivindicación 1 o la reivindicación 2, en el que el rango de niveles de reproducción de referencia está entre -14 dBFS y -8 dBFS.
4. - El método de la reivindicación 1 o la reivindicación 2, en el que el segundo nivel de reproducción de referencia es -11 dBFS.
5. - Un aparato que comprende:
un procesador;
una memoria acoplada al procesador y configurada para almacenar instrucciones que, cuando son ejecutadas por el procesador, hacen que el procesador realice el método de cualquiera de las reivindicaciones anteriores. 6. - Un producto de programa de ordenador que incluye un soporte de datos que almacena instrucciones para realizar el método de una cualquiera de las reivindicaciones 1 a 4.
ES22160243T 2010-02-11 2011-02-03 System and method for non-destructively normalizing loudness of audio signals within portable devices Active ES2994834T3 (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US30364310P 2010-02-11 2010-02-11

Publications (1)

Publication Number Publication Date
ES2994834T3 true ES2994834T3 (en) 2025-02-03

Family

ID=43881135

Family Applications (5)

Application Number Title Priority Date Filing Date
ES22160243T Active ES2994834T3 (en) 2010-02-11 2011-02-03 System and method for non-destructively normalizing loudness of audio signals within portable devices
ES24193995T Active ES3032238T3 (en) 2010-02-11 2011-02-03 System and method for non-destructively normalizing loudness of audio signals within portable devices
ES24193996T Active ES3026800T3 (en) 2010-02-11 2011-02-03 System and method for non-destructively normalizing loudness of audio signals within portable devices
ES25163662T Active ES3057213T3 (en) 2010-02-11 2011-02-03 System and method for non-destructively normalizing loudness of audio signals within portable devices
ES18191911T Active ES2916403T3 (es) 2010-02-11 2011-02-03 Sistema y método para normalizar de manera no destructiva la sonoridad de señales de audio en dispositivos portátiles

Family Applications After (4)

Application Number Title Priority Date Filing Date
ES24193995T Active ES3032238T3 (en) 2010-02-11 2011-02-03 System and method for non-destructively normalizing loudness of audio signals within portable devices
ES24193996T Active ES3026800T3 (en) 2010-02-11 2011-02-03 System and method for non-destructively normalizing loudness of audio signals within portable devices
ES25163662T Active ES3057213T3 (en) 2010-02-11 2011-02-03 System and method for non-destructively normalizing loudness of audio signals within portable devices
ES18191911T Active ES2916403T3 (es) 2010-02-11 2011-02-03 Sistema y método para normalizar de manera no destructiva la sonoridad de señales de audio en dispositivos portátiles

Country Status (19)

Country Link
US (9) US8903729B2 (es)
EP (7) EP2534656B1 (es)
JP (2) JP5666625B2 (es)
KR (1) KR101381588B1 (es)
CN (2) CN102754151B (es)
AR (1) AR080156A1 (es)
BR (2) BR112012019880B1 (es)
CA (7) CA3247149A1 (es)
CL (1) CL2012002213A1 (es)
CO (1) CO6511277A2 (es)
EA (1) EA023730B9 (es)
ES (5) ES2994834T3 (es)
MX (1) MX2012008954A (es)
MY (1) MY169981A (es)
PH (1) PH12012501501A1 (es)
SG (1) SG182632A1 (es)
TW (2) TWI529703B (es)
UA (1) UA105277C2 (es)
WO (1) WO2011100155A1 (es)

Families Citing this family (64)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10158337B2 (en) 2004-08-10 2018-12-18 Bongiovi Acoustics Llc System and method for digital signal processing
US10848118B2 (en) 2004-08-10 2020-11-24 Bongiovi Acoustics Llc System and method for digital signal processing
US11431312B2 (en) 2004-08-10 2022-08-30 Bongiovi Acoustics Llc System and method for digital signal processing
US10848867B2 (en) 2006-02-07 2020-11-24 Bongiovi Acoustics Llc System and method for digital signal processing
US10701505B2 (en) 2006-02-07 2020-06-30 Bongiovi Acoustics Llc. System, method, and apparatus for generating and digitally processing a head related audio transfer function
AR077680A1 (es) 2009-08-07 2011-09-14 Dolby Int Ab Autenticacion de flujos de datos
TWI413110B (zh) 2009-10-06 2013-10-21 Dolby Int Ab 以選擇性通道解碼的有效多通道信號處理
WO2011048010A1 (en) 2009-10-19 2011-04-28 Dolby International Ab Metadata time marking information for indicating a section of an audio object
TWI529703B (zh) 2010-02-11 2016-04-11 杜比實驗室特許公司 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法
TWI525987B (zh) 2010-03-10 2016-03-11 杜比實驗室特許公司 在單一播放模式中組合響度量測的系統
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
US9171549B2 (en) * 2011-04-08 2015-10-27 Dolby Laboratories Licensing Corporation Automatic configuration of metadata for use in mixing audio programs from two encoded bitstreams
CN119495308A (zh) 2012-05-18 2025-02-21 杜比实验室特许公司 用于维持与参数音频编码器相关联的可逆动态范围控制信息的系统
US10844689B1 (en) 2019-12-19 2020-11-24 Saudi Arabian Oil Company Downhole ultrasonic actuator system for mitigating lost circulation
KR101726205B1 (ko) * 2012-11-07 2017-04-12 돌비 인터네셔널 에이비 감소된 복잡성 변환기 snr 계산
US9411881B2 (en) * 2012-11-13 2016-08-09 Dolby International Ab System and method for high dynamic range audio distribution
CN112652316B (zh) * 2013-01-21 2023-09-15 杜比实验室特许公司 利用响度处理状态元数据的音频编码器和解码器
ES2843744T3 (es) 2013-01-21 2021-07-20 Dolby Laboratories Licensing Corp Decodificación de trenes de bits de audio codificados con un contenedor de metadatos situado en un espacio de datos reservado
RU2665873C1 (ru) * 2013-01-21 2018-09-04 Долби Лэборетериз Лайсенсинг Корпорейшн Оптимизация громкости и динамического диапазона через различные устройства воспроизведения
CN110853660B (zh) * 2013-01-28 2024-01-23 弗劳恩霍夫应用研究促进协会 解码比特流以从该比特流产生音频输出信号的解码器设备
JP6250071B2 (ja) * 2013-02-21 2017-12-20 ドルビー・インターナショナル・アーベー パラメトリック・マルチチャネル・エンコードのための方法
US9559651B2 (en) 2013-03-29 2017-01-31 Apple Inc. Metadata for loudness and dynamic range control
US9607624B2 (en) * 2013-03-29 2017-03-28 Apple Inc. Metadata driven dynamic range control
US9883318B2 (en) 2013-06-12 2018-01-30 Bongiovi Acoustics Llc System and method for stereo field enhancement in two-channel audio systems
TWM487509U (zh) * 2013-06-19 2014-10-01 杜比實驗室特許公司 音訊處理設備及電子裝置
CN109903776B (zh) * 2013-09-12 2024-03-01 杜比实验室特许公司 用于各种回放环境的动态范围控制
JP6506764B2 (ja) * 2013-09-12 2019-04-24 ドルビー ラボラトリーズ ライセンシング コーポレイション ダウンミックスされたオーディオ・コンテンツについてのラウドネス調整
JP6531649B2 (ja) 2013-09-19 2019-06-19 ソニー株式会社 符号化装置および方法、復号化装置および方法、並びにプログラム
US20150095320A1 (en) * 2013-09-27 2015-04-02 Trooclick France Apparatus, systems and methods for scoring the reliability of online information
US9906858B2 (en) 2013-10-22 2018-02-27 Bongiovi Acoustics Llc System and method for digital signal processing
ES2732304T3 (es) 2013-10-22 2019-11-21 Fraunhofer Ges Forschung Concepto para la compresión combinada del intervalo dinámico y prevención guiada de recortes para dispositivos de audio
US20150146099A1 (en) * 2013-11-25 2015-05-28 Anthony Bongiovi In-line signal processor
US9276544B2 (en) 2013-12-10 2016-03-01 Apple Inc. Dynamic range control gain encoding
BR112016014476B1 (pt) 2013-12-27 2021-11-23 Sony Corporation Aparelho e método de decodificação, e, meio de armazenamento legível por computador
US9608588B2 (en) 2014-01-22 2017-03-28 Apple Inc. Dynamic range control with large look-ahead
EP3809714B1 (en) * 2014-02-27 2025-09-10 Sonarworks SIA Method of and apparatus for determining an equalization filter
US10063207B2 (en) * 2014-02-27 2018-08-28 Dts, Inc. Object-based audio loudness management
TWI718979B (zh) * 2014-03-24 2021-02-11 瑞典商杜比國際公司 應用動態範圍壓縮至高階保真立體音響信號之方法和裝置
US9654076B2 (en) * 2014-03-25 2017-05-16 Apple Inc. Metadata for ducking control
WO2015144587A1 (en) 2014-03-25 2015-10-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder device and an audio decoder device having efficient gain coding in dynamic range control
US10820883B2 (en) 2014-04-16 2020-11-03 Bongiovi Acoustics Llc Noise reduction assembly for auscultation of a body
KR102655047B1 (ko) * 2014-06-27 2024-04-08 돌비 인터네셔널 에이비 Hoa 데이터 프레임 표현의 압축을 위해 비차분 이득 값들을 표현하는 데 필요하게 되는 비트들의 최저 정수 개수를 결정하는 방법
US20170127073A1 (en) * 2014-06-30 2017-05-04 Sony Corporation Information processing device and method
EP2963948A1 (en) * 2014-07-02 2016-01-06 Thomson Licensing Method and apparatus for encoding/decoding of directions of dominant directional signals within subbands of a HOA signal representation
WO2016050740A1 (en) 2014-10-01 2016-04-07 Dolby International Ab Efficient drc profile transmission
ES2980796T3 (es) 2014-10-10 2024-10-03 Dolby Laboratories Licensing Corp Sonoridad de programa basada en la presentación, independiente de la transmisión
TWI890652B (zh) 2015-03-13 2025-07-11 瑞典商杜比國際公司 音訊處理單元、用於將經編碼的音訊位元流解碼之方法以及非暫態電腦可讀媒體
US10109288B2 (en) 2015-05-27 2018-10-23 Apple Inc. Dynamic range and peak control in audio using nonlinear filters
US9837086B2 (en) 2015-07-31 2017-12-05 Apple Inc. Encoded audio extended metadata-based dynamic range control
US9590580B1 (en) 2015-09-13 2017-03-07 Guoguang Electric Company Limited Loudness-based audio-signal compensation
TWI594231B (zh) * 2016-12-23 2017-08-01 瑞軒科技股份有限公司 分頻壓縮電路,音訊處理方法以及音訊處理系統
US11089349B2 (en) * 2017-01-20 2021-08-10 Hanwha Techwin Co., Ltd. Apparatus and method for playing back and seeking media in web browser
EP3574583B1 (en) * 2017-03-31 2020-12-09 Dolby International AB Inversion of dynamic range control
CN110033781B (zh) * 2018-01-10 2021-06-01 盛微先进科技股份有限公司 音频处理方法、装置及非暂时性电脑可读媒体
IL314886B2 (en) 2018-04-09 2025-08-01 Dolby Int Ab Methods, apparatus and systems for three degrees of freedom (3dof+) extension of mpeg-h 3d audio
AU2019252524A1 (en) 2018-04-11 2020-11-05 Bongiovi Acoustics Llc Audio enhanced hearing protection system
US10959035B2 (en) 2018-08-02 2021-03-23 Bongiovi Acoustics Llc System, method, and apparatus for generating and digitally processing a head related audio transfer function
JP7682860B2 (ja) 2019-09-13 2025-05-26 ドルビー ラボラトリーズ ライセンシング コーポレイション アーチファクトを低減したダイナミックレンジ圧縮
EP3809709A1 (en) * 2019-10-14 2021-04-21 Koninklijke Philips N.V. Apparatus and method for audio encoding
CN112732069B (zh) * 2021-02-20 2024-11-15 无锡创感微传感技术有限公司 一种电子设备状态修改方法和装置
CN112992159B (zh) * 2021-05-17 2021-08-06 北京百瑞互联技术有限公司 一种lc3音频编解码方法、装置、设备及存储介质
US12563339B2 (en) * 2023-02-09 2026-02-24 Samsung Electronics Co., Ltd. Signal normalization using loudness metadata for audio processing
CN119252277B (zh) * 2024-12-05 2025-02-25 电子科技大学 一种基于机器学习算法catboost的音频信号处理方法及装置

Family Cites Families (57)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2373975B (en) 2001-03-30 2005-04-13 Sony Uk Ltd Digital audio signal processing
US7328151B2 (en) * 2002-03-22 2008-02-05 Sound Id Audio decoder with dynamic adjustment of signal modification
US7072477B1 (en) 2002-07-09 2006-07-04 Apple Computer, Inc. Method and apparatus for automatically normalizing a perceived volume level in a digitally encoded file
US7454331B2 (en) * 2002-08-30 2008-11-18 Dolby Laboratories Licensing Corporation Controlling loudness of speech in signals that contain speech and other types of audio material
US7398207B2 (en) * 2003-08-25 2008-07-08 Time Warner Interactive Video Group, Inc. Methods and systems for determining audio loudness levels in programming
US7617109B2 (en) * 2004-07-01 2009-11-10 Dolby Laboratories Licensing Corporation Method for correcting metadata affecting the playback loudness and dynamic range of audio information
US7729673B2 (en) 2004-12-30 2010-06-01 Sony Ericsson Mobile Communications Ab Method and apparatus for multichannel signal limiting
TW200638335A (en) * 2005-04-13 2006-11-01 Dolby Lab Licensing Corp Audio metadata verification
JP2007109328A (ja) 2005-10-14 2007-04-26 Kenwood Corp 再生装置
US20080025530A1 (en) 2006-07-26 2008-01-31 Sony Ericsson Mobile Communications Ab Method and apparatus for normalizing sound playback loudness
WO2008032828A1 (en) * 2006-09-15 2008-03-20 Panasonic Corporation Audio encoding device and audio encoding method
DE102006048685A1 (de) * 2006-10-14 2008-04-17 Mtu Aero Engines Gmbh Turbinenschaufel einer Gasturbine
US20090253457A1 (en) 2008-04-04 2009-10-08 Apple Inc. Audio signal processing for certification enhancement in a handheld wireless communications device
US20090281803A1 (en) * 2008-05-12 2009-11-12 Broadcom Corporation Dispersion filtering for speech intelligibility enhancement
US9197181B2 (en) * 2008-05-12 2015-11-24 Broadcom Corporation Loudness enhancement system and method
EP2146522A1 (en) 2008-07-17 2010-01-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating audio output signals using object based metadata
KR101599535B1 (ko) * 2008-07-29 2016-03-03 엘지전자 주식회사 오디오 신호의 처리 방법 및 장치
US8798776B2 (en) * 2008-09-30 2014-08-05 Dolby International Ab Transcoding of audio metadata
JP2010135906A (ja) 2008-12-02 2010-06-17 Sony Corp クリップ防止装置及びクリップ防止方法
JP5136378B2 (ja) * 2008-12-09 2013-02-06 富士通株式会社 音響処理方法
US20100161340A1 (en) * 2008-12-24 2010-06-24 Plantronics, Inc. Dynamic Codec Switching
US8670990B2 (en) * 2009-08-03 2014-03-11 Broadcom Corporation Dynamic time scale modification for reduced bit rate audio coding
TWI529703B (zh) 2010-02-11 2016-04-11 杜比實驗室特許公司 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法
EP2381574B1 (en) 2010-04-22 2014-12-03 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for modifying an input audio signal
JP5903758B2 (ja) 2010-09-08 2016-04-13 ソニー株式会社 信号処理装置および方法、プログラム、並びにデータ記録媒体
US8989884B2 (en) 2011-01-11 2015-03-24 Apple Inc. Automatic audio configuration based on an audio output device
JP2012235310A (ja) 2011-04-28 2012-11-29 Sony Corp 信号処理装置および方法、プログラム、並びにデータ記録媒体
US8965774B2 (en) 2011-08-23 2015-02-24 Apple Inc. Automatic detection of audio compression parameters
JP5845760B2 (ja) 2011-09-15 2016-01-20 ソニー株式会社 音声処理装置および方法、並びにプログラム
JP2013102411A (ja) 2011-10-14 2013-05-23 Sony Corp 音声信号処理装置、および音声信号処理方法、並びにプログラム
CN104081454B (zh) 2011-12-15 2017-03-01 弗劳恩霍夫应用研究促进协会 用于避免削波假象的设备、方法和计算机程序
TWI517142B (zh) 2012-07-02 2016-01-11 Sony Corp Audio decoding apparatus and method, audio coding apparatus and method, and program
EP2757558A1 (en) 2013-01-18 2014-07-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Time domain level adjustment for audio signal decoding or encoding
CN110853660B (zh) 2013-01-28 2024-01-23 弗劳恩霍夫应用研究促进协会 解码比特流以从该比特流产生音频输出信号的解码器设备
US9607624B2 (en) 2013-03-29 2017-03-28 Apple Inc. Metadata driven dynamic range control
US9559651B2 (en) 2013-03-29 2017-01-31 Apple Inc. Metadata for loudness and dynamic range control
JP2015050685A (ja) 2013-09-03 2015-03-16 ソニー株式会社 オーディオ信号処理装置および方法、並びにプログラム
JP6531649B2 (ja) 2013-09-19 2019-06-19 ソニー株式会社 符号化装置および方法、復号化装置および方法、並びにプログラム
US9300268B2 (en) 2013-10-18 2016-03-29 Apple Inc. Content aware audio ducking
ES2732304T3 (es) 2013-10-22 2019-11-21 Fraunhofer Ges Forschung Concepto para la compresión combinada del intervalo dinámico y prevención guiada de recortes para dispositivos de audio
US9240763B2 (en) 2013-11-25 2016-01-19 Apple Inc. Loudness normalization based on user feedback
US9276544B2 (en) 2013-12-10 2016-03-01 Apple Inc. Dynamic range control gain encoding
BR112016014476B1 (pt) 2013-12-27 2021-11-23 Sony Corporation Aparelho e método de decodificação, e, meio de armazenamento legível por computador
US9608588B2 (en) 2014-01-22 2017-03-28 Apple Inc. Dynamic range control with large look-ahead
WO2015144587A1 (en) 2014-03-25 2015-10-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder device and an audio decoder device having efficient gain coding in dynamic range control
US9654076B2 (en) 2014-03-25 2017-05-16 Apple Inc. Metadata for ducking control
KR101967810B1 (ko) 2014-05-28 2019-04-11 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 데이터 프로세서 및 사용자 제어 데이터의 오디오 디코더들과 렌더러들로의 전송
RU2019122989A (ru) 2014-05-30 2019-09-16 Сони Корпорейшн Устройство обработки информации и способ обработки информации
US20180165358A1 (en) 2014-06-30 2018-06-14 Sony Corporation Information processing apparatus and information processing method
TWI631835B (zh) 2014-11-12 2018-08-01 弗勞恩霍夫爾協會 用以解碼媒體信號之解碼器、及用以編碼包含用於主要媒體資料之元資料或控制資料的次要媒體資料之編碼器
US20160315722A1 (en) 2015-04-22 2016-10-27 Apple Inc. Audio stem delivery and control
US10109288B2 (en) 2015-05-27 2018-10-23 Apple Inc. Dynamic range and peak control in audio using nonlinear filters
BR112017025552B1 (pt) 2015-05-29 2023-01-24 Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E.V Dispositivo e método para controle de volume e sintonizador de rádio
CN107820711B (zh) 2015-06-17 2020-09-08 弗劳恩霍夫应用研究促进协会 用于音频编码系统中用户交互性的响度控制
US9837086B2 (en) 2015-07-31 2017-12-05 Apple Inc. Encoded audio extended metadata-based dynamic range control
US9934790B2 (en) 2015-07-31 2018-04-03 Apple Inc. Encoded audio metadata-based equalization
US10341770B2 (en) 2015-09-30 2019-07-02 Apple Inc. Encoded audio metadata-based loudness equalization and dynamic equalization during DRC

Also Published As

Publication number Publication date
WO2011100155A1 (en) 2011-08-18
KR101381588B1 (ko) 2014-04-17
MY169981A (en) 2019-06-19
US12183355B2 (en) 2024-12-31
CA2995461A1 (en) 2011-08-18
CA2787466C (en) 2016-04-05
EP4571738B1 (en) 2025-11-19
EP3444816B8 (en) 2022-05-25
CN102754151A (zh) 2012-10-24
KR20120124484A (ko) 2012-11-13
US20200176008A1 (en) 2020-06-04
JP2013519918A (ja) 2013-05-30
US11341982B2 (en) 2022-05-24
US8903729B2 (en) 2014-12-02
ES2916403T3 (es) 2022-06-30
JP5666625B2 (ja) 2015-02-12
CA3075793A1 (en) 2011-08-18
EP4047602C0 (en) 2024-08-28
US20170213566A1 (en) 2017-07-27
TW201506912A (zh) 2015-02-16
AR080156A1 (es) 2012-03-14
EP4459615A2 (en) 2024-11-06
ES3057213T3 (en) 2026-02-26
CN103795364B (zh) 2016-08-24
EP2534656A1 (en) 2012-12-19
CA3114177C (en) 2023-08-01
EA023730B9 (ru) 2016-11-30
US20230343347A1 (en) 2023-10-26
CN102754151B (zh) 2014-03-05
CA2787466A1 (en) 2011-08-18
CA3247149A1 (en) 2025-10-27
CA2918302C (en) 2018-04-03
UA105277C2 (ru) 2014-04-25
SG182632A1 (en) 2012-08-30
CA2995461C (en) 2020-04-28
EA023730B1 (ru) 2016-07-29
BR112012019880B1 (pt) 2020-10-13
US20220358944A1 (en) 2022-11-10
EA201270712A1 (ru) 2013-01-30
JP6133263B2 (ja) 2017-05-24
EP3444816B1 (en) 2022-04-13
CO6511277A2 (es) 2012-08-31
CA3201814C (en) 2025-02-11
EP4047602B1 (en) 2024-08-28
CA3075793C (en) 2021-05-18
CA3201814A1 (en) 2011-08-18
MX2012008954A (es) 2012-08-23
CL2012002213A1 (es) 2012-11-30
US11670315B2 (en) 2023-06-06
EP2534656B1 (en) 2018-09-05
EP4459616A3 (en) 2024-12-25
US10566006B2 (en) 2020-02-18
EP4571738A1 (en) 2025-06-18
EP4546336A2 (en) 2025-04-30
EP4459616A2 (en) 2024-11-06
EP4546336A3 (en) 2025-06-18
ES3026800T3 (en) 2025-06-12
ES3032238T3 (en) 2025-07-16
US20150043754A1 (en) 2015-02-12
TWI529703B (zh) 2016-04-11
US10418045B2 (en) 2019-09-17
US9646622B2 (en) 2017-05-09
CN103795364A (zh) 2014-05-14
TWI447709B (zh) 2014-08-01
BR122019025627B1 (pt) 2021-01-19
EP3444816A1 (en) 2019-02-20
US20190325886A1 (en) 2019-10-24
JP2015045886A (ja) 2015-03-12
EP4459616B1 (en) 2025-04-23
EP4459615B1 (en) 2025-04-30
CA3114177A1 (en) 2011-08-18
US11948592B2 (en) 2024-04-02
US20120310654A1 (en) 2012-12-06
PH12012501501A1 (en) 2015-09-09
US20250078849A1 (en) 2025-03-06
EP4459615A3 (en) 2024-12-25
CA2918302A1 (en) 2011-08-18
BR112012019880A2 (pt) 2016-04-26
US20240249738A1 (en) 2024-07-25
TW201205559A (en) 2012-02-01
EP4047602A1 (en) 2022-08-24

Similar Documents

Publication Publication Date Title
ES2994834T3 (en) System and method for non-destructively normalizing loudness of audio signals within portable devices
HK40117711B (en) System and method for non-destructively normalizing loudness of audio signals within portable devices
HK40117711A (en) System and method for non-destructively normalizing loudness of audio signals within portable devices
HK40124412B (en) System and method for non-destructively normalizing loudness of audio signals within portable devices
HK40124412A (en) System and method for non-destructively normalizing loudness of audio signals within portable devices
HK40117710B (en) System and method for non-destructively normalizing loudness of audio signals within portable devices
HK40117710A (en) System and method for non-destructively normalizing loudness of audio signals within portable devices
HK40079884B (en) System and method for non-destructively normalizing loudness of audio signals within portable devices
HK40002961B (en) System and method for non-destructively normalizing loudness of audio signals within portable devices