ES2994834T3 - System and method for non-destructively normalizing loudness of audio signals within portable devices - Google Patents
System and method for non-destructively normalizing loudness of audio signals within portable devices Download PDFInfo
- Publication number
- ES2994834T3 ES2994834T3 ES22160243T ES22160243T ES2994834T3 ES 2994834 T3 ES2994834 T3 ES 2994834T3 ES 22160243 T ES22160243 T ES 22160243T ES 22160243 T ES22160243 T ES 22160243T ES 2994834 T3 ES2994834 T3 ES 2994834T3
- Authority
- ES
- Spain
- Prior art keywords
- encoded
- dynamic range
- decoding device
- dbfs
- level
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G7/00—Volume compression or expansion in amplifiers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
- G10L19/0208—Subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G3/00—Gain control in amplifiers or frequency changers
- H03G3/20—Automatic control
- H03G3/30—Automatic control in amplifiers having semiconductor devices
- H03G3/3089—Control of digital or coded signals
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G3/00—Gain control in amplifiers or frequency changers
- H03G3/20—Automatic control
- H03G3/30—Automatic control in amplifiers having semiconductor devices
- H03G3/32—Automatic control in amplifiers having semiconductor devices the control being dependent upon ambient noise level or sound level
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G7/00—Volume compression or expansion in amplifiers
- H03G7/007—Volume compression or expansion in amplifiers of digital or coded signals
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
- Stereophonic System (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
Muchos dispositivos de reproducción portátiles no pueden decodificar y reproducir contenido de audio codificado que tenga un ancho de banda amplio y un amplio rango dinámico con un volumen y una inteligibilidad constantes a menos que el contenido de audio codificado haya sido preparado especialmente para estos dispositivos. Este problema se puede superar incluyendo con el contenido codificado algunos metadatos que especifiquen un perfil de compresión de rango dinámico adecuado mediante valores absolutos o valores diferenciales en relación con otro perfil de compresión conocido. Un dispositivo de reproducción también puede aplicar de forma adaptativa ganancia y limitación al audio de reproducción. Se describen implementaciones en codificadores, transcodificadores y decodificadores. (Traducción automática con Google Translate, sin valor legal)
Description
DESCRIPCIÓN
Sistema y método para normalizar de manera no destructiva la sonoridad de señales de audio en dispositivos portátiles
Referencia cruzada a la aplicación relacionada
Esta solicitud es una solicitud divisional europea de la solicitud de patente europea EP18191911.9 (referencia: D10006EP04), cuyo formulario 1001 de la OEP fue presentado el 31 de agosto de 2018.
Campo técnico
La presente invención se refiere en general a la codificación y decodificación de señales de audio y se refiere más específicamente a técnicas que pueden usarse para codificar y decodificar señales de audio para una gama más amplia de dispositivos de reproducción y entornos de escucha.
Antecedentes de la técnica
La creciente popularidad de los dispositivos de mano y otros tipos de dispositivos portátiles ha creado nuevas oportunidades y desafíos para los creadores y distribuidores de contenido multimedia para reproducir en esos dispositivos, así como para los diseñadores y fabricantes de los dispositivos. Muchos dispositivos portátiles son capaces de reproducir una amplia gama de tipos y formatos de contenido multimedia, incluidos los que a menudo se asocian con contenido de audio de alta calidad, amplio ancho de banda y amplio rango dinámico para HDTV, Blu-ray o DVD. Se pueden usar dispositivos portátiles para reproducir este tipo de contenido de audio en sus propios transductores acústicos internos o en transductores externos como auriculares; sin embargo, por lo general no pueden reproducir este contenido con una sonoridad e inteligibilidad consistentes en diferentes formatos de medios y tipos de contenido.
La publicación Jeffrey C. Riedmiller: “An Analysis of Audio for Digital Cable Television Recommendations for the Digital Transition via Audio Metadata”, Dolby Laboratories Inc., documento técnico de la NCTA, 2001, páginas 1 18, aborda estos asuntos.
Divulgación de la invención
La presente invención está dirigida a proporcionar métodos mejorados para codificar y decodificar señales de audio para su reproducción en una variedad de dispositivos, incluidos dispositivos de mano y otros tipos de dispositivos portátiles.
Varios aspectos de la presente invención se exponen en las reivindicaciones independientes que se muestran a continuación.
Las diversas características de la presente invención y sus realizaciones preferidas pueden entenderse mejor con referencia a la siguiente discusión y los dibujos adjuntos en los que los mismos números de referencia se refieren a elementos similares en las diversas figuras. El contenido de la siguiente discusión y los dibujos se exponen solo como ejemplos y no debe entenderse que representan limitaciones sobre el alcance de la presente invención.
Breve descripción de los dibujos
La figura 1 es un diagrama de bloques esquemático de un dispositivo de reproducción.
La figura 2 es un diagrama de bloques esquemático de un dispositivo de codificación.
Las figuras 3 a 5 son diagramas de bloques esquemáticos de dispositivos de transcodificación.
La figura 6 es un diagrama de bloques esquemático de un dispositivo que puede usarse para implementar varios aspectos de la presente invención.
Modos de llevar a cabo la invención
A. Introducción
La presente invención está dirigida a la codificación y decodificación de información de audio para su reproducción en entornos de escucha desafiantes como los que encuentran los usuarios de dispositivos de mano y otros tipos de dispositivos portátiles. Algunos ejemplos de codificación y decodificación de audio se describen en estándares publicados, como los que se describen en el “Digital Audio Compression Standard (AC-3, E-AC3)”, revisión B, documento A/52B, 14 de junio de 2005, publicado por Advanced Televisión Systems Committee, Inc. (denominado en el presente documento “Estándar ATSC”), y en ISO/IEC 13818-7, Codificación de audio avanzada (AAC) (denominado en el presente documento “Estándar MPEG-2 AAC”) y ISO/IEC 14496-3, subparte 4 (denominado en el presente documento “Estándar de audio MPEG-4”) publicado por la Organización Internacional de Normalización (ISO). Los procesos de codificación y decodificación que cumplen a estos estándares se mencionan solo como ejemplos. Los principios de la presente invención se pueden usar con sistemas de codificación que cumplan también otras normas.
Los inventores descubrieron que las características disponibles de los dispositivos que cumplen algunos estándares de codificación a menudo no son suficientes para las aplicaciones y los entornos de escucha que son típicos de los dispositivos de mano y otros tipos de dispositivos portátiles. Cuando estos tipos de dispositivos se usan para decodificar el contenido de audio de las señales de entrada codificadas que cumplen con estos estándares, el contenido de audio decodificado a menudo se reproduce a niveles de sonoridad significativamente más bajos que los niveles de sonoridad del contenido de audio obtenidos mediante la decodificación de señales de entrada codificadas que se prepararon especialmente para su reproducción en estos dispositivos.
Las señales de entrada codificadas que cumplen con el estándar ATSC (denominadas en el presente documento “señales codificadas compatibles con ATSC”), por ejemplo, contienen información de audio codificada y metadatos que describen cómo se puede decodificar esta información. Algunos de los parámetros de metadatos identifican un perfil de compresión de rango dinámico que especifica cómo se puede comprimir el rango dinámico de la información de audio cuando se decodifica la información de audio codificada. El rango dinámico completo de la señal decodificada se puede retener o se puede comprimir en diversos grados en el momento de la decodificación para satisfacer las demandas de diferentes aplicaciones y entornos de escucha. Otros metadatos identifican alguna medida de sonoridad de la información de audio codificada, como un nivel de programa promedio o nivel de diálogo en la señal codificada. Estos metadatos pueden ser usados por un decodificador para ajustar amplitudes de la señal decodificada para lograr una sonoridad específica o un nivel de reproducción de referencia durante la reproducción. En algunas aplicaciones, se pueden especificar o asumir uno o más niveles de reproducción de referencia, mientras que en otras aplicaciones se le puede dar al usuario el control sobre el establecimiento del nivel de reproducción de referencia. Por ejemplo, los procesos de codificación usados para codificar y decodificar señales codificadas compatibles con ATSC asumen que el diálogo se reproducirá en uno de los dos niveles de reproducción de referencia. Un nivel está 31 dB por debajo de un nivel de recorte, que es el valor digital o valor de escala completa (FS) más grande posible, indicado aquí como -31 dBFS. El modo de decodificación que usa este nivel a veces se denomina “modo de línea” y está diseñado para usarse en aplicaciones y entornos donde son adecuados rangos dinámicos más amplios. El otro nivel se establece en -20 dBFS. El modo de decodificación que usa este segundo nivel a veces se denomina “modo RF”, que está diseñado para usarse en aplicaciones y entornos como los que se encuentran en la difusión por modulación de señales de radiofrecuencia (RF) donde se necesitan rangos dinámicos más estrechos para evitar la sobremodulación.
Para otro ejemplo, las señales codificadas que se adecúan a los estándares MPEG-2 AAC y audio MPEG-4 incluyen metadatos que identifican un nivel de sonoridad promedio para la información de audio codificada. Los procesos que decodifican señales codificadas compatibles con MPEG-2 AAC y audio MPEG-4 pueden permitir al oyente especificar el nivel de reproducción deseado. El decodificador usa el nivel de reproducción deseado y los metadatos de sonoridad promedio para ajustar las amplitudes de la señal decodificada de modo que se logre el nivel de reproducción deseado.
Cuando se usan dispositivos de mano y otros tipos de dispositivos portátiles para decodificar y reproducir el contenido de audio de señales codificadas compatibles con ATSC, compatibles con MPEG-2 AAC y compatibles con audio MPEG-4 de acuerdo con estos parámetros de metadatos, el rango dinámico y el nivel de sonoridad a menudo no son adecuados debido a los entornos de escucha adversos que se encuentran con este tipo de dispositivos o debido a las limitaciones eléctricas debido a los voltajes operativos más bajos que se usan en estos dispositivos.
Las señales codificadas que cumplen otros estándares usan tipos similares de metadatos y pueden incluir una disposición para especificar el nivel de sonoridad de reproducción previsto. A menudo, se encuentran los mismos problemas con los dispositivos portátiles que decodifican estas señales.
La presente invención se puede usar para mejorar la experiencia de escucha de los usuarios de dispositivos de mano y portátiles sin requerir contenido que haya sido preparado especialmente para estos dispositivos.
B. Descripción general del dispositivo
La figura 1 es un diagrama de bloques esquemático de un tipo de dispositivo 10 de receptor/decodificador que incorpora varios aspectos de la presente invención. El dispositivo 10 recibe una señal de entrada codificada de la ruta 11 de señal, aplica procesos adecuados en el desformateador 12 para extraer información de audio codificada y metadatos asociados de la señal de entrada, pasa la información de audio codificada al decodificador 14 y pasa los metadatos a lo largo de la ruta 13 de señal. La información de audio codificada incluye señales de subbanda codificadas que representan el contenido espectral de los estímulos auditivos y los metadatos especifican valores para una variedad de parámetros que incluyen uno o más parámetros de control de decodificación y uno o más parámetros que especifican la compresión del rango dinámico de acuerdo con un perfil de compresión de rango dinámico. El término “perfil de compresión de rango dinámico” se refiere a características tales como factores de ganancia, tiempos de ataque de compresión y tiempos de liberación de compresión que definen las características operativas de un compresor de rango dinámico.
El decodificador 14 aplica un proceso de decodificación a la información de audio codificada para obtener señales de subbanda decodificadas, que se pasan al control 16 de rango dinámico. El funcionamiento y las funciones del proceso de decodificación pueden adaptarse en respuesta a los parámetros de control de decodificación recibidos desde la ruta 13 de señal. Ejemplos de parámetros de control de decodificación que pueden usarse para adaptar el funcionamiento y funciones del proceso de decodificación son parámetros que identifican el número y la configuración de los canales de audio representados por la información de audio codificada.
El control 16 de rango dinámico ajusta opcionalmente el rango dinámico de la información de audio decodificada. Este ajuste puede activarse o desactivarse y adaptarse en respuesta a los metadatos recibidos desde la ruta 13 de señal y/o desde las señales de control que pueden proporcionarse en respuesta a la entrada de un oyente. Por ejemplo, se puede proporcionar una señal de control en respuesta a que un oyente accione un interruptor o seleccione una opción operativa para el dispositivo 10.
En implementaciones que cumplen con el estándar ATSC, el estándar MPEG-2 AAC o el estándar de audio MPEG-4, por ejemplo, la señal de entrada codificada incluye información de audio codificada organizada en una secuencia de segmentos o tramas. Cada trama contiene señales de subbanda codificadas que representan los componentes espectrales de una señal de audio con su rango dinámico completo. El control 16 de rango dinámico puede no realizar ninguna acción, lo que permite que la señal de audio se reproduzca con una cantidad máxima de rango dinámico, o puede modificar las señales de subbanda decodificadas para comprimir el rango dinámico en diversos grados.
El banco 18 de filtros de síntesis aplica un banco de filtros de síntesis a las señales de subbanda decodificadas, que pueden haber sido ajustadas por el control 16 de rango dinámico, y proporciona a su salida una señal de audio de dominio tiempo que puede ser una señal digital o analógica.
El limitador 20 de ganancia se usa en algunas implementaciones de la presente invención para ajustar la amplitud de la señal de audio de dominio tiempo. La salida del limitador 20 de ganancia pasa a lo largo de la ruta 21 para su posterior presentación por un transductor acústico.
La figura 2 es un diagrama de bloques esquemático de un dispositivo 30 de codificador/transmisor que incorpora varios aspectos de la presente invención. El dispositivo 30 recibe una señal de entrada de audio desde la ruta 31 de señal que representa estímulos auditivos. El dispositivo 30 aplica un banco de filtros de análisis a la señal de audio para obtener señales de subbanda en una representación de dominio frecuencia de la señal de audio de entrada o un conjunto de señales de ancho de banda limitado que representan la señal de audio de entrada. La calculadora 34 de metadatos analiza la señal de entrada de audio y/o una o más señales derivadas de la señal de entrada de audio, como una versión modificada de la señal de entrada de audio o las señales de subbanda del banco 32 de filtros de análisis para calcular metadatos que especifican valores para un variedad de parámetros que incluyen parámetros de control de codificación, uno o más parámetros de control de decodificación y uno o más parámetros que especifican la compresión del rango dinámico de acuerdo con un perfil de compresión de rango dinámico. La calculadora 34 de metadatos puede analizar señales de dominio tiempo, señales en el dominio frecuencia o una combinación de señales de dominio tiempo y de dominio frecuencia. Los cálculos realizados por la calculadora 34 de metadatos también pueden adaptarse en respuesta a uno o más parámetros de metadatos recibidos desde la ruta 33. El codificador 36 aplica un proceso de codificación a la salida del banco 32 de filtros de análisis para obtener información de audio codificada que incluye señales de subbanda codificadas, que se pasa al formateador 38. El proceso de codificación puede adaptarse en respuesta a los parámetros de control de codificación recibidos desde la ruta 33. El proceso de codificación también puede generar otros parámetros de control de decodificación a lo largo de la ruta 33 para que los usen los procesos realizados en el dispositivo 10 para decodificar la información de audio codificada. El formateador 38 ensambla la información de audio codificada y al menos algunos de los metadatos, incluidos uno o más parámetros de control de decodificación y uno o más parámetros que especifican la compresión del rango dinámico en una señal de salida codificada que tiene un formato adecuado para transmisión o almacenamiento.
En implementaciones que cumplen con el estándar ATSC, el estándar MPEG-2 AAC o el estándar de audio MPEG-4, por ejemplo, la señal de salida codificada incluye información de audio codificada organizada en una secuencia de segmentos o tramas. Cada trama contiene señales de subbanda codificadas que representan los componentes espectrales de una señal de audio con su rango dinámico completo y que tienen amplitudes para la reproducción a un nivel de reproducción de referencia.
El desformateador 12, el decodificador 14, el banco 18 de filtros de síntesis, el banco 32 de filtros de análisis, el codificador 36 y el formateador 38 pueden ser de diseño y funcionamiento convencionales. Algunos ejemplos incluyen los componentes correspondientes que cumplen con los estándares publicados mencionados anteriormente. Las implementaciones de los componentes especificados o sugeridos en estos estándares son adecuadas para usar con la presente invención pero no son necesarios. Ninguna implementación particular de estos componentes es crítica.
Las figuras 3 a 5 son diagramas de bloques esquemáticos de diferentes implementaciones de un dispositivo 40 de transcodificador que comprende algunos de los componentes en el dispositivo 10 y el dispositivo 30, descritos anteriormente. Estos componentes funcionan sustancialmente igual que sus contrapartes. El dispositivo 40 que se muestra en la figura 3 es capaz de transcodificar la señal de entrada codificada recibida desde la ruta 11 en una versión modificada que cumple el mismo estándar de codificación. En esta implementación, el dispositivo 40 recibe una señal de entrada codificada de la ruta 11 de señal, aplica procesos adecuados en el desformateador 12 para extraer la primera información de audio codificada y los metadatos asociados de la señal de entrada codificada, pasa la primera información de audio codificada al decodificador 14 y al formateador 38, y pasa los metadatos a lo largo de la ruta 43 de señal. La primera información de audio codificada incluye señales de subbanda codificadas que representan el contenido espectral de los estímulos auditivos y los metadatos especifican valores para una variedad de parámetros que incluyen uno o más parámetros de control de decodificación y uno o más parámetros que especifican la compresión del rango dinámico de acuerdo con un primer perfil de compresión de rango dinámico. El decodificador 14 aplica un proceso de decodificación a la primera información de audio codificada para obtener señales de subbanda decodificadas. El funcionamiento y las funciones del proceso de decodificación pueden adaptarse en respuesta a uno o más parámetros de control de decodificación recibidos desde la ruta 43 de señal. Las señales de subbanda pueden ser una representación en el dominio frecuencia de los estímulos auditivos o un conjunto de señales de ancho de banda limitado que representan los estímulos auditivos.
La calculadora 44 de metadatos analiza las señales de subbanda decodificadas y/o una o más señales derivadas de las señales de subbanda decodificadas para calcular uno o más valores de parámetro que especifican la compresión de rango dinámico de acuerdo con un segundo perfil de compresión de rango dinámico. Por ejemplo, una o más señales pueden obtenerse aplicando el banco 18 de filtros de síntesis a las señales de subbanda decodificadas. Los cálculos realizados por la calculadora 44 de metadatos pueden adaptarse en respuesta a los metadatos recibidos desde la ruta 43. El banco 18 de filtros de síntesis puede omitirse de esta implementación si su salida no es necesaria para el cálculo de metadatos.
Otra implementación del dispositivo 40 se muestra en la figura 4. Esta implementación es similar a la que se muestra en la figura 3 pero incluye el codificador 36. La inclusión del codificador 36 permite que el dispositivo 40 transcodifique la señal de entrada codificada recibida de la ruta 11, que cumple un primer estándar de codificación, en una señal de salida codificada que cumple un segundo estándar de codificación que puede ser igual o diferente del primer estándar de codificación siempre que las señales de subbanda de los dos estándares de codificación sean compatibles. Esto se puede hacer en esta implementación haciendo que el codificador 36 aplique un proceso de codificación a las señales de subbanda para obtener una segunda información de audio codificada que cumpla segundo estándar de codificación. La segunda información de audio codificada se pasa al formateador 38. El proceso de codificación puede adaptarse en respuesta a los metadatos recibidos desde la ruta 43. El proceso de codificación también puede generar otros metadatos a lo largo de la ruta 43 para que los usen los procesos realizados en el dispositivo 10 para decodificar la información de audio codificada. El formateador 38 ensambla los metadatos recibidos de la ruta 43 y la información de audio codificada que recibe en una señal de salida codificada que tiene un formato que es adecuado para transmisión o almacenamiento.
Otra implementación más del dispositivo 40 se muestra en la figura 5. Esta implementación incluye el banco 18 de filtros de síntesis, que se aplica a las señales de subbanda decodificadas para obtener una representación de dominio tiempo o de banda ancha de la información de audio codificada. La inclusión del banco 18 de filtros de síntesis y el banco 32 de filtros de análisis permite que el dispositivo 40 transcodifique entre esencialmente cualquier opción de estándares de codificación. La salida del banco 18 de filtros de síntesis se pasa al banco 32 de filtros de análisis, que genera señales de subbanda para que las codifique el codificador 36. El codificador 36 aplica un proceso de codificación a la salida del banco 32 de filtros de análisis para obtener una segunda información de audio codificada, que se pasa al formateador 38. El proceso de codificación también puede generar otros metadatos a lo largo de la ruta 43 para que los usen los procesos realizados en el dispositivo 10 para decodificar la información de audio codificada. La calculadora 44 de metadatos puede calcular valores de parámetro de metadatos a partir de su análisis de cualquiera o todas las señales de subbanda recibidas del decodificador 14, la salida del banco 18 de filtros de síntesis y la salida del banco 32 de filtros de análisis.
Algunos aspectos del dispositivo 10 y el dispositivo 30 se describen a continuación con más detalle. Estas descripciones se aplican a las características correspondientes del dispositivo 40. Estos aspectos se describen en términos de funciones y características de los métodos y dispositivos que cumplen el estándar ATSC mencionado anteriormente. Estas funciones y características específicas se tratan únicamente a modo de ejemplo. Los principios que subyacen a estas implementaciones son directamente aplicables a los métodos y dispositivos que cumplen otros estándares.
C. Receptor/Decodificador
Los problemas de reproducción descritos anteriormente se pueden abordar mediante el uso de una o más de las tres técnicas diferentes que se describen a continuación. La primera técnica usa la limitación de ganancia y puede implementarse mediante características solo en el dispositivo 10. La segunda y la tercera técnica usan compresión de rango dinámico y sus implementaciones requieren características tanto en el dispositivo 10 como en el dispositivo 30.
1. Limitador de ganancia
La primera técnica opera el dispositivo 10 en modo RF en lugar de en modo de línea para que decodifique una señal de entrada codificada compatible con ATSC con el control 16 de rango dinámico proporcionando niveles más altos de compresión de rango dinámico y un nivel de reproducción de referencia más alto. El limitador 20 de ganancia proporciona una ganancia adicional, elevando el nivel de reproducción de referencia efectivo a un valor de -14 dBFS a -8 dBFS. Los resultados empíricos indican que un nivel de referencia igual a -11 dBFS da buenos resultados para muchas aplicaciones.
El limitador 20 de ganancia también aplica una operación de limitación para evitar que la señal digital amplificada exceda 0 dBFS. Las características operativas del limitador pueden afectar la calidad percibida del audio reproducido pero ningún limitador en particular es crítico para la presente invención. El limitador puede implementarse esencialmente de cualquier forma que se desee. Preferiblemente, el limitador está diseñado para proporcionar una función de limitación “suave” en lugar de una función de recorte “duro”.
2. Valores diferenciales de compresión
La segunda técnica permite que el dispositivo 10 aplique uno o más parámetros de compresión de rango dinámico modificados en el control 16 de rango dinámico. El desformateador 12 obtiene valores de parámetro de compresión de rango dinámico (DRC) diferenciales de la señal de entrada codificada y pasa los valores de parámetro diferenciales junto con los valores de parámetro DRC convencionales a lo largo de la ruta 13 al control 16 de rango dinámico. El control 16 de rango dinámico calcula uno o más valores de parámetro DRC que necesita combinando aritméticamente los valores de parámetro DRC convencionales con los correspondientes valores de parámetro diferenciales DRC. No es necesario usar el limitador 20 de ganancia en esta situación. Los valores de parámetro diferenciales DRC son proporcionados en la señal de entrada codificada por el dispositivo 30 de codificador/transmisor que generó la señal de entrada codificada. Esto se describe a continuación.
Si la señal de entrada codificada no contiene estos valores diferenciales DRC, el dispositivo 10 puede usar el limitador 20 de ganancia de acuerdo con la primera técnica descrita anteriormente.
3. Perfil de compresión distinto
La tercera técnica permite que el dispositivo 10 aplique compresión de rango dinámico de acuerdo con un nuevo perfil de compresión de rango dinámico en el control 16 de rango dinámico. El desformateador 12 obtiene uno o más valores de parámetro DRC para el nuevo perfil de la señal de entrada codificada y los pasa a lo largo de la ruta 13 al control 16 de rango dinámico. No es necesario usar el limitador 20 de ganancia en esta situación. Los valores de parámetro DRC para el nuevo perfil de compresión de rango dinámico se proporcionan en la señal de entrada codificada por el dispositivo 30 de codificador/transmisor que generó la señal de entrada codificada. Esto se describe a continuación.
Si la señal de entrada codificada no contiene uno o más valores de parámetro DRC para el nuevo perfil DRC, el dispositivo 10 puede usar el limitador 20 de ganancia de acuerdo con la primera técnica descrita anteriormente. D. Codificador/Transmisor
1. Valores de compresión diferencial
Los procesos para la segunda técnica discutida anteriormente se implementan en el dispositivo 10 usando valores de parámetro diferenciales DRC que se extraen de la señal de entrada codificada. Estos valores de parámetro diferenciales son proporcionados por el dispositivo 30 que generó la señal codificada.
El dispositivo 30 proporciona un conjunto de valores de parámetro diferenciales DRC que representan la diferencia entre un conjunto de valores de parámetro DRC que estarán presentes en la señal codificada y un conjunto de valores de parámetro base correspondientes para un nuevo perfil DRC que se requieren para evitar que las muestras de señales de audio decodificadas excedan 0 dBFS para un nivel de reproducción de referencia más alto. Ningún método particular para calcular los valores de parámetro DRC es crítico para la presente invención. Métodos conocidos para calcular valores de parámetro que se adecúan al estándar ATSC se divulgan en “ATSC Recommended Practice: Techniques for Estalishing an Maintaining Audio Loudness for Digital Television”, documento A/85, 4 de noviembre de 2009, publicado por Advanced Television Systems Committee, Inc., especialmente la Sección 9 y el Anexo F, y en Robinson et al., “Dynamic Range Control via Metadata”, prepublicación n.° 5028, 107a Convención AES, Nueva York, septiembre de 1999.
Si la señal de salida codificada cumple con el estándar ATSC, el estándar MPEG-2 AAC o el estándar de audio MPEG-4, el nivel de reproducción de referencia aumenta a un valor de -14 dBFS a -8 dBFS. Los resultados empíricos indican que un nivel de referencia igual a -11 dBFS da buenos resultados para muchas aplicaciones. Para señales de salida codificadas compatibles con ATSC, la calculadora 34 de metadatos calcula un valor de parámetro diferencial para el parámetro base correspondiente “compr” especificado en el estándar. El formateador 38 puede ensamblar el valor de parámetro diferencial en porciones de cada trama de señal codificada indicada como “addbsi” (información de flujo de bits adicional) y/o “auxdata” (datos auxiliares). Si los valores de parámetro diferenciales se ensamblan en las porciones “addbsi” o “auxdata”, la señal codificada será compatible con todos los decodificadores compatibles con ATSC. Los decodificadores que no reconocen los valores de parámetro diferenciales aún pueden procesar y decodificar correctamente las tramas de señales codificadas ignorando las porciones “addbsi” y “auxdata”. Consúltese el documento A/52b citado anteriormente para obtener más detalles.
Para señales de salida codificadas que se adecúan a los estándares MPEG-2 AAC o audio MPEG-4, el formateador 38 puede ensamblar los valores de parámetro diferenciales en porciones de cada trama de señal codificada indicada como “Fill_Element” o “Data_Stream_Element” en los dos estándares. Si los valores de parámetro diferenciales se ensamblan en cualquiera de estas porciones, la señal codificada será compatible con todos los decodificadores compatibles con los estándares MPEG-2 AAC y audio MPEG-4. Consúltense los documentos ISO/IEC 13818-7 e ISO/IEC 14496-3 citados anteriormente para obtener más detalles.
Los valores de parámetro diferenciales pueden calcularse e insertarse en la señal codificada a una tasa mayor, igual o menor que la tasa a la que los valores de parámetro base correspondientes están en la señal codificada. La tasa de los valores diferenciales puede variar. También se pueden incluir en la señal codificada indicadores o bits que indican si un valor diferencial anterior debe ser reutilizado.
2. Perfil de compresión distinto
Los procesos para la tercera técnica discutida anteriormente se implementan en el dispositivo 10 usando valores de parámetro DRC para el nuevo perfil de compresión de rango dinámico que se extraen de la señal de entrada codificada. Estos valores de parámetro son proporcionados por el dispositivo 30 que generó la señal codificada. El dispositivo 30 deriva valores de parámetro DRC para un nuevo perfil DRC calculando los valores de parámetro necesarios para evitar que las muestras de señales de audio decodificadas excedan 0 dBFS para un nivel de reproducción de referencia superior.
Si la señal de salida codificada cumple con el estándar ATSC, el estándar MPEG-2 AAC o el estándar de audio MPEG-4, la calculadora 34 de metadatos calcula un valor de compresión DRC basándose en la suposición de que el nivel de reproducción de referencia aumenta a un valor de - 14 dBFS a -8 dBFS. Los resultados empíricos indican que un nivel de referencia igual a -11 dBFS da buenos resultados para muchas aplicaciones. El formateador 38 puede ensamblar el valor de parámetro para el perfil DRC en porciones de cada trama de señal codificada como se describe anteriormente para los parámetros diferenciales. El uso de estas porciones de las tramas permite que la señal codificada sea compatible con todos los decodificadores que se adecúen al estándar respectivo.
E. Implementación
Los dispositivos que incorporan diversos aspectos de la presente invención pueden implementarse de diversas maneras, incluido el software para su ejecución por un ordenador o algún otro dispositivo que incluya componentes más especializados, como un circuito de procesador de señal digital (DSP) acoplado a componentes similares a los que se encuentran en un ordenador de propósito general. La figura 6 es un diagrama de bloques esquemático de un dispositivo 70 que puede usarse para implementar aspectos de la presente invención. El procesador 72 proporciona recursos informáticos. La rAm 73 es una memoria de acceso aleatorio (RAM) del sistema usada por el procesador 72 para el procesamiento. La ROM 74 representa alguna forma de almacenamiento persistente tal como memoria de sólo lectura (ROM) para almacenar programas necesarios para operar el dispositivo 70 y posiblemente para llevar a cabo varios aspectos de la presente invención. El control de E/S 75 representa un circuito de interfaz para recibir señales de entrada y transmitir señales de salida a través de los canales de comunicación 76, 77. En la realización mostrada, todos los componentes principales del sistema se conectan al bus 71, que puede representar más de un bus físico o lógico; sin embargo, no se requiere una arquitectura de bus para implementar la presente invención.
En las realizaciones implementadas por un sistema de ordenador de propósito general, se pueden incluir componentes adicionales para conectarse a dispositivos como un teclado o ratón y un visualizador, y para controlar un dispositivo 78 de almacenamiento que tiene un medio de almacenamiento como una cinta magnética o un disco, o un medio óptico. El medio de almacenamiento se puede usar para grabar programas de instrucciones para sistemas operativos, utilidades y aplicaciones, y puede incluir programas que implementen varios aspectos de la presente invención.
Las funciones requeridas para poner en práctica varios aspectos de la presente invención pueden ser realizadas por componentes que se implementan en una amplia variedad de formas que incluyen componentes lógicos discretos, circuitos integrados, uno o más ASIC y/o procesadores controlados por programa. La manera en que se implementan estos componentes no es importante para la presente invención.
Las implementaciones de software de la presente invención pueden transmitirse mediante una variedad de medios legibles por máquina, como rutas de comunicación de banda base o modulada en todo el espectro, incluidas desde frecuencias supersónicas hasta ultravioleta, o medios de almacenamiento que transmiten información usando esencialmente cualquier tecnología de grabación, incluidas cintas magnéticas, tarjetas o disco, tarjetas ópticas o disco, y marcas detectables en medios, incluido el papel.
Claims (5)
1. - Un método que comprende:
recibir, mediante un dispositivo de decodificación, información de audio codificada y metadatos asociados con una señal de audio, incluyendo los metadatos uno o más parámetros de control de decodificación, una medida de una sonoridad de la información de audio codificada y uno o más primeros valores de parámetro que especifican compresión de rango dinámico (DRC) de acuerdo con un primer perfil asociado con un primer nivel de reproducción de referencia, y uno o más segundos valores de parámetro que especifican DRC de acuerdo con un segundo perfil asociado con un segundo nivel de reproducción de referencia superior al primer nivel de reproducción de referencia y dentro de un rango de niveles de reproducción de referencia;
especificar, para el dispositivo de decodificación, un nivel de reproducción de referencia;
aplicar, mediante el dispositivo de decodificación, un proceso de decodificación a la información de audio codificada para obtener señales de subbanda que representan el contenido espectral de la señal de audio; modificar, mediante el dispositivo de decodificación, las señales de subbanda usando el uno o más segundos valores de parámetro DRC que especifican DRC de acuerdo con el segundo perfil para obtener señales de subbanda modificadas con características de rango dinámico cambiadas, en respuesta a especificar el nivel de reproducción de referencia, para el dispositivo de decodificación, al segundo nivel de reproducción de referencia; aplicar, mediante el dispositivo de decodificación, un banco de filtros de síntesis a las señales de subbanda modificadas para obtener una señal de audio de dominio tiempo; y
usar, mediante el dispositivo de decodificación, la medida de sonoridad para ajustar amplitudes de la señal de audio de dominio tiempo para lograr el nivel de reproducción de referencia para el dispositivo de decodificación.
2. - El método de la reivindicación 1, en el que el primer nivel de reproducción de referencia es -31 dBFS o -20 dBFS.
3. - El método de la reivindicación 1 o la reivindicación 2, en el que el rango de niveles de reproducción de referencia está entre -14 dBFS y -8 dBFS.
4. - El método de la reivindicación 1 o la reivindicación 2, en el que el segundo nivel de reproducción de referencia es -11 dBFS.
5. - Un aparato que comprende:
un procesador;
una memoria acoplada al procesador y configurada para almacenar instrucciones que, cuando son ejecutadas por el procesador, hacen que el procesador realice el método de cualquiera de las reivindicaciones anteriores. 6. - Un producto de programa de ordenador que incluye un soporte de datos que almacena instrucciones para realizar el método de una cualquiera de las reivindicaciones 1 a 4.
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US30364310P | 2010-02-11 | 2010-02-11 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| ES2994834T3 true ES2994834T3 (en) | 2025-02-03 |
Family
ID=43881135
Family Applications (5)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| ES22160243T Active ES2994834T3 (en) | 2010-02-11 | 2011-02-03 | System and method for non-destructively normalizing loudness of audio signals within portable devices |
| ES24193995T Active ES3032238T3 (en) | 2010-02-11 | 2011-02-03 | System and method for non-destructively normalizing loudness of audio signals within portable devices |
| ES24193996T Active ES3026800T3 (en) | 2010-02-11 | 2011-02-03 | System and method for non-destructively normalizing loudness of audio signals within portable devices |
| ES25163662T Active ES3057213T3 (en) | 2010-02-11 | 2011-02-03 | System and method for non-destructively normalizing loudness of audio signals within portable devices |
| ES18191911T Active ES2916403T3 (es) | 2010-02-11 | 2011-02-03 | Sistema y método para normalizar de manera no destructiva la sonoridad de señales de audio en dispositivos portátiles |
Family Applications After (4)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| ES24193995T Active ES3032238T3 (en) | 2010-02-11 | 2011-02-03 | System and method for non-destructively normalizing loudness of audio signals within portable devices |
| ES24193996T Active ES3026800T3 (en) | 2010-02-11 | 2011-02-03 | System and method for non-destructively normalizing loudness of audio signals within portable devices |
| ES25163662T Active ES3057213T3 (en) | 2010-02-11 | 2011-02-03 | System and method for non-destructively normalizing loudness of audio signals within portable devices |
| ES18191911T Active ES2916403T3 (es) | 2010-02-11 | 2011-02-03 | Sistema y método para normalizar de manera no destructiva la sonoridad de señales de audio en dispositivos portátiles |
Country Status (19)
| Country | Link |
|---|---|
| US (9) | US8903729B2 (es) |
| EP (7) | EP2534656B1 (es) |
| JP (2) | JP5666625B2 (es) |
| KR (1) | KR101381588B1 (es) |
| CN (2) | CN102754151B (es) |
| AR (1) | AR080156A1 (es) |
| BR (2) | BR112012019880B1 (es) |
| CA (7) | CA3247149A1 (es) |
| CL (1) | CL2012002213A1 (es) |
| CO (1) | CO6511277A2 (es) |
| EA (1) | EA023730B9 (es) |
| ES (5) | ES2994834T3 (es) |
| MX (1) | MX2012008954A (es) |
| MY (1) | MY169981A (es) |
| PH (1) | PH12012501501A1 (es) |
| SG (1) | SG182632A1 (es) |
| TW (2) | TWI529703B (es) |
| UA (1) | UA105277C2 (es) |
| WO (1) | WO2011100155A1 (es) |
Families Citing this family (64)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US10158337B2 (en) | 2004-08-10 | 2018-12-18 | Bongiovi Acoustics Llc | System and method for digital signal processing |
| US10848118B2 (en) | 2004-08-10 | 2020-11-24 | Bongiovi Acoustics Llc | System and method for digital signal processing |
| US11431312B2 (en) | 2004-08-10 | 2022-08-30 | Bongiovi Acoustics Llc | System and method for digital signal processing |
| US10848867B2 (en) | 2006-02-07 | 2020-11-24 | Bongiovi Acoustics Llc | System and method for digital signal processing |
| US10701505B2 (en) | 2006-02-07 | 2020-06-30 | Bongiovi Acoustics Llc. | System, method, and apparatus for generating and digitally processing a head related audio transfer function |
| AR077680A1 (es) | 2009-08-07 | 2011-09-14 | Dolby Int Ab | Autenticacion de flujos de datos |
| TWI413110B (zh) | 2009-10-06 | 2013-10-21 | Dolby Int Ab | 以選擇性通道解碼的有效多通道信號處理 |
| WO2011048010A1 (en) | 2009-10-19 | 2011-04-28 | Dolby International Ab | Metadata time marking information for indicating a section of an audio object |
| TWI529703B (zh) | 2010-02-11 | 2016-04-11 | 杜比實驗室特許公司 | 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法 |
| TWI525987B (zh) | 2010-03-10 | 2016-03-11 | 杜比實驗室特許公司 | 在單一播放模式中組合響度量測的系統 |
| JP5850216B2 (ja) | 2010-04-13 | 2016-02-03 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
| JP5707842B2 (ja) | 2010-10-15 | 2015-04-30 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
| US9171549B2 (en) * | 2011-04-08 | 2015-10-27 | Dolby Laboratories Licensing Corporation | Automatic configuration of metadata for use in mixing audio programs from two encoded bitstreams |
| CN119495308A (zh) | 2012-05-18 | 2025-02-21 | 杜比实验室特许公司 | 用于维持与参数音频编码器相关联的可逆动态范围控制信息的系统 |
| US10844689B1 (en) | 2019-12-19 | 2020-11-24 | Saudi Arabian Oil Company | Downhole ultrasonic actuator system for mitigating lost circulation |
| KR101726205B1 (ko) * | 2012-11-07 | 2017-04-12 | 돌비 인터네셔널 에이비 | 감소된 복잡성 변환기 snr 계산 |
| US9411881B2 (en) * | 2012-11-13 | 2016-08-09 | Dolby International Ab | System and method for high dynamic range audio distribution |
| CN112652316B (zh) * | 2013-01-21 | 2023-09-15 | 杜比实验室特许公司 | 利用响度处理状态元数据的音频编码器和解码器 |
| ES2843744T3 (es) | 2013-01-21 | 2021-07-20 | Dolby Laboratories Licensing Corp | Decodificación de trenes de bits de audio codificados con un contenedor de metadatos situado en un espacio de datos reservado |
| RU2665873C1 (ru) * | 2013-01-21 | 2018-09-04 | Долби Лэборетериз Лайсенсинг Корпорейшн | Оптимизация громкости и динамического диапазона через различные устройства воспроизведения |
| CN110853660B (zh) * | 2013-01-28 | 2024-01-23 | 弗劳恩霍夫应用研究促进协会 | 解码比特流以从该比特流产生音频输出信号的解码器设备 |
| JP6250071B2 (ja) * | 2013-02-21 | 2017-12-20 | ドルビー・インターナショナル・アーベー | パラメトリック・マルチチャネル・エンコードのための方法 |
| US9559651B2 (en) | 2013-03-29 | 2017-01-31 | Apple Inc. | Metadata for loudness and dynamic range control |
| US9607624B2 (en) * | 2013-03-29 | 2017-03-28 | Apple Inc. | Metadata driven dynamic range control |
| US9883318B2 (en) | 2013-06-12 | 2018-01-30 | Bongiovi Acoustics Llc | System and method for stereo field enhancement in two-channel audio systems |
| TWM487509U (zh) * | 2013-06-19 | 2014-10-01 | 杜比實驗室特許公司 | 音訊處理設備及電子裝置 |
| CN109903776B (zh) * | 2013-09-12 | 2024-03-01 | 杜比实验室特许公司 | 用于各种回放环境的动态范围控制 |
| JP6506764B2 (ja) * | 2013-09-12 | 2019-04-24 | ドルビー ラボラトリーズ ライセンシング コーポレイション | ダウンミックスされたオーディオ・コンテンツについてのラウドネス調整 |
| JP6531649B2 (ja) | 2013-09-19 | 2019-06-19 | ソニー株式会社 | 符号化装置および方法、復号化装置および方法、並びにプログラム |
| US20150095320A1 (en) * | 2013-09-27 | 2015-04-02 | Trooclick France | Apparatus, systems and methods for scoring the reliability of online information |
| US9906858B2 (en) | 2013-10-22 | 2018-02-27 | Bongiovi Acoustics Llc | System and method for digital signal processing |
| ES2732304T3 (es) | 2013-10-22 | 2019-11-21 | Fraunhofer Ges Forschung | Concepto para la compresión combinada del intervalo dinámico y prevención guiada de recortes para dispositivos de audio |
| US20150146099A1 (en) * | 2013-11-25 | 2015-05-28 | Anthony Bongiovi | In-line signal processor |
| US9276544B2 (en) | 2013-12-10 | 2016-03-01 | Apple Inc. | Dynamic range control gain encoding |
| BR112016014476B1 (pt) | 2013-12-27 | 2021-11-23 | Sony Corporation | Aparelho e método de decodificação, e, meio de armazenamento legível por computador |
| US9608588B2 (en) | 2014-01-22 | 2017-03-28 | Apple Inc. | Dynamic range control with large look-ahead |
| EP3809714B1 (en) * | 2014-02-27 | 2025-09-10 | Sonarworks SIA | Method of and apparatus for determining an equalization filter |
| US10063207B2 (en) * | 2014-02-27 | 2018-08-28 | Dts, Inc. | Object-based audio loudness management |
| TWI718979B (zh) * | 2014-03-24 | 2021-02-11 | 瑞典商杜比國際公司 | 應用動態範圍壓縮至高階保真立體音響信號之方法和裝置 |
| US9654076B2 (en) * | 2014-03-25 | 2017-05-16 | Apple Inc. | Metadata for ducking control |
| WO2015144587A1 (en) | 2014-03-25 | 2015-10-01 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder device and an audio decoder device having efficient gain coding in dynamic range control |
| US10820883B2 (en) | 2014-04-16 | 2020-11-03 | Bongiovi Acoustics Llc | Noise reduction assembly for auscultation of a body |
| KR102655047B1 (ko) * | 2014-06-27 | 2024-04-08 | 돌비 인터네셔널 에이비 | Hoa 데이터 프레임 표현의 압축을 위해 비차분 이득 값들을 표현하는 데 필요하게 되는 비트들의 최저 정수 개수를 결정하는 방법 |
| US20170127073A1 (en) * | 2014-06-30 | 2017-05-04 | Sony Corporation | Information processing device and method |
| EP2963948A1 (en) * | 2014-07-02 | 2016-01-06 | Thomson Licensing | Method and apparatus for encoding/decoding of directions of dominant directional signals within subbands of a HOA signal representation |
| WO2016050740A1 (en) | 2014-10-01 | 2016-04-07 | Dolby International Ab | Efficient drc profile transmission |
| ES2980796T3 (es) | 2014-10-10 | 2024-10-03 | Dolby Laboratories Licensing Corp | Sonoridad de programa basada en la presentación, independiente de la transmisión |
| TWI890652B (zh) | 2015-03-13 | 2025-07-11 | 瑞典商杜比國際公司 | 音訊處理單元、用於將經編碼的音訊位元流解碼之方法以及非暫態電腦可讀媒體 |
| US10109288B2 (en) | 2015-05-27 | 2018-10-23 | Apple Inc. | Dynamic range and peak control in audio using nonlinear filters |
| US9837086B2 (en) | 2015-07-31 | 2017-12-05 | Apple Inc. | Encoded audio extended metadata-based dynamic range control |
| US9590580B1 (en) | 2015-09-13 | 2017-03-07 | Guoguang Electric Company Limited | Loudness-based audio-signal compensation |
| TWI594231B (zh) * | 2016-12-23 | 2017-08-01 | 瑞軒科技股份有限公司 | 分頻壓縮電路,音訊處理方法以及音訊處理系統 |
| US11089349B2 (en) * | 2017-01-20 | 2021-08-10 | Hanwha Techwin Co., Ltd. | Apparatus and method for playing back and seeking media in web browser |
| EP3574583B1 (en) * | 2017-03-31 | 2020-12-09 | Dolby International AB | Inversion of dynamic range control |
| CN110033781B (zh) * | 2018-01-10 | 2021-06-01 | 盛微先进科技股份有限公司 | 音频处理方法、装置及非暂时性电脑可读媒体 |
| IL314886B2 (en) | 2018-04-09 | 2025-08-01 | Dolby Int Ab | Methods, apparatus and systems for three degrees of freedom (3dof+) extension of mpeg-h 3d audio |
| AU2019252524A1 (en) | 2018-04-11 | 2020-11-05 | Bongiovi Acoustics Llc | Audio enhanced hearing protection system |
| US10959035B2 (en) | 2018-08-02 | 2021-03-23 | Bongiovi Acoustics Llc | System, method, and apparatus for generating and digitally processing a head related audio transfer function |
| JP7682860B2 (ja) | 2019-09-13 | 2025-05-26 | ドルビー ラボラトリーズ ライセンシング コーポレイション | アーチファクトを低減したダイナミックレンジ圧縮 |
| EP3809709A1 (en) * | 2019-10-14 | 2021-04-21 | Koninklijke Philips N.V. | Apparatus and method for audio encoding |
| CN112732069B (zh) * | 2021-02-20 | 2024-11-15 | 无锡创感微传感技术有限公司 | 一种电子设备状态修改方法和装置 |
| CN112992159B (zh) * | 2021-05-17 | 2021-08-06 | 北京百瑞互联技术有限公司 | 一种lc3音频编解码方法、装置、设备及存储介质 |
| US12563339B2 (en) * | 2023-02-09 | 2026-02-24 | Samsung Electronics Co., Ltd. | Signal normalization using loudness metadata for audio processing |
| CN119252277B (zh) * | 2024-12-05 | 2025-02-25 | 电子科技大学 | 一种基于机器学习算法catboost的音频信号处理方法及装置 |
Family Cites Families (57)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| GB2373975B (en) | 2001-03-30 | 2005-04-13 | Sony Uk Ltd | Digital audio signal processing |
| US7328151B2 (en) * | 2002-03-22 | 2008-02-05 | Sound Id | Audio decoder with dynamic adjustment of signal modification |
| US7072477B1 (en) | 2002-07-09 | 2006-07-04 | Apple Computer, Inc. | Method and apparatus for automatically normalizing a perceived volume level in a digitally encoded file |
| US7454331B2 (en) * | 2002-08-30 | 2008-11-18 | Dolby Laboratories Licensing Corporation | Controlling loudness of speech in signals that contain speech and other types of audio material |
| US7398207B2 (en) * | 2003-08-25 | 2008-07-08 | Time Warner Interactive Video Group, Inc. | Methods and systems for determining audio loudness levels in programming |
| US7617109B2 (en) * | 2004-07-01 | 2009-11-10 | Dolby Laboratories Licensing Corporation | Method for correcting metadata affecting the playback loudness and dynamic range of audio information |
| US7729673B2 (en) | 2004-12-30 | 2010-06-01 | Sony Ericsson Mobile Communications Ab | Method and apparatus for multichannel signal limiting |
| TW200638335A (en) * | 2005-04-13 | 2006-11-01 | Dolby Lab Licensing Corp | Audio metadata verification |
| JP2007109328A (ja) | 2005-10-14 | 2007-04-26 | Kenwood Corp | 再生装置 |
| US20080025530A1 (en) | 2006-07-26 | 2008-01-31 | Sony Ericsson Mobile Communications Ab | Method and apparatus for normalizing sound playback loudness |
| WO2008032828A1 (en) * | 2006-09-15 | 2008-03-20 | Panasonic Corporation | Audio encoding device and audio encoding method |
| DE102006048685A1 (de) * | 2006-10-14 | 2008-04-17 | Mtu Aero Engines Gmbh | Turbinenschaufel einer Gasturbine |
| US20090253457A1 (en) | 2008-04-04 | 2009-10-08 | Apple Inc. | Audio signal processing for certification enhancement in a handheld wireless communications device |
| US20090281803A1 (en) * | 2008-05-12 | 2009-11-12 | Broadcom Corporation | Dispersion filtering for speech intelligibility enhancement |
| US9197181B2 (en) * | 2008-05-12 | 2015-11-24 | Broadcom Corporation | Loudness enhancement system and method |
| EP2146522A1 (en) | 2008-07-17 | 2010-01-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating audio output signals using object based metadata |
| KR101599535B1 (ko) * | 2008-07-29 | 2016-03-03 | 엘지전자 주식회사 | 오디오 신호의 처리 방법 및 장치 |
| US8798776B2 (en) * | 2008-09-30 | 2014-08-05 | Dolby International Ab | Transcoding of audio metadata |
| JP2010135906A (ja) | 2008-12-02 | 2010-06-17 | Sony Corp | クリップ防止装置及びクリップ防止方法 |
| JP5136378B2 (ja) * | 2008-12-09 | 2013-02-06 | 富士通株式会社 | 音響処理方法 |
| US20100161340A1 (en) * | 2008-12-24 | 2010-06-24 | Plantronics, Inc. | Dynamic Codec Switching |
| US8670990B2 (en) * | 2009-08-03 | 2014-03-11 | Broadcom Corporation | Dynamic time scale modification for reduced bit rate audio coding |
| TWI529703B (zh) | 2010-02-11 | 2016-04-11 | 杜比實驗室特許公司 | 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法 |
| EP2381574B1 (en) | 2010-04-22 | 2014-12-03 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Apparatus and method for modifying an input audio signal |
| JP5903758B2 (ja) | 2010-09-08 | 2016-04-13 | ソニー株式会社 | 信号処理装置および方法、プログラム、並びにデータ記録媒体 |
| US8989884B2 (en) | 2011-01-11 | 2015-03-24 | Apple Inc. | Automatic audio configuration based on an audio output device |
| JP2012235310A (ja) | 2011-04-28 | 2012-11-29 | Sony Corp | 信号処理装置および方法、プログラム、並びにデータ記録媒体 |
| US8965774B2 (en) | 2011-08-23 | 2015-02-24 | Apple Inc. | Automatic detection of audio compression parameters |
| JP5845760B2 (ja) | 2011-09-15 | 2016-01-20 | ソニー株式会社 | 音声処理装置および方法、並びにプログラム |
| JP2013102411A (ja) | 2011-10-14 | 2013-05-23 | Sony Corp | 音声信号処理装置、および音声信号処理方法、並びにプログラム |
| CN104081454B (zh) | 2011-12-15 | 2017-03-01 | 弗劳恩霍夫应用研究促进协会 | 用于避免削波假象的设备、方法和计算机程序 |
| TWI517142B (zh) | 2012-07-02 | 2016-01-11 | Sony Corp | Audio decoding apparatus and method, audio coding apparatus and method, and program |
| EP2757558A1 (en) | 2013-01-18 | 2014-07-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Time domain level adjustment for audio signal decoding or encoding |
| CN110853660B (zh) | 2013-01-28 | 2024-01-23 | 弗劳恩霍夫应用研究促进协会 | 解码比特流以从该比特流产生音频输出信号的解码器设备 |
| US9607624B2 (en) | 2013-03-29 | 2017-03-28 | Apple Inc. | Metadata driven dynamic range control |
| US9559651B2 (en) | 2013-03-29 | 2017-01-31 | Apple Inc. | Metadata for loudness and dynamic range control |
| JP2015050685A (ja) | 2013-09-03 | 2015-03-16 | ソニー株式会社 | オーディオ信号処理装置および方法、並びにプログラム |
| JP6531649B2 (ja) | 2013-09-19 | 2019-06-19 | ソニー株式会社 | 符号化装置および方法、復号化装置および方法、並びにプログラム |
| US9300268B2 (en) | 2013-10-18 | 2016-03-29 | Apple Inc. | Content aware audio ducking |
| ES2732304T3 (es) | 2013-10-22 | 2019-11-21 | Fraunhofer Ges Forschung | Concepto para la compresión combinada del intervalo dinámico y prevención guiada de recortes para dispositivos de audio |
| US9240763B2 (en) | 2013-11-25 | 2016-01-19 | Apple Inc. | Loudness normalization based on user feedback |
| US9276544B2 (en) | 2013-12-10 | 2016-03-01 | Apple Inc. | Dynamic range control gain encoding |
| BR112016014476B1 (pt) | 2013-12-27 | 2021-11-23 | Sony Corporation | Aparelho e método de decodificação, e, meio de armazenamento legível por computador |
| US9608588B2 (en) | 2014-01-22 | 2017-03-28 | Apple Inc. | Dynamic range control with large look-ahead |
| WO2015144587A1 (en) | 2014-03-25 | 2015-10-01 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder device and an audio decoder device having efficient gain coding in dynamic range control |
| US9654076B2 (en) | 2014-03-25 | 2017-05-16 | Apple Inc. | Metadata for ducking control |
| KR101967810B1 (ko) | 2014-05-28 | 2019-04-11 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 데이터 프로세서 및 사용자 제어 데이터의 오디오 디코더들과 렌더러들로의 전송 |
| RU2019122989A (ru) | 2014-05-30 | 2019-09-16 | Сони Корпорейшн | Устройство обработки информации и способ обработки информации |
| US20180165358A1 (en) | 2014-06-30 | 2018-06-14 | Sony Corporation | Information processing apparatus and information processing method |
| TWI631835B (zh) | 2014-11-12 | 2018-08-01 | 弗勞恩霍夫爾協會 | 用以解碼媒體信號之解碼器、及用以編碼包含用於主要媒體資料之元資料或控制資料的次要媒體資料之編碼器 |
| US20160315722A1 (en) | 2015-04-22 | 2016-10-27 | Apple Inc. | Audio stem delivery and control |
| US10109288B2 (en) | 2015-05-27 | 2018-10-23 | Apple Inc. | Dynamic range and peak control in audio using nonlinear filters |
| BR112017025552B1 (pt) | 2015-05-29 | 2023-01-24 | Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E.V | Dispositivo e método para controle de volume e sintonizador de rádio |
| CN107820711B (zh) | 2015-06-17 | 2020-09-08 | 弗劳恩霍夫应用研究促进协会 | 用于音频编码系统中用户交互性的响度控制 |
| US9837086B2 (en) | 2015-07-31 | 2017-12-05 | Apple Inc. | Encoded audio extended metadata-based dynamic range control |
| US9934790B2 (en) | 2015-07-31 | 2018-04-03 | Apple Inc. | Encoded audio metadata-based equalization |
| US10341770B2 (en) | 2015-09-30 | 2019-07-02 | Apple Inc. | Encoded audio metadata-based loudness equalization and dynamic equalization during DRC |
-
2011
- 2011-02-01 TW TW103122263A patent/TWI529703B/zh active
- 2011-02-01 TW TW100103980A patent/TWI447709B/zh active
- 2011-02-03 BR BR112012019880-7A patent/BR112012019880B1/pt active IP Right Grant
- 2011-02-03 KR KR1020127023274A patent/KR101381588B1/ko active Active
- 2011-02-03 EP EP11706975.7A patent/EP2534656B1/en active Active
- 2011-02-03 SG SG2012053765A patent/SG182632A1/en unknown
- 2011-02-03 CA CA3247149A patent/CA3247149A1/en active Pending
- 2011-02-03 ES ES22160243T patent/ES2994834T3/es active Active
- 2011-02-03 ES ES24193995T patent/ES3032238T3/es active Active
- 2011-02-03 ES ES24193996T patent/ES3026800T3/es active Active
- 2011-02-03 CA CA3075793A patent/CA3075793C/en active Active
- 2011-02-03 EP EP24193995.8A patent/EP4459615B1/en active Active
- 2011-02-03 EP EP24193996.6A patent/EP4459616B1/en active Active
- 2011-02-03 EP EP25163661.9A patent/EP4546336A3/en active Pending
- 2011-02-03 CA CA2995461A patent/CA2995461C/en active Active
- 2011-02-03 EA EA201270712A patent/EA023730B9/ru not_active IP Right Cessation
- 2011-02-03 EP EP18191911.9A patent/EP3444816B8/en active Active
- 2011-02-03 WO PCT/US2011/023531 patent/WO2011100155A1/en not_active Ceased
- 2011-02-03 CA CA2787466A patent/CA2787466C/en active Active
- 2011-02-03 CA CA2918302A patent/CA2918302C/en active Active
- 2011-02-03 JP JP2012552907A patent/JP5666625B2/ja active Active
- 2011-02-03 CA CA3114177A patent/CA3114177C/en active Active
- 2011-02-03 EP EP22160243.6A patent/EP4047602B1/en active Active
- 2011-02-03 CN CN201180009098.1A patent/CN102754151B/zh active Active
- 2011-02-03 CA CA3201814A patent/CA3201814C/en active Active
- 2011-02-03 MX MX2012008954A patent/MX2012008954A/es active IP Right Grant
- 2011-02-03 ES ES25163662T patent/ES3057213T3/es active Active
- 2011-02-03 US US13/576,386 patent/US8903729B2/en active Active
- 2011-02-03 UA UAA201210385A patent/UA105277C2/ru unknown
- 2011-02-03 CN CN201410039751.4A patent/CN103795364B/zh active Active
- 2011-02-03 EP EP25163662.7A patent/EP4571738B1/en active Active
- 2011-02-03 PH PH1/2012/501501A patent/PH12012501501A1/en unknown
- 2011-02-03 ES ES18191911T patent/ES2916403T3/es active Active
- 2011-02-03 BR BR122019025627-6A patent/BR122019025627B1/pt active IP Right Grant
- 2011-02-03 MY MYPI2012003595A patent/MY169981A/en unknown
- 2011-02-10 AR ARP110100414A patent/AR080156A1/es active IP Right Grant
-
2012
- 2012-07-30 CO CO12127728A patent/CO6511277A2/es active IP Right Grant
- 2012-08-09 CL CL2012002213A patent/CL2012002213A1/es unknown
-
2014
- 2014-10-28 US US14/525,536 patent/US9646622B2/en active Active
- 2014-12-10 JP JP2014249460A patent/JP6133263B2/ja active Active
-
2017
- 2017-04-07 US US15/482,328 patent/US10418045B2/en active Active
-
2019
- 2019-07-05 US US16/504,076 patent/US10566006B2/en active Active
-
2020
- 2020-02-11 US US16/787,502 patent/US11341982B2/en active Active
-
2022
- 2022-05-23 US US17/750,803 patent/US11670315B2/en active Active
-
2023
- 2023-04-20 US US18/303,919 patent/US11948592B2/en active Active
-
2024
- 2024-03-28 US US18/620,081 patent/US12183355B2/en active Active
- 2024-11-18 US US18/950,995 patent/US20250078849A1/en active Pending
Also Published As
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| ES2994834T3 (en) | System and method for non-destructively normalizing loudness of audio signals within portable devices | |
| HK40117711B (en) | System and method for non-destructively normalizing loudness of audio signals within portable devices | |
| HK40117711A (en) | System and method for non-destructively normalizing loudness of audio signals within portable devices | |
| HK40124412B (en) | System and method for non-destructively normalizing loudness of audio signals within portable devices | |
| HK40124412A (en) | System and method for non-destructively normalizing loudness of audio signals within portable devices | |
| HK40117710B (en) | System and method for non-destructively normalizing loudness of audio signals within portable devices | |
| HK40117710A (en) | System and method for non-destructively normalizing loudness of audio signals within portable devices | |
| HK40079884B (en) | System and method for non-destructively normalizing loudness of audio signals within portable devices | |
| HK40002961B (en) | System and method for non-destructively normalizing loudness of audio signals within portable devices |