ES2642906T3 - Codificador de audio, procedimientos para proporcionar un flujo de audio y programa de ordenador - Google Patents

Codificador de audio, procedimientos para proporcionar un flujo de audio y programa de ordenador Download PDF

Info

Publication number
ES2642906T3
ES2642906T3 ES09776839.4T ES09776839T ES2642906T3 ES 2642906 T3 ES2642906 T3 ES 2642906T3 ES 09776839 T ES09776839 T ES 09776839T ES 2642906 T3 ES2642906 T3 ES 2642906T3
Authority
ES
Spain
Prior art keywords
spectral
quantified
information
scale
noise
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES09776839.4T
Other languages
English (en)
Inventor
Nikolaus Rettelbach
Bernhard Grill
Guillaume Fuchs
Stefan Geyersberger
Markus Multrus
Harald Popp
Juergen Herre
Stefan Wabnik
Gerald Schuller
Jens Hirschfeld
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=40941986&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=ES2642906(T3) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Application granted granted Critical
Publication of ES2642906T3 publication Critical patent/ES2642906T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/035Scalar quantisation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/028Noise substitution, i.e. substituting non-tonal spectral components by noisy source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Detection And Prevention Of Errors In Transmission (AREA)

Description

DESCRIPCION
Codificador de audio, procedimientos para proporcionar un flujo de audio y programa de ordenador 5 ANTECEDENTES DE LA INVENCION
[0001] Las realizaciones segun la invencion se refieren a un codificador para proporcionar un flujo de audio basandose en una representacion en el dominio de la transformada de una senal de audio de entrada. Una realizacion adicional segun la invencion proporciona un procedimiento para proporcionar un flujo de audio. Una
10 realizacion adicional segun la invencion proporciona un programa de ordenador.
[0002] En terminos generales, las realizaciones segun la invencion se refieren a un relleno de ruido.
[0003] Los conceptos de codificacion de audio a menudo codifican una senal de audio en el dominio de la 15 frecuencia. Por ejemplo, el concepto denominado de “codificacion de audio avanzada” (AAC) codifica el contenido
de diferentes segmentos espectrales (o segmentos de frecuencia) teniendo en cuenta un modelo psicoacustico. Para este proposito, se codifica la information de intensidad para diferentes segmentos espectrales. Sin embargo, la resolution utilizada para codificar intensidades en diferentes segmentos espectrales se adapta de acuerdo con las relevancias psicoacusticas de los diferentes segmentos espectrales. Asl, algunos segmentos espectrales, que se 20 considera que son de baja relevancia psicoacustica, se codifican con una resolucion de intensidad muy baja, de modo que algunos de los segmentos espectrales que se consideran de baja relevancia psicoacustica, o incluso un numero dominante de los mismos, se cuantifican a cero. Cuantificar la intensidad de un segmento espectral a cero lleva aparejada la ventaja de que el valor cuantificado a cero puede codificarse de una manera que ahorra muchos bits, lo cual ayuda a mantener la velocidad binaria lo mas pequena posible. No obstante, los segmentos espectrales 25 cuantificados a cero a veces resultan en artefactos audibles, aunque el modelo psicoacustico indique que los segmentos espectrales son de baja relevancia psicoacustica.
[0004] Por lo tanto, existe el deseo de tratar los segmentos espectrales cuantificados a cero, tanto en un codificador de audio como en un decodificador de audio.
30
[0005] Se conocen diferentes estrategias para tratar los segmentos espectrales codificados a cero en los sistemas de codificacion de audio en el dominio de la transformada y tambien en los codificadores de voz.
[0006] Por ejemplo, la norma MPEG-4 “AAC” (codificacion de audio avanzada) utiliza el concepto de 35 sustitucion de ruido perceptivo (PNS). La sustitucion de ruido perceptivo rellena bandas de factores de escala
completas solo con ruido. Los detalles respecto al MPEG-4 AAC pueden encontrarse, por ejemplo, en la Norma Internacional ISO /IEC 14496-3 (Tecnologla de la Informacion - Codificacion de Objetos Audiovisuales - Parte 3: Audio). Ademas, el codificador de voz AMR-WB+ reemplaza los vectores de cuantificacion vectorial (vectores VQ) cuantificados a cero con un vector de ruido aleatorio, donde cada valor espectral complejo tiene una amplitud 40 constante, pero una fase aleatoria. La amplitud se controla mediante un valor de ruido transmitido con el tren de bits. Los detalles respecto al codificador de voz AMR-WB+ pueden encontrarse, por ejemplo, en la especificacion tecnica titulada “Third Generation Partnership Project; Technical Specification Group Services and System Aspects: Audio Codec Processing Functions; Extended Adaptive Multi-Rate-Wide Band (AMR-WB+) Codec; Transcoding Functions (Release Six)”, que tambien se conoce como “3GPP TS 26.290 V6.3.0 (2005-06) - Technical Specification”.
45
[0007] Ademas, el documento EP1395980B1 describe un concepto de codificacion de audio. La publication describe un medio por el cual bandas de frecuencias seleccionadas de informacion de una senal de audio original, que son audibles, pero que son perceptivamente menos relevantes, no necesitan ser codificadas, sino que pueden reemplazarse por un parametro de relleno de ruido. En cambio, aquellas bandas de senal que tienen contenido, que
50 son mas relevantes perceptivamente, se codifican totalmente. De esta manera se ahorran bits de codificacion sin dejar huecos en el espectro de frecuencia de la senal recibida. El parametro de relleno de ruido es una medida del valor de la senal RMS dentro de la banda en cuestion y se utiliza en el extremo de reception por un algoritmo de decodificacion para indicar la cantidad de ruido que hay que inyectar en la banda de frecuencias en cuestion.
55 [0008] Estrategias adicionales proporcionan una insertion de ruido no guiada en el decodificador, teniendo en
cuenta la tonalidad del espectro transmitido.
[0009] Sin embargo, los conceptos convencionales tlpicamente llevan aparejado el problema de que o bien
comprenden una escasa resolucion en cuanto a la granularidad del relleno de ruido, lo cual tlpicamente degrada la 60 impresion de audition, o requieren una cantidad comparativamente grande de informacion colateral de relleno de
ruido, lo cual requiere velocidad binaria extra.
[0010] El documento de Neuendorf y col, “A Novel Scheme for Low Bitrate Unified Speech and Audio Coding - MPEg RM0”, Audio Engineering Society Convention Paper 7713, presentado en la 126 Convencion, 7-10 de mayo
5 de 2009, Munich, Alemania, paginas 1-6, XP040508995, presenta un codificador de audio que comprende analisis de relleno de ruido, segun el cual se calcula un error medio de cuantificacion y se transmite en un tren de bits.
[0011] En vista de lo anterior, existe la necesidad de un concepto mejorado de relleno de ruido, que proporcione un mejor compromiso entre la impresion de audicion alcanzable y la velocidad binaria requerida.
10
RESUMEN DE LA INVENCION
[0012] Una realization segun la invention crea un codificador para proporcionar un flujo de audio basandose en una representation en el dominio de la transformada de una serial de audio de entrada, como se expone en la
15 revindication independiente 1. El codificador comprende un calculador de error de cuantificacion configurado para determinar un error de cuantificacion multibanda sobre una pluralidad de bandas de frecuencias (por ejemplo, sobre una pluralidad de bandas de factores de escala) de la serial de audio de entrada, para lo cual se dispone de information de ganancia de banda separada (por ejemplo, factores de escala separados). El codificador tambien comprende un proveedor de flujo de audio configurado para proporcionar el flujo de audio de modo que el flujo de 20 audio comprende una informacion que describe un contenido de audio de las bandas de frecuencias y una informacion que describe el error de cuantificacion multibanda.
[0013] El codificador descrito anteriormente se basa en el hallazgo de que la utilization de una informacion de error de cuantificacion multibanda lleva aparejada la posibilidad de obtener una buena impresion de audicion
25 basandose en una cantidad comparativamente pequena de informacion colateral. En particular, la utilizacion de una informacion de error de cuantificacion multibanda, que abarca una pluralidad de bandas de frecuencias para las cuales se dispone de informacion de ganancia de banda separada, permite un cambio de escala en el lado del decodificador de los valores de ruido, que estan basados en el error de cuantificacion multibanda, dependiendo de la informacion de ganancia de banda. Por consiguiente, como la informacion de ganancia de banda esta 30 correlacionada tlpicamente con una relevancia psicoacustica de las bandas de frecuencias o con una exactitud de cuantificacion aplicada a las bandas de frecuencias, la informacion de error de cuantificacion multibanda se ha identificado como una informacion colateral, que permite una slntesis del ruido de relleno que proporciona una buena impresion de audicion en tanto que manteniendo bajo el coste de velocidad binaria de la informacion colateral.
35
[0014] El codificador comprende un cuantificador configurado para cuantificar componentes espectrales (por ejemplo, coeficientes espectrales) de diferentes bandas de frecuencias de la representacion en el dominio de la transformada utilizando diferentes exactitudes de cuantificacion dependiendo de las relevancias psicoacusticas de las diferentes bandas de frecuencias para obtener componentes espectrales cuantificadas, en el que las diferentes
40 exactitudes de cuantificacion se reflejan por la informacion de ganancia de banda. Ademas, el proveedor de flujo de audio esta configurado para proporcionar el flujo de audio de modo que el flujo de audio comprende una informacion que describe la informacion de ganancia de banda (por ejemplo, en forma de factores de escala) y de modo que el flujo de audio tambien comprende la informacion que describe el error de cuantificacion multibanda.
45 [0015] El calculador de error de cuantificacion esta configurado para determinar el error de cuantificacion en
el dominio cuantificado, de modo que se tiene en cuenta un cambio de escala, dependiendo de la informacion de ganancia de banda de la componente espectral, que se lleva a cabo antes de una cuantificacion de valor entero. Considerando el error de cuantificacion en el dominio cuantificado, la relevancia psicoacustica de los segmentos espectrales se considera cuando se calcula el error de cuantificacion multibanda. Por ejemplo, para bandas de 50 frecuencias de pequena relevancia perceptiva, la cuantificacion puede ser aproximada, de modo que el error de cuantificacion absoluto (en el dominio no cuantificado) es grande. En cambio, para bandas espectrales de elevada relevancia psicoacustica, la cuantificacion es fina y el error de cuantificacion, en el dominio no cuantificado, es pequeno. Con el fin de hacer comparables los errores de cuantificacion en las bandas de frecuencias de elevada relevancia psicoacustica y de baja relevancia psicoacustica, tal como para obtener una informacion de error de 55 cuantificacion multibanda significativa, el error de cuantificacion se calcula en el dominio cuantificado (en vez de en el dominio no cuantificado) en una realizacion preferente de la invencion.
[0016] El codificador esta configurado para establecer una informacion de ganancia de banda (por ejemplo,
un factor de escala) de una banda de frecuencias, que se cuantifica a cero (por ejemplo, en que todos los 60 segmentos espectrales de la banda de frecuencias se cuantifican a cero) a un valor que representa una relation
entre una energla de la banda de frecuencias cuantificada a cero y una energla del error de cuantificacion multibanda. Estableciendo un factor de escala de una banda de frecuencias que se cuantifica a cero en un valor bien definido, es posible rellenar la banda de frecuencias cuantificada a cero con un ruido, de modo que la energla del ruido es al menos aproximadamente igual a la energla de la senal original de la banda de frecuencias cuantificada a 5 cero. Adaptando el factor de escala en el codificador, un decodificador puede tratar la banda de frecuencias cuantificada a cero de la misma manera que cualquier otra banda de frecuencias no cuantificada a cero, de modo que no hay necesidad de un tratamiento de excepcion complicado (que requiere tlpicamente una senalizacion adicional). En cambio, adaptando la informacion de ganancia de banda (por ejemplo, el factor de escala), una combinacion del valor de ganancia de banda y la informacion de error de cuantificacion multibanda permite una 10 determinacion conveniente del ruido de relleno.
[0017] En una realizacion preferente de la invention, el calculador de error de cuantificacion esta configurado para determinar el error de cuantificacion multibanda sobre una pluralidad de bandas de frecuencias que comprende al menos una componente de frecuencia (por ejemplo, un segmento de frecuencia) cuantificada a un valor no cero
15 en tanto que evitando las bandas de frecuencias enteramente cuantificadas a cero. Se ha descubierto que una informacion de error de cuantificacion multibanda es particularmente significativa si las bandas de frecuencias enteramente cuantificadas a cero se omiten del calculo. En las bandas de frecuencias enteramente cuantificadas a cero, la cuantificacion se tlpicamente muy aproximada, de modo que la informacion de error de cuantificacion obtenida de tal banda de frecuencias tlpicamente no es particularmente significativa. En cambio, el error de 20 cuantificacion en las bandas de frecuencias mas relevantes psicoacusticamente, que no estan enteramente cuantificadas a cero, proporciona una informacion mas significativa, lo cual permite un relleno de ruido adaptado a la audition humana en el lado del decodificador.
[0018] Otra realizacion segun la invencion crea un procedimiento para proporcionar un flujo de audio 25 basandose en una representation en el dominio de la transformada de la senal de audio de entrada, como se
expone en la reivindicacion independiente 3.
[0019] Una realizacion adicional segun la invencion crea un programa de ordenador para llevar a cabo el procedimiento mencionado anteriormente, como se expone en la reivindicacion independiente 4.
30
BREVE DESCRIPCION DE LOS DIBUJOS
[0020]
35 La Fig. 1 muestra un diagrama esquematico de bloques de un codificador segun una realizacion de la invencion; la Fig. 2 muestra un diagrama esquematico de bloques de un codificador segun un ejemplo;
las Figs. 3a y 3b muestran un diagrama esquematico de bloques de una codification de audio avanzada extendida (AAC) segun un ejemplo;
las Figs. 4a y 4b muestran listados de programas de pseudocodigo de algoritmos ejecutados para la codificacion de 40 una senal de audio;
la Fig. 5 muestra un diagrama esquematico de bloques de un decodificador segun un ejemplo;
la Fig. 6 muestra un diagrama esquematico de bloques de un decodificador segun otro ejemplo;
las Figs. 7a y 7b muestran un diagrama esquematico de bloques de un decodificador de AAC (codificacion de audio
avanzada) extendida segun un ejemplo;
45 la Fig. 8a muestra una representacion matematica de una cuantificacion inversa, que puede llevarse a cabo en el decodificador de AAC extendida de la Fig. 7;
la Fig. 8b muestra un listado de programas de pseudocodigo de un algoritmo para cuantificacion inversa, que puede
llevarse a cabo por el decodificador de AAC extendida de la Fig. 7;
la Fig. 8c muestra una representacion de diagrama de flujo de la cuantificacion inversa;
50 la Fig. 9 muestra un diagrama esquematico de bloques de un rellenador de ruido y un medio de reajuste de escala, que pueden utilizarse en el decodificador de AAC extendida de la Fig. 7;
la Fig. 10a muestra una representacion de codigo de pseudocodigo de programa de un algoritmo, que puede ser ejecutado por el rellenador de ruido mostrado en la Fig. 7 o por el rellenador de ruido mostrado en la Fig. 9; la Fig. 10b muestra una leyenda de elementos del pseudocodigo de programa de la Fig. 10a;
55 la Fig. 11 muestra un diagrama de flujo de un procedimiento, que puede implementarse en el rellenador de ruido de la Fig. 7 o en el rellenador de ruido de la Fig. 9;
la Fig. 12 muestra una ilustracion grafica del procedimiento de la Fig. 11;
las Figs. 13a y 13b muestran representaciones de pseudocodigo de programa de algoritmos, que pueden llevarse a cabo por el rellenador de ruido de la Fig. 7 o por el rellenador de ruido de la Fig. 9;
60 las Figs. 14a a 14d muestran representaciones de elementos de tren de bits de un flujo de audio segun un ejemplo;
y
la Fig. 15 muestra una representacion grafica de un tren de bits segun otro ejemplo.
DESCRIPCION DETALLADA DE LAS REALIZACIONES Y EJEMPLOS
5
1. Codificador
1.1 Codificador segun la Fig. 1
10 [0021] La Fig. 1 muestra un diagrama esquematico de bloques de un codificador para proporcionar un flujo
de audio basandose en la representacion en el dominio de la transformada de una senal de audio de entrada segun una realizacion de la invention.
[0022] El codificador 100 de la Fig. 1 comprende un calculador de error de cuantificacion 110 y un proveedor 15 de flujo de audio 120. El calculador de error de cuantificacion 110 esta configurado para recibir una information 112
respecto a una primera banda de frecuencias, para la cual se dispone de una informacion de ganancia de primera banda de frecuencias, y una informacion 114 acerca de una segunda banda de frecuencias, para la cual se dispone de una informacion de ganancia de segunda banda de frecuencias. El calculador de error de cuantificacion esta configurado para determinar un error de cuantificacion multibanda sobre una pluralidad de bandas de frecuencias de 20 la senal de audio de entrada, para las cuales se dispone de informacion de ganancia de banda separada. Por ejemplo, el calculador de error de cuantificacion 110 esta configurado para determinar el error de cuantificacion multibanda por la primera banda de frecuencias y la segunda banda de frecuencias utilizando la informacion 112, 114. Por consiguiente, el calculador de error de cuantificacion 110 esta configurado para proporcionar la informacion 116 que describe el error de cuantificacion multibanda al proveedor de flujo de audio 120. El proveedor de flujo de 25 audio 120 esta configurado para recibir tambien una informacion 122 que describe la primera banda de frecuencias y una informacion 124 que describe la segunda banda de frecuencias. Ademas, el proveedor de flujo de audio 120 esta configurado para proporcionar un flujo de audio 126, de modo que el flujo de audio 126 comprende una representacion de la informacion 116 y tambien una representacion del contenido de audio de la primera banda de frecuencias y de la segunda banda de frecuencias.
30
[0023] Por consiguiente, el codificador 100 proporciona un flujo de audio 126, que comprende un contenido de informacion, que permite una decodificacion eficiente del contenido de audio de la banda de frecuencias utilizando un relleno de ruido. En particular, el flujo de audio 126 proporcionado por el codificador lleva aparejado un buen compromiso entre velocidad binaria y flexibilidad de decodificacion de relleno de ruido.
35
1.2 Codificador segun la Fig. 2
1.2.1 Description general del codificador
40 [0024] En lo que viene a continuation, se describira un codificador de audio mejorado segun un ejemplo, que
esta basado en el codificador de audio descrito en la Norma Internacional ISO/IEC 14496-3: 2005(E), Tecnologla de la Informacion - Codification de Objetos Audiovisuales - Parte 3: Audio, Subparte 4: Codification General de Audio (GA) - AAC, Twin VQ, BSAC.
45 [0025] El codificador de audio 200 segun la Fig. 2 esta basado especlficamente en el codificador de audio
descrito en la norma ISO/IEC 14496-3: 2005(E), Parte 3: Audio, Subparte 4, Section 4.1. Sin embargo, el codificador de audio 200 no necesita implementar la funcionalidad exacta del codificador de audio de la norma ISO/IEC 144943: 2005(E).
50 [0026] El codificador de audio 200 puede, por ejemplo, estar configurado para recibir una senal de tiempo de
entrada 210 y para proporcionar, basandose en ello, un flujo de audio codificado 212. Un recorrido de procesamiento de senal puede comprender un reductor de muestreo opcional 220, un controlador de ganancia de AAC opcional 222, un banco de filtros de conmutacion de bloques 224, un procesamiento de senal opcional 226, un codificador de AAC extendida 228 y un formateador de cabida util de tren de bits 230. Sin embargo, el codificador 200 comprende 55 tlpicamente un modelo psicoacustico 240.
[0027] En un caso muy simple, el codificador 200 solo comprende la conmutacion de bloques/banco de filtros
224, el codificador de AAC extendida 228, el formateador de cabida util de tren de bits 230 y el modelo psicoacustico 240, mientras que los otros componentes (en particular, los componentes 220, 222, 226) deberlan considerarse 60 meramente opcionales.
[0028] En un caso simple, la conmutacion de bloques/banco de filtros 224 recibe la senal de tiempo de
entrada 210 (opcionalmente con un muestreo reducido por el reductor de muestreo 220, y opcionalmente con ganancia cambiada de escala por el controlador de ganancia de AAC 222), y proporciona, basandose en ello, una 5 representacion en el dominio de la frecuencia 224a. La representation en el dominio de la frecuencia 224a puede, por ejemplo, comprender una information que describe intensidades (por ejemplo, amplitudes o energlas) de segmentos espectrales de la senal de tiempo de entrada 210. Por ejemplo, la conmutacion de bloques/banco de filtros 224 puede estar configurada para realizar una transformada discreta del coseno modificada (MDCT) para obtener los valores en el dominio de la frecuencia de la senal de tiempo de entrada 210. La representacion en el 10 dominio de la frecuencia 224a puede ser dividida logicamente en diferentes bandas de frecuencias, que tambien se designan como “bandas de factores de escala”. Por ejemplo, se supone que la conmutacion de bloques/banco de filtros 224 proporciona valores espectrales (tambien designados como valores de segmentos de frecuencia) para un gran numero de segmentos de frecuencia diferentes. El numero de segmentos de frecuencia se determina, entre otras cosas, por la longitud de una ventana introducida en el banco de filtros 224, y tambien dependiendo de la 15 velocidad de muestreo (y la velocidad binaria). Sin embargo, las bandas de frecuencias o las bandas de factores de escala definen subconjuntos de los valores espectrales proporcionados por la conmutacion de bloques/bando de filtros. Los detalles respecto a la definition de las bandas de factores de escala resultan conocidos por los expertos en la materia, y tambien se describen en la norma ISO/IEC 14496-3: 2005(E), Parte 3, Subparte 4.
20 [0029] El codificador de AAC extendida 228 recibe los valores espectrales 224a proporcionados por la
conmutacion de bloques/banco de filtros 224 basandose en la senal de tiempo de entrada 210 (o una version preprocesada de la misma) como informacion de entrada 228a. Como puede apreciarse a partir de la Fig. 2, la informacion de entrada 228a del codificador de AAC extendida 228 puede obtenerse de los valores espectrales 224a utilizando una o mas de las etapas de procesamiento del procesamiento espectral opcional 226. Para los detalles 25 respecto a las etapas de preprocesamiento opcional del procesamiento espectral 226, se hace referencia a la norma ISO/IEC 14496-3: 2005(E), y a mas normas a las que se hace referencia en la misma.
[0030] El codificador de AAC extendida 228 esta configurado para recibir la informacion de entrada 228a en forma de valores espectrales para una pluralidad de segmentos espectrales y para proporcionar, basandose en ello,
30 una representacion cuantificada y codificada sin ruido 228b del espectro. Para este proposito, el codificador de AAC extendida 228 puede, por ejemplo, utilizar informacion obtenida de la senal de audio de entrada 210 (o una version preprocesada de la misma) utilizando el modelo psicoaustico 240. En terminos generales, el codificador de AAC extendida 228 puede utilizar una informacion proporcionada por el modelo psicoacustico 240 para decidir que exactitud deberla aplicarse para la codification de diferentes bandas de frecuencias (o banda de factores de escala) 35 de la informacion de entrada espectral 228a. Asl, el codificador de AAC extendida 228 puede adaptar en general su exactitud de cuantificacion para diferentes bandas de frecuencias a las caracterlsticas especlficas de la senal de tiempo de entrada 210, y tambien el numero de bits disponibles. Asl, el codificador de AAC extendida puede, por ejemplo, ajustar sus exactitudes de cuantificacion, de modo que la informacion que representa el espectro cuantificado y codificado sin ruido comprende una velocidad binaria (o velocidad binaria media) apropiada.
40
[0031] El formateador de cabida util de tren de bits 230 esta configurado para incluir la informacion 228b que representa los espectros cuantificados y codificados sin ruido en el flujo de audio codificado 212 segun una sintaxis predeterminada.
45 [0032] Para detalles adicionales respecto a la funcionalidad de los componentes del codificador descritos en
este documento, se hace referencia a la norma ISO/IEC 14496-3: 2005(E) (incluyendo el anexo 4.B de la misma), y tambien a la norma ISO/IEC 13818-7: 2003.
[0033] Ademas, se hace referencia a la norma ISO/IEC 13818-7: 2005, Subclausulas C1 a C9.
50
[0034] Asimismo, se hace referencia especlfica respecto a la terminologla a la norma ISO/IEC 14496-3: 2005(E), Parte 3: Audio, Subparte 1: Principal.
[0035] Ademas, se hace referencia especlfica a la norma ISO/IEC 14496-3: 2005(E), Parte 3: Audio, 55 Subparte 4: Codificacion General de Audio (GA) - AAC, Twin VQ, BSAC.
1.2.2 Detalles del codificador
[0036] En lo que viene a continuation, se describiran detalles respecto al codificador haciendo referencia a 60 las Figs. 3a, 3b, 4a y 4b.
[0037] Las Figs. 3a y 3b muestran un diagrama esquematico de bloques de un codificador de AAC extendida segun un ejemplo. El decodificador de AAC extendida se designa con 228 y puede ocupar el lugar del codificador de AAC extendida 228 de la Fig. 2. El codificador de AAC extendida 228 esta configurado para recibir, como
5 information de entrada 228a, un vector de magnitudes de llneas espectrales, en el que el vector de llneas espectrales a veces esta designado con mdct_line (0..1023). El codificador de AAC extendida 228 tambien recibe una informacion de umbral de codec 228c, que describe una energla de error admisible maximo en un nivel de MDCT. La informacion de umbral de codec 228c se proporciona tlpicamente de manera individual para diferentes bandas de factores de escala y se genera utilizando el modelo psicoacustico 240. La informacion de umbral de 10 codec 228 a veces se designa con xmin (sb), en la que el parametro sb indica la dependencia de la banda de factores de escala. El codificador de AAC extendida 228 tambien recibe una informacion de numero de bits 228d, que describe un numero de bits disponibles para codificar el espectro representado por el vector 228a de magnitudes de valores espectrales. Por ejemplo, la informacion de numero de bits 228d puede comprender una informacion de bits medios (designada con mean_bits) y una informacion de bits adicionales (designada con 15 more_bits. El codificador de AAC extendida 228 tambien esta configurado para recibir una informacion de banda de factores de escala 228e, que describe, por ejemplo, un numero y anchura de las bandas de factores de escala.
[0038] El codificador de AAC extendido comprende un cuantificador de valores espectrales 310, que esta configurado para proporcionar un vector 312 de valores cuantificados de llneas espectrales, que tambien se designa
20 con x_quant (0..1023). El cuantificador de valores espectrales 310, que incluye un cambio de escala, tambien esta configurado para proporcionar una informacion de factor de escala 314, que puede representar un factor de escala por cada banda de factores de escala y tambien una informacion de factor de escala comun. Ademas, el cuantificador de valores espectrales 310 puede estar configurado para proporcionar una informacion de utilization de bits 316, que puede describir un numero de bits utilizados para cuantificar el vector 228a de magnitudes de 25 valores espectrales. Efectivamente, el cuantificador de valores espectrales 310 esta configurado para cuantificar diferentes valores espectrales del vector 228a con diferentes exactitudes dependiendo de la relevancia psicoacustica de los diferentes valores espectrales. Para este proposito, el cuantificador de valores espectrales 210 cambia de escala de los valores espectrales del vector 228a utilizando diferentes factores de escala dependientes de la banda de factores de escala y cuantifica los valores espectrales cambiados de escala resultantes. Tlpicamente, los valores 30 espectrales asociados con bandas de factores de escala importantes psicoacusticamente seran cambiados de escala con grandes factores de escala, de modo que los valores espectrales cambiados de escala de bandas de factores de escala importantes psicoacusticamente abarquen un gran intervalo de valores. En cambio, los valores espectrales de bandas de factores de escala menos importantes psicoacusticamente son cambiados de escala con factores de escala mas pequenos, de modo que los valores espectrales cambiados de escala de las bandas de 35 factores de escala menos importantes psicoacusticamente abarcan solo un intervalo mas de valores mas pequeno. Los valores espectrales cambiados de escala se cuantifican entonces, por ejemplo, a un valor entero. En esta cuantificacion, muchos de los valores espectrales cambiados de escala de las bandas de factores de escala menos importantes psicoacusticamente se cuantifican a cero, porque los valores espectrales de las bandas de factores de escala menos importantes psicoacusticamente se cambian de escala solo con un factor de escala pequeno.
40
[0039] Como resultado, puede decirse que los valores espectrales de las bandas de factores de escala mas relevantes psicoacusticamente se cuantifican con elevada exactitud (porque las llneas espectrales cambiadas de escala de dichas bandas de factores de escala mas relevantes abarcan un gran intervalo de valores y, por lo tanto, muchas etapas de cuantificacion), mientras que los valores espectrales de las bandas de factores de escala menos
45 importantes psicoacusticamente se cuantifican con exactitud de cuantificacion mas baja (porque los valores espectrales cambiados de escala de las bandas de factores de escala menos importantes abarcan un intervalo de valores mas pequeno y, por lo tanto, se cuantifican a etapas de cuantificacion menos diferentes).
[0040] El cuantificador de valores espectrales 310 esta configurado tlpicamente para determinar factores de 50 cambio de escala apropiados utilizando el umbral de codec 228c y la informacion de numero de bits 228d.
Tlpicamente, el cuantificador de valores espectrales 310 tambien esta configurado para determinar los factores de escala apropiados por si mismo. Los detalles respecto a una posible implementation del cuantificador de valores espectrales 310 se describen en la norma ISO/IEC 14496-3: 2001, Capltulo 4.B.10. Ademas, la implementacion del cuantificador de valores espectrales resulta bien conocida para un experto en la materia de la codification MPEG4.
55
[0041] El codificador de AAC extendida 228 tambien comprende un calculador de error de cuantificacion multibanda 330, que esta configurado para recibir, por ejemplo, el vector 228a de magnitudes de valores espectrales, el vector 312 de valores cuantificados de llneas espectrales y la informacion de factor de escala 314. El calculador de error de cuantificacion multibanda 330 esta configurado, por ejemplo, para determinar una desviacion
60 entre una version cambiada de escala no cuantificada de los valores espectrales del vector 228a (por ejemplo,
cambada de escala utilizando una operacion de cambio de escala no lineal y un factor de escala) y una version cambiada de escala y cuantificada (por ejemplo, cambiada de escala utilizando una operacion de cambio de escala no lineal y un factor de escala, y cuantificada utilizando una operacion de redondeo a “entero”) de los valores espectrales. Ademas, el calculador de error de cuantificacion multibanda 330 puede estar configurado para calcular 5 un error medio de cuantificacion sobre una pluralidad de bandas de factores de escala. Cabe destacar que el calculador de error de cuantificacion multibanda 330 calcula preferentemente el error de cuantificacion multibanda en un dominio cuantificado (mas exactamente en un dominio cambiado de escala psicoacusticamente), de modo que se pone de relieve el peso de un error de cuantificacion en bandas de factores de escala relevantes psicoacusticamente cuando se compara con un error de cuantificacion en bandas de factores de escala menos relevantes 10 psicoacusticamente. Los detalles respecto a la operacion del calculador de error de cuantificacion multibanda se describiran posteriormente haciendo referencia a las Figs. 4a y 4b.
[0042] El codificador de AAC extendida 328 tambien comprende un adaptador de factor de escala 340, que esta configurado para recibir el vector 312 de valores cuantificados, la informacion de factor de escala 314 y tambien
15 la informacion de error de cuantificacion multibanda 332, proporcionada por el calculador de error de cuantificacion multibanda 340. El adaptador de factor de escala 340 esta configurado para identificar bandas de factores de escala, que se “cuantifican a cero”, es decir, bandas de factores de escala para las cuales todos los valores espectrales (o llneas espectrales) se cuantifican a cero. Para tales bandas de factores de escala cuantificadas enteramente a cero, el adaptador de factor de escala 340 adapta el factor de escala respectivo. Por ejemplo, el adaptador de factor de 20 escala 340 puede establecer el factor de escala de una banda de factores de escala cuantificada enteramente a cero en un valor que representa una relacion entre una energla residual (antes de la cuantificacion) de la banda de factores de escala respectiva y una energla del error de cuantificacion multibanda 334. Por consiguiente, el adaptador de factor de escala 340 proporciona factores de escala adaptados 342. Cabe destacar que tanto los factores de escala proporcionados por el cuantificador de valores espectrales 310 como los factores de escala 25 adaptados proporcionados por el adaptador de factor de escala se designan con “factor de escala (sb)”, “scf[band]”, “sf[g][sfb]”, “scf[g][sfb]” en la bibliografla y tambien dentro de esta solicitud. Los detalles respecto al funcionamiento del adaptador de factor de escala 340 se describiran posteriormente haciendo referencia a las Figs. 4a y 4b.
[0043] El codificador de AAC extendida 228 tambien comprende una codificacion sin ruido 350, que se
30 explica, por ejemplo, en la norma ISO/IEC 14496-3: 2001, Capltulo 4.B.11. En resumen, la codificacion sin ruido 350
recibe el vector de valores cuantificados de llneas espectrales (tambien designado como “valores cuantificados de los espectros”) 312, la representacion entera 342 de los factores de escala (o bien proporcionada por el cuantificador de valores espectrales 310, o bien adaptada por el adaptador de factor de escala 340), y tambien un parametro de relleno de ruido 332 (por ejemplo, en forma de una informacion de nivel de ruido) proporcionado por el calculador de 35 error de cuantificacion multibanda 330.
[0044] La codificacion sin ruido 350 comprende una codificacion de coeficientes espectrales 350a para codificar los valores cuantificados 312 de las llneas espectrales, y para proporcionar valores cuantificados y codificados 352 de las llneas espectrales. Los detalles respecto a la codificacion de coeficientes espectrales se
40 describen, por ejemplo, en las secciones 4.B.11.2, 4.B.11.3, 4.B.11.4 y 4.B.11.6 de la norma ISO/IEC 14496-3: 2001. La codificacion sin ruido 350 tambien comprende una codificacion de factor de escala 350b para codificar la representacion entera 342 del factor de escala para obtener una informacion de factor de escala codificado 354. La codificacion sin ruido 350 tambien comprende una codificacion de parametros de relleno de ruido 350c para codificar el uno o mas parametros de relleno de ruido 332, para obtener uno o mas parametros de relleno de ruido codificados 45 356. En consecuencia, el codificador de AAC extendida proporciona una informacion que describe los espectros cuantificados como codificados sin ruido, en la que esta informacion comprende valores cuantificados y codificados de las llneas espectrales, informacion de factor de escala codificado e informacion de parametros de relleno de ruido codificados.
50 [0045] En lo que viene a continuation, se describira la funcionalidad del calculador de error de cuantificacion
multibanda 330 y del adaptador de factor de escala 340, que son componentes clave del codificador de AAC extendida 228, haciendo referencia a las Figs. 4a y 4b. Para este proposito, la Fig. 4a muestra un listado de programa de un algoritmo llevado a cabo por el calculador de error de cuantificacion multibanda 330 y el adaptador de factor de escala 340.
55
[0046] Una primera parte del algoritmo, representada por las llneas 1 a 12 del pseudocodigo de la Fig. 4a,
comprende un calculo de un error medio de cuantificacion, que se lleva a cabo por el calculador de error de cuantificacion multibanda 330. El calculo del error medio de cuantificacion se lleva a cabo, por ejemplo, por todas las bandas de factores de escala, excepto aquellas que se cuantifican a cero. Si una banda de factores de escala esta 60 cuantificada enteramente a cero (es decir, todas las llneas espectrales de la banda de factores de escala se
cuantifican a cero), dicha banda de factores de escala se omite para el calculo del error medio de cuantificacion. Si, sin embargo, una banda de factores de escala no se cuantifica enteramente a cero (es decir, comprende al menos una llnea espectral, que no se cuantifica a cero), todas las llneas espectrales de dicha banda de factores de escala se consideran para el calculo del error medio de cuantificacion. El error medio de cuantificacion se calcula en un 5 dominio cuantificado (o, mas exactamente, en un dominio cambiado de escala). El calculo de una contribucion al error promedio puede apreciarse en la llnea 7 del pseudocodigo de la Fig. 4a. En particular, la llnea 7 muestra la contribucion de una sola llnea espectral al error promedio, en la que el promediado se lleva a cabo por todas las llneas espectrales (en la que nLines indica el numero de llneas consideradas totales).
10 [0047] Como puede apreciarse en la llnea 7 del pseudocodigo, la contribucion de una llnea espectral al error
promedio es el valor absoluto (operador “fabs”) de una diferencia entre un valor de magnitud de llnea espectral no cuantificada cambiada de escala y un valor de magnitud de llnea espectral cuantificada cambiada de escala. En el valor de magnitud de llnea espectral no cuantificada cambiada de escala, la “llnea” de valor de magnitud (que puede ser igual a mdct_line) se cambia de escala de manera no lineal utilizando una funcion de potencia (pow(line, 0.75) = 15 line075) y utilizando un factor de escala (por ejemplo, un factor de escala 314 proporcionado por el cuantificador de valores espectrales 310). En el calculo del valor de magnitud de llnea espectral cuantificada cambiada de escala, la “llnea” de valor de magnitud de llnea espectral puede cambiarse de escala de manera no lineal utilizando las funciones de potencia mencionadas anteriormente y cambiarse de escala utilizando el factor de escala mencionado anteriormente. El resultado de este cambio de escala no lineal y lineal puede cuantificarse utilizando un operador 20 entero (“INT”). Utilizando el calculo tal como se indica en la llnea 7 del pseudocodigo, se considera el diferente impacto de la cuantificacion sobre las bandas de frecuencias mas importantes psicoacusticamente y las menos importantes psicoacusticamente.
[0048] Despues del calculo del error de cuantificacion (promedio) multibanda (avgError), el error de 25 cuantificacion promedio puede cuantificarse opcionalmente, tal como se muestra en las llneas 13 y 14 del
pseudocodigo. Cabe destacar que la cuantificacion del error de cuantificacion multibanda tal como aqul se muestra esta adaptado especlficamente al intervalo esperado de valores y las caracterlsticas estadlsticas del error de cuantificacion, de modo que el error de cuantificacion puede representarse de manera eficiente en cuanto a bits. Sin embargo, pueden aplicarse otras cuantificaciones del error de cuantificacion multibanda.
30
[0049] Una tercera parte del algoritmo, que se representa en las llneas 15 a 25, puede ser ejecutada por el adaptador de factor de escala 340. La tercera parte del algoritmo sirve para establecer factores de escala de bandas de frecuencias de factor de escala, que han sido cuantificadas enteramente a cero, en un valor bien definido, lo cual permite un relleno de ruido sencillo, lo cual lleva aparejada una buena impresion de audicion. La tercera parte del
35 algoritmo comprende opcionalmente una cuantificacion inversa del nivel de ruido (por ejemplo, representada por el error de cuantificacion multibanda 332). La tercera parte del algoritmo tambien comprende un calculo de un valor de factor de escala de reemplazo para las bandas de factores de escala cuantificadas a cero (mientras que los factores de escala de las bandas de factores de escala no cuantificadas a cero se dejaran sin cambios). Por ejemplo, el valor de factor de escala de reemplazo para una cierta banda de factores de escala (“band”) se calcula utilizando la 40 ecuacion mostrada en la llnea 20 del algoritmo de la Fig. 4a. En esta ecuacion, “(INT)” representa un operador entero, “2.f” representa el numero 2 en una representacion en coma flotante, “log” designa un operador logarltmico, “energy” designa una energla de la banda de factores de escala en consideracion (antes de la cuantificacion), “(float)” designa un operador en coma flotante, “sfbWidth” designa una anchura de la cierta banda de factores de escala en terminos de llneas espectrales (o segmentos espectrales), y “noiseVal” designa un valor de ruido que 45 describe el error de cuantificacion multibanda. En consecuencia, el factor de escala de reemplazo describe una relacion entre una energla promedio por segmento de energla (energy/sfbWidth) de las ciertas bandas de factores de escala en consideracion, y una energla (noiseVal2) del error de cuantificacion multibanda.
1.2.3 Conclusion del codificador 50
[0050] Las realizaciones segun la invencion crean un codificador que tiene un nuevo tipo de calculo de nivel de ruido. El nivel de ruido se calcula en el dominio cuantificado basandose en el error de cuantificacion promedio.
[0051] Calcular el error de cuantificacion en el dominio cuantificado lleva aparejadas ventajas significativas, 55 por ejemplo, porque se considera la relevancia psicoacustica de diferentes bandas de frecuencias (bandas de
factores de escala). El error de cuantificacion por llnea (es decir, por llnea espectral, o segmento espectral) en el dominio cuantificado esta tlpicamente en el intervalo [-0,5; 0,5] (nivel de cuantificacion 1) con un error absoluto promedio de 0,25 (para valores de entrada de distribucion normal que normalmente son mayores que 1). Utilizando un codificador, que proporciona informacion acerca de un error de cuantificacion multibanda, las ventajas del relleno 60 de ruido en el dominio cuantificado pueden aprovecharse en un codificador, tal como se describira posteriormente.
[0052] El calculo del nivel de ruido y la deteccion de sustitucion de ruido en el codificador puede comprender las siguientes etapas:
5 • Detectar y marcar las bandas espectrales que pueden reproducirse perceptivamente equivalentes en el decodificador por sustitucion de ruido. Por ejemplo, para este proposito puede comprobarse una tonalidad o una medicion de planicidad espectral;
• Calcular y cuantificar el error medio de cuantificacion (que puede calcularse por todas las bandas de factores de escala no cuantificadas a cero); y
10 • Calcular el factor de escala (scf) para una banda cuantificada a cero de modo que el ruido introducido (por el decodificador) coincida con la energla original.
[0053] Una cuantificacion de nivel de ruido apropiada puede ayudar a producir el numero de bits requeridos para transportar la informacion que describe el error de cuantificacion multibanda. Por ejemplo, el nivel de ruido
15 puede cuantificarse en 8 niveles de cuantificacion en el dominio logarltmico, teniendo en cuenta la percepcion humana de la sonoridad. Por ejemplo, puede utilizarse el algoritmo mostrado en la Fig. 4b, en el que “(INT)” designa un operador entero, en el que “LD” designa una operacion logarltmica para una base 2, y en el que “meanLineError” designa un error de cuantificacion por llnea de frecuencia. “min(.,.)” designa un operador de valor mlnimo, y “max(.,.)” designa un operador de valor maximo.
20
2. Decodificador
2.1. Decodificador segun la Fig. 5
25 [0054] La Fig. 5 muestra un diagrama esquematico de bloques de un decodificador segun un ejemplo. El
decodificador 500 esta configurado para recibir una informacion de audio codificada, por ejemplo, en forma de un flujo de audio codificado 510, y para proporcionar, basandose en ello, una representacion decodificada de la senal de audio, por ejemplo, basandose en componentes espectrales 522 de una primera banda de frecuencias y componentes espectrales 524 de una segunda banda de frecuencias. El decodificador 500 comprende un rellenador 30 de ruido 520, que esta configurado para recibir una representacion 522 de componentes espectrales de una primera banda de frecuencias, a la cual se asocia informacion de ganancia de primera banda de frecuencias, y una representacion 524 de componentes espectrales de una segunda banda de frecuencias, a la cual se asocia informacion de ganancia de segunda banda de frecuencias. Ademas, el rellenador de ruido 520 esta configurado para recibir una representacion 526 de un valor de intensidad de ruido multibanda. Ademas, el rellenador de ruido 35 esta configurado para introducir ruido en componentes espectrales (por ejemplo, en valores de llneas espectrales o valores de segmentos espectrales) de una pluralidad de bandas de frecuencias a las cuales se asocia informacion de ganancia de banda de frecuencias separada (por ejemplo, en forma de factores de escala) basandose en el valor de intensidad de ruido multibanda comun 526. Por ejemplo, el rellenador de ruido 520 puede estar configurado para introducir ruido en las componentes espectrales 522 de la primera banda de frecuencias para obtener las 40 componentes espectrales afectadas por ruido 512 de la primera banda de frecuencias, y tambien para introducir ruido en las componentes espectrales 524 de la segunda banda de frecuencias para obtener las componentes espectrales afectadas por ruido 514 de la segunda banda de frecuencias.
[0055] Aplicando el ruido descrito por un solo valor de intensidad de ruido multibanda 526 a componentes
45 espectrales de diferentes bandas de frecuencias a las que se asocia informacion de ganancia de diferentes bandas de frecuencias, puede introducirse ruido en las diferentes bandas de frecuencias de manera muy afinada, teniendo en cuenta la diferente relevancia psicoacustica de una banda de frecuencias diferente, que se expresa por la informacion de ganancia de banda de frecuencias. Asl, el decodificador 500 es capaz de llevar a cabo un relleno de ruido afinado basandose en una informacion colateral de relleno de ruido muy pequena (eficiente en cuanto a bits).
50
2.2 Decodificador segun la Fig. 6
2.2.1 Descripcion general del decodificador
55 [0056] La Fig. 6 muestra un diagrama esquematico de bloques de un decodificador 600 segun un ejemplo.
[0057] El decodificador 600 es similar al decodificador descrito en la norma ISO/IEC 14496.3: 2005 (E), de
modo que se hace referencia a esta norma internacional. El decodificador 600 esta configurado para recibir un flujo de audio codificado 610 y para proporcionar, basandose en ello, senales de tiempo de salida 612. El flujo de audio 60 codificado puede comprender alguna o toda la informacion descrita en la norma ISO/IEC 14496.3: 2005 (E), y
comprende adicionalmente informacion que describe un valor de intensidad de ruido multibanda. El decodificador 600 comprende ademas un deformateador de cabida util de tren de bits 620, que esta configurado para extraer del flujo de audio codificado 610 una pluralidad de parametros de audio codificados, algunos de los cuales se explicaran en detalle en lo que viene a continuacion. El decodificador 600 comprende ademas un decodificador de “codificacion 5 de audio avanzada” (AAC) extendida 630, cuya funcionalidad se describira en detalle, haciendo referencia a las Figs. 7a, 7b, 8a a 8c, 9, l0a, 10b, 11, 12, 13a y 13b. El decodificador de AAC extendida 630 esta configurado para recibir una informacion de entrada 630a, que comprende, por ejemplo, una informacion de llneas espectrales cuantificadas y codificadas, una informacion de factor de escala codificado y una informacion de parametros de relleno de ruido codificados. Por ejemplo, la informacion de entrada 630a del codificador de AAC extendida 630 puede ser identica a 10 la informacion de salida 228b proporcionada por el codificador de AAC extendida 220a descrita con referencia a la Fig. 2.
[0058] El decodificador de AAC extendida 630 puede estar configurado para proporcionar, basandose en la informacion de entrada 630a, una representation 630b de un espectro cambiado de escala y cuantificado
15 inversamente, por ejemplo, en forma de valores de llneas espectrales cambiadas de escala, cuantificadas inversamente para una pluralidad de segmentos de frecuencia (por ejemplo, para 1024 segmentos de frecuencia).
[0059] Opcionalmente, el decodificador 600 puede comprender decodificadores de espectro adicionales, como, por ejemplo, un decodificador de espectro TwinVQ y/o un decodificador de espectro BSAC, que pueden
20 utilizarse alternativamente al decodificador de espectro de AAC extendida 630 en algunos casos.
[0060] El decodificador 600 puede comprender opcionalmente un procesamiento de espectro 640, que esta configurado para procesar la informacion de salida 630b del decodificador de AAC extendida 630 con el fin de obtener una informacion de entrada 640a de una conmutacion de bloques/banco de filtros 640. El procesamiento
25 espectral opcional 630 puede comprender una o mas, o incluso todas las funcionalidades M/S, PNS, prediction, intensidad, prediccion a largo plazo, acoplamiento conmutado dependientemente, TNS, acoplamiento conmutado dependientemente, funcionalidades que se describen en detalle en la norma ISO/IEC 14493.3: 2005 (E) y los documentos a los que se hace referencia en la misma. Si, sin embargo, se omite el procesamiento espectral 630, la informacion de salida 630b del decodificador de AAC extendida 630 puede servir directamente como informacion de 30 entrada 640a de la conmutacion de bloques/banco de filtros 640. Asl, el decodificador de AAC extendida 630 puede proporcionar, como la informacion de salida 630b, espectros cambiados de escala y cuantificados inversamente. La conmutacion de bloques/banco de filtros 640 utiliza, como la informacion de entrada 640a, los espectros cuantificados inversamente (opcionalmente preprocesados) y proporciona, basandose en ello, una o mas senales de audio reconstruidas en el dominio del tiempo como informacion de salida 640b. El banco de filtros/conmutacion de 35 bloques puede, por ejemplo, estar configurado para aplicar la inversa de la correspondencia de frecuencia que se llevo a cabo en el codificador (por ejemplo, en la conmutacion de bloques/banco de filtros 224). Por ejemplo, puede utilizarse una transformada inversa del coseno discreta modificada (iMDCT) por el banco de filtros. Por ejemplo, la IMDCT puede estar configurada para soportar o bien un conjunto de 120, 128, 480, 512, 960 o 1024, o bien cuatro conjuntos de 32 o 256 coeficientes espectrales.
40
[0061] Para obtener detalles, se hace referencia, por ejemplo, a la Norma Internacional ISO/IEC 14496-3: 2005 (E). El decodificador 600 puede comprender ademas opcionalmente un control de ganancia de AAC 650, un decodificador de SBR 652 y un acoplamiento conmutado independientemente 654, para obtener la senal de tiempo de salida 612 a partir de la senal de salida 640b de la conmutacion de bloques/banco de filtros 640.
45
[0062] Sin embargo, la senal de salida 640b de la conmutacion de bloques/banco de filtros 640 tambien puede servir como la senal de tiempo de salida 612 en ausencia de la funcionalidad 650, 652, 654.
2.2.2 Detalles del decodificador de AAC extendida 50
[0063] En lo que viene a continuacion, se describiran detalles respecto al decodificador de AAC extendida, haciendo referencia a las Figs. 7a y 7b. Las Figs. 7a y 7b muestran un diagrama esquematico de bloques del decodificador de AAC de la Fig. 6 en combination con el deformateador de cabida util de tren de bits 620 de la Fig. 6.
55
[0064] El deformateador de cabida util de flujo de bits 620 recibe un flujo de audio decodificado 610, que puede comprender, por ejemplo, un flujo de datos de audio codificado que comprende un elemento de sintaxis con
el tltulo “ac_raw_data_block”, que es un bloque de datos sin procesar del codificador de audio. Sin embargo, el formateador de cabida util de tren de bits 620 esta configurado para proporcionar al decodificador de AAC extendida 60 630 un espectro cuantificado y codificado sin ruido o una representacion, que comprende una informacion de llneas
espectrales cuantificadas y codificadas aritmeticamente 630aa (por ejemplo, designada como ac_spectral_data), una informacion de factor de escala 630ab (por ejemplo, designada como scale_factor_data) y una informacion de parametros de relleno de ruido 630ac. La informacion de parametros de relleno de ruido 630ac comprende, por ejemplo, un valor de compensacion de ruido (designado como noise_offset) y un valor de nivel de ruido (designado 5 como noise_level).
[0065] Con respecto al decodificador de AAC extendida, cabe destacar que el decodificador de AAC extendida 630 es muy similar al decodificador de AAC de la Norma Internacional ISO/IEC 19496-3: 2005 (E), de modo que se hace referencia a la descripcion detallada en dicha Norma.
10
[0066] El decodificador de AAC extendida 630 comprende un decodificador de factor de escala 740 (tambien designado como herramienta de decodificacion sin ruido de factor de escala) que esta configurado para recibir la informacion de factor de escala 630ab y para proporcionar, basandose en ello, una representacion entera decodificada 742 de los factores de escala (la cual tambien se designa como sf[g] [sfb] o scf[g] [sfb]). Con respecto
15 al decodificador de factor de escala 740, se hace referencia a la norma ISO/IEC 14496-3: 2005, Capltulos 4.6.2 y
4.6.3. Cabe destacar que la representacion entera decodificada 742 de los factores de escala refleja una exactitud de cuantificacion con la cual se cuantifican diferentes bandas de frecuencias (tambien designadas como bandas de factores de escala) de una senal de audio. Los factores de escala mas grandes indican que las bandas de factores de escala correspondientes se han cuantificado con una exactitud elevada, y los factores de escala mas pequenos
20 indican que las bandas de factores de escala correspondientes se han cuantificado con exactitud baja.
[0067] El decodificador de AAC extendida 630 tambien comprende un decodificador espectral 750 que esta configurado para recibir la informacion de llneas espectrales cuantificadas y codificadas por entropla (por ejemplo, codificadas segun Huffman o codificadas aritmeticamente) 630aa y para proporcionar, basandose en ello, valores
25 cuantificados 752 del uno o mas espectros (por ejemplo, designados como x_ac_quant o x_quant). Con respecto al decodificador espectral, se hace referencia, por ejemplo, a la seccion 4.6.3 de la Norma Internacional anteriormente mencionada. Sin embargo, se pueden aplicar naturalmente implementaciones alternativas del decodificador espectral. Por ejemplo, el decodificador Huffman de la norma ISO/IEC 14496-3: 2005 puede ser reemplazado por un decodificador aritmetico si la informacion de llneas espectrales 630aa se codifica aritmeticamente.
30
[0068] El decodificador de AAC extendida 630 comprende ademas un cuantificador inverso 760, que puede ser un cuantificador inverso no uniforme. Por ejemplo, el cuantificador inverso 760 puede proporcionar valores espectrales cuantificados inversamente no cambiados de escala 762 (por ejemplo, designados con x_ac_invquant o x_invquant). Por ejemplo, el cuantificador inverso 760 puede comprender la funcionalidad descrita en la norma
35 ISO/IEC 14496-3: 2005, Capltulo 4.6.2. Alternativamente, el cuantificador inverso 760 puede comprender la funcionalidad descrita con referencia a las Figs. 8a a 8c.
[0069] El decodificador de AAC extendida 630 tambien comprende un rellenador de ruido 770 (tambien designado como herramienta de relleno de ruido), el cual recibe la representacion entera decodificada 742 de los
40 factores de escala procedente del decodificador de factor de escala 740, los valores espectrales cuantificados inversamente sin cambiar de escala 762 procedentes del cuantificador inverso 760 y la informacion de parametros de relleno de ruido 630ac procedente del deformateador de cabida util de tren de bits 620. El rellenador de ruido esta configurado para proporcionar, basandose en ello, la representacion modificada (tlpicamente entera) 772 de los factores de escala, la cual tambien esta designada en este documento con sf[g] [sfb] o scf[g] [sfb]. El rellenador de
45 ruido 770 tambien esta configurado para proporcionar valores espectrales cuantificados inversamente no cambiados de escala 774, tambien designados como x_ac_invquant o x_invquant basandose en su informacion de entrada. Los detalles con respecto a la funcionalidad del rellenador de ruido se describiran posteriormente, haciendo referencia a las Figs. 9, 10a, 10b, 11, 12, 13a y 13b.
50 [0070] El decodificador de AAC extendida 630 tambien comprende un medio de reajuste de escala 780, que
esta configurado para recibir la representacion entera modificada de los factores de escala 772 y los valores espectrales cuantificados inversamente no cambiados de escala 774, y para proporcionar, basandose en ello, valores espectrales cuantificados inversamente cambiados de escala 782, que tambien pueden designarse como x_rescal, y los cuales pueden servir como la informacion de salida 630b del decodificador de AAC extendida 630. El
55 medio de reajuste de escala 780 puede comprender, por ejemplo, la funcionalidad que se describe en la norma ISO/IEC 14496-3: 2005, Capltulo 4.6.2.3.3.
2.2.3. Cuantificador inverso
60 [0071] En lo que viene a continuation, se describira la funcionalidad del cuantificador inverso 760, haciendo
referenda a las Figs. 8a, 8b, y 8c. La Fig. 8a muestra una representacion de una ecuacion para obtener los valores espectrales cuantificados inversamente no cambiados de escala 762 a partir de los valores espectrales cuantificados 752. En las ecuaciones alternativas de la Fig. 8a, “sign(.)” designa un operador de signo, y “.” designa un operador de valor absoluto. La Fig. 8b muestra un pseudocodigo de programa que representa la funcionalidad del 5 cuantificador inverso 760. Como puede apreciarse, se lleva a cabo la cuantificacion inversa segun la regla de correspondencia matematica mostrada en la Fig. 8a para todos los grupos de ventanas (designados por la variable en curso g), para todas las bandas de factores de escala (designadas por la variable en curso sfb), para todas las ventanas (designadas por el Indice en curso win) y todas las llneas espectrales (o segmentos espectrales) (designadas por la variable en curso bin). La Fig. 8c muestra una representacion de diagrama de flujo del algoritmo 10 de la Fig. 8b. Para las bandas de factores de escala por debajo de una banda de factores de escala maxima predeterminada (designada con max_sfb), se obtienen los valores espectrales cuantificados inversamente no cambiados de escala como una funcion de los valores espectrales cuantificados no cambiados de escala. Se aplica una regla de cuantificacion inversa no lineal.
15 2.2.4 Rellenador de ruido
2.2.4.1 Rellenador de ruido segun las Figs. 9 a 12
[0072] La Fig. 9 muestra un diagrama de bloques esquematico de un rellenador de ruido 900 segun un 20 ejemplo. El rellenador de ruido 900 puede, por ejemplo, ocupar el lugar del rellenador de ruido 770 descrito con
referencia a las Figs. 7A y 7B.
[0073] El rellenador de ruido 900 recibe la representacion entera decodificada 742 de los factores de escala, que pueden considerarse como valores de ganancia de banda de frecuencias. El rellenador de ruido 900 tambien
25 recibe los valores espectrales cuantificados inversamente no cambiados de escala 762. Ademas, el rellenador de ruido 900 recibe la informacion de parametros de relleno de ruido 630ac, que comprende, por ejemplo, los parametros de relleno de ruido noise_value y noise_offset. Ademas, el rellenador de ruido 900 proporciona la representacion entera modificada 772 de los factores de escala y los valores espectrales cuantificados inversamente no cambiados de escala 774. El rellenador de ruido 900 comprende un detector de llneas espectrales cuantificadas 30 a cero 910, que esta configurado para determinar si una llnea espectral (o segmento espectral) esta cuantificada a cero (y posiblemente cumple requisitos de relleno de ruido adicionales). Para este proposito, el detector de llneas espectrales cuantificadas a cero 910 recibe directamente los espectros cuantificados inversamente no cambiados de escala 762 como informacion de entrada. El rellenador de ruido 900 comprende ademas un dispositivo de reemplazo selectivo de llneas espectrales 920, que esta configurado para reemplazar selectivamente los valores espectrales de 35 la informacion de entrada 762 por los valores de reemplazo de llneas espectrales 922 dependiendo de la decision del detector de llneas espectrales cuantificadas a cero 910. De ese modo, el detector de llneas espectrales cuantificadas a cero 910 indica que una cierta llnea espectral de la informacion de entrada 762 deberla ser reemplazada por un valor de reemplazo, entonces el dispositivo de reemplazo selectivo de llneas espectrales 920 reemplaza la cierta llnea espectral con el valor de reemplazo de las llneas espectrales 922 para obtener la 40 informacion de salida 774. Si no, el dispositivo de reemplazo selectivo de llneas espectrales 920 transmite el valor de la cierta llnea espectral sin cambio para obtener la informacion de salida 774. El rellenador de ruido 900 tambien comprende un modificador selectivo de factores de escala 930, que esta configurado para modificar selectivamente los factores de escala de la informacion de entrada 742. Por ejemplo, el modificador selectivo de factores de escala 930 esta configurado para incrementar los factores de escala de las bandas de frecuencias de factores de escala, 45 que han sido cuantificadas a cero por un valor predeterminado, que se designa como “noise_offset”. De ese modo
en la informacion de salida 772, los factores de escala de las bandas de frecuencias cuantificadas a cero se
incrementan en comparacion con los valores de factores de escala correspondientes dentro de la informacion de entrada 742. En cambio, los valores de factores de escala correspondientes de las bandas de frecuencias de factores de escala, que no se cuantifican a cero, son identicos en la informacion de entrada 742 y en la informacion 50 de salida 772.
[0074] Para determinar si una banda de frecuencias de factores de escala esta cuantificada a cero, el rellenador de ruido 900 tambien comprende un detector de bandas cuantificadas a cero 940, que esta configurado para controlar el modificador selectivo de factores de escala 930 proporcionando una senal o un indicador de
55 “permitir modificacion de factores de escala” 942 basandose en la informacion de entrada 762. Por ejemplo, el
detector de bandas cuantificadas a cero 940 puede proporcionar una senal o un indicador que indica la necesidad de
un incremento de un factor de escala al modificador selectivo de factores de escala 930 si todos los segmentos de frecuencia (tambien designadas como segmentos espectrales) de una banda de factores de escala estan cuantificados a cero.
[0075] Cabe destacar aqul que el modificador selectivo de factores de escala tambien puede adoptar la forma de un dispositivo de reemplazo selectivo de factores de escala, que esta configurado para establecer los factores de escala de las bandas de factores de escala cuantificadas enteramente a cero en un valor predeterminado, independientemente de la information de entrada 742.
5
[0076] En lo que viene a continuation, se describira un medio de reajuste de escala 950, que puede adoptar la funcion del medio de reajuste de escala 780. El medio de reajuste de escala 950 esta configurado para recibir la representation entera modificada 772 de los factores de escala proporcionados por el rellenador de ruido y tambien para los valores espectrales cuantificados inversamente no cambiados de escala 774 proporcionados por el
10 rellenador de ruido. El medio de reajuste de escala 950 comprende un computador de ganancia de factores de escala 960, que esta configurado para recibir una representacion entera del factor de escala por banda de factores de escala y para proporcionar un valor de ganancia por banda de factores de escala. Por ejemplo, el computador de ganancia de factores de escala 960 puede estar configurada para calcular un valor de ganancia 962 para una banda de frecuencias i-esima basandose en una representacion entera modificada 772 del factor de escala para la banda 15 de factores de escala i-esima. De ese modo, el computador de ganancia de los factores de escala 960 proporciona valores de ganancia individuales para las diferentes bandas de factores de escala. El medio de reajuste de escala 950 tambien comprende un multiplicador 970, que esta configurado para recibir los valores de ganancia 962 y los valores espectrales cuantificados inversamente no cambiados de escala 774. Cabe destacar que cada uno de los valores espectrales cuantificados inversamente no cambiados de escala 774 esta asociado con una banda de 20 frecuencias de factores de escala (sfb). Por consiguiente, el multiplicador 970 esta configurado para cambiar la escala de cada uno de los valores espectrales cuantificados inversamente no cambiados de escala 774 con un valor de ganancia correspondiente asociado con la misma banda de factores de escala. En otras palabras, todos los valores espectrales cuantificados inversamente no cambiados de escala 774 asociados con una banda de factores de escala dada se cambian de escala con el valor de ganancia asociado con la banda de factores de escala dada. 25 Por consiguiente, los valores espectrales cuantificados inversamente no cambiados de escala asociados con bandas de factores de escala diferentes se cambian de escala tlpicamente con diferentes valores de ganancia asociados con diferentes bandas de factores de escala.
[0077] De este modo, los diferentes valores espectrales cuantificados inversamente no cambiados de escala 30 se cambian de escala con diferentes valores de ganancia, dependiendo de a que bandas de factores de escala
estan asociados.
Representacion de pseudocodigo de programa
35 [0078] En lo que viene a continuacion, se describira la funcionalidad del rellenador de ruido 900 haciendo
referencia a las Figs. 10A y 10B, las cuales muestran una representacion de pseudocodigo de programa (Fig. 10A) y una leyenda correspondiente (Fig. 10B). Los comentarios empiezan con “- -“.
[0079] El algoritmo de relleno de ruido representado por el listado del pseudocodigo de programa de la Fig. 40 10 comprende una primera parte (llneas 1 a 8) para obtener un valor de ruido (noiseVal) a partir de una
representacion de nivel de ruido (noise_level). Ademas, se obtiene una compensation de ruido (noise_offset). La obtencion del valor de ruido a partir del nivel de ruido comprende un cambio de escala no lineal, en el que el valor de ruido se calcula segun:
45 noiseVal = 2((noise_level-14)/3).
[0080] Ademas, se lleva a cabo un desplazamiento de intervalo del valor de compensacion de ruido de modo que el valor de compensacion de ruido de intervalo desplazado puede adoptar valores positivos y negativos.
50 [0081] Una segunda parte del algoritmo (llneas 9 a 29) es responsable del reemplazo selectivo de los valores
espectrales cuantificados inversamente no cambiados de escala con valores de reemplazo de llneas espectrales y de una modification selectiva de los factores de escala. Tal como se puede apreciarse a partir del pseudocodigo de programa, el algoritmo puede ejecutarse para todos los grupos de ventanas disponibles (bucle “for” de las llneas 9 a 29). Ademas, se pueden procesar todas las bandas de factores de escala entre cero y una banda de factores de 55 escala maxima (max_sfb) aun cuando el procesamiento puede ser diferente para diferentes bandas de factores de ajuste (bucle “for” entre las llneas 10 a 28). Un aspecto importante es el hecho de que se supone generalmente que una banda de factores de escala se cuantifica a cero a menos que se descubra que la banda de factores de escala no esta cuantificada a cero (consultese la llnea 11). Sin embargo, la verification de si una banda de factores de escala esta cuantificada a cero o no se ejecuta solo para las bandas de factores de escala, de lo cual una llnea de 60 frecuencia de comienzo (swb_offset[sfb]) esta por encima de un Indice de coeficiente espectral predeterminado

(noiseFillingStartOffset). Una rutina condicional entre las ilneas 13 y 24 se ejecuta solo si un Indice de los

coeficientes espectrales mas bajos de una banda de factores de escala sfb es mayor que la compensacion de
comienzo de relleno de ruido. En cambio, para cualquier banda de factores de escala para la cual un Indice del coeficiente espectral mas bajo (swb_offset[sfb]) es menor o igual que un valor predeterminado

5 (noiseFillingStartOffset), se supone que las bandas no estan cuantificadas a cero, independientemente de los
valores reales de las llneas espectrales (veanse las llneas 24a, 24b y 24c).
[0082] Sin embargo, si el Indice de los coeficientes espectrales mas bajos de una cierta banda de factores de escala es mayor que el valor predeterminado (noiseFillingStartOffset), entonces se considera que la cierta banda de
10 factores de escala esta cuantificada a cero solo si todas las llneas espectrales de la cierta banda de factores de escala estan cuantificadas a cero (se restablece el indicador “band_quantized_to_zero” mediante el bucle “for” entre las llneas 15 y 22 si un solo segmento espectral de la banda de factores de escala no esta cuantificado a cero.
[0083] En consecuencia, un factor de escala de una banda de factores de escala dada se modifica utilizando 15 de la compensacion de ruido si el indicador “band_quantized_to_zero”, que se establece inicialmente por defecto
(llnea 11) no se borra durante la ejecucion del codigo de programa entre las llneas 12 y 24. Tal como se menciona anteriormente, un restablecimiento del indicador solo puede producirse para las bandas de factores de escala para las cuales un Indice del coeficiente espectral mas bajo esta por encima del valor predeterminado (noiseFillingStartOffset). Ademas, el algoritmo de la Fig. 10A comprende un reemplazo de valores de llneas 20 espectrales con valores de reemplazo de llneas espectrales si la llnea espectral esta cuantificada a cero (condicion de la llnea 16 y operacion de reemplazo de la llnea 17). Sin embargo, dicho reemplazo solo se lleva a cabo para las bandas de factores de escala para las cuales un Indice de los coeficientes espectrales mas bajos esta por encima del valor predeterminado (noiseFillingStartOffset). Para las bandas de frecuencias espectral mas baja, se omite el reemplazo de los valores espectrales cuantificados a cero con los valores espectrales de reemplazo.
25
[0084] Ademas, cabe destacar que los valores de reemplazo podrlan calcularse de una manera sencilla porque se anade un signo aleatorio o pseudoaleatorio al valor de ruido (noiseVal) calculado en la primera parte del algoritmo (consultese la llnea 17).
30 [0085] Cabe destacar que la Fig. 10B muestra una leyenda de los slmbolos relevantes utilizados en el
pseudocodigo de programa de la Fig. 10A para facilitar una mejor comprension del pseudocodigo de programa.
[0086] Aspectos importantes de la funcionalidad del rellenador de ruido se ilustran en la Fig. 11. Tal como puede apreciarse, la funcionalidad del rellenador de ruido comprende opcionalmente calcular 1110 un valor de ruido
35 basandose en el nivel de ruido. La funcionalidad del rellenador de ruido comprende tambien el reemplazo 1120 de valores de llneas espectrales de las llneas espectrales cuantificadas a cero con valores de reemplazo de llneas espectrales dependiendo del valor de ruido para obtener valores de llneas espectrales reemplazados. Sin embargo, el reemplazo 1120 solo se lleva a cabo para las bandas de factores de escala que tienen un coeficiente espectral mas bajo por encima de un Indice de coeficiente espectral predeterminado.
40
[0087] La funcionalidad del rellenador de ruido tambien comprende modificar 1130 un factor de escala de bandas dependiendo del valor de compensacion de ruido, si, y solo si la banda de factores de escala esta cuantificada a cero. Sin embargo, la modificacion 1130 se ejecuta de esa forma para las bandas de factores de escala que tienen un coeficiente espectral mas bajo por encima del Indice de coeficiente espectral predeterminado.
45
[0088] El rellenador de ruido tambien comprende una funcionalidad de dejar 1140 sin cambio a los factores de escala de bandas, independiente de si la banda de factores de escala esta cuantificada a cero, para las bandas de factores de escala que tienen un coeficiente espectral mas bajo por debajo del Indice de coeficiente espectral predeterminado.
50
[0089] Ademas, el medio de reajuste de escala comprende una funcionalidad 1150 de aplicar los factores de escala de bandas no modificadas o modificadas (cualquiera que este disponible) a los valores de llneas espectrales no reemplazados o reemplazados (cualquiera que este disponible), para obtener espectros cambiados de escala y cuantificados inversamente.
55
[0090] La Fig. 12 muestra una representacion esquematica del concepto descrito con referencia a las Figs. 10A, 10B y 11. En particular, las diferentes funcionalidades se representan dependiendo de un segmento de comienzo de bandas de factores de escala.
60 2.2.4.2 Rellenador de ruido segun las Figs. 13A y 13B
[0091] Las Figs. 13A y 13B muestran listados de pseudocodigos de programa de algoritmos, que pueden llevarse a cabo en una implementacion alternativa del rellenador de ruido 770. La Fig. 13A describe un algoritmo para obtener un valor de ruido (para uso dentro del rellenador de ruido) a partir de una informacion de nivel de ruido,
5 que puede representarse por la informacion de parametros de relleno de ruido 630ac.
[0092] Como el error medio de cuantificacion es aproximadamente 0,25 en la mayorla de los casos, el intervalo de noiseVal [0, 0,5] es bastante grande y puede ser optimizado.
10 [0093] La Fig. 13B representa un algoritmo, que puede estar formado por el rellenador de ruido 770. El
algoritmo de la Fig. 13B comprende una primera porcion de determinacion del valor de ruido (designado con noiseValue” o “noiseVal” - llneas 1 a 4). Una segunda porcion del algoritmo comprende una modificacion selectiva de un factor de escala (llneas 7 a 9) y un reemplazo selectivo de valores de llneas espectrales por valores de reemplazo de llneas espectrales (llneas 10 a 14).
15
[0094] Sin embargo, segun el algoritmo de la Fig. 13B, el factor de escala (scf) se modifica utilizando la compensation de ruido (noise_offset) siempre y cuando una banda este cuantificada a cero (vease la llnea 7). En esta realization no se hacen diferencias entre las bandas de frecuencias mas bajas y las bandas de frecuencias mas altas.
20
[0095] Ademas, se introduce ruido en las llneas espectrales cuantificadas a cero solo para las bandas de frecuencias mas altas (si la llnea esta por encima de un cierto umbral predeterminado “noiseFillingStartOffset”).
2.2.5. Conclusion del decodificador 25
[0096] Para resumir, los ejemplos del decodificador descritos anteriormente pueden comprender una o mas de las siguientes caracterlsticas:
• Comenzando desde una “llnea de comienzo de relleno de ruido” (que puede ser una compensacion fija o una llnea 30 que representa una frecuencia de comienzo) se debe reemplazar cada 0 con un valor de reemplazo;
• el valor de reemplazo es el valor de ruido indicado (con un signo aleatorio) en el dominio cuantificado y luego se cambia la escala de este “valor de reemplazo” con el factor de escala “scf” transmitido para la banda de factores de escala real; y
35
• los valores de reemplazo “aleatorios” tambien pueden obtenerse a partir de, por ejemplo, una distribution de ruido o un conjunto de valores alternativos ponderados con el nivel de ruido senalado.
3. Flujo de audio 40
3.1 Flujo de audio segun las Figs. 14A y 14B
[0097] En lo que viene a continuation, se describira un flujo de audio segun un ejemplo. En lo que sigue, se
describira una denominada “cabida util de tren de bits usac”. La “cabida util de tren de bits usac” transporta 45 informacion de cabida util para representar uno o mas canales individuales (cabida util: “single_channel_element ()) y/o uno o mas pares de canales (channel_pair_element ()) tal como puede apreciarse en la Fig. 14A. Una informacion de canal individual (single_channel_element ()) comprende, entre otra informacion opcional, un flujo de canal en el dominio de la frecuencia (fd_channel_stream), tal como puede apreciarse en la Figura 14B.
50 [0098] Una informacion de pares de canales (channel_pair_element) comprende, ademas de elementos
adicionales, una pluralidad de, por ejemplo, dos flujos de canales en el dominio de la frecuencia (fd_channel_stream), tal como puede apreciarse en la Fig. 14c.
[0099] El contenido de datos de un flujo de canal en el dominio de la frecuencia puede, por ejemplo,
55 depender de si se utiliza o no un relleno de ruido (lo cual se puede senalar en una porcion de datos de serialization que no se muestra aqul). En lo que viene a continuacion, se supondra que se utiliza un relleno de ruido. En este caso, el flujo de canal en el dominio de la frecuencia comprende, por ejemplo, los elementos de datos mostrados en la Fig. 14D. Por ejemplo, puede estar presente una informacion de ganancia global (global_gain), tal como se define en la norma ISO/IEC 14496-3: 2005. Por otra parte, el flujo de canal en el dominio de la frecuencia puede 60 comprender una informacion de compensacion de ruido (noise_offset) y una informacion de nivel de ruido
(noise_level), tal como se describe en este documento. Por ejemplo, la informacion de compensacion de ruido puede codificarse utilizando 3 bits y la informacion de nivel de ruido puede codificarse utilizando, por ejemplo, 5 bits.
[0100] Ademas, el flujo de canal en el dominio de la frecuencia puede comprender una informacion de factor 5 de escala codificado (un scale_factor_data ()) y datos espectrales codificados aritmeticamente (AC_spectral_data ()),
tal como se describen en este documento y tambien como se definen en la norma ISO/IEC 14496-3.
[0101] Opcionalmente, el flujo de canal en el dominio de la frecuencia tambien comprende datos de conformacion de ruido temporal (tns_data) ()), tal como se define en la norma ISO/IEC 14496-3.
10
[0102] Naturalmente, el flujo de canal en el dominio de la frecuencia puede comprender otra informacion, si es necesario.
3.2 Flujo de audio segun la Fig. 15 15
[0103] La Fig. 15 muestra una representacion esquematica de la sintaxis de un flujo de canal que representa un canal individual (individual_channel_stream ()).
[0104] El flujo de canal individual puede comprender una informacion de ganancia global (global_gain) 20 codificada utilizando, por ejemplo, 8 bits, informacion de compensacion de ruido (noise_offset) codificada utilizando,
por ejemplo, 5 bits y una informacion de nivel de ruido (noise_level) codificada utilizando, por ejemplo, 3 bits.
[0105] El flujo de canal individual comprende ademas datos de seccion (section_data ()), datos de factor de escala (scale_factor ()) y datos espectrales (spectral_data ()).
25
[0106] Ademas, el flujo de canal individual puede comprender informacion opcional individual, tal como puede apreciarse en la Fig. 15.
3.3 Conclusion de flujo de audio 30
[0107] Para resumir lo anterior, en algunos de los ejemplos descritos anteriormente se utilizan los siguientes elementos de sintaxis de tren de bits.
• Un valor que indica una compensacion de factores de escala de ruido para optimizar los bits necesarios para 35 transmitir los factores de escala;
• un valor que indica el nivel de ruido; y/o
• un valor opcional para escoger entre diferentes formas para la sustitucion de ruido (ruido distribuido uniforme en lugar de valores constantes o multiples niveles discretos en lugar de solo uno).
40 4. Conclusion
[0108] En la codificacion de baja velocidad binaria, puede utilizarse relleno de ruido para dos propositos:
• Una cuantificacion gruesa de los valores espectrales en una codificacion de audio de baja velocidad binaria podrla 45 conducir a espectros muy dispersos despues de la cuantificacion inversa, ya que muchas llneas espectrales podrlan
haber sido cuantificadas a cero. Los espectros de ocupacion dispersa tendran como resultado que la senal decodificada suene aguda o inestable (senales espurias). Reemplazando las llneas cuantificadas a cero con valores “pequenos” en el decodificador, es posible enmascarar o reducir estos artefactos muy obvios sin anadir nuevos artefactos de ruido obvios.
50 • Si en el espectro original hay partes de la senal similares a ruido, se puede reproducir en el decodificador una representacion perceptivamente equivalente de estas partes de senal ruidosa basandose solo en una informacion parametrica pequena, como la energla de la parte de senal ruidosa. La informacion parametrica puede transmitirse con menos bits en comparacion con el numero de bits necesarios para transmitir la forma de onda codificada.
55 [0109] El esquema de codificacion de relleno de ruido que se acaba de proponer descrito en este documento
combina eficientemente los propositos anteriores en una unica aplicacion.
[0110] Como comparacion, en el audio MPEG-4, se utiliza la sustitucion de ruido perceptivo (PNS) solo para
transmitir una informacion parametrica de las partes de senal de tipo ruido y para reproducir estas partes de senal de 60 manera perceptivamente equivalente en el decodificador.
[0111] Como comparacion adicional, en AMR-WB+, los vectores de cuantificacion de vector (vectores VQ) cuantificados a cero se reemplazan por un vector de ruido aleatorio donde cada valor espectral complejo tiene amplitud constante, pero fase aleatoria. La amplitud se controla por un valor de ruido transmitido con el tren de bits.
5
[0112] Sin embargo, los conceptos de comparacion tienen desventajas significativas. La PNS solo puede utilizarse para rellenar bandas de factores de escala completas, mientras el AMR-WB+ solo intenta enmascarar los artefactos en la senal decodificada que resultan de partes grandes de la senal que estan cuantificadas a cero. En cambio, el esquema de codificacion de relleno de ruido propuesto combina eficientemente ambos aspectos del
10 relleno de ruido en una unica aplicacion.
[0113] Segun un aspecto, la presente invention comprende una nueva forma de calculo de nivel de ruido. El nivel de ruido se calcula en el dominio cuantificado basandose en el error de cuantificacion promedio.
15 [0114] El error de cuantificacion en el dominio cuantificado difiere de otras formas de error de cuantificacion.
El error de cuantificacion por llnea en el dominio cuantificado esta en el intervalo de [-0,5; 0,5] (nivel de cuantificacion 1) con un error absoluto promedio de 0,25 (para valores de entrada de distribution normal que normalmente son mayores que 1).
20 [0115] En lo que viene a continuation, se resumiran algunas ventajas del relleno de ruido en el dominio
cuantificado. La ventaja de anadir ruido en el dominio cuantificado es el hecho de que el ruido anadido en el decodificador se cambia de escala, no solo con la energla promedio en una banda dada, sino tambien la relevancia psicoacustica de una banda.
25 [0116] Normalmente, las bandas (tonales) mas relevantes perceptivamente seran las bandas cuantificadas
con mas exactitud, lo que significa que en estas bandas se utilizaran multiples niveles de cuantificacion (valores cuantificados mayores que 1). Ahora, anadir ruido con un nivel del error de cuantificacion promedio tendra solo una influencia muy limitada sobre la perception de tal banda.
30 [0117] Las bandas que no son perceptivamente tan importantes o mas similares a ruido, pueden ser
cuantificadas con un menor numero de niveles de cuantificacion. Aunque se cuantificaran a cero muchas mas llneas de la banda, el error de cuantificacion promedio resultante sera el mismo que para las bandas finamente cuantificadas (suponiendo un error de cuantificacion de distribucion normal en ambas bandas), mientras que el error relativo en la banda puede ser mucho mas alto.
35
[0118] En estas bandas cuantificadas de manera gruesa, el relleno de ruido ayudara a enmascarar perceptivamente los artefactos que resultan de los agujeros espectrales debidos a la cuantificacion gruesa.
[0119] Puede alcanzarse una consideration del relleno de ruido en el dominio cuantificado mediante el 40 codificador descrito anteriormente y tambien mediante del decodificador descrito anteriormente.
5. Implementaciones alternativas
[0120] Dependiendo de ciertos requisitos de implementation, las realizaciones de la invencion pueden 45 implementarse en hardware o en software. La implementacion puede llevarse a cabo utilizando un medio de
almacenamiento digital, por ejemplo, un disco flexible, un DVD, un CD, una ROM, una PROM, una EPROM, una EEPROM o una memoria FLASH, que tienen senales de control legibles electronicamente almacenadas en los mismos, que cooperan (o son capaces de cooperar) con un sistema informatico programable de modo que se lleva a cabo el procedimiento respectivo.
50
[0121] Implementaciones ejemplares segun la invencion pueden comprender un portador de datos que tiene senales de control legibles electronicamente, que son capaces de cooperar con un sistema informatico, de modo que se lleva a cabo uno de los procedimientos descritos en este documento.
55 [0122] En general, las realizaciones de la presente invencion pueden implementarse como un producto de
programa de ordenador con un codigo de programa, siendo operativo el codigo de programa para llevar a cabo uno de los procedimientos cuando el producto de programa de ordenador se ejecuta en un ordenador. El codigo de programa puede, por ejemplo, estar almacenado en un portador legible por una maquina.

Claims (4)

  1. REIVINDICACIONES
    1. Un codificador (100; 228) para proporcionar un flujo de audio (126; 212) basandose en una representacion en el dominio de la transformada (112; 114; 228a) de una senal de audio de entrada; comprendiendo
    5 el codificador:
    un calculador de error de cuantificacion (110; 330) configurado para determinar un error de cuantificacion multibanda promedio (116; 332) sobre una pluralidad de bandas de frecuencias de la senal de audio de entrada, para las cuales se dispone de information de ganancia de banda separada (228a); y 10 un proveedor de flujo de audio (120; 230) configurado para proporcionar el flujo de audio (126; 212) de modo que el flujo de audio comprenda una informacion que describe un contenido de audio de las bandas de frecuencias y una informacion que describe el error de cuantificacion multibanda;
    en el que el codificador comprende un cuantificador (310) configurado para cuantificar las componentes espectrales de diferentes bandas de frecuencias de la representacion en el dominio de la transformada (228a) utilizando 15 diferentes exactitudes de cuantificacion dependiendo de las relevancias psicoacusticas (228c) de las diferentes bandas de frecuencias, para obtener las componentes espectrales cuantificadas, en el que las diferentes exactitudes de cuantificacion estan reflejadas por la informacion de ganancia de banda; y
    en el que el proveedor de flujo de audio (212) esta configurado para proporcionar el flujo de audio de modo que el flujo de audio comprenda una informacion que describe la informacion de ganancia de banda y de modo que el flujo 20 de audio comprenda ademas la informacion que describe el error de cuantificacion multibanda promedio;
    en el que el cuantificador (310) esta configurado para llevar a cabo un cambio de escala de la componente espectral dependiendo de la informacion de ganancia de banda y para llevar cabo una cuantificacion de valor entero de las componentes espectrales cambiadas de escala; y
    en el que el calculador de error de cuantificacion (330) esta configurado para determinar el error de cuantificacion 25 multibanda promedio (332) en el dominio cuantificado, de modo que el cambio de escala de las componentes espectrales, que se lleva a cabo antes de la cuantificacion de valor entero, se tiene en cuenta en el error de cuantificacion multibanda promedio;
    en el que el codificador esta configurado para establecer una informacion de ganancia de banda de una banda de frecuencias, que esta cuantificada completamente a cero, en un valor que representa una relation entre una energla 30 de la banda de frecuencias cuantificada completamente a cero y una energla del error de cuantificacion multibanda promedio.
  2. 2. El codificador (100; 228) segun la revindication 1, en el que el calculador de error de cuantificacion (330) esta configurado para determinar el error de cuantificacion multibanda promedio (332) sobre una pluralidad de
    35 bandas de frecuencias que comprenden cada una al menos una componente espectral cuantificada a un valor no cero en tanto que evitando las bandas de frecuencias cuyas componentes espectrales estan cuantificadas enteramente a cero.
  3. 3. Un procedimiento para proporcionar una corriente de audio (126; 212) basandose en una 40 representacion en el dominio de la transformada (112; 114; 228a) de una senal de audio de entrada; comprendiendo
    el procedimiento:
    determinar un error de cuantificacion multibanda promedio sobre una pluralidad de bandas de frecuencias, para las cuales se dispone de informacion de ganancia de banda separada; y 45 proporcionar el flujo de audio de modo que el flujo de audio comprenda una informacion que describe un contenido de audio de las bandas de frecuencias y una informacion que describe el error de cuantificacion multibanda promedio; en el que el procedimiento comprende cuantificar las componentes espectrales de diferentes bandas de frecuencias de la representacion en el dominio de la transformada (228a) utilizando diferentes exactitudes de cuantificacion dependiendo de las relevancias psicoacusticas (228c) de las diferentes bandas de frecuencias, para 50 obtener las componentes espectrales cuantificadas, en el que las diferentes exactitudes de cuantificacion estan reflejadas por la informacion de ganancia de banda; y
    en el que el procedimiento comprende proporcionar el flujo de audio de modo que el flujo de audio comprenda una informacion que describe la informacion de ganancia de banda y de modo que el flujo de audio comprenda ademas la informacion que describe el error de cuantificacion multibanda promedio;
    55 en el que el procedimiento comprende llevar a cabo un cambio de escala de la componente espectral dependiendo de la informacion de ganancia de banda y llevar cabo una cuantificacion de valor entero de las componentes espectrales cambiadas de escala; y
    en el que el procedimiento comprende determinar el error de cuantificacion multibanda promedio (332) en el dominio cuantificado, de modo que el cambio de escala de las componentes espectrales, que se lleva a cabo antes de la 60 cuantificacion de valor entero, se tiene en cuenta en el error de cuantificacion multibanda promedio;
    en el que el procedimiento comprende establecer una informacion de ganancia de banda de una banda de frecuencias, que esta cuantificada completamente a cero, en un valor que representa una relacion entre una energla de la banda de frecuencias cuantificada completamente a cero y una energla del error de cuantificacion multibanda promedio.
    5
  4. 4. Un programa de ordenador para llevar a cabo un procedimiento de acuerdo con la reivindicacion 3
    cuando el programa de ordenador se ejecuta en un ordenador.
ES09776839.4T 2008-07-11 2009-06-25 Codificador de audio, procedimientos para proporcionar un flujo de audio y programa de ordenador Active ES2642906T3 (es)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US79872 1979-09-28
US7987208P 2008-07-11 2008-07-11
US10382008P 2008-10-08 2008-10-08
US103820 2008-10-08
PCT/EP2009/004602 WO2010003556A1 (en) 2008-07-11 2009-06-25 Audio encoder, audio decoder, methods for encoding and decoding an audio signal, audio stream and computer program

Publications (1)

Publication Number Publication Date
ES2642906T3 true ES2642906T3 (es) 2017-11-20

Family

ID=40941986

Family Applications (5)

Application Number Title Priority Date Filing Date
ES09776839.4T Active ES2642906T3 (es) 2008-07-11 2009-06-25 Codificador de audio, procedimientos para proporcionar un flujo de audio y programa de ordenador
ES11157188T Active ES2422412T3 (es) 2008-07-11 2009-06-25 Codificador de audio, procedimiento para la codificación de audio y programa de ordenador
ES11157204.6T Active ES2526767T3 (es) 2008-07-11 2009-06-25 Codificador de audio, procedimiento para codificar una señal de audio y programa de ordenador
ES17175883T Active ES2955669T3 (es) 2008-07-11 2009-06-25 Decodificador de audio, procedimiento para decodificar una señal de audio y programa de ordenador
ES09776859T Active ES2374640T3 (es) 2008-07-11 2009-06-26 Rellenador de ruido, calculador de parámetro de relleno de ruido, método para proporcionar un parámetro de relleno de ruido, método para proporcionar una representación espectral rellenada con ruido de una señal de audio, programa informático correspondiente y señal de audio codificada.

Family Applications After (4)

Application Number Title Priority Date Filing Date
ES11157188T Active ES2422412T3 (es) 2008-07-11 2009-06-25 Codificador de audio, procedimiento para la codificación de audio y programa de ordenador
ES11157204.6T Active ES2526767T3 (es) 2008-07-11 2009-06-25 Codificador de audio, procedimiento para codificar una señal de audio y programa de ordenador
ES17175883T Active ES2955669T3 (es) 2008-07-11 2009-06-25 Decodificador de audio, procedimiento para decodificar una señal de audio y programa de ordenador
ES09776859T Active ES2374640T3 (es) 2008-07-11 2009-06-26 Rellenador de ruido, calculador de parámetro de relleno de ruido, método para proporcionar un parámetro de relleno de ruido, método para proporcionar una representación espectral rellenada con ruido de una señal de audio, programa informático correspondiente y señal de audio codificada.

Country Status (22)

Country Link
US (9) US9043203B2 (es)
EP (12) EP4372744A1 (es)
JP (2) JP5622726B2 (es)
KR (4) KR101706009B1 (es)
CN (2) CN102089808B (es)
AR (2) AR072482A1 (es)
AT (1) ATE535903T1 (es)
AU (2) AU2009267459B2 (es)
BR (6) BR122021003142B1 (es)
CA (2) CA2730361C (es)
CO (2) CO6341671A2 (es)
EG (1) EG26480A (es)
ES (5) ES2642906T3 (es)
HK (2) HK1157045A1 (es)
MX (2) MX2011000382A (es)
MY (2) MY178597A (es)
PL (3) PL3246918T3 (es)
PT (1) PT2304719T (es)
RU (2) RU2519069C2 (es)
TW (2) TWI417871B (es)
WO (2) WO2010003556A1 (es)
ZA (2) ZA201100085B (es)

Families Citing this family (83)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4372744A1 (en) 2008-07-11 2024-05-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, methods for encoding and decoding an audio signal, audio stream and computer program
EP2182513B1 (en) * 2008-11-04 2013-03-20 Lg Electronics Inc. An apparatus for processing an audio signal and method thereof
US8553897B2 (en) 2009-06-09 2013-10-08 Dean Robert Gary Anderson Method and apparatus for directional acoustic fitting of hearing aids
US9101299B2 (en) * 2009-07-23 2015-08-11 Dean Robert Gary Anderson As Trustee Of The D/L Anderson Family Trust Hearing aids configured for directional acoustic fitting
US8879745B2 (en) * 2009-07-23 2014-11-04 Dean Robert Gary Anderson As Trustee Of The D/L Anderson Family Trust Method of deriving individualized gain compensation curves for hearing aid fitting
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
US9117458B2 (en) * 2009-11-12 2015-08-25 Lg Electronics Inc. Apparatus for processing an audio signal and method thereof
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
US9236063B2 (en) 2010-07-30 2016-01-12 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for dynamic bit allocation
JP6075743B2 (ja) * 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
US9208792B2 (en) 2010-08-17 2015-12-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for noise injection
WO2012037515A1 (en) 2010-09-17 2012-03-22 Xiph. Org. Methods and systems for adaptive time-frequency resolution in digital data coding
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
JP5695074B2 (ja) * 2010-10-18 2015-04-01 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America 音声符号化装置および音声復号化装置
US8838442B2 (en) 2011-03-07 2014-09-16 Xiph.org Foundation Method and system for two-step spreading for tonal artifact avoidance in audio coding
US9015042B2 (en) * 2011-03-07 2015-04-21 Xiph.org Foundation Methods and systems for avoiding partial collapse in multi-block audio coding
US9009036B2 (en) 2011-03-07 2015-04-14 Xiph.org Foundation Methods and systems for bit allocation and partitioning in gain-shape vector quantization for audio coding
CN103703511B (zh) 2011-03-18 2017-08-22 弗劳恩霍夫应用研究促进协会 定位在表示音频内容的比特流的帧中的帧元素
WO2012150482A1 (en) * 2011-05-04 2012-11-08 Nokia Corporation Encoding of stereophonic signals
AU2012276367B2 (en) * 2011-06-30 2016-02-04 Samsung Electronics Co., Ltd. Apparatus and method for generating bandwidth extension signal
WO2013061232A1 (en) * 2011-10-24 2013-05-02 Koninklijke Philips Electronics N.V. Audio signal noise attenuation
US8942397B2 (en) * 2011-11-16 2015-01-27 Dean Robert Gary Anderson Method and apparatus for adding audible noise with time varying volume to audio devices
JP5942463B2 (ja) * 2012-02-17 2016-06-29 株式会社ソシオネクスト オーディオ信号符号化装置およびオーディオ信号符号化方法
US20130282373A1 (en) * 2012-04-23 2013-10-24 Qualcomm Incorporated Systems and methods for audio signal processing
CN103778918B (zh) * 2012-10-26 2016-09-07 华为技术有限公司 音频信号的比特分配的方法和装置
CN103854653B (zh) * 2012-12-06 2016-12-28 华为技术有限公司 信号解码的方法和设备
PT2951814T (pt) 2013-01-29 2017-07-25 Fraunhofer Ges Forschung Ênfase de baixa frequência para codificação com base em lpc em domínio de frequência
CN105264597B (zh) 2013-01-29 2019-12-10 弗劳恩霍夫应用研究促进协会 感知转换音频编码中的噪声填充
PT2939235T (pt) * 2013-01-29 2017-02-07 Fraunhofer Ges Forschung Quantização de sinal de áudio de tonalidade adaptativa de baixa complexidade
BR112015019176B1 (pt) 2013-04-05 2021-02-09 Dolby Laboratories Licensing Corporation método e aparelho de expansão de um sinal de áudio, método e aparelho de compressão de um sinal de áudio, e mídia legível por computador
EP3217398B1 (en) 2013-04-05 2019-08-14 Dolby International AB Advanced quantizer
US9762198B2 (en) * 2013-04-29 2017-09-12 Dolby Laboratories Licensing Corporation Frequency band compression with dynamic thresholds
KR102280461B1 (ko) 2013-05-24 2021-07-22 돌비 인터네셔널 에이비 오디오 인코더 및 디코더
RU2632585C2 (ru) 2013-06-21 2017-10-06 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Способ и устройство для получения спектральных коэффициентов для заменяющего кадра аудиосигнала, декодер аудио, приемник аудио и система для передачи аудиосигналов
EP3014609B1 (en) * 2013-06-27 2017-09-27 Dolby Laboratories Licensing Corporation Bitstream syntax for spatial voice coding
EP2830061A1 (en) 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
EP2830060A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Noise filling in multichannel audio coding
EP2830058A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Frequency-domain audio coding supporting transform length switching
JP6531649B2 (ja) 2013-09-19 2019-06-19 ソニー株式会社 符号化装置および方法、復号化装置および方法、並びにプログラム
CN105612767B (zh) * 2013-10-03 2017-09-22 杜比实验室特许公司 音频处理方法和音频处理设备
EP3951778A1 (en) * 2013-10-22 2022-02-09 FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. Concept for combined dynamic range compression and guided clipping prevention for audio devices
EP3336841B1 (en) 2013-10-31 2019-12-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder and method for providing a decoded audio information using an error concealment modifying a time domain excitation signal
ES2739477T3 (es) 2013-10-31 2020-01-31 Fraunhofer Ges Forschung Decodificador de audio y método para proporcionar una información de audio decodificada usando un ocultamiento de errores en base a una señal de excitación de dominio de tiempo
KR102023138B1 (ko) 2013-12-02 2019-09-19 후아웨이 테크놀러지 컴퍼니 리미티드 인코딩 방법 및 장치
BR112016014476B1 (pt) 2013-12-27 2021-11-23 Sony Corporation Aparelho e método de decodificação, e, meio de armazenamento legível por computador
CN110808056B (zh) * 2014-03-14 2023-10-17 瑞典爱立信有限公司 音频编码方法和装置
PL3550563T3 (pl) * 2014-03-31 2024-07-08 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Enkoder, dekoder, sposób enkodowania, sposób dekodowania oraz powiązane programy
US9685166B2 (en) 2014-07-26 2017-06-20 Huawei Technologies Co., Ltd. Classification between time-domain coding and frequency domain coding
EP2980792A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating an enhanced signal using independent noise-filling
EP2980801A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for estimating noise in an audio signal, noise estimator, audio encoder, audio decoder, and system for transmitting audio signals
EP4092670A1 (en) * 2014-09-30 2022-11-23 Sony Group Corporation Transmitting device, transmission method, receiving device, and receiving method
US9875756B2 (en) 2014-12-16 2018-01-23 Psyx Research, Inc. System and method for artifact masking
WO2016142002A1 (en) * 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
TWI758146B (zh) 2015-03-13 2022-03-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
US10553228B2 (en) * 2015-04-07 2020-02-04 Dolby International Ab Audio coding with range extension
US9454343B1 (en) 2015-07-20 2016-09-27 Tls Corp. Creating spectral wells for inserting watermarks in audio signals
US9311924B1 (en) 2015-07-20 2016-04-12 Tls Corp. Spectral wells for inserting watermarks in audio signals
US9626977B2 (en) 2015-07-24 2017-04-18 Tls Corp. Inserting watermarks into audio signals that have speech-like properties
US10115404B2 (en) 2015-07-24 2018-10-30 Tls Corp. Redundancy in watermarking audio signals that have speech-like properties
EP3992963B1 (en) 2015-10-08 2023-02-15 Dolby International AB Layered coding for compressed sound or sound field representations
MA45880B1 (fr) 2015-10-08 2022-01-31 Dolby Int Ab Codage hiérarchique et structure de données pour représentations compressées de sons ou champs acoustiques d'ambiophonie d'ordre supérieur
US10142742B2 (en) 2016-01-01 2018-11-27 Dean Robert Gary Anderson Audio systems, devices, and methods
EP3208800A1 (en) * 2016-02-17 2017-08-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for stereo filing in multichannel coding
MX371223B (es) * 2016-02-17 2020-01-09 Fraunhofer Ges Forschung Post-procesador, pre-procesador, codificador de audio, decodificador de audio y metodos relacionados para mejorar el procesamiento de transitorios.
US10146500B2 (en) 2016-08-31 2018-12-04 Dts, Inc. Transform-based audio codec and method with subband energy smoothing
EP3382703A1 (en) * 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and methods for processing an audio signal
EP3396670B1 (en) * 2017-04-28 2020-11-25 Nxp B.V. Speech signal processing
BR112020008216A2 (pt) * 2017-10-27 2020-10-27 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. aparelho e seu método para gerar um sinal de áudio intensificado, sistema para processar um sinal de áudio
WO2019091576A1 (en) * 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
US10950251B2 (en) * 2018-03-05 2021-03-16 Dts, Inc. Coding of harmonic signals in transform-based audio codecs
US11694708B2 (en) * 2018-09-23 2023-07-04 Plantronics, Inc. Audio device and method of audio processing with improved talker discrimination
US11264014B1 (en) * 2018-09-23 2022-03-01 Plantronics, Inc. Audio device and method of audio processing with improved talker discrimination
US11503548B2 (en) * 2018-10-08 2022-11-15 Telefonaktiebolaget Lm Ericsson (Publ) Transmission power determination for an antenna array
WO2020164751A1 (en) 2019-02-13 2020-08-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decoder and decoding method for lc3 concealment including full frame loss concealment and partial frame loss concealment
KR20210137146A (ko) * 2019-03-10 2021-11-17 카르돔 테크놀로지 엘티디. 큐의 클러스터링을 사용한 음성 증강
WO2020207593A1 (en) * 2019-04-11 2020-10-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder, apparatus for determining a set of values defining characteristics of a filter, methods for providing a decoded audio representation, methods for determining a set of values defining characteristics of a filter and computer program
US11361776B2 (en) 2019-06-24 2022-06-14 Qualcomm Incorporated Coding scaled spatial components
US20200402522A1 (en) * 2019-06-24 2020-12-24 Qualcomm Incorporated Quantizing spatial components based on bit allocations determined for psychoacoustic audio coding
US11538489B2 (en) 2019-06-24 2022-12-27 Qualcomm Incorporated Correlating scene-based audio data for psychoacoustic audio coding
CN112037802B (zh) * 2020-05-08 2022-04-01 珠海市杰理科技股份有限公司 基于语音端点检测的音频编码方法及装置、设备、介质
US11545172B1 (en) * 2021-03-09 2023-01-03 Amazon Technologies, Inc. Sound source localization using reflection classification
CN114900246B (zh) * 2022-05-25 2023-06-13 中国电子科技集团公司第十研究所 噪声基底估计方法、装置、设备及存储介质

Family Cites Families (49)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4703505A (en) * 1983-08-24 1987-10-27 Harris Corporation Speech data encoding scheme
US4956871A (en) 1988-09-30 1990-09-11 At&T Bell Laboratories Improving sub-band coding of speech at low bit rates by adding residual speech energy signals to sub-bands
JPH0934493A (ja) 1995-07-20 1997-02-07 Graphics Commun Lab:Kk 音響信号符号化装置、音響信号復号装置および音響信号処理装置
US6092041A (en) 1996-08-22 2000-07-18 Motorola, Inc. System and method of encoding and decoding a layered bitstream by re-applying psychoacoustic analysis in the decoder
US5797120A (en) * 1996-09-04 1998-08-18 Advanced Micro Devices, Inc. System and method for generating re-configurable band limited noise using modulation
US5924064A (en) * 1996-10-07 1999-07-13 Picturetel Corporation Variable length coding using a plurality of region bit allocation patterns
US5960389A (en) * 1996-11-15 1999-09-28 Nokia Mobile Phones Limited Methods for generating comfort noise during discontinuous transmission
US6167133A (en) * 1997-04-02 2000-12-26 At&T Corporation Echo detection, tracking, cancellation and noise fill in real time in a communication system
US6240386B1 (en) * 1998-08-24 2001-05-29 Conexant Systems, Inc. Speech codec employing noise classification for noise compensation
RU2237296C2 (ru) * 1998-11-23 2004-09-27 Телефонактиеболагет Лм Эрикссон (Пабл) Кодирование речи с функцией изменения комфортного шума для повышения точности воспроизведения
US7124079B1 (en) * 1998-11-23 2006-10-17 Telefonaktiebolaget Lm Ericsson (Publ) Speech coding with comfort noise variability feature for increased fidelity
JP3804902B2 (ja) 1999-09-27 2006-08-02 パイオニア株式会社 量子化誤差補正方法及び装置並びにオーディオ情報復号方法及び装置
FI116643B (fi) * 1999-11-15 2006-01-13 Nokia Corp Kohinan vaimennus
SE0004187D0 (sv) * 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
DE60233032D1 (de) * 2001-03-02 2009-09-03 Panasonic Corp Audio-kodierer und audio-dekodierer
US6876968B2 (en) * 2001-03-08 2005-04-05 Matsushita Electric Industrial Co., Ltd. Run time synthesizer adaptation to improve intelligibility of synthesized speech
WO2002091363A1 (en) * 2001-05-08 2002-11-14 Koninklijke Philips Electronics N.V. Audio coding
JP4506039B2 (ja) 2001-06-15 2010-07-21 ソニー株式会社 符号化装置及び方法、復号装置及び方法、並びに符号化プログラム及び復号プログラム
US7447631B2 (en) * 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
KR100462611B1 (ko) * 2002-06-27 2004-12-20 삼성전자주식회사 하모닉 성분을 이용한 오디오 코딩방법 및 장치
JP4218271B2 (ja) * 2002-07-19 2009-02-04 ソニー株式会社 データ処理装置およびデータ処理方法、並びにプログラムおよび記録媒体
DE10236694A1 (de) 2002-08-09 2004-02-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren
KR100477699B1 (ko) * 2003-01-15 2005-03-18 삼성전자주식회사 양자화 잡음 분포 조절 방법 및 장치
JP4212591B2 (ja) 2003-06-30 2009-01-21 富士通株式会社 オーディオ符号化装置
DE602004013031T2 (de) * 2003-10-10 2009-05-14 Agency For Science, Technology And Research Verfahren zum codieren eines digitalen signals in einen skalierbaren bitstrom, verfahren zum decodieren eines skalierbaren bitstroms
US7723474B2 (en) 2003-10-21 2010-05-25 The Regents Of The University Of California Molecules that selectively home to vasculature of pre-malignant dysplastic lesions or malignancies
US7436786B2 (en) * 2003-12-09 2008-10-14 International Business Machines Corporation Telecommunications system for minimizing the effect of white noise data packets for the generation of required white noise on transmission channel utilization
JP2005202248A (ja) * 2004-01-16 2005-07-28 Fujitsu Ltd オーディオ符号化装置およびオーディオ符号化装置のフレーム領域割り当て回路
DE102004007200B3 (de) 2004-02-13 2005-08-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audiocodierung
CA2457988A1 (en) 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
US7613306B2 (en) * 2004-02-25 2009-11-03 Panasonic Corporation Audio encoder and audio decoder
JP2007538281A (ja) * 2004-05-17 2007-12-27 ノキア コーポレイション 異なる符号化モデルを用いる音声符号化
US7649988B2 (en) 2004-06-15 2010-01-19 Acoustic Technologies, Inc. Comfort noise generator using modified Doblinger noise estimate
US7873515B2 (en) * 2004-11-23 2011-01-18 Stmicroelectronics Asia Pacific Pte. Ltd. System and method for error reconstruction of streaming audio information
KR100707173B1 (ko) * 2004-12-21 2007-04-13 삼성전자주식회사 저비트율 부호화/복호화방법 및 장치
US7885809B2 (en) * 2005-04-20 2011-02-08 Ntt Docomo, Inc. Quantization of speech and audio coding parameters using partial information on atypical subsequences
DE602006018618D1 (de) * 2005-07-22 2011-01-13 France Telecom Verfahren zum umschalten der raten- und bandbreitenskalierbaren audiodecodierungsrate
JP4627737B2 (ja) * 2006-03-08 2011-02-09 シャープ株式会社 デジタルデータ復号化装置
US7564418B2 (en) * 2006-04-21 2009-07-21 Galtronics Ltd. Twin ground antenna
JP4380669B2 (ja) * 2006-08-07 2009-12-09 カシオ計算機株式会社 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、及び、プログラム
US7275936B1 (en) * 2006-09-22 2007-10-02 Lotes Co., Ltd. Electrical connector
US8275611B2 (en) * 2007-01-18 2012-09-25 Stmicroelectronics Asia Pacific Pte., Ltd. Adaptive noise suppression for digital speech signals
CN101617362B (zh) * 2007-03-02 2012-07-18 松下电器产业株式会社 语音解码装置和语音解码方法
ES2774956T3 (es) * 2007-08-27 2020-07-23 Ericsson Telefon Ab L M Método y dispositivo para la descodificación espectral perceptual de una señal de audio, que incluyen el llenado de huecos espectrales
CN101939782B (zh) * 2007-08-27 2012-12-05 爱立信电话股份有限公司 噪声填充与带宽扩展之间的自适应过渡频率
US8560307B2 (en) * 2008-01-28 2013-10-15 Qualcomm Incorporated Systems, methods, and apparatus for context suppression using receivers
EP4372744A1 (en) * 2008-07-11 2024-05-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, methods for encoding and decoding an audio signal, audio stream and computer program
US9208792B2 (en) 2010-08-17 2015-12-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for noise injection
JP5695074B2 (ja) 2010-10-18 2015-04-01 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America 音声符号化装置および音声復号化装置

Also Published As

Publication number Publication date
US20140236605A1 (en) 2014-08-21
ZA201100085B (en) 2011-10-26
EP4407613A1 (en) 2024-07-31
EP4407614A1 (en) 2024-07-31
BRPI0910522A2 (pt) 2020-10-20
EP2304719A1 (en) 2011-04-06
KR20160004403A (ko) 2016-01-12
MX2011000382A (es) 2011-02-25
PL2304720T3 (pl) 2012-04-30
AR072482A1 (es) 2010-09-01
US20150112693A1 (en) 2015-04-23
US20170004839A1 (en) 2017-01-05
TWI492223B (zh) 2015-07-11
RU2519069C2 (ru) 2014-06-10
US20170309283A1 (en) 2017-10-26
US20110173012A1 (en) 2011-07-14
BRPI0910811A2 (pt) 2020-11-03
EP4235660A2 (en) 2023-08-30
BR122021003097B1 (pt) 2021-11-03
KR101706009B1 (ko) 2017-02-22
ATE535903T1 (de) 2011-12-15
AU2009267468A1 (en) 2010-01-14
KR101582057B1 (ko) 2015-12-31
AU2009267459B2 (en) 2014-01-23
US12080306B2 (en) 2024-09-03
EP4407612A1 (en) 2024-07-31
US10629215B2 (en) 2020-04-21
CA2730536C (en) 2014-12-02
US11024323B2 (en) 2021-06-01
ES2955669T3 (es) 2023-12-05
CO6280569A2 (es) 2011-05-20
KR20110039245A (ko) 2011-04-15
WO2010003565A1 (en) 2010-01-14
KR20140036042A (ko) 2014-03-24
ES2374640T3 (es) 2012-02-20
TW201007697A (en) 2010-02-16
US20240096337A1 (en) 2024-03-21
US9449606B2 (en) 2016-09-20
MY155785A (en) 2015-11-30
EP4372744A1 (en) 2024-05-22
WO2010003556A1 (en) 2010-01-14
US8983851B2 (en) 2015-03-17
EP3246918A1 (en) 2017-11-22
EG26480A (en) 2013-12-02
CN102089808B (zh) 2014-02-12
EP2304720B1 (en) 2011-11-30
HK1157045A1 (en) 2012-06-22
TW201007696A (en) 2010-02-16
MX2011000359A (es) 2011-02-25
BR122021003142B1 (pt) 2021-11-03
EP3246918B1 (en) 2023-06-14
US20240096338A1 (en) 2024-03-21
JP5622726B2 (ja) 2014-11-12
MY178597A (en) 2020-10-16
AR072497A1 (es) 2010-09-01
JP2011527451A (ja) 2011-10-27
ES2526767T3 (es) 2015-01-15
PT2304719T (pt) 2017-11-03
EP4372745A1 (en) 2024-05-22
US20110170711A1 (en) 2011-07-14
CA2730361C (en) 2017-01-03
CA2730361A1 (en) 2010-01-14
US12080305B2 (en) 2024-09-03
BR122021003752B1 (pt) 2021-11-09
TWI417871B (zh) 2013-12-01
KR101251790B1 (ko) 2013-04-08
US9043203B2 (en) 2015-05-26
CO6341671A2 (es) 2011-11-21
AU2009267468B2 (en) 2012-03-15
JP2011527455A (ja) 2011-10-27
PL3246918T3 (pl) 2023-11-06
EP4407611A1 (en) 2024-07-31
BR122021003726B1 (pt) 2021-11-09
EP4375998A1 (en) 2024-05-29
JP5307889B2 (ja) 2013-10-02
EP4235660A3 (en) 2023-09-13
US20210272577A1 (en) 2021-09-02
HK1160285A1 (en) 2012-08-10
RU2011102410A (ru) 2012-07-27
EP2304719B1 (en) 2017-07-26
ZA201100091B (en) 2011-10-26
KR20110040829A (ko) 2011-04-20
RU2512103C2 (ru) 2014-04-10
US11869521B2 (en) 2024-01-09
RU2011104006A (ru) 2012-08-20
US9711157B2 (en) 2017-07-18
PL2304719T3 (pl) 2017-12-29
KR101518532B1 (ko) 2015-05-07
CN102089806B (zh) 2012-12-05
CN102089808A (zh) 2011-06-08
CA2730536A1 (en) 2010-01-14
ES2422412T3 (es) 2013-09-11
AU2009267459A1 (en) 2010-01-14
CN102089806A (zh) 2011-06-08
EP4407610A1 (en) 2024-07-31
EP3246918C0 (en) 2023-06-14
EP2304720A1 (en) 2011-04-06
EP4235660B1 (en) 2024-06-19
BRPI0910811B1 (pt) 2021-09-21

Similar Documents

Publication Publication Date Title
ES2642906T3 (es) Codificador de audio, procedimientos para proporcionar un flujo de audio y programa de ordenador
EP2346030B1 (en) Audio encoder, method for encoding an audio signal and computer program
AU2013273846B2 (en) Audio encoder, audio decoder, methods for encoding and decoding an audio signal, audio stream and computer program