ES2600313T3 - Aparato y método para la estimación de nivel de tramas de audio codificadas en un dominio de flujo de bits - Google Patents

Aparato y método para la estimación de nivel de tramas de audio codificadas en un dominio de flujo de bits Download PDF

Info

Publication number
ES2600313T3
ES2600313T3 ES11764577.0T ES11764577T ES2600313T3 ES 2600313 T3 ES2600313 T3 ES 2600313T3 ES 11764577 T ES11764577 T ES 11764577T ES 2600313 T3 ES2600313 T3 ES 2600313T3
Authority
ES
Spain
Prior art keywords
level
value
code word
code
code book
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES11764577.0T
Other languages
English (en)
Inventor
Ralf Geiger
Markus Schnell
Manfred Lutzky
Marco Diatschuk
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Application granted granted Critical
Publication of ES2600313T3 publication Critical patent/ES2600313T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/15Conference systems
    • H04N7/152Multipoint control units therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Un aparato para la estimación de nivel de una señal de audio codificada, que comprende: un determinador de libros de códigos (110) para determinar un libro de códigos a partir de una pluralidad de libros de códigos como un libro de códigos identificado, en el que la señal de audio se ha codificado mediante el empleo del libro de códigos identificado, y una unidad de estimación (120) configurada para obtener un valor de nivel asociado con el libro de códigos identificado como un valor de nivel obtenido y para estimar una estimación de nivel de la señal de audio usando el valor de nivel obtenido.

Description

5
10
15
20
25
30
35
40
45
50
55
60
Aparato y metodo para la estimacion de nivel de tramas de audio codificadas en un dominio de flujo de bits
DESCRIPCION
La presente invencion se refiere al procesamiento de audio y, en particular, a un aparato y metodo para la estimacion de nivel de senales de audio codificadas en un dominio de flujo de bits.
El procesamiento de audio ha progresado de muchas maneras y ha sido objeto de muchos estudios el como codificar y descodificar con eficiencia senales de datos de audio. Una codificacion eficiente es provista, por ejemplo, por la norma AAC de MPEG (AAC = Advanced Audio Coding, Codificacion Avanzada de Audio; MPEG = Moving Pictures Expert Group, Grupo de Expertos en Imagenes Moviles).
De acuerdo con la norma AAC de MPEG, los valores espectrales de una senal de audio se codifican empleando factores de escala, cuantificacion y libros de codigos, en particular libros de codigos de Huffman.
Antes de llevar a cabo la codificacion de Huffman, el codificador agrupa la pluralidad de coeficientes espectrales a codificar en diferentes secciones. Para cada seccion de coeficientes espectrales, el codificador elige un libro de codigos de Huffman para la codificacion de Huffman. La norma AAC de MPEG proporciona once libros de codigos de Huffman de Espectros diferentes para la codificacion de datos espectrales, de entre los cuales el codificador selecciona el libro de codigos mas adecuado para la codificacion de los coeficientes espectrales de la seccion. El codificador proporciona un identificador de libro de codigos que identifica el libro de codigos usado para la codificacion de Huffman de los coeficientes espectrales de la seccion al descodificador como informacion secundaria.
En un lado de descodificador, el descodificador analiza la informacion secundaria recibida para determinar cual de la pluralidad de libros de codigos de Huffman de Espectro se ha usado para codificar los valores espectrales de una seccion. El descodificador lleva a cabo la descodificacion de Huffman sobre la base de la informacion secundaria sobre el libro de codigos de Huffman empleado para codificar los coeficientes espectrales de la seccion que va a ser descodificada por el descodificador.
Despues de la descodificacion de Huffman, se obtiene una pluralidad de valores espectrales cuantificados en el descodificador. A continuacion, el descodificador puede realizar una cuantificacion inversa para invertir una cuantificacion no uniforme que pueda haber sido realizada por el codificador. De este modo, se obtienen valores espectrales inversamente cuantificados en el descodificador.
Sin embargo, los valores espectrales inversamente cuantificados pueden estar aun sin ajustar a escalar. Los valores espectrales sin ajustar a escala obtenidos han sido agrupados en bandas de factores de escala, teniendo cada banda de factores de escala un factor de escala comun. El factor de escala para cada banda de factores de escala esta a disposicion del descodificador como informacion secundaria, que ha sido provista por el codificador. Usando esta informacion, el descodificador multiplica los valores espectrales sin ajustar a escala de una banda de factores de escala por su factor de escala. De este modo, se obtienen valores espectrales ajustados a escala.
Se explica a continuacion la codificacion y descodificacion de valores espectrales en el estado de la tecnica con referencia a las figuras 7 - 10.
La figura 7 ilustra un codificador de acuerdo con el estado de la tecnica. El codificador comprende un banco de filtros T/F 710 para transformar una senal de audio AS, que se ha de codificar, de un dominio del tiempo a un dominio de la frecuencia para obtener una senal de audio en el dominio de la frecuencia. La senal de audio en el dominio de la frecuencia se alimenta a una unidad de factores de escala 720 para la determinacion de factores de escala. La unidad de factores de escala 720 esta adaptada para dividir los coeficientes espectrales de la senal de audio en el dominio de la frecuencia en varios grupos de coeficientes espectrales denominados bandas de factores de escala, que comparten un factor de escala. Un factor de escala representa un valor de ganancia usado para cambiar la amplitud de todos los coeficientes espectrales en la respectiva banda de factores de escala. La unidad de factores de escala 720 esta adaptada, ademas, para generar y emitir los coeficientes espectrales sin ajustar a escala de la senal de audio en el dominio de la frecuencia.
Ademas, el codificador en la figura 7 comprende un cuantificador para cuantificar los coeficientes espectrales sin ajustar a escala de la senal de audio en el dominio de la frecuencia. El cuantificador 730 puede ser un cuantificador no uniforme.
Despues de la cuantificacion, los espectros sin ajustar a escala cuantificados de la senal de audio se alimentan a un codificador de Huffman 740 para ser codificados por codificacion de Huffman. La codificacion de Huffman se usa para reducir la redundancia del espectro cuantificado de la senal de audio. La pluralidad de coeficientes espectrales
5
10
15
20
25
30
35
40
45
50
55
60
cuantificados sin ajustar a escala se agrupa en secciones. A pesar de que, en AAC de MPEG, se proporcionan once posibles libros de codigos, todos los coeficientes espectrales de una seccion son codificados por el mismo libro de codigos de Huffman.
El codificador elegira uno de los once libros de codigos de Huffman posibles que sea particularmente adecuado para codificar los coeficientes espectrales de la seccion. De este modo, la seleccion del libro de codigos de Huffman del codificador para una seccion particular depende de los valores espectrales de la seccion particular. Los coeficientes espectrales codificados por codificacion de Huffman se pueden transmitir a continuacion al descodificador junto con informacion secundaria que comprende, por ejemplo, informacion acerca del libro de codigos de Huffman que se ha usado para codificar una seccion de unos coeficientes espectrales, un factor de escala que se ha usado para una banda de factores de escala particular, etc.
Dos o cuatro coeficientes espectrales son codificados por una palabra de codigo del libro de codigos de Huffman empleado para la codificacion de Huffman de los coeficientes espectrales de la seccion. El codificador transmite las palabras de codigo que representan los coeficientes espectrales codificados al descodificador junto con informacion secundaria que comprende la longitud de la seccion, asf como informacion acerca del libro de codigos de Huffman usado para codificar los coeficientes espectrales de la seccion,
En la norma AAC de MPEG, se proporcionan once libros de codigos de Huffman de Espectro para codificar datos espectrales de la senal de audio. El libro de codigos de Huffman de Espectro se puede identificar por su mdice de libros de codigos (un valor de entre 1 y 11). La dimension del libro de codigos de Huffman indica cuantos coeficientes espectrales son codificadas por una palabra de codigo del libro de codigos de Huffman en cuestion. En la norma AAC de MPEG, la dimension de un libro de codigos de Huffman es o bien 2 o bien 4, lo que indica que una palabra de codigo codifica o bien dos o bien cuatro valores espectrales de la senal de audio.
Sin embargo, los diferentes libros de codigos de Huffman difieren ademas con respecto a otras propiedades. Por ejemplo, el valor absoluto maximo de un coeficiente espectral que puede ser codificado por el libro de codigos de Huffman vana de un libro de codigos a otro libro de codigos y puede ser, por ejemplo, de 1, 2, 4, 7, 12 o mas. Ademas, un libro de codigos de Huffman en cuestion puede estar, o no, adaptado para codificar valores con signo.
Empleando la codificacion de Huffman, los coeficientes espectrales son codificados por palabras de codigo de diferentes longitudes. La norma AAC de MPEG proporciona dos libros de codigos de Huffman diferentes que tienen un valor absoluto maximo de 1, dos libros de codigos de Huffman que tienen un valor absoluto maximo de 2, dos libros de codigos de Huffman que tienen un valor absoluto maximo de 4, dos libros de codigos de Huffman que tienen un valor absoluto maximo de 7 y dos libros de codigos de Huffman que tienen un valor absoluto maximo de 12, en los que cada libro de codigos de Huffman representa una funcion de distribucion de probabilidades distinta. El codificador de Huffman elegira siempre el libro de codigos de Huffman que sea mas adecuado para la codificacion de los coeficientes espectrales.
La figura 8 ilustra un descodificador de acuerdo con el estado de la tecnica. Los valores espectrales codificados por codificacion de Huffman son recibidos por un descodificador de Huffman 750. El descodificador de Huffman 750 tambien recibe, como informacion secundaria, informacion acerca del libro de codigos de Huffman usado para codificar los valores espectrales para cada seccion de valores espectrales. A continuacion, el descodificador de Huffman 750 realiza la descodificacion de Huffman para obtener valores espectrales cuantificados sin ajustar a escala. Los valores espectrales cuantificados sin ajustar a escala se alimentan a un cuantificador inverso 760. El cuantificador inverso realiza la cuantificacion inversa para obtener valores espectrales inversamente cuantificados sin ajustar a escala, que se alimentan a un elemento de ajuste a escala 770. El elemento de ajuste a escala 770 tambien recibe factores de escala como informacion secundaria para cada banda de factores de escala. Sobre la base de los factores de escala recibidos, el elemento de ajuste a escala 770 ajusta a escala los valores espectrales inversamente cuantificados sin ajustar a escala para obtener valores espectrales inversamente cuantificados ajustados a escala. A continuacion, un banco de filtros F/T 780 transforma los valores espectrales inversamente cuantificados ajustados a escala de la senal de audio en el dominio de la frecuencia del dominio de la frecuencia al domino del tiempo para obtener valores de muestra de una senal de audio en el dominio del tiempo.
La figura 9 ilustra un codificador de acuerdo con el estado de la tecnica que difiere del codificador de la figura 7 en que el codificador de la figura 9 comprende adicionalmente una unidad de TNS de lado de codificador (TNS = Temporal Noise Shaping, Modelado Temporal de Ruido). Se puede emplear el Modelado Temporal de Ruido para controlar la forma temporal del ruido de cuantificacion al llevar a cabo un proceso de filtrado con respecto a porciones de los datos espectrales de la senal de audio. La unidad de TNS de lado de codificador 715 determina y lleva a cabo un calculo de codificacion por prediccion lineal (LPC, linear predictive coding) con respecto a los coeficientes espectrales de la senal de audio en el dominio de la frecuencia a codificar. Entre otras cosas, como resultado del calculo de LPC se obtienen coeficientes de reflexion, a los que tambien se hace referencia como coeficientes PARCOR. El modelado temporal de ruido no se usa su la ganancia de prediccion, que se tambien se obtiene mediante el calculo de LPC, no supera un cierto valor umbral. Sin embargo, si la ganancia de prediccion es mayor que el valor umbral, se emplea el modelado temporal de ruido. La unidad de TNS de lado de codificador
5
10
15
20
25
30
35
40
45
50
55
60
elimina todos los coeficientes de reflexion que sean inferiores a un determinado valor umbral. El resto de los coeficientes de reflexion se convierten en coeficientes de prediccion lineal y se usan como coeficientes de filtro de modelado de ruido en el codificador. A continuacion, la unidad de TNS de lado de codificador realiza una operacion de filtrado sobre esos coeficientes espectrales, para lo cual se emplea el TNS, con el fin de obtener coeficientes espectrales procesados de la senal de audio. Se transmite al descodificador informacion secundaria que indica informacion de TNS, por ejemplo los coeficientes de reflexion (coeficientes PARCOR).
La figura 10 ilustra un descodificador de acuerdo con el estado de la tecnica que difiere del descodificador ilustrado en la figura 8, puesto que el descodificador de la figura 10 comprende adicionalmente una unidad de TNS de lado de descodificador 775. La unidad de TNS de lado de descodificador recibe espectros ajustados a escala inversamente cuantificados de la senal de audio y tambien informacion de TNS recibida, por ejemplo, informacion que indica los coeficientes de reflexion (coeficientes PARCOR). La unidad de TNS de lado de descodificador 775 procesa los espectros inversamente cuantificados de la senal de audio para obtener un especto inversamente cuantificado procesado de la senal de audio.
Para una pluralidad de aplicaciones, es importante determinar o estimar un nivel, por ejemplo de energfa, amplitud o volumen sonoro, de una senal de audio codificada. Esto es especialmente cierto para los sistemas de teleconferencia. Las teleconferencias, con varios participates en diferentes ubicaciones, son manejadas por Unidades de Control Multipunto (MCU, Multipoint Control Unit). Su finalidad es mezclar los diversos flujos de entrada y de salida en los que los datos de audio se presentan en un formato codificado.
De acuerdo con el estado de la tecnica, todos los flujos de entrada son descodificados en la MCU y, a continuacion, se analizan adicionalmente los datos de audio para identificar los flujos mas dominantes que se mezclan para dar un flujo de salida. Esto quiere decir que, de acuerdo con el estado de la tecnica, todos los flujos de entrada son descodificados por codificacion de Huffman, se ajustan a escala y se cuantifican inversamente para el analisis adicional de los flujos de entrada mas adelante con el fin de identificar los flujos mas dominantes, por ejemplo, los flujos que muestran el nivel mas elevado, por ejemplo, que muestran la mayor energfa. El enfoque del estado de la tecnica para estimar un nivel, por ejemplo la energfa, de una banda de factores de escala sena realizar la descodificacion de Huffman y la cuantificacion inversa para todos los valores espectrales y computar la energfa mediante la suma del cuadrado de todos los valores espectrales inversamente cuantificados.
El objeto de la presente invencion es proporcionar conceptos mejorados para la estimacion del nivel de una senal de audio codificada. El objeto de la presente invencion se soluciona por medio de un aparato de acuerdo con la reivindicacion 1, un metodo de acuerdo con la reivindicacion 14 y un programa informatico de acuerdo con la reivindicacion 19.
Se proporciona un aparato para la estimacion de nivel de una senal de audio codificada. El aparato comprende un determinador de libros de codigos para determinar un libro de codigos para una pluralidad de libros de codigos como libro de codigos identificado, en el que la senal de audio se ha codificado mediante el empleo del libro de codigos identificado. El aparato comprende adicionalmente una unidad de estimacion configurada para obtener un valor de nivel asociado con el libro de codigos identificado como un valor de nivel obtenido. Ademas, la unidad de estimacion esta adaptada para estimar un nivel estimado de la senal de audio usando el valor de nivel obtenido.
En una realizacion, el valor de nivel obtenido puede ser un valor de energfa obtenido y el aparato para la estimacion de nivel puede estar adaptado para llevar a cabo una estimacion de la energfa como estimacion de nivel. En otra realizacion, el valor de nivel obtenido puede ser un valor de amplitud obtenido y el aparato para la estimacion de nivel puede estar adaptado para llevar a cabo una estimacion de la amplitud como estimacion de nivel. En una realizacion adicional, el valor de nivel obtenido puede ser un valor de volumen sonoro obtenido y el aparato para la estimacion de nivel puede estar adaptado para llevar a cabo una estimacion de volumen sonoro como estimacion de nivel.
La presente invencion se basa en el hallazgo de que, con el fin de reducir la complejidad para todas las etapas de descodificacion, se puede estimar el nivel, por ejemplo la energfa, la amplitud o el volumen sonoro, directamente a partir de los parametros de flujo de bits para la identificacion de los flujos mas dominantes. La estimacion de nivel, por ejemplo, la estimacion de energfa, la estimacion de amplitud o la estimacion de volumen sonoro, se puede basar en la informacion de flujo de bits, por ejemplo, los elementos del flujo de bits, por ejemplo, el libro de codigos de Huffman, el factor de escala y, por ejemplo, los coeficientes de filtro de TNS. Estos elementos del flujo de bits se pueden usar para estimar el nivel de un flujo AAC-ELD correspondiente (AAC-ELD: Advanced Audio Coding - Enhanced Low Delay, Codificacion Avanzada de Audio - Retardo Bajo Potenciado). Por lo tanto, de acuerdo con la presente invencion, no es necesario descodificar por completo un flujo de bits de audio sino que, por el contrario, mediante la provision de una estimacion de nivel sobre la base de la determinacion de un libro de codigos que se ha empleado para codificar la senal de audio, mediante la obtencion de un valor de nivel asociado con el libro de codigos identificado y mediante la estimacion de una estimacion de nivel de la senal de audio usando el valor de nivel.
5
10
15
20
25
30
35
40
45
50
55
60
En una realizacion, la unidad de estimacion comprende una unidad de ajuste a escala. La unidad de ajuste a escala puede estar adaptada para obtener un factor de escala en relacion con la senal de audio codificada o con una porcion de la senal de audio codificada como un factor de escala obtenido. La unidad de ajuste a escala puede estar adaptada para obtener un valor de nivel ajustado a escala, por ejemplo un valor de energfa, de amplitud o de volumen sonoro ajustado a escala, sobre la base del factor de escala y el valor de nivel obtenido. Ademas, la unidad de estimacion puede estar adaptada para estimar una estimacion de nivel de la senal de audio usando el valor de nivel ajustado a escala. De acuerdo con la presente realizacion, la estimacion de valor se proporciona sobre la base de una informacion acerca del libro de codigos que se ha usado para codificar la senal de audio, de un valor de nivel que esta asociado con el libro de codigos identificado y de un factor de escala.
En una realizacion, el valor de nivel obtenido es un valor de energfa y la unidad de ajuste a escala esta adaptada para aplicar el factor de escala obtenido sobre el valor de energfa obtenido para obtener un valor de energfa ajustado a escala mediante la multiplicacion del valor de energfa obtenido por el cuadrado del factor de escala obtenido. De esta manera, el factor de escala obtenido se aplica sobre la energfa obtenida de manera similar a la aplicacion del factor de escala a los coeficientes espectrales inversamente cuantificados sin ajustar a escala en el descodificador de acuerdo con la norma AAC de MPEG-2, pero sin la necesidad de descodificar los coeficientes espectrales.
En otra realizacion, el valor de nivel obtenido es un valor de amplitud y la unidad de ajuste a escala esta adaptada para aplicar el factor de escala obtenido sobre el valor de amplitud obtenido para obtener un valor de amplitud ajustado a escala mediante la multiplicacion del valor de amplitud obtenido por el factor de escala obtenido.
En una realizacion adicional, el valor de nivel obtenido es un valor de volumen sonoro y la unidad de ajuste a escala esta adaptada para aplicar el factor de escala obtenido sobre el valor de volumen sonoro obtenido para obtener un valor de volumen sonoro ajustado a escala mediante la multiplicacion del valor de volumen sonoro obtenido por el cubo del factor de escala obtenido. Existen maneras alternativas de calcular el volumen sonoro tales como, por ejemplo, por un exponente de 3/2. Por lo general, los factores de escala han de ser transformados al dominio del volumen sonoro, cuando el valor de nivel obtenido es un valor de volumen sonoro.
En otra realizacion, la unidad de estimacion esta configurada para estimar una estimacion de nivel de la senal de audio usando un valor de nivel particular como valor de nivel obtenido. Por lo tanto, la unidad de estimacion esta configurada, en particular, para llevar a cabo la estimacion de nivel sobre la base de un tipo particular de valor de nivel.
En una realizacion, el valor de nivel obtenido es un valor de energfa obtenido y la unidad de estimacion esta configurada para estimar una estimacion de energfa como estimacion de nivel de la senal de audio usando como valor de energfa obtenido un valor de energfa del libro de codigos, que indica una suma de los valores de suma de energfa ponderados segun su probabilidad y promediados de todas las palabras de codigo del libro de codigos identificado. Cada valor de suma ponderado segun su probabilidad promedio indica una relacion de un valor de suma de energfa ponderado segun su probabilidad de una palabra de codigo del libro de codigos identificado por un valor de dimension asociado con el libro de codigos. Cada valor de suma de energfa ponderado segun su probabilidad indica un producto de un valor de suma de energfa de una palabra de codigo en cuestion del libro de codigos identificado, por un valor de probabilidad asociado con la palabra de codigo en cuestion del libro de codigos identificado. Cada valor de suma de energfa indica valores numericos de una secuencia de valores de energfa de una palabra de codigo del libro de codigos identificado. Cada secuencia de valores de energfa indica un valor cuadratico para cada valor de una secuencia inversamente cuantificada de valores numericos de una secuencia de valores numericos de una palabra de codigo para cada palabra de codigo del libro de codigos. Cada secuencia de valores numericos es una secuencia de valores numericos codificada por una palabra de codigo del libro de codigos.
En una realizacion adicional, la unidad de estimacion comprende adicionalmente un elemento de obtencion de valores de nivel. El elemento de obtencion de valores de nivel esta adaptado para obtener el valor de nivel obtenido mediante la consulta del valor de nivel asociado con el libro de codigos identificado en una memoria. En una realizacion alternativa, el elemento de obtencion de valores de nivel esta adaptado para solicitar el valor de nivel asociado con el libro de codigos identificado a una base de datos local. En otra realizacion adicional, el elemento de obtencion de valores de nivel esta adaptado para solicitar el valor de nivel asociado con el libro de codigos identificado a un ordenador remoto.
En otra realizacion, el aparato comprende adicionalmente una memoria o una base de datos que tiene almacenada en la misma una pluralidad de valores de memoria de nivel de libro de codigos que indican un nivel de valor que esta asociado con un libro de codigos, en la que cada uno de la pluralidad de libros de codigos tiene un valor de memoria de nivel de libro de codigos asociado con el mismo y almacenado en la memoria o en la base de datos. El elemento de obtencion de valores de nivel esta configurado para obtener el valor de nivel asociado con el libro de codigos identificado mediante la obtencion de un valor de memoria de nivel de libro de codigos asociado con el libro de
5
10
15
20
25
30
35
40
45
50
55
60
codigos identificado para la memoria o a partir de la base de datos.
En una realizacion, la memoria o la base de datos tiene almacenada en la misma una pluralidad de valores de memoria de energfa de libro de codigos, como valores de nivel de memoria de libro de codigos, en la que cada valor de memoria de energfa de libro de codigos indica una suma de valores de suma de energfa ponderados segun su probabilidad y promediados de todas las palabras de codigo del libro de codigos identificado. Cada valor de suma de energfa indica valores numericos de una secuencia de valores de energfa de una palabra de codigo del libro de codigos identificado. Ademas, cada secuencia de valores de energfa indica un valor cuadratico para cada valor de una secuencia inversamente cuantificada de valores numericos de una secuencia de valores numericos de una palabra de codigo para cada palabra de codigo del libro de codigos. Cada secuencia de valores numericos es una secuencia de valores numericos almacenada por una palabra de codigo del libro de codigos. La presente realizacion incluye una memoria o una base de datos que tiene almacenada en la misma una pluralidad de valores de memoria de energfa de libro de codigos que esta asociada con un libro de codigos particular, en la que los valores de memoria de energfa de libro de codigos almacenados tienen unas propiedades especiales que son particularmente adecuadas para ser usadas para la estimacion de energfa.
En otra realizacion, la memoria o la base de datos tiene almacenada en la misma una pluralidad de valores de amplitud como valores de nivel de memoria de libro de codigos. En una realizacion adicional, la memoria o la base de datos tiene almacenada en la misma una pluralidad de valores de volumen sonoro como valores de nivel de memoria de libro de codigos.
En otra realizacion, la unidad de estimacion comprende adicionalmente un elemento de ajuste de filtro de prediccion. El elemento de ajuste de filtro de prediccion esta adaptado para obtener uno o mas coeficientes de filtro de
prediccion en relacion con la senal de audio codificada o con una porcion de la senal de audio codificada como
coeficientes de filtro de prediccion obtenidos. El elemento de ajuste de filtro de prediccion esta adaptado ademas para obtener un valor de nivel ajustado por filtro de prediccion sobre la base de los coeficientes de filtro de prediccion y el valor de nivel obtenido. Ademas, la unidad de estimacion esta adaptada para estimar una estimacion de nivel de la senal de audio usando el valor de nivel ajustado por filtro de prediccion.
De acuerdo con otra realizacion, se proporciona un aparato para generar un flujo de datos de retorno para una pluralidad de participates en un sistema de teleconferencia. El aparato comprende una interfaz de recepcion para recibir una pluralidad de flujos de datos de participate que comprenden senales de audio a partir de la pluralidad de participates. Ademas, el aparato para generar un flujo de datos de retorno comprende un aparato para la
estimacion de nivel de una senal de audio codificada de acuerdo con una de las realizaciones que se han descrito
en lo que antecede. El aparato para la estimacion de nivel esta dispuesto para llevar a cabo una estimacion de nivel para cada flujo de datos de participate sin descodificar por completo el flujo de datos. Ademas, el aparato para generar un flujo de datos de retorno comprende un elemento de decision para decidir si un flujo de datos de participate se ha de incluir, o no, en el flujo de datos de retorno sobre la base de la estimacion de nivel. Ademas, el aparato para generar un flujo de datos de retorno comprende un mezclador para mezclar solo los flujos de datos de participate que se han de incluir en el flujo de datos de retorno y para no incluir los flujos de datos de participate que se decidiera no incluir. El aparato para generar un flujo de datos de retorno esta configurado para no descodificar por completo los flujos de datos de participate que se decidiera no incluir en el flujo de datos de retorno. En una realizacion, el elemento de decision esta adaptado para decidir que un flujo de datos de participate en cuestion no se incluye en el flujo de datos de retorno cuando la estimacion de nivel del flujo de datos de participate en cuestion esta por debajo de un valor umbral. En una realizacion adicional, el elemento de decision esta adaptado para decidir que el unico flujo de datos que se incluye en el flujo de datos de retorno es el flujo de datos que tiene la estimacion de nivel mas alta de las estimaciones de nivel de todos los flujos de datos de participate con respecto a una banda de factores de escala particular.
De acuerdo con una realizacion, se proporciona un metodo para generar un valor de nivel asociado con un libro de codigos. El metodo comprende: Determinar una secuencia de valores numericos asociada con una palabra de codigo del libro de codigos para cada palabra de codigo del libro de codigos. Determinar una secuencia inversamente cuantificada de valores numericos para cada palabra de codigo del libro de codigos mediante la aplicacion de un cuantificador inverso a los valores numericos de la secuencia de valores numericos de una palabra de codigo para cada palabra de codigo del libro de codigos. Calcular una secuencia de valores de nivel para cada palabra de codigo del libro de codigos mediante la obtencion del cuadrado de cada valor de la secuencia inversamente cuantificada de valores numericos de una palabra de codigo para cada palabra de codigo del libro de codigos. Calcular un valor de suma de nivel para cada palabra de codigo del libro de codigos mediante la suma de los valores de la secuencia de valores de nivel para cada palabra de codigo del libro de codigos. Determinar un valor de suma de nivel ponderado segun su probabilidad para cada palabra de codigo del libro de codigos mediante la multiplicacion del valor de suma de nivel de una palabra de codigo por un valor de probabilidad asociado con la palabra de codigo para cada palabra de codigo del libro de codigos. Determinar un valor de suma de nivel ponderado segun su probabilidad y promediado para cada palabra de codigo del libro de codigos mediante la division del valor de suma de nivel ponderado segun su probabilidad de una palabra de codigo por un valor de
5
10
15
20
25
30
35
40
45
50
55
60
dimension asociado con el libro de codigos para cada palabra de codigo del libro de codigos y calcular el valor de nivel de libro de codigos mediante la suma del valor de suma de nivel ponderado segun su probabilidad promedio de todas las palabras de codigo.
Realizaciones preferidas se explican con referencia a las figuras, en las que
la figura 1 la figura 2 la figura 3 las figuras 4a y 4b la figura 5
la figura 6 la figura 7 la figura 8 la figura 9 la figura 10
ilustra un aparato para la estimacion de nivel de acuerdo con una realizacion, ilustra una unidad de estimacion de acuerdo con una realizacion, muestra una unidad de estimacion de acuerdo con otra realizacion, ilustran un metodo para generar un valor de nivel,
ilustra una unidad de estimacion de acuerdo con una realizacion adicional, que comprende un elemento de ajuste de filtro de prediccion,
ilustra un aparato para generar un flujo de datos de retorno,
ilustra un codificador de acuerdo con el estado de la tecnica,
ilustra un descodificador de acuerdo con el estado de la tecnica,
ilustra otro codificador de acuerdo con el estado de la tecnica, y
ilustra un descodificador adicional de acuerdo con el estado de la tecnica.
La figura 1 ilustra un aparato de acuerdo con una realizacion. El aparato comprende un determinador de libros de codigos 110 y una unidad de estimacion 120. El determinador de libros de codigos 110 esta adaptado para determinar un libro de codigos a partir de una pluralidad de libros de codigos como un libro de codigos identificado, en el que la senal de audio se ha codificado mediante el empleo del libro de codigos identificado. La unidad de estimacion 120 esta adaptada para obtener un valor de nivel, por ejemplo un valor de energfa, un valor de amplitud o un valor de volumen sonoro, asociado con el libro de codigos identificado como un valor de nivel obtenido. Ademas, la unidad de estimacion 120 esta adaptada para estimar una estimacion de nivel, por ejemplo una estimacion de energfa, una estimacion de amplitud o una estimacion de volumen sonoro, de la senal de audio usando el valor de nivel obtenido. Por ejemplo, el determinador de libros de codigos 110 puede determinar el libro de codigos, que ha sido usado por un codificador para codificar la senal de audio, mediante la recepcion de informacion secundaria transmitida junto con la senal de audio codificada. En particular, la informacion secundaria puede comprender informacion que identifica el libro de codigos usado para codificar una seccion en cuestion de la senal de audio. Esta informacion se puede transmitir, por ejemplo, del codificador al descodificador como un numero, que identifica un libro de codigos de Huffman usado para codificar la seccion en cuestion de la senal de audio.
La figura 2 ilustra una unidad de estimacion de acuerdo con una realizacion. La unidad de estimacion comprende un elemento de obtencion de valores de nivel 210 y una unidad de ajuste a escala 220. El elemento de obtencion de valores de nivel esta adaptado para obtener un valor de nivel asociado con el libro de codigos identificado, es decir, el libro de codigos que fue usado por el codificador para codificar los datos espectrales, mediante la consulta del valor de nivel en una memoria, mediante la solicitud del valor de nivel a una base de datos local o mediante la solicitud del valor de nivel asociado con el libro de codigos identificado a un ordenador remoto. En una realizacion, el valor de nivel, que es consultado o solicitado por el elemento de obtencion de valores de nivel, puede ser un valor de nivel promedio que indica un nivel promedio de un valor espectral sin ajustar a escala codificado mediante el uso del libro de codigos identificado.
De esta manera, el valor de nivel obtenido no se calcula a partir de los valores espectrales reales sino que, en su lugar, se usa un valor de nivel promedio que depende solo del libro de codigos empleado. Tal como se ha explicado en lo que antecede, el codificador esta adaptado, por lo general, para seleccionar el libro de codigos de entre una pluralidad de libros de codigos que son mas adecuados para codificar los respectivos datos espectrales de una seccion de la senal de audio. Debido a que los libros de codigos difieren, por ejemplo, con respecto a su valor absoluto maximo que se puede codificar, el valor promedio que es codificado por un libro de codigos de Huffman difiere de un libro de codigos a otro libro de codigos y, por lo tanto, tambien el valor de nivel promedio de un coeficiente espectral codificado que es codificado por un determinado libro de codigos difiere de un libro de codigos a otro libro de codigos.
Por lo tanto, de acuerdo con una realizacion, un valor de nivel promedio para codificar un coeficiente espectral de una senal de audio que emplea un libro de codigos de Huffman particular se puede determinar para cada libro de
5
10
15
20
25
30
35
40
45
50
55
60
codigos de Huffman y se puede almacenar, por ejemplo, en una memoria, en una base de datos o en un ordenador remote. El elemento de obtencion de valores de nivel simplemente ha de consultar o solicitar entonces, el valor de nivel asociado con el libro de codigos identificado que se ha empleado para codificar los datos espectrales, para obtener el valor de nivel obtenido asociado con el libro de codigos identificado.
Sin embargo, se ha de tener en cuenta que, con frecuencia, los libros de codigos de Huffman se emplean para codificar valores espectrales sin ajustar a escala, como es el caso para la norma AAC de MPEG. Sin embargo, entonces se ha de tener en cuenta el ajuste a escala cuando se lleva a cabo una estimacion de nivel. Por lo tanto, la unidad de estimacion de la figura 2 tambien comprende una unidad de ajuste a escala 220. La unidad de ajuste a escala esta adaptada para obtener un factor de escala en relacion con la senal de audio codificada o con una porcion de la senal de audio codificada como un factor de escala obtenido. Por ejemplo, con respecto a un descodificador, la unidad de ajuste a escala 220 determinara un factor de escala para cada banda de factores de escala. Por ejemplo, la unidad de ajuste a escala 220 puede recibir informacion acerca del factor de escala de una banda de factores de escala mediante la recepcion de informacion secundaria transmitida de un codificador al descodificador. La unidad de ajuste a escala 220 esta adaptada ademas para determinar un valor de nivel ajustado a escala sobre la base del factor de escala y el valor de nivel obtenido.
En una realizacion, en la que el valor de nivel obtenido es un valor de energfa obtenido, la unidad de ajuste a escala esta adaptada para aplicar el factor de escala obtenido sobre el valor de energfa obtenido para obtener un valor de nivel ajustado a escala mediante la multiplicacion del valor de energfa obtenido por el cuadrado del factor de escala obtenido.
En otra realizacion, en la que el valor de nivel obtenido es un valor de amplitud obtenido, y la unidad de ajuste a escala esta adaptada para aplicar el factor de escala obtenido sobre el valor de amplitud obtenido para obtener un valor de nivel ajustado a escala mediante la multiplicacion del valor de amplitud obtenido por el factor de escala obtenido.
En una realizacion adicional, en la que el valor de nivel obtenido es un valor de volumen sonoro obtenido, y la unidad de ajuste a escala (220) esta adaptada para aplicar el factor de escala obtenido sobre el valor de volumen sonoro obtenido para obtener un valor de nivel ajustado a escala mediante la multiplicacion del valor de volumen sonoro obtenido por el cubo del factor de escala obtenido. Existen maneras alternativas de calcular el volumen sonoro tales como, por ejemplo, por un exponente de 3/2. Por lo general, los factores de escala se han de transformar al dominio del volumen sonoro cuando el valor de nivel obtenido es un valor de volumen sonoro.
Estas realizaciones tienen en cuenta que un valor de energfa se determina sobre la base del cuadrado de los coeficientes espectrales de una senal de audio, que el valor de amplitud se determina sobre la base de los valores absolutos de los coeficientes espectrales de una senal de audio y que el valor de volumen sonoro se determina sobre la base de los coeficientes espectrales de una senal de audio que se han transformado al dominio del volumen sonoro.
La unidad de estimacion esta adaptada para estimar una estimacion de nivel de la senal de audio usando el valor de nivel ajustado a escala. En la realizacion de la figura 2, la unidad de estimacion esta adaptada para emitir el valor de nivel ajustado a escala como la estimacion de nivel. En este caso, no se lleva a cabo post-procesamiento alguno del valor de nivel ajustado a escala. Sin embargo, tal como se ilustra en la realizacion de la figura 3, la unidad de estimacion tambien puede estar adaptada para llevar a cabo un post-procesamiento. Por lo tanto, la unidad de estimacion de la figura 3 comprende un post-procesador 230 para post-procesar uno o mas valores de nivel ajustados a escala para estimar una estimacion de nivel. Por ejemplo, la estimacion de nivel de la unidad de estimacion puede ser determinada por el post-procesador 230 mediante la determinacion de un valor promedio de una pluralidad de valores de nivel ajustados a escala. Este valor promediado puede ser emitido por la unidad de estimacion como estimacion de nivel.
A diferencia de las realizaciones presentadas, un enfoque del estado de la tecnica para estimar, por ejemplo, la energfa de una banda de factores de escala sena realizar la descodificacion de Huffman y la cuantificacion inversa para todos los valores espectrales y computar la energfa mediante la suma del cuadrado de todos los valores espectrales inversamente cuantificados.
En las realizaciones propuestas, sin embargo, este proceso del estado de la tecnica, complejo desde el punto de vista informatico, se reemplaza por una estimacion del nivel promedio que solo depende del factor de escala y los usos del libro de codigos y no de los valores cuantificados reales.
Las realizaciones de la presente invencion emplean el hecho de que un libro de codigos de Huffman esta disenado para proporcionar una codificacion optima siguiendo una estadfstica dedicada. Esto quiere decir que el libro de codigos ha sido disenado de acuerdo con la probabilidad de los datos, por ejemplo, AAC-ELD (AAC-ELD = Codificacion Avanzada de Audio de Retardo Bajo Potenciado): lmeas espectrales. Este proceso se puede invertir
5
10
15
20
25
30
35
40
45
50
55
60
para obtener la probabilidad de los datos de acuerdo con el libro de codigos. La probabilidad de cada entrada de datos dentro de un libro de codigos (mdice) viene dada por la longitud de la palabra de codigo. Por ejemplo,
p (mdice) = 2A-longitud(palabra de codigo)
es decir,
p (mdice) = 2_l°ngitud(palabra de codigo)
en la que p(mdice) es la probabilidad de una entrada de datos (un mdice) dentro de un libro de codigos.
Sobre la base de esto, el nivel esperado se puede pre-computar y almacenar de la siguiente manera: cada mdice representa una secuencia de valores enteros (x), por ejemplo, lmeas espectrales, en la que la longitud de la secuencia depende de la dimension del libro de codigos, por ejemplo, 2 o 4 en el caso de AAC-ELD.
Las figuras 4a y 4b ilustran un metodo para generar un valor de nivel, por ejemplo un valor de energfa, un valor de amplitud o un valor de volumen sonoro, asociado con un libro de codigos de acuerdo con una realizacion. El metodo comprende:
Determinar una secuencia de valores numericos asociada con una palabra de codigo del libro de codigos para cada palabra de codigo del libro de codigos (la etapa 410). Tal como se ha explicado en lo que antecede, un libro de codigos codifica una secuencia de valores numericos, por ejemplo, 2 o 4 valores numericos mediante una palabra de codigo del libro de codigos. El libro de codigos comprende una pluralidad de palabras de codigo para codificar una pluralidad de secuencias de valores numericos. La secuencia de valores numericos, que se determina, es la secuencia de valores numericos codificada por la palabra de codigo en cuestion del libro de codigos. La etapa 410 se lleva a cabo para cada palabra de codigo del libro de codigos. Por ejemplo, si el libro de codigos comprende 81 palabras de codigo, en la etapa 410 se determinan 81 secuencias de valores numericos.
En la etapa 420 se determina una secuencia inversamente cuantificada de valores numericos para cada palabra de codigo del libro de codigos mediante la aplicacion de un cuantificador inverso a los valores numericos de la secuencia de valores numericos de una palabra de codigo para cada palabra de codigo del libro de codigos. Tal como se ha explicado en lo que antecede, por lo general, un codificador puede emplear una cuantificacion en la codificacion de los valores espectrales de la senal de audio, por ejemplo una cuantificacion no lineal. Como consecuencia, esta cuantificacion se ha de invertir en un lado de descodificador.
Mas adelante, en la etapa 430, se determina una secuencia de valores de nivel para cada palabra de codigo del libro de codigos.
Si se ha de generar un valor de energfa como el valor de nivel de libro de codigos, entonces se determina una secuencia de valores de energfa para cada palabra de codigo, y se calcula el cuadrado de cada valor de la secuencia inversamente cuantificada de valores numericos para cada palabra de codigo del libro de codigos.
Sin embargo, si se ha de generar un valor de amplitud como el valor de nivel de libro de codigos, entonces se determina una secuencia de valores de amplitud para cada palabra de codigo y se calcula el valor absoluto de cada valor de la secuencia inversamente cuantificada de valores numericos para cada palabra de codigo del libro de codigos.
No obstante, si se ha de generar un valor de volumen sonoro como el valor de nivel de libro de codigos, entonces se determina una secuencia de valores de volumen sonoro para cada palabra de codigo y se calcula el cubo de cada valor de la secuencia inversamente cuantificada de valores numericos para cada palabra de codigo del libro de codigos. Existen maneras alternativas de calcular el volumen sonoro tales como, por ejemplo, por un exponente de 3/2. Por lo general, se han de transformar los valores de la secuencia inversamente cuantificada de valores numericos al dominio del volumen sonoro, cuando se ha de generar un valor de volumen sonoro como el valor de nivel de libro de codigos.
Posteriormente, en la etapa 440, se calcula un valor de suma de nivel para cada palabra de codigo del libro de codigos mediante la suma de los valores de la secuencia de valores de nivel para cada palabra de codigo del libro de codigos.
A continuacion, en la etapa 450, se determina un valor de suma de nivel ponderado segun su probabilidad para cada palabra de codigo del libro de codigos mediante la multiplicacion del valor de suma de nivel de una palabra de codigo por un valor de probabilidad asociado con la palabra de codigo para cada palabra de codigo del libro de codigos. De esta manera, se tiene en cuenta que algunas de las secuencias de valores numericos, por ejemplo, secuencias de coeficientes espectrales, no aparecen con tanta frecuencia como otras secuencias de coeficientes
5
10
15
20
25
30
35
40
45
50
55
60
espectrales. El valor de probabilidad asociado con la palabra de codigo tiene esto en cuenta. Se puede obtener un valor de probabilidad de este tipo a partir de la longitud de la palabra de codigo, debido a que las palabras de codigo que resulta mas probable que aparezcan se codifican mediante el uso de palabras de codigo que tienen una menor longitud, en tanto que otras palabras de codigo que resulta menos probable que aparezcan se codifican mediante el uso de palabras de codigo que tienen una mayor longitud, cuando se emplea la codificacion de Huffman.
En la etapa 460, se determinara un valor de suma de nivel ponderado segun su probabilidad y promediado para cada palabra de codigo del libro de codigos mediante la division del valor de suma de nivel ponderado segun su probabilidad de una palabra de codigo por un valor de dimension asociado con el libro de codigos para cada palabra de codigo del libro de codigos. Un valor de dimension indica el numero de valores espectrales que son codificados por una palabra de codigo del libro de codigos. De esta manera, se determina un valor de suma de nivel ponderado segun su probabilidad y promediado que representa un valor de nivel (ponderado segun su probabilidad) para un coeficiente espectral que es codificado por la palabra de codigo.
A continuacion, en la etapa 470, se calcula el valor de nivel de libro de codigos mediante la suma del valor de suma de nivel ponderado segun su probabilidad y promediado de todas las palabras de codigo.
Se ha de hacer notar que una generacion como esa de un valor de nivel solo ha de hacerse, de hecho, una vez para un libro de codigos. Si se determina el valor de nivel de un libro de codigos, este valor puede, simplemente, ser consultado y usado, por ejemplo, por un aparato, para la estimacion de nivel de acuerdo con las realizaciones que se han descrito en lo que antecede.
En lo sucesivo se presenta un metodo para generar un valor de energfa asociado con un libro de codigos de acuerdo con una realizacion. Con el fin de estimar el valor esperado de los datos de energfa codificados con el libro de codigos dado, las siguientes etapas se han de realizar solo una vez para cada mdice del libro de codigos:
A) aplicar el cuantificador inverso a los valores enteros de la secuencia (por ejemplo AAC-ELD: xa(4/3))
B) calcular la energfa mediante la obtencion del cuadrado de cada valor de la secuencia de A)
C) calcular la suma de la secuencia de B)
D) multiplicar C) por la probabilidad dada del mdice
E) dividir por la dimension del libro de codigos para obtener la energfa esperada por lmea espectral.
Por ultimo, se han de sumar todos los valores calculados mediante E) para obtener la energfa esperada del libro de codigos completo.
Despues de que la salida de estas etapas se haya almacenado en una tabla, los valores de energfa simplemente se pueden consultar sobre la base del mdice del libro de codigos, es decir, dependiendo de que libro de codigos se usa. No es necesario descodificar por codificacion de Huffman los valores espectrales reales para esta estimacion.
Para estimar la energfa total de los datos espectrales de una trama de audio completa, se ha de tener en cuenta el factor de escala. El factor de escala se puede extraer del flujo de bits sin una cantidad de complejidad significativa. El factor de escala se puede modificar antes de su aplicacion a la energfa esperada; por ejemplo se puede calcular el cuadrado del factor de escala usado. A continuacion, la energfa esperada se multiplica por el cuadrado del factor de escala usado.
De acuerdo con las realizaciones que se han descrito en lo que antecede, se puede estimar el nivel espectral para cada banda de factores de escala sin descodificar los valores espectrales codificados por codificacion de Huffman. Se pueden emplear las estimaciones del nivel para identificar flujos con un bajo nivel, por ejemplo con baja potencia, que no son relevantes para un proceso de mezclado posterior. Por lo tanto, se puede evitar la descodificacion completa de tales flujos.
De acuerdo con una realizacion, un aparato para la estimacion de nivel comprende adicionalmente una memoria o una base de datos que tiene almacenada en la misma una pluralidad de valores de memoria de nivel de libro de codigos que indican un valor de nivel que esta asociado con un libro de codigos, en el que cada uno de la pluralidad de libros de codigos tiene un valor de memoria de nivel de libro de codigos asociado con el mismo almacenado en la memoria o en la base de datos. Ademas, el elemento de obtencion de valores de nivel esta configurado para obtener el valor de nivel asociado con el libro de codigos identificado mediante la obtencion de un valor de memoria de nivel de libro de codigos asociado con el libro de codigos identificado a partir de la memoria o a partir de la base de datos.
El nivel estimado de acuerdo con las realizaciones que se han descrito en lo que antecede puede variar si una etapa
5
10
15
20
25
30
35
40
45
50
55
60
de procesamiento adicional como una prediccion, tal como un filtrado de prediccion, se aplica en el codec, por ejemplo, en el caso del filtrado de TNS (Modelado Temporal de Ruido) de aAC-ELD. En este caso, los coeficientes de la prediccion se transmiten dentro del flujo de bits, por ejemplo, en el caso del TNS como coeficientes PARCOR.
La figura 5 ilustra una realizacion en la que la unidad de estimacion comprende adicionalmente un elemento de ajuste de filtro de prediccion 240. El elemento de ajuste de filtro de prediccion esta adaptado para obtener uno o mas coeficientes de filtro de prediccion en relacion con la senal de audio codificada o con una porcion de la senal de audio codificada como coeficientes de filtro de prediccion obtenidos. Ademas, el elemento de ajuste de filtro de prediccion esta adaptado para obtener un valor de nivel ajustado por filtro de prediccion sobre la base de los coeficientes de filtro de prediccion y el valor de nivel obtenido. Ademas, la unidad de estimacion esta adaptada para estimar una estimacion de nivel de la senal de audio usando el valor de nivel ajustado por filtro de prediccion.
En una realizacion, se usan los coeficientes PARCOR para el TNS como unos coeficientes de filtro de prediccion. Se puede determinar la ganancia de prediccion del proceso de filtrado a partir de esos coeficientes de una manera muy eficiente. Con respecto al TNS, la ganancia de prediccion se puede calcular de acuerdo con la formula: ganancia = 1/prod (1 - parcor a2).
Por ejemplo, si se han de tener en cuenta 3 coeficientes PARCOR, por ejemplo, parcori, parcor y parcor, la ganancia se calcula de acuerdo con la formula:
1
ganancia = 7-------------^^n
(1 - parcor, J — parcor2 ) (1 — parcor3 J
En el caso de n coeficientes PARCOR parcori, parcor2, ... parcorn, es de aplicacion la siguiente formula:
1
ganancia = 7-------------^^n
(1 - parcor, J(1 — parcor2 ) (1 — parcorn )
Esto quiere decir que la amplificacion de la senal de audio por medio de filtrado se puede estimar sin aplicar la operacion de filtrado en sf
Se puede emplear un aparato para la estimacion de nivel de acuerdo con una de las realizaciones que se han descrito en lo que antecede para los sistemas de sistemas de teleconferencia, por ejemplo, para una Unidad de Control Multipunto (MCU).
La figura 6 ilustra un aparato para generar un flujo de datos de retorno para una pluralidad de participates en un sistema de teleconferencia de acuerdo con una realizacion. El aparato comprende una interfaz de recepcion 610 para recibir una pluralidad de flujos de datos de participate pi, p2, ... pn. Los flujos de datos de participate pi, p2, ... pn comprenden senales de audio a partir de la pluralidad de participates. Ademas, el aparato para generar un flujo de datos de retorno comprende un aparato 620 para la estimacion de nivel de una senal de audio codificada de acuerdo con una de las realizaciones que se han descrito en lo que antecede, en el que el aparato 620 para la estimacion de nivel esta dispuesto para llevar a cabo una estimacion de nivel para cada flujo de datos de participate sin descodificar por completo el flujo de datos. Tal como se ilustra en la figura 6, el aparato para la estimacion de nivel recibe los flujos de datos de audio pi, p2, ... pn y lleva a cabo una estimacion de nivel para cada uno de los flujos de datos de audio recibidos pi, p2, ... pn que comprenden senales de audio. El aparato 620 transmite la estimacion de nivel eei, ee2, ... een en relacion con los flujos de datos de audio pi, p2, ... pn a un elemento de decision 630. El elemento de decision 630 esta adaptado para decidir si un flujo de datos de un participate se ha de incluir, o no, en el flujo de datos de retorno, sobre la base de la estimacion de nivel para cada flujo de datos de participate. El elemento de decision 530 transmite a continuacion una decision deci, dec2, ..., decn, con respecto a si un flujo de datos particular pi, p2, ... pn esta incluido, o no, en el flujo de datos de retorno a un mezclador 640 para cada flujo de datos de participate. El mezclador 640 tambien esta adaptado para recibir los flujos de datos de participate pi, p2, ... pn. Sobre la base de las decisiones deci, dec2, ... decn, el mezclador 640 mezcla solo los flujos de datos de participate que se han de incluir en el flujo de datos de retorno y no incluye los flujos de datos de participate que se ha decidido que no se han incluir.
El aparato para generar un flujo de datos de retorno esta configurado para no descodificar por completo los flujos de datos de participate que se ha decidido que no se han incluir en el flujo de datos de retorno.
En una realizacion, el elemento de decision 630 esta adaptado para decidir que un flujo de datos de participate en cuestion no se incluye en el flujo de datos de retorno cuando la estimacion de nivel del flujo de datos de participate en cuestion esta por debajo de un valor umbral.
En una realizacion, el aparato para generar un flujo de datos de retorno esta adaptado para decidir, de una forma
5
10
15
20
25
30
35
40
45
50
55
60
trama a trama, si un flujo de datos de un participante se ha de incluir, o no, en el flujo de datos de retorno, por ejemplo, se decide para cada trama de audio, si la totalidad de la trama de audio del flujo de datos de participante se ha de incluir, o no, en el flujo de datos de retorno.
En una realizacion alternativa, el aparato para generar un flujo de datos de retorno esta adaptado para decidir, en funcion de la banda de factores de escala, si un flujo de datos de un participante se ha de incluir, o no, en el flujo de datos de retorno, por ejemplo, en el caso de diferentes bandas de factores de escala de una trama de audio, la decision de si una banda de factores de escala esta incluida en el flujo de datos de retorno puede ser diferente.
En una realizacion adicional, el elemento de decision 630 esta adaptado para decidir que el unico flujo de datos que se incluye en el flujo de datos de retorno es el flujo de datos que tiene la estimacion de nivel mas alta de las estimaciones de nivel de todos los flujos de datos de participante con respecto a una banda de factores de escala particular.
En otra realizacion, el elemento de decision 630 esta adaptado para decidir que los unicos dos flujos de datos que se incluyen en el flujo de datos de retorno son los flujos de datos que tienen las dos estimaciones de nivel mas altas de las estimaciones de nivel de todos los flujos de datos de participante con respecto a una banda de factores de escala particular.
En una realizacion alternativa, el aparato para la estimacion de nivel 620 de la figura 6 no es un aparato unico para la estimacion de nivel que estima una estimacion de nivel para cada una de las senales de audio sino que, en su lugar, el aparato 620 comprende una pluralidad de n aparatos para la estimacion de nivel, proporcionando cada aparato para la estimacion de nivel un estimacion de nivel para uno de los n flujos de senales de audio.
El aparato para la estimacion de nivel tambien es aplicable para una variedad de aplicaciones adicionales. En una realizacion, se proporciona un aparato para la administracion de memoria intermedia. El aparato para la administracion de memoria intermedia comprende una unidad de acceso a la memoria intermedia para acceder a unos datos de audio de memoria intermedia de una memoria intermedia como datos de audio de memoria intermedia a los que se ha accedido, en el que los datos de audio de memoria intermedia comprenden una senal de audio codificada. Ademas, el aparato para la administracion de la memoria intermedia comprende un aparato para la estimacion de nivel de la senal de audio codificada de acuerdo con una de las realizaciones anteriores. Ademas, el aparato para la administracion de la memoria intermedia comprende un elemento de decision para decidir si los datos de audio de memoria intermedia a los que se ha accedido se han de borrar, o no, de la memoria intermedia, sobre la base de la estimacion de nivel de la senal de audio codificada.
Un aparato de este tipo para la administracion de memoria intermedia es util, en particular, para administrar una memoria intermedia de fluctuacion de fase, por ejemplo, empleada para VoIP (Voice over Internet Protocol, Voz sobre Protocolo de Internet). Un aparato para la administracion de memoria intermedia de acuerdo con una realizacion esta adaptado para mantener las tramas de audio importantes en la memoria intermedia y esta adaptado para borrar de la memoria intermedia las tramas menos importantes cuando la memoria intermedia esta en un estado en el que existe el peligro de desbordamiento de la memoria intermedia. Por ejemplo, se podna examinar la totalidad del contenido de datos de audio de una memoria intermedia y el aparato para la administracion de la memoria intermedia decide si el contenido de datos de audio (datos de audio de memoria intermedia) se ha de eliminar, o no, de la memoria intermedia, sobre la base de la estimacion de nivel.
En una realizacion, el aparato para almacenar datos de entrada esta adaptado para decidir si los datos de audio se han de guardar o de descartar, de una forma trama a trama, por ejemplo, se decide para cada trama de audio si se ha de guardar o de descartar la totalidad de la trama de audio.
A pesar de que se han descrito algunos aspectos en el contexto de un aparato, es obvio que estos aspectos tambien representan una descripcion del metodo correspondiente, en el que un bloque o dispositivo se corresponde con una etapa del metodo o con una caractenstica de una etapa del metodo. De manera analoga, los aspectos descritos en el contexto de una etapa del metodo tambien representan una descripcion de un bloque o elemento o caractenstica correspondiente de un aparato correspondiente.
Dependiendo de ciertos requisitos de implementacion, las realizaciones de la invencion se pueden implementar en hardware o en software. La implementacion se puede realizar empleando un medio de almacenamiento digital, por ejemplo un disco flexible, un DVD, un Blu-Ray, un CD, una ROM, una PROM, una EPROM, una EEPROM o una memoria FLASH, que tenga almacenadas en el mismo unas senales control electronicamente legibles, que cooperan (o que son capaces de cooperar) con un sistema informatico programable de tal manera que se realice el metodo respectivo.
Algunas realizaciones de acuerdo con la invencion comprenden un soporte de datos no transitorio que tiene senales de control electronicamente legibles, que son capaces de cooperar con un sistema informatico programable de tal
5
10
15
20
25
30
35
40
manera que se realice uno de los metodos que se describen en el presente documento.
Por lo general, las realizaciones de la presente invencion se pueden implementar en forma de producto de programa informatico con un codigo de programa, siendo el codigo de programa operativo para realizar uno de los metodos cuando el programa informatico se ejecuta en un ordenador. El codigo de programa se puede almacenar, por ejemplo, en un soporte legible por maquina.
Otras realizaciones comprenden el programa informatico para realizar uno de los metodos que se describen en el presente documento, almacenado en un soporte legible por maquina.
Dicho de otra forma, una realizacion del metodo de la invencion es, por lo tanto, un programa informatico que tiene un codigo de programa para realizar uno de los metodos que se describen en el presente documento, cuando el programa informatico se ejecuta en un ordenador.
Una realizacion adicional de los metodos de la invencion es, por lo tanto, un soporte de datos (o un medio de almacenamiento digital, o un medio legible por ordenador) que comprende, registrado en el mismo, el programa informatico para realizar uno de los metodos que se describen en el presente documento.
Una realizacion adicional del metodo de la invencion es, por lo tanto, un flujo de datos o una secuencia de senales que representa el programa informatico para realizar uno de los metodos que se describen en el presente documento. El flujo de datos o la secuencia de senales se puede configurar, por ejemplo, para transferirse a traves de una conexion de comunicacion de datos, por ejemplo a traves de Internet.
Una realizacion adicional comprende un medio de procesamiento, por ejemplo un ordenador, o un dispositivo logico programable, configurado o adaptado para realizar uno de los metodos que se describen en el presente documento.
Una realizacion adicional comprende un ordenador que tiene, instalado en el mismo, el programa informatico para realizar uno de los metodos que se describen en el presente documento.
En algunas realizaciones, se puede usar un dispositivo logico programable (por ejemplo una matriz de puertas programables sobre el terreno) para realizar algunas o todas las funcionalidades de los metodos que se describen en el presente documento. En algunas realizaciones, una matriz de puertas programables sobre el terreno puede cooperar con un microprocesador con el fin de realizar uno de los metodos que se describen en el presente documento. Por lo general, los metodos son realizados, preferentemente, por cualquier aparato de hardware.
Las realizaciones que se han descrito en lo que antecede son meramente ilustrativas de los principios de la presente invencion. Se entiende que modificaciones y variaciones de las disposiciones y detalles que se describen en el presente documento seran evidentes para los expertos en la materia. Por lo tanto, se tiene por objeto quedar limitado solo por el alcance de las siguientes reivindicaciones de patente y no por los detalles espedficos presentados a modo de descripcion y explicacion de las realizaciones que se presentan en el presente documento.

Claims (18)

  1. 5
    10
    15
    20
    25
    30
    35
    40
    45
    50
    55
    60
    REIVINDICACIONES
    1. Un aparato para la estimacion de nivel de una senal de audio codificada, que comprende:
    un determinador de libros de codigos (110) para determinar un libro de codigos a partir de una pluralidad de libros de codigos como un libro de codigos identificado, en el que la senal de audio se ha codificado mediante el empleo del libro de codigos identificado, y
    una unidad de estimacion (120) configurada para obtener un valor de nivel asociado con el libro de codigos identificado como un valor de nivel obtenido y para estimar una estimacion de nivel de la senal de audio usando el valor de nivel obtenido.
  2. 2. Un aparato de acuerdo con la reivindicacion 1, en el que la unidad de estimacion (120) comprende una unidad de ajuste a escala (220),
    en el que la unidad de ajuste a escala (220) esta adaptada para obtener un factor de escala en relacion con la senal de audio codificada o con una porcion de la senal de audio codificada como un factor de escala obtenido, en el que la unidad de ajuste a escala (220) esta adaptada para obtener un valor de nivel ajustado a escala sobre la base del factor de escala y el valor de nivel obtenido,
    y en el que la unidad de estimacion (120) esta adaptada para estimar una estimacion de nivel de la senal de audio usando el valor de nivel ajustado a escala.
  3. 3. Un aparato de acuerdo con la reivindicacion 2,
    en el que el valor de nivel obtenido es un valor de energfa obtenido y la unidad de ajuste a escala (220) esta adaptada para aplicar el factor de escala obtenido sobre el valor de energfa obtenido para obtener un valor de nivel ajustado a escala mediante la multiplicacion del valor de energfa obtenido por el cuadrado del factor de escala obtenido, o
    en el que el valor de nivel obtenido es un valor de amplitud obtenido y la unidad de ajuste a escala (220) esta adaptada para aplicar el factor de escala obtenido sobre el valor de amplitud obtenido para obtener un valor de nivel ajustado a escala mediante la multiplicacion del valor de amplitud obtenido por el factor de escala obtenido, o en el que el valor de nivel obtenido es un valor de volumen sonoro obtenido y la unidad de ajuste a escala (220) esta adaptada para transformar el factor de escala obtenido al dominio del volumen sonoro y para aplicar el factor de escala obtenido transformado sobre el valor de volumen sonoro obtenido para obtener un valor de nivel ajustado a escala.
  4. 4. Un aparato de acuerdo con una de las reivindicaciones anteriores, en el que la unidad de estimacion (120) esta configurada para estimar una estimacion de nivel de la senal de audio usando un valor de nivel de libro de codigos que indica una suma de valores de suma de nivel ponderados segun su probabilidad y promediados de todas las palabras de codigo del libro de codigos identificado,
    en el que cada valor de suma de nivel ponderado segun su probabilidad y promediado indica una relacion de un valor de suma de nivel ponderado segun su probabilidad de una palabra de codigo del libro de codigos identificado por un valor de dimension asociado con el libro de codigos,
    en el que cada valor de suma de nivel ponderado segun su probabilidad indica un producto de un valor de suma de nivel de una palabra de codigo en cuestion del libro de codigos identificado por un valor de probabilidad asociado con la palabra de codigo en cuestion del libro de codigos identificado,
    en el que cada valor de suma de nivel indica valores numericos de una secuencia de valores de nivel de una palabra de codigo del libro de codigos identificado,
    en el que cada secuencia de valores de nivel indica un valor cuadratico para cada valor de una secuencia de valores numericos inversamente cuantificados de una secuencia de valores numericos de una palabra de codigo para cada palabra de codigo del libro de codigos cuando el valor de nivel de libro de codigos es un valor de energfa, o cada secuencia de valores de nivel indica un valor absoluto para cada valor de una secuencia de valores numericos inversamente cuantificados de una secuencia de valores numericos de una palabra de codigo para cada palabra de codigo del libro de codigos cuando el valor de nivel de libro de codigos es un valor de amplitud, o cada secuencia de valores de nivel indica que un valor se transforma a un dominio del volumen sonoro para cada valor de una secuencia de valores numericos inversamente cuantificados de una secuencia de valores numericos de una palabra de codigo para cada palabra de codigo del libro de codigos cuando el valor de nivel de libro de codigos es un valor de volumen sonoro, y
    en el que cada secuencia de valores numericos es una secuencia de valores numericos codificados por una palabra de codigo del libro de codigos.
  5. 5. Un aparato de acuerdo con una de las reivindicaciones anteriores, en el que la unidad de estimacion (120) comprende adicionalmente un elemento de obtencion de valores de nivel (210),
    en el que el elemento de obtencion de valores de nivel (210) esta adaptado para obtener el valor de nivel obtenido mediante la consulta del valor de nivel asociado con el libro de codigos identificado en una memoria, en el que el elemento de obtencion de valores de nivel (210) esta adaptado para solicitar el valor de nivel asociado con el libro de codigos identificado a una base de datos local, o
    5
    10
    15
    20
    25
    30
    35
    40
    45
    50
    55
    60
    en el que el elemento de obtencion de valores de nivel (210) esta adaptado para solicitar el valor de nivel asociado con el libro de codigos identificado a un ordenador remoto.
  6. 6. Un aparato de acuerdo con la reivindicacion 5, que comprende adicionalmente una memoria o una base de datos que tiene almacenada en la misma una pluralidad de valores de memoria de nivel de libro de codigos que indican un valor de nivel que esta asociado con un libro de codigos, en el que cada uno de la pluralidad de libros de codigos tiene un valor de memoria de nivel de libro de codigos asociado con el mismo, almacenado en la memoria o en la base de datos, y
    en el que el elemento de obtencion de valores de nivel (210) esta configurado para obtener el valor de nivel asociado con el libro de codigos identificado como el valor de nivel mediante la obtencion de un valor de memoria de nivel de libro de codigos asociado con el libro de codigos identificado a partir de la memoria o a partir de la base de datos.
  7. 7. Un aparato de acuerdo con la reivindicacion 6, en el que la memoria o la base de datos tiene almacenada en la misma la pluralidad de valores de memoria de nivel de libro de codigos,
    en el que cada valor de memoria de nivel de libro de codigos indica una suma de valores de suma de nivel ponderados segun su probabilidad y promediados de todas las palabras de codigo de un libro de codigos asociado, en el que el libro de codigos asociado esta asociado con el valor de memoria de nivel de libro de codigos, en el que cada valor de suma de nivel ponderado segun su probabilidad y promediado indica una relacion de un valor de suma de nivel ponderado segun su probabilidad de una palabra de codigo del libro de codigos asociado con un valor de dimension asociado con el libro de codigos asociado,
    en el que cada valor de suma de nivel ponderado segun su probabilidad indica un producto de un valor de suma de nivel de una palabra de codigo en cuestion del libro de codigos asociado por un valor de probabilidad asociado con la palabra de codigo en cuestion del libro de codigos asociado,
    en el que cada valor de suma de nivel indica valores numericos de una secuencia de valores de nivel de una palabra de codigo del libro de codigos asociado,
    en el que cada secuencia de valores de nivel indica un valor cuadratico para cada valor de una secuencia de valores numericos inversamente cuantificados de una secuencia de valores numericos de una palabra de codigo para cada palabra de codigo del libro de codigos asociado cuando el valor de memoria de nivel de libro de codigos es un valor de energfa, o cada secuencia de valores de nivel indica un valor absoluto para cada valor de una secuencia de valores numericos inversamente cuantificados de una secuencia de valores numericos de una palabra de codigo para cada palabra de codigo del libro de codigos asociado cuando el valor de memoria de nivel de libro de codigos es un valor de amplitud, o cada secuencia de valores de nivel indica que un valor se transforma a un dominio del volumen sonoro para cada valor de una secuencia de valores numericos inversamente cuantificados de una secuencia de valores numericos de una palabra de codigo para cada palabra de codigo del libro de codigos asociado cuando el valor de memoria de nivel de libro de codigos es un valor de volumen sonoro, y en el que cada secuencia de valores numericos es una secuencia de valores numericos codificados por una palabra de codigo del libro de codigos asociado.
  8. 8. Un aparato de acuerdo con una de las reivindicaciones anteriores, en el que la unidad de estimacion (120) comprende adicionalmente un elemento de ajuste de filtro de prediccion,
    en el que el elemento de ajuste de filtro de prediccion (240) esta adaptado para obtener uno o mas coeficientes de filtro de prediccion en relacion con la senal de audio codificada o con una porcion de la senal de audio codificada como coeficientes de filtro de prediccion obtenidos,
    en el que el elemento de ajuste de filtro de prediccion (240) esta adaptado para obtener un valor de nivel ajustado por filtro de prediccion sobre la base de los coeficientes de filtro de prediccion y el valor de nivel obtenido, y en el que la unidad de estimacion (120) esta adaptada para estimar una estimacion de nivel de la senal de audio usando el valor de nivel ajustado por filtro de prediccion.
  9. 9. Aparato para generar un flujo de datos de salida a partir de unos datos de entrada, que comprende:
    una interfaz de recepcion (610) para recibir los datos de entrada que comprenden una senal de audio codificada, un aparato (620) para la estimacion de nivel de la senal de audio codificada de acuerdo con una de las reivindicaciones anteriores,
    un elemento de decision (630) para decidir si una porcion de la senal de audio codificada se ha de incluir, o no, en el flujo de datos de salida, sobre la base de la estimacion de nivel para la porcion del flujo de datos de salida.
  10. 10. Un aparato de acuerdo con la reivindicacion 9, en el que el aparato comprende adicionalmente un mezclador,
    en el que el aparato esta adaptado para generar un flujo de datos de retorno como flujo de datos de salida para una pluralidad de participates en un sistema de teleconferencia,
    en el que el receptor esta adaptado para recibir una pluralidad de flujos de datos de participate que comprenden senales de audio a partir de la pluralidad de participates,
    en el que el elemento de decision esta adaptado para decidir si un flujo de datos de participate se ha de incluir, o no, en el flujo de datos de retorno, sobre la base de la estimacion de nivel para cada flujo de datos de participate, y un mezclador para mezclar solo los flujos de datos de participate que se han de incluir en el flujo de datos de retorno y para no incluir los flujos de datos de participate que se ha decidido que no se han incluir.
    5
    10
    15
    20
    25
    30
    35
    40
    45
    50
    55
    60
  11. 11. Un aparato de acuerdo con la reivindicacion 10, en el que el elemento de decision (630) esta adaptado para decidir que un flujo de datos de participante en cuestion no se incluye en el flujo de datos de retorno cuando la estimacion de nivel del flujo de datos de participante en cuestion esta por debajo de un valor umbral.
  12. 12. Un aparato de acuerdo con la reivindicacion 10, en el que el elemento de decision (630) esta adaptado para decidir que el unico flujo de datos que se incluye en el flujo de datos de retorno es el flujo de datos que tiene la estimacion de nivel mas alta de las estimaciones de nivel de todos los flujos de datos de participante con respecto a una banda de factores de escala particular.
  13. 13. Un aparato para la administracion de memoria intermedia:
    una unidad de acceso a la memoria intermedia para acceder a unos datos de audio de memoria intermedia de una memoria intermedia como datos de audio de memoria intermedia a los que se ha accedido, en el que los datos de audio de memoria intermedia comprenden una senal de audio codificada,
    un aparato para la estimacion de nivel de la senal de audio codificada de acuerdo con una de las reivindicaciones anteriores,
    un elemento de decision para decidir si los datos de audio de memoria intermedia a los que se ha accedido se han de borrar, o no, de la memoria intermedia, sobre la base de la estimacion de nivel de la senal de audio codificada.
  14. 14. Metodo para generar un valor de nivel de libro de codigos asociado con un libro de codigos, que comprende:
    determinar una secuencia de valores numericos asociada con una palabra de codigo del libro de codigos para cada palabra de codigo del libro de codigos,
    determinar una secuencia inversamente cuantificada de valores numericos para cada palabra de codigo del libro de codigos mediante la aplicacion de un cuantificador inverso a los valores numericos de la secuencia de valores numericos de una palabra de codigo para cada palabra de codigo del libro de codigos,
    determinar una secuencia de valores de nivel para cada palabra de codigo del libro de codigos mediante la determinacion del cuadrado de cada valor de la secuencia inversamente cuantificada de valores numericos de una palabra de codigo para cada palabra de codigo del libro de codigos cuando se ha de generar un valor de energfa como valor de nivel de libro de codigos, o mediante la determinacion de una secuencia de valores de nivel para cada palabra de codigo del libro de codigos mediante la determinacion de un valor absoluto de cada valor de la secuencia inversamente cuantificada de valores numericos de una palabra de codigo para cada palabra de codigo del libro de codigos cuando se ha de generar un valor de amplitud como valor de nivel de libro de codigos, o mediante la transformacion de cada valor de la secuencia inversamente cuantificada de valores numericos de una palabra de codigo a un dominio del volumen sonoro para cada palabra de codigo del libro de codigos cuando se ha de determinar un valor de volumen sonoro como valor de nivel de libro de codigos, calcular un valor de suma de nivel para cada palabra de codigo del libro de codigos mediante la suma de los valores de la secuencia de valores de nivel para cada palabra de codigo del libro de codigos, determinar un valor de suma de nivel ponderado segun su probabilidad para cada palabra de codigo del libro de codigos mediante la multiplicacion del valor de suma de nivel de una palabra de codigo por un valor de probabilidad asociado con la palabra de codigo para cada palabra de codigo del libro de codigos, determinar un valor de suma de nivel ponderado segun su probabilidad y promediado para cada palabra de codigo del libro de codigos mediante la division del valor de suma de nivel ponderado segun su probabilidad de una palabra de codigo por un valor de dimension asociado con el libro de codigos para cada palabra de codigo del libro de codigos, y
    calcular el valor de nivel de libro de codigos mediante la suma de los valores de suma de nivel ponderados segun su probabilidad y promediados de todas las palabras de codigo.
  15. 15. Metodo de acuerdo con la reivindicacion 14, en el que el valor de probabilidad asociado con la palabra de codigo se calcula de acuerdo con la formula:
    2-(Iongitud(palabra de codigo))
    en la que longitud(palabra de codigo) indica la longitud de la palabra de codigo.
  16. 16. Metodo para la estimacion de nivel de una senal de audio codificada, que comprende:
    determinar un libro de codigos a partir de una pluralidad de libros de codigos como un libro de codigos identificado, en el que la senal de audio se ha codificado mediante el empleo del libro de codigos identificado, obtener un valor de nivel asociado con el libro de codigos identificado, y estimar una estimacion de nivel de la senal de audio usando el valor de nivel.
  17. 17. Metodo de acuerdo con la reivindicacion 16, en el que el metodo esta adaptado para generar un flujo de datos de
    salida a partir de unos datos de entrada, y en el que el metodo comprende adicionalmente: recibir los datos de entrada que comprenden la senal de audio codificada, y
    decidir si una porcion de la senal de audio codificada se ha de incluir, o no, en el flujo de datos de salida, sobre la 5 base de la estimacion de nivel para la porcion del flujo de datos de salida.
  18. 18. Metodo de acuerdo con la reivindicacion 16, en el que el metodo esta adaptado para almacenar datos de entrada que comprenden una senal de audio codificada en una memoria intermedia, y en el que el metodo comprende adicionalmente:
    10
    recibir los datos de entrada que comprenden la senal de audio codificada, y
    decidir si una porcion de la senal de audio codificada se ha de almacenar, o no, en la memoria intermedia, sobre la base de la estimacion de nivel para la porcion del flujo de datos de salida.
    15 19. Programa informatico que implementa un metodo de acuerdo con una de las reivindicaciones 14 a 18, cuando
    esta siendo ejecutado por un ordenador o un procesador de senal.
ES11764577.0T 2010-10-07 2011-10-06 Aparato y método para la estimación de nivel de tramas de audio codificadas en un dominio de flujo de bits Active ES2600313T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US39073910P 2010-10-07 2010-10-07
US390739P 2010-10-07
PCT/EP2011/067466 WO2012045816A1 (en) 2010-10-07 2011-10-06 Apparatus and method for level estimation of coded audio frames in a bit stream domain

Publications (1)

Publication Number Publication Date
ES2600313T3 true ES2600313T3 (es) 2017-02-08

Family

ID=44741342

Family Applications (1)

Application Number Title Priority Date Filing Date
ES11764577.0T Active ES2600313T3 (es) 2010-10-07 2011-10-06 Aparato y método para la estimación de nivel de tramas de audio codificadas en un dominio de flujo de bits

Country Status (15)

Country Link
US (1) US11238873B2 (es)
EP (1) EP2625687B1 (es)
JP (1) JP5792821B2 (es)
KR (1) KR101412115B1 (es)
CN (1) CN103250206B (es)
AR (1) AR083368A1 (es)
AU (1) AU2011311543B2 (es)
BR (1) BR112013008462B1 (es)
CA (1) CA2813898C (es)
ES (1) ES2600313T3 (es)
HK (1) HK1188327A1 (es)
MX (1) MX2013003803A (es)
RU (1) RU2553084C2 (es)
TW (1) TWI489449B (es)
WO (1) WO2012045816A1 (es)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2813898C (en) 2010-10-07 2017-05-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for level estimation of coded audio frames in a bit stream domain
AU2013301831B2 (en) * 2012-08-10 2016-12-01 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoder, decoder, system and method employing a residual concept for parametric audio object coding
EP2757558A1 (en) * 2013-01-18 2014-07-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Time domain level adjustment for audio signal decoding or encoding
TWM487509U (zh) 2013-06-19 2014-10-01 杜比實驗室特許公司 音訊處理設備及電子裝置
ES2667823T3 (es) * 2013-06-21 2018-05-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Escalador de tiempo, decodificador de audio, procedimiento y programa informático mediante el uso de un control de calidad
PL3011692T3 (pl) 2013-06-21 2017-11-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Sterowanie buforem rozsynchronizowania, dekoder sygnału audio, sposób i program komputerowy
CN105556837B (zh) 2013-09-12 2019-04-19 杜比实验室特许公司 用于各种回放环境的动态范围控制
EP4060661B1 (en) 2014-10-10 2024-04-24 Dolby Laboratories Licensing Corporation Transmission-agnostic presentation-based program loudness
WO2016142002A1 (en) * 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
GB2578625A (en) * 2018-11-01 2020-05-20 Nokia Technologies Oy Apparatus, methods and computer programs for encoding spatial metadata

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5701392A (en) * 1990-02-23 1997-12-23 Universite De Sherbrooke Depth-first algebraic-codebook search for fast coding of speech
JP3483958B2 (ja) * 1994-10-28 2004-01-06 三菱電機株式会社 広帯域音声復元装置及び広帯域音声復元方法及び音声伝送システム及び音声伝送方法
WO2000011845A1 (en) * 1998-08-21 2000-03-02 Massachusetts Institute Of Technology Power-efficient communication protocol
US6704705B1 (en) * 1998-09-04 2004-03-09 Nortel Networks Limited Perceptual audio coding
CA2356869C (en) 1998-12-28 2004-11-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and devices for coding or decoding an audio signal or bit stream
JP3372908B2 (ja) * 1999-09-17 2003-02-04 エヌイーシーマイクロシステム株式会社 マルチパルス探索処理方法と音声符号化装置
US6944236B2 (en) * 2000-08-11 2005-09-13 Lucent Technologies Inc. Method of multiple-antenna wireless communication using space-time codes
US7106794B2 (en) * 2000-08-11 2006-09-12 Broadcom Corporation System and method for Huffman shaping in a data communication system
AU2003219198A1 (en) 2002-04-02 2003-10-13 Nokia Corporation Coding transform coefficients in image / video encoder and/or decoders
US7617094B2 (en) * 2003-02-28 2009-11-10 Palo Alto Research Center Incorporated Methods, apparatus, and products for identifying a conversation
EP1521241A1 (en) * 2003-10-01 2005-04-06 Siemens Aktiengesellschaft Transmission of speech coding parameters with echo cancellation
JP4698593B2 (ja) * 2004-07-20 2011-06-08 パナソニック株式会社 音声復号化装置および音声復号化方法
US7983922B2 (en) 2005-04-15 2011-07-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing
US7177804B2 (en) 2005-05-31 2007-02-13 Microsoft Corporation Sub-band voice codec with multi-stage codebooks and redundant coding
US8091006B2 (en) * 2006-06-02 2012-01-03 Nec Laboratories America, Inc. Spherical lattice codes for lattice and lattice-reduction-aided decoders
US20090094026A1 (en) * 2007-10-03 2009-04-09 Binshi Cao Method of determining an estimated frame energy of a communication
US8219409B2 (en) * 2008-03-31 2012-07-10 Ecole Polytechnique Federale De Lausanne Audio wave field encoding
CN101609674B (zh) * 2008-06-20 2011-12-28 华为技术有限公司 编解码方法、装置和系统
CA2871268C (en) * 2008-07-11 2015-11-03 Nikolaus Rettelbach Audio encoder, audio decoder, methods for encoding and decoding an audio signal, audio stream and computer program
US8565064B2 (en) * 2008-12-15 2013-10-22 Futurewei Technologies, Inc. System and method for employing six-bit rank 1 and 2 codebooks for four transmit antennas
US8665945B2 (en) * 2009-03-10 2014-03-04 Nippon Telegraph And Telephone Corporation Encoding method, decoding method, encoding device, decoding device, program, and recording medium
CA2813898C (en) 2010-10-07 2017-05-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for level estimation of coded audio frames in a bit stream domain

Also Published As

Publication number Publication date
EP2625687B1 (en) 2016-08-10
CN103250206A (zh) 2013-08-14
RU2553084C2 (ru) 2015-06-10
JP5792821B2 (ja) 2015-10-14
CA2813898C (en) 2017-05-23
TWI489449B (zh) 2015-06-21
BR112013008462B1 (pt) 2021-11-16
EP2625687A1 (en) 2013-08-14
RU2013120547A (ru) 2014-11-20
US20130226596A1 (en) 2013-08-29
HK1188327A1 (zh) 2014-04-25
AU2011311543A1 (en) 2013-05-02
AU2011311543B2 (en) 2015-05-21
WO2012045816A1 (en) 2012-04-12
CN103250206B (zh) 2015-07-15
US11238873B2 (en) 2022-02-01
BR112013008462A2 (pt) 2016-08-09
KR20130112893A (ko) 2013-10-14
MX2013003803A (es) 2013-06-03
JP2013543146A (ja) 2013-11-28
AR083368A1 (es) 2013-02-21
TW201222530A (en) 2012-06-01
KR101412115B1 (ko) 2014-06-26
CA2813898A1 (en) 2012-04-12

Similar Documents

Publication Publication Date Title
ES2600313T3 (es) Aparato y método para la estimación de nivel de tramas de audio codificadas en un dominio de flujo de bits
ES2604983T3 (es) Ajuste de nivel en el dominio del tiempo para decodificación o codificación de señales de audio
ES2380591T3 (es) Codificación de señal de información
ES2453098T3 (es) Códec multimodo de audio
ES2773795T3 (es) Aparato y método para llenado estéreo en codificación multicanal
ES2953084T3 (es) Decodificador de audio para procesar audio estéreo usando una dirección de predicción variable
US9269366B2 (en) Hybrid instantaneous/differential pitch period coding
JP6892467B2 (ja) 符号化及び復号化のための符号化装置、復号化装置、システム及び方法
ES2644131T3 (es) Predicción lineal basada en una codificación de audio utilizando un estimador mejorado de distibución de probabilidad
TWI505262B (zh) 具多重子流之多通道音頻信號的有效編碼與解碼
US9489962B2 (en) Sound signal hybrid encoder, sound signal hybrid decoder, sound signal encoding method, and sound signal decoding method
JP2022110116A (ja) オーディオエンコーダ、オーディオデコーダ、オーディオ信号を符号化する方法、および符号化されたオーディオ信号を復号化する方法
KR20230018533A (ko) 오디오 코딩/디코딩 모드를 결정하는 방법 및 관련 제품
JP2021005086A (ja) 最下位ビットの符号化および復号に適合するオーディオ符号化器、オーディオ復号器、方法、およびコンピュータプログラム
ES2691546T3 (es) Aparato y procedimiento para la codificación de objetos de audio espacial que emplea objetos ocultos para la manipulación de mezclas de señales
CN109427338B (zh) 立体声信号的编码方法和编码装置
RU2670377C2 (ru) Квантование аудиопараметров
CN103503065A (zh) 用于衰减低精确度重构的信号区域的方法和解码器
TW200903454A (en) Multiple stream decoder
Moon et al. Low latency audio coder design for high quality audio service on server-client environment
Cho et al. Flexiable Audio System for Multipurpose