ES2374640T3 - Rellenador de ruido, calculador de parámetro de relleno de ruido, método para proporcionar un parámetro de relleno de ruido, método para proporcionar una representación espectral rellenada con ruido de una señal de audio, programa informático correspondiente y señal de audio codificada. - Google Patents

Rellenador de ruido, calculador de parámetro de relleno de ruido, método para proporcionar un parámetro de relleno de ruido, método para proporcionar una representación espectral rellenada con ruido de una señal de audio, programa informático correspondiente y señal de audio codificada. Download PDF

Info

Publication number
ES2374640T3
ES2374640T3 ES09776859T ES09776859T ES2374640T3 ES 2374640 T3 ES2374640 T3 ES 2374640T3 ES 09776859 T ES09776859 T ES 09776859T ES 09776859 T ES09776859 T ES 09776859T ES 2374640 T3 ES2374640 T3 ES 2374640T3
Authority
ES
Spain
Prior art keywords
spectral
noise
zero
representation
quantified
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES09776859T
Other languages
English (en)
Inventor
Nikolaus Rettlebach
Bernhard Grill
Guillaume Fuchs
Stefan Geyersberger
Markus Multrus
Harald Popp
Jürgen HERRE
Stefan Wabnik
Gerald Schuller
Jens Hirschfeld
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=40941986&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=ES2374640(T3) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Application granted granted Critical
Publication of ES2374640T3 publication Critical patent/ES2374640T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/035Scalar quantisation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/028Noise substitution, i.e. substituting non-tonal spectral components by noisy source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Detection And Prevention Of Errors In Transmission (AREA)

Abstract

Rellenador (100) de ruido para proporcionar una representación (112) espectral rellenada con ruido de una señal de audio sobre la base de una representación (110) espectral de entrada de la señal de audio, comprendiendo el rellenador de ruido: un identificador (120) de región espectral configurado para identificar regiones (422e, 422f, 422g) espectrales de la representación (110) espectral de entrada cuantificadas a cero y separadas de regiones (420a, 420b, 420c, 420d) espectrales distintas de cero de la representación (110) espectral de entrada por al menos una región (422a, 422b, 422c, 422d, 422h, 422i, 422j, 422k) espectral intermedia, para obtener regiones (422e, 422f, 422g) espectrales identificadas; y un insertador (130) de ruido configurado para introducir selectivamente ruido dentro de las regiones (422e, 422f, 422g) espectrales identificadas para obtener la representación (112) espectral rellenada con ruido de la señal de audio.

Description

Rellenador de ruido, calculador de parámetro de relleno de ruido, método para proporcionar un parámetro de relleno de ruido, método para proporcionar una representación espectral rellenada con ruido de una señal de audio, programa informático correspondiente y señal de audio codificada.
Antecedentes de la invención
Realizaciones según la invención se refieren a un rellenador de ruido para proporcionar una representación espectral rellenada con ruido de una señal de audio sobre la base de una representación espectral de entrada de la señal de audio, a un calculador de parámetro de relleno de ruido de una señal de audio, a una representación de señal de audio codificada que representa una señal de audio, a un método para proporcionar una representación espectral rellenada con ruido de una señal de audio, a un método para proporcionar un parámetro de relleno de ruido sobre la base de una representación espectral cuantificada de una señal de audio, y a programas informáticos para implementar dichos métodos.
En lo que sigue se describirán algunos escenarios en los cuales se pueden aplicar ventajosamente realizaciones según la invención. Muchos codificadores de señal de audio en el dominio de la frecuencia se basan en la idea de que algunas regiones de frecuencia o regiones espectrales (por ejemplo, líneas de frecuencia o líneas espectrales proporcionadas por una conversión de dominio del tiempo al dominio de la frecuencia), son más importantes que otras regiones espectrales. Por consiguiente, las regiones espectrales de alta importancia psicoacústica normalmente se codifican con mayor precisión que las regiones espectrales de inferior relevancia psicoacústica. La relevancia psicoacústica de las diferentes regiones espectrales puede calcularse, por ejemplo, usando un modelo piscoacústico que tiene en cuenta el enmascaramiento de regiones espectrales más débiles por picos espectrales fuertes adyacentes.
Si hay un deseo de reducir la tasa de transmisión de bits de una señal de audio codificada hacia un nivel bajo, algunas regiones espectrales se cuantifican con una precisión muy baja (por ejemplo, precisión de sólo un bit, o precisión de dos bits). Por consiguiente, muchas de las regiones espectrales cuantificadas con baja precisión se cuantifican a cero. Así, a bajas tasas de transmisión de bits los codificadores de audio basados en transformación son propensos a diferentes artefactos y especialmente a artefactos que se originan a partir de líneas de frecuencia cuantificadas a cero. En realidad, la cuantificación aproximada de valores espectrales en codificación de audio de baja tasa de transmisión de bits podría conducir a un espectro muy esparcido después de la cuantificación inversa, ya que muchas líneas espectrales podrían haberse cuantificado a cero. Estos huecos de frecuencia en la señal reconstruida producen indeseables artefactos de sonido. Puede hacer que el sonido reproducido sea demasiado agudo o inestable (birdies) cuando los huecos de frecuencia en el espectro se mueven de trama a trama.
El relleno de ruido es un medio para enmascarar estos artefactos rellenando, en el lado del decodificador, las bandas o los coeficientes cuantificados en cero, con ruido aleatorio. La energía del ruido insertado es un parámetro calculado y transmitido por el codificador.
Se conocen diferentes conceptos de relleno de ruido. Por ejemplo, el denominado AMR–WR+ combina relleno de ruido y una transformada discreta de Fourier (DFT), tal como se describe por ejemplo en la referencia [1]. Además, la norma internacional ITU–T G.729.1 define un concepto que combina relleno de ruido y transformada de coseno discreta modificada (MDCT). En la referencia [2] se describen detalles.
El documento WO 02/091363 A da a conocer un códec de audio en el dominio de transformación, en el que bandas de frecuencia menos relevantes desde el punto de vista perceptivo seleccionadas de una señal de audio original se sustituyen durante la codificación por un parámetro de relleno de ruido. Tras la decodificación, dicho parámetro de relleno de ruido se usa para rellenar dichas bandas menos relevantes desde el punto de vista perceptivo con ruido aleatorio, cuya amplitud se ajusta según la energía original (raíz cuadrática media) de dichas bandas. Por tanto se evitan artefactos de conmutación de ancho de banda audibles debido a la no reconstrucción de bandas cuantificadas a cero durante la codificación debido a grandes restricciones de presupuesto.
Aspectos adicionales relativos al relleno de ruido se describen en la solicitud de patente internacional PCT/IB2002/001388 de Koninklijke Philips Electronics N.V. (véase la referencia [3]).
De todos modos, los conceptos de relleno de ruido convencionales dan como resultado distorsiones audibles.
En vista de esta discusión, hay un deseo de crear un concepto de relleno de ruido que proporcione una mejor impresión auditiva.
Sumario de la invención
Una realización según la invención crea un rellenador de ruido para proporcionar una representación espectral rellenada con ruido de una señal de audio sobre la base de una representación espectral de entrada de la señal de audio. El rellenador de ruido comprende un identificador de región espectral configurado para identificar regiones espectrales (por ejemplo, líneas espectrales, o intervalos espectrales) de la representación espectral de entrada cuantificadas a cero y separadas de regiones espectrales distintas de cero (por ejemplo, líneas espectrales o intervalos espectrales) de la representación espectral de entrada por al menos una región espectral intermedia, para obtener regiones espectrales identificadas. El rellenador de ruido también comprende un insertador de ruido configurado para introducir selectivamente ruido dentro de las regiones espectrales identificadas (por ejemplo, líneas espectrales o intervalos espectrales) para obtener la representación espectral rellena con ruido de la señal de audio.
Esta realización de la presente invención se basa en el hallazgo de que las componentes tonales de la representación espectral de una señal de audio normalmente se ven degradadas, en términos de impresión auditiva, si se aplica un relleno de ruido en la proximidad inmediata de tales componentes tonales. Por consiguiente, se ha hallado que se puede obtener una mejor impresión auditiva de una señal de audio rellenada con ruido si el relleno de ruido sólo se aplica a regiones espectrales que están separadas de tales regiones tonales espectrales distintas de cero. Por consiguiente, las componentes tonales del espectro de señal de audio (que no están cuantificadas a cero en la representación espectral cuantificada introducida al rellenador de ruido) permanecen audibles (es decir, no quedan afectadas por ruido adyacente muy cercano), mientras que todavía se evita eficazmente la presencia de grandes huecos espectrales.
En una realización preferida, el identificador de región espectral está configurado para identificar, como regiones espectrales identificadas, líneas espectrales de la representación espectral de entrada, que están cuantificadas a cero y que comprenden al menos un primer número predeterminado de líneas espectrales vecinas de frecuencia inferior cuantificadas a cero y al menos un segundo número predeterminado de líneas espectrales vecinas de frecuencia superior cuantificadas a cero, como regiones espectrales identificadas, en el que el primer número predeterminado es mayor o igual a uno y en el que el segundo número predeterminado es mayor o igual a uno. En esta realización, el insertador de ruido está configurado para introducir selectivamente ruido dentro de las líneas espectrales identificadas mientras que deja sin afectar por el relleno con ruido líneas espectrales cuantificadas a un valor distinto de cero y líneas espectrales cuantificadas a cero, pero que no tienen el primer número predeterminado de líneas espectrales vecinas de frecuencia inferior cuantificadas a cero, o el segundo número predeterminado de líneas espectrales vecinas de frecuencia superior cuantificadas a cero. Así, el relleno de ruido es selectivo por el hecho de que se introduce ruido sólo en líneas espectrales que están cuantificadas a cero y que están separadas de líneas cuantificadas a un valor distinto de cero, tanto en una dirección espectral ascendente como en una dirección espectral descendente, por ejemplo por el primer número predeterminado de líneas espectrales vecinas de frecuencia inferior cuantificadas a cero y por el segundo número predeterminado de líneas espectrales vecinas de frecuencia superior cuantificadas a cero.
En una realización preferida, el primer número predeterminado es igual al segundo número predeterminado, de manera que una separación mínima en la dirección de frecuencia ascendente desde líneas cuantificadas a un valor distinto de cero es igual a una separación mínima en la dirección de frecuencia descendente desde líneas cuantificadas a un valor distinto de cero.
En una realización preferida, el rellenador de ruido está configurado para introducir ruido sólo en regiones espectrales en una parte superior de la representación espectral de la señal de audio, mientras que deja una parte inferior de la representación espectral de la señal de audio sin afectar por el relleno de ruido. Un concepto de este tipo es útil ya que usualmente las frecuencias más altas son menos importantes desde el punto de vista perceptivo que las bajas frecuencias. Los valores cuantificados a cero también aparecen mayormente en la segunda mitad de los espectros (es decir, para altas frecuencias). También agregar ruido en las altas frecuencias es menos propenso a obtener un restitución de sonido final ruidosa.
En una realización preferida, el identificador de región espectral está configurado para sumar valores de intensidad de cuantificador (por ejemplo, valores de energía o valores de amplitud) de regiones espectrales en la proximidad espectral a ambos lados predeterminada de una región espectral dada (es decir, la proximidad espectral que se extiende tanto hacia las frecuencias inferiores como hacia las superiores), para obtener un valor suma, y para evaluar el valor suma para decidir si la región espectral dada es una región espectral identificada o no. Se ha hallado que un valor suma de energías de un espectro cuantificado sobre la proximidad espectral a ambos lados de una región espectral dada es una magnitud significativa para decidir si se debe aplicar relleno de ruido a la región espectral dada.
En otra realización preferida, el identificador de región espectral está configurado para explorar un rango de regiones espectrales de la representación espectral de entrada para detectar secuencias contiguas de regiones espectrales cuantificadas a cero, y para reconocer una o más regiones espectrales centrales (es decir, regiones espectrales no límite) de tales secuencias contiguas detectadas como regiones espectrales identificadas.
Se ha hallado que una detección de una cierta longitud de recorrido (“run–length”) de regiones espectrales cuantificadas a cero, es una tarea que puede implementarse con complejidad computacional particularmente baja. Para identificar tal secuencia contigua de regiones espectrales, es posible decidir si todas las regiones espectrales dentro de esta secuencia de regiones espectrales están cuantificadas a cero, lo cual puede realizarse usando un algoritmo o circuito relativamente simple. Si se halla que tal secuencia contigua de regiones espectrales está cuantificada a cero, una o más regiones espectrales interiores de la secuencia (que están separadas suficientemente de regiones espectrales fuera de la presente secuencia de regiones espectrales) son tratadas como regiones espectrales identificadas. Así, explorando a través de un rango de regiones espectrales (por ejemplo, seleccionando a continuación diferentes secuencias desplazadas de regiones espectrales), se puede hacer un análisis eficaz de la representación espectral, para identificar regiones espectrales cuantificadas a cero y separadas de regiones espectrales cuantificadas a un valor distinto de cero por una distancia mínima predeterminada.
Otra realización según la invención crea un calculador de parámetro de relleno de ruido para proporcionar un parámetro de relleno de ruido sobre la base de una representación espectral cuantificada de una señal de audio. El calculador de parámetro de relleno de ruido comprende un identificador de región espectral configurado para identificar regiones espectrales de la representación espectral cuantificada cuantificadas a cero y separadas de regiones espectrales distintas de cero de la representación espectral cuantificada por al menos una región espectral intermedia, para obtener regiones espectrales identificadas. El calculador de parámetro de relleno de ruido también comprende un calculador de valor de ruido configurado para considerar selectivamente errores de cuantificación de las regiones espectrales identificadas para un cálculo del parámetro de relleno de ruido. El calculador de parámetro de relleno de ruido se basa en la idea clave de que es deseable restringir un relleno de ruido en el lado del decodificador a regiones espectrales que están separadas de regiones espectrales tonales (cuantificadas a un valor distinto de cero), y que consecuentemente el parámetro de ruido debe calcularse en el lado del codificador, tomando en consideración este concepto. Por consiguiente, se obtiene un parámetro de relleno de ruido que es particularmente bien adecuado para el concepto de decodificador descrito anteriormente. También se ha hallado que regiones espectrales, que están cuantificadas a cero, pero que están muy cerca de regiones espectrales cuantificadas a un valor distinto de cero, con frecuencia no reflejan un contenido de audio verdaderamente de tipo ruido, sino que más bien están fuertemente correlacionadas con una región espectral tonal adyacente (cuantificada a un valor distinto de cero). Por consiguiente, se ha hallado que generalmente no es deseable considerar el error de cuantificación de regiones espectrales, que están cerca de regiones espectrales cuantificadas a un valor distinto de cero para un cálculo de un parámetro de relleno de ruido, porque esto normalmente daría como resultado una fuerte sobreestimación de ruido, dando como resultado de ese modo una representación espectral reconstruida demasiado ruidosa.
Así, el concepto de cálculo de parámetro de relleno de ruido descrito en el presente documento puede usarse en combinación con el concepto de relleno de ruido descrito anteriormente e incluso en combinación con conceptos de relleno de ruido convencionales.
En realizaciones preferidas, el concepto para la identificación de regiones espectrales, que se ha comentado con respecto al rellenador de ruido, también puede aplicarse en combinación con el calculador de parámetro de relleno de ruido.
En una realización preferida adicional, el calculador de valor de ruido está configurado para considerar una energía real de error de cuantificación de las regiones espectrales identificadas para el cálculo del parámetro de relleno de ruido. Se ha hallado que la consideración de un error de cuantificación real (en lugar de un error de cuantificación estimado o un error de cuantificación promedio) normalmente conlleva mejores resultados, porque el error de cuantificación real normalmente se desvía del error de cuantificación estadísticamente esperado.
En una realización preferida adicional, el calculador de valor de ruido está configurado para enfatizar una energía de error de cuantificación no tonal distribuida sobre una pluralidad de regiones espectrales identificadas en relación a una energía de error de cuantificación tonal concentrada en una sola región espectral. Este concepto se basa en el hallazgo de que un ruido de banda ancha no tonal, cuya energía promedio se sitúa por debajo de un umbral de cuantificación y que por lo tanto está cuantificado a cero, es desde el punto de vista perceptivo mucho más relevante para el rellenador de ruido que una única componente de audio tonal, cuya intensidad se sitúa por debajo del umbral de cuantificación, incluso si el ruido de banda ancha no tonal cuantificado a cero y la componente tonal cuantificada a cero estuviesen ambos cuantificados a cero. La razón es que el rellenador de ruido generando un ruido aleatorio en el decodificador puede modelar ruido de banda ancha no tonal ausente en la representación espectral cuantificada pero no componentes tonales ausentes. Así, un énfasis de las componentes de ruido no tonales cuantificadas a cero sobre las componentes tonales cuantificadas a cero, lleva consigo una reconstrucción de sonido más realista. Esto también se debe al hecho de que una impresión auditiva humana se degrada mucho más por la presencia de un hueco espectral (por ejemplo, en forma de ausencia de un ruido de banda ancha cuantificado a cero) que por la ausencia de un pequeño pico espectral cuantificado a cero. Una componente tonal puede concentrarse en una sola línea espectral, o puede esparcirse sobre varias líneas espectrales contiguas (por ejemplo, i–1, i, i+1). Una región espectral puede comprender, por ejemplo, una
o más líneas espectrales.
En una realización preferida, el calculador de valor de ruido está configurado para calcular una suma de energías de error de cuantificación logaritmizadas de las regiones espectrales identificadas para obtener el parámetro de relleno de ruido. Calculando la suma de energías de error de cuantificación logaritmizadas de las regiones espectrales identificadas, el énfasis relativo descrito anteriormente de regiones espectrales no tonales cuantificadas a cero sobre regiones tonales cuantificadas a cero, puede obtenerse de una manera eficaz.
Otra realización según la invención crea una representación de señal de audio codificada, para representar una señal de audio. La representación de señal de audio codificada comprende una representación en el dominio espectral cuantificada codificada de la señal de audio y un parámetro de relleno de ruido codificado. El parámetro de relleno de ruido representa un error de cuantificación de las regiones espectrales de la representación en el dominio espectral cuantificadas a cero y separadas de regiones espectrales de la representación en el dominio espectral cuantificadas a un valor distinto de cero por al menos un número predeterminado de regiones espectrales intermedias. La representación de señal de audio codificada descrita anteriormente puede usarse por el rellenador de ruido comentado anteriormente y puede obtenerse usando el calculador de parámetro de relleno de ruido comentado anteriormente. La representación de señal de audio codificada permite una reconstrucción de la señal de audio con calidad de audio particularmente buena porque el parámetro de relleno de ruido refleja selectivamente el error de cuantificación de la representación en el dominio espectral cuantificada para aquellas regiones espectrales en las que está presente una información de ruido significativa y que deben considerarse selectivamente para un relleno de ruido en el lado del decodificador.
Otra realización según la invención crea un método para proporcionar una representación rellenada con ruido de una señal de audio.
Otra realización adicional según la invención crea un método para proporcionar un parámetro de relleno de ruido sobre la base de una representación espectral cuantificada de una señal de audio.
Otra realización adicional según la invención crea un programa informático para implementar los métodos mencionados anteriormente.
Breve descripción de los dibujos
A continuación se describirán realizaciones según la invención, tomando como referencia las figuras adjuntas, en las que:
la figura 1 muestra un diagrama de bloques esquemático de un rellenador de ruido, según una realización de la invención;
la figura 2 muestra un diagrama de bloques esquemático de un decodificador de señal de audio que comprende el rellenador de ruido según la presente invención;
la figura 3 muestra un pseudocódigo de programa para implementar la funcionalidad del rellenador de ruido de la figura 1;
la figura 4 muestra una representación gráfica de una identificación de regiones espectrales, que puede realizarse en el rellenador de ruido según el figura 1;
la figura 5 muestra un diagrama de bloques esquemático de un calculador de parámetro de relleno de ruido según una realización de la invención;
la figura 6 muestra un pseudocódigo de programa para implementar la funcionalidad del calculador de parámetro de relleno de ruido según la figura 5;
la figura 7 muestra un diagrama de flujo de un método para proporcionar una representación espectral rellenada con ruido de una señal de audio sobre la base de una representación espectral de entrada de la señal de audio;
la figura 8 muestra un diagrama de flujo de un método para proporcionar un parámetro de relleno de ruido sobre la base de una representación espectral cuantificada de una señal de audio; y
la figura 9 muestra una representación gráfica de una representación de señal de audio, según una realización de la invención.
Rellenador de ruido según las figuras 1–4
La figura 1 muestra un diagrama de bloques esquemático de un rellenador 100 de ruido, según una realización de la invención. El rellenador 100 de ruido está configurado para recibir una representación 110 espectral de entrada de una señal de audio, por ejemplo en forma de coeficientes espectrales decodificados (que pueden, por ejemplo, estar cuantificados o inversamente cuantificados). El rellenador 100 de ruido también está configurado para proporcionar una representación 112 espectral rellenada con ruido de la señal de audio sobre la base de la representación 110 espectral de entrada.
El rellenador 100 de ruido comprende un identificador 120 de región espectral, que está configurado para identificar regiones espectrales de la representación 110 espectral de entrada separadas de regiones espectrales distintas de cero de la representación 110 espectral de entrada por al menos una región espectral intermedia, para obtener una información 122 que indica las regiones espectrales identificadas. El rellenador 100 de ruido también comprende un insertador 130 de ruido, que está configurado para introducir selectivamente ruido dentro de las regiones espectrales identificadas (descritas mediante la información 122), para obtener la representación 112 espectral rellenada con ruido de la señal de audio.
Con relación a la funcionalidad del rellenador 100 de ruido, en general se puede decir que el rellenador 100 de ruido rellena selectivamente regiones espectrales (por ejemplo, líneas espectrales o intervalos espectrales) de la representación 110 espectral de entrada con ruido, por ejemplo reemplazando valores espectrales de líneas espectrales cuantificadas a cero por valores espectrales de reemplazo que describen un ruido. De esta manera se pueden rellenar huecos espectrales o vacíos espectrales dentro de la representación 110 espectral de entrada, los cuales pueden aparecer, por ejemplo, a partir de una cuantificación aproximada de la representación 110 espectral de entrada. Sin embargo, el rellenador 100 de ruido no introduce ruido dentro de todas las líneas espectrales cuantificadas a cero (es decir, líneas espectrales, cuyos valores espectrales están cuantificados a cero). En cambio, el rellenador 100 de ruido sólo introduce ruido en aquellas líneas espectrales cuantificadas a cero que comprenden una suficiente distancia desde cualquier línea espectral cuantificada a un valor distinto de cero. De esta manera, el relleno de ruido no rellena completamente huecos espectrales o vacíos espectrales, sino que mantiene una distancia espectral de al menos una región espectral (o de al menos cualquier otro número predeterminado de regiones espectrales) entre aquellas líneas espectrales en las que se introduce un ruido y líneas espectrales cuantificadas a un valor distinto de cero. Así, se mantiene una distancia espectral entre ruido de relleno, introducido en la representación espectral, y líneas espectrales cuantificadas a un valor distinto de cero, de tal manera que las líneas espectrales psicoacústicamente relevantes (que no están cuantificadas a cero en la representación espectral de entrada de la señal de audio) pueden distinguirse claramente (debido a la distancia espectral del número predeterminado de una o más regiones espectrales) del ruido de relleno introducido dentro del espectro por el rellenador de ruido. Por consiguiente, se puede percibir claramente el contenido de audio psicoacústicamente más relevante (representado por valores de línea espectral distintos de cero en la representación 110 espectral de entrada), mientras se evitan grandes huecos espectrales. Esto se debe al hecho de que el relleno de ruido se omite selectivamente en la proximidad de líneas espectrales de la representación espectral de entrada cuantificadas a un valor distinto de cero, mientras que se ejecuta relleno de ruido en las regiones centrales de huecos espectrales o vacíos espectrales.
En lo que sigue se describirá un entorno de aplicación para el rellenador 100 de ruido haciendo referencia a la figura 2. La figura 2 muestra un diagrama de bloques esquemático de un decodificador 200 de señal de audio, según una realización de la invención. El decodificador 200 de señal de audio comprende, como componente clave, el rellenador 100 de ruido. El decodificador 200 de señal de audio también comprende un decodificador 210 de coeficiente espectral, que está configurado para recibir una representación 212 de señal de audio codificada y para proporcionar una representación 214 decodificada, opcionalmente inversamente cuantificada, de coeficientes espectrales de la señal de audio codificada. El decodificador 210 de coeficiente espectral puede comprender, por ejemplo, un decodificador de entropía (por ejemplo, decodificador aritmético o decodificador de longitud de recorrido) y, opcionalmente, un cuantificador inverso para derivar la representación 214 decodificada de los coeficientes espectrales (por ejemplo, en forma de coeficientes inversamente cuantificados) a partir de la representación 212 de señal de audio codificada. El rellenador 100 de ruido está configurado para recibir la representación 214 decodificada de coeficientes espectrales (que está opcionalmente inversamente cuantificada) como la representación 110 espectral de entrada de la señal de audio.
El decodificador 200 de señal de audio también comprende un extractor 220 de factor de ruido, que está configurado para extraer una información 222 de factor de ruido de la representación 212 de señal de audio codificada y para proporcionar la información 222 de factor de ruido al rellenador 100 de ruido. El decodificador 200 de señal de audio también comprende un reconformador 230 de espectro, que está configurado para recibir una representación 232 de espectro reconstruida desde el rellenador 100 de ruido. La representación 232 de espectro reconstruida puede ser, por ejemplo, igual a la representación 112 espectral rellenada con ruido proporcionada por el rellenador de ruido. El reconformador 230 de espectro, que puede ser considerado opcional, está configurado para proporcionar una información 234 de espectro sobre la base de la representación 232 de espectro reconstruida. El decodificador 200 de señal de audio además comprende un conversor 240 de dominio espectral a dominio del tiempo, que recibe la información 234 de espectro proporcionada por el reconformador 230 de espectro o, en ausencia del reconformador 230 de espectro, la representación 232 de espectro reconstruida, y para proporcionar basándose en ello, una representación 242 de señal de audio en el dominio del tiempo. El conversor 240 de dominio espectral a dominio del tiempo puede estar configurado, por ejemplo, para realizar una transformada de coseno discreta modificada inversa (IMDCT).
En una realización preferida, el relleno de ruido en el lado del decodificador comprende las siguientes etapas (o sigue las siguientes etapas):
1.
decodificar el suelo de ruido;
2.
decodificar los valores cuantificados de las líneas de frecuencia;
3.
detectar las regiones espectrales en la parte seleccionada de los espectros donde una longitud de recorrido de ceros es mayor que un tamaño mínimo de longitud de recorrido; y
4.
aplicar un signo generado aleatoriamente al suelo de ruido decodificado para cada una de las líneas dentro de las regiones seleccionadas.
El suelo de ruido se decodifica como sigue:
nf_decoded = 0,0625*(8–index).
Las regiones espectrales detectadas se seleccionan, por ejemplo, de la misma manera en que se hace en lado del codificador (que se describirá más adelante).
Un ruido gaussiano sin memoria en el dominio de MDCT se genera por un espectro con la misma amplitud para todas las líneas pero con signos aleatorios. Así, para cada una de las líneas dentro de las regiones seleccionadas, el decodificador genera un signo aleatorio (–1 ó +1) y lo aplica al suelo de ruido decodificado. Sin embargo, se pueden aplicar también otros métodos para proporcionar una contribución de ruido.
En lo que sigue se describirán algunos detalles tomando como referencia las figuras 1, 2, 3 y 4, en las que la figura 3 muestra un pseudocódigo de programa de un algoritmo para relleno de ruido en el lado del decodificador, que puede realizarse mediante el rellenador 100 de ruido, y en las que la figura 4 muestra una representación gráfica del rellenado con ruido.
Para empezar, la decodificación del suelo de ruido puede realizarse mediante el extractor 220 de factor de ruido, que recibe, por ejemplo, un índice de factor de ruido (al que también se designa de manera abreviada “index”) y proporciona basándose en ello, el valor 222 de factor de ruido decodificado (también designado con ““nf_decoded”). El índice de factor de ruido puede codificarse, por ejemplo, usando tres o cuatros bits, y puede ser, por ejemplo, un valor entero en el rango entre 0 y 7, o un valor entero en un rango entre 0 y 15.
Los valores cuantificados de las líneas de frecuencia (también designados como “líneas espectrales” o “intervalos espectrales”) pueden proporcionarse por el decodificador 210 de coeficiente espectral. Por consiguiente, se obtienen valores de línea espectral (a los que también se designa como “coeficientes espectrales) cuantificados (u opcionalmente, inversamente cuantificados), que se designan como “quantized (x(i))”. Aquí, i designa un índice de frecuencia de los valores de línea espectral.
A continuación se detectan regiones espectrales mediante el rellenador 100 de ruido en una parte seleccionada de los espectros (por ejemplo, en una parte superior del espectro partiendo de un índice de frecuencia i de línea espectral predeterminada) donde una longitud de recorrido de ceros (es decir, de valores de línea espectral cuantificados, cuantificados a cero) es mayor que un tamaño de longitud de recorrido mínimo. La detección de tales regiones espectrales se realiza por una primera parte 310 del algoritmo 300 de la figura 3. Como se puede ver a partir de la primera parte 310 del algoritmo 300, un conjunto R de regiones detectadas se inicializa para ser un conjunto vacío en el inicio del algoritmo (R= {};).
En el ejemplo del algoritmo de la figura 3, se fija una longitud de recorrido mínima en un valor fijo de 8, pero naturalmente se puede elegir cualquier otro valor.
A continuación, se determina para una pluralidad de líneas espectrales bajo consideración (designadas por la variable continua “line index”) si cada una de esas líneas espectrales bajo consideración comprende un entorno a ambos lados de líneas espectrales cuantificada a cero (y si la línea espectral bajo consideración está en sí misma cuantificada a cero). Por ejemplo, todas las líneas en la segunda mitad de los espectros pueden considerarse sucesivamente como líneas bajo consideración, designándose una línea que está actualmente bajo consideración por “line index”. Para una línea bajo consideración designada por “line index”, se calcula una suma de coeficientes espectrales cuantificados “quantized(x(i))” en un entorno que oscila desde un índice de frecuencia de línea espectral de “line index – (MinimalRunLength)/2” hasta un índice de frecuencia de línea espectral de “line index + MinimalRunLength)/2”. Si se halla que la suma de los valores de línea espectral en dicho entorno de la línea espectral actualmente bajo consideración (que tiene el índice de frecuencia de línea espectral “line index”) es cero, entonces, la línea espectral actualmente bajo consideración (o más precisamente, el índice de frecuencia de línea espectral “line index” de la misma) se agrega al conjunto R de regiones detectadas (o líneas espectrales detectadas). Por consiguiente, si el índice de frecuencia de línea espectral de una línea espectral se agrega al conjunto R, esto significa que las líneas espectrales que tienen índices de línea entre “line index – MinimalRunLength)/2” y “line index + MinimalRunLength)/2”, comprenden todas valores de línea espectral cuantificados a cero.
Por consiguiente, en la primera parte 310 del pseudocódigo 310 de programa, se obtiene un conjunto R de índices de frecuencia de línea espectral “line index”, que enumera aquellas (y sólo aquellas) líneas espectrales de la parte espectral bajo consideración que están “suficientemente” separadas (es decir, por al menos MinimalRunLength/2 líneas) de cualquier línea espectral cuantificada a un valor distinto de cero.
La detección de tal región está ilustrada en la figura 4, que muestra una representación gráfica 400 de un espectro. Una abscisa 410 describe una frecuencia de líneas espectrales en términos de un índice de frecuencia de línea espectral “line index”. Una ordenada 412 describe una intensidad (por ejemplo, amplitud o energía) de las líneas espectrales. Como se puede ver, la parte del espectro ilustrada en la representación gráfica 400 comprende cuatro líneas 420a, 420b, 420c y 420d espectrales, cuantificadas a un valor distinto de cero. Además, entre las líneas 420c y 420d espectrales, hay 11 líneas 422a–422k espectrales cuantificadas a cero. Además, se supone que una línea espectral sólo se considera que está suficientemente separada de una línea espectral cuantificada a un valor distinto de cero si hay al menos cuatro líneas espectrales cuantificadas a cero entre la línea espectral actualmente bajo consideración y cualquier otra línea espectral cuantificada a un valor distinto de cero (y naturalmente, si la línea espectral actualmente bajo consideración está en sí misma cuantificada a cero). Sin embargo, cuando se considera la línea 422a espectral, se hallará que la línea 422a espectral es inmediatamente adyacente a la línea 422c espectral, que no está cuantificada a cero, de manera que el índice de frecuencia de línea espectral de la línea 422a espectral no formará parte del conjunto R calculado según la primera parte 310 del algoritmo 300. De manera similar, se hallará que las líneas 422b, 422c y 422d espectrales no están separadas suficientemente de cualquier línea espectral cuantificada a un valor distinto de cero , de manera que los índices de frecuencia de línea espectral de las líneas 422b a 422d espectrales tampoco formarán parte del conjunto R. En cambio, se reconocerá que la línea 422e espectral está separada suficientemente de cualquier línea espectral cuantificada a un valor distinto de cero, porque la línea 422e espectral es una línea de centro (o, más generalmente, una línea central), de una secuencia de 9 líneas espectrales contiguas todas cuantificadas a cero. Por consiguiente, un índice de frecuencia de línea espectral de la línea 422e espectral formará parte del conjunto R calculado en la primera parte 310 del algoritmo 300. Lo mismo es válido para las líneas 422f y 422g espectrales, de manera que los índices de frecuencia de línea espectral de las líneas 422f y 422g espectrales formarán parte del conjunto R determinado en la primera parte 310 del algoritmo 300, ya que las líneas 422f y 422g espectrales están separadas suficientemente de cualquier línea 420a, 420b y 420c espectral de frecuencia inferior, cuantificadas a un valor distinto de cero y de cualquier línea espectral de frecuencia superior cuantificada a un valor distinto de cero. Por otro lado, las líneas 422h, 422i, 422j y 422k espectrales no formarán parte del conjunto R, porque dichas líneas espectrales están ubicadas demasiado cerca, en términos de frecuencia, al lado de la línea 420d espectral cuantificada a un valor distinto de cero.
Por consiguiente, el conjunto R no comprenderá índices de frecuencia de línea espectral de las líneas espectrales 420a, 420b, 420c, 420d, porque dichas líneas espectrales están cuantificadas a un valor distinto de cero. Además, los índices de frecuencia de línea espectral de las líneas 422a, 422b, 422c, 422d, 422h, 422i, 422j y 422k espectrales no formarán parte del conjunto R porque dichas líneas espectrales están ubicadas demasiado cerca al lado de las líneas 420a, 420b, 420c y 420d espectrales. En cambio, los índices de frecuencia de línea espectral de las líneas 422e, 422f, 422g espectrales estarán incluidos en el conjunto R, porque dichas líneas espectrales están en sí mismas cuantificadas a cero y están separadas suficientemente de cualquier línea espectral adyacente distinta de cero.
El algoritmo 300 también comprende una segunda parte 320 de decodificación del suelo de ruido, en el que un índice de valor de ruido (“index” en la parte 320 de código de programa) se convierte en un valor de cifra de ruido decodificado (“nf_decoded” en el programa 300).
El código 300 de programa también comprende una tercera parte 330 de relleno de las líneas espectrales identificadas, es decir líneas espectrales cuyos índices de frecuencia i de línea espectral están en el conjunto R, con ruido. Con este propósito, los valores espectrales de las líneas espectrales identificadas (designados por ejemplo, con x(i), donde la variable continua i adopta de manera subsiguiente todos los índices de frecuencia de línea espectral incluidos en el conjunto R) se fijan a valores de relleno de ruido. Los valores de relleno de ruido se obtienen, por ejemplo, multiplicando el valor de relleno de ruido decodificado (“nf_decoded”) por un número aleatorio o un número pseudoalaeatorio (designado con “random(–1,+1)”), donde el número aleatorio o pseudoalaeatorio puede adoptar, por ejemplo, aleatoriamente o seudoaleatoriamente los números –1 y +1. Sin embargo, naturalmente es posible una provisión diferente de un ruido aleatorio o pseudoaleatorio.
El relleno de ruido también se ilustra en la figura 4. Como se puede ver en la figura 4, los valores espectrales cero de las líneas 422e, 422f y 422g espectrales se reemplazan por valores de relleno de ruido (ilustrados por líneas discontinuas en la figura 4).
Calculador de parámetro de relleno de ruido según las figuras 5 y 6
La figura 5 muestra un diagrama de bloques esquemático de un calculador 500 de parámetro de relleno de ruido. El calculador de parámetro de relleno de ruido está configurado para obtener una representación 510 espectral cuantificada de una señal de audio y para proporcionar, basándose en ello, un parámetro 512 de relleno de ruido. El calculador 500 de parámetro de relleno de ruido comprende un identificador 520 de región espectral, que está configurado para recibir la representación 510 espectral cuantificada de la señal de audio y para identificar regiones espectrales (por ejemplo, líneas espectrales) de la representación 510 espectral cuantificada separadas de regiones espectrales distintas de cero de la representación 510 espectral cuantificada por al menos una región espectral intermedia (por ejemplo línea espectral), para obtener una información 522 que describe regiones espectrales identificadas (por ejemplo líneas espectrales identificadas). El calculador 500 de parámetro de relleno de ruido comprende además un calculador 530 de valor de ruido configurado para recibir una información 532 de error de cuantificación y para proporcionar el parámetro 512 de relleno de ruido. Con este propósito, el calculador de valor de ruido está configurado para considerar selectivamente errores de cuantificación de las regiones espectrales identificadas, descritas mediante la información 522, para un cálculo del parámetro 512 de relleno de ruido.
La información 532 de error de cuantificación puede por ejemplo ser idéntica a una información de energía (o información de intensidad) que describe energías (o intensidades) de aquellas líneas espectrales que están cuantificadas a cero en la representación 510 espectral cuantificada.
El calculador 500 de parámetro de relleno de ruido puede comprender opcionalmente un cuantificador 540, que está configurado para recibir una representación 542 espectral no cuantificada de una señal de audio y para proporcionar la representación 510 espectral cuantificada de la señal de audio. El cuantificador 540 puede tener una resolución de cuantificación ajustable, que puede ser, por ejemplo, individualmente ajustable por línea espectral, o por banda espectral (por ejemplo, dependiendo de una relevancia psicoacústica de las líneas espectrales o bandas espectrales, obtenida usando un modelo psicoacústico). La funcionalidad del cuantificador de resolución variable puede ser igual a la funcionalidad descrita en las normas internaciones ISO/IEC 13818–7 e ISO/IEC 14496–3. En particular, el cuantificador 540 puede ajustarse de manera que haya vacíos espectrales o huecos espectrales en la representación 510 espectral cuantificada de la señal de audio, por ejemplo, regiones contiguas de líneas espectrales adyacentes cuantificadas a cero.
Asimismo, la representación 542 espectral no cuantificada puede servir como la información 532 de error de cuantificación, o la información 532 de error de cuantificación puede derivarse a partir de la representación 542 espectral no cuantificada.
En lo que sigue se describirá en detalle la funcionalidad del cálculo del parámetro de relleno de ruido, que puede realizarse mediante el calculador 500 de parámetro de relleno de ruido. En el cálculo del parámetro de relleno de ruido en el lado del codificador, el relleno de ruido preferiblemente se aplica en el dominio de cuantificación. De esta manera, el ruido introducido se conforma más tarde mediante el filtro inverso relevante psicoacústico. La energía del ruido introducido por el decodificador se calcula y se codifica en el lado del codificador siguiendo las siguientes etapas:
1.
obtener los valores cuantificados de las líneas de frecuencia;
2.
seleccionar sólo una parte de los espectros;
3.
detectar las regiones espectrales en la parte seleccionada de los espectros donde una longitud de recorrido de ceros es mayor que un tamaño de longitud de recorrido mínimo;
4.
calcular la media geométrica del error de cuantificación sobre las regiones previamente detectadas; y
5.
cuantificar uniformemente la media geométrica con 3 bits.
Con relación a la primera etapa, los valores cuantificados de las líneas de frecuencia pueden obtenerse usando el cuantificador 540. Los valores cuantificados de las líneas de frecuencia por lo tanto están representados por la representación 510 espectral cuantificada.
Con respecto a la segunda etapa, que puede considerarse opcional, ha de indicarse que el cálculo del relleno de ruido preferiblemente se realiza sobre la base de una parte de alta frecuencia de los espectros. En una realización preferida, la energía del ruido (llamada suelo de ruido) se calcula sólo en la segunda mitad de los espectros, es decir, para las altas frecuencias (pero no para las frecuencias inferiores). En realidad, usualmente las altas frecuencias (parte superior del espectro) son menos importantes desde el punto de vista perceptivo que las bajas frecuencias, y los valores cuantificados a cero aparecen mayormente en la segunda mitad de los espectros. Asimismo, agregar el ruido en las altas frecuencias es menos propenso a obtener una restitución de sonido final ruidosa.
Con respecto a la tercera etapa, restringiendo el relleno de ruido en las regiones espectrales donde ocurre una longitud de recorrido de valores cuantificados a cero, se evita que el relleno de ruido afecte demasiado a los valores distintos de cero. De esta manera, el relleno de ruido no se aplica en la proximidad de los valores distintos de cero, y la tonalidad original de estas líneas entonces se preserva mejor. El tamaño de longitud de recorrido mínimo se fija en 8 en una realización preferida. Esto significa que las 8 líneas que rodean a un valor distinto de cero no se ven afectadas por el relleno de ruido (y consecuentemente no se consideran para el cálculo de un valor de ruido).
Con respecto a la cuarta etapa, el error de cuantificación en el dominio cuantificado está en el rango [–0,5; 0,5], y se supone que está uniformemente distribuido. La energía de errores de cuantificación de las regiones detectadas se promedia en el dominio logarítmico (es decir, media geométrica). El suelo de ruido, nf, se calcula entonces como sigue:
nf = power(10, sum(log10(E(x(i))))/(2*n))
En lo anterior, sum() es la suma de las energías logarítmicas, log10(E()), de las líneas individuales x(i) dentro de las regiones detectadas, y n el número de líneas dentro de estas regiones. El suelo de ruido, nf, está entre 0 y 0,5. Tal cálculo permite tener en cuenta la planeidad espectral original de los valores cero, y luego obtener información acerca de sus características de tonalidad/ruido.
Si los valores cero son muy tonales, el suelo de ruido (calculado en el aparato 500) tenderá a cero, y se agregará un suelo de ruido bajo al decodificador (por ejemplo, al decodificador 100, 200 descrito arriba). Si los valores cero son realmente ruidosos, el suelo de ruido será alto, y el relleno de ruido puede verse como una codificación altamente paramétrica de las líneas espectrales cero, tal como PNS (sustitución de ruido perceptivo) (véase también referencia [4]).
Con respecto a la quinta etapa, el índice de cuantificación (“index”) del suelo de ruido, se calcula entonces como sigue:
index=max(0,min(7, int(8–16*nf)))
El índice se transmite, por ejemplo, en 3 bits.
En lo que sigue se describirá el algoritmo para calcular el parámetro de relleno de ruido tomando como referencia la figura 6, que muestra un pseudocódigo 600 de programa de un algoritmo tal para obtener el parámetro de relleno de ruido, según una realización de la invención. El algoritmo 600 comprende una primera parte 610 de detección de regiones que deben ser consideradas para calcular el parámetro de relleno de ruido. Las regiones identificadas (por ejemplo, líneas espectrales) se describen por el conjunto R, que por ejemplo puede comprender índices de frecuencia de línea espectral (“line index”) de líneas espectrales identificadas. Pueden identificarse líneas espectrales que en sí mismas están cuantificadas a cero y que además están separadas suficientemente de cualquier otra línea espectral cuantificada a un valor distinto de cero.
La primera parte 610 del programa 600 puede ser idéntica a la primera parte 310 del programa 300. Por consiguiente, la representación espectral cuantificada (“quantized (x(i))”) usada en el algoritmo 600 puede ser, por ejemplo, idéntica a la representación espectral cuantificada (“quantized x(i))”) usada en el algoritmo 300 en el lado del decodificador. En otras palabras, la representación espectral cuantificada usada en el lado del codificador puede transmitirse, en una forma codificada, al decodificador en un sistema de transmisión que comprende un codificador y un decodificador.
El algoritmo 600 comprende una segunda parte 620 de cálculo del suelo de ruido. En el cálculo del suelo de ruido, sólo se consideran aquellas regiones espectrales (o líneas espectrales) descritas por el conjunto R calculado en la primera parte 610 del algoritmo 600. Como puede verse, el valor de relleno de ruido nf se inicializa primero a cero. El número de líneas espectrales (n) consideradas se inicializa primero a cero. A continuación, las energías de todas las líneas espectrales, cuyos índices de línea están incluidos en el conjunto R, se suman, habiéndose logaritmizado las energías de las líneas espectrales antes de la suma. Por ejemplo, se puede sumar un logaritmo de base 10 (log10) de las energías (E(x(i))) de las líneas espectrales. Ha de indicarse aquí que la energía real de las líneas espectrales antes de la cuantificación (designada como “E o energy (x(i))”) se suma en forma logaritmizada. También se cuenta el número de líneas espectrales consideradas. Así, después de la ejecución de la segunda parte 620 del algoritmo 600, la variable nf indica una suma logarítmica de energías de las líneas espectrales identificadas antes de la cuantificación, y la variable n describe el número de líneas espectrales identificadas.
El algoritmo 600 también comprende una tercera parte 630 de cuantificación del valor nf, es decir, la suma logarítmica de las líneas espectrales identificadas. Se puede usar una ecuación de correlación tal como se describió anteriormente
o tal como se muestra en la figura 6.
Método según la figura 7
La figura 7 muestra un diagrama de flujo de un método para proporcionar una representación espectral rellenada con ruido de una señal de audio sobre la base de una representación espectral de entrada de la señal de audio. El método 700 de la figura 7 comprende una etapa 710 de identificar regiones espectrales de una representación espectral de entrada de una señal de audio separadas de las regiones espectrales de valores distintos de cero de la representación espectral de entrada por al menos una región espectral intermedia, para obtener regiones espectrales identificadas. El método 700 también comprende una etapa 720 de introducir selectivamente ruido dentro de las regiones identificadas, para obtener una representación espectral rellenada con ruido de la señal de audio.
El método 700 puede complementarse por cualquiera de las características y funcionalidades descritas en el presente documento con referencia al rellenador de ruido de la invención.
Método según la figura 8
La figura 8 muestra un diagrama de flujo de un método para proporcionar un parámetro de relleno de ruido sobre la base de una representación espectral cuantificada de una señal de audio. El método 800 comprende una etapa 810 de identificar regiones espectrales de la representación espectral cuantificada de una señal de audio separadas de las regiones espectrales de valores distintos de cero de la representación espectral cuantificada por al menos una región espectral intermedia, para obtener regiones espectrales identificadas. El método 800 también comprende una etapa 820 de considerar selectivamente los errores de cuantificación de las regiones identificadas para el cálculo del parámetro de relleno.
El método 800 puede complementarse por cualquiera de las características y funcionalidades descritas en el presente documento con respecto al calculador de parámetro de relleno de ruido.
Representación de señal de audio según la figura 9
La figura 9 muestra una representación gráfica de una representación de señal de audio según una realización de la invención. La representación 900 de señal de audio puede formar la base, por ejemplo, para la representación 110 espectral de entrada. La representación 900 de señal de audio también puede hacerse cargo de la funcionalidad de la representación 212 de señal de audio codificada. La representación 900 de señal de audio puede obtenerse usando el calculador 500 de parámetro de relleno de ruido, pudiendo comprender la representación 900 de señal de audio, por ejemplo, la representación 510 espectral cuantificada de la señal de audio y el parámetro 512 de relleno de ruido, por ejemplo, ambos en forma codificada.
En otras palabras, la representación 900 de señal de audio codificada puede representar una señal de audio. La representación 900 de señal de audio codificada comprende una representación en el dominio espectral cuantificada codificada de la señal de audio y también un parámetro de relleno de ruido codificado. El parámetro de relleno de ruido representa un error de cuantificación de regiones espectrales de la representación en el dominio espectral cuantificadas a cero y separadas de regiones espectrales de la representación en el dominio espectral cuantificadas a valores distinto de ceros, por al menos una región espectral intermedia.
Naturalmente, la representación 900 de señal de audio puede complementarse por cualquier información descrita anteriormente.
Alternativas de implementación
Dependiendo de ciertos requisitos de implementación, las realizaciones de la invención pueden implementarse en hardware o en software. La implementación puede realizarse usando un medio de almacenamiento digital, por ejemplo un disco flexible, un DVD, un CD, una ROM, una PROM, una EPROM, una EEPROM o una memoria FLASH, con señales de control legibles electrónicamente almacenadas en los mismos, que actúan conjuntamente (o pueden actuar conjuntamente) con un sistema informático programable de tal manera que se realice el respectivo método.
Algunas realizaciones según la invención comprenden un soporte de datos con señales de control legibles electrónicamente, que pueden actuar conjuntamente con un sistema informático programable, de tal manera que se realice uno de los métodos descritos en el presente documento.
Generalmente, las realizaciones de la presente invención pueden implementarse como un producto de programa informático con un código de programa, siendo el código de programa operativo para realizar uno de los métodos cuando el producto de programa informático se ejecuta en un ordenador. El código de programa puede estar almacenado, por ejemplo, en un soporte legible por máquina.
Otras realizaciones comprenden el programa informático para realizar uno de los métodos descritos en el presente documento, almacenado en un soporte legible por máquina.
En otras palabras, una realización del método de la invención es, por lo tanto, un programa informático que tiene un código de programa para realizar uno de los métodos descritos en el presente documento, cuando el programa informático se ejecuta en un ordenador.
Una realización adicional de los métodos de la invención es, por lo tanto, un soporte de datos (o un medio de almacenamiento digital) que comprende el programa informático para realizar uno de los métodos descritos en el presente documento.
Una realización adicional del método de la invención es, por lo tanto, un flujo de datos o una secuencia de señales que representan el programa informático para realizar uno de los métodos descritos en el presente documento. El flujo de datos o la secuencia de señales pueden configurarse, por ejemplo, para transferirse a través de una conexión de comunicación de datos, por ejemplo, a través de Internet.
Una realización adicional comprende un medio de procesamiento, por ejemplo, un ordenador, o un dispositivo lógico programable, configurado para o adaptado para realizar uno de los métodos descritos en el presente documento.
Una realización adicional comprende un ordenador que tiene instalado en el mismo el programa informático para realizar uno de los métodos descritos en el presente documento.
En algunas realizaciones se puede usar un dispositivo lógico programable (por ejemplo una disposición de puertas programables en campo) para realizar algunas o todas las funcionalidades de los métodos descritos en el presente documento. En algunas realizaciones, una disposición de puertas programables en campo puede actuar conjuntamente con un microprocesador para realizar uno de los métodos descritos en el presente documento.
Conclusión
Para resumir lo anterior, la presente invención mejora la herramienta de codificación de audio “relleno de ruido” considerando la señal de audio y las características de señal decodificada tanto cuando se calculan parámetros de relleno de ruido en el lado del codificador, como cuando se aplica el ruido en el lado del decodificador. En una realización de la invención, se estima la tonalidad/ruido de las líneas espectrales cuantificadas a cero y se usa para la estimación del suelo de ruido. Este suelo de ruido se transmite entonces al decodificador que aplica el relleno de ruido a los valores cuantificados a cero que aparecen en regiones específicas de los espectros. Estas regiones se seleccionan basándose en las características de los espectros decodificados.
Con relación al contexto de la invención, puede observarse que la invención se ha aplicado a una codificación basada en transformación que usa una cuantificación escalar sobre MDCT. Los coeficientes de MDCT están previamente normalizados mediante una curva calculada basándose en indicadores perceptivos. La curva se deduce a partir de una fase de análisis de LPC (codificación de predicción lineal) previa ponderando los coeficientes de LPC, tal como se hace en el modo TCX de AMR–WB+ (véase la referencia [1]). A partir de los coeficientes ponderados, se diseña un filtro de ponderación perceptivo y se aplica antes de la MDCT. El filtro inverso también se aplica en el lado del decodificador después de la MDCT inversa. Este filtro de ponderación perceptiva inversa conforma los ruidos de cuantificación de una manera que minimiza o enmascara el ruido percibido.
En las realizaciones según la invención se superan las desventajas de la técnica anterior. El relleno de ruido se aplica convencionalmente de una manera sistemática sobre los valores cuantificados a cero considerando sólo un umbral basado en la envolvente espectral, un umbral de enmascaramiento, o un umbral de energía. La técnica anterior no considera ni las características de la señal de entrada ni las características de la señal decodificada. Así, un aparato
5 convencional puede introducir artefactos adicionales indeseables, especialmente artefactos de ruido, y cancela las ventajas de una herramienta de este tipo.
En cambio, las realizaciones de la invención permiten un relleno de ruido mejorado con artefactos reducidos, tal como se comentó anteriormente.
Referencias:
10 [1] “Extended Adaptive Multi-Rate - Wideband (AMR-WB+) codec”, 3GPP TS 26.290 V6.3.0, 2005-06, Technical Specification
[2] Ragot et al., “ITU-T G.729.1: AN 8-32 Kbit/S Scalable Coder Interoperable with G.729 for Wideband Telephony and Voice Over IP”, Vol. 4, ICASSP 07, 15-20 abril de 2007
[3] “AUDIO CODING”, solicitud internacional n.º: PCT/IB2002/001388, Solicitante: KONINKLIJKE PHILIPS
15 ELECTRONICS N.V. [NL/NL]; Groenewoudseweg 1 NL-5621 BA Eindhoven (NL). Inventores: TAORI, Rakesh; Prof Holstlaan 6 NL-5656 AA Eindhoven (NL) y VAN DE PAR, Steven, L., J., D., E.; Prof. Holstlaan 6 NL-5656 AA Eindhoven (NL).
[4] Generic Coding of Moving Pictures and Associated Audio: Advanced Audio Coding. International Standard 13818-7, ISO/IEC JTCI/SC29/WG11 Moving Pictures Expert Group, 1997.

Claims (15)

  1. REIVINDICACIONES
    1. Rellenador (100) de ruido para proporcionar una representación (112) espectral rellenada con ruido de una señal de audio sobre la base de una representación (110) espectral de entrada de la señal de audio, comprendiendo el rellenador de ruido:
    un identificador (120) de región espectral configurado para identificar regiones (422e, 422f, 422g) espectrales de la representación (110) espectral de entrada cuantificadas a cero y separadas de regiones (420a, 420b, 420c, 420d) espectrales distintas de cero de la representación (110) espectral de entrada por al menos una región (422a, 422b, 422c, 422d, 422h, 422i, 422j, 422k) espectral intermedia, para obtener regiones (422e, 422f, 422g) espectrales identificadas; y
    un insertador (130) de ruido configurado para introducir selectivamente ruido dentro de las regiones (422e, 422f, 422g) espectrales identificadas para obtener la representación (112) espectral rellenada con ruido de la señal de audio.
  2. 2. Rellenador (100) de ruido según la reivindicación 1, en el que el identificador (120) de región espectral está configurado para identificar, como regiones espectrales identificadas, líneas (422e, 422f, 422g) espectrales de la representación (110) espectral de entrada, que están cuantificadas a cero y que comprenden al menos un primer número predeterminado de líneas (422a, 422b, 422c, 422d; 422b, 422c, 422d, 422e, 422c, 422d, 422e, 422f) espectrales vecinas de frecuencia inferior cuantificadas a cero y al menos un segundo número predeterminado (4) de líneas (422f, 422g, 422h, 422i; 422g, 422h, 422i, 422j; 422h, 422i, 422j, 422k) espectrales vecinas de frecuencia superior cuantificadas a cero, como regiones espectrales identificadas;
    en el que el primer número predeterminado es mayor o igual a 1, y en el que el segundo número predeterminado es mayor o igual a 1; y
    en el que el insertador (130) de ruido está configurado para introducir selectivamente ruido dentro de las líneas (422e, 422f, 422g) espectrales identificadas mientras que deja sin afectar por el relleno con ruido las líneas (420a, 420b, 420c, 420d) espectrales cuantificadas a un valor distinto de cero y las líneas (422a, 422b, 422c, 422d, 422h, 422i, 422j, 422k) espectrales cuantificadas a cero, pero que no tienen el primer número predeterminado de líneas espectrales vecinas de frecuencia inferior cuantificadas a cero, o el segundo número predeterminado de líneas espectrales vecinas de frecuencia superior cuantificadas a cero.
  3. 3.
    Rellenador (100) de ruido según la reivindicación 2, en el que el primer número predeterminado es igual al segundo número predeterminado.
  4. 4.
    Rellenador (100) de ruido según una de las reivindicaciones 1 a 3, en el que el rellenador de ruido está configurado para introducir ruido sólo dentro de regiones espectrales en una parte superior de la representación (110) espectral de entrada de la señal de audio mientras que deja una parte inferior de la representación (110) espectral de entrada de la señal de audio sin afectar por el relleno con ruido.
  5. 5.
    Rellenador (100) de ruido según una de las reivindicaciones 1 a 4, en el que el identificador (120) de región espectral está configurado para sumar valores de intensidad cuantificados (quantized (x(i))) de regiones espectrales en la proximidad espectral a ambos lados predeterminada de una región espectral (i) dada, para obtener un valor suma (E), y para evaluar el valor suma (E) para decidir si la región espectral (i) dada es una región espectral identificada o no.
  6. 6.
    Rellenador (100) de ruido según una de las reivindicaciones 1 a 5, en el que el identificador (120) de región espectral está configurado para explorar un rango de regiones espectrales de la representación (110) espectral de entrada para detectar secuencias (422a a 422i; 422b a 422j; 422c a 422k) contiguas de regiones espectrales cuantificadas a cero, y para reconocer una o más regiones (422e, 422f, 422g) espectrales centrales de las secuencias contiguas detectadas como regiones espectrales identificadas.
  7. 7.
    Calculador (500) de parámetro de relleno de ruido para proporcionar un parámetro (512) de relleno de ruido sobre la base de una representación (510) espectral cuantificada de una señal de audio, comprendiendo el calculador de parámetro de relleno de ruido:
    un identificador (520) de región espectral configurado para identificar regiones (422e, 422f, 422g) espectrales de la representación (510) espectral cuantificada cuantificadas a cero y separadas de las regiones (420a, 420b, 420c, 420d) espectrales distintas de cero de la representación (510) espectral cuantificada por al menos una región (422a, 422b, 422c, 422d, 422h, 422i, 422j, 422k) espectral intermedia, para obtener regiones (422e, 422f, 422g) espectrales identificadas; y
    un calculador (530) de valor de ruido configurado para considerar selectivamente errores de cuantificación ((energy (x(i))) de las regiones espectrales identificadas (i) para un cálculo del parámetro (512, nf) de relleno de ruido.
  8. 8. Calculador (500) de parámetro de relleno de ruido según la reivindicación 7,
    en el que el identificador (520) de región espectral está configurado para identificar, como regiones espectrales identificadas, líneas (422e, 422f, 422g) espectrales de la representación (510) espectral de entrada, que están cuantificadas a cero y que comprenden al menos un primer número predeterminado de líneas (422a, 422b, 422c, 422d; 422b, 422c, 422d, 422e, 422c, 422d, 422e, 422f) espectrales vecinas de frecuencia inferior cuantificadas a cero y al menos un segundo número predeterminado de líneas (422f, 422g, 422h, 422i; 422g, 422h, 422i, 422j; 422h, 422i, 422j, 422k) espectrales vecinas de frecuencia superior cuantificadas a cero, como regiones espectrales identificadas;
    en el que el primer número predeterminado es mayor o igual a 1, y en el que el segundo número predeterminado es mayor o igual a 1; y
    en el que el calculador (520) de valor de ruido está configurado para considerar selectivamente errores de cuantificación de las regiones espectrales identificadas (i) para un cálculo del parámetro de relleno de ruido mientras que deja las líneas (420a, 420b, 420c, 420d) espectrales cuantificadas a un valor distinto de cero y las líneas (422a, 422b, 422c, 422d, 422h, 422i, 422j, 422k) espectrales cuantificadas a cero, pero que no tienen el primer número predeterminado (4) de líneas espectrales vecinas de frecuencia inferior cuantificadas a cero, o el segundo número predeterminado de líneas espectrales vecinas de frecuencia superior cuantificadas a cero, fuera de consideración para el cálculo del parámetro de relleno de ruido.
  9. 9.
    Calculador (500) de parámetro de relleno de ruido según una de las reivindicaciones 7 a 8, en el que el calculador (530) de valor de ruido está configurado para considerar energías real (energy(x(i)))) de los errores de cuantificación de las regiones espectrales identificadas (i) para el cálculo del parámetro de relleno de ruido (512, nf, nf_index).
  10. 10.
    Calculador (500) de parámetro de relleno de ruido según una de las reivindicaciones 7 a 9, en el que el calculador (530) de valor de ruido está configurado para enfatizar una energía de error de cuantificación no tonal (energy (x(i)))) distribuida sobre una pluralidad de regiones espectrales identificadas en relación a una energía de error de cuantificación tonal concentrada en una sola región espectral o en una pluralidad de líneas espectrales contiguas.
  11. 11.
    Calculador (500) de parámetro de relleno de ruido según una de las reivindicaciones 7 a 10, en el que el calculador (530) de valor de ruido está configurado para calcular una suma de energías de error de cuantificación logaritmizadas (log10(energy(x(i)))) de las regiones espectrales identificadas (i), para obtener el parámetro de relleno de ruido (512, nf, nf_index).
  12. 12.
    Representación (900) de señal de audio codificada que representa una señal de audio, comprendiendo la representación de señal de audio codificada:
    una representación en el dominio espectral cuantificada codificada de la señal de audio; y
    un parámetro de relleno de ruido codificado;
    en la que el parámetro de relleno de ruido representa un error de cuantificación de regiones espectrales de la representación en el dominio espectral cuantificada a cero y separada de regiones espectrales de la representación en el dominio espectral cuantificada a un valor distinto de cero, por al menos una región espectral intermedia.
  13. 13. Método (700) para proporcionar una representación espectral rellenada con ruido de una señal de audio sobre la base de una representación espectral de entrada de la señal de audio, comprendiendo el método:
    identificar (710) regiones espectrales de la representación espectral de entrada cuantificadas a cero y separadas de regiones espectrales distintas de cero de la representación espectral de entrada por al menos una región espectral intermedia, para obtener regiones espectrales identificadas; e
    introducir selectivamente (720) ruido dentro de las regiones espectrales identificadas para obtener la representación espectral rellenada con ruido de la señal de audio.
  14. 14. Método (800) para proporcionar un parámetro de relleno de ruido sobre la base de una representación espectral cuantificada de una señal de audio, comprendiendo el método:
    identificar (810) regiones espectrales de la representación espectral cuantificada cuantificadas a cero y separadas de regiones espectrales distintas de cero de la representación espectral cuantificada por al menos una región espectral intermedia para obtener regiones espectrales identificadas; y
    considerar selectivamente (820) errores de cuantificación de las regiones espectrales identificadas para un cálculo del parámetro de relleno de ruido.
  15. 15. Programa informático para realizar el método según la reivindicación 13 ó 14, cuando el programa informático se ejecuta en un ordenador.
ES09776859T 2008-07-11 2009-06-26 Rellenador de ruido, calculador de parámetro de relleno de ruido, método para proporcionar un parámetro de relleno de ruido, método para proporcionar una representación espectral rellenada con ruido de una señal de audio, programa informático correspondiente y señal de audio codificada. Active ES2374640T3 (es)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US7987208P 2008-07-11 2008-07-11
US79872 2008-07-11
US10382008P 2008-10-08 2008-10-08
US103820 2008-10-08
PCT/EP2009/004653 WO2010003565A1 (en) 2008-07-11 2009-06-26 Noise filler, noise filling parameter calculator, method for providing a noise filling parameter, method for providing a noise-filled spectral representation of an audio signal, corresponding computer program and encoded audio signal

Publications (1)

Publication Number Publication Date
ES2374640T3 true ES2374640T3 (es) 2012-02-20

Family

ID=40941986

Family Applications (5)

Application Number Title Priority Date Filing Date
ES11157188T Active ES2422412T3 (es) 2008-07-11 2009-06-25 Codificador de audio, procedimiento para la codificación de audio y programa de ordenador
ES11157204.6T Active ES2526767T3 (es) 2008-07-11 2009-06-25 Codificador de audio, procedimiento para codificar una señal de audio y programa de ordenador
ES09776839.4T Active ES2642906T3 (es) 2008-07-11 2009-06-25 Codificador de audio, procedimientos para proporcionar un flujo de audio y programa de ordenador
ES17175883T Active ES2955669T3 (es) 2008-07-11 2009-06-25 Decodificador de audio, procedimiento para decodificar una señal de audio y programa de ordenador
ES09776859T Active ES2374640T3 (es) 2008-07-11 2009-06-26 Rellenador de ruido, calculador de parámetro de relleno de ruido, método para proporcionar un parámetro de relleno de ruido, método para proporcionar una representación espectral rellenada con ruido de una señal de audio, programa informático correspondiente y señal de audio codificada.

Family Applications Before (4)

Application Number Title Priority Date Filing Date
ES11157188T Active ES2422412T3 (es) 2008-07-11 2009-06-25 Codificador de audio, procedimiento para la codificación de audio y programa de ordenador
ES11157204.6T Active ES2526767T3 (es) 2008-07-11 2009-06-25 Codificador de audio, procedimiento para codificar una señal de audio y programa de ordenador
ES09776839.4T Active ES2642906T3 (es) 2008-07-11 2009-06-25 Codificador de audio, procedimientos para proporcionar un flujo de audio y programa de ordenador
ES17175883T Active ES2955669T3 (es) 2008-07-11 2009-06-25 Decodificador de audio, procedimiento para decodificar una señal de audio y programa de ordenador

Country Status (22)

Country Link
US (9) US9043203B2 (es)
EP (7) EP4372745A1 (es)
JP (2) JP5622726B2 (es)
KR (4) KR101582057B1 (es)
CN (2) CN102089808B (es)
AR (2) AR072482A1 (es)
AT (1) ATE535903T1 (es)
AU (2) AU2009267459B2 (es)
BR (6) BR122021003726B1 (es)
CA (2) CA2730361C (es)
CO (2) CO6341671A2 (es)
EG (1) EG26480A (es)
ES (5) ES2422412T3 (es)
HK (2) HK1157045A1 (es)
MX (2) MX2011000382A (es)
MY (2) MY178597A (es)
PL (3) PL3246918T3 (es)
PT (1) PT2304719T (es)
RU (2) RU2519069C2 (es)
TW (2) TWI417871B (es)
WO (2) WO2010003556A1 (es)
ZA (2) ZA201100091B (es)

Families Citing this family (83)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR122021003726B1 (pt) 2008-07-11 2021-11-09 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Codificador de áudio, decodificador de áudio, métodos para codificar e decodificar um sinal de áudio.
EP2182513B1 (en) * 2008-11-04 2013-03-20 Lg Electronics Inc. An apparatus for processing an audio signal and method thereof
US8553897B2 (en) * 2009-06-09 2013-10-08 Dean Robert Gary Anderson Method and apparatus for directional acoustic fitting of hearing aids
US8879745B2 (en) * 2009-07-23 2014-11-04 Dean Robert Gary Anderson As Trustee Of The D/L Anderson Family Trust Method of deriving individualized gain compensation curves for hearing aid fitting
US9101299B2 (en) * 2009-07-23 2015-08-11 Dean Robert Gary Anderson As Trustee Of The D/L Anderson Family Trust Hearing aids configured for directional acoustic fitting
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
US9117458B2 (en) * 2009-11-12 2015-08-25 Lg Electronics Inc. Apparatus for processing an audio signal and method thereof
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
US8924222B2 (en) 2010-07-30 2014-12-30 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for coding of harmonic signals
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
US9208792B2 (en) * 2010-08-17 2015-12-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for noise injection
WO2012037515A1 (en) 2010-09-17 2012-03-22 Xiph. Org. Methods and systems for adaptive time-frequency resolution in digital data coding
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
WO2012053150A1 (ja) * 2010-10-18 2012-04-26 パナソニック株式会社 音声符号化装置および音声復号化装置
WO2012122303A1 (en) 2011-03-07 2012-09-13 Xiph. Org Method and system for two-step spreading for tonal artifact avoidance in audio coding
US9015042B2 (en) * 2011-03-07 2015-04-21 Xiph.org Foundation Methods and systems for avoiding partial collapse in multi-block audio coding
US9009036B2 (en) 2011-03-07 2015-04-14 Xiph.org Foundation Methods and systems for bit allocation and partitioning in gain-shape vector quantization for audio coding
JP5820487B2 (ja) 2011-03-18 2015-11-24 フラウンホーファーゲゼルシャフトツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. オーディオコンテントを表すビットストリームのフレームにおけるフレーム要素位置決め
EP2705516B1 (en) * 2011-05-04 2016-07-06 Nokia Technologies Oy Encoding of stereophonic signals
AU2012276367B2 (en) * 2011-06-30 2016-02-04 Samsung Electronics Co., Ltd. Apparatus and method for generating bandwidth extension signal
US9875748B2 (en) * 2011-10-24 2018-01-23 Koninklijke Philips N.V. Audio signal noise attenuation
US8942397B2 (en) * 2011-11-16 2015-01-27 Dean Robert Gary Anderson Method and apparatus for adding audible noise with time varying volume to audio devices
JP5942463B2 (ja) * 2012-02-17 2016-06-29 株式会社ソシオネクスト オーディオ信号符号化装置およびオーディオ信号符号化方法
US9305567B2 (en) 2012-04-23 2016-04-05 Qualcomm Incorporated Systems and methods for audio signal processing
CN103778918B (zh) * 2012-10-26 2016-09-07 华为技术有限公司 音频信号的比特分配的方法和装置
CN103854653B (zh) * 2012-12-06 2016-12-28 华为技术有限公司 信号解码的方法和设备
AU2014211539B2 (en) * 2013-01-29 2017-04-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Low-complexity tonality-adaptive audio signal quantization
MX346927B (es) 2013-01-29 2017-04-05 Fraunhofer Ges Forschung Énfasis de bajas frecuencias para codificación basada en lpc (codificación de predicción lineal) en el dominio de frecuencia.
RU2631988C2 (ru) * 2013-01-29 2017-09-29 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Заполнение шумом при аудиокодировании с перцепционным преобразованием
BR112015019176B1 (pt) * 2013-04-05 2021-02-09 Dolby Laboratories Licensing Corporation método e aparelho de expansão de um sinal de áudio, método e aparelho de compressão de um sinal de áudio, e mídia legível por computador
EP2981961B1 (en) 2013-04-05 2017-05-10 Dolby International AB Advanced quantizer
EP2992605B1 (en) * 2013-04-29 2017-06-07 Dolby Laboratories Licensing Corporation Frequency band compression with dynamic thresholds
EP4290510A3 (en) 2013-05-24 2024-02-14 Dolby International AB Audio encoder
BR112015032013B1 (pt) * 2013-06-21 2021-02-23 Fraunhofer-Gesellschaft zur Förderung der Angewandten ForschungE.V. Método e equipamento para a obtenção de coeficientes do espectropara um quadro de substituição de um sinal de áudio, descodificador de áudio,receptor de áudio e sistema para transmissão de sinais de áudio
WO2014210284A1 (en) * 2013-06-27 2014-12-31 Dolby Laboratories Licensing Corporation Bitstream syntax for spatial voice coding
EP2830064A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding and encoding an audio signal using adaptive spectral tile selection
EP2830058A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Frequency-domain audio coding supporting transform length switching
EP2830060A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Noise filling in multichannel audio coding
CN105531762B (zh) 2013-09-19 2019-10-01 索尼公司 编码装置和方法、解码装置和方法以及程序
AU2014329890B2 (en) 2013-10-03 2017-10-26 Dolby Laboratories Licensing Corporation Adaptive diffuse signal generation in an upmixer
CN111580772B (zh) * 2013-10-22 2023-09-26 弗劳恩霍夫应用研究促进协会 用于音频设备的组合动态范围压缩和引导截断防止的构思
EP3285254B1 (en) 2013-10-31 2019-04-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder and method for providing a decoded audio information using an error concealment based on a time domain excitation signal
PL3336839T3 (pl) 2013-10-31 2020-02-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Dekoder audio i sposób dostarczania zdekodowanej informacji audio z wykorzystaniem maskowania błędów modyfikującego sygnał pobudzenia w dziedzinie czasu
WO2015081699A1 (zh) 2013-12-02 2015-06-11 华为技术有限公司 一种编码方法及装置
KR20230042410A (ko) 2013-12-27 2023-03-28 소니그룹주식회사 복호화 장치 및 방법, 및 프로그램
EP4109445A1 (en) * 2014-03-14 2022-12-28 Telefonaktiebolaget LM Ericsson (PUBL) Audio coding method and apparatus
CN111710342B (zh) * 2014-03-31 2024-04-16 弗朗霍弗应用研究促进协会 编码装置、解码装置、编码方法、解码方法及程序
US9685166B2 (en) 2014-07-26 2017-06-20 Huawei Technologies Co., Ltd. Classification between time-domain coding and frequency domain coding
EP2980801A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for estimating noise in an audio signal, noise estimator, audio encoder, audio decoder, and system for transmitting audio signals
EP2980792A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating an enhanced signal using independent noise-filling
JPWO2016052191A1 (ja) * 2014-09-30 2017-07-20 ソニー株式会社 送信装置、送信方法、受信装置および受信方法
US20160173808A1 (en) 2014-12-16 2016-06-16 Psyx Research, Inc. System and method for level control at a receiver
WO2016142002A1 (en) * 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
TWI771266B (zh) * 2015-03-13 2022-07-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
WO2016162283A1 (en) * 2015-04-07 2016-10-13 Dolby International Ab Audio coding with range extension
US9454343B1 (en) 2015-07-20 2016-09-27 Tls Corp. Creating spectral wells for inserting watermarks in audio signals
US9311924B1 (en) 2015-07-20 2016-04-12 Tls Corp. Spectral wells for inserting watermarks in audio signals
US9626977B2 (en) 2015-07-24 2017-04-18 Tls Corp. Inserting watermarks into audio signals that have speech-like properties
US10115404B2 (en) 2015-07-24 2018-10-30 Tls Corp. Redundancy in watermarking audio signals that have speech-like properties
IL276591B2 (en) 2015-10-08 2023-09-01 Dolby Int Ab Layered coding for voice or compressed sound field representations
CA3228629A1 (en) 2015-10-08 2017-04-13 Dolby International Ab Layered coding and data structure for compressed higher-order ambisonics sound or sound field representations
US10142743B2 (en) 2016-01-01 2018-11-27 Dean Robert Gary Anderson Parametrically formulated noise and audio systems, devices, and methods thereof
EP3208800A1 (en) * 2016-02-17 2017-08-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for stereo filing in multichannel coding
AU2017219696B2 (en) * 2016-02-17 2018-11-08 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Post-processor, pre-processor, audio encoder, audio decoder and related methods for enhancing transient processing
US10146500B2 (en) 2016-08-31 2018-12-04 Dts, Inc. Transform-based audio codec and method with subband energy smoothing
EP3382703A1 (en) * 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and methods for processing an audio signal
EP3396670B1 (en) * 2017-04-28 2020-11-25 Nxp B.V. Speech signal processing
WO2019081070A1 (en) * 2017-10-27 2019-05-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. APPARATUS, METHOD, OR COMPUTER PROGRAM PRODUCT FOR GENERATING ENHANCED BANDWIDTH AUDIO SIGNAL USING NEURAL NETWORK PROCESSOR
WO2019091576A1 (en) * 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
US10950251B2 (en) * 2018-03-05 2021-03-16 Dts, Inc. Coding of harmonic signals in transform-based audio codecs
US11694708B2 (en) * 2018-09-23 2023-07-04 Plantronics, Inc. Audio device and method of audio processing with improved talker discrimination
US11264014B1 (en) * 2018-09-23 2022-03-01 Plantronics, Inc. Audio device and method of audio processing with improved talker discrimination
WO2020073148A1 (en) * 2018-10-08 2020-04-16 Telefonaktiebolaget Lm Ericsson (Publ) Transmission power determination for an antenna array
WO2020164751A1 (en) * 2019-02-13 2020-08-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decoder and decoding method for lc3 concealment including full frame loss concealment and partial frame loss concealment
EP3939035A4 (en) * 2019-03-10 2022-11-02 Kardome Technology Ltd. LANGUAGE IMPROVEMENT USING CLUSTERING OF HINTS
WO2020207593A1 (en) * 2019-04-11 2020-10-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder, apparatus for determining a set of values defining characteristics of a filter, methods for providing a decoded audio representation, methods for determining a set of values defining characteristics of a filter and computer program
US20200402522A1 (en) * 2019-06-24 2020-12-24 Qualcomm Incorporated Quantizing spatial components based on bit allocations determined for psychoacoustic audio coding
US11361776B2 (en) 2019-06-24 2022-06-14 Qualcomm Incorporated Coding scaled spatial components
US11538489B2 (en) 2019-06-24 2022-12-27 Qualcomm Incorporated Correlating scene-based audio data for psychoacoustic audio coding
CN112037802B (zh) * 2020-05-08 2022-04-01 珠海市杰理科技股份有限公司 基于语音端点检测的音频编码方法及装置、设备、介质
US11545172B1 (en) * 2021-03-09 2023-01-03 Amazon Technologies, Inc. Sound source localization using reflection classification
CN114900246B (zh) * 2022-05-25 2023-06-13 中国电子科技集团公司第十研究所 噪声基底估计方法、装置、设备及存储介质

Family Cites Families (49)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4703505A (en) * 1983-08-24 1987-10-27 Harris Corporation Speech data encoding scheme
US4956871A (en) * 1988-09-30 1990-09-11 At&T Bell Laboratories Improving sub-band coding of speech at low bit rates by adding residual speech energy signals to sub-bands
JPH0934493A (ja) 1995-07-20 1997-02-07 Graphics Commun Lab:Kk 音響信号符号化装置、音響信号復号装置および音響信号処理装置
US6092041A (en) 1996-08-22 2000-07-18 Motorola, Inc. System and method of encoding and decoding a layered bitstream by re-applying psychoacoustic analysis in the decoder
US5797120A (en) * 1996-09-04 1998-08-18 Advanced Micro Devices, Inc. System and method for generating re-configurable band limited noise using modulation
US5924064A (en) * 1996-10-07 1999-07-13 Picturetel Corporation Variable length coding using a plurality of region bit allocation patterns
US5960389A (en) * 1996-11-15 1999-09-28 Nokia Mobile Phones Limited Methods for generating comfort noise during discontinuous transmission
US6167133A (en) * 1997-04-02 2000-12-26 At&T Corporation Echo detection, tracking, cancellation and noise fill in real time in a communication system
US6240386B1 (en) 1998-08-24 2001-05-29 Conexant Systems, Inc. Speech codec employing noise classification for noise compensation
US7124079B1 (en) 1998-11-23 2006-10-17 Telefonaktiebolaget Lm Ericsson (Publ) Speech coding with comfort noise variability feature for increased fidelity
RU2237296C2 (ru) * 1998-11-23 2004-09-27 Телефонактиеболагет Лм Эрикссон (Пабл) Кодирование речи с функцией изменения комфортного шума для повышения точности воспроизведения
JP3804902B2 (ja) 1999-09-27 2006-08-02 パイオニア株式会社 量子化誤差補正方法及び装置並びにオーディオ情報復号方法及び装置
FI116643B (fi) * 1999-11-15 2006-01-13 Nokia Corp Kohinan vaimennus
SE0004187D0 (sv) * 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
DE60233032D1 (de) * 2001-03-02 2009-09-03 Panasonic Corp Audio-kodierer und audio-dekodierer
US6876968B2 (en) 2001-03-08 2005-04-05 Matsushita Electric Industrial Co., Ltd. Run time synthesizer adaptation to improve intelligibility of synthesized speech
KR100871999B1 (ko) * 2001-05-08 2008-12-05 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 코딩
JP4506039B2 (ja) 2001-06-15 2010-07-21 ソニー株式会社 符号化装置及び方法、復号装置及び方法、並びに符号化プログラム及び復号プログラム
US7447631B2 (en) * 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
KR100462611B1 (ko) * 2002-06-27 2004-12-20 삼성전자주식회사 하모닉 성분을 이용한 오디오 코딩방법 및 장치
JP4218271B2 (ja) * 2002-07-19 2009-02-04 ソニー株式会社 データ処理装置およびデータ処理方法、並びにプログラムおよび記録媒体
DE10236694A1 (de) 2002-08-09 2004-02-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren
KR100477699B1 (ko) * 2003-01-15 2005-03-18 삼성전자주식회사 양자화 잡음 분포 조절 방법 및 장치
WO2005004113A1 (ja) * 2003-06-30 2005-01-13 Fujitsu Limited オーディオ符号化装置
ATE391988T1 (de) * 2003-10-10 2008-04-15 Agency Science Tech & Res Verfahren zum codieren eines digitalen signals in einen skalierbaren bitstrom, verfahren zum decodieren eines skalierbaren bitstroms
US7723474B2 (en) 2003-10-21 2010-05-25 The Regents Of The University Of California Molecules that selectively home to vasculature of pre-malignant dysplastic lesions or malignancies
US7436786B2 (en) * 2003-12-09 2008-10-14 International Business Machines Corporation Telecommunications system for minimizing the effect of white noise data packets for the generation of required white noise on transmission channel utilization
JP2005202248A (ja) * 2004-01-16 2005-07-28 Fujitsu Ltd オーディオ符号化装置およびオーディオ符号化装置のフレーム領域割り当て回路
DE102004007200B3 (de) 2004-02-13 2005-08-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audiocodierung
CA2457988A1 (en) 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
US7613306B2 (en) * 2004-02-25 2009-11-03 Panasonic Corporation Audio encoder and audio decoder
ES2291877T3 (es) 2004-05-17 2008-03-01 Nokia Corporation Codificacion de audio con diferentes modelos de codificacion.
US7649988B2 (en) 2004-06-15 2010-01-19 Acoustic Technologies, Inc. Comfort noise generator using modified Doblinger noise estimate
US7873515B2 (en) * 2004-11-23 2011-01-18 Stmicroelectronics Asia Pacific Pte. Ltd. System and method for error reconstruction of streaming audio information
KR100707173B1 (ko) 2004-12-21 2007-04-13 삼성전자주식회사 저비트율 부호화/복호화방법 및 장치
US7885809B2 (en) * 2005-04-20 2011-02-08 Ntt Docomo, Inc. Quantization of speech and audio coding parameters using partial information on atypical subsequences
RU2419171C2 (ru) * 2005-07-22 2011-05-20 Франс Телеком Способ переключения скорости передачи битов при аудиодекодировании с масштабированием скорости передачи битов и масштабированием полосы пропускания
JP4627737B2 (ja) * 2006-03-08 2011-02-09 シャープ株式会社 デジタルデータ復号化装置
WO2007122614A2 (en) * 2006-04-21 2007-11-01 Galtronics Ltd. Twin ground antenna
JP4380669B2 (ja) * 2006-08-07 2009-12-09 カシオ計算機株式会社 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、及び、プログラム
US7275936B1 (en) * 2006-09-22 2007-10-02 Lotes Co., Ltd. Electrical connector
US8275611B2 (en) * 2007-01-18 2012-09-25 Stmicroelectronics Asia Pacific Pte., Ltd. Adaptive noise suppression for digital speech signals
EP2116997A4 (en) * 2007-03-02 2011-11-23 Panasonic Corp AUDIO DECODING DEVICE AND AUDIO DECODING METHOD
ES2858423T3 (es) 2007-08-27 2021-09-30 Ericsson Telefon Ab L M Método y dispositivo para el llenado de huecos espectrales
US9269372B2 (en) 2007-08-27 2016-02-23 Telefonaktiebolaget L M Ericsson (Publ) Adaptive transition frequency between noise fill and bandwidth extension
US8554550B2 (en) * 2008-01-28 2013-10-08 Qualcomm Incorporated Systems, methods, and apparatus for context processing using multi resolution analysis
BR122021003726B1 (pt) * 2008-07-11 2021-11-09 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Codificador de áudio, decodificador de áudio, métodos para codificar e decodificar um sinal de áudio.
US9208792B2 (en) 2010-08-17 2015-12-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for noise injection
WO2012053150A1 (ja) 2010-10-18 2012-04-26 パナソニック株式会社 音声符号化装置および音声復号化装置

Also Published As

Publication number Publication date
KR101582057B1 (ko) 2015-12-31
CA2730536A1 (en) 2010-01-14
CA2730361A1 (en) 2010-01-14
AU2009267459B2 (en) 2014-01-23
BR122021003097B1 (pt) 2021-11-03
US20110170711A1 (en) 2011-07-14
US11869521B2 (en) 2024-01-09
AR072482A1 (es) 2010-09-01
ZA201100091B (en) 2011-10-26
ES2422412T3 (es) 2013-09-11
CA2730536C (en) 2014-12-02
BR122021003142B1 (pt) 2021-11-03
EP2304719B1 (en) 2017-07-26
ES2642906T3 (es) 2017-11-20
EP3246918A1 (en) 2017-11-22
BRPI0910522A2 (pt) 2020-10-20
KR20140036042A (ko) 2014-03-24
HK1160285A1 (en) 2012-08-10
EG26480A (en) 2013-12-02
KR20160004403A (ko) 2016-01-12
KR101518532B1 (ko) 2015-05-07
US20240096337A1 (en) 2024-03-21
EP4235660A2 (en) 2023-08-30
EP4372744A1 (en) 2024-05-22
US20150112693A1 (en) 2015-04-23
US9449606B2 (en) 2016-09-20
ES2955669T3 (es) 2023-12-05
US20170004839A1 (en) 2017-01-05
ZA201100085B (en) 2011-10-26
KR20110039245A (ko) 2011-04-15
US9711157B2 (en) 2017-07-18
EP4372745A1 (en) 2024-05-22
RU2011102410A (ru) 2012-07-27
MY155785A (en) 2015-11-30
US20110173012A1 (en) 2011-07-14
BR122021003752B1 (pt) 2021-11-09
US20140236605A1 (en) 2014-08-21
AU2009267468B2 (en) 2012-03-15
HK1157045A1 (en) 2012-06-22
EP4375998A1 (en) 2024-05-29
CN102089806B (zh) 2012-12-05
TW201007696A (en) 2010-02-16
BRPI0910811A2 (pt) 2020-11-03
JP2011527455A (ja) 2011-10-27
JP5622726B2 (ja) 2014-11-12
JP5307889B2 (ja) 2013-10-02
MX2011000382A (es) 2011-02-25
CO6341671A2 (es) 2011-11-21
PL2304720T3 (pl) 2012-04-30
CN102089808A (zh) 2011-06-08
KR20110040829A (ko) 2011-04-20
CA2730361C (en) 2017-01-03
BRPI0910811B1 (pt) 2021-09-21
ATE535903T1 (de) 2011-12-15
WO2010003556A1 (en) 2010-01-14
MY178597A (en) 2020-10-16
EP2304720A1 (en) 2011-04-06
KR101251790B1 (ko) 2013-04-08
US9043203B2 (en) 2015-05-26
RU2512103C2 (ru) 2014-04-10
BR122021003726B1 (pt) 2021-11-09
CN102089808B (zh) 2014-02-12
TW201007697A (en) 2010-02-16
EP2304719A1 (en) 2011-04-06
AU2009267459A1 (en) 2010-01-14
EP2304720B1 (en) 2011-11-30
PT2304719T (pt) 2017-11-03
MX2011000359A (es) 2011-02-25
PL2304719T3 (pl) 2017-12-29
US20170309283A1 (en) 2017-10-26
CN102089806A (zh) 2011-06-08
US10629215B2 (en) 2020-04-21
EP4235660A3 (en) 2023-09-13
RU2519069C2 (ru) 2014-06-10
US20210272577A1 (en) 2021-09-02
CO6280569A2 (es) 2011-05-20
US11024323B2 (en) 2021-06-01
RU2011104006A (ru) 2012-08-20
WO2010003565A1 (en) 2010-01-14
KR101706009B1 (ko) 2017-02-22
EP3246918C0 (en) 2023-06-14
EP3246918B1 (en) 2023-06-14
ES2526767T3 (es) 2015-01-15
TWI492223B (zh) 2015-07-11
AR072497A1 (es) 2010-09-01
JP2011527451A (ja) 2011-10-27
US8983851B2 (en) 2015-03-17
AU2009267468A1 (en) 2010-01-14
PL3246918T3 (pl) 2023-11-06
TWI417871B (zh) 2013-12-01
US20240096338A1 (en) 2024-03-21

Similar Documents

Publication Publication Date Title
ES2374640T3 (es) Rellenador de ruido, calculador de parámetro de relleno de ruido, método para proporcionar un parámetro de relleno de ruido, método para proporcionar una representación espectral rellenada con ruido de una señal de audio, programa informático correspondiente y señal de audio codificada.
ES2858423T3 (es) Método y dispositivo para el llenado de huecos espectrales
ES2403410T3 (es) Frecuencia de transición adaptativa entre el rellenado con ruido y la extensión del ancho de banda
US7395211B2 (en) Modulating one or more parameters of an audio or video perceptual coding system in response to supplemental information
ES2312142T3 (es) Aparato avanzado para codificar datos de audio digitales.
CN110197667B (zh) 对音频信号的频谱执行噪声填充的装置
US9546924B2 (en) Transform audio codec and methods for encoding and decoding a time segment of an audio signal
RU2744477C2 (ru) Преобразующее кодирование/декодирование гармонических звуковых сигналов
ES2655832T3 (es) Método y dispositivo de codificación y descodificación de señal
CN104170009B (zh) 感知音频编解码器中的谐波信号的相位相干性控制
ES2634196T3 (es) Diseño de tabla de banda de frecuencia para algoritmos de reconstrucción de alta frecuencia
KR101426596B1 (ko) 오디오 인코딩 방법
Melkote et al. A modified distortion metric for audio coding