MX2011000359A - Rellenador de ruido, calculador de parametro de relleno de ruido, representacion de señal de audio codificada, metodos y programa de computadora. - Google Patents

Rellenador de ruido, calculador de parametro de relleno de ruido, representacion de señal de audio codificada, metodos y programa de computadora.

Info

Publication number
MX2011000359A
MX2011000359A MX2011000359A MX2011000359A MX2011000359A MX 2011000359 A MX2011000359 A MX 2011000359A MX 2011000359 A MX2011000359 A MX 2011000359A MX 2011000359 A MX2011000359 A MX 2011000359A MX 2011000359 A MX2011000359 A MX 2011000359A
Authority
MX
Mexico
Prior art keywords
spectral
noise
audio signal
representation
regions
Prior art date
Application number
MX2011000359A
Other languages
English (en)
Inventor
Juergen Herre
Harald Popp
Stefan Geyersberger
Bernhard Grill
Markus Multrus
Gerald Schuller
Jens Hirschfeld
Stefan Wabnik
Guillaume Fuchs
Nikolaus Rettlebach
Original Assignee
Fraunhofer Ges Forschung
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=40941986&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=MX2011000359(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Fraunhofer Ges Forschung filed Critical Fraunhofer Ges Forschung
Publication of MX2011000359A publication Critical patent/MX2011000359A/es

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/035Scalar quantisation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/028Noise substitution, i.e. substituting non-tonal spectral components by noisy source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band

Abstract

Un rellenador de ruido para proveer una representación espectral rellenada con ruido de una señal de audio sobre la base de una representación espectral de entrada de la señal de audio comprende un identificador de región espectral configurado para identificar regiones de la representación espectral de entrada espaciadas de regiones espectrales no nulas de la representación espectral de entrada por al menos una región espectral intermedia, para obtener regiones espectrales identificadas, y un insertador de mido configurado para introducir selectivamente ruido dentro las regiones espectrales identificadas para obtener la representación espectral rellena con ruido de la señal de audio. Un calculador de parámetro de relleno de mido para proveer un parámetro de relleno de ruido sobre la base de una representación espectral cuantificada de una señal de audio comprende un identificador de región espectral, como se menciona arriba, y un calculador de valor de ruido configurado para considerar selectivamente errores de cuantificación de las regiones espectrales identificadas para un cálculo del parámetro de relleno de mido. Consiguientemente, se puede obtener una representación de señal de audio que representa la señal de audio.

Description

LLENADOR DE RUIDO, CALCULADOR DE PARÁMETRO DE R IDO, REPRESENTACIÓN DE SEÑAL DE AUDIO CODIFICADA, I PROGRAMA DE COMPUTADORA Descripción do del Invento . i ¦ Realizaciones de acuerdo con el invento están relacion ñador de ruido para proveer una representación espectral rellen una señal de audio sobre la base de una representación espectr la señal de audio, con un calculador de parámetro de relleno de al de audio, con una representación de señal de audio co resenta una señal de audio, con un método para proveer una r ectral rellenada con ruido de una señal de audio, con un método parámetro de relleno de ruido sobre la base de una representa ntificada de una señal de audio, y con programas de comp lementar dichos métodos.
En lo que sigue se describirán algunos escenarios en l vancia psicoacústica de las diferentes regiones espectrales ulada, por ejemplo, usando un modelo piscoacústico el cual toma ascaramiento dé regiones espectrales más débiles por par ectrales fuertes adyacentes.
Si hay un deseo de reducir la velocidad de transmisión d al de audio codificada hacia un nivel bajo, algunas regiones es ntificadas con una muy baja precisión (por ejemplo, precisión de cisión de dos bits). Consiguientemente, muchas regiones ntificadas con baja precisión son cuantificadas a cero. Así, a baja transmisión de bits los codificadores de audio basados en transf pensos a diferentes artefactos (en este contexto se refiere a versión) y especialmente a artefactos que se originan desd uencia cuantificadas a cero. En realidad, la cuantificación grase ectrales en codificación de audio de baja velocidad de transm ría conducir a un espectro muy esparcido después de la cuantific que muchas líneas espectrales podrían haber sido cuantificadas jeros de frecuencia en la señal reconstruida producen indeseabl Se conocen diferentes conceptos de relleno de ruido. Po ominado AMR-WR+ combina relleno de ruido y una Transformaci creta (DFT), como se describe por ejemplo en la referencia [1]. Ad 29.1 Estándar Internacional define un concepto que combina relle sformación coseno discreta modificada (MDCT). En la refer criben detalles.
Aspectos adicionales con relación a relleno de ruido se de icitud de patente Internacional PCT/IB2002/001388 de Konin Ctronics N.V. (ver referencia [3]).
De todos modos, los conceptos de relleno de ruido conve resultado distorsiones audibles.
En vista de esta discusión, hay un deseo de crear un eño de ruido que se encargue.de una mejor impresión de audición. tesis del Invento Una realización de acuerdo con el invento crea un filtro veer una representación espectral rellenada con ruido de una s tro de las regiones espectrales identificadas (por ejemplo, líneas dejas espectrales) para obtener la representación espectral reli la señal de audio.
Esta realización del presente invento se basa en el hall ponentes tonales de la representación espectral de una se camente son degradados, en términos de impresión auditiva, si eño de ruido en la vecindad inmediata de tales compone nsiguientemente, se ha hallado que se puede obtener una me itiva de una señal de audio rellenada con ruido si el relleno de ica a regiones espectrales que están separadas de tal to ectrales no nulas. Consiguientemente, los componentes tonales señal de audio (los cuales no son cuantificados a cero en la r ectral cuantificada ingresada al rellenador de ruido) permanecen no quedan derrotados con ruido adyacente muy cercano), mientr ta eficientemente la presencia de grandes agujeros espectrales.
En una realización preferida, el identificador de región figurado para identificar líneas espectrales de la representación ectrales identificadas mientras que deja líneas espectrales cuant or no cero y líneas espectrales cuantificadas a cero, pero no habie diante el relleno de ruido, al primer número predeterminad ectrales vecinas de frecuencia más baja cuantificado a cero, ero predeterminado de líneas espectrales vecinas de frecuen ntificado a cero. Así, el relleno de ruido es selectivo por el hec oduce ruido sólo en líneas espectrales que son cuantificadas les están separadas de líneas cuantificadas a un valor no cero, cción espectral hacia arriba como en una dirección espectral ha mplo mediante el primer número predeterminado de líneas espect frecuencia más baja cuantificadas a cero y mediante el seg determinado de líneas espectrales vecinas de frecuenci ntificadas a cero.
En una realización preferida, el primer número predetermi egundo número predeterminado, tal que un mínimo espaciamient frecuencia hacia arriba desde las líneas cuantificadas a un val al a un mínimo espaciamiento en la dirección de frecuencia haci espectro (esto es, para altas frecuencias). También agregar ruid uencias es menos propenso a tener un restitución de sonido final En una realización preferida, el identificador de región e figurado para sumar valores de intensidad cuantificados (por eje energía o valores de amplitud) de regiones espectrales en ectral a los dos lados predeterminada de una dada región espe vecindad espectral que se extiende hacia ambos lados, frecuenci ás altas), para obtener un valor suma, y para evaluar el valor sum a región espectral dada es una región espectral identificada o no. un valor suma de energías de un espectro cuantificado sobre ectral a los dos lados de una dada región espectral es u nificativa para decidir si se debe aplicar relleno de ruido a la reg a.
En otra realización preferida, el identificador de región e figurado para explorar un rango de regiones espectrales de la r ectral de entrada para detectar secuencias contiguas de regione ntificadas a cero, y para reconocer una o más regiones espectr ritmo o circuito relativamente simple. Si se halla que una secue de regiones espectrales está cuantificada a cero, una o ectrales interiores de la secuencia (las cuales está espaciadas su S de regiones espectrales afuera de la presente secuencia ectrales) son tratadas como regiones espectrales identificadas. As ravés de un rango de regiones espectrales (por ejemplo, s siguientemente diferentes secuencias desplazadas de regiones uede hacer un análisis eficiente de la representación espectral, p iones espectrales cuantificadas a cero y separadas de regione ntificadas a un valor no cero por una distancia mínima predetermin Otra realización de acuerdo con el invento crea un C ámetro de relleno de ruido para proveer un parámetro de relleno d ase de una representación espectral cuantificada de una señal ulador de parámetro de relleno de ruido comprende un identifica ectral configurado para identificar regiones espectrales de la re ectral cuantificada espaciadas de regiones espectrales no-resentación espectral cuantificada por al menos una regi ulado en el lado de codificador, tomando en consideración es siguientemente, se obtiene un parámetro de relleno de ruid ticularmente bien adecuado para el concepto de decodificador d bién se ha hallado que regiones espectrales, las cuales están cu o, pero Jas cuales están muy cerca de las regiones espectrales cu valor no cero, con frecuencia no reflejan un contenid daderamente de tipo ruido, sino más bien están fuertemente co una región espectral tonal adyacente (cuantificada a un val siguientemente, se ha hallado que generalmente no es deseable r de cuantificación de regiones espectrales, las cuales están cerc ectrales cuantificadas a un valor no cero para un cálculo de un eño de ruido, porque esto típicamente daría por resultado una f imación del ruido, resultando de ese modo en una representac onstruida demasiado ruidosa.
Así, el concepto de cálculo de parámetro de relleno de ruid resente se puede usar eri combinación con el concepto de reli crito arriba e incluso en combinación con conceptos de relle o. Se ha hallado que la consideración de un error de cuantificac un error de cuantificación estimado o un error de cuantificaci amente conlleva mejores resultados, porque el error de cuant amente se desvía del error de cuantificación estadísticamente es En otra realización preferida, el calculador de valor d figurado para enfatizar una energía de error de cuantificac ribuida sobre una pluralidad de regiones espectrales identificadas energía de error de cuantificación tonal concentrada en una ectral. Este concepto se basa en el hallazgo de que un ruido de tonal, una energía promedio de lo cual yace debajo de u ntificación y que por lo tanto es cuantificada a cero, es perceptual s relevante para el filtro de ruido que un único componente de au nsidad de lo cual yace por debajo del umbral de cuantificación, o de banda ancha no-tonal cuantificado a cero y el comp ntificado a cero fueran ambos cuantificados a cero. La razón es q o generando un ruido aleatorio en el decodificador puede mod da ancha no-tonal faltante en la representación espectral cuantifi r ejemplo, i-1 , i, i+1 ). Una región espectral puede comprende, por iás líneas espectrales.
En una realización preferida, el calculador de valor d figurado para calcular una suma de energías de error de aritmizadas de las regiones espectrales identificadas para obtener relleno de ruido. Calculando la suma de energías de error de aritmizadas de las regiones espectrales identificadas, el énfasis reí ba de regiones espectrales no-tonales 'cuantificadas a cero s ales cuantificadas a cero, puede obtenerse de una manera eficient Otra realización de acuerdo con el invento crea una repr al de audio codificada, para representar una señal de audio. La r señal de audio codificada comprende una representación de dom ntificada codificada de la señal de audio y un parámetro de reli ificado. El parámetro de relleno de ruido representa un error de las regiones espectrales de la representación de domi ntificadas a cero y espaciadas de regiones espectrales de la repr inio espectral cuantificadas a un valor no cero por al meno consideradas selectivamente para un relleno de ruido en odificador.
Otra realización de acuerdo con el invento crea un método representación rellenada con ruido de una señal de audio.
Otra realización adicional de acuerdo con el invento cre a proveer un parámetro de relleno de ruido sobre la b resentación espectral cuantificada de una señal de audio.
Otra realización adicional de acuerdo con el invento crea computadora para implementar los métodos mencionados arriba. ve Descripción de los Dibujos Subsiguientemente se describirán realizaciones de ac ento, tomando como referencia las figuras adjuntas, en las cuales: la Figura 1 muestra un diagrama de bloques esque lenador de ruido, de acuerdo con una realización del invento; la Figura 2 muestra un diagrama de bloques esque codificador de señal de audio que comprende el rellenador de ruid la Figura 5. muestra un diagrama de bloques esque ulador de parámetro de relleno de ruido de de acuerdo con una r nto; la Figura 6 muestra un seudo código de programa para i cionalidad de calculador de parámetro de relleno de ruido de ac ura 5; la Figura 7 muestra un diagrama de flujo de un método representación espectral rellenada con ruido de una señal de a e de una representación espectral de entrada de la señal de audio la Figura 8 muestra un diagrama de flujo de un método pa ámetro de relleno de ruido sobre la base de una representac ntificada de una señal de audio; y la Figura 9 muestra una representación gráfica de una r señal de audio, de de acuerdo con una realización del invento. llenador de Ruido de acuerdo con las Figuras 1-4 La Figura 1 muestra un diagrama de bloques esque El rellenador de ruido 100 comprende un identificado ectral 120, el cual está configurado para identificar regiones esp resentac¡ón espectral de entrada 110 espaciadas de regiones es s de la representación espectral de entrada 110 por al meno ectral intermedia, para obtener una información 122 que indica ectrales identificadas. El rellenador de ruido 100 también co rtador de ruido 130, el cual está configurado para introducir se o dentro de las regiones espectrales identificadas (descritas rmación 122), para obtener la representación espectral rellenada la señal de audio.
Con relación a la funcionalidad del rellenador de ruido 10 puede decir que el rellenador de ruido 100 rellena selectivame ectrales (por ejemplo, líneas espectrales o bandejas esp resentación espectral de entrada 110 con ruido, por ejemplo r res espectrales de líneas espectrales cuantificadas a cero ectrales de reemplazo que describen un ruido. De esta maner ñar agujeros espectrales o vacíos espectrales dentro de la re jeros espectrales o vacíos espectrales, sino que mantiene u ectral de por lo menos una región espectral (o de por lo menos c ero predeterminado de regiones espectrales) entre aquellas línea as cuales se introduce un ruido y líneas espectrales cuantificadas . Así, se mantiene una distancia espectral entre relleno dé ruido tro de la representación espectral, y líneas espectrales cuantificad cero, tal que las líneas espectrales psicoacústicamente relevante son cuantificadas a cero en la representación espectral de entrad audio) pueden ser claramente distinguidas (debido a la distancia ero predeterminado de una o más regiones espectrales) del reli ducido dentro del espectro por el rellenador de ruido. Consiguie de percibir claramente el . contenido de audio psicoacústic vante (representado por valores de línea espectral no resentación espectral de entrada 110), mientras se evitan gran ectrales. Esto se debe al hecho de que el relleno de ruido ctivamente en la cercanía de líneas espectrales de la representa entrada cuantificadas a un valor no cero, mientras que se ejecu ficientes espectrales de la señal de audio codificada. El dec ficiente espectral 210 puede comprender, por ejemplo, un dec ropía (por ejemplo, decodificador aritmético o un decodificador d uidilla) y, opcionalmente, un cuantificador inverso para e resentación decodificada 214 de los coeficientes espectrales (po orma de coeficientes inversamente cuantificados) a partir de la r señal de audio codificada 212. El rellenador de ruido 100 está con ibir la representación decodificada 214 de coeficientes espectral ionalmente inversamente cuantificada) como la representación rada 110 de la señal de audio.
El decodificador de señal de audio 200 también comprend factor de ruido 220, el cual está configurado para extraer una in tor de ruido 222 de la representación de señal de audio codificad veer la información de factor de ruido 222 al rellenador de odificador de señal de audio 200 también comprende un correcto , el cual está configurado para recibir una representación onstruida 232 desde el rellenador de ruido 100. La representació , y para proveer sobre la base de eso, una representación de s el dominio del tiempo 242 El conversor de dominio espectral a po 240 puede ser configurado, por ejemplo, para realizar una tr eno discreta modificada inversa (IMDCT).
En una, realización preferida, el relleno de ruido en odificador comprende los siguientes pasos (o sigue los siguientes 1. decodificar el piso de ruido; 2. decodificar los valores cuantificados de las líneas de 3. detectadlas regiones espectrales en la parte sele espectro donde una longitud de seguidilla de ceros un tamaño mínimo de longitud de seguidilla; y 4. aplicar un signo generado aleatoriamente al pi decodificado para cada una de las líneas dentro de seleccionadas.
El piso de ruido se decodifica como sigue: nf_decoded = 0.0625*(8-index) Las regiones espectrales detectadas son seleccionadas, En lo que sigue se describirán algunos detalles to rencia las Figuras 1 , 2, 3 y 4 en donde la Figura 3 muestra un seu grama de un algoritmo para relleno de ruido en él lado del decodifi de ser realizado mediante el rellenador de ruido 100, y en dond estra una representación gráfica del rellenado con ruido.
Para empezar la decodificación del piso de ruido puede diante el extractor de factor de ruido 220, el cual recibe, por ejem factor de ruido (al que también se designa sintéticamente como "i veer sobre la base de eso, el valor de factor de ruido decodificado ignado con ""nfjdecoded"). El índice de factor de ruido puede s ejemplo, usando tres o cuatros bits, y puede ser por ejemplo, u el rango entre 0 y 7, o un valor entero en un rango entre 0 y 15.
Los valores cuantificados de las líneas de frecuen ignados como "líneas espectrales" o "bandejas espectrales") vistos por el decodificador de coeficiente espectral 210. Consiguie ienen valores de línea espectral (a los que también se d eficientes espectrales) cuantificados (u opcionalmente, i ectrales así es realizada por una primera porción 310 del algorit ura 3. Como se puede ver de la primera porción 310 del algori junto R de regiones detectadas es inicializada para ser un conjunt io del algoritmo (R= {};).
En el ejemplo del algoritmo de la Figura 3, se fija una uidilla mínima en un valor fijo de 8, pero naturalmente se lquier otro valor.
Subsiguientemente, se determina para una pluralida ectrales bajo consideración (designadas por variable en curs a").si cada uno de esas líneas espectrales bajo consideración c orno a ambos lados de líneas espectrales cuantificada a cero ectral bajo consideración está en sí misma cuantificada a cero), as las líneas en la segunda mitad del espectro pueden ser esivamente como líneas bajo consideración, en donde una lín ualmente bajo consideración es designada por "índice de línea". P consideración designada por "índice de línea", se computa u ficientes espectrales cuantificados "quantized(x(i))" en un entorno siguientemente, si el índice de frecuencia de línea espectral ectral es agregado al conjunto R, esto significa que las líneas es en índices de línea entre "line índex - MinimalRunLength)/2" y imalRunLength)/2", todos comprenden valores de línea espectral ro..
Consiguientemente, en la primera porción 310 del seud grama 310, se obtiene un conjunto R de índices de frecuen ectral "índice de línea", el cual enumera aquellas (y sólo aqu ectrales de la porción espectral bajo consideración que están "sufi aciadas (esto es, por al menos MinimalRunLength/2 líneas) de c ectral cuantificada a un valor no cero.
La detección de una región así está ilustrada en la Figu estra una representación gráfica 400 de un espectro. Una abscisa frecuencia de líneas espectrales en términos de un índice de f a espectral "índice de línea". Una ordenada 412 describe una in mplo, amplitud o energía) de las líneas espectrales. Como se ción del espectro ilustrada en la representación gráfica 400 comp o). Sin embargo, cuando se considera la línea espectral 422á, se a espectral 422a es inmediatamente adyacente a la línea espe l no está cuantificada a cero, tal que el índice de frecuencia de lí la línea espectral 422a no será parte del conjunto R computado de rimera parte 310 del algoritmo 300. De manera similar, se ha as espectrales 422b, 422c y 422d no están espaciadas suficient toda línea espectral cuantificada a un valor no cero , tal que lo uencia de línea espectral de las líneas espectrales 422b a 422d ta te del conjunto R. En contraste, se reconocerá que la línea espect aciada suficientemente lejos de toda línea espectral cuantificada o, porque la línea espectral 422e es una línea central (o, más g línea central), de una secuencia de 9 líneas espectrales co ntificadas a cero. Consiguientemente, un índice de frecuen ectral de la línea espectral 422e será parte del conjunto R com era porción 310 del algoritmo 300. Lo mismo vale para las línea f y 422g, tal que los índices de frecuencia de línea espectral ectrales 422f y 422g serán parte del conjunto R determinado Consiguientemente, el conjunto R no comprenderá uencia de línea espectral de las líneas espectrales 420a, 420b, que dichas líneas espectrales están cuántificadas a un valor no c índices de frecuencia de línea espectral de las líneas espectrale c, 422d, 422h, 422i, 422j y 422k no serán parte del conjunto R p as espectrales están ubicadas demasiado cerca al lado d ectrales 420at 420b, 420c y 420d. En contraste, los índices de f a espectral de las líneas espectrales 422e, 422f, 422g estarán in junto R, porque dichas líneas espectrales están en sí mismas c o y están espaciadas suficientemente lejos de cualquier lín acente no nula.
El algoritmo 300 también comprende una segunda po odificar el piso de ruido, en donde un índice de valor de ruido ( ción 320 de código de programa ) es convertido en un valor de odificado ("nf_decoded" en el programa 300).
El código de programa 300 también comprende una tercer rellenar las líneas espectrales identificadas, esto es líneas éspec atorio puede tomar, por ejemplo, aleatoriamente o seudo aleat eros -? y +1. Sin embargo, naturalmente es posible diferente pr o aleatorio o seudo aleatorio.
El relleno de ruido también se ilustra en la Figura 4. Como la Figgra 4, los valores espectrales cero de las líneas espectrales g son reemplazados por valores de relleno de ruido (ilustrados os en la Figura 4). lculador de parámetro de relleno de ruido de acuerdo con las Figur La Figura 5 muestra un diagrama de bloques esque ulador de parámetro de relleno de ruido 500. El calculador de eño de ruido está configurado para obtener una representaci ntificada 510 de una señal de audio y para proveer, sobre la ba ámetro de relleno de ruido 512. El calculador de parámetro de rel comprende un identificador de región espectral 520, el cual est a recibir la representación espectral cuantificada 510 de la señ a identificar regiones espectrales (por ejemplo, líneas espec ctivamente errores de cuantificacion de las regiones espectrales crito mediante la información 522, para un cálculo del parámetro o 512.
La información de error de cuantificacion 532 puede por ntica a una información de energía (o información de intensidad) rgías (o intensidades) de aquellas líneas espectrales que están c o en la representación espectral cuantificada 510.
El calculador de parámetro de relleno de ruido 500 pued ionalmente un cuantificador 540, el cual está configurado par resentacion espectral no cuantificada 542 de una señal de audio y epresentación espectral cuantificada 510 de la señal de audio! El puede tener una resolución de cuantificacion ajustable, la cual p mplo, individualmente ajustable por línea espectral, o por banda mplo, en dependencia de una relevancia psicoacústica d ectrales o bandas espectrales, obtenido usando un modelo psico cionalidad del cuantificador de resolución variable puede se cionalidad descrita en las Normas Internaciones ISO/IEC 13818 En lo que sigue s describirá en detalle la funcion putación de parámetro de relleno de ruido, la cual puede ser re ulador de parámetro de relleno de ruido 500. En la computación relleno de ruido en el lado del codificador, el relleno de ruido prefe icado en el dominio de la cuantificacion. De esta manera, el ruido i regido luego mediante el filtro inverso relevante psicoacústico. L o introducido por el decodificador es calculada en codificada e ificador siguiendo los siguientes pasos: 1. Tomar los valores cuantificados de las líneas de frec 2. Seleccionar sólo una parte de los espectros; 3. Detectar las regiones espectrales en la parte selecci espectros donde una longitud de seguidilla de cero que un tamaño mínimo de longitud de seguidilla; 4. Calcular la media geométrica del error de cuantifica regiones previamente detectadas; y 5. Cuantificar uniformemente la media geométrica con Con relación al primer paso, los valores cuantificados de para las frecuencias inferiores). En realidad, usualmente las alta rte superior del espectro) son perceptualmente menos importa s frecuencias, y los valores cuantificados a cero aparecen mayo unda mitad de los espectros. Asimismo, agregar el ruido uencias es menos propenso a obtener una resolución de sonido fi Con respecto al tercer paso, restringiendo el relleno de ru iones espectrales donde ocurre una longitud de seguidilla ntificados a cero, se evita que el relleno de ruido afecte dem res no anulados. De esta manera, el relleno de ruido no se indad de valores no anulados, y la tonalidad original de estas lín preserva mejor. El tamaño mínimo de longitud de seguidilla se fija lización preferida. Esto significa que ías 8 líneas que rodean a lado no son afectadas por el relleno de ruido (y consecuenter sideradas para el cálculo de un valor de ruido).
Con respecto al cuarto paso, el error de cuantificación e ntificado está en el rango [-0,5; 0,5], y se supone que está u ribuido. La energía de errores de cuantificación de las regiones d cálculo así permite tomar en cuenta la chatura espectral original d lados, y luego obtener información acerca de sus caract lidad/ruidosidad.
Si los valores anulados son muy tonales, el piso de ruido el aparato 500) irá hacia cero, y se agregará un bajo piso odificador (por ejemplo, el decodificador 100, 200 descrito a res anulados son realmente ruidosos, el piso de ruido será alto, y o puede verse como una codificación altamente paramétric ectrales anuladas, tipo PNS (Substitución de Ruido Perceptual) rencia [4]).
Con respecto al quinto paso, el índice de cuantificación de ruido, entonces se calcula como sigue: index=max(0,min(7, int(8— 16*nf))) El índice es transmitido, por ejemplo, en 3 bits. s En lo que sigue se describirá el algoritmo para computar en sí mismas son cuantificadas a cero y las cuales además está icientemente lejos de cualquier otra línea espectral cuantificada o.
La primera porción 610 del programa 600 puede ser i era porción 310 del programa 300. Consiguientemente, la re ectral cuantificada ("quantized (x(i))") usada en el algoritmo 600 p mplo, idéntica a la representación espectral cuantificada ("qu da en el algoritmo 300 en el lado del decodificador. En otras resentación espectral cuantificada usada en el lado del codificad smitida, en una forma codificada, al decodificador en un smisión que comprende un codificador y un decodificador.
El algoritmo 600 comprende una segunda porción 620 d de ruido. En la computación del piso de ruido, sólo se consid iones espectrales (o líneas espectrales) descritas por el conj era porción 610 del algoritmo 600. Como se puede ver, el valor o nf es primero inicializado a cero. El número de líneas siderada (n) es inicializado primero a cero. Subsiguientemente, la energía de las líneas espectrales identificadas antes de la cuant iable n describe el número de líneas espectrales identificadas.
El algoritmo 600 también comprende una tercera por ntificación del valor nf, esto es, la suma logarítmica de las línea ntificadas. Se puede usar una ecuación de mapeo como se des o se muestra en la Figura 6. todo de acuerdo con la Figura 7 4 La Figura 7 muestra un diagrama de flujo de un método representación espectral rellenada con ruido de una señal de a e de una representación espectral de entrada de la séñal de aud de la Figura 7 comprende un paso 710 de identificar regiones e representación espectral de entrada de una señal de audio espa iones espectrales de valores no ceros de la representación rada por al menos una región espectral intermedia, para obtene ectrales identificadas. El método 700 también comprende un oducir selectivamente ruido dentro de las regiones identificadas, ntificada de una señal de audio. El método 800 comprende un ntificar las regiones espectrales de la representación espectral cu señal de audio espaciadas de las regiones espectrales de valore representación espectral cuantificada por al menos una regi rmedia, para obtener las regiones espectrales identificadas. El ibién comprende un paso 820 de considerar selectivamente lo ntificación de las regiones identificadas para el cálculo de los p eño.
El método 800 puede ser suplementado por cualquiera d intivos y funcionalidades descritos en la presente con respecto al ámetro de relleno de ruido. presentación de señal de audio de acuerdo con la Figura 9 La Figura 9 muestra una representación gráfica de una r señal de audio de acuerdo con una realización del invento. La r señal de audio 900 puede formar la base, por ejemplo, para la r ectral de entrada 110. La representación de señal de audio 900 ta ificada 900 comprende una representación de dominio espectral ificada de la señal de audio y también un parámetro de rell ificado. El parámetro de relleno de ruido representa un error de regiones espectrales de la representación de dominio espectral cu o y espaciadas de regiones espectrales de la representación ectral cuantificadas a valores no ceros, por al menos una regi rmedia.
Naturalmente, la representación de señal de audio 90 lementada por cualquier información descrita arriba. rnativas de Implementación Dependiendo de ciertos requerimientos de im lizaciones del invento pueden ser implementadas en hardware o implementación puede ser realizada usando un medio de alm ital, por ejemplo un disco flexible, un DVD, un CD, una memoria de PROM, una EEPROM o una memoria FLASH, teniendo señal ibles electrónicamente almacenadas en las mismas, las cuales co do código de programa operativo para ejecutar uno de los métod ducto de programa de computadora corre en una computadora. grama puede ser almacenado, por ejemplo, sobre un portador le quina.
Otras realizaciones comprenden el programa de comp utar uno de los métodos descritos en la presente, almacenado e ible por una máquina.
En otras palabras, una realización del método inventivo es, programa de computadora que un código de programa para ejecut dos descritos en la presente, cuando el programa de computa computadora.
Una realización adicional de los métodos inventivos es, po tador de datos (o un medio de almacenamiento dígita) que c grama de computadora para ejecutar uno de los métodos de sente.
Una realización adicional del método inventivo es, por l smisión de datos o una secuencia de señales que representan el Una realización adicional comprende una computador alado en ella el programa de computadora para ejecutar uno de critos en la presente.
En algunas realizaciones se puede usar un dispositi gramable (por ejemplo un arreglo de compuesta programable de lizar algunas o todas las funcionalidades de los métodos de sente. En algunas realizaciones, el arreglo de compuerta pro po puede cooperar con un microprocesador para realizar uno de critos en la presente. nclusión Sintetizando lo de arriba, el presente invento mejora la h ificación de audio "relleno de ruido" considerando la señal de acterísticas de señal decodificada tanto cuando se computan p eño de ruido en el lado del codificador, como cuando se aplica el decodificador. En una realización del invento, se estima la tonalid las líneas espectrales cuantificadas a cero y se usa para la estim ucida a partir de una etapa de análisis de LPC (Codificación d al) previa ponderando los coeficientes de LPC, como se hace en AMR-WB+ (ver referencia [1]) A partir de los coeficientes po ña un filtro de ponderación perceptual y se aplica antes de la M rso también es aplicado en el lado del decodificador después rsa. Este filtro de ponderación perceptual inversa corrige IO ntificación de una manera que minimiza o enmascara el ruido perc En realizaciones de acuerdo con el invento se superan la la técnica previa. El relleno de ruido se aplica convencional! ñera sistemática sobre los valores cuantificados a cero consider bral basado en la envolvente espectral, un umbral de enmascara bral de energía. La técnica previa no considera ni las característic entrada ni las características de la señal decodificada. Así, vencional puede introducir artefactos adicionales indeseables, e factos de ruido, y cancela las ventajas de una herramienta así. [3] "CODIFICACIÓN DE AUDIO" ("AUDIO CODIN rnacional No.: PCT/IB2002/001388, Solicitante: KONINKLIJ ECTRONICS N.V. [NL/NL]; Groenewoudseweg 1 NL-5621 BA Ein entores: TAORI, Rakesh; Prof Holstlaan 6 NL-5656 AA Eindhove PAR, Steven. L, J., D., E.; Prof. Holstlaan 6 NL-5656 AA Eindhov [4] Codificación Genérica de Dibujos Animados y Au dificación de Audio Avanzado. (Generic Coding of Moving ociated Audio: Advanced Audio Coding) International Stand /IECJTC1/SC29/WG11 Moving Pictures Expert Group, 1997

Claims (1)

  1. REIVINDICACIONES 1. Un rellenador de ruido (100) para proveer una r ectral rellenada con ruido (112) de una señal dé audio sobre la resentación espectral de entrada (110) de la señal de audio, el o que comprende: un identificador de región espectral (120) configurado p iones espectrales (422e, 422f, 422g) de la representación espectr 0) espaciadas de regiones espectrales no nulas (420a, 420b, 420 resentación espectral de entrada (110) por al menos una reg rmedia (422a, 422b, 422c, 422d, 422h, 422i, 422j, 422k), iones espectrales identificadas (422e, 422f, 422g); y un insertador de ruido (130) configurado para introducir s o dentro de las regiones espectrales identificadas (422e, 422 ener la representación espectral rellenada con ruido (112) de la se 2. El rellenador de ruido (100) de acuerdo con la reivind de el identificador de región espectral (120) está configurado p 4 - 36 - en donde el primer número predeterminado (4) es mayor o donde el segundo número predeterminado (4) es mayor o igual q en donde el insertador de ruido (130) está configurado p ctivamente ruido dentro de las líneas espectrales identificadas g) mientras que deja sin afectar por el relleno con ruido, las línea a, 420b, 420c, 420d) cuantificadas a un valor no cero y las línea a, 422b, 422c, 422d, 422h, 422i, 422j, 422k) cuantificadas a cero, en el primer número predeterminado (4) de líneas espectrales * uencia inferior cuantificadas a cero, o el segundo número predet líneas espectrales (4) de líneas espectrales vecinas de frecuen ntificadas a cero. 3. El relienador de ruido (100) de acuerdo con la reivindi de el primer número predeterminado (4) es igual al segu determinado (4). 4. El relienador de ruido (100) de acuerdo con indicaciones 1 a 3, en donde el relienador de ruido está confi ducir ruido sólo dentro de regiones espectrales en una porción s r suma (E) para decidir si la región espectral dada (i) es una reg ntificada o no. 6. El rellenador de ruido (100) > de acuerdo con indicaciones 1 a 5, en donde el identificador de región espectr figurado para explorar un rango de regiones espectrales de la r ectral de entrada ( 0) para detectar secuencias contiguas (422a j; 422c a 422k) de regiones espectrales cuantificadas a cero, y p o más regiones espectrales centrales (422e, 422f, 422g) de la tiguas detectadas como regiones espectrales identificadas. 7. Un calculador de parámetro de relleno de ruido (500) pa ámetro de relleno de ruido (512) sobre la base de una representa ntificada (510) de una señal de audio, el calculador de parámetro o que comprende: un identificador de región espectral (520) configurado p iones espectrales 422e, 422f, 422g) de la representación espectra 0) espaciadas de las regiones espectrales no nulas (420a, 420b la representación espectral cuantificada (510) por al meno en donde el idéntificador de región espectral (520) está identificar líneas espectrales (422e, 422f, 422g) de la re ectral de entrada (510), las cuales están cuantificadas a cero prenden por lo menos un primer número predeterminado ( ectrales vecinas de frecuencia inferior (422a, 422b, 422c, 422d; d, 422e, 422c, 422d, 422e, 422f) cuantificadas a cero y por l undo número predeterminado (4) de líneas espectrales vecinas d alta (422f, 422g, 422h, 422i; 422g, 422h, 422i, 422j; 422h, 422i ntificadas a cero, como regiones espectrales identificadas; en donde el primer número predeterminado (4) es mayor o donde el segundo número predeterminado (4) es mayor o igual q en donde el idéntificador de región espectral (520) está a considerar selectivamente errores de cuantificación de l ectrales identificadas (i) para un cálculo del parámetro de reli ntras que deja las líneas espectrales (420a, 420b, 420c, 420d) CU valor no cero y la línea espectral (422a, 422b, 422c, 422d, 422 k) cuantificadas a cero, pero que no tienen el primer número pr ntificación de las regiones espectrales identificadas (i) para e ámetro de relleno de ruido (512, nf, nf_index). 10. El calculador de parámetro de relleno de ruido (500) de de las reivindicaciones 7 a 9, en donde el calculador de valor d á configurado para enfatizar una energía de error de cuantifica ergía (x(i)))) distribuida sobre una pluralidad de regiones ntificadas en relación a una energía de error de cuantifi centrada en una sola región espectral o en una pluralida ectrales contiguas. 11. El calculador de parámetro de relleno de ruido (500) de de las reivindicaciones 7 a 10, en donde el calculador de valor d á configurado para calcular una suma de energías de error de aritmizadas (Iog10(energy(x(i)))) de regiones espectrales identific ener el parámetro de relleno de ruido (512, nf, nfjndex). 12. Una representación de señal de audio codifica resenta una señal de audio, la representación de señal de audio c prende: 13. Un método (700) para proveer una representad ñada con rudo de una señal de audio sobre la base de una re ectral de entrada de la señal de audio, el método que comprende: identificar (710) regiones espectrales de la representación rada espaciadas de regiones espectrales no nulas de la re ectral de entrada por al menos una región espectral intermedia, iones espectrales identificadas; e introducir selectivamente (720) ruido dentro de las regione tificadas para obtener la representación espectral rellenada co al de audio. 14. Un método (800) para proveer un parámetro de reli re la base de una representación espectral cuantificada de una se étodo que comprende: Identificar (810) regiones espectrales de representaci ntificada espaciadas de regiones espectrales no nulas de re ectral cuantificada por al menos una región espectral intermedia iones espectrales identificadas; y
MX2011000359A 2008-07-11 2009-06-26 Rellenador de ruido, calculador de parametro de relleno de ruido, representacion de señal de audio codificada, metodos y programa de computadora. MX2011000359A (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US7987208P 2008-07-11 2008-07-11
US10382008P 2008-10-08 2008-10-08
PCT/EP2009/004653 WO2010003565A1 (en) 2008-07-11 2009-06-26 Noise filler, noise filling parameter calculator, method for providing a noise filling parameter, method for providing a noise-filled spectral representation of an audio signal, corresponding computer program and encoded audio signal

Publications (1)

Publication Number Publication Date
MX2011000359A true MX2011000359A (es) 2011-02-25

Family

ID=40941986

Family Applications (2)

Application Number Title Priority Date Filing Date
MX2011000382A MX2011000382A (es) 2008-07-11 2009-06-25 Codificador de audio, decodificador de audio, metodos para la codificacion y decodificacion de audio; transmision de audio y programa de computacion.
MX2011000359A MX2011000359A (es) 2008-07-11 2009-06-26 Rellenador de ruido, calculador de parametro de relleno de ruido, representacion de señal de audio codificada, metodos y programa de computadora.

Family Applications Before (1)

Application Number Title Priority Date Filing Date
MX2011000382A MX2011000382A (es) 2008-07-11 2009-06-25 Codificador de audio, decodificador de audio, metodos para la codificacion y decodificacion de audio; transmision de audio y programa de computacion.

Country Status (22)

Country Link
US (9) US9043203B2 (es)
EP (4) EP4235660A3 (es)
JP (2) JP5622726B2 (es)
KR (4) KR101518532B1 (es)
CN (2) CN102089808B (es)
AR (2) AR072482A1 (es)
AT (1) ATE535903T1 (es)
AU (2) AU2009267459B2 (es)
BR (6) BRPI0910811B1 (es)
CA (2) CA2730361C (es)
CO (2) CO6341671A2 (es)
EG (1) EG26480A (es)
ES (5) ES2422412T3 (es)
HK (2) HK1157045A1 (es)
MX (2) MX2011000382A (es)
MY (2) MY178597A (es)
PL (3) PL2304719T3 (es)
PT (1) PT2304719T (es)
RU (2) RU2519069C2 (es)
TW (2) TWI417871B (es)
WO (2) WO2010003556A1 (es)
ZA (2) ZA201100085B (es)

Families Citing this family (83)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101518532B1 (ko) 2008-07-11 2015-05-07 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 오디오 인코더, 오디오 디코더, 오디오 신호, 오디오 스트림을 부호화 및 복호화하는 장치 및 컴퓨터 프로그램
EP2182513B1 (en) * 2008-11-04 2013-03-20 Lg Electronics Inc. An apparatus for processing an audio signal and method thereof
US8553897B2 (en) * 2009-06-09 2013-10-08 Dean Robert Gary Anderson Method and apparatus for directional acoustic fitting of hearing aids
US8879745B2 (en) * 2009-07-23 2014-11-04 Dean Robert Gary Anderson As Trustee Of The D/L Anderson Family Trust Method of deriving individualized gain compensation curves for hearing aid fitting
US9101299B2 (en) * 2009-07-23 2015-08-11 Dean Robert Gary Anderson As Trustee Of The D/L Anderson Family Trust Hearing aids configured for directional acoustic fitting
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
US9117458B2 (en) * 2009-11-12 2015-08-25 Lg Electronics Inc. Apparatus for processing an audio signal and method thereof
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
US20120029926A1 (en) 2010-07-30 2012-02-02 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for dependent-mode coding of audio signals
JP6075743B2 (ja) * 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
US9208792B2 (en) * 2010-08-17 2015-12-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for noise injection
WO2012037515A1 (en) 2010-09-17 2012-03-22 Xiph. Org. Methods and systems for adaptive time-frequency resolution in digital data coding
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
US20130173275A1 (en) * 2010-10-18 2013-07-04 Panasonic Corporation Audio encoding device and audio decoding device
US8838442B2 (en) 2011-03-07 2014-09-16 Xiph.org Foundation Method and system for two-step spreading for tonal artifact avoidance in audio coding
WO2012122297A1 (en) * 2011-03-07 2012-09-13 Xiph. Org. Methods and systems for avoiding partial collapse in multi-block audio coding
WO2012122299A1 (en) 2011-03-07 2012-09-13 Xiph. Org. Bit allocation and partitioning in gain-shape vector quantization for audio coding
EP2686848A1 (en) 2011-03-18 2014-01-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Frame element positioning in frames of a bitstream representing audio content
US9530419B2 (en) * 2011-05-04 2016-12-27 Nokia Technologies Oy Encoding of stereophonic signals
MX350162B (es) 2011-06-30 2017-08-29 Samsung Electronics Co Ltd Aparato y método para generar señal extendida de ancho de banda.
RU2616534C2 (ru) * 2011-10-24 2017-04-17 Конинклейке Филипс Н.В. Ослабление шума при передаче аудиосигналов
US8942397B2 (en) 2011-11-16 2015-01-27 Dean Robert Gary Anderson Method and apparatus for adding audible noise with time varying volume to audio devices
JP5942463B2 (ja) * 2012-02-17 2016-06-29 株式会社ソシオネクスト オーディオ信号符号化装置およびオーディオ信号符号化方法
US20130282373A1 (en) * 2012-04-23 2013-10-24 Qualcomm Incorporated Systems and methods for audio signal processing
CN103778918B (zh) * 2012-10-26 2016-09-07 华为技术有限公司 音频信号的比特分配的方法和装置
CN103854653B (zh) * 2012-12-06 2016-12-28 华为技术有限公司 信号解码的方法和设备
CN105122357B (zh) 2013-01-29 2019-04-23 弗劳恩霍夫应用研究促进协会 频域中基于lpc进行编码的低频增强
AU2014211544B2 (en) * 2013-01-29 2017-03-30 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Noise filling in perceptual transform audio coding
MX346732B (es) 2013-01-29 2017-03-30 Fraunhofer Ges Forschung Cuantificación de señales de audio adaptables por tonalidad de baja complejidad.
KR20220140002A (ko) 2013-04-05 2022-10-17 돌비 레버러토리즈 라이쎈싱 코오포레이션 향상된 스펙트럼 확장을 사용하여 양자화 잡음을 감소시키기 위한 압신 장치 및 방법
BR112015025009B1 (pt) * 2013-04-05 2021-12-21 Dolby International Ab Unidades de quantização e quantização inversa, codificador e decodificador, métodos para quantizar e dequantizar
EP2992605B1 (en) * 2013-04-29 2017-06-07 Dolby Laboratories Licensing Corporation Frequency band compression with dynamic thresholds
EP4290510A3 (en) 2013-05-24 2024-02-14 Dolby International AB Audio encoder
KR101757338B1 (ko) 2013-06-21 2017-07-26 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에.베. 오디오 신호의 대체 프레임에 대한 스펙트럼 계수들을 획득하기 위한 방법과 장치, 오디오 디코더, 오디오 수신기 및 오디오 신호들의 전송을 위한 시스템
EP3014609B1 (en) 2013-06-27 2017-09-27 Dolby Laboratories Licensing Corporation Bitstream syntax for spatial voice coding
EP2830060A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Noise filling in multichannel audio coding
EP2830058A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Frequency-domain audio coding supporting transform length switching
EP2830065A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency
WO2015041070A1 (ja) 2013-09-19 2015-03-26 ソニー株式会社 符号化装置および方法、復号化装置および方法、並びにプログラム
JP6186503B2 (ja) 2013-10-03 2017-08-23 ドルビー ラボラトリーズ ライセンシング コーポレイション アップミキサーにおける適応的な拡散性信号生成
CN111580772B (zh) * 2013-10-22 2023-09-26 弗劳恩霍夫应用研究促进协会 用于音频设备的组合动态范围压缩和引导截断防止的构思
KR101854296B1 (ko) 2013-10-31 2018-05-03 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 시간 도메인 여기 신호를 변형하는 오류 은닉을 사용하여 디코딩된 오디오 정보를 제공하기 위한 오디오 디코더 및 방법
PT3288026T (pt) 2013-10-31 2020-07-20 Fraunhofer Ges Forschung Descodificador áudio e método para fornecer uma informação de áudio descodificada utilizando uma ocultação de erro baseada num sinal de excitação no domínio de tempo
KR102023138B1 (ko) 2013-12-02 2019-09-19 후아웨이 테크놀러지 컴퍼니 리미티드 인코딩 방법 및 장치
KR20230042410A (ko) 2013-12-27 2023-03-28 소니그룹주식회사 복호화 장치 및 방법, 및 프로그램
WO2015136078A1 (en) * 2014-03-14 2015-09-17 Telefonaktiebolaget L M Ericsson (Publ) Audio coding method and apparatus
RU2689181C2 (ru) * 2014-03-31 2019-05-24 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Кодер, декодер, способ кодирования, способ декодирования и программа
US9685166B2 (en) 2014-07-26 2017-06-20 Huawei Technologies Co., Ltd. Classification between time-domain coding and frequency domain coding
EP2980801A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for estimating noise in an audio signal, noise estimator, audio encoder, audio decoder, and system for transmitting audio signals
EP2980792A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating an enhanced signal using independent noise-filling
RU2701060C2 (ru) * 2014-09-30 2019-09-24 Сони Корпорейшн Передающее устройство, способ передачи, приемное устройство и способ приема
US9875756B2 (en) 2014-12-16 2018-01-23 Psyx Research, Inc. System and method for artifact masking
WO2016142002A1 (en) * 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
TWI758146B (zh) 2015-03-13 2022-03-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
US10553228B2 (en) * 2015-04-07 2020-02-04 Dolby International Ab Audio coding with range extension
US9311924B1 (en) 2015-07-20 2016-04-12 Tls Corp. Spectral wells for inserting watermarks in audio signals
US9454343B1 (en) 2015-07-20 2016-09-27 Tls Corp. Creating spectral wells for inserting watermarks in audio signals
US9626977B2 (en) 2015-07-24 2017-04-18 Tls Corp. Inserting watermarks into audio signals that have speech-like properties
US10115404B2 (en) 2015-07-24 2018-10-30 Tls Corp. Redundancy in watermarking audio signals that have speech-like properties
AR106308A1 (es) 2015-10-08 2018-01-03 Dolby Int Ab Codificación en capas para representaciones de sonido o campo de sonido comprimidas
ES2903247T3 (es) 2015-10-08 2022-03-31 Dolby Int Ab Codificación en capas y estructura de datos para representaciones comprimidas de campo sonoro o sonido ambisónico de orden superior
US10142743B2 (en) 2016-01-01 2018-11-27 Dean Robert Gary Anderson Parametrically formulated noise and audio systems, devices, and methods thereof
CA2985019C (en) * 2016-02-17 2022-05-03 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Post-processor, pre-processor, audio encoder, audio decoder and related methods for enhancing transient processing
EP3208800A1 (en) 2016-02-17 2017-08-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for stereo filing in multichannel coding
US10146500B2 (en) 2016-08-31 2018-12-04 Dts, Inc. Transform-based audio codec and method with subband energy smoothing
EP3382704A1 (en) * 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for determining a predetermined characteristic related to a spectral enhancement processing of an audio signal
EP3396670B1 (en) * 2017-04-28 2020-11-25 Nxp B.V. Speech signal processing
JP7214726B2 (ja) * 2017-10-27 2023-01-30 フラウンホッファー-ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ ニューラルネットワークプロセッサを用いた帯域幅が拡張されたオーディオ信号を生成するための装置、方法またはコンピュータプログラム
WO2019091576A1 (en) * 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
US10950251B2 (en) * 2018-03-05 2021-03-16 Dts, Inc. Coding of harmonic signals in transform-based audio codecs
US11694708B2 (en) * 2018-09-23 2023-07-04 Plantronics, Inc. Audio device and method of audio processing with improved talker discrimination
US11264014B1 (en) * 2018-09-23 2022-03-01 Plantronics, Inc. Audio device and method of audio processing with improved talker discrimination
US11503548B2 (en) * 2018-10-08 2022-11-15 Telefonaktiebolaget Lm Ericsson (Publ) Transmission power determination for an antenna array
WO2020164753A1 (en) * 2019-02-13 2020-08-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decoder and decoding method selecting an error concealment mode, and encoder and encoding method
EP3939035A4 (en) * 2019-03-10 2022-11-02 Kardome Technology Ltd. LANGUAGE IMPROVEMENT USING CLUSTERING OF HINTS
WO2020207593A1 (en) * 2019-04-11 2020-10-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder, apparatus for determining a set of values defining characteristics of a filter, methods for providing a decoded audio representation, methods for determining a set of values defining characteristics of a filter and computer program
US11538489B2 (en) 2019-06-24 2022-12-27 Qualcomm Incorporated Correlating scene-based audio data for psychoacoustic audio coding
US11361776B2 (en) 2019-06-24 2022-06-14 Qualcomm Incorporated Coding scaled spatial components
US20200402522A1 (en) * 2019-06-24 2020-12-24 Qualcomm Incorporated Quantizing spatial components based on bit allocations determined for psychoacoustic audio coding
CN112037802B (zh) * 2020-05-08 2022-04-01 珠海市杰理科技股份有限公司 基于语音端点检测的音频编码方法及装置、设备、介质
US11545172B1 (en) * 2021-03-09 2023-01-03 Amazon Technologies, Inc. Sound source localization using reflection classification
CN114900246B (zh) * 2022-05-25 2023-06-13 中国电子科技集团公司第十研究所 噪声基底估计方法、装置、设备及存储介质

Family Cites Families (49)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4703505A (en) * 1983-08-24 1987-10-27 Harris Corporation Speech data encoding scheme
US4956871A (en) * 1988-09-30 1990-09-11 At&T Bell Laboratories Improving sub-band coding of speech at low bit rates by adding residual speech energy signals to sub-bands
JPH0934493A (ja) 1995-07-20 1997-02-07 Graphics Commun Lab:Kk 音響信号符号化装置、音響信号復号装置および音響信号処理装置
US6092041A (en) 1996-08-22 2000-07-18 Motorola, Inc. System and method of encoding and decoding a layered bitstream by re-applying psychoacoustic analysis in the decoder
US5797120A (en) * 1996-09-04 1998-08-18 Advanced Micro Devices, Inc. System and method for generating re-configurable band limited noise using modulation
US5924064A (en) * 1996-10-07 1999-07-13 Picturetel Corporation Variable length coding using a plurality of region bit allocation patterns
US5960389A (en) * 1996-11-15 1999-09-28 Nokia Mobile Phones Limited Methods for generating comfort noise during discontinuous transmission
US6167133A (en) * 1997-04-02 2000-12-26 At&T Corporation Echo detection, tracking, cancellation and noise fill in real time in a communication system
US6240386B1 (en) * 1998-08-24 2001-05-29 Conexant Systems, Inc. Speech codec employing noise classification for noise compensation
RU2237296C2 (ru) * 1998-11-23 2004-09-27 Телефонактиеболагет Лм Эрикссон (Пабл) Кодирование речи с функцией изменения комфортного шума для повышения точности воспроизведения
US7124079B1 (en) * 1998-11-23 2006-10-17 Telefonaktiebolaget Lm Ericsson (Publ) Speech coding with comfort noise variability feature for increased fidelity
JP3804902B2 (ja) 1999-09-27 2006-08-02 パイオニア株式会社 量子化誤差補正方法及び装置並びにオーディオ情報復号方法及び装置
FI116643B (fi) * 1999-11-15 2006-01-13 Nokia Corp Kohinan vaimennus
SE0004187D0 (sv) * 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
WO2002071395A2 (en) * 2001-03-02 2002-09-12 Matsushita Electric Industrial Co., Ltd. Apparatus for coding scaling factors in an audio coder
US6876968B2 (en) * 2001-03-08 2005-04-05 Matsushita Electric Industrial Co., Ltd. Run time synthesizer adaptation to improve intelligibility of synthesized speech
ATE320651T1 (de) * 2001-05-08 2006-04-15 Koninkl Philips Electronics Nv Kodieren eines audiosignals
JP4506039B2 (ja) 2001-06-15 2010-07-21 ソニー株式会社 符号化装置及び方法、復号装置及び方法、並びに符号化プログラム及び復号プログラム
US7447631B2 (en) * 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
KR100462611B1 (ko) * 2002-06-27 2004-12-20 삼성전자주식회사 하모닉 성분을 이용한 오디오 코딩방법 및 장치
JP4218271B2 (ja) * 2002-07-19 2009-02-04 ソニー株式会社 データ処理装置およびデータ処理方法、並びにプログラムおよび記録媒体
DE10236694A1 (de) 2002-08-09 2004-02-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren
KR100477699B1 (ko) * 2003-01-15 2005-03-18 삼성전자주식회사 양자화 잡음 분포 조절 방법 및 장치
WO2005004113A1 (ja) * 2003-06-30 2005-01-13 Fujitsu Limited オーディオ符号化装置
US8446947B2 (en) * 2003-10-10 2013-05-21 Agency For Science, Technology And Research Method for encoding a digital signal into a scalable bitstream; method for decoding a scalable bitstream
US7723474B2 (en) 2003-10-21 2010-05-25 The Regents Of The University Of California Molecules that selectively home to vasculature of pre-malignant dysplastic lesions or malignancies
US7436786B2 (en) * 2003-12-09 2008-10-14 International Business Machines Corporation Telecommunications system for minimizing the effect of white noise data packets for the generation of required white noise on transmission channel utilization
JP2005202248A (ja) * 2004-01-16 2005-07-28 Fujitsu Ltd オーディオ符号化装置およびオーディオ符号化装置のフレーム領域割り当て回路
DE102004007200B3 (de) * 2004-02-13 2005-08-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audiocodierung
CA2457988A1 (en) * 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
CN1906664A (zh) * 2004-02-25 2007-01-31 松下电器产业株式会社 音频编码器和音频解码器
ATE371926T1 (de) * 2004-05-17 2007-09-15 Nokia Corp Audiocodierung mit verschiedenen codierungsmodellen
US7649988B2 (en) * 2004-06-15 2010-01-19 Acoustic Technologies, Inc. Comfort noise generator using modified Doblinger noise estimate
US7873515B2 (en) * 2004-11-23 2011-01-18 Stmicroelectronics Asia Pacific Pte. Ltd. System and method for error reconstruction of streaming audio information
KR100707173B1 (ko) * 2004-12-21 2007-04-13 삼성전자주식회사 저비트율 부호화/복호화방법 및 장치
US7885809B2 (en) * 2005-04-20 2011-02-08 Ntt Docomo, Inc. Quantization of speech and audio coding parameters using partial information on atypical subsequences
ES2356492T3 (es) * 2005-07-22 2011-04-08 France Telecom Método de conmutación de tasa de transmisión en decodificación de audio escalable en tasa de transmisión y ancho de banda.
JP4627737B2 (ja) * 2006-03-08 2011-02-09 シャープ株式会社 デジタルデータ復号化装置
WO2007122614A2 (en) * 2006-04-21 2007-11-01 Galtronics Ltd. Twin ground antenna
JP4380669B2 (ja) * 2006-08-07 2009-12-09 カシオ計算機株式会社 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、及び、プログラム
US7275936B1 (en) * 2006-09-22 2007-10-02 Lotes Co., Ltd. Electrical connector
US8275611B2 (en) * 2007-01-18 2012-09-25 Stmicroelectronics Asia Pacific Pte., Ltd. Adaptive noise suppression for digital speech signals
CN101617362B (zh) * 2007-03-02 2012-07-18 松下电器产业株式会社 语音解码装置和语音解码方法
CN101939782B (zh) * 2007-08-27 2012-12-05 爱立信电话股份有限公司 噪声填充与带宽扩展之间的自适应过渡频率
DK3401907T3 (da) * 2007-08-27 2020-03-02 Ericsson Telefon Ab L M Fremgangsmåde og indretning til perceptuel spektral afkodning af et audiosignal omfattende udfyldning af spektrale huller
US8600740B2 (en) * 2008-01-28 2013-12-03 Qualcomm Incorporated Systems, methods and apparatus for context descriptor transmission
KR101518532B1 (ko) * 2008-07-11 2015-05-07 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 오디오 인코더, 오디오 디코더, 오디오 신호, 오디오 스트림을 부호화 및 복호화하는 장치 및 컴퓨터 프로그램
US9208792B2 (en) 2010-08-17 2015-12-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for noise injection
US20130173275A1 (en) 2010-10-18 2013-07-04 Panasonic Corporation Audio encoding device and audio decoding device

Also Published As

Publication number Publication date
RU2519069C2 (ru) 2014-06-10
ATE535903T1 (de) 2011-12-15
EP2304720A1 (en) 2011-04-06
MX2011000382A (es) 2011-02-25
KR101582057B1 (ko) 2015-12-31
US11024323B2 (en) 2021-06-01
EP2304719A1 (en) 2011-04-06
KR101518532B1 (ko) 2015-05-07
ES2526767T3 (es) 2015-01-15
PL2304719T3 (pl) 2017-12-29
EP4235660A3 (en) 2023-09-13
BR122021003097B1 (pt) 2021-11-03
US8983851B2 (en) 2015-03-17
US11869521B2 (en) 2024-01-09
BR122021003752B1 (pt) 2021-11-09
EP4235660A2 (en) 2023-08-30
TW201007697A (en) 2010-02-16
ES2642906T3 (es) 2017-11-20
EP3246918A1 (en) 2017-11-22
EG26480A (en) 2013-12-02
KR20160004403A (ko) 2016-01-12
EP2304719B1 (en) 2017-07-26
HK1157045A1 (en) 2012-06-22
US20110170711A1 (en) 2011-07-14
US20240096337A1 (en) 2024-03-21
JP5307889B2 (ja) 2013-10-02
KR101706009B1 (ko) 2017-02-22
KR20140036042A (ko) 2014-03-24
BR122021003726B1 (pt) 2021-11-09
TW201007696A (en) 2010-02-16
PL2304720T3 (pl) 2012-04-30
CN102089808B (zh) 2014-02-12
CN102089806A (zh) 2011-06-08
US20110173012A1 (en) 2011-07-14
RU2512103C2 (ru) 2014-04-10
EP3246918C0 (en) 2023-06-14
AR072482A1 (es) 2010-09-01
ZA201100091B (en) 2011-10-26
PL3246918T3 (pl) 2023-11-06
US9449606B2 (en) 2016-09-20
US20150112693A1 (en) 2015-04-23
WO2010003565A1 (en) 2010-01-14
CA2730536A1 (en) 2010-01-14
AU2009267459B2 (en) 2014-01-23
JP2011527455A (ja) 2011-10-27
MY155785A (en) 2015-11-30
CN102089808A (zh) 2011-06-08
US20140236605A1 (en) 2014-08-21
CN102089806B (zh) 2012-12-05
ES2955669T3 (es) 2023-12-05
US20170004839A1 (en) 2017-01-05
US20240096338A1 (en) 2024-03-21
TWI492223B (zh) 2015-07-11
AR072497A1 (es) 2010-09-01
US9711157B2 (en) 2017-07-18
BR122021003142B1 (pt) 2021-11-03
AU2009267468A1 (en) 2010-01-14
BRPI0910522A2 (pt) 2020-10-20
KR101251790B1 (ko) 2013-04-08
US9043203B2 (en) 2015-05-26
KR20110039245A (ko) 2011-04-15
MY178597A (en) 2020-10-16
EP2304720B1 (en) 2011-11-30
ZA201100085B (en) 2011-10-26
CA2730361C (en) 2017-01-03
CA2730536C (en) 2014-12-02
US10629215B2 (en) 2020-04-21
ES2374640T3 (es) 2012-02-20
RU2011102410A (ru) 2012-07-27
RU2011104006A (ru) 2012-08-20
ES2422412T3 (es) 2013-09-11
AU2009267468B2 (en) 2012-03-15
AU2009267459A1 (en) 2010-01-14
US20210272577A1 (en) 2021-09-02
CO6280569A2 (es) 2011-05-20
BRPI0910811B1 (pt) 2021-09-21
PT2304719T (pt) 2017-11-03
EP3246918B1 (en) 2023-06-14
BRPI0910811A2 (pt) 2020-11-03
TWI417871B (zh) 2013-12-01
HK1160285A1 (en) 2012-08-10
JP2011527451A (ja) 2011-10-27
CO6341671A2 (es) 2011-11-21
CA2730361A1 (en) 2010-01-14
JP5622726B2 (ja) 2014-11-12
US20170309283A1 (en) 2017-10-26
WO2010003556A1 (en) 2010-01-14
KR20110040829A (ko) 2011-04-20

Similar Documents

Publication Publication Date Title
MX2011000359A (es) Rellenador de ruido, calculador de parametro de relleno de ruido, representacion de señal de audio codificada, metodos y programa de computadora.
US20210110836A1 (en) Adaptive transition frequency between noise fill and bandwidth extension
US9546924B2 (en) Transform audio codec and methods for encoding and decoding a time segment of an audio signal
AU2006233504B2 (en) Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing
TWI380602B (en) Apparatus and method for encoding an information signal
US20090018824A1 (en) Audio encoding device, audio decoding device, audio encoding system, audio encoding method, and audio decoding method
US9293145B2 (en) Device and method for postprocessing a decoded multi-channel audio signal or a decoded stereo signal
US10566003B2 (en) Transform encoding/decoding of harmonic audio signals
US7921007B2 (en) Scalable audio coding
TR201902394T4 (tr) Gürültü doldurma konsepti.
US8224660B2 (en) Method of coding a source audio signal, corresponding coding device, decoding method and device, signal, computer program products
JP2008518264A (ja) 振幅の包絡線を有するパラメトリックオーディオコーディング
KR101426596B1 (ko) 오디오 인코딩 방법
Hemis et al. New secure and robust audio watermarking algorithm based on QR factorization in wavelet domain
US20220208201A1 (en) Apparatus and method for comfort noise generation mode selection
CN114783449A (zh) 神经网络训练方法、装置、电子设备及介质

Legal Events

Date Code Title Description
FG Grant or registration