ES2889001T3 - Método y dispositivo para decodificar una señal - Google Patents

Método y dispositivo para decodificar una señal Download PDF

Info

Publication number
ES2889001T3
ES2889001T3 ES18170973T ES18170973T ES2889001T3 ES 2889001 T3 ES2889001 T3 ES 2889001T3 ES 18170973 T ES18170973 T ES 18170973T ES 18170973 T ES18170973 T ES 18170973T ES 2889001 T3 ES2889001 T3 ES 2889001T3
Authority
ES
Spain
Prior art keywords
sub
band
decoding
spectral coefficient
allocated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES18170973T
Other languages
English (en)
Inventor
Zexin Liu
Fengyan Qi
Lei Miao
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Application granted granted Critical
Publication of ES2889001T3 publication Critical patent/ES2889001T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/028Noise substitution, i.e. substituting non-tonal spectral components by noisy source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

Un método para decodificar una señal, en donde el método comprende: la obtención (110) de coeficientes espectrales de sub­bandas a partir de un flujo binario recibido por medios de decodificación; la obtención de una cantidad promediada de bits asignados por coeficiente espectral de cada una de las sub­bandas, en donde una cantidad promediada de bits asignados por coeficiente espectral de una sub­banda es una relación de una cantidad de bits asignados para una sub­banda con una cantidad de coeficientes espectrales en la sub-­banda; la clasificación (120) de sub­bandas en las que los coeficientes espectrales están situados en una sub-­banda con asignación binaria saturada y una sub­banda con asignación binaria no saturada mediante comparación de las cantidades promediadas de bits asignados por coeficiente espectral de las sub­bandas con un primer umbral; en donde la sub­banda con asignación binaria saturada se refiere a una sub­banda cuya cantidad promediada de bits asignados por coeficiente espectral es mayor o igual que el primer umbral, y la sub­banda con asignación binaria no saturada se refiere a una sub­banda cuya cantidad promediada de bits asignados por coeficiente espectral es menor que el primer umbral; la realización (130) del relleno mediante ruido en un coeficiente espectral que no se ha obtenido por medios de decodificación y está en la sub­banda con asignación binaria no saturada, con el fin de reconstruir el coeficiente espectral que no ha sido obtenido por medios de decodificación; y la obtención (140) de una señal del dominio de frecuencia de conformidad con los coeficientes espectrales obtenidos por medios de decodificación y el coeficiente espectral reconstruido.

Description

DESCRIPCIÓN
Método y dispositivo para decodificar una señal
CAMPO TÉCNICO
Formas de realización de la presente invención se refieren al campo de la electrónica y más en particular, a un método y dispositivo para decodificar una señal.
ANTECEDENTES DE LA INVENCIÓN
En un algoritmo de códec (codificación/decodificación) del dominio de frecuencia existente, una cantidad de bits que se puede asignar es insuficiente cuando una tasa binaria es baja. En este caso, los bits se asignan solamente a coeficientes espectrales relativamente importantes, y los bits asignados se utilizan para codificar los coeficientes espectrales relativamente importantes durante la codificación. Sin embargo, no se asigna ningún bit para un coeficiente espectral (es decir, un coeficiente espectral menos importante), excepto los coeficientes espectrales relativamente importantes, y el coeficiente espectral menos importante no se codifica. Para los coeficientes espectrales para los que se asignan bits, puesto que una cantidad de bits que se puede asignar es insuficiente, existe una parte de coeficientes espectrales con insuficientes bits asignados. Durante la codificación, no existen suficientes bits para codificar los coeficientes espectrales con insuficientes bits asignados, a modo de ejemplo, solamente se codifica un pequeño número de coeficientes espectrales en una sub-banda.
En correspondencia con un codificador, solamente se decodifican los coeficientes espectrales relativamente importantes en un decodificador, y un coeficiente espectral menos importante, que no se ha obtenido por medios de decodificación, se rellena - con un valor de 0. Si no se realiza ningún procesamiento en un coeficiente espectral que no se ha obtenido por medios de decodificación, un efecto de decodificación se ve gravemente afectado. Por ejemplo, para la decodificación de una señal de audio, una señal de audio que proporciona finalmente sonidos de "una sensación de vacío" o "un sonido de agua", o similar, lo que afecta gravemente a la calidad auditiva. Por lo tanto, el coeficiente espectral que no se ha obtenido mediante la decodificación debe reconstruirse utilizando un método de relleno mediante ruido, con el fin de emitir una señal de mejor calidad. En un ejemplo (es decir, un ejemplo de relleno mediante ruido), de reconstrucción del coeficiente espectral que no se ha obtenido mediante la decodificación, un coeficiente espectral obtenido mediante la decodificación se puede guardar en una matriz, y un coeficiente espectral en la matriz se copia en una localización de un coeficiente espectral, en una sub-banda, para quien no se asigna ningún bit. Dicho de otro modo, el coeficiente espectral que no se ha obtenido por medios de decodificación se reconstruye sustituyendo el coeficiente espectral que no se ha obtenido mediante la decodificación con un coeficiente espectral guardado que ha sido obtenido mediante decodificación.
En la solución anterior para la reconstrucción de un coeficiente espectral que no se ha obtenido por medios de decodificación, solamente se reconstruye un coeficiente espectral que no se ha obtenido por medios de decodificación y está en una sub-banda para la cual no se asigna ningún bit, y la calidad de una señal decodificada no es lo suficientemente buena.
La Publicación de Solicitud de Patente de Estados Unidos n° 2010/0241437 A1 da a conocer un método para la decodificación espectral perceptual, que comprende la decodificación de coeficientes espectrales recuperados a partir de un flujo binario en coeficientes espectrales decodificados de un conjunto inicial de coeficientes espectrales. El conjunto inicial de coeficientes espectrales se rellena de forma espectral. El relleno espectral comprende el relleno mediante ruido de orificios espectrales mediante el establecimiento de coeficientes espectrales en el conjunto inicial de coeficientes espectrales que no han sido decodificados a partir del flujo binario igual a elementos derivados a partir de coeficientes espectrales decodificados. El conjunto de coeficientes espectrales reconstruidos de un dominio de frecuencia, que se forma por el relleno espectral, se convierte en una señal de audio de un dominio temporal. Un decodificador espectral perceptual incluye un relleno mediante ruido, que funciona de conformidad con el método para la decodificación espectral perceptual.
SUMARIO
Formas de realización de la presente invención dan a conocer un método y un dispositivo para decodificar una señal, lo que puede mejorar la calidad de decodificación de la señal.
La presente invención se define en las reivindicaciones independientes.
BREVE DESCRIPCIÓN DE LOS DIBUJOS.
Con el fin de describir las soluciones técnicas en las formas de realización de la presente invención de manera más clara, a continuación, se introducen, de forma breve, los dibujos adjuntos requeridos para describir las formas de realización, o la técnica anterior. Evidentemente, los dibujos adjuntos en la siguiente descripción muestran simplemente algunas formas de realización de la presente invención, y un experto en la técnica puede derivar todavía otros dibujos a partir de estos dibujos adjuntos sin necesidad de esfuerzos creativos.
La Figura 1 es un diagrama de flujo de un método para decodificar una señal de conformidad con una forma de realización de la presente invención;
La Figura 2 es un diagrama de flujo de procesamiento de relleno mediante ruido en un método para decodificar una señal, de conformidad con una forma de realización de la presente invención;
La Figura 3 es un diagrama de bloques de un dispositivo para decodificar una señal de conformidad con una forma de realización de la presente invención;
La Figura 4 es un diagrama de bloques de una unidad de reconstrucción de un dispositivo para decodificar una señal, de conformidad con una forma de realización de la presente invención; y
La Figura 5 es un diagrama de bloques de un aparato de conformidad con otra forma de realización de la presente invención.
DESCRIPCIÓN DE FORMAS DE REALIZACIÓN
A continuación, se describen, de forma clara y completa, las soluciones técnicas en las formas de realización de la presente invención con referencia a los dibujos adjuntos en las formas de realización de la presente invención. Evidentemente, las formas de realización descritas son algunas, pero no todas, las formas de realización de la presente invención. Todas las demás formas de realización obtenidas por un experto en la técnica, sobre la base de las formas de realización de la presente invención, sin esfuerzos creativos, caerán dentro del alcance de protección de la presente invención.
La presente invención da a conocer un método de decodificación del dominio de frecuencia. Un codificador agrupa coeficientes espectrales en sub-bandas, y asigna bits codificados para cada sub-banda. Los coeficientes espectrales, en la sub-banda, se cuantifican en función de los bits asignados para cada sub-banda, con el fin de obtener un flujo binario de codificación. Cuando una tasa binaria es baja y una cantidad de bits que se pueden asignar es insuficiente, el codificador asigna bits solamente a un coeficiente espectral relativamente importante. Para las sub-bandas, los bits asignados tienen diferentes casos: los bits asignados se pueden utilizar para codificar todos los coeficientes espectrales en una sub-banda; los bits asignados se pueden usar para codificar solamente una parte de coeficientes espectrales en una sub-banda; o no se asigna ningún bit para una sub-banda. Cuando los bits asignados se pueden utilizar para codificar todos los coeficientes espectrales en una sub-banda, un decodificador puede obtener, directamente, todos los coeficientes espectrales en la sub-banda por medios de decodificación. Cuando no se asigna ningún bit para la sub-banda, el decodificador no puede obtener un coeficiente espectral de la sub-banda por medios de decodificación y reconstruye, utilizando un método de relleno mediante ruido, un coeficiente espectral que no se ha obtenido por medios de decodificación. Cuando los bits asignados se pueden utilizar para codificar solamente una parte de coeficientes espectrales en una sub-banda, el decodificador puede reconstruir una parte de coeficientes espectrales en la sub-banda, y un coeficiente espectral que no se ha obtenido por medios de decodificación (es decir, un coeficiente espectral no codificado por el codificador) se reconstruye mediante el uso del relleno mediante ruido.
Las soluciones técnicas para decodificar una señal, en las formas de realización de la presente invención, se pueden aplicar a varios sistemas de comunicaciones, a modo de ejemplo, un sistema GSM, un sistema de Acceso Múltiple por División de Código (CDMA, Code Division Multiple Access), un Acceso Múltiple por División de Código de Banda Ancha (WCDMA, Wideband Code Division Multiple Access Wireless), un Servicio General de Paquetes a través de Radio (GPRS, General Packet Radio Service) y Evolución a Largo Plazo (LTE, Longitudinal Term Evolution). Los sistemas o dispositivos de comunicaciones, a los que se aplican las soluciones técnicas para decodificar una señal en las formas de realización de la presente invención, no constituyen una limitación de la presente invención.
La Figura 1 es un diagrama de flujo de un método 100 para la decodificación de una señal de conformidad con una forma de realización de la presente invención.
El método 100 para decodificar una señal incluye: la obtención de coeficientes espectrales de sub-bandas a partir de un flujo binario recibido por medios de decodificación (110); la clasificación de sub-bandas en las que los coeficientes espectrales están situados en una sub-banda con asignación binaria saturada, y una sub-banda con asignación binaria no saturada, en donde la sub-banda con asignación binaria saturada se refiere a una sub-banda en la que los bits asignados se pueden utilizar para codificar todos los coeficientes espectrales en la sub-banda, y la sub-banda con asignación binaria no saturada se refiere a una sub-banda en la que los bits asignados se pueden utilizar para codificar solamente una parte de coeficientes espectrales en la sub-banda, y una sub-banda para la cual no se asigna ningún bit (120); la realización del relleno mediante ruido en un coeficiente espectral que no se ha obtenido por medios de decodificación y está en la sub-banda con asignación binaria no saturada, con el fin de reconstruir el coeficiente espectral que no se ha obtenido por medios de decodificación (130); y la obtención de una señal del dominio de frecuencia en función de los coeficientes espectrales obtenidos por medios de decodificación, y el coeficiente espectral reconstruido (140).
En 110, la obtención de coeficientes espectrales de sub-bandas a partir de un flujo binario recibido, por medios de decodificación, incluye, específicamente: la obtención de los coeficientes espectrales del flujo binario recibido por medios de decodificación, y agrupar los coeficientes espectrales en las sub-bandas. Los coeficientes espectrales pueden ser coeficientes espectrales de las siguientes clases de señales, tales como una señal de imagen, una señal de datos, una señal de audio, una señal de video y una señal de texto. Los coeficientes espectrales se pueden adquirir utilizando varios métodos de decodificación. Una clase de señal específica, y un método de decodificación, no constituyen una limitación de la presente invención.
Un codificador agrupa los coeficientes espectrales en las sub-bandas, y asigna bits de codificación para cada sub­ banda. Después de utilizar un método de clasificación de sub-bandas igual al del codificador, con el fin de obtener los coeficientes espectrales por medios de decodificación, un decodificador agrupa, en función de frecuencias de los coeficientes espectrales, los coeficientes espectrales obtenidos por medios de decodificación en las sub-bandas.
En un ejemplo, una banda de frecuencia en la que están situados los coeficientes espectrales se puede agrupar, de manera uniforme, en múltiples sub-bandas, y a continuación, se agrupan los coeficientes espectrales de conformidad con una frecuencia de cada coeficiente espectral, en las sub-bandas en las que están situadas las frecuencias. Además, los coeficientes espectrales se pueden agrupar en sub-bandas de un dominio de frecuencia de conformidad con varios métodos de clasificación, existentes o futuros, y luego, se realizan diversos procesos.
En 120, las sub-bandas en las que se sitúan los coeficientes espectrales se clasifican en una sub-banda con asignación binaria saturada, y una sub-banda con asignación binaria no saturada, en donde la sub-banda con asignación binaria saturada se refiere a sub-banda en la que se pueden utilizar los bits asignados para codificar todos los coeficientes espectrales en la sub-banda, y la sub-banda con asignación binaria no saturada se refiere a una sub-banda en la que los bits asignados pueden utilizarse para codificar solamente una parte de coeficientes espectrales en la sub-banda, y una sub-banda para la cual no se asigna ningún bit. Cuando la asignación de bits de un coeficiente espectral está saturada, incluso si se asignan más bits para el coeficiente espectral, la calidad de una señal obtenida por medios de decodificación no se mejora notablemente.
En un ejemplo, se puede observar, de conformidad con una cantidad promediada de bits asignados por coeficiente espectral en una sub-banda, si la asignación de bits de la sub-banda es saturada. Más concretamente, la cantidad promediada de bits asignados por coeficiente espectral se compara con un primer umbral, en donde la cantidad promediada de bits asignados por coeficiente espectral es una relación de una cantidad de bits asignados para cada sub-banda con una cantidad de coeficientes espectrales en cada sub-banda, es decir, una cantidad promediada de bits asignados por coeficiente espectral de una sub-banda es una relación de una cantidad de bits asignados para la sub-banda con una cantidad de coeficientes espectrales en la sub-banda; una sub-banda cuya cantidad promediada de bits asignados por coeficiente espectral es mayor o igual que el primer umbral se utiliza como una sub-banda con asignación binaria saturada, y una sub-banda cuya cantidad promediada de bits asignados por coeficiente espectral es menor que el primer umbral se utiliza como una sub-banda con asignación binaria no saturada. En un ejemplo, la cantidad promediada de bits asignados por coeficiente espectral en una sub-banda se obtiene dividiendo una cantidad de bits asignados para la sub-banda por una cantidad de coeficientes espectrales en la sub-banda. El primer umbral puede estar preestablecido, o puede obtenerse, con facilidad, a modo de ejemplo, mediante un experimento. Para una señal de audio, el primer umbral puede ser de 1.5 bits/coeficiente espectral.
En 130, se realiza el relleno mediante ruido en el coeficiente espectral que no se ha obtenido por medios de decodificación, y está en la sub-banda con asignación binaria no saturada, con el fin de reconstruir el coeficiente espectral que no se ha obtenido por medios de decodificación. La sub-banda con asignación binaria no saturada incluye una sub-banda cuyo coeficiente espectral no tiene un bit asignado, y una sub-banda para la que se asignan bits, pero los bits asignados son insuficientes. Se pueden utilizar varios métodos de relleno mediante ruido para reconstruir el coeficiente espectral que no ha sido obtenido por medios de decodificación.
En la técnica anterior, solamente se reconstruye un coeficiente espectral que no se ha obtenido por medios de decodificación, y está en una sub-banda para la que no se asigna ningún bit, y un coeficiente espectral que no se ha obtenido por medios de decodificación y existe debido a una asignación de bits insuficiente en una sub-banda para la cual los bits asignados no se reconstruyen. Además, los coeficientes espectrales obtenidos por medios de decodificación no suelen estar muy relacionados con el coeficiente espectral que no se ha obtenido por medios de decodificación, y resulta difícil obtener un buen efecto de decodificación realizando, directamente, una replicación. En esta forma de realización de la presente invención, se propone un nuevo método de relleno mediante ruido; es decir, el relleno mediante ruido se realiza sobre la base de un parámetro armónico harm de una sub-banda cuya cantidad de bits es mayor o igual que un segundo umbral. Más concretamente, la cantidad promediada de bits asignados por coeficiente espectral se compara con el primer umbral, en donde la cantidad promediada de bits asignados por coeficiente espectral es la relación de la cantidad de bits asignados para cada sub-banda con la cantidad de coeficientes espectrales en cada sub-banda, es decir, una cantidad promediada de bits asignados por coeficiente espectral de una sub-banda es una relación de una cantidad de bits asignados para la sub-banda con una cantidad de coeficientes espectrales en la sub-banda; se calcula un parámetro armónico de una sub-banda cuya cantidad promediada de bits asignados por coeficiente espectral es mayor o igual que el segundo umbral, en donde el parámetro armónico representa la fuerza o debilidad armónica de una señal del dominio de frecuencia; y el relleno mediante ruido se realiza, sobre la base del parámetro armónico, en el coeficiente espectral que no se ha obtenido por medios de decodificación, y está en la sub-banda con asignación binaria no saturada. El segundo umbral puede estar preestablecido, y el segundo umbral es menor, o igual, que el anterior primer umbral y puede ser otro umbral tal como 1.3 bits/coeficiente espectral. El parámetro armónico harm se utiliza para representar la fuerza o debilidad armónica de una señal del dominio de frecuencia. En un caso en el que la armonicidad de una señal del dominio de frecuencia es fuerte, existe una cantidad relativamente grande de coeficientes espectrales con un valor de 0 en los coeficientes espectrales obtenidos por medios de decodificación, y no es necesario realizar el relleno mediante ruido en estos coeficientes espectrales con el valor de 0. Por lo tanto, si el relleno mediante ruido se realiza de manera diferencial, en función del parámetro armónico, en el coeficiente espectral (es decir, un coeficiente espectral con el valor de 0), que no se ha obtenido por medios de decodificación, se puede evitar el error de relleno mediante ruido realizado en una parte de los coeficientes espectrales, obtenidos por medios de decodificación, con el valor de 0 mejorando, de este modo, la calidad de decodificación de la señal.
El parámetro armónico harm de la sub-banda cuya cantidad promediada de bits asignados por coeficiente espectral es mayor o igual que el segundo umbral, se puede representar por uno o más de: una relación de pico a promedio (es decir, una relación de un valor de pico a una amplitud promediada), una relación de envolvente de pico, escasez de un coeficiente espectral obtenido por medios de decodificación, una varianza de asignación de bits de una trama completa, una relación de envolvente promedio, una relación de promedio a pico (es decir, una relación de una amplitud promediada a un valor de pico), una relación de envolvente de pico, y una relación de envolvente de promedio, que son de la sub-banda. Una forma de calcular un parámetro armónico se describe, de forma breve, a continuación, con el fin de dar a conocer más completamente la presente invención.
Una relación de pico a promedio sharp de una sub-banda se puede calcular utilizando la siguiente fórmula (1):
Figure imgf000005_0001
Fórmula (1),
en donde
peak es una amplitud máxima de un coeficiente espectral que se obtiene por medios de decodificación y está en una sub-banda cuyo índice es sfm; sizesfm es una cantidad de coeficientes espectrales en la sub-banda sfm, o una cantidad de coeficientes espectrales que se obtienen por medios de decodificación, y está en la sub-banda sfm; y mean es una suma de amplitudes de todos los coeficientes espectrales. Se puede calcular una relación de envolvente de pico PER de una sub-banda utilizando la siguiente fórmula (2):
Figure imgf000005_0002
Fórmula (2),
en donde
peak es la amplitud máxima del coeficiente espectral que se obtiene por medios de decodificación, y está en la sub­ banda sfm, y norm[sfm] es una envolvente del coeficiente espectral que se obtiene por medios de decodificación y está en la sub-banda sfm. La escasez spar de una sub-banda se utiliza para representar si los coeficientes espectrales en la sub-banda están centralmente distribuidos en varios intervalos de frecuencia o están escasamente distribuidos, en toda la sub-banda, y la escasez se puede calcular utilizando la siguiente fórmula (3):
num _ de _coef
spar = --------------------- - ----- pos _ m ax - pos _ min Fórmula (3),
en donde
num_de_coef es una cantidad de coeficientes espectrales que se obtienen por medios de decodificación y está en una sub-banda; pos_max es una posición de frecuencia más alta de coeficientes espectrales que se obtienen por medios de decodificación y en la sub-banda; y pos_min es una ubicación de frecuencia más baja de los coeficientes espectrales que se obtienen por medios de decodificación y en la sub-banda. Se puede calcular una varianza de asignación de bits de una trama completa utilizando la siguiente fórmula (4):
Figure imgf000005_0003
Fórmula (4),
en donde
last_sfm representa una sub-banda de frecuencia más alta para la cual los bits se asignan en la trama completa; bit[sfm] representa una cantidad de bits asignados para la sub-banda sfm; bit[sfm-1] representa una cantidad de bits asignados para una sub-banda sfm-1; y total_bit representa una cantidad total de bits asignados para todas las sub­ bandas. Los valores mayores de la relación de pico a promedio sharp, la relación de envolvente de pico PER, la escasez spar, y la varianza de asignación de bits var indica una mayor armonicidad de una señal del dominio de frecuencia; por el contrario, los valores más pequeños de la relación de pico a promedio sharp, la relación de envolvente de pico PER, la escasez spar, y la varianza de asignación de bits, var, indican una menor armonicidad de la señal del dominio de frecuencia. Además, los cuatro parámetros armónicos se pueden utilizar, de manera combinada, para representar la fuerza o debilidad armónica. En la práctica, una forma de combinación adecuada se puede seleccionar de conformidad con un requisito. En condiciones normales, la suma ponderada se puede realizar en dos o más de los cuatro parámetros, y una suma obtenida se utiliza como un parámetro armónico. Por lo tanto, el parámetro armónico se puede calcular utilizando las siguientes operaciones: calculando al menos un parámetro de: la relación de pico a promedio, la relación de envolvente de pico, la escasez de un coeficiente espectral obtenido por medios de decodificación, y la varianza de asignación de bits de una trama completa, una relación de envolvente promedio, una relación de promedio a pico, una relación de pico de envolvente y una relación de promedio de envolvente que son de la sub-banda cuya cantidad promediada de bits asignados por coeficiente espectral es mayor o igual que el segundo umbral; y la utilización de uno de los al menos un parámetro calculado o el uso, de forma combinada, del parámetro calculado como el parámetro armónico. Ha de tenerse en cuenta que un parámetro de otra forma de definición se puede utilizar, de forma adicional, además de los cuatro parámetros que se proporcionan siempre que el parámetro de otra forma de definición pueda representar la armonicidad de una señal del dominio de frecuencia.
Tal como se describió anteriormente, una vez obtenido el parámetro armónico, se realiza el relleno mediante ruido, sobre la base del parámetro armónico, en el coeficiente espectral que no se ha obtenido por medios de decodificación, y está en la sub-banda con asignación binaria no saturada, que se describe a continuación, en detalle, haciendo referencia a la Figura 2.
En 140, la señal del dominio de frecuencia se obtiene de conformidad con los coeficientes espectrales obtenidos por medios de decodificación y el coeficiente espectral reconstruido. Después de que los coeficientes espectrales obtenidos por medios de decodificación, se obtienen por medios de decodificación, y se reconstruye el coeficiente espectral que no se ha obtenido por medios de decodificación, se obtiene una señal del dominio de frecuencia en una banda de frecuencia completa, y se obtiene una señal de salida de un dominio temporal realizando un procesamiento tal como la transformación inversa del dominio de la frecuencia, a modo de ejemplo, transformada de Fourier rápida inversa (IFFT, Inverse Fast Fourier Transform). En la práctica, un ingeniero experto en la técnica entiende una solución sobre cómo se obtiene una señal de salida de un dominio temporal de conformidad con un coeficiente espectral, y los detalles no se describen aquí de nuevo.
En el método anterior para la decodificación de una señal en esta forma de realización de la presente invención, se obtiene una sub-banda con asignación binaria no saturada en sub-bandas de una señal del dominio de frecuencia por medio de una clasificación, y un coeficiente espectral que no ha sido obtenido por medios de decodificación, y se reconstruye en la sub-banda con asignación binaria no saturada, mejorando, de este modo, la calidad de decodificación de señal. Además, en un caso en el que se reconstruye un coeficiente espectral que no se ha obtenido por medios de decodificación, sobre la base de un parámetro armónico, se puede evitar un error de relleno mediante ruido que se realiza en coeficientes espectrales, obtenido por medios de decodificación, con un valor de 0, mejorando así la calidad de decodificación de la señal.
La Figura 2 es un diagrama de flujo del procesamiento de relleno mediante ruido 200, en un método para decodificar una señal de conformidad con una forma de realización de la presente invención.
El procesamiento de relleno mediante ruido 200 incluye: el cálculo, de conformidad con una envolvente de la sub­ banda con asignación binaria no saturada, y un coeficiente espectral obtenido por medios de decodificación, de una ganancia de relleno mediante ruido de la sub-banda con asignación binaria no saturada (210); el cálculo de una relación de pico a promedio de una sub-banda cuya cantidad promediada de bits asignados por coeficiente espectral es mayor, o igual, a un segundo umbral, y la obtención de un factor de ruido global basado en una relación de pico a promedio de la sub-banda con asignación binaria saturada (220); la corrección de la ganancia de relleno mediante ruido sobre la base de un parámetro armónico y el factor de ruido global, con el fin de obtener una ganancia objetivo (230); y la utilización de la ganancia objetivo y un valor ponderado de ruido para reconstruir el coeficiente espectral que no se ha obtenido por medios de decodificación, y está en la sub-banda con asignación binaria no saturada (240).
En 210, para la sub-banda sfm con asignación binaria no saturada, se puede calcular una ganancia de relleno mediante ruido gain de la sub-banda sfm con asignación binaria no saturada de conformidad con la siguiente fórmula (5) o (6):
Figure imgf000007_0001
gain = {norm[ sfm] * size _ sfm - ^ \coef\ i ||) / size _ sfm
Fórmula (6).
en donde
norm[sfm] es la envolvente del coeficiente espectral que se ha obtenido por medios de decodificación y está en la sub­ banda (un índice es sfm) con asignación binaria no saturada; coef[i] es el i-ésimo coeficiente espectral que se ha obtenido por medios de decodificación, y está en una sub-banda con asignación binaria no saturada; y size_sfm es una cantidad de coeficientes espectrales en la sub-banda sfm con asignación binaria no saturada, o una cantidad de coeficientes espectrales que se han obtenido por medios de decodificación, y está en la sub-banda sfm.
En 220, el factor de ruido global se puede calcular en función de la relación de pico a promedio, sharp, de la sub­ banda con asignación binaria saturada (en referencia a la descripción anterior que se refiere a la fórmula (1). Más concretamente, se puede calcular un valor medio de la relación de pico a promedio, sharp, y se utiliza un múltiplo de un recíproco del valor promedio como el factor de ruido global fac.
En 230, la ganancia de relleno mediante ruido gain se corrige basándose en el parámetro armónico, y el factor de ruido global, con el fin de obtener la ganancia objetivo gainT . En un ejemplo, la ganancia objetivo gainT se puede obtener de conformidad con la siguiente fórmula (7):
gainT = fac x harnn x gain Fónmüa (7),
en donde
fac es el factor de ruido global; harm es el parámetro armónico; y gain es la ganancia de relleno mediante ruido. En otro ejemplo, además, se puede determinar, en primer lugar, la fuerza o debilidad armónica y, a continuación, se obtiene la ganancia objetivo gainT de una manera diferente de conformidad con la fuerza o debilidad armónica. A modo de ejemplo, el parámetro armónico se compara con un cuarto umbral.
Cuando el parámetro armónico es mayor o igual que el cuarto umbral, la ganancia objetivo gainT se obtiene utilizando la siguiente fórmula (8):
gaini=fac*gain*norm[sfm]/peaJí Fórmula (8),
Cuando el parámetro armónico es menor que el cuarto umbral, la ganancia objetivo gainT se obtiene utilizando la siguiente fórmula (9):
gainT=fac’*gain, fac'=fac+step Fórmula (9),
en donde
fac es el factor de ruido global; norm[sfm] es la envolvente de la sub-banda sfm con asignación binaria no saturada; peak es una amplitud máxima del coeficiente espectral, que se obtiene por medios de decodificación, en la sub-banda con asignación binaria no saturada; y step es una etapa en la que cambia el factor de ruido global. El factor de ruido global aumenta desde una frecuencia baja, a una frecuencia alta, en función de la etapa step, y se puede determinar la etapa step de conformidad con una sub-banda más alta para la que se asignan bits, o el factor de ruido global. El cuarto umbral puede estar preestablecido, o se puede establecer, de manera cambiante, en la práctica, de conformidad con una diferente característica de señal.
En 240, la ganancia objetivo y el valor ponderado del ruido se utilizan para reconstruir el coeficiente espectral que no se ha obtenido por medios de decodificación y está en la sub-banda con asignación binaria no saturada. En un ejemplo, la ganancia objetivo y el valor ponderado del ruido se pueden utilizar para obtener ruido de relleno, y el ruido de relleno se utiliza para realizar el relleno mediante ruido en el coeficiente espectral que no se ha obtenido por medios de decodificación y está en la sub-banda con asignación binaria no saturada, con el fin de reconstruir una señal del dominio de frecuencia que no se ha obtenido por medios de decodificación. El ruido puede ser ruido, tal como ruido aleatorio, de cualquier tipo. Cabe señalar que, además, el ruido se puede utilizar en este caso, en primer lugar, para rellenar el coeficiente espectral que no se ha obtenido por medios de decodificación y está en la sub-banda con asignación binaria no saturada y luego, la ganancia objetivo se ejerce sobre ruido de relleno, con el fin de reconstruir el coeficiente espectral que no se ha obtenido por medios de decodificación. Además, después de que se realiza el relleno mediante ruido en el coeficiente espectral que no se ha obtenido por medios de decodificación, y está en la sub-banda con asignación binaria no saturada (es decir, se reconstruye el coeficiente espectral que no se ha obtenido por medios de decodificación), el procesamiento de suavizado intertramas se puede realizar, además, en un coeficiente espectral reconstruido para conseguir un mejor efecto de decodificación.
En las etapas anteriores de la Figura 2, se puede ajustar una secuencia de ejecución de algunas etapas de conformidad con un requisito. A modo de ejemplo, puede ser que 220 se ejecute primero y a continuación, se ejecute 210, o puede ser que 210 y 220 se ejecuten de forma simultánea.
Además, puede existir una sub-banda anormal con una gran relación de pico a promedio en la sub-banda con asignación binaria no saturada, y se puede corregir, además, para la sub-banda anormal una ganancia objetivo de la sub-banda anormal, con el fin de obtener una ganancia objetivo que sea más adecuada para la sub-banda anormal. Más concretamente, se puede calcular una relación de pico a promedio de un coeficiente espectral de la sub-banda cuya cantidad promediada de bits asignados por coeficiente espectral es mayor o igual que el segundo umbral, y se compara la relación de pico a promedio con un tercer umbral; y para una sub-banda cuya relación de pico a promedio es mayor que el tercer umbral, después de que se obtiene una ganancia objetivo en 240, una relación (norm[sfm]/peak) de una envolvente de la sub-banda con asignación binaria no saturada a una amplitud de señal máxima de la sub­ banda con asignación binaria no saturada se puede utilizar para corregir la ganancia objetivo de la sub-banda cuya relación de pico a promedio es mayor que el tercer umbral. El tercer umbral se puede preestablecer de conformidad con un requisito.
Un flujo de un método para la decodificación de una señal, que se da a conocer en una forma de realización de la presente invención, incluye: la obtención de coeficientes espectrales de sub-bandas a partir de un flujo binario recibido por medios de decodificación; la clasificación de sub-bandas en las que los coeficientes espectrales están situados en una sub-banda con asignación binaria saturada, y una sub-banda con asignación binaria no saturada; la realización del relleno mediante ruido en un coeficiente espectral que no se ha obtenido por medios de decodificación, y está en la sub-banda con asignación binaria no saturada, con el fin de reconstruir el coeficiente espectral que no se ha obtenido por medios de decodificación; y la obtención de una señal del dominio de frecuencia en función de los coeficientes espectrales obtenidos por medios de decodificación y el coeficiente espectral reconstruido.
En otra forma de realización de la presente invención, las sub-bandas de clasificación en las que están situados los coeficientes espectrales en una sub-banda con asignación binaria saturada, y una sub-banda con asignación binaria no saturada, incluye: la comparación de una cantidad promediada de bits asignados por coeficiente espectral con un primer umbral, en donde una cantidad promediada de bits asignados por coeficiente espectral de una sub-banda es una relación de una cantidad de bits asignados para una sub-banda con una cantidad de coeficientes espectrales en la sub-banda; y la utilización de una sub-banda cuya cantidad promediada de bits asignados por coeficiente espectral es mayor o igual que el primer umbral como una sub-banda con asignación binaria saturada, y el uso de una sub­ banda cuya cantidad promediada de bits asignados por coeficiente espectral es menor que el primer umbral como una sub-banda con asignación binaria no saturada.
En otra forma de realización de la presente invención, la realización de relleno mediante ruido en un coeficiente espectral que no se ha obtenido por medios de decodificación, y está en la sub-banda con asignación binaria no saturada, puede incluir: la comparación de la cantidad promediada de bits asignados por coeficiente espectral con 0, en donde una cantidad promediada de bits asignados por coeficiente espectral de una sub-banda, es una relación de una cantidad de bits asignados para la sub-banda con una cantidad de coeficientes espectrales en la sub-banda; el cálculo de un parámetro armónico de una sub-banda cuya cantidad promediada de bits asignados por coeficiente espectral no es igual a 0, en donde el parámetro armónico representa la fuerza o debilidad armónica de una señal del dominio de frecuencia; y la realización, sobre la base del parámetro armónico, del relleno mediante ruido en el coeficiente espectral que no se ha obtenido por medios de decodificación y está en la sub-banda con asignación binaria no saturada.
En otra forma de realización de la presente invención, el cálculo de un parámetro armónico de una sub-banda cuya cantidad promediada de bits asignados por coeficiente espectral no es igual a 0 puede incluir: calcular al menos un parámetro de: una relación de pico a promedio, una relación de envolvente de pico, escasez de un coeficiente espectral obtenido por medios de decodificación, una varianza de asignación de bits de una trama completa, una relación de envolvente promedio, una relación de promedio a pico, una relación de pico de envolvente y una relación de promedio de envolvente que son de la sub-banda cuya cantidad promediada de bits asignados por coeficiente espectral no es igual a 0; y la utilización de uno de los al menos un parámetro calculado o el uso, de forma combinada, del parámetro calculado como el parámetro armónico.
En otra forma de realización de la presente invención, la realización, basada en el parámetro armónico, del relleno mediante ruido en el coeficiente espectral que no se ha obtenido por medios de decodificación, y está en la sub-banda con asignación binaria no saturada, puede incluir: el cálculo, de conformidad con una envolvente de la sub-banda con asignación binaria no saturada, y un coeficiente espectral obtenido por medios de decodificación, una ganancia de relleno mediante ruido de la sub-banda con asignación binaria no saturada; el cálculo de la relación pico a promedio de la sub-banda cuya cantidad promediada de bits asignados por coeficiente espectral no es igual a 0, y la obtención de un factor de ruido global basado en la relación de pico a promedio; la corrección de la ganancia de relleno mediante ruido en función del parámetro armónico y el factor de ruido global con el fin de obtener una ganancia objetivo; y el uso de la ganancia objetivo y un valor ponderado de ruido para la reconstrucción del coeficiente espectral que no se ha obtenido por medios de decodificación y está en la sub-banda con asignación binaria no saturada.
En otra forma de realización de la presente invención, la realización, basada en el parámetro armónico, del relleno mediante ruido en el coeficiente espectral que no se ha obtenido por medios de decodificación, y está en la sub-banda con asignación binaria no saturada puede incluir, además: el cálculo de una relación de pico a promedio de la sub­ banda con asignación binaria no saturada, y la comparación de la relación de pico a promedio con un tercer umbral; y para una sub-banda, cuya relación de pico a promedio es mayor que el tercer umbral, con asignación binaria no saturada, después de que se obtenga una ganancia objetivo, la utilización de una relación de una envolvente de la sub-banda con asignación binaria no saturada a una amplitud máxima de un coeficiente espectral, que se obtiene por medios de decodificación, en la sub-banda con asignación binaria no saturada, con el fin de corregir la ganancia objetivo.
En otra forma de realización de la presente invención, la corrección de la ganancia de relleno mediante ruido, sobre la base del parámetro armónico, y el factor de ruido global, con el fin de obtener una ganancia objetivo, puede incluir: la comparación del parámetro armónico con un cuarto umbral; cuando el parámetro armónico es mayor o igual que el cuarto umbral, la obtención de la ganancia objetivo mediante el uso de gainT=fac*gain*norm/peak; y cuando el parámetro armónico es menor que el cuarto umbral, la obtención de la ganancia objetivo utilizando gainT=fac'*gain y fac'=fac+step, en donde gainT es la ganancia objetivo; fac es el factor de ruido global; norm es la envolvente de la sub­ banda con asignación binaria no saturada; peak es una amplitud máxima del coeficiente espectral, que se obtiene por medios de decodificación, en la sub-banda con asignación binaria no saturada; y step es una etapa en la que cambia el factor de ruido global en función de una frecuencia.
En otra forma de realización de la presente invención, la realización, sobre la base del parámetro armónico, del relleno mediante ruido en el coeficiente espectral que no se ha obtenido por medios de decodificación y está en la sub-banda con asignación binaria no saturada puede incluir, además: una vez que se reconstruye el coeficiente espectral que no se ha obtenido por medios de decodificación, se realiza un procesamiento de suavizado intertramas en el coeficiente espectral reconstruido.
La Figura 3 es un diagrama de bloques de un dispositivo 300 para la decodificación de una señal de conformidad con una forma de realización de la presente invención. La Figura 4 es un diagrama de bloques de una unidad de reconstrucción 330 de un dispositivo para decodificar una señal de conformidad con una forma de realización de la presente invención. A continuación, se describe el dispositivo para decodificar una señal con referencia a la Figura 3 y la Figura 4.
Tal como se ilustra en la Figura 3, el dispositivo 300 para decodificar una señal incluye: una unidad de decodificación 310, configurada para obtener coeficientes espectrales de sub-bandas procedentes de un flujo binario recibido por medios de decodificación, en donde la unidad de decodificación 330 concretamente, obtiene los coeficientes espectrales a partir del flujo binario recibido por medios de decodificación, y agrupar los coeficientes espectrales en las sub-bandas; una unidad de clasificación 320, configurada para clasificar sub-bandas en las que están situados los coeficientes espectrales en una sub-banda con asignación binaria saturada, y una sub-banda con asignación binaria no saturada, en donde la sub-banda con asignación binaria saturada se refiere a una sub-banda en la que los bits asignados se pueden utilizar para codificar todos los coeficientes espectrales en la sub-banda, y la sub-banda con asignación binaria no saturada se refiere a una sub-banda en la que los bits asignados se pueden utilizar para codificar solamente una parte de coeficientes espectrales en la sub-banda, y una sub-banda para la cual no se asigna ningún bit; la unidad de reconstrucción 330, configurada para realizar el relleno mediante ruido en un coeficiente espectral que no se ha obtenido por medios de decodificación, y está en la sub-banda con asignación binaria no saturada, con el fin de reconstruir el coeficiente espectral que no se ha obtenido por medios de decodificación; y una unidad de salida 340, configurada para obtener una señal del dominio de frecuencia de conformidad con los coeficientes espectrales obtenidos por medios de decodificación y el coeficiente espectral reconstruido.
La unidad de decodificación 310 puede recibir un flujo binario de varias clases de señales, y utilizar diversos métodos de decodificación para realizar la decodificación con el fin de obtener los coeficientes espectrales obtenidos por medios de decodificación. Una clase de señal, y un método de decodificación no constituyen una limitación de la presente invención. En un ejemplo de agrupación de sub-bandas, la unidad de decodificación 310 puede agrupar, de forma uniforme, una banda de frecuencia en la que los coeficientes espectrales están situados en múltiples sub-bandas y, a continuación, los coeficientes espectrales se agrupan, de conformidad con una frecuencia de cada coeficiente espectral, en las sub-bandas en las que se ubican las frecuencias.
La unidad de clasificación 3 clasifica sub-bandas en las que los coeficientes espectrales están situados en una sub­ banda con asignación binaria saturada, y una sub-banda con asignación binaria no saturada. La unidad de clasificación 320 realiza la clasificación de conformidad con una cantidad promediada de bits asignados por coeficiente espectral en una sub-banda. Más concretamente, la unidad de clasificación 320 incluye: un componente de comparación, configurado para comparar una cantidad promediada de bits asignados por coeficiente espectral con un primer umbral, en donde la cantidad promediada de bits asignados por coeficiente espectral es una relación de una cantidad de bits asignados para cada sub-banda con una cantidad de coeficientes espectrales en cada sub-banda, es decir, una cantidad promediada de bits asignados por coeficiente espectral de una sub-banda es una relación de una cantidad de bits asignados para la sub-banda a una cantidad de coeficientes espectrales en la sub-banda; y un componente de clasificación, configurado para clasificar una sub-banda cuya cantidad promediada de bits asignados por coeficiente espectral es mayor o igual que el primer umbral como una sub-banda con asignación binaria saturada, y la clasificación de una sub-banda cuya cantidad promediada de bits asignados por coeficiente espectral es menor que el primer umbral como una sub-banda con asignación binaria no saturada. Tal como se describió con anterioridad, la cantidad promediada de bits asignados por coeficiente espectral en una sub-banda se puede obtener agrupando una cantidad de bits asignados para la sub-banda, por una cantidad de coeficientes espectrales en la sub-banda. El primer umbral puede estar preestablecido, o puede obtenerse, con facilidad, mediante un experimento.
La unidad de reconstrucción 330 realiza el relleno mediante ruido en el coeficiente espectral que no se ha obtenido por medios de decodificación, y está en la sub-banda con asignación binaria no saturada, con el fin de reconstruir el coeficiente espectral que no se ha obtenido por medios de decodificación. La sub-banda con asignación binaria no saturada puede incluir una sub-banda para la cual no se asigna ningún bit, y una sub-banda para la cual se asignan bits, pero la asignación de bits es insaturada. Se pueden utilizar varios métodos de relleno mediante ruido para reconstruir el coeficiente espectral que no se ha obtenido por medios de decodificación. En esta forma de realización de la presente invención, la unidad de reconstrucción 330 puede realizar un relleno mediante ruido basándose en un parámetro armónico harm de una sub-banda cuya cantidad de bits es mayor o igual que un segundo umbral. Más concretamente, tal como se muestra en la Figura 4, la unidad de reconstrucción 330 puede incluir: un componente de cálculo 410, configurado para comparar la cantidad promediada de bits asignados por coeficiente espectral con el primer umbral, y para calcular el parámetro armónico de la sub-banda cuya cantidad promediada de bits asignados por coeficiente espectral es mayor o igual que el segundo umbral, en donde la cantidad promediada de bits asignados por coeficiente espectral es la relación de la cantidad de bits asignados para cada sub-banda con la cantidad de coeficientes espectrales en cada sub-banda, es decir, una cantidad promediada de bits asignados por coeficiente espectral de una sub-banda es una relación de una cantidad de bits asignados para una sub-banda con una cantidad de coeficientes espectrales en la sub-banda, y el parámetro armónico representa la fuerza o debilidad armónica de una señal del dominio de frecuencia; y un componente de relleno 420, configurado para realizar, sobre la base del parámetro armónico, el relleno mediante ruido en el coeficiente espectral que no se ha obtenido por medios de decodificación, y está en la sub-banda con asignación binaria no saturada, con el fin de reconstruir el coeficiente espectral que no se ha conseguido por medios de decodificación. Según se describió anteriormente, el segundo umbral es menor, o igual, que el primer umbral; por lo tanto, el primer umbral se puede utilizar como el segundo umbral. Otro umbral menor que el primer umbral se puede establecer, además, como el segundo umbral. Un parámetro de armónico harm de una señal del dominio de frecuencia se utiliza para representar la fuerza o debilidad armónica de la señal del dominio de frecuencia. En un caso en el que la armonicidad es fuerte, existe una cantidad relativamente grande de coeficientes espectrales con un valor de 0, en los coeficientes espectrales obtenidos por medios de decodificación, y no es necesario realizar el relleno mediante ruido en estos coeficientes espectrales con el valor de 0. Por lo tanto, si el relleno mediante ruido se realiza de manera diferencial, en función del parámetro armónico de la señal del dominio de frecuencia, en el coeficiente espectral (es decir, un coeficiente espectral con el valor de 0) que no se ha obtenido por medios de decodificación, se puede evitar un error de relleno mediante ruido realizado en una parte de los coeficientes espectrales, obtenidos por medios de decodificación, con el valor de 0, con lo que se mejora la calidad de decodificación de la señal.
Tal como se describió con anterioridad, más concretamente, el componente de cálculo 410 puede calcular el parámetro armónico utilizando las siguientes operaciones: calcular al menos un parámetro de: una relación de pico a promedio, una relación de envolvente de pico, escasez de un coeficiente espectral obtenido mediante decodificación, una varianza de asignación de bits de una trama completa, una relación de envolvente promedio, una relación de promedio a pico, una relación de pico de envolvente y una relación de envolvente promedio que son de la sub-banda cuya cantidad promediada de bits asignados por coeficiente espectral es mayor o igual que el segundo umbral; y la utilización de uno de los al menos un parámetro calculado o el uso, de forma combinada, del parámetro calculado como el parámetro armónico. Para un método específico para calcular el parámetro armónico, se puede hacer referencia a las descripciones anteriores que se hacen con referencia a la fórmula (1) a la fórmula (4) y cuyos detalles no se describen aquí de nuevo.
Según se describió anteriormente, después de que el componente de cálculo 410 obtiene el parámetro armónico, el componente de relleno 420 realiza, basándose en el parámetro armónico, el relleno mediante ruido en el coeficiente espectral que no se ha obtenido por medios de decodificación, y está en el sub banda con asignación binaria no saturada, que se describe, en detalle, a continuación.
La unidad de salida 340 obtiene la señal del dominio de frecuencia de conformidad con los coeficientes espectrales obtenidos por medios de decodificación, y el coeficiente espectral reconstruido. Después de que los coeficientes espectrales obtenidos por medios de decodificación, se obtengan por medios de decodificación, y la unidad de reconstrucción 330 reconstruye el coeficiente espectral que no se ha obtenido por medios de decodificación, se obtienen coeficientes espectrales en una banda de frecuencias completa, y una señal de salida de un dominio temporal se obtiene realizando un procesamiento tal como la transformación, a modo de ejemplo, la transformada de Fourier rápida inversa (IFFT). En la práctica, un ingeniero experto en la técnica entiende una solución sobre cómo se obtiene una señal de salida de un dominio temporal de conformidad con una señal del dominio de frecuencia, y los detalles no se describen aquí de nuevo.
En el dispositivo anterior para decodificar una señal en esta forma de realización de la presente invención, una unidad de clasificación 320 obtiene una sub-banda con asignación binaria no saturada, a partir de sub-bandas de una señal del dominio de frecuencia por medio de clasificación, y una unidad de reconstrucción 330 reconstruye un coeficiente espectral que no se ha obtenido por medios de decodificación, y está en la sub-banda con asignación binaria no saturada, con lo que se mejora la calidad de decodificación de la señal. Además, en un caso en el que se reconstruye el coeficiente espectral que no se ha obtenido por medios de decodificación sobre la base de un parámetro armónico obtenido por un componente de cálculo 410 mediante cálculo, se puede evitar un error de relleno mediante ruido que se produce en los coeficientes espectrales, obtenidos por medios de decodificación, con un valor de 0, lo que mejora todavía más la calidad de decodificación de la señal.
A continuación, se describen, de forma adicional, operaciones realizadas por el componente de relleno 420 en la Figura 4. El componente de relleno 420 puede incluir: un módulo de cálculo de ganancia 421, configurado para calcular, de conformidad con una envolvente de la sub-banda con asignación binaria no saturada, y un coeficiente espectral obtenido por medios de decodificación, una ganancia de relleno mediante ruido de la sub-banda con asignación binaria no saturada; para calcular la relación de pico a promedio de la sub-banda cuya cantidad promediada de bits asignados por coeficiente espectral es mayor o igual que el segundo umbral, y para obtener un factor de ruido global basado en la relación de pico a promedio; y la corrección de la ganancia de relleno mediante ruido sobre la base del parámetro armónico, y el factor de ruido global con el fin de obtener una ganancia objetivo; y un módulo de relleno 422, configurado para utilizar la ganancia objetivo y un valor ponderado de ruido para reconstruir el coeficiente espectral que no se ha obtenido por medios de decodificación, y está en la sub-banda con asignación binaria no saturada. En otra forma de realización, el componente de relleno 420 incluye, además, un módulo de suavizado intertramas 424, configurado para, una vez realizado el relleno mediante ruido en el coeficiente espectral que no se ha obtenido por medios de decodificación, y está en la sub-banda con asignación binaria no saturada, la realización del procesamiento de suavizado intertramas en el coeficiente espectral reconstruido con el fin de obtener un coeficiente espectral en el que se ha realizado el procesamiento de suavizado. La unidad de salida está configurada para obtener la señal del dominio de frecuencia de conformidad con los coeficientes espectrales obtenidos por medios de decodificación, y el coeficiente espectral en el que se ha realizado el procesamiento de suavizado. Se puede lograr un mejor efecto de decodificación utilizando el procesamiento de suavizado intertramas.
El módulo de cálculo de ganancia 421 puede utilizar la fórmula anterior (5) o (6) para calcular la ganancia de relleno mediante ruido de la sub-banda con asignación binaria no saturada, utilizar un múltiplo de un recíproco de un valor promedio de una relación de pico a promedio, sharp, (con referencia a las descripciones que se refieren a la fórmula 1 anterior) de la sub-banda con asignación binaria saturada como un factor de ruido global fac; y la corrección de la ganancia de relleno mediante ruido gain sobre la base del parámetro armónico, y el factor de ruido global, con el fin de obtener una ganancia objetivo gainT. En un ejemplo de obtención de la ganancia objetivo gainT, el módulo de cálculo de ganancia 421 puede realizar las siguientes operaciones: la comparación del parámetro armónico con un cuarto umbral; cuando el parámetro armónico es mayor o igual que el cuarto umbral, la obtención de la ganancia objetivo mediante el uso de la fórmula anterior (8); y cuando el parámetro armónico es menor que el cuarto umbral, la obtención de la ganancia objetivo mediante el uso de la fórmula anterior (9). Además, el módulo de cálculo de ganancia 421 puede utilizar, además, directamente la fórmula anterior (7) con el fin de obtener la ganancia objetivo.
En otra forma de realización, el componente de relleno 420 incluye, además, un módulo de corrección 423, configurado para calcular una relación de pico a promedio de la sub-banda con asignación binaria no saturada, y la comparación de la relación de pico a promedio con un tercer umbral ; y para una sub-banda, cuya relación de pico a promedio es mayor que el tercer umbral, con asignación binaria no saturada, después de obtener una ganancia objetivo, que utiliza una relación de una envolvente de la sub-banda con asignación binaria no saturada con una amplitud máxima de un coeficiente espectral, la obtención por medios de decodificación, en la sub-banda con asignación binaria no saturada para corregir la ganancia objetivo, con el fin de obtener una ganancia objetivo corregida. El módulo de relleno utiliza la ganancia objetivo que se corrige para reconstruir el coeficiente espectral que no se ha obtenido por medios de decodificación, y está en la sub-banda con asignación binaria no saturada. Una finalidad es corregir una sub-banda anormal con una gran relación de pico a promedio en la sub-banda con asignación binaria no saturada, de modo que se obtenga una ganancia objetivo más adecuada.
Además de realizar el relleno mediante ruido de la manera anterior, el módulo de relleno 422 puede utilizar, además, en primer lugar, un ruido para rellenar el coeficiente espectral que no se ha obtenido por medios de decodificación, y está en la sub-banda con asignación binaria no saturada y, a continuación, ejercer la ganancia objetivo sobre el ruido de relleno, con el fin de reconstruir el coeficiente espectral que no se ha obtenido por medios de decodificación.
Conviene señalar que la clasificación estructural en la Figura 4 es simplemente a modo de ejemplo y se puede poner en práctica, de forma flexible, en otra forma de clasificación en la práctica; por ejemplo, el componente de cálculo 410 se puede utilizar para realizar las operaciones del módulo de cálculo de ganancia 421.
La Figura 5 es un diagrama de bloques de un aparato 500, de conformidad con otra forma de realización de la presente invención. El aparato 500 en la Figura 5 se puede configurar para la puesta en práctica de etapas y métodos en las formas de realización del método anterior. El aparato 500 se puede aplicar a una estación base, o un terminal, en varios sistemas de comunicación. En la forma de realización de la Figura 5, el aparato 500 incluye un circuito de recepción 502, un procesador de decodificación 503, una unidad de procesamiento 504, una memoria 505 y una antena 501. La unidad de procesamiento 504 controla el funcionamiento del aparato 500, y la unidad de procesamiento 504 se puede referir, además, como una CPU (Central Processing Unit, unidad central de procesamiento). La memoria 505 puede incluir una memoria de solamente lectura y una memoria de acceso aleatorio, y proporcionar una instrucción y datos a la unidad de procesamiento 504. Una parte de la memoria 505 puede incluir, además, una memoria de acceso aleatorio no volátil (NVRAM). En una aplicación específica, el aparato 500 puede estar integrado o puede ser un dispositivo de comunicaciones inalámbrico, tal como un teléfono móvil, y el aparato 500 puede incluir, además, una portadora que aloja el circuito de recepción 501, con el fin de permitir que el aparato 500 reciba datos desde una localización distante. El circuito de recepción 501 se puede acoplar a la antena 501. Los componentes del aparato 500 se acoplan entre sí utilizando un sistema de bus 506, en donde el sistema de bus 506 incluye, además, un bus de alimentación de energía, un bus de control, y un bus de señal de estado, además de un bus de datos. Sin embargo, para mayor claridad de la descripción, varios buses están marcados como el sistema de bus "506" en la Figura 5. El aparato 500 puede incluir, además, la unidad de procesamiento 504, configurada para procesar una señal y, además, incluye también el procesador de decodificación 503.
Los métodos dados a conocer en las formas de realización anteriores de la presente invención, se pueden aplicar al procesador de decodificación 503, o ponerse en práctica por el procesador de decodificación 503. El procesador de decodificación 503 puede ser un circuito integrado, que tiene una capacidad de procesamiento de señal. En un proceso de puesta en práctica, las etapas en los métodos anteriores se pueden realizar utilizando un circuito lógico integrado de hardware en el procesador de decodificación 503, o instrucciones en una forma de software. Estas instrucciones pueden ponerse en práctica y controlarse mediante el funcionamiento con la unidad de procesamiento 504. El procesador de decodificación anterior puede ser un procesador de propósito general, un procesador de señal digital (DSP), un circuito integrado específico de la aplicación (ASIC), una matriz de puerta programable de campo (FPGA) u otro dispositivo lógico programable, una puerta discreta o un dispositivo lógico de transistor, o un componente de hardware discreto. El procesador de decodificación anterior puede poner en práctica o realizar métodos, etapas y diagramas de bloques lógicos que se dan a conocer en las formas de realización de la presente invención. El procesador de finalidad general puede ser un microprocesador, o el procesador puede ser, además, cualquier procesador convencional, traductor o similar. Las etapas de los métodos descritos con referencia a las formas de realización de la presente invención se pueden ejecutar, directamente, y llevarse a cabo mediante un procesador de decodificación incorporado como hardware, o pueden ejecutarse y realizarse utilizando una combinación de módulos de hardware y software en el procesador de decodificación. El módulo de software puede estar situado en un soporte de memorización ya conocido en la técnica, tal como una memoria de acceso aleatorio, una memoria instantánea, una memoria de solamente lectura, una memoria de solamente lectura programable, una memoria programable eléctricamente borrable, o un registro. El soporte de memorización está situado en la memoria 505. El procesador de decodificación 503 efectúa la lectura de la información procedente de la memoria 505, y completa las etapas de los métodos anteriores en combinación con el hardware.
A modo de ejemplo, el dispositivo 300 para decodificar una señal en la Figura 3 se puede poner en práctica mediante el procesador de decodificación 503. Además, la unidad de clasificación 320, la unidad de reconstrucción 330, y la unidad de salida 340, en la Figura 3, se pueden poner en práctica por la unidad de procesamiento 504, o realizarse por el procesador de decodificación 503. Sin embargo, los ejemplos anteriores son simplemente realizaciones a modo de ejemplo y no están previstos para limitar las formas de realización de la presente invención a esta manera de puesta en práctica específica.
Más concretamente, la memoria 505 memoriza una instrucción que permite al procesador 504, o al procesador de decodificación 503, realizar las siguientes operaciones: la obtención de coeficientes espectrales de sub-bandas desde un flujo binario recibido por medios de decodificación; la clasificación de sub-bandas en las que los coeficientes espectrales están situados en una sub-banda con asignación binaria saturada, y una sub-banda con asignación binaria no saturada, en donde la sub-banda con asignación binaria saturada se refiere a una sub-banda en la que los bits asignados se pueden utilizar para codificar todos los coeficientes espectrales en la sub-banda, y la sub-banda con asignación binaria no saturada se refiere a una sub-banda en la que los bits asignados se pueden utilizar para codificar solamente una parte de coeficientes espectrales en la sub-banda, y una sub-banda para la cual no se asigna ningún bit; la realización del relleno mediante ruido en un coeficiente espectral que no se ha obtenido por medios de decodificación, y está en la sub-banda con asignación binaria no saturada, con el fin de reconstruir el coeficiente espectral que no se ha obtenido por medios de decodificación; y la obtención de una señal del dominio de frecuencia de conformidad con los coeficientes espectrales obtenidos por medios de decodificación y el coeficiente espectral reconstruido.
En el aparato 500 anterior, en esta forma de realización de la presente invención, se obtiene una sub-banda con asignación binaria no saturada, mediante clasificación de sub-bandas procedentes de una señal del dominio de frecuencia, y se reconstruye un coeficiente espectral que no se ha obtenido por medios de decodificación, y está en la sub-banda con asignación binaria no saturada, con lo que se mejora la calidad de decodificación de la señal.
Un dispositivo para decodificar una señal, dada a conocer en una forma de realización de la presente invención, incluye: una unidad de decodificación, configurada para obtener coeficientes espectrales de sub-bandas desde un flujo binario recibido por medios de decodificación; una unidad de clasificación, configurada para clasificar sub-bandas en las que los coeficientes espectrales están situados en una sub-banda con asignación binaria saturada, y una sub­ banda con asignación binaria no saturada; una unidad de reconstrucción, configurada para realizar el relleno mediante ruido en un coeficiente espectral que no se ha obtenido por medios de decodificación y está en la sub-banda con asignación binaria no saturada, con el fin de reconstruir el coeficiente espectral que no se ha obtenido por medios de decodificación; y una unidad de salida, configurada para obtener una señal del dominio de frecuencia de conformidad con los coeficientes espectrales obtenidos por medios de decodificación, y el coeficiente espectral reconstruido.
En una forma de realización de la presente invención, la unidad de clasificación incluye: un componente de comparación, configurado para comparar una cantidad promediada de bits asignados por coeficiente espectral con un primer umbral, en donde una cantidad promediada de bits asignados por coeficiente espectral de una sub-banda es una relación de una cantidad de bits asignados para una sub-banda con una cantidad de coeficientes espectrales en la sub-banda; y un componente de clasificación, configurado para clasificar una sub-banda cuya cantidad promediada de bits asignados por coeficiente espectral es mayor o igual que el primer umbral como una sub-banda con asignación binaria saturada, y la clasificación de una sub-banda cuya cantidad promediada de los bits asignados por coeficiente espectral es menor que el primer umbral como una sub-banda con asignación binaria no saturada.
En una forma de realización de la presente invención, la unidad de reconstrucción puede incluir: un componente de cálculo, configurado para comparar la cantidad promediada de bits asignados por coeficiente espectral con 0, y para calcular un parámetro armónico de una sub-banda cuya cantidad promediada de bits asignados por coeficiente espectral no es igual a 0, en donde una cantidad promediada de bits asignados por coeficiente espectral de una sub­ banda es una relación de una cantidad de bits asignados para una sub-banda con una cantidad de coeficientes espectrales en la sub-banda, y el parámetro armónico representa la fuerza o debilidad armónica de una señal del dominio de frecuencia; y un componente de relleno, configurado para realizar, sobre la base del parámetro armónico, el relleno mediante ruido en el coeficiente espectral que no se ha obtenido por medios de decodificación, y está en la sub-banda con asignación binaria no saturada, con el fin de reconstruir el coeficiente espectral que no se ha obtenido por medios de decodificación.
En una forma de realización de la presente invención, el componente de cálculo puede calcular el parámetro armónico utilizando las siguientes operaciones: calculando al menos un parámetro de: una relación de pico a promedio, una relación de envolvente de pico, escasez de un coeficiente espectral obtenido por medios de decodificación, una varianza de asignación de bits de una trama completa, una relación de envolvente promedio, una relación de promedio a pico, una relación de pico de envolvente y una relación de promedio de envolvente que son de la sub-banda cuya cantidad promediada de bits asignados por coeficiente espectral no es igual a 0; y la utilización de uno de los al menos un parámetro calculado o el uso, de forma combinada, del parámetro calculado como el parámetro armónico.
En una forma de realización de la presente invención, el componente de relleno puede incluir: un módulo de cálculo de ganancia, configurado para calcular, de conformidad con una envolvente de la sub-banda con asignación binaria no saturada, y un coeficiente espectral obtenido por medios de decodificación, una ganancia de relleno mediante ruido de la sub-banda con asignación binaria no saturada; para calcular la relación de pico a promedio de la sub-banda cuya cantidad promediada de bits asignados por coeficiente espectral no es igual a 0, y para obtener un factor de ruido global sobre la base de la relación de pico a promedio; y para la corrección de la ganancia de relleno mediante ruido basándose en el parámetro armónico y el factor de ruido global, con el fin de obtener una ganancia objetivo; y un módulo de relleno, configurado para utilizar la ganancia objetivo y un valor ponderado de ruido para reconstruir el coeficiente espectral que no se ha obtenido por medios de decodificación, y está en la sub-banda con asignación binaria no saturada.
En una forma de realización de la presente invención, el componente de relleno puede incluir, además, un módulo de corrección, configurado para calcular una relación de pico a promedio de la sub-banda con asignación binaria no saturada, y comparar la relación de pico a promedio con un tercer umbral; y para una sub-banda, cuya relación de pico a promedio es mayor que el tercer umbral, con asignación binaria no saturada, después de obtener una ganancia objetivo, la utilización de una relación de una envolvente de la sub-banda con asignación binaria no saturada con una amplitud máxima de un coeficiente espectral, que se obtiene por medios de decodificación, en la sub-banda con asignación binaria no saturada, con el fin de corregir la ganancia objetivo, de modo que se obtenga una ganancia objetivo corregida; en donde el módulo de relleno utiliza la ganancia objetivo corregida y el valor ponderado del ruido para reconstruir el coeficiente espectral que no se ha obtenido por medios de decodificación, y está en la sub-banda con asignación binaria no saturada.
En una forma de realización de la presente invención, el módulo de cálculo de ganancia puede corregir, utilizando las siguientes operaciones, la ganancia de relleno mediante ruido basada en el parámetro armónico y el factor de ruido global: comparando el parámetro armónico con un cuarto umbral; cuando el parámetro armónico es mayor o igual que el cuarto umbral, para obtener la ganancia objetivo mediante el uso de gainT=fac*gain*norm/peak; y cuando el parámetro armónico es menor que el cuarto umbral, obtener la ganancia objetivo utilizando gainT=fac'*gain y fac'=fac+step, en donde gainT es la ganancia objetivo; fac es el factor de ruido global; norm es la envolvente de la sub­ banda con asignación binaria no saturada; peak es una amplitud máxima del coeficiente espectral, que se obtiene por medios de decodificación, en la sub-banda con asignación binaria no saturada; y step es una etapa en la que cambia el factor de ruido global en función de una frecuencia.
En una forma de realización de la presente invención, el componente de relleno puede incluir, además, un módulo de suavizado intertramas, configurado para, después de que se reconstruya el coeficiente espectral que no se ha obtenido por medios de decodificación, la realización del procesamiento de suavizado intertramas en el coeficiente espectral reconstruido con el fin de obtener un coeficiente espectral en el que se ha realizado el procesamiento de suavizado; en donde la unidad de salida está configurada para obtener la señal del dominio de frecuencia de conformidad con los coeficientes espectrales obtenidos por medios de decodificación, y el coeficiente espectral en el que se ha realizado el procesamiento de suavizado.
Un experto en la técnica puede ser consciente de que, en combinación con los ejemplos descritos en las formas de realización dadas a conocer en esta memoria descriptiva, las unidades y etapas de algoritmo se pueden poner en práctica mediante hardware electrónico o una combinación de software informático y hardware electrónico. El hecho de que las funciones sean realizadas por hardware o software depende de aplicaciones particulares, y condiciones de restricción de diseño de las soluciones técnicas. Un experto en la materia puede utilizar diferentes métodos para realizar las funciones descritas para cada aplicación particular, pero no debe considerarse que la puesta en práctica va más allá del alcance de la presente invención.
Un experto en la técnica puede entender, de forma clara que, para la finalidad de una descripción breve y conveniente, para un proceso de trabajo detallado del dispositivo, unidad, elemento y, módulos anteriores, se refiere a un proceso correspondiente en las formas de realización anteriores del método, y los detalles no se describen aquí de nuevo.
En las diversas formas de realización, dadas a conocer en la presente memoria descriptiva, ha de entenderse que el sistema, el aparato y el método dados a conocer se pueden poner en práctica de otras formas operativas. A modo de ejemplo, la forma de realización del aparato descrito es simplemente a modo de ejemplo. Por ejemplo, la división de unidad es simplemente una división de funciones lógicas y puede ser otra división en la puesta en práctica real. A modo de ejemplo, una pluralidad de unidades o componentes se pueden combinar o integrar en otro sistema, o algunas características se pueden ignorar, o no realizarse.
Además, unidades funcionales en las formas de realización de la presente invención se pueden integrar en una unidad de procesamiento, o cada una de las unidades puede existir de forma separada físicamente, o dos o más unidades están integradas en una unidad.
Cuando se implementan las funciones en forma de una unidad funcional de software y se vende o utiliza como un producto independiente, las funciones se pueden almacenar en un soporte de memorización legible por ordenador. Basándose en una interpretación de este tipo, las soluciones técnicas de la presente invención esencialmente, o la parte que contribuye a la técnica anterior, o algunas de las soluciones técnicas, se pueden implementar en una forma de un producto de software. El producto de software se almacena en un soporte de memorización, e incluye varias instrucciones para indicar a un dispositivo informático (que puede ser un ordenador personal, un servidor o un dispositivo de red) que realice todas o algunas de las etapas de los métodos descritos en las formas de realización de la presente invención. El soporte de memorización anterior incluye: cualquier soporte que pueda almacenar código de programa, tal como una unidad flash USB, un disco duro extraíble, una memoria de solo lectura (ROM, Read-Only Memory), una memoria de acceso aleatorio (RAM, Random Access Memory), un disco magnético o un disco óptico.

Claims (6)

REIVINDICACIONES
1. Un método para decodificar una señal, en donde el método comprende:
la obtención (110) de coeficientes espectrales de sub-bandas a partir de un flujo binario recibido por medios de decodificación;
la obtención de una cantidad promediada de bits asignados por coeficiente espectral de cada una de las sub-bandas, en donde una cantidad promediada de bits asignados por coeficiente espectral de una sub-banda es una relación de una cantidad de bits asignados para una sub-banda con una cantidad de coeficientes espectrales en la sub-banda; la clasificación (120) de sub-bandas en las que los coeficientes espectrales están situados en una sub-banda con asignación binaria saturada y una sub-banda con asignación binaria no saturada mediante comparación de las cantidades promediadas de bits asignados por coeficiente espectral de las sub-bandas con un primer umbral; en donde la sub-banda con asignación binaria saturada se refiere a una sub-banda cuya cantidad promediada de bits asignados por coeficiente espectral es mayor o igual que el primer umbral, y la sub-banda con asignación binaria no saturada se refiere a una sub-banda cuya cantidad promediada de bits asignados por coeficiente espectral es menor que el primer umbral;
la realización (130) del relleno mediante ruido en un coeficiente espectral que no se ha obtenido por medios de decodificación y está en la sub-banda con asignación binaria no saturada, con el fin de reconstruir el coeficiente espectral que no ha sido obtenido por medios de decodificación; y
la obtención (140) de una señal del dominio de frecuencia de conformidad con los coeficientes espectrales obtenidos por medios de decodificación y el coeficiente espectral reconstruido.
2. El método según la reivindicación 1, en donde la realización de relleno mediante ruido (130) en un coeficiente espectral que no se ha obtenido por medios de decodificación, y está en la sub-banda con asignación binaria no saturada, comprende:
la comparación de la cantidad promediada de bits asignados por coeficiente espectral con un segundo umbral, en donde una cantidad promediada de bits asignados por coeficiente espectral de una sub-banda es una relación de una cantidad de bits asignados para una sub-banda con una cantidad de coeficientes espectrales en la sub-banda; el cálculo de un parámetro armónico de una sub-banda cuya cantidad promediada de bits asignados por coeficiente espectral es mayor o igual que el segundo umbral, en donde el parámetro armónico representa la fuerza o debilidad armónica de una señal del dominio de frecuencia; y
la realización, sobre la base del parámetro armónico, del relleno mediante ruido en el coeficiente espectral que no se ha obtenido por medios de decodificación y está en la sub-banda con asignación binaria no saturada.
3. El método según la reivindicación 2, en donde el parámetro armónico comprende:
una relación de pico a promedio.
4. Un dispositivo (300) para decodificar una señal, en donde el dispositivo comprende:
una unidad de decodificación (310), configurada para obtener coeficientes espectrales de sub-bandas procedentes de un flujo binario recibido por medios de decodificación;
una unidad, configurada para obtener una cantidad promediada de bits asignados por coeficiente espectral de cada una de las sub-bandas, en donde una cantidad promediada de bits asignados por coeficiente espectral de una sub­ banda es una relación de una cantidad de bits asignados para una sub-banda con una cantidad de coeficientes espectrales en la sub-banda;
una unidad de clasificación (320), configurada para clasificar sub-bandas en las que los coeficientes espectrales están situados en una sub-banda con asignación binaria saturada y una sub-banda con asignación binaria no saturada mediante comparación de las cantidades promediadas de bits asignados por coeficiente espectral de las sub-bandas con un primer umbral; en donde la sub-banda con asignación binaria saturada se refiere a una sub-banda cuya cantidad promediada de bits asignados por coeficiente espectral es mayor o igual que el primer umbral, y la sub-banda con asignación binaria no saturada se refiere a una sub-banda cuya cantidad promediada de bits asignados por coeficiente espectral es menor que el primer umbral;
una unidad de reconstrucción (330), configurada para realizar el relleno mediante ruido en un coeficiente espectral que no se ha obtenido por medios de decodificación y está en la sub-banda con asignación binaria no saturada, con el fin de reconstruir el coeficiente espectral que no se ha obtenido por medios de decodificación; y
una unidad de salida (340), configurada para obtener una señal del dominio de frecuencia de conformidad con los coeficientes espectrales obtenidos por medios de decodificación y el coeficiente espectral reconstruido.
5. El dispositivo (300) según la reivindicación 4, en donde la unidad de reconstrucción (330) comprende:
un componente de cálculo, configurado para comparar la cantidad promediada de bits asignados por coeficiente espectral con un segundo umbral, y para calcular un parámetro armónico de una sub-banda cuya cantidad promediada de bits asignados por coeficiente espectral es mayor o igual que el segundo umbral, en donde una cantidad promediada de bits asignados por coeficiente espectral de una sub-banda es una relación de una cantidad de bits asignados para una sub-banda con una cantidad de coeficientes espectrales en la sub-banda, y el parámetro armónico representa la fuerza o debilidad armónica de una señal del dominio de frecuencia; y
un componente de relleno, configurado para realizar, sobre la base del parámetro armónico, el relleno mediante ruido en el coeficiente espectral que no se ha obtenido por medios de decodificación, y está en la sub-banda con asignación binaria no saturada, con el fin de reconstruir el coeficiente espectral que no ha sido obtenido por medios de decodificación.
6. El dispositivo (300) según la reivindicación 5, en donde el parámetro armónico comprende una relación de pico a promedio.
ES18170973T 2012-12-06 2013-07-25 Método y dispositivo para decodificar una señal Active ES2889001T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201210518020 2012-12-06
CN201310297982.0A CN103854653B (zh) 2012-12-06 2013-07-16 信号解码的方法和设备

Publications (1)

Publication Number Publication Date
ES2889001T3 true ES2889001T3 (es) 2022-01-10

Family

ID=50862223

Family Applications (2)

Application Number Title Priority Date Filing Date
ES18170973T Active ES2889001T3 (es) 2012-12-06 2013-07-25 Método y dispositivo para decodificar una señal
ES13859818T Active ES2700985T3 (es) 2012-12-06 2013-07-25 Método y dispositivo para decodificar una señal

Family Applications After (1)

Application Number Title Priority Date Filing Date
ES13859818T Active ES2700985T3 (es) 2012-12-06 2013-07-25 Método y dispositivo para decodificar una señal

Country Status (14)

Country Link
US (8) US9626972B2 (es)
EP (4) EP3951776B1 (es)
JP (3) JP6170174B2 (es)
KR (4) KR101649251B1 (es)
CN (2) CN105976824B (es)
BR (1) BR112015012976B1 (es)
DK (1) DK2919231T3 (es)
ES (2) ES2889001T3 (es)
HK (1) HK1209894A1 (es)
PL (1) PL2919231T3 (es)
PT (2) PT3444817T (es)
SG (1) SG11201504244PA (es)
SI (1) SI2919231T1 (es)
WO (1) WO2014086155A1 (es)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105976824B (zh) 2012-12-06 2021-06-08 华为技术有限公司 信号解码的方法和设备
CN107424621B (zh) 2014-06-24 2021-10-26 华为技术有限公司 音频编码方法和装置
EP2980792A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating an enhanced signal using independent noise-filling
CN104113778B (zh) * 2014-08-01 2018-04-03 广州猎豹网络科技有限公司 一种视频流解码方法及装置
US10020002B2 (en) * 2015-04-05 2018-07-10 Qualcomm Incorporated Gain parameter estimation based on energy saturation and signal scaling
JPWO2017119284A1 (ja) * 2016-01-08 2018-11-08 日本電気株式会社 信号処理装置、利得調整方法および利得調整プログラム
CN113539281A (zh) * 2020-04-21 2021-10-22 华为技术有限公司 音频信号编码方法和装置
CN114070156B (zh) * 2020-08-04 2023-06-23 美的威灵电机技术(上海)有限公司 基于转速信息的电机的控制方法、电机和存储介质

Family Cites Families (69)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4964166A (en) * 1988-05-26 1990-10-16 Pacific Communication Science, Inc. Adaptive transform coder having minimal bit allocation processing
NL9000338A (nl) * 1989-06-02 1991-01-02 Koninkl Philips Electronics Nv Digitaal transmissiesysteem, zender en ontvanger te gebruiken in het transmissiesysteem en registratiedrager verkregen met de zender in de vorm van een optekeninrichting.
US5632005A (en) * 1991-01-08 1997-05-20 Ray Milton Dolby Encoder/decoder for multidimensional sound fields
JP3134338B2 (ja) * 1991-03-30 2001-02-13 ソニー株式会社 ディジタル音声信号符号化方法
EP0551705A3 (en) * 1992-01-15 1993-08-18 Ericsson Ge Mobile Communications Inc. Method for subbandcoding using synthetic filler signals for non transmitted subbands
JP3153933B2 (ja) 1992-06-16 2001-04-09 ソニー株式会社 データ符号化装置及び方法並びにデータ復号化装置及び方法
US5761636A (en) * 1994-03-09 1998-06-02 Motorola, Inc. Bit allocation method for improved audio quality perception using psychoacoustic parameters
DE69515907T2 (de) * 1994-12-20 2000-08-17 Dolby Lab Licensing Corp Verfahren und gerät zum anwenden von wellenformprädiktion auf teilbänder in einem perzeptiven kodiersystem
KR970011728B1 (ko) * 1994-12-21 1997-07-14 김광호 음향신호의 에러은닉방법 및 그 장치
US5710863A (en) * 1995-09-19 1998-01-20 Chen; Juin-Hwey Speech signal quantization using human auditory models in predictive coding systems
US6058359A (en) * 1998-03-04 2000-05-02 Telefonaktiebolaget L M Ericsson Speech coding including soft adaptability feature
WO1999050828A1 (en) 1998-03-30 1999-10-07 Voxware, Inc. Low-complexity, low-delay, scalable and embedded speech and audio coding with adaptive frame loss concealment
DE19905868A1 (de) * 1999-02-12 2000-08-17 Bosch Gmbh Robert Verfahren zur Verarbeitung eines Datenstromes sowie Dekoder und Verwendung
JP2001255882A (ja) 2000-03-09 2001-09-21 Sony Corp 音声信号処理装置及びその信号処理方法
ATE320651T1 (de) * 2001-05-08 2006-04-15 Koninkl Philips Electronics Nv Kodieren eines audiosignals
US7447631B2 (en) * 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
CN102280109B (zh) 2004-05-19 2016-04-27 松下电器(美国)知识产权公司 编码装置、解码装置及它们的方法
KR100668319B1 (ko) * 2004-12-07 2007-01-12 삼성전자주식회사 오디오 신호의 변환방법 및 장치와 오디오 신호에적응적인 부호화방법 및 장치, 오디오 신호의 역변환 방법및 장치와 오디오 신호에 적응적인 복호화 방법 및 장치
US7609904B2 (en) * 2005-01-12 2009-10-27 Nec Laboratories America, Inc. Transform coding system and method
US7539612B2 (en) * 2005-07-15 2009-05-26 Microsoft Corporation Coding and decoding scale factor information
US7630882B2 (en) * 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
US7562021B2 (en) * 2005-07-15 2009-07-14 Microsoft Corporation Modification of codewords in dictionary used for efficient coding of digital media spectral data
US8620644B2 (en) * 2005-10-26 2013-12-31 Qualcomm Incorporated Encoder-assisted frame loss concealment techniques for audio coding
US8332216B2 (en) * 2006-01-12 2012-12-11 Stmicroelectronics Asia Pacific Pte., Ltd. System and method for low power stereo perceptual audio coding using adaptive masking threshold
CN101390158B (zh) * 2006-02-24 2012-03-14 法国电信公司 量化索引的编码方法、解码信号包络方法、编解码模块
JP4649351B2 (ja) 2006-03-09 2011-03-09 シャープ株式会社 デジタルデータ復号化装置
JP2007264154A (ja) 2006-03-28 2007-10-11 Sony Corp オーディオ信号符号化方法、オーディオ信号符号化方法のプログラム、オーディオ信号符号化方法のプログラムを記録した記録媒体及びオーディオ信号符号化装置
KR101291672B1 (ko) 2007-03-07 2013-08-01 삼성전자주식회사 노이즈 신호 부호화 및 복호화 장치 및 방법
KR101131880B1 (ko) * 2007-03-23 2012-04-03 삼성전자주식회사 오디오 신호의 인코딩 방법 및 장치, 그리고 오디오 신호의디코딩 방법 및 장치
US7761290B2 (en) * 2007-06-15 2010-07-20 Microsoft Corporation Flexible frequency and time partitioning in perceptual transform coding of audio
EP2186087B1 (en) 2007-08-27 2011-11-30 Telefonaktiebolaget L M Ericsson (PUBL) Improved transform coding of speech and audio signals
DK3401907T3 (da) 2007-08-27 2020-03-02 Ericsson Telefon Ab L M Fremgangsmåde og indretning til perceptuel spektral afkodning af et audiosignal omfattende udfyldning af spektrale huller
EP2571024B1 (en) 2007-08-27 2014-10-22 Telefonaktiebolaget L M Ericsson AB (Publ) Adaptive transition frequency between noise fill and bandwidth extension
EP2201566B1 (en) * 2007-09-19 2015-11-11 Telefonaktiebolaget LM Ericsson (publ) Joint multi-channel audio encoding/decoding
GB2454190A (en) * 2007-10-30 2009-05-06 Cambridge Silicon Radio Ltd Minimising a cost function in encoding data using spectral partitioning
KR100970446B1 (ko) 2007-11-21 2010-07-16 한국전자통신연구원 주파수 확장을 위한 가변 잡음레벨 결정 장치 및 그 방법
US20100324708A1 (en) 2007-11-27 2010-12-23 Nokia Corporation encoder
CN101933086B (zh) * 2007-12-31 2013-06-19 Lg电子株式会社 处理音频信号的方法和设备
US20090210222A1 (en) * 2008-02-15 2009-08-20 Microsoft Corporation Multi-Channel Hole-Filling For Audio Compression
NO328622B1 (no) * 2008-06-30 2010-04-06 Tandberg Telecom As Anordning og fremgangsmate for reduksjon av tastaturstoy i konferanseutstyr
ATE538469T1 (de) * 2008-07-01 2012-01-15 Nokia Corp Vorrichtung und verfahren zum justieren von räumlichen hinweisinformationen eines mehrkanaligen audiosignals
MY154452A (en) 2008-07-11 2015-06-15 Fraunhofer Ges Forschung An apparatus and a method for decoding an encoded audio signal
EP4372745A1 (en) 2008-07-11 2024-05-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, methods for encoding and decoding an audio signal, audio stream and computer program
RU2621965C2 (ru) 2008-07-11 2017-06-08 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Передатчик сигнала активации с деформацией по времени, кодер звукового сигнала, способ преобразования сигнала активации с деформацией по времени, способ кодирования звукового сигнала и компьютерные программы
US8364471B2 (en) * 2008-11-04 2013-01-29 Lg Electronics Inc. Apparatus and method for processing a time domain audio signal with a noise filling flag
CN101436407B (zh) 2008-12-22 2011-08-24 西安电子科技大学 音频编解码方法
US8805694B2 (en) 2009-02-16 2014-08-12 Electronics And Telecommunications Research Institute Method and apparatus for encoding and decoding audio signal using adaptive sinusoidal coding
WO2010111876A1 (zh) * 2009-03-31 2010-10-07 华为技术有限公司 一种信号去噪的方法和装置及音频解码系统
FR2947945A1 (fr) * 2009-07-07 2011-01-14 France Telecom Allocation de bits dans un codage/decodage d'amelioration d'un codage/decodage hierarchique de signaux audionumeriques
EP2492726A1 (en) * 2009-10-23 2012-08-29 Fujikura Co., Ltd. Element for outputting laser beam, method for manufacturing the element, and fiber laser apparatus using the element
US9117458B2 (en) 2009-11-12 2015-08-25 Lg Electronics Inc. Apparatus for processing an audio signal and method thereof
CN102063905A (zh) * 2009-11-13 2011-05-18 数维科技(北京)有限公司 一种用于音频解码的盲噪声填充方法及其装置
CN102081926B (zh) * 2009-11-27 2013-06-05 中兴通讯股份有限公司 格型矢量量化音频编解码方法和系统
CN102081927B (zh) * 2009-11-27 2012-07-18 中兴通讯股份有限公司 一种可分层音频编码、解码方法及系统
CN102194457B (zh) * 2010-03-02 2013-02-27 中兴通讯股份有限公司 音频编解码方法、系统及噪声水平估计方法
CN102194458B (zh) 2010-03-02 2013-02-27 中兴通讯股份有限公司 频带复制方法、装置及音频解码方法、系统
CN102222505B (zh) 2010-04-13 2012-12-19 中兴通讯股份有限公司 可分层音频编解码方法系统及瞬态信号可分层编解码方法
CN102959872A (zh) * 2010-07-05 2013-03-06 日本电信电话株式会社 编码方法、解码方法、装置、程序及记录介质
US9236063B2 (en) * 2010-07-30 2016-01-12 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for dynamic bit allocation
EP2631905A4 (en) * 2010-10-18 2014-04-30 Panasonic Corp DEVICE FOR TONE CODING AND TONE DECODING
WO2012122297A1 (en) * 2011-03-07 2012-09-13 Xiph. Org. Methods and systems for avoiding partial collapse in multi-block audio coding
FR2973551A1 (fr) * 2011-03-29 2012-10-05 France Telecom Allocation par sous-bandes de bits de quantification de parametres d'information spatiale pour un codage parametrique
MX2013013261A (es) * 2011-05-13 2014-02-20 Samsung Electronics Co Ltd Asignacion de bits, codificacion y decodificacion de audio.
BR112013033900B1 (pt) 2011-06-30 2022-03-15 Samsung Electronics Co., Ltd Método para gerar um sinal estendido de largura de banda para decodificação de áudio
DE102011106033A1 (de) 2011-06-30 2013-01-03 Zte Corporation Verfahren und System zur Audiocodierung und -decodierung und Verfahren zur Schätzung des Rauschpegels
CN102208188B (zh) 2011-07-13 2013-04-17 华为技术有限公司 音频信号编解码方法和设备
WO2013057895A1 (ja) * 2011-10-19 2013-04-25 パナソニック株式会社 符号化装置及び符号化方法
KR20140130248A (ko) * 2012-03-29 2014-11-07 텔레폰악티에볼라겟엘엠에릭슨(펍) 하모닉 오디오 신호의 변환 인코딩/디코딩
CN105976824B (zh) * 2012-12-06 2021-06-08 华为技术有限公司 信号解码的方法和设备

Also Published As

Publication number Publication date
EP2919231B1 (en) 2018-09-12
US20210201920A1 (en) 2021-07-01
ES2700985T3 (es) 2019-02-20
EP3951776B1 (en) 2024-01-10
KR20170070290A (ko) 2017-06-21
KR20160099728A (ko) 2016-08-22
WO2014086155A1 (zh) 2014-06-12
KR101973599B1 (ko) 2019-04-29
JP2017194705A (ja) 2017-10-26
DK2919231T3 (da) 2019-01-02
CN103854653A (zh) 2014-06-11
CN105976824B (zh) 2021-06-08
BR112015012976A2 (pt) 2017-07-11
JP6404410B2 (ja) 2018-10-10
JP6170174B2 (ja) 2017-07-26
US20230206929A1 (en) 2023-06-29
KR101851545B1 (ko) 2018-04-24
US10236002B2 (en) 2019-03-19
JP2016506536A (ja) 2016-03-03
JP2018194870A (ja) 2018-12-06
KR102099754B1 (ko) 2020-04-10
SI2919231T1 (sl) 2019-01-31
US11610592B2 (en) 2023-03-21
PT3444817T (pt) 2021-08-30
EP4340228A2 (en) 2024-03-20
US20190156839A1 (en) 2019-05-23
EP4340228A3 (en) 2024-05-15
US10546589B2 (en) 2020-01-28
US20170178633A1 (en) 2017-06-22
US20240046938A1 (en) 2024-02-08
JP6637559B2 (ja) 2020-01-29
EP3444817A1 (en) 2019-02-20
KR20150088868A (ko) 2015-08-03
PT2919231T (pt) 2018-12-17
US20200135214A1 (en) 2020-04-30
US20180040326A1 (en) 2018-02-08
BR112015012976B1 (pt) 2020-01-14
US10971162B2 (en) 2021-04-06
US20150269947A1 (en) 2015-09-24
EP2919231A1 (en) 2015-09-16
PL2919231T3 (pl) 2019-02-28
KR101649251B1 (ko) 2016-08-18
KR20190045406A (ko) 2019-05-02
US9830914B2 (en) 2017-11-28
EP2919231A4 (en) 2016-02-24
SG11201504244PA (en) 2015-07-30
US9626972B2 (en) 2017-04-18
CN103854653B (zh) 2016-12-28
US11823687B2 (en) 2023-11-21
EP3951776A1 (en) 2022-02-09
HK1209894A1 (en) 2016-04-08
CN105976824A (zh) 2016-09-28
EP3444817B1 (en) 2021-07-21

Similar Documents

Publication Publication Date Title
ES2889001T3 (es) Método y dispositivo para decodificar una señal
CN109361495B (zh) 一种极化码构造方法、装置、电子设备及可读存储介质
JP2021043453A (ja) 信号処理方法及び装置