ES2755152T3 - Método y dispositivo de procesamiento de señal - Google Patents

Método y dispositivo de procesamiento de señal Download PDF

Info

Publication number
ES2755152T3
ES2755152T3 ES14891093T ES14891093T ES2755152T3 ES 2755152 T3 ES2755152 T3 ES 2755152T3 ES 14891093 T ES14891093 T ES 14891093T ES 14891093 T ES14891093 T ES 14891093T ES 2755152 T3 ES2755152 T3 ES 2755152T3
Authority
ES
Spain
Prior art keywords
subbands
energy
envelope values
subband
original envelope
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES14891093T
Other languages
English (en)
Inventor
Bin Wang
Lei Miao
Zexin Liu
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Application granted granted Critical
Publication of ES2755152T3 publication Critical patent/ES2755152T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

Un método de procesamiento de señal para procesar una señal, en donde la señal es una señal de audio o una señal de voz, comprendiendo el método de procesamiento de señal: seleccionar (110) las primeras M subbandas de las N subbandas, en donde las N subbandas son obtenidas mediante la división de los coeficientes espectrales de una trama actual de la señal y se disponen en orden ascendente de bandas de frecuencia; determinar (120), según una característica de energía y una característica espectral de las M subbandas, para realizar una operación de modificación sobre los valores originales de envolvente de las M subbandas; realizar (130) la modificación sobre los valores originales de envolvente de las M subbandas, para adquirir valores modificados de envolvente de las M subbandas; y realizar (140) la primera asignación de bits sobre las N subbandas según los valores modificados de envolvente de las M subbandas y los valores originales de envolvente de las otras K subbandas de las N subbandas, en donde N es un número entero positivo mayor que 1, tanto M como K son números enteros positivos, y la suma de M y K es N; caracterizado por que la etapa de determinación (120), según una característica de energía y una característica espectral de las M subbandas, para realizar una operación de modificación sobre los valores originales de envolvente de las M subbandas comprende: determinar la característica de energía de las M subbandas según los valores originales de envolvente de las N subbandas, en donde la característica de energía de las M subbandas indica un grado de concentración que es de energía espectral de la trama actual de la señal y que está sobre las M subbandas; determinar la característica espectral de las M subbandas según los valores originales de envolvente de las M subbandas, en donde la característica espectral de las M subbandas indica un grado de fluctuación espectral de las M subbandas; y determinar, cuando la característica de energía de las M subbandas cae dentro de un primer intervalo y la característica espectral de las M subbandas cae dentro de un segundo intervalo, realizar la operación de modificación sobre los valores originales de envolvente de las M subbandas.

Description

DESCRIPCIÓN
Método y dispositivo de procesamiento de señal
Campo técnico
La presente invención se relaciona con el campo del procesamiento de señal, y específicamente con un método y dispositivo de procesamiento de señal.
Antecedentes
En la transmisión de comunicación actual, se pone una creciente atención a la calidad de una señal de voz o de una señal de audio; por lo tanto, un requisito para la codificación y decodificación de señal es cada vez más alto. En un algoritmo de codificación existente del dominio de la frecuencia, se realiza la asignación de bits generalmente en cada subbanda de una señal de manera directa según un tamaño de una envolvente de frecuencia, y después cada subbanda es codificada mediante el uso de una cantidad de bits asignados. Sin embargo, la práctica muestra que, en estos algoritmos de codificación existentes, una subbanda de una banda de baja frecuencia tiene un impacto relativamente grande sobre la calidad de codificación de la señal; por lo tanto, la subbanda de la banda de bajas frecuencias generalmente resulta un cuello de botella de rendimiento de codificación de la señal. Además, la forma de asignación de bits anterior no se puede adaptar bien a un requisito de bits de cada subbanda, especialmente el de una subbanda de una banda de baja frecuencia, lo que lleva a un relativamente pobre rendimiento de codificación de la señal. De manera correspondiente, el rendimiento de decodificación de la señal es también relativamente pobre.
El documento JP 2055258478 A describe un dispositivo de codificación, en donde un sub muestreador disminuye la tasa de muestreo de una señal de entrada desde una tasa de muestreo FH a una tasa de muestro FL, un codificador de capa básico codifica una señal de sonido con la tasa de muestreo FL, un decodificador local decodifica el código codificado emitido desde el codificador de capa básico, y un sobre muestreador aumenta la tasa de muestreo de la señal decodificada a la tasa de muestreo FH, un sustractor sustrae la señal decodificada desde la señal de sonido con la tasa de muestreo FH, y un codificador de capa extendida codifica la señal emitida desde el sustractor mediante el uso de parámetros del resultado de decodificación emitido desde el decodificador local.
Compendio
La presente invención proporciona un método y un dispositivo de procesamiento de señal, que puede mejorar el rendimiento de codificación y decodificación de la señal.
La presente invención se define en las reivindicaciones independientes.
Según un primer aspecto, se proporciona un método de procesamiento de señal para procesar una señal de audio o una señal de voz, que incluye: seleccionar M subbandas a partir de N subbandas, donde las N subbandas son obtenidas mediante la división de los coeficientes espectrales de una trama actual de una señal, una banda de frecuencia de las M subbandas es inferior que una banda de frecuencia de las K subbandas en las N subbandas excepto las M subbandas, N es un número entero positivo mayor que 1, tanto M como K son números enteros positivos, y la suma de M y K es N; determinar según la información de rendimiento de las M subbandas, realizar una operación de modificación sobre los valores originales de la envolvente de las M subbandas, donde la información del rendimiento se usa para indicar una característica de energía y una característica espectral que son de las M subbandas; realizar la modificación sobre los valores originales de la envolvente de las M subbandas, para adquirir los valores modificados de la envolvente de las M subbandas, y realizar la primera asignación de bits sobre las N subbandas según los valores modificados de envolvente de las M subbandas y los valores originales de envolvente de las K subbandas.
Con referencia al primer aspecto, la determinación, según la información de rendimiento de las M subbandas, de realizar una operación de modificación sobre los valores originales de envolvente de las M subbandas incluye: determinar un primer parámetro según los valores originales de envolvente de las N subbandas, donde el primer parámetro indica un grado de concentración que es de energía espectral de la señal y que está sobre las M subbandas.
determinar un segundo parámetro según los valores originales de la envolvente de las M subbandas, donde el segundo parámetro indica un grado de fluctuación espectral de las M subbandas; y
determinar, en un caso en que el primer parámetro cae dentro de un primer intervalo y el segundo parámetro cae dentro de un segundo intervalo, realizar la operación de modificación sobre los valores originales de la envolvente de las M subbandas.
En una posible forma de implementación, la determinación de un primer parámetro según los valores originales de la envolvente de las N subbandas incluye: determinar la energía total de las M subbandas según los valores originales de envolvente de las M subbandas; determinar la energía total de las K subbandas según los valores originales de envolvente de las K subbandas, y determinar una relación de la energía total de las M subbandas a la energía total de las K subbandas como el primer parámetro.
En una posible forma de implementación, la determinación de un segundo parámetro según los valores originales de la envolvente de las M subbandas incluye: determinar la energía total de las M subbandas y la energía de una primera subbanda según los valores originales de la envolvente de las M subbandas, donde la energía de la primera subbanda es la mayor de las M subbandas; y determinar una relación de la energía de la primera subbanda con la energía total de las M subbandas como el segundo parámetro.
En una posible forma de implementación, la modificación que se realiza sobre los valores originales de la envolvente de las M subbandas, para adquirir los valores modificados de la envolvente de las M subbandas incluye: determinar la energía total de las M subbandas y la energía de la primera subbanda según los valores originales de envolvente de las M subbandas, donde la energía de la primera subbanda es la mayor de las M subbandas; determinar un factor de modificación según la energía total de las M subbandas y la energía de la primera subbanda; y realizar la modificación sobre los valores originales de envolvente de las M subbandas mediante el uso del factor de modificación, para adquirir los valores modificados de envolvente de las M subbandas.
En una posible forma de implementación, un valor modificado de envolvente de cada subbanda en las M subbandas es mayor que un valor original de envolvente de la misma subbanda.
En una posible forma de implementación, el método incluye además: determinar una cantidad de bits redundantes de cada subbanda en las N subbandas según las cantidades de bits asignadas respectivamente a las N subbandas durante la primera asignación de bits, donde la cantidad de bits redundantes de cada subbanda en las N subbandas es menor que una cantidad de bits requerida para codificar una unidad de información única en la misma subbanda; determinar una cantidad total de bits redundantes según la cantidad de bits redundantes de cada subbanda en las N subbandas; y realizar la segunda asignación de bits de las N subbandas en las N subbandas según los valores modificados de la envolvente de las M subbandas, los valores originales de envolvente de las K subbandas, y la cantidad total de bits redundantes.
Según un segundo aspecto, se proporciona un segundo dispositivo de procesamiento de señales para procesar una señal de audio o una señal de voz, que incluye: una unidad de selección, configurada para seleccionar M subbandas a partir de las N subbandas, donde las N subbandas son obtenidas mediante la división de los coeficientes espectrales de una trama actual de una señal, una banda de frecuencia de las M subbandas es inferior que una banda de frecuencia de las K subbandas en las N subbandas excepto las M subbandas, N es un número entero positivo mayor que 1, tanto M como K son números enteros positivos, y la suma de M y K es N; una unidad de terminación, configurada para determinar, según la información de rendimiento de las M subbandas, realizar una operación de modificación sobre los valores de envolvente originales de las M subbandas, donde la información de rendimiento se usa para indicar una característica de energía y una característica espectral que son de las M subbandas; una unidad de modificación, configurada para realizar la modificación sobre los valores de la envolvente original de las M subbandas, para adquirir los valores modificados de la envolvente de las M subbandas, y una unidad de asignación, configurada para realizar la primera asignación de bits sobre las N subbandas según los valores modificados de la envolvente de las M subbandas y los valores originales de la envolvente de las K subbandas.
Con referencia al segundo aspecto, la unidad de determinación se configura de manera específica para: determinar un primer parámetro según los valores originales de envolvente de las N subbandas, donde el primer parámetro indica un grado de concentración que es de energía espectral de la señal y que está sobre las M subbandas; determinar un segundo parámetro según los valores originales de envolvente de las M subbandas, donde el segundo parámetro indica un grado de fluctuación espectral de las M subbandas; y determinar, en el caso en que el primer parámetro cae dentro de un primer intervalo y el segundo parámetro cae dentro de un segundo intervalo, realizar la operación de modificación sobre los valores originales de envolvente de las M subbandas.
En una posible forma de implementación, la unidad de determinación se configura específicamente para: determinar la energía total de las M subbandas según los valores originales de envolvente de las M subbandas; determinar la energía total de las K subbandas según los valores originales de envolvente de las K subbandas; y determinar una relación de la energía total de las M subbandas con la energía total de las K subbandas como el primer parámetro. En una posible forma de implementación, la unidad de determinación se configura específicamente para: determinar la energía total de las M subbandas y la energía de una primera subbanda según los valores originales de envolvente de las M subbandas, donde la energía de la primera subbanda es la mayor de las M subbandas; y determinar una relación de la energía de la primera subbanda con la energía total de las M subbandas como el segundo parámetro.
En una posible forma de implementación, la unidad de modificación se configura específicamente para: determinar la energía total de las M subbandas y la energía de la primera subbanda según los valores originales de envolvente de las M subbandas, donde la energía de la primera subbanda es la mayor de las M subbandas; determinar un factor de modificación según la energía total de las M subbandas y la energía de la primera subbanda, y realizar la modificación sobre los valores originales de envolvente de las M subbandas mediante el uso del factor de modificación, para adquirir los valores modificados de envolvente de las M subbandas.
En una posible forma de implementación, un valor modificado de envolvente de cada subbanda en las M subbandas es mayor que un valor original de envolvente de la misma subbanda.
En una posible forma de implementación, la unidad de determinación se configura además para determinar la cantidad de bits redundantes de cada subbanda en las N subbandas según las cantidades de bits asignados respectivamente a las N subbandas durante la primera asignación de bits, donde la cantidad de bits redundantes de cada subbanda en las N subbandas es menor que una cantidad de bits requeridos para codificar una unidad de información en la misma subbanda; la unidad de determinación se configura además para determinar una cantidad total de bits redundantes según la cantidad de bits redundantes de cada subbanda en las N subbandas; y la unidad de asignación se configura además para realizar una segunda asignación de bits sobre las N subbandas según los valores modificados de envolvente de las M subbandas, los valores originales de envolvente de las k subbandas, y la cantidad total de bits redundantes.
En la presente invención, la asignación de bits no se realiza directamente según los valores originales de envolvente de las N subbandas; en su lugar, se seleccionan M subbandas de una banda de baja frecuencia a partir de las N subbandas, se determina, según una característica de energía y una característica espectral que son de las M subbandas, para realizar una operación de modificación sobre los valores originales de envolvente de las M subbandas, la modificación se realiza respectivamente sobre los valores originales de envolvente de las M subbandas según los valores originales de envolvente de las M subbandas, y se realiza la primera asignación de bits sobre las N subbandas según los valores modificados de envolvente de las M subbandas y los valores originales de envolvente de las K subbandas, de manera que la asignación de bits alcance mejor un requisito de bits de cada subbanda, y por lo tanto, el rendimiento de la codificación y decodificación de la señal se pueda mejorar.
Breve descripción de los dibujos
Para describir las soluciones técnicas de la presente invención de manera más clara, a continuación se introducen brevemente los dibujos adjuntos describiendo las realizaciones de la presente invención. Evidentemente, los dibujos adjuntos en la siguiente descripción muestran simplemente algunas realizaciones preferidas de la presente invención.
La FIG. 1 es un diagrama de flujo esquemático de un método de procesamiento de señal según una realización de la presente invención.
La FIG. 2 es un diagrama de flujo esquemático de un proceso de un método de procesamiento de señal según una realización de la presente invención.
La FIG. 3 es un diagrama de bloques esquemático de un dispositivo de procesamiento de señal según una realización de la presente invención; y
La FIG. 4 es un diagrama de bloques esquemático de un dispositivo de procesamiento de señal según otra realización de la presente invención.
Descripción de las realizaciones
Lo siguiente describe de manera clara las soluciones técnicas de la presente invención con referencia a los dibujos adjuntos mostrando las realizaciones preferidas de la presente invención. Evidentemente, las realizaciones descritas son algunas, pero no todas las realizaciones de la presente invención.
Todas las ocurrencias siguientes de la palabra “realización” o “realizaciones”, si hacen referencia a combinaciones de características diferentes de aquellas definidas por las reivindicaciones independientes, se refieren a ejemplos que fueron solicitados originalmente pero que no representan las realizaciones de la invención reivindicada actualmente; estos ejemplos se muestran por propósitos ilustrativos sólo.
Una tecnología de codificación de señal y una tecnología de decodificación de señal son ampliamente aplicadas a diversos dispositivos electrónicos, tales como un teléfono móvil, un aparato inalámbrico, un asistente de datos personal (Asistente de Datos Personal, PDA), un ordenador portátil o de mano, un asistente de navegación receptor del Sistema de Posicionamiento Global (Sistema de Posicionamiento Global, GPS), una cámara, un reproductor de audio/video, una video cámara, una grabadora de video, y un dispositivo de monitorización. Generalmente, dichos dispositivos electrónicos incluyen un codificador de voz o un codificador de audio, y pueden incluir además un decodificador de voz o un decodificador de audio. El codificador de voz o el codificador de audio y el decodificador de voz o el decodificador de audio se pueden implementar de manera directa por un circuito digital o un chip, tal como un chip de procesador digital de señales (Procesador Digital de Señales, DSP), o se pueden implementar mediante un procesador gestionado por código de software mediante la ejecución de un procedimiento en código de software.
La FIG. 1 es un diagrama de flujo esquemático de un método de procesamiento de señal según una realización de la presente invención. El método en la FIG. 1 es ejecutado por un lado codificador, tal como el codificador de voz anterior o el codificador de audio anterior. El método en la FIG. 1 puede ser ejecutado también por un lado decodificador, tal como el decodificador de audio anterior o el decodificador de audio anterior.
En un proceso de codificación, el lado codificador puede transformar primero una señal en el dominio del tiempo en una señal en el dominio de la frecuencia. Por ejemplo, la transformación tiempo-frecuencia puede ser realizada mediante el uso de un algoritmo tal como la transformada de Fourier rápida (Transformada de Fourier Rápida, FFT) o la transformada de coseno discreta modificada (Transformada de Coseno Discreta Modificada, MDCT). Entonces, se puede usar una ganancia global para realizar la normalización sobre un coeficiente espectral de la señal en el dominio de la frecuencia, y se realiza la división sobre un coeficiente espectral normalizado para obtener múltiples subbandas.
En un proceso de decodificación, el lado decodificador puede decodificar un flujo de bits recibido desde el lado codificador para obtener un coeficiente espectral normalizado, y se realiza la división sobre el coeficiente espectral normalizado para obtener múltiples subbandas.
110. Seleccionar M subbandas a partir de las N subbandas, donde las N subbandas son obtenidas mediante la división de los coeficientes espectrales de una trama actual de una señal, una banda de frecuencia de las M subbandas es inferior que una banda de frecuencia de las K subbandas en las N subbandas excepto las M subbandas, N es un número entero positivo mayor que 1, tanto M como K son números enteros positivos, y la suma de M y K es N.
En esta realización de la presente invención, la señal puede ser una señal de voz, o puede ser una señal de audio. Las K subbandas anteriores son todas subbandas en las N subbandas excepto las M subbandas.
120. Determinar, según la información de rendimiento de las M subbandas, realizar una operación de modificación sobre los valores originales de envolvente de las M subbandas, donde la información de rendimiento se usa para indicar una característica de energía, y una característica espectral que son de las M subbandas.
130. Realizar la modificación respectivamente sobre los valores originales de envolvente de las M subbandas, para adquirir los valores modificados de envolvente de las M subbandas.
140. Realizar la primera asignación de bits sobre las N subbandas según los valores modificados de envolvente de las M subbandas y los valores originales de envolvente de las K subbandas.
En esta realización de la presente invención, la asignación de bits no se realiza de manera directa según los valores originales de envolvente de las N subbandas, en su lugar, se seleccionan M subbandas de una banda baja de frecuencia a partir de las N subbandas, se determina, según una característica de energía y una característica espectral que son de las M subbandas, para realizar una operación de modificación sobre los valores originales de envolvente de las M subbandas, la modificación se realiza respectivamente sobre los valores originales de envolvente de las M subbandas según los valores originales de envolvente de las M subbandas, y se realiza la primera asignación de bits sobre las N subbandas según los valores modificados de envolvente de las M subbandas y los valores originales de envolvente de las K subbandas, de manera que la asignación de bits alcance mejor un requisito de bits de cada subbanda, y por lo tanto, se pueda mejorar el rendimiento de codificación y decodificación de la señal.
Específicamente, en un algoritmo de codificación en el dominio de la frecuencia existente, la asignación de bits se realiza sobre cada subbanda de una señal de manera directa según un tamaño de una envolvente de frecuencia. Como resultado, una cantidad de bits asignados no puede alcanzar bien un requisito de bits de algunas subbandas de una banda de baja frecuencia. Sin embargo, en esta realización de la presente invención, las M subbandas de la banda de baja frecuencia son seleccionadas primero a partir de las N subbandas, se determina, según la característica de energía y la característica espectral que son de las M subbandas, para realizar una operación de modificación sobre los valores originales de la envolvente de las M subbandas, se realiza la modificación sobre los valores originales de envolvente de las M subbandas, se realiza la modificación sobre los valores originales de envolvente de las M subbandas según los valores originales de evolvente de las M subbandas, y después se realiza la primera asignación de bits sobre las N subbandas según los valores modificados de envolvente de las M subbandas y los valores originales de envolvente de las K subbandas. Se puede entender que, en esta realización de la presente invención, la asignación de bits no se realiza de manera directa sobre las N subbandas según los valores originales de envolvente de las N subbandas. En su lugar, la característica de energía y la característica espectral que son de las M subbandas se usan como consideraciones para determinar que la modificación necesita ser realizada sobre las M subbandas, para obtener los respectivos valores modificados de envolvente de las M subbandas, y se realiza la asignación de bits según los valores modificados de envolvente de las subbandas de la banda de baja frecuencia y los valores originales de envolvente de otras subbandas, de manera que la asignación de bits realizada en cada subbanda sea más apropiada, especialmente la realizada sobre las M subbandas de la banda de baja frecuencia, y por lo tanto, se puede mejorar el rendimiento de codificación y decodificación de la señal.
Después de que se dividan los coeficientes espectrales para obtener las N subbandas, se puede calcular y cuantificar una envolvente de cada subbanda. Por lo tanto, cada subbanda tiene un valor cuantificado de envolvente. Se debería entender que el valor original de envolvente es relativo al valor modificado de envolvente, y el valor original de envolvente puede referirse a un valor inicial de envolvente de una subbanda, esto es, un valor cuantificado de envolvente obtenido mediante el cálculo después de la división en subbandas. Un valor de envolvente obtenido después de que el valor inicial de envolvente de la subbanda sea modificado es referido como el valor modificado de envolvente. Por lo tanto, en esta realización de la presente invención, tanto el mencionado valor original de envolvente como el valor modificado de envolvente se refieren a valores cuantificados de envolvente.
De manera opcional, como una realización, en la etapa 110, las M subbandas se pueden seleccionar a partir de las M subbandas según una característica armónica de una subbanda y de la energía de una subbanda. Por ejemplo, para las M subbandas, la intensidad armónica de cada subbanda puede ser mayor que un umbral de intensidad armónica, y una relación de energía de la subbanda con la energía total de las N subbandas es mayor que un umbral de energía preestablecido. Tal como se mencionó anteriormente, las subbandas de una banda de baja frecuencia son generalmente cuellos de botella de rendimiento de codificación de la señal. En estas subbandas, una subbanda que tiene una característica armónica relativamente fuerte y cuya energía cuenta para una proporción específica de energía total de todas las subbandas es particularmente un cuello de botella del rendimiento de codificación. Por lo tanto, después de que se seleccionen M subbandas a partir de las N subbandas según la característica armónica de la subbanda y la energía de la subbanda, y los valores originales de envolvente de las M subbandas se modifiquen, la asignación de bits realizada sobre las M subbandas es más apropiada, y, por lo tanto, la codificación de señal y el rendimiento de decodificación pueden ser mejorados de manera eficiente.
De manera opcional, según otra realización, las N subbandas se pueden disponer en orden ascendente de bandas de frecuencia. De esta manera, en la etapa 110, las primeras M subbandas pueden ser seleccionadas a partir de las N subbandas. En esta realización, las M subbandas se seleccionan en orden ascendente de bandas de frecuencia, lo cual puede simplificar una operación y mejorar la eficiencia del procesamiento de señal.
En la etapa 120, se puede determinar un primer parámetro según los valores originales de envolvente de las N subbandas, donde el primer parámetro puede indicar un grado de concentración que es de energía espectral de la señal y que está sobre las M subbandas. Un segundo parámetro puede ser determinado según los valores originales de envolvente de las M subbandas, donde el segundo parámetro indica un grado de fluctuación espectral de las M subbandas. En un caso en el que el primer parámetro cae dentro de un primer intervalo y el segundo parámetro cae dentro de un segundo intervalo, se puede determinar realizar una operación de modificación sobre los valores originales de envolvente de las M subbandas.
Específicamente, la característica de energía de las M subbandas puede ser el grado de concentración que es la energía espectral de la señal y que está sobre las M subbandas, y la característica espectral de las M subbandas puede ser el grado de fluctuación espectral de las M subbandas.
El primer intervalo se relaciona con la energía de una subbanda, y se puede pre establecer. Cuando el grado de concentración que es de la energía espectral de la señal y que está sobre las M subbandas es relativamente bajo, puede indicar que una relación de las M subbandas a las N subbandas es pequeña, y el rendimiento de codificación no está enormemente afectado. Por lo tanto, no existe necesidad de modificar los valores originales de envolvente de las M subbandas. Cuando el grado de concentración que es de la energía espectral de la señal y que está en las M subbandas es relativamente grande, indica que los valores originales de envolvente de las M subbandas son también relativamente grandes. Por lo tanto, una cantidad de bits asignados a las M subbandas es suficiente para codificar, y no existe tampoco necesidad de modificar los valores originales de envolvente de las M subbandas. El primer intervalo se puede predeterminar por medio de simulación experimental. Por ejemplo, el primer intervalo puede preestablecerse a [1/6, 2/3].
El segundo intervalo está relacionado con un grado de fluctuación espectral de una subbanda, y puede ser preestablecido. Si el grado de fluctuación espectral de las M subbandas es bajo, el rendimiento de codificación no está enormemente afectado incluso si la cantidad de bits asignados a la M subbanda es pequeña. De esta manera, no existe necesidad de modificar los valores originales de envolvente de las M subbandas. Por lo tanto, el segundo intervalo indica que el grado de fluctuación espectral de las subbandas es relativamente alto. El segundo intervalo puede estar predeterminado por medio de simulación experimental. Por ejemplo, el segundo intervalo puede estar 1 1
prees ,tab ,,lecido a r L 0.575 * M ’ oot oL r 0.5 ^ M *0 De manera general, si en una señal, el ancho de banda que se
puede usar para codificar es de 0 a 4 KHZ, el segundo intervalo se puede preestablecer a
Figure imgf000006_0001
M °°); si en una señal, el ancho de banda que se puede usar para codificar es de 0 a 8KHz, el segundo intervalo se puede
preestablecer
Figure imgf000006_0002
Cuando el primer parámetro cae dentro del primer intervalo y el segundo parámetro cae dentro del segundo intervalo, significa que el grado de concentración que es de la energía espectral de la señal y que está en las M subbandas no es extremadamente alto ni extremadamente bajo, y que el grado de fluctuación espectral de las M subbandas es relativamente alto, y se puede realizar una modificación sobre los valores originales de envolvente de las M subbandas, de manera tal que los bits asignados a las M subbandas durante la primera asignación de bits de las M subbandas alcancen mejor un requisito de bits de las M subbandas. Por ejemplo, para cada subbanda en las M subbandas, un valor modificado de envolvente es mayor que un valor original de envolvente. Entonces, comparado con realizar la primera asignación de bits según los valores originales de envolvente de las M subbandas, realizar la primera asignación de bits según los valores modificados de envolvente de las M subbandas, hace que la cantidad de bits asignados a las M subbandas sea mayor, y por lo tanto, se puede mejorar el rendimiento de codificación de las M subbandas.
Se puede entender que, en esta realización, el primer parámetro y el segundo parámetro que se determinan según los valores originales de envolvente de las N subbandas pueden reflejar una característica de cada banda de frecuencia. Por lo tanto, en el caso en que el primer parámetro cae dentro del primer intervalo y el segundo parámetro cae dentro del segundo intervalo, se determina realizar una operación de modificación sobre los valores originales de envolvente de las M subbandas, de manera que cuando la asignación de bits se realiza de manera posterior según los valores modificados de envolvente de las M subbandas, una cantidad de bits asignados a las M subbandas alcanza mejor un requisito de bits de las M subbandas, y por lo tanto, se puede mejorar el rendimiento de codificación y decodificación.
De manera opcional, como otra realización, en la etapa 120, la energía total de las M subbandas puede ser determinada según los valores originales de envolvente de las M subbandas. La energía total de las K subbandas se puede determinar según los valores originales de envolvente de las K subbandas. Se puede determinar una relación de la energía total de las M subbandas con la energía total de las K subbandas como el primer parámetro.
De manera específica, se puede determinar la relación de la energía total de las M subbandas con la energía total de las K subbandas como el primer parámetro.
Por ejemplo, el primer parámetro puede ser obtenido mediante el cálculo según las ecuaciones siguientes, donde el primer parámetro puede ser representado por a:
Figure imgf000007_0001
banda'
, donde
Epm puede representar la energía total de las M subbandas, Epk puede representar la energía total de las K subbandas, ancho_bandai representa el ancho de banda de la i-ésima subbanda, y energía_bandai puede representar la energía de la i-ésima subbanda. Energía_bandai puede representar un valor original de envolvente de la i-ésima subbanda. Por ejemplo, el valor original de envolvente energía_bandai de la i-ésima subbanda se puede obtener según un coeficiente espectral de la i-ésima subbanda. Por ejemplo, energía_bandai se puede obtener según las siguientes ecuaciones:
energía_banda¡= log2 E¡, y
ancho_banda¡
Ei - y ' t _ audidjj] * t _ audi({j\
i=1
Se debería entender que las personas expertas en la técnica evidentemente pueden realizar diversas modificaciones o cambios equivalentes según las ecuaciones anteriores, para obtener el primer parámetro, y dichas modificaciones o cambios caen también dentro de esta realización de la presente invención.
De manera opcional, según otra realización, en la etapa 120, según los valores originales de envolvente de las M subbandas, se puede determinar la energía total de las M subbandas, y se puede determinar la energía de una primera subbanda, donde la energía de la primera subbanda es la mayor de las de las M subbandas. Se puede determinar una relación de la energía de la primera subbanda con la energía total de las M subbandas como el segundo parámetro.
De manera específica, el grado de fluctuación espectral de las M subbandas puede estar indicado mediante el uso de un grado de fluctuación de los valores originales de envolvente de las M subbandas. Por ejemplo, el segundo parámetro puede ser obtenido mediante el cálculo según las siguientes ecuaciones, donde el segundo parámetro puede estar representado por p:
Figure imgf000008_0001
donde
para formas de cálculo de
Figure imgf000008_0002
se puede hacer referencia a las ecuaciones anteriores.
Se debería entender que las personas expertas en la técnica pueden evidentemente hacer diversas modificaciones o cambios equivalentes según las ecuaciones anteriores, para obtener el segundo parámetro, y dichas modificaciones o cambios caen también dentro del alcance de esta realización de la presente invención.
De manera opcional, como otra realización, en la etapa 130, la energía total de las M subbandas y la energía de una primera banda pueden ser determinadas según los valores originales de envolvente de las M subbandas, donde la energía de la primera subbanda es la mayor de las de las M subbandas. Se puede determinar un factor de modificación según la energía total de las M subbandas y la energía de la primera subbanda. Entonces, se puede realizar la modificación respectivamente sobre los valores originales de envolvente de las M subbandas mediante el uso del factor de modificación, para adquirir los valores modificados de envolvente de las M subbandas.
Por ejemplo, el factor de modificación se puede determinar según las siguientes ecuaciones, donde el factor de modificación puede estar representado por y:
Figure imgf000008_0003
donde
para las formas de cálculo de E p-ímP¡ y E pm t se puede hacer referencia a las anteriores ecuaciones.
Se puede realizar una modificación sobre un valor original de envolvente de cada subbanda en las M subbandas según el factor de modificación y. Por ejemplo, el valor original de envolvente de cada subbanda puede estar multiplicado por el factor de multiplicación, para obtener un valor modificado de envolvente de la subbanda.
Se debería entender que las personas expertas en la técnica pueden evidentemente hacer diversas modificaciones o cambios equivalentes según las ecuaciones anteriores, para obtener el segundo parámetro, y dichas modificaciones o cambios caen también dentro del alcance de esta realización de la presente invención.
De manera opcional, como otra realización, en la etapa 130, un valor modificado de envolvente de cada subbanda en las M subbandas puede ser mayor que un valor original de envolvente de la subbanda.
De manera específica, el valor modificado de envolvente de cada subbanda en las M subbandas se obtiene realizando la modificación sobre un valor original de envolvente de cada subbanda en las M subbandas. El valor modificado de envolvente de cada subbanda puede ser mayor que el valor original de envolvente de la subbanda. Si el valor modificado de envolvente de cada subbanda en las M subbandas es mayor que el valor original de envolvente de la subbanda, en la etapa 140, la asignación de bits se realiza según los valores modificados de envolvente de las M subbandas. De esta manera, una cantidad de bits asignados a cada subbanda en las M subbandas aumenta de manera que la asignación de bits alcance mejor un requisito de bits de cada subbanda, y por lo tanto, se pueda mejorar el rendimiento de codificación y decodificación de la señal.
De manera opcional, como otra realización, en la etapa 130, un valor modificado de envolvente de cada subbanda en las M subbandas puede ser menor que un valor original de envolvente de la subbanda.
De manera específica, si el valor modificado de envolvente de cada subbanda en las M subbandas es menor que el valor original de envolvente, en la etapa 140, se realiza la asignación de bits según los valores modificados de envolvente de las M subbandas y los valores originales de envolvente de las K subbandas. De esta manera, una cantidad de bits asignados a cada subbanda en las M subbandas es relativamente pequeña, y por consiguiente, las cantidades de bits respectivamente asignados a las K subbandas aumentan, de manera que la asignación de bits alcance mejor un requisito de bits de cada subbanda, y por lo tanto, se pueda mejorar el rendimiento de codificación y decodificación de la señal.
De manera opcional, según otra realización, en la etapa 130, se puede realizar la primera asignación de bits sobre las N subbandas en orden descendente de valores de envolvente.
De manera opcional, según otra realización, en la etapa 130, se puede determinar un factor de modificación según el segundo parámetro. Entonces, se puede realizar la modificación respectivamente sobre los valores originales de envolvente de las M subbandas mediante el uso del factor de modificación, para adquirir los valores modificados de envolvente de las M subbandas.
De manera específica, el factor de modificación puede estar determinado según el segundo parámetro. Se puede realizar la modificación sobre un valor original de envolvente de cada subbanda en las M subbandas según el factor de modificación. Por ejemplo, el valor original de envolvente de cada subbanda puede estar multiplicado por el factor de modificación para obtener un valor modificado de envolvente de la subbanda, de manera tal que los bits asignados a las M subbandas alcancen mejor un requisito de bits de las M subbandas, y por lo tanto, se pueda mejorar el rendimiento de codificación y decodificación de la señal.
Después de que se realice la primera asignación de bits, generalmente, existen bits redundantes en los bits asignados a cada subbanda. Los bits redundantes de cada subbanda no son suficientes para codificar una unidad de información de la subbanda. Por lo tanto, se pueden contar las cantidades de bits redundantes de todas las subbandas para obtener una cantidad total de bits redundantes, y después se realiza la segunda asignación de bits. De manera opcional, como otra realización, después de la etapa 140, se puede determinar una cantidad de bits redundantes de cada subbanda en las N subbandas según las cantidades de bits respectivamente asignados a las N subbandas durante la primera asignación de bits. Donde la cantidad de bits redundantes de cada subbanda en las N subbandas es menor que una cantidad de bits requerida para codificar en la misma subbanda. Una cantidad total de bits redundantes puede ser determinada según la cantidad de bits redundantes de cada subbanda en las N subbandas. Después, se puede realizar la segunda asignación de bits sobre las N subbandas según la cantidad total de bits redundantes.
Específicamente, los bits redundantes totales se pueden asignar igualmente a las N subbandas. De esta manera, los bits redundantes se pueden volver a usar, para evitar un desperdicio de bits y para mejorar aún más el rendimiento de codificación y decodificación de la señal.
Lo anterior describe un proceso de una primera asignación de bits y una segunda asignación de bits. Si el método anterior en la FIG. 1 es ejecutado por un lado codificador, después de la segunda asignación de bits, el lado codificador puede cuantificar un coeficiente espectral de cada subbanda mediante el uso de una cantidad de bits asignados a cada subbanda en un proceso de asignación de bits en dos tiempos, escribir un índice de un coeficiente espectral cuantificado y un índice de un valor original de envolvente de cada subbanda en un flujo de bits, y después enviar el flujo de bits a un lado decodificador.
Si el método anterior en la FIG. 1 es ejecutado por un lado decodificador, después de la segunda asignación de bits, el lado decodificador puede decodificar un coeficiente espectral cuantificado mediante el uso de una cantidad de bits asignados a cada subbanda en un proceso de asignación en dos tiempos, para obtener una señal recuperada. Lo siguiente describe realizaciones de la presente invención en detalle con referencia a los ejemplos específicos. Se debería entender que, estos ejemplos están simplemente destinados a ayudar a personas expertas en la técnica a entender mejor las realizaciones de la presente invención.
En los ejemplos siguientes, se usa un lado codificador como un ejemplo de descripción.
La FIG. 2 es un diagrama de flujo esquemático de un proceso de un método de procesamiento de señal según una realización de la presente invención.
201. Un lado codificador realiza la transformación tiempo-frecuencia en una señal en el dominio del tiempo.
202. El lado codificador divide los coeficientes espectrales de una señal en el dominio de la frecuencia en N subbandas, donde N es un número entero positivo mayor que 1.
Específicamente, el lado codificador puede calcular una ganancia global; la ganancia global se usa para realizar la normalización sobre un coeficiente espectral original; después, se realiza la división sobre un coeficiente espectral normalizado para obtener todas las subbandas.
203. El lado codificador obtiene un valor original de envolvente de cada subbanda por medio de una operación de cálculo y una operación de cuantificación.
204. El lado codificador selecciona M subbandas a partir de las N subbandas, donde M es un número entero positivo.
Una banda de frecuencia de las M subbandas es inferior que una banda de frecuencia de las K subbandas en las N subbandas excepto las M subbandas, donde K es un número entero positivo, y la suma de K y M es N.
205. El lado codificador determina un primer parámetro según los valores originales de envolvente de las M subbandas y los valores originales de envolvente de las K subbandas.
El primer parámetro puede indicar un grado de concentración que es de energía espectral de la señal y que está en las M subbandas. Por ejemplo, se puede usar una relación de la energía total de las M subbandas con la energía total de las K subbandas para indicar el primer parámetro. Para una forma de cálculo del primer parámetro, se puede hacer referencia a la forma de cálculo del primer parámetro en la realización de la FIG. 1, y los detalles no se describen de nuevo.
206. El lado codificador determina un segundo parámetro según los valores originales de envolvente de las M subbandas.
El segundo parámetro puede indicar un grado de fluctuación espectral de las M subbandas. Por ejemplo, se puede usar una relación de energía de una primera subbanda a la energía total de las M subbandas para indicar el segundo parámetro, donde la energía de la primera subbanda es la mayor de las M subbandas. Para una forma de cálculo del segundo parámetro, se puede hacer referencia a la forma de cálculo del segundo parámetro en la realización de la FIG. 1, y los detalles no se describen de nuevo.
207. El lado codificador determina si el primer parámetro cae dentro de un primer intervalo y si el segundo parámetro cae dentro de un segundo intervalo.
El primer intervalo y el segundo intervalo pueden estar preestablecidos. Por ejemplo, el primer intervalo puede estar 1 I preestablecido a [1/6, 2/3], El segundo intervalo puede estar preestablecido a r L 0 ' 515*M x ) \ oL r 0 • 5* J M ' cc \/. 208. Si el lado codificador determina que el primer parámetro cae dentro del primer intervalo y el segundo parámetro cae dentro del segundo intervalo en la etapa 207, modificar los valores originales de envolvente de las M subbandas según los valores originales de envolvente de las M subbandas, para obtener los valores modificados de envolvente de las M subbandas.
De manera específica, el lado codificador puede determinar un factor de modificación según los valores originales de envolvente de las M subbandas. Para una forma de cálculo del factor de modificación, se puede hacer referencia al proceso en la realización de la FIG. 1, y los detalles no se describen de nuevo. El lado codificador puede realizar la modificación sobre un valor original de envolvente de cada subbanda en las M subbandas mediante el uso del factor de modificación, para obtener los valores modificados de envolvente de las M subbandas. Por ejemplo, un valor modificado de envolvente de cada subbanda puede ser mayor que el valor original de envolvente de la subbanda. 209. El lado codificador realiza la primera asignación de bits sobre las N subbandas según los valores modificados de envolvente de las M subbandas y los valores originales de envolvente de las K subbandas.
Por ejemplo, el lado codificador puede realizar la primera asignación de bits sobre las N subbandas en orden descendente de valores de envolvente. Para las M subbandas, ya que el valor modificador de envolvente de cada subbanda es mayor que el valor original de envolvente de la subbanda, comparado con una cantidad de bits asignados antes de la modificación, una cantidad de bits asignados a cada subbanda en las M subbandas aumenta, de manera que la asignación de bits alcanza mejor un requisito de bits de cada subbanda, mejorando de este modo el rendimiento de codificación y decodificación de la señal.
210. El lado codificador realiza la segunda asignación de bits sobre las N subbandas.
Específicamente, el lado codificador puede determinar una cantidad de bits redundantes de cada subbanda según una cantidad de bits asignados a cada subbanda en las N subbandas después de la primera asignación de bits y de ancho de banda de cada subbanda, para determinar una cantidad total de bits redundantes de las N subbandas. Después, los bits redundantes totales se asignan igualmente a las N subbandas según la cantidad total de bits redundantes.
211. El lado codificador cuantifica un coeficiente espectral de cada subbanda según una cantidad de bits asignados a cada subbanda en las N subbandas.
212. El lado codificador escribe un flujo de bits según un coeficiente espectral cuantificado obtenido en la etapa 211 y un valor original de envolvente de cada subbanda.
De manera específica, el lado codificador puede escribir índices del coeficiente espectral cuantificado, el valor original de envolvente de cada subbanda, y similares dentro del flujo de bits. Para un proceso específico, se puede hacer referencia a la técnica anterior, y los detalles no se describen en la presente memoria de nuevo.
213. Si el lado codificador determina que el primer parámetro cae fuera del primer intervalo o el segundo parámetro cae fuera del segundo intervalo en la etapa 207, el lado codificador realiza la primera la asignación de bits sobre las N subbandas según los valores originales de envolvente de las N subbandas.
Por ejemplo, el lado codificador puede realizar la primera asignación de bits sobre las N subbandas en orden descendente de valores de envolvente.
214. El lado codificador realiza la segunda asignación de bits sobre las N subbandas.
Específicamente, el lado codificador puede determinar una cantidad de bits redundantes de cada subbanda según una cantidad de bits asignados a cada subbanda en las N subbandas después de la primera asignación de bits y el ancho de banda de cada subbanda, para determinar una cantidad total de bits redundantes de las N subbandas. Después, los bits redundantes totales se asignan igualmente a las N subbandas según la cantidad total de los bits redundantes.
215. El lado codificador cuantifica un coeficiente espectral de cada subbanda según una cantidad de bits asignados a cada subbanda en las N subbandas.
216. El lado codificador escribe un flujo de bits según un coeficiente espectral cuantificado obtenido en la etapa 215 y un valor original de envolvente de cada subbanda.
De manera específica, el lado codificador puede escribir los índices del coeficiente espectral cuantificado, el valor original de envolvente de cada subbanda, y similares dentro del flujo de bits. Para un proceso específico, se puede hacer referencia a la técnica anterior, y los detalles no se describen en la presente memoria de nuevo.
En esta realización de la presente invención, en un caso en el que un primer parámetro cae dentro de un primer intervalo y un segundo parámetro cae dentro de un segundo intervalo, se realiza la modificación sobre los valores originales de envolvente de las M subbandas de una banda de baja frecuencia según los valores originales de envolvente de las M subbandas, y la primera asignación de bits se realiza sobre las N subbandas según los valores modificados de envolvente de las M subbandas y los valores originales de envolvente de las K subbandas, de manera tal que la asignación de bits alcance mejor un requisito de bits de cada subbanda, y por lo tanto, se pueda mejorar el rendimiento de codificación y decodificación de la señal.
La FIG. 3 es un diagrama de bloques esquemático de un dispositivo de procesamiento de señal según una realización de la presente invención. Un dispositivo 300 en la FIG. 3 puede ser un dispositivo del lado codificador o un dispositivo del lado decodificador. El dispositivo 300 en la FIG. 3 incluye una unidad 310 de selección, una unidad 320 determinación, una unidad 330 de modificación, y una unidad 340 de asignación.
La unidad 310 de selección selecciona M subbandas de las N subbandas, donde las N subbandas son obtenidas mediante la división de los coeficientes espectrales de una trama actual de una señal, una banda de frecuencia de las M subbandas es inferior que una banda de frecuencia de las K subbandas en las N subbandas excepto las M subbandas, N es un número entero positivo mayor que 1, tanto M como K son número enteros positivos, y la suma de M y K es N. La unidad 320 de determinación determina, según la información de rendimiento de las M subbandas, realizar una operación de modificación sobre los valores originales de envolvente de las M subbandas, donde la información de rendimiento se usa para indicar una característica de energía y una característica espectral que sean de las M subbandas. La unidad 330 de modificación realiza la modificación respectivamente sobre los valores originales de envolvente de las M subbandas, para adquirir los valores modificados de envolvente de las M subbandas. La unidad 340 realiza la primera asignación de bits sobre las N subbandas según los valores modificados de envolvente de las M subbandas y los valores originales de envolvente de las K subbandas.
En esta realización de la presente invención, la asignación de bits no se realiza directamente según los valores originales de envolvente de las N subbandas; en su lugar, las M subbandas de una banda de baja frecuencia se seleccionan de las N subbandas, se determina, según una característica de energía y una característica espectral que son de las M subbandas, para realizar una operación de modificación sobre los valores de envolvente originales de las M subbandas, la modificación se realiza respectivamente sobre los valores originales de envolvente de las M subbandas según los valores originales de envolvente de las M subbandas, y se realiza la primera asignación de bits sobre las N subbandas según los valores modificados de envolvente de las M subbandas y los valores originales de envolvente de las K subbandas, de manera que la asignación de bits alcanza mejor un requisito de bits de cada subbanda, y por lo tanto, el rendimiento de codificación y decodificación puede ser mejorado.
La unidad 320 de determinación puede determinar un primer parámetro según los valores originales de envolvente de las N subbandas, donde el primer parámetro indica un grado de concentración que es de energía espectral de la señal y que está sobre las M subbandas. La unidad 320 de determinación puede determinar un segundo parámetro según los valores originales de envolvente de las M subbandas, donde el segundo parámetro indica un grado de fluctuación espectral de las M subbandas. La unidad 320 de determinación puede determinar, en el caso en que el primer parámetro cae dentro de un primer intervalo y el segundo parámetro cae dentro de un segundo intervalo, realizar la operación de modificación sobre los valores originales de envolvente de las M subbandas.
De manera opcional, como otra realización, la unidad 320 de determinación puede determinar la energía total de las M subbandas según los valores originales de envolvente de las M subbandas, puede determinar la energía total de las K subbandas según los valores originales de envolvente de las K subbandas, y puede determinar una relación de la energía total de las M subbandas con la energía total de las K subbandas como el primer parámetro.
De manera opcional, como otra realización, la unidad 320 de determinación puede determinar la energía total de las M subbandas y la energía de una primera banda según los valores originales de envolvente de las M subbandas, donde la energía de la primera subbanda es la mayor de las M subbandas. La unidad 320 de determinación puede determinar una relación de la energía de la primera subbanda con la energía total de las M subbandas como el segundo parámetro.
De manera opcional, como otra realización, la unidad 330 de modificación puede determinar la energía total de las M subbandas y la energía de una primera subbanda según los valores originales de envolvente de las M subbandas, donde la energía de la primera subbanda es la mayor de las M subbandas. La unidad 330 de modificación puede determinar un factor de modificación según la energía total de las M subbandas y la energía de la primera subbanda, y puede realizar la modificación respectivamente sobre los valores originales de envolvente de las M subbandas mediante el uso del factor de modificación, para adquirir los valores modificados de envolvente de las M subbandas. De manera opcional, como otra realización, un valor modificado de envolvente de cada subbanda en las M subbandas puede ser mayor que un valor original de envolvente de la misma subbanda.
De manera opcional, como otra realización, la unidad 320 de determinación puede determinar además una cantidad de bits redundantes de cada subbanda en las N subbandas según las cantidades de bits respectivamente asignados a las N subbandas durante la primera asignación de bits, donde la cantidad de bits redundantes de cada subbanda en las N subbandas es menor que una cantidad de bits requerida para codificar una única unidad de información en la misma subbanda. La unidad 320 de determinación puede determinar además una cantidad total de bits redundantes según la cantidad de bits redundantes de cada subbanda en las N subbandas. La unidad 340 de asignación puede realizar además una segunda asignación de bits sobre las N subbandas según los valores modificados de envolvente de las M subbandas, los valores originales de envolvente de las K subbandas, y la cantidad total de bits redundantes.
Para otras funciones y operaciones del dispositivo 300, se puede hacer referencia a los procesos de las realizaciones del método en la FIG. 1 y la f Ig . 2. Para evitar la repetición, no se describen los detalles en la presente memoria de nuevo.
La FIG. 4 es un diagrama de bloques esquemático de un dispositivo de procesamiento de señal según otra realización de la presente invención. Un dispositivo 400 en la FIG. 4 puede ser un dispositivo de lado codificador o un dispositivo de lado decodificador. El dispositivo 400 en la FIG. 4 incluye una memoria 410 y un procesador 420. La memoria 410 puede incluir una memoria de acceso aleatorio, una memoria flash, una memoria de sólo lectura, una memoria de sólo lectura programable, una memoria no volátil, un registro, o similar. El procesador 420 puede ser una unidad central de procesamiento (Unidad Central de Procesamiento, CPU).
La memoria 410 se configura para almacenar una instrucción ejecutable. El procesador 420 puede ejecutar la instrucción ejecutable almacenada en la memoria 410, para: seleccionar M subbandas de las N subbandas, donde las N subbandas se obtienen mediante la división de los coeficientes espectrales de una trama actual de una señal, una banda de frecuencia de las M subbandas es inferior que una banda de frecuencia de las K subbandas en las N subbandas excepto las M subbandas, N es un número entero positivo mayor que 1, tanto M como K son números enteros positivos, y la suma de M y K es N; determinar, según la información de rendimiento de las M subbandas, realizar una operación de modificación sobre los valores originales de envolvente de las M subbandas, donde la información de rendimiento se usa para indicar una característica de energía y una característica espectral que sean de las M subbandas; realizar la modificación respectivamente sobre los valores originales de envolvente de las M subbandas, para adquirir los valores modificados de envolvente de las M subbandas; y realizar la primera asignación de bits sobre las N subbandas según los valores modificador de envolvente de las M subbandas y los valores originales de envolvente de las K subbandas.
En esta realización de la presente invención, la asignación de bits no es realizada directamente según los valores originales de envolvente de las N subbandas; en su lugar, las M subbandas de una banda de baja frecuencia se seleccionan de las N subbandas, se determina, según una característica de energía y una característica espectral que son de las M subbandas, realizar una operación de modificación sobre los valores originales de envolvente de las M subbandas, la modificación es realizada respectivamente sobre los valores originales de envolvente de las M subbandas según los valores originales de envolvente de las M subbandas, y se realiza la primera asignación de bits sobre las N subbandas según los valores modificados de envolvente de las M subbandas y los valores originales de envolvente de las K subbandas, de manera que la asignación de bits alcanza mejor un requisito de bits de cada subbanda, y por lo tanto, se pueda mejorar el rendimiento de codificación y decodificación.
El procesador 420 puede determinar un primer parámetro según los valores originales de envolvente de las N subbandas, donde el primer parámetro indica un grado de concentración que es de energía espectral de la señal y que está sobre las M subbandas. El procesador 420 puede determinar un segundo parámetro según los valores originales de envolvente de las M subbandas, donde el segundo parámetro indica un grado de fluctuación espectral de las M subbandas. El procesador 420 puede determinar, en el caso de que el primer parámetro cae dentro de un primer intervalo y el segundo parámetro cae dentro de un segundo intervalo, realizar la operación de modificación sobre los valores originales de envolvente de las M subbandas.
De manera opcional, como otra realización, el procesador 420 puede determinar la energía total de las M subbandas según los valores originales de envolvente de las M subbandas, puede determinar la energía total de las K subbandas según los valores originales de envolvente de las K subbandas, y puede determinar una relación de la energía total de las M subbandas con la energía total de las K subbandas como el primer parámetro.
De manera opcional, como otra realización, el procesador 420 puede determinar la energía total de las M subbandas y la energía de una primera subbanda según los valores originales de envolvente de las M subbandas, donde la energía de la primera subbanda es la mayor de las M subbandas. El procesador 420 puede determinar una relación de la energía de la primera subbanda con la energía total de las M subbandas como el segundo parámetro.
De manera opcional, como otra realización, el procesador 420 puede determinar la energía total de las M subbandas y la energía de una primera subbanda según los valores originales de envolvente de las M subbandas, donde la energía de la primera subbanda es la mayor de las M subbandas. El procesador 420 puede determinar el factor de modificación según la energía total de las M subbandas y la energía de la primera subbanda, y puede realizar la modificación respectivamente sobre los valores originales de envolvente de las M subbandas mediante el uso del factor de modificación, para adquirir los valores modificados de envolvente de las M subbandas.
De manera opcional, como otra realización, un valor modificado de envolvente de cada subbanda en las M subbandas puede ser mayor que un valor original de envolvente de la misma subbanda.
De manera opcional, como otra realización, el procesador 420 puede determinar además una cantidad de bits redundantes de cada subbanda en las N subbandas según las cantidades de bits respectivamente asignados a las N subbandas durante la primera asignación de bits, donde la cantidad de bits redundantes de cada subbanda en las N subbandas es menor que una cantidad de bits requerida para codificar una unidad única de información en la misma subbanda. El procesador 420 puede además determinar una cantidad total de bits redundantes según la cantidad de bits redundantes de cada subbanda en las N subbandas. El procesador 420 puede realizar además la segunda asignación de bits sobre las N subbandas según los valores modificados de envolvente de las M subbandas, los valores originales de envolvente de las K subbandas, y la cantidad total de bits redundantes.
Paras otras funciones y operaciones del dispositivo 400, se hace referencia a los procesos de las realizaciones del método en la FIG. 1 y la FIG. 2. Para evitar la repetición, no se describen los detalles en la presente memoria de nuevo.
Las personas de experiencia ordinaria en la técnica pueden ser conscientes de que, en combinación con los ejemplos descritos en las realizaciones descritas en esta especificación, las unidades y etapas de algoritmo pueden ser implementadas por hardware electrónico o una combinación de software informático y hardware electrónico. Si las funciones son realizadas por hardware o software depende de las aplicaciones particulares y las condiciones de restricción del diseño de las soluciones técnicas. Las personas expertas en la técnica pueden usar diferentes métodos para implementar las funciones descritas para cada aplicación concreta, pero no se debería considerar que la implementación va más allá del alcance de la presente invención.
Puede ser claramente entendido por las personas expertas en la técnica que, con el propósito de una descripción breve y conveniente, para un proceso de trabajo detallado del sistema, aparato, y unidad anterior, se puede hacer referencia a un proceso correspondiente en las realizaciones del método anteriores, y los detalles no se describen en la presente memoria de nuevo.
En las diversas realizaciones proporcionadas en la presente solicitud, se debería entender que el sistema, aparato, y método descritos pueden ser implementados de otras formas. Por ejemplo, la realización del aparato descrita es simplemente ejemplar. Por ejemplo, la división unitaria es simplemente una división de función lógica y puede ser otra división en una implementación real. Por ejemplo, una pluralidad de unidades o componentes se pueden combinar o integrar en otro sistema, o algunas características se pueden ignorar o no realizar. Además, los acoplamientos mutuos presentados o discutidos o los acoplamientos directos o las conexiones de comunicación pueden estar implementadas mediante el uso de algunas interfaces. Los acoplamientos indirectos o las conexiones de comunicación entre los aparatos o unidades se pueden implementar en forma electrónica, mecánica, u otra. Las unidades descritas como partes separadas pueden estar o no físicamente separadas, y las partes presentadas como unidades pueden ser o no unidades físicas, puede estar ubicadas en una posición, o pueden estar distribuidas en una pluralidad de unidades de red. Algunas o todas las unidades se pueden seleccionar según las necesidades reales para alcanzar los objetivos de las soluciones de las realizaciones.
Además, las unidades funcionales en las realizaciones de la presente invención se pueden integrar dentro de una unidad de procesamiento, o cada una de las unidades puede existir físicamente sola, o dos o más unidades se integran en una unidad.
Cuando las funciones se implementan en la forma de una unidad funcional de software y es vendida o usada como un producto independiente, las funciones se pueden almacenar en un medio de almacenamiento legible por ordenador. En base a dicho conocimiento, las soluciones técnicas de la presente invención esencialmente, o la parte que contribuye a la técnica anterior, o alguna de las soluciones técnicas se pueden implementar en una forma de un producto de software. El producto de software informático se almacena en un medio de almacenamiento, e incluye diversas instrucciones para dar instrucciones a un dispositivo informático (que puede ser un ordenador personal, un servidor, un dispositivo de red, o similar) para realizar todas o algunas de las etapas de los métodos descritos en las realizaciones de la presente invención. El medio de almacenamiento anterior incluye: cualquier medio que pueda almacenar código de programa, tal como una unidad flash USB, un disco duro extraíble, una memoria de sólo lectura (ROM; Memoria de Sólo Lectura), una memoria de acceso aleatorio (RAM; Memoria de Acceso Aleatorio), un disco magnético, o un disco óptico.
Las descripciones anteriores son simplemente formas de implementación específicas de la presente invención, pero no están destinadas a limitar la presente invención.

Claims (14)

REIVINDICACIONES
1. Un método de procesamiento de señal para procesar una señal, en donde la señal es una señal de audio o una señal de voz, comprendiendo el método de procesamiento de señal:
seleccionar (110) las primeras M subbandas de las N subbandas, en donde las N subbandas son obtenidas mediante la división de los coeficientes espectrales de una trama actual de la señal y se disponen en orden ascendente de bandas de frecuencia;
determinar (120), según una característica de energía y una característica espectral de las M subbandas, para realizar una operación de modificación sobre los valores originales de envolvente de las M subbandas; realizar (130) la modificación sobre los valores originales de envolvente de las M subbandas, para adquirir valores modificados de envolvente de las M subbandas; y
realizar (140) la primera asignación de bits sobre las N subbandas según los valores modificados de envolvente de las M subbandas y los valores originales de envolvente de las otras K subbandas de las N subbandas, en donde N es un número entero positivo mayor que 1, tanto M como K son números enteros positivos, y la suma de M y K es N; caracterizado por que la etapa de determinación (120), según una característica de energía y una característica espectral de las M subbandas, para realizar una operación de modificación sobre los valores originales de envolvente de las M subbandas comprende:
determinar la característica de energía de las M subbandas según los valores originales de envolvente de las N subbandas, en donde la característica de energía de las M subbandas indica un grado de concentración que es de energía espectral de la trama actual de la señal y que está sobre las M subbandas;
determinar la característica espectral de las M subbandas según los valores originales de envolvente de las M subbandas, en donde la característica espectral de las M subbandas indica un grado de fluctuación espectral de las M subbandas; y
determinar, cuando la característica de energía de las M subbandas cae dentro de un primer intervalo y la característica espectral de las M subbandas cae dentro de un segundo intervalo, realizar la operación de modificación sobre los valores originales de envolvente de las M subbandas.
2. El método según la reivindicación 1, en donde el primer intervalo es [1/6, 2/3].
1 1
3. El método según la reivindicación 1 o 2, en donde el segundo intervalo es t M 20) o [ M cc).
4. El método según una cualquiera de las reivindicaciones 1 a 3, en donde la etapa de determinación de una característica de energía de las M subbandas según los valores originales de envolvente de las N subbandas comprende:
determinar la energía total de las M subbandas según los valores originales de envolvente de las M subbandas; determinar la energía total de las K subbandas según los valores originales de envolvente de las K subbandas; y determinar una relación de la energía total de las M subbandas con la energía total de las K subbandas como la característica de energía de las M subbandas.
5. El método según una cualquiera de las reivindicaciones 1 a 4, en donde la etapa de determinación de una característica espectral de las M subbandas según los valores originales de envolvente de las M subbandas comprende:
determinar la energía total de las M subbandas y la energía de una primera subbanda según los valores originales de envolvente de las M subbandas, en donde la energía de la primera subbanda es la mayor de las M subbandas; y determinar una relación de la energía de la primera subbanda con la energía total de las M subbandas como la característica espectral de las M subbandas.
6. El método según una cualquiera de las reivindicaciones 1 a 5, en donde la etapa de realización (130) de la modificación sobre los valores originales de envolvente de las M subbandas, para adquirir los valores modificados de envolvente de las M subbandas comprende:
determinar la energía total de as M subbandas y la energía de la primera subbanda según los valores originales de envolvente de las M subbandas, en donde la energía de la primera subbanda es la mayor de las M subbandas; determinar un factor de modificación según la energía total de las M subbandas y la energía de la primera subbanda; y
realizar la modificación sobre los valores originales de envolvente de las M subbandas mediante el uso del factor de modificación, para adquirir los valores modificados de envolvente de las M subbandas.
7. El método según una cualquiera de las reivindicaciones 1 a 6, en donde un valor modificado de envolvente de cada subbanda en las M subbandas es mayor que un valor original de envolvente de la misma subbanda.
8. Un dispositivo (300) de procesamiento de señal para procesar una señal, en donde la señal es una señal de audio o una señal de voz, comprendiendo el aparato de procesamiento de señal:
una unidad (310) de selección, configurada para seleccionar las primeras M subbandas de las N subbandas, en donde las N subbandas son obtenidas mediante la división de los coeficientes espectrales de una trama actual de la señal y se disponen en orden ascendente de bandas de frecuencia;
una unidad (320) de determinación, configurada para determinar, según una característica de energía y una característica espectral de las M subbandas, para realizar una operación de modificación sobre los valores originales de envolvente de las M subbandas;
una unidad (330) de modificación, configurada para realizar la modificación sobre los valores originales de envolvente de las M subbandas, para adquirir los valores modificados de envolventes de las M subbandas; y una unidad (340) de asignación, configurada para realizar la primera asignación de bits sobre las N subbandas según los valores modificados de envolvente de las M subbandas y los valores originales de envolvente de las otras K subbandas de las N subbandas, en donde N es un número entero positivo mayor que 1, tanto M como K son números enteros positivos, y la suma de M y K es N;
caracterizado por que la unidad (320) de determinación se configura específicamente para:
determinar la característica de energía de las M subbandas según los valores originales de envolvente de las N subbandas, en donde la característica de energía de las M subbandas indica un grado de concentración que es de energía espectral de la trama actual de la señal y que está sobre las M subbandas;
determinar la característica espectral de las M subbandas según los valores originales de envolvente de las M subbandas, en donde la característica espectral de las M subbandas indica un grado de fluctuación espectral de las M subbandas; y
determinar, cuando la característica de energía de las M subbandas cae dentro de un primer intervalo y la característica espectral de las M subbandas cae dentro de un segundo intervalo, realizar la operación de modificación sobre los valores originales de envolvente de las M subbandas.
9. El dispositivo (300) según la reivindicación 8, en donde el primer intervalo es [1/6, 2/3].
10. El dispositivo (300) según la reivindicación 8 o 9, en donde el segundo intervalo es
Figure imgf000016_0001
i
0 [°.5*M <*)_
11. El dispositivo (300) según una cualquiera de las reivindicaciones 8 a 10, en donde la unidad (320) de determinación se configura específicamente para:
determinar la energía total de las M subbandas según los valores originales de envolvente de las M subbandas; determinar la energía total de las K subbandas según los valores originales de envolvente de las K subbandas; y determinar una relación de la energía total de las M subbandas con la energía total de las K subbandas como la característica de energía de las M subbandas.
12. El dispositivo (300) según una cualquiera de las reivindicaciones 8 a 11, en donde la unidad (320) de determinación se configura específicamente para:
determinar la energía total de las M subbandas y la energía de una primera subbanda según los valores originales de envolvente de las M subbandas, en done la energía de la primera subbanda es la mayor de las M subbandas; y determinar una relación de la energía de la primera subbanda con la energía total de las M subbandas como la característica espectral de las M subbandas.
13. El dispositivo (300) según una cualquiera de las reivindicaciones 8 a 12, en donde la unidad (330) de modificación se configura específicamente para:
determinar la energía total de las M subbandas y la energía de la primera subbanda según los valores originales de envolvente de las M subbandas, en donde la energía de la primera subbanda es la mayor de las M subbandas; determinar un factor de modificación según la energía total de las M subbandas y la energía de la primera subbanda; y
realizar la modificación sobre los valores originales de envolvente de las M subbandas mediante el uso del factor de modificación, para adquirir los valores modificados de envolvente de las M subbandas.
14. El dispositivo (300) según una cualquiera de las reivindicaciones 8 a 13, en donde un valor modificado de envolvente de cada subbanda en las M subbandas es mayor que un valor original de envolvente de la misma subbanda.
ES14891093T 2014-04-29 2014-12-01 Método y dispositivo de procesamiento de señal Active ES2755152T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201410177234.3A CN105096957B (zh) 2014-04-29 2014-04-29 处理信号的方法及设备
PCT/CN2014/092695 WO2015165264A1 (zh) 2014-04-29 2014-12-01 处理信号的方法及设备

Publications (1)

Publication Number Publication Date
ES2755152T3 true ES2755152T3 (es) 2020-04-21

Family

ID=54358124

Family Applications (1)

Application Number Title Priority Date Filing Date
ES14891093T Active ES2755152T3 (es) 2014-04-29 2014-12-01 Método y dispositivo de procesamiento de señal

Country Status (20)

Country Link
US (9) US9837088B2 (es)
EP (3) EP4372738A3 (es)
JP (4) JP6231699B2 (es)
KR (4) KR102052487B1 (es)
CN (2) CN106409303B (es)
AU (2) AU2014392351B2 (es)
BR (1) BR112016015855B1 (es)
CA (1) CA2935084C (es)
CL (1) CL2016002106A1 (es)
ES (1) ES2755152T3 (es)
IL (2) IL246427B (es)
MX (2) MX389400B (es)
NZ (1) NZ721875A (es)
PL (1) PL3637417T3 (es)
PT (1) PT3079150T (es)
RU (3) RU2656812C2 (es)
SG (2) SG10201801095QA (es)
UA (1) UA117395C2 (es)
WO (1) WO2015165264A1 (es)
ZA (1) ZA201604465B (es)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105096958B (zh) 2014-04-29 2017-04-12 华为技术有限公司 音频编码方法及相关装置
CN106409303B (zh) 2014-04-29 2019-09-20 华为技术有限公司 处理信号的方法及设备
RU2763480C1 (ru) * 2021-06-16 2021-12-29 Федеральное государственное казенное военное образовательное учреждение высшего образования "Военный учебно-научный центр Военно-Морского Флота "Военно-морская академия имени Адмирала флота Советского Союза Н.Г. Кузнецова" Устройство для восстановления речевого сигнала
CN117476013A (zh) * 2022-07-27 2024-01-30 华为技术有限公司 音频信号的处理方法、装置、存储介质及计算机程序产品

Family Cites Families (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100188912B1 (ko) * 1992-09-21 1999-06-01 윤종용 서브밴드코딩의 비트재할당 방법
JP3283413B2 (ja) 1995-11-30 2002-05-20 株式会社日立製作所 符号化復号方法、符号化装置および復号装置
JP2003280698A (ja) * 2002-03-22 2003-10-02 Sanyo Electric Co Ltd 音声圧縮方法および音声圧縮装置
DE10345995B4 (de) 2003-10-02 2005-07-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Verarbeiten eines Signals mit einer Sequenz von diskreten Werten
DE102004007200B3 (de) 2004-02-13 2005-08-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audiocodierung
JP4287840B2 (ja) * 2005-06-06 2009-07-01 パナソニック株式会社 符号化装置
WO2007041789A1 (en) * 2005-10-11 2007-04-19 National Ict Australia Limited Front-end processing of speech signals
US7590523B2 (en) * 2006-03-20 2009-09-15 Mindspeed Technologies, Inc. Speech post-processing using MDCT coefficients
US8392198B1 (en) * 2007-04-03 2013-03-05 Arizona Board Of Regents For And On Behalf Of Arizona State University Split-band speech compression based on loudness estimation
JP2008309955A (ja) * 2007-06-13 2008-12-25 Toshiba Corp ノイズサプレス装置
US7885819B2 (en) * 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
KR20090110244A (ko) 2008-04-17 2009-10-21 삼성전자주식회사 오디오 시맨틱 정보를 이용한 오디오 신호의 부호화/복호화 방법 및 그 장치
JP2009288560A (ja) * 2008-05-29 2009-12-10 Sanyo Electric Co Ltd 音声符号化装置、音声復号装置、及びプログラム
US8352279B2 (en) * 2008-09-06 2013-01-08 Huawei Technologies Co., Ltd. Efficient temporal envelope coding approach by prediction between low band signal and high band signal
WO2010028299A1 (en) * 2008-09-06 2010-03-11 Huawei Technologies Co., Ltd. Noise-feedback for spectral envelope quantization
CN101727906B (zh) * 2008-10-29 2012-02-01 华为技术有限公司 高频带信号的编解码方法及装置
CN101770776B (zh) 2008-12-29 2011-06-08 华为技术有限公司 瞬态信号的编码方法和装置、解码方法和装置及处理系统
CN101770775B (zh) * 2008-12-31 2011-06-22 华为技术有限公司 信号处理方法及装置
JP5520967B2 (ja) 2009-02-16 2014-06-11 エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュート 適応的正弦波コーディングを用いるオーディオ信号の符号化及び復号化方法及び装置
ES2374486T3 (es) * 2009-03-26 2012-02-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Dispositivo y método para manipular una señal de audio.
CN101853663B (zh) * 2009-03-30 2012-05-23 华为技术有限公司 比特分配方法、编码装置及解码装置
US8498874B2 (en) 2009-09-11 2013-07-30 Sling Media Pvt Ltd Audio signal encoding employing interchannel and temporal redundancy reduction
CN102081927B (zh) 2009-11-27 2012-07-18 中兴通讯股份有限公司 一种可分层音频编码、解码方法及系统
CN102081926B (zh) * 2009-11-27 2013-06-05 中兴通讯股份有限公司 格型矢量量化音频编解码方法和系统
US9047875B2 (en) * 2010-07-19 2015-06-02 Futurewei Technologies, Inc. Spectrum flatness control for bandwidth extension
US8560330B2 (en) * 2010-07-19 2013-10-15 Futurewei Technologies, Inc. Energy envelope perceptual correction for high band coding
KR102095385B1 (ko) 2010-07-19 2020-03-31 돌비 인터네셔널 에이비 고주파 복원 동안 오디오 신호들의 프로세싱
KR101826331B1 (ko) * 2010-09-15 2018-03-22 삼성전자주식회사 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법
CN102436820B (zh) * 2010-09-29 2013-08-28 华为技术有限公司 高频带信号编码方法及装置、高频带信号解码方法及装置
WO2012065081A1 (en) * 2010-11-12 2012-05-18 Polycom, Inc. Scalable audio in a multi-point environment
RU2464649C1 (ru) * 2011-06-01 2012-10-20 Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." Способ обработки звукового сигнала
CN102208188B (zh) * 2011-07-13 2013-04-17 华为技术有限公司 音频信号编解码方法和设备
RU2505921C2 (ru) * 2012-02-02 2014-01-27 Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." Способ и устройство кодирования и декодирования аудиосигналов (варианты)
CN103366750B (zh) * 2012-03-28 2015-10-21 北京天籁传音数字技术有限公司 一种声音编解码装置及其方法
CN106941004B (zh) * 2012-07-13 2021-05-18 华为技术有限公司 音频信号的比特分配的方法和装置
EP2717262A1 (en) * 2012-10-05 2014-04-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder, decoder and methods for signal-dependent zoom-transform in spatial audio object coding
JP6535466B2 (ja) * 2012-12-13 2019-06-26 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 音声音響符号化装置、音声音響復号装置、音声音響符号化方法及び音声音響復号方法
CN104282312B (zh) 2013-07-01 2018-02-23 华为技术有限公司 信号编码和解码方法以及设备
CN106409303B (zh) 2014-04-29 2019-09-20 华为技术有限公司 处理信号的方法及设备

Also Published As

Publication number Publication date
JP2018041091A (ja) 2018-03-15
KR20190049954A (ko) 2019-05-09
US20240185867A1 (en) 2024-06-06
MX358255B (es) 2018-08-09
KR20160099714A (ko) 2016-08-22
WO2015165264A1 (zh) 2015-11-05
US10186271B2 (en) 2019-01-22
EP3079150A1 (en) 2016-10-12
JP2019152871A (ja) 2019-09-12
JP6231699B2 (ja) 2017-11-15
MX389400B (es) 2025-03-20
MX2018009564A (es) 2022-01-14
AU2017272204B2 (en) 2019-09-12
CN106409303A (zh) 2017-02-15
EP4372738A3 (en) 2024-07-24
CN105096957B (zh) 2016-09-14
IL248575A0 (en) 2016-12-29
US20170352358A1 (en) 2017-12-07
EP4372738A2 (en) 2024-05-22
US20230238010A1 (en) 2023-07-27
BR112016015855B1 (pt) 2019-09-10
KR101890346B1 (ko) 2018-08-21
PT3079150T (pt) 2019-10-29
UA117395C2 (uk) 2018-07-25
US12249339B2 (en) 2025-03-11
CA2935084C (en) 2019-03-12
IL246427B (en) 2019-03-31
RU2656812C2 (ru) 2018-06-06
US10546591B2 (en) 2020-01-28
JP2017507366A (ja) 2017-03-16
KR101977383B1 (ko) 2019-05-10
US11081121B2 (en) 2021-08-03
KR102052487B1 (ko) 2019-12-05
US20210343298A1 (en) 2021-11-04
CN105096957A (zh) 2015-11-25
RU2688259C2 (ru) 2019-05-21
KR20180095120A (ko) 2018-08-24
RU2018118576A3 (es) 2019-03-05
US11881226B2 (en) 2024-01-23
US20170047074A1 (en) 2017-02-16
CA2935084A1 (en) 2015-11-05
NZ721875A (en) 2018-03-23
PL3637417T3 (pl) 2024-06-10
SG11201605353YA (en) 2016-08-30
KR20180019761A (ko) 2018-02-26
JP2021043453A (ja) 2021-03-18
RU2018118576A (ru) 2018-10-31
AU2014392351A1 (en) 2016-07-21
IL248575B (en) 2022-02-01
JP6517300B2 (ja) 2019-05-22
US9837088B2 (en) 2017-12-05
SG10201801095QA (en) 2018-03-28
JP6790166B2 (ja) 2020-11-25
EP3637417A1 (en) 2020-04-15
EP3079150B1 (en) 2019-09-11
RU2016134014A (ru) 2018-02-22
EP3079150A4 (en) 2016-12-07
CL2016002106A1 (es) 2016-12-16
US20190108848A1 (en) 2019-04-11
US20250239266A1 (en) 2025-07-24
US20190267015A1 (en) 2019-08-29
US11580996B2 (en) 2023-02-14
MX2016010690A (es) 2016-11-23
EP3637417B1 (en) 2024-02-07
HK1212501A1 (en) 2016-06-10
US20200135218A1 (en) 2020-04-30
ZA201604465B (en) 2017-09-27
JP7144499B2 (ja) 2022-09-29
US10347264B2 (en) 2019-07-09
KR101830855B1 (ko) 2018-02-21
AU2014392351B2 (en) 2017-09-14
CN106409303B (zh) 2019-09-20
AU2017272204A1 (en) 2018-01-04
RU2702265C1 (ru) 2019-10-07

Similar Documents

Publication Publication Date Title
ES2822607T3 (es) Método de predicción y dispositivo de codificación/decodificación para una señal de banda de alta frecuencia
ES2988733T3 (es) Método para predecir una señal de una banda de frecuencias de extensión de ancho de banda, y dispositivo de decodificación
KR20160072145A (ko) 리던던트 프레임 정보를 통신하는 시스템들 및 방법들
ES2755152T3 (es) Método y dispositivo de procesamiento de señal
BR112015014956B1 (pt) Método de codificação de sinal de áudio, método de decodificação de sinal de áudio, aparelho de codificação de sinal de áudio e aparelho de decodificação de sinal de áudio
ES2882485T3 (es) Procedimiento y aparato de codificación de audio
JP6289627B2 (ja) 信号の符号化および復号化の方法および装置
ES2980990T3 (es) Método para procesar una trama perdida y decodificador
HK1230780B (zh) 处理信号的方法及设备
HK1230780A1 (en) Signal processing method and device
HK1230780A (en) Signal processing method and device
HK1212501B (en) Signal processing method and device