ES2779857T3 - Método de procesamiento de señal de voz/audio y aparato de codificación - Google Patents

Método de procesamiento de señal de voz/audio y aparato de codificación Download PDF

Info

Publication number
ES2779857T3
ES2779857T3 ES17195365T ES17195365T ES2779857T3 ES 2779857 T3 ES2779857 T3 ES 2779857T3 ES 17195365 T ES17195365 T ES 17195365T ES 17195365 T ES17195365 T ES 17195365T ES 2779857 T3 ES2779857 T3 ES 2779857T3
Authority
ES
Spain
Prior art keywords
signal
harmonic
wideband
voice
audio signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES17195365T
Other languages
English (en)
Inventor
Chen Hu
Zexin Liu
Lei Miao
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Application granted granted Critical
Publication of ES2779857T3 publication Critical patent/ES2779857T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • G10L19/265Pre-filtering, e.g. high frequency emphasis prior to encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

Un método de procesamiento de señal de voz/audio, que comprende: si una primera señal de voz/audio de banda ancha es una señal armónica, ajustar una condición determinante para determinar que una segunda señal de voz/audio de banda ancha es una señal armónica, para obtener una primera condición determinante, a fin de aumentar una posibilidad de determinar que la segunda señal de voz/audio de banda ancha es una señal armónica, en donde la primera señal de voz/audio de banda ancha es una señal de voz/audio antes de la conmutación de banda ancha y la segunda señal de voz/audio de banda ancha es una señal de voz/audio después de la conmutación de banda ancha; en donde, la primera señal de voz/audio de banda ancha es una señal de banda ultra ancha, y la segunda señal de voz/audio de banda ancha después de la conmutación es una señal de banda ancha; o la primera señal de voz/audio de banda ancha es una señal de banda ancha, y la segunda señal de voz/audio de banda ancha después de la conmutación es una señal de banda ultra ancha; y determinar, de acuerdo con la primera condición determinante, si la segunda señal de voz/audio de banda ancha es una señal armónica.

Description

DESCRIPCIÓN
Método de procesamiento de señal de voz/audio y aparato de codificación
Esta solicitud reivindica la prioridad de la Solicitud de Patente China n° CN201210223014.0 presentada ante la Oficina de patentes china el 29 de junio de 2012 y titulada “MÉTODO DE PROCESAMIENTO DE SEÑAL DE VOZ/AUDIO Y APARATO DE CODIFICACIÓN11.
CAMPO TÉCNICO
La presente invención se refiere a tecnologías de las comunicaciones y, en particular, a un método de procesamiento de señal de voz/audio y a un aparato de codificación.
ANTECEDENTES
En el campo de las comunicaciones digitales, existe una gran demanda de aplicación para la transmisión de voz, imagen, audio y video, tal como la comunicación con teléfonos móviles, conferencias de audio y video, televisión de difusión y entretenimiento multimedia. Una señal de voz/audio se digitaliza y transfiere desde un terminal a otro terminal utilizando una red de comunicaciones. El terminal en el presente documento puede ser un teléfono móvil, un terminal de teléfono digital o un terminal de voz y audio de cualquier otro tipo. El terminal de teléfono digital puede ser, por ejemplo, un teléfono VOIP, un teléfono RDSI, un ordenador o un teléfono de comunicaciones por cable. Para reducir los recursos ocupados en un proceso de almacenamiento o transmisión de una señal de voz/audio, la señal de voz/audio se comprime en un extremo de transmisión y se transmite a un extremo de recepción, y el extremo receptor restaura la señal de voz/audio mediante el procesamiento de descompresión y reproduce la señal de voz/audio.
En un proceso de comunicación de voz real, el ancho de banda de una señal de voz/audio a menudo cambia. Una causa que conduce al cambio de ancho de banda de la señal de voz/audio puede ser un cambio de estado de la red, puede ser un cambio de ancho de banda de la propia señal de voz/audio o puede ser otro factor que puede causar la conmutación de la señal de voz/audio entre una señal de alta frecuencia y una señal de baja frecuencia. El proceso en el que una señal de voz/audio cambia entre frecuencias altas y bajas se denomina conmutación de banda ancha.
Específicamente, el estado de la red a menudo cambia y el ancho de banda de la red se reduce a medida que el estado de la red se deteriora. En consecuencia, con el cambio del ancho de banda de la red, la señal de voz/audio también necesita cambiar entre la señal de alta frecuencia y la señal de baja frecuencia. Cuando el ancho de banda de la red se reduce, la señal de voz/audio necesita cambiar de la señal de alta frecuencia a la señal de baja frecuencia; cuando se recupera una situación de red, la señal de voz/audio necesita recuperarse de la señal de baja frecuencia a la señal de alta frecuencia. Un tamaño de ancho de banda de la señal de alta frecuencia y la señal de baja frecuencia es un concepto relativo. Por ejemplo, el ancho de banda de la señal de alta frecuencia es de 0 - 16 kHz y el ancho de banda de la señal de baja frecuencia es de 0 - 8 kHz; o el ancho de banda de la señal de alta frecuencia es 0 - 8 kHz y el ancho de banda de la señal de baja frecuencia es 0 - 4 kHz, donde la señal de alta frecuencia es también una señal de banda ultra ancha y la señal de baja frecuencia es también una señal de banda ancha.
Sin embargo, después de que se realiza la conmutación de banda ancha utilizando la técnica anterior en un codificador, a menudo se produce un problema de señales discontinuas de voz/audio en un decodificador, lo que de ese modo degrada la calidad del servicio de comunicación de voz. La Recomendación G.722, Enmienda 1 de la UIT-T, da a conocer la conmutación de banda ancha de audio a banda superancha o viceversa. Al conmutar, la señal después de la conmutación se genera aplicando la envoltura espectral de la señal anterior si se cumple una condición. Esta condición se cumple con una mayor probabilidad para las señales armónicas.
RESUMEN
Las realizaciones de la presente invención proporcionan un método de procesamiento de señal de voz/audio basado en conmutación de banda ancha y un aparato de codificación.
Una realización de la presente invención proporciona un método de procesamiento de señal de voz/audio basado en conmutación de banda ancha, que incluye:
si una primera señal de voz/audio de banda ancha es una señal armónica, ajustar una condición determinante para determinar que una segunda señal de voz/audio de banda ancha es una señal armónica, para obtener una primera condición determinante, para aumentar una posibilidad de determinar que la segunda señal de voz/audio de banda ancha es una señal armónica, donde la primera señal de voz de banda ancha es una señal antes de la conmutación de banda ancha y la segunda señal de voz/audio de banda ancha es una señal después de la conmutación de banda ancha; y
determinar, de acuerdo con la primera condición determinante, si la segunda señal de voz/audio de banda ancha es una señal armónica.
Una realización de la presente invención proporciona además un aparato de codificación que incluye: un módulo de ajuste de la condición determinante, configurado para: si una primera señal de voz/audio de banda ancha es una señal armónica, ajustar una condición determinante para determinar que una segunda señal de voz/audio de banda ancha es una señal armónica, para obtener una primera condición determinante para aumentar una posibilidad de determinar que la segunda señal de voz/audio de banda ancha es una señal armónica, donde la primera señal de voz de banda ancha es una señal antes de la conmutación de banda ancha y la segunda señal de voz/audio de banda ancha es una señal después de la conmutación de banda ancha; y
un módulo de determinación del tipo de señal, configurado para determinar, de acuerdo con la primera condición determinante, si la segunda señal de voz/audio de banda ancha es una señal armónica.
En las realizaciones de la presente invención, un aparato de codificación puede determinar si una primera señal de voz/audio de banda ancha antes de la conmutación de banda ancha es una señal armónica, y cuando se determina que la primera señal de voz/audio de banda ancha es una señal armónica, utilizar una manera de ajuste de una condición determinante de señal armónica para una segunda señal de voz/audio de banda ancha después de la conmutación de banda ancha para relajar una condición para determinar si la segunda señal de voz/audio de banda ancha después de la conmutación de banda ancha es una señal armónica, para incrementar, tanto como sea posible, una posibilidad de determinar que la segunda señal de voz/audio de banda ancha es una señal armónica. Por lo tanto, en las realizaciones de la presente invención, en el caso de la conmutación de banda ancha, los tipos de señales de voz/audio permanecen lo más consistentes posible antes y después de la conmutación, de modo que se garantiza la continuidad de la señal de voz/audio decodificada por un dispositivo decodificador, tanto como sea posible, mejorando aún más la calidad del servicio de comunicación de voz.
BREVE DESCRIPCIÓN DE LOS DIBUJOS
Para describir las soluciones técnicas en las realizaciones de la presente invención o en la técnica anterior más claramente, lo siguiente introduce brevemente los dibujos adjuntos requeridos para describir las realizaciones o la técnica anterior. Aparentemente, los dibujos que se acompañan en la siguiente descripción muestran algunas realizaciones de la presente invención, y una persona con experiencia ordinaria en la técnica aún puede obtener otros dibujos de estos dibujos adjuntos sin esfuerzos creativos.
La FIG. 1 es un diagrama de flujo de una primera realización de un método de procesamiento de señal de voz/audio de acuerdo con la presente invención;
la FIG. 2 es un diagrama de flujo de una segunda realización de un método de procesamiento de señal de voz/audio de acuerdo con la presente invención;
la FIG. 3 es un diagrama de flujo de una tercera realización de un método de procesamiento de señal de voz/audio de acuerdo con la presente invención;
la FIG. 4 es un diagrama de flujo de una cuarta realización de un método de procesamiento de señal de voz/audio de acuerdo con la presente invención;
la FIG. 5 es un diagrama de flujo de una quinta realización de un método de procesamiento de señal de voz/audio de acuerdo con la presente invención;
la FIG. 6 es un diagrama estructural esquemático de un dispositivo codificador en el que está dispuesto un aparato de codificación de acuerdo con la presente invención;
la FIG. 7 es un diagrama estructural esquemático de una primera realización de un aparato de codificación de acuerdo con la presente invención; y
la FIG. 8 es un diagrama estructural esquemático de una segunda realización de un aparato de codificación de acuerdo con la presente invención.
DESCRIPCIÓN DE LAS REALIZACIONES
Para hacer más claros los objetivos, soluciones técnicas y ventajas de las realizaciones de la presente invención, lo siguiente describe clara y completamente las soluciones técnicas en las realizaciones de la presente invención con referencia a los dibujos adjuntos en las realizaciones de la presente invención. Aparentemente, las realizaciones descritas son una parte en lugar de todas las realizaciones de la presente invención. Todas las demás realizaciones obtenidas sin esfuerzos creativos por una persona con experiencia ordinaria en la técnica en base a las realizaciones de la presente invención, estarán dentro del alcance de protección de la presente invención.
El método de procesamiento de señal de voz/audio de acuerdo con la presente invención se puede aplicar a un codificador de audio. En el campo del procesamiento de señales digitales, los códecs de audio se aplican ampliamente a diversos dispositivos electrónicos, por ejemplo, un teléfono móvil, un aparato inalámbrico, un asistente de datos personales (PDA), una ordenador de mano o portátil, un receptor/navegador GPS, una cámara, un reproductor de audio/video, una videocámara, una grabadora de video y un dispositivo de monitorización. Habitualmente, este tipo de dispositivo electrónico incluye un codificador de audio o un decodificador de audio, donde el codificador o decodificador de audio puede implementarse directamente mediante un circuito digital o un chip, por ejemplo, un DSP (procesador de señal digital) o implementarse mediante código de software que controla un procesador para ejecutar un proceso en el código de software.
La FIG. 1 es un diagrama de flujo de una primera realización de un método de procesamiento de señal de voz/audio de acuerdo con la presente invención. Como se muestra en la FIG. 1, el método de acuerdo con esta realización puede incluir:
Paso 101. Si una primera señal de voz/audio de banda ancha es una señal armónica, ajustar una condición determinante para determinar que una segunda señal de voz/audio de banda ancha es una señal armónica, para obtener una primera condición determinante, para aumentar una posibilidad de determinar que la segunda señal de voz/audio de banda ancha es una señal armónica.
La primera señal de voz/audio de banda ancha es una señal de voz/audio antes de la conmutación de banda ancha, y la segunda señal de voz/audio de banda ancha es una señal de voz/audio después de la conmutación de banda ancha.
Paso 102. Determinar, de acuerdo con la primera condición determinante, si la segunda señal de voz/audio de banda ancha es una señal armónica.
Específicamente, una señal de alta frecuencia puede ser una señal de banda ultra ancha y una señal de baja frecuencia puede ser una señal de banda ancha. Una persona experta en la técnica puede autodefinir, de acuerdo con un requisito, una señal por encima de un cierto rango de ancho de banda como una señal de banda ultra ancha y una señal en o por debajo del determinado rango de ancho de banda como una señal de banda ancha. Por ejemplo, puede establecerse que una señal por encima de un rango de ancho de banda de 0 - 8 kHz es una señal de banda ultra ancha y una señal en o por debajo del rango de ancho de banda de 0 - 8 kHz es una señal de banda ancha. Durante la codificación en un codificador, una señal de banda ultra ancha puede clasificarse en una señal armónica, una señal común, una señal transitoria y una señal de ruido, y una señal de banda ancha puede clasificarse en una señal armónica y una señal común.
La primera señal de voz/audio de banda ancha en esta realización puede ser una señal de banda ultra ancha y la segunda señal de voz/audio de banda ancha después de la conmutación puede ser una señal de banda ancha; o la primera señal de voz/audio de banda ancha puede ser una señal de banda ancha y la segunda señal de voz/audio de banda ancha después de la conmutación puede ser una señal de banda ultra ancha. Para la señal de banda ultra ancha, su tipo de señal puede ser una de la señal armónica, la señal común, la señal transitoria y la señal de ruido; para la señal de banda ancha, su tipo de señal puede ser una de la señal armónica y la señal común. Para la señal de banda ultra ancha, un aparato de codificación puede utilizar una condición determinante de señal armónica correspondiente a una señal de banda ultra ancha para determinar un tipo de señal de la señal de banda ultra ancha; para la señal de banda ancha, el aparato de codificación puede utilizar una condición determinante de señal armónica correspondiente a una señal de banda ancha para determinar un tipo de señal de la señal de banda ancha. En la técnica anterior, tanto la condición determinante de señal armónica correspondiente a una señal de banda ultra ancha como la condición determinante de señal armónica correspondiente a una señal de banda ancha necesitan utilizar información de una señal de una trama previa como información de referencia durante la determinación de una señal armónica.
El autor de la invención encuentra en un proceso de práctica de la técnica anterior que: en el caso de conmutación de banda ancha en un codificador, si una señal de voz/audio antes de la conmutación de banda ancha es una señal armónica de una señal de banda ultra ancha o una señal armónica de señal de banda ancha, a menudo se produce voz intermitente en un decodificador, lo que de ese modo afecta a la comunicación normal de los usuarios y degrada la calidad del servicio de comunicación de voz.
Después de un estudio cuidadoso, el autor de la invención encuentra que una causa principal del problema anterior reside en que: tanto la condición determinante de señal armónica correspondiente a una señal de banda ultra ancha como la condición determinante de señal armónica correspondiente a una señal de banda ancha necesitan utilizar información de una señal de una trama previa como información de referencia durante la determinación de una señal armónica; sin embargo, cuando se produce la conmutación de banda ancha, las bandas de energía y frecuencia de las señales antes y después de la conmutación de banda ancha son muy diferentes porque cambia el ancho de banda de la señal. En base a este cambio, si el aparato de codificación todavía utiliza la señal antes de la conmutación de banda ancha como información de referencia para determinar un tipo de la señal después de la conmutación de banda ancha, el aparato de codificación puede realizar la conmutación del tipo de señal durante la conmutación de banda ancha. Por ejemplo, una señal de voz/audio antes de la conmutación de banda ancha es una señal armónica, pero puede determinarse que la señal de voz/audio después de la conmutación de banda ancha es una señal transitoria. El codificador puede utilizar un método de codificación para que una señal armónica codifique una señal armónica antes de la conmutación de banda ancha y utilizar un método de codificación para que una señal no armónica codifique una señal no armónica después de la conmutación de banda ancha. Más tarde, el codificador puede enviar la señal codificada al decodificador, y el decodificador puede utilizar un método de decodificación correspondiente para decodificar la señal codificada después de recibir la señal codificada, para restaurar la señal armónica y la señal no armónica. Debido a que hay una diferencia significativa entre la señal armónica y la señal no armónica en términos de características de señal, la salida de las dos señales hace que la señal de voz/audio, escuchada por un usuario en el decodificador, sea intermitente. Con respecto a la conmutación entre tres tipos de señal de la señal no armónica, es decir, la señal de ruido, la señal transitoria y la señal común, para un dispositivo decodificador, la señal de voz/audio decodificada no se ve afectada significativamente.
Por lo tanto, en esta realización, el aparato de codificación puede determinar si la primera señal de voz/audio de banda ancha antes de la conmutación de banda ancha es una señal armónica. Si la primera señal de voz/audio de banda ancha antes de la conmutación de banda ancha es una señal armónica, el aparato de codificación puede utilizar una manera de ajuste de la condición determinante de señal armónica para aumentar la posibilidad de determinar que la segunda señal de voz/audio de banda ancha después de la conmutación de banda ancha es una señal armónica. Por lo tanto, en el caso de la conmutación de banda ancha, un tipo de señal de la señal de voz/audio no cambia tanto como sea posible durante la determinación de la señal de voz/audio después de la conmutación de banda ancha, de modo que los tipos de señales de las señales de voz/audio recibidas en el dispositivo decodificador son consistentes antes y después de la conmutación de banda ancha, es decir, se puede utilizar una misma manera de decodificación para la decodificación, a fin de garantizar la continuidad de la señal de voz/audio tanto como sea posible. El tipo de señal de la segunda señal de voz/audio de banda ancha cambia solo cuando la segunda señal de voz/audio de banda ancha después de la conmutación no cumple una condición determinante de señal armónica relajada, es decir, solo cuando hay muy pocas componentes armónicas en la segunda señal de voz/audio de banda ancha. En esta realización, si la primera señal de voz/audio de banda ancha es una señal de banda ultra ancha, la segunda señal de voz/audio de banda ancha es una señal de banda ancha; si la primera señal de voz/audio de banda ancha es una señal de banda ancha, la segunda señal de voz/audio de banda ancha es una señal de banda ultra ancha.
En un ejemplo en el cual una primera señal de voz/audio de banda ancha es una señal de banda ultra ancha y una segunda señal de voz/audio de banda ancha es una señal de banda ancha, el aparato de codificación puede utilizar la condición determinante de señal armónica correspondiente a una señal de banda ultra ancha para determinar si una señal de banda ultra ancha antes de la conmutación de banda ancha es una señal armónica o una señal no armónica, donde la señal no armónica es una de la señal transitoria, la señal de ruido y la señal común. Si un resultado de la determinación es una señal armónica, el aparato de codificación puede relajar la condición determinante de señal armónica correspondiente a una señal de banda ancha para obtener la primera condición determinante y determinar, de acuerdo con la primera condición determinante, si una señal de banda ancha después de la conmutación de banda ancha es una señal armónica. Debido a que se relaja la condición determinante de señal armónica correspondiente a una señal de banda ancha, se aumenta una posibilidad de determinar que la señal de banda ancha después de la conmutación es una señal armónica, de modo que los tipos de señal antes y después de la conmutación de banda ancha no cambian tanto como sea posible y, además, la continuidad de la señal de voz/audio decodificada por el dispositivo decodificador se garantiza tanto como sea posible.
Cabe destacar que un experto en la técnica puede diseñar la condición determinante de señal armónica correspondiente a una señal de banda ultra ancha y la condición determinante de señal armónica correspondiente a una señal de banda ancha de acuerdo con un método de procesamiento de señal de voz/audio o utilizar una condición determinante de señal armónica estipulada en un estándar, lo cual no está limitado en esta realización.
En esta realización, un aparato de codificación puede determinar si una primera señal de voz/audio de banda ancha antes de la conmutación de banda ancha es una señal armónica, y cuando se determina que la primera señal de voz/audio de banda ancha es una señal armónica, utilizar una manera de ajuste de una condición determinante de señal armónica para una segunda señal de voz/audio de banda ancha después de la conmutación de banda ancha, para relajar una condición de determinar si la segunda señal de voz/audio de banda ancha después de la conmutación de banda ancha es una señal armónica, para aumentar tanto como sea posible, una posibilidad de determinar que la segunda señal de voz/audio de banda ancha es una señal armónica. Por lo tanto, en esta realización, en el caso de la conmutación de banda ancha, los tipos de señal de las señales de voz/audio permanecen tan consistentes como sea posible antes y después de la conmutación, de modo que la continuidad de una señal de voz/audio decodificada por un dispositivo decodificador se garantiza tanto como sea posible y, además, se mejora la calidad del servicio de comunicación de voz.
En base a la realización del método mostrada en la FIG. 1, si el aparato de codificación determina que la primera señal de voz/audio de banda ancha no es una señal armónica, antes de que el aparato de codificación realice el paso 102 en la realización del método mostrada en la FIG. 1, el método puede incluir además:
ajustar la condición determinante de señal armónica para obtener una segunda condición determinante, para decrementar la posibilidad de determinar que la segunda señal de voz/audio de banda ancha es una señal armónica y, además, determinar de acuerdo con la segunda condición determinante, si la segunda señal de voz/audio de banda ancha es una señal armónica.
Específicamente, si el aparato de codificación determina que la primera señal de voz/audio de banda ancha antes de la conmutación de banda ancha no es una señal armónica, el aparato de codificación puede utilizar una manera de ajuste de la condición determinante de señal armónica para incrementar un umbral de determinación para determinar que la segunda señal de voz/audio de banda ancha es una señal armónica, para decrementar la posibilidad de determinar que la segunda señal de voz/audio de banda ancha es una señal armónica. Es decir, si la primera señal de voz/audio de banda ancha antes de la conmutación de banda ancha es una señal no armónica, por ejemplo, una señal de ruido, una señal transitoria o una señal común, puede determinarse en gran medida incrementando el umbral de determinación de la señal armónica, que la segunda señal de voz/audio de banda ancha después de la conmutación de banda ancha es una señal de ruido, una señal transitoria o una señal común, pero no una señal armónica. El codificador no cambia un tipo de señal de la señal de voz/audio durante la conmutación de banda ancha tanto como sea posible y se puede asegurar la continuidad de la señal de voz/audio decodificada por el decodificador tanto como sea posible.
Como se ha mencionado anteriormente, si la primera señal de voz/audio de banda ancha es una señal de banda ultra ancha, la segunda señal de voz/audio de banda ancha es una señal de banda ancha; si la primera señal de voz/audio de banda ancha es una señal de banda ancha, la segunda señal de voz/audio de banda ancha es una señal de banda ultra ancha. Lo siguiente describe en detalle las soluciones técnicas de la presente invención utilizando diferentes realizaciones para diferentes situaciones de conmutación de banda ancha.
Primero, se describen en detalle la condición determinante de señal armónica y una condición determinante de señal no armónica que corresponden a una señal de banda ultra ancha y la condición determinante de señal armónica y una condición determinante de señal no armónica que corresponden a una señal de banda ancha que se utilizan en las siguientes realizaciones. Cabe destacar que en las siguientes realizaciones se utiliza una condición determinante del tipo de señal estipulada en un estándar como un ejemplo para determinar si una señal de voz/audio es una señal armónica o una señal no armónica. Una persona experta en la técnica puede comprender que estas condiciones determinantes se pueden cambiar de acuerdo con el método de procesamiento de señal de voz/audio.
Para una señal de banda ultra ancha, se puede utilizar la siguiente manera para determinar un tipo de señal de señal de banda ultra ancha:
(1) Dividir una señal de voz/audio actual en múltiples segmentos de señal para obtener múltiples segmentos de una señal de dominio del tiempo y determinar un valor del parámetro de la envolvente de tiempo para cada uno de los segmentos de la señal de dominio del tiempo. Opcionalmente, antes de que se determine el valor del parámetro de la envolvente de tiempo para cada uno de los segmentos de la señal de dominio del tiempo, cada uno de los segmentos de la señal de dominio del tiempo también se puede multiplicar por un factor de proporción de acuerdo con un grado de importancia de cada uno de los segmentos de la señal de dominio del tiempo en toda la señal de voz/audio para obtener una señal de dominio del tiempo utilizada para determinar el valor del parámetro de la envolvente de tiempo.
(2) Determinar si un valor del parámetro de la envolvente de tiempo de múltiples valores de los parámetros de la envolvente de tiempo de la señal de dominio del tiempo es mayor que un umbral de la envolvente T1 dado, donde el umbral de la envolvente T1 se obtiene realizando una suma ponderada de varios valores de la envolvente previos de la señal de voz/audio y luego multiplicar un resultado por un valor preestablecido.
(3) Si al menos un umbral de la envolvente de tiempo es mayor que T1, determinar que la señal de voz/audio actual es una señal transitoria.
Los pasos 1 al 3 son una condición determinante de señal transitoria.
(4) Si ningún umbral de la envolvente de tiempo es mayor que T1, dividir una señal de dominio de la frecuencia de la señal de voz/audio actual en múltiples bandas de frecuencia, calcular un valor pico de amplitud de dominio de la frecuencia de cada una de las bandas de frecuencia y luego calcular un valor de la característica armónica de cada una de las bandas de frecuencia de acuerdo con los valores pico de amplitud de dominio de la frecuencia, un valor promedio de los valores pico de amplitud de dominio de la frecuencia de las múltiples bandas de frecuencia y un ancho de banda de frecuencia.
(5) Determinar si el valor de la característica armónica de cada una de las bandas de frecuencia es mayor que un umbral dado y si el valor pico de amplitud de dominio de la frecuencia de cada una de las bandas de frecuencia es mayor que un umbral t 2 dado. Si tanto el valor de la característica armónica de cada una de las bandas de frecuencia como el valor pico de amplitud de dominio de la frecuencia de cada una de las bandas de frecuencia son mayores que los umbrales dados, determinar que la banda de frecuencia es una banda de frecuencia armónica y realizar el paso 6; de lo contrario, determinar además si el valor de la característica armónica es menor que un umbral T3 dado. Si el valor de la característica armónica es menor que el umbral T3 dado, determinar que la banda de frecuencia es una banda de frecuencia de ruido; de lo contrario, determinar que la banda de frecuencia es una banda de frecuencia común.
(6) Determinar un valor del parámetro del valor pico máximo, es decir, un valor máximo de los valores pico de amplitud de todas las bandas de frecuencia, calcular una cantidad de bandas de frecuencia armónicas y una cantidad de bandas de frecuencia de ruido y calcular una proporción de la energía global de la señal de voz/audio actual con la energía global de una señal de voz/audio previa.
(7) Determinar si el valor del parámetro del valor pico máximo es mayor que un umbral T4 dado, si la cantidad de bandas de frecuencia armónicas es mayor que un umbral T5 dado y si la proporción de la energía global cae dentro de un rango umbral (T6, T7) dado. Si todos los resultados determinantes son sí, determinar que la señal de voz/audio actual es una señal armónica y actualizar un contador de modo armónico, por ejemplo, sumar 1 a un valor del conteo del contador de modo armónico.
(8) Si las tres condiciones determinantes no son todas afirmativas, actualizar un contador de modo armónico, por ejemplo, restar 1 de un valor de conteo del contador de modo armónico y determinar si el valor de conteo de modo armónico es mayor que un umbral T8 dado en este caso. En caso afirmativo, determinar que la señal de voz/audio actual es una señal armónica.
Los pasos 4 a 8 son una condición determinante de señal armónica.
Cabe destacar que el contador de modo armónico es una función opcional. Cuando un valor de un parámetro del valor pico máximo de la señal de voz/audio actual es menor o igual que el umbral T4 dado, la cantidad de bandas de frecuencia armónicas es menor o igual que el umbral T5 dado y la proporción de la energía global no está dentro del rango de umbral (T6, T7) dado, el contador de modo armónico puede utilizarse como una referencia para determinar si la señal de voz/audio actual es una señal armónica. Si una cantidad de señales armónicas acumuladas previamente excede el umbral T8 dado, indica que la señal de voz/audio continua es más probable que sea una señal armónica y, en este caso, aunque las tres condiciones anteriores no se cumplan, también se puede determinar que la señal de voz/audio actual es una señal armónica.
(9) Si no es así, determinar además si la cantidad de bandas de frecuencia de ruido y otro parámetro relacionado con el ruido cumplen una condición. Si la cantidad de bandas de frecuencia de ruido y otro parámetro relacionado con el ruido cumplen una condición, determinar que la señal de voz/audio actual es una señal de ruido; de lo contrario, determinar que la señal de voz/audio actual es una señal común.
Para la señal de banda ancha, solo se necesita distinguir una señal armónica y una señal común. Sin embargo, en un proceso de conmutación de banda ancha, la condición determinante de señal armónica es similar a un principio para determinar una señal de banda ultra ancha y es específicamente como sigue:
Al determinar si la señal de voz/audio actual es una señal armónica, el aparato de codificación solo necesita determinar si la cantidad de bandas de frecuencia armónicas y el valor del parámetro del valor pico máximo son mayores que los umbrales T4 y T5 dados, respectivamente, y en caso afirmativo, determinar que la señal de voz/audio actual es una señal armónica y aumentar el valor del contador de modo armónico, por ejemplo, sumar 1 al valor de conteo del contador de modo armónico, o si no se pueden cumplir los dos al mismo tiempo, reducir el valor del contador de modo armónico, por ejemplo, restar 1 del valor de conteo del contador de modo armónico; y luego determinar si el valor de conteo del contador de modo armónico es mayor que el umbral T8 dado, y en caso afirmativo, determinar que la señal de voz/audio actual es una señal armónica, o si no, determinar que la señal de voz/audio actual es una señal común.
En base a la descripción anterior de la determinación de los tipos de señal de la señal de banda ancha y la señal de banda ultra ancha, lo siguiente describe en detalle la solución técnica de la presente invención.
La FIG. 2 es un diagrama de flujo de una segunda realización de un método de procesamiento de señal de voz/audio de acuerdo con la presente invención. En esta realización, una primera señal de voz/audio de banda ancha es una señal de banda ultra ancha, una segunda señal de voz/audio de banda ancha es una señal de banda ancha, y la conmutación de banda ancha es conmutar desde la señal de banda ultra ancha a la señal de banda ancha. Como se muestra en la FIG. 2, el método en esta realización puede incluir:
Paso 201. Calcular una cantidad de bandas de frecuencia armónicas y un parámetro del valor pico máximo de una señal de banda ancha después de la conmutación de banda ancha.
Este paso puede implementarse utilizando el paso 6 anterior y, por lo tanto, no se proporcionan más detalles en el presente documento.
Paso 202. Actualizar un valor del conteo de modo armónico de acuerdo con la cantidad de bandas de frecuencia armónicas, el parámetro del valor pico máximo y una condición determinante de señal armónica para la señal de banda ancha.
Este paso puede implementarse utilizando, por ejemplo, el paso 7 anterior. Cabe destacar que, para la señal de banda ancha no es necesario calcular una proporción de la energía global, sino solo determinar la cantidad de bandas de frecuencia armónicas y el parámetro del valor pico máximo utilizado en la condición determinante de señal armónica para la señal de banda ancha, de modo que se puede actualizar un contador de modo armónico. Si la cantidad de bandas de frecuencia armónicas es mayor que un umbral T5 dado y el parámetro del valor pico máximo es mayor que un umbral T4 dado, se puede determinar que la señal de banda ancha después de la conmutación de banda ancha es una señal armónica, y luego se puede sumar 1 a un valor del contador de modo armónico; si la cantidad de bandas de frecuencia armónicas es menor o igual que el umbral T5 dado y/o el parámetro del valor pico máximo es menor o igual que el umbral T4 dado, puede determinarse que la señal de banda ancha después de la conmutación de banda ancha es una señal no armónica, y luego se puede restar 1 del valor del contador de modo armónico. Por lo tanto, puede aprenderse que determinar si la señal de banda ancha después de la conmutación de banda ancha es una señal armónica o una señal no armónica se basa en un tipo de señal objetivo de la señal de banda ancha, y el contador de modo armónico actualizado de las mismas es información objetiva de las señales de voz/audio anteriores que pueden utilizarse como referencia durante la determinación de una señal de voz/audio siguiente.
Paso 203. Determinar si una señal de banda ultra ancha antes de la conmutación de banda ancha es una señal armónica. En caso afirmativo, realizar el paso 204; si no es así, realizar el paso 206.
Cabe destacar que el paso 203 se debe realizar antes del paso 204, pero no debe realizarse necesariamente después del paso 201 o del paso 202. En un proceso de procesamiento real, el paso 203 puede realizarse antes de la conmutación de banda ancha.
Paso 204. Reducir al menos un umbral de un umbral de la cantidad de bandas de frecuencia armónicas y un umbral parámetro del valor pico máximo en una condición determinante de señal armónica para la señal de banda ancha.
Debido a que la señal de banda ultra ancha antes de la conmutación de banda ancha es una señal armónica, una condición de determinar que la señal de banda ancha después de la conmutación de banda ancha es una señal armónica tiene que ser relajada en el paso 204. En esta realización, puede decrementarse al menos un umbral del umbral T5 de la cantidad de bandas de frecuencia armónicas y el umbral T4 del parámetro del valor pico máximo en la condición determinante de señal armónica para la señal de banda ancha. Cabe destacar que, para una manera de ajuste del decremento tanto de T4 como de T5, un grado de relajación de la condición determinante de señal armónica es relativamente más grande cuando se compara con una manera de ajuste de decrementar T4 solamente o decrementar T5 solamente. En esta realización, un umbral de la cantidad bandas de frecuencia armónicas decrementado se puede marcar como T51, donde T51 < T5; y un umbral del parámetro del valor pico máximo decrementado se marca como T41, donde T41 < T4. Por ejemplo, T51 puede ser la mitad de T5 y T41 es la mitad de T4.
Un experto en la técnica puede entender que los valores específicos de T51 y T41 se pueden ajustar de acuerdo con un requisito determinante de señal armónica. Por ejemplo, si necesita ser determinado tanto como sea posible que una señal de banda ancha con una cierta característica armónica es una señal armónica, T51 y T41 se pueden ajustar a valores más pequeños, relajando de esta manera la condición determinante de señal armónica en mayor medida.
Paso 205. Si la cantidad de bandas de frecuencia armónicas es mayor que un umbral de la cantidad bandas de frecuencia armónicas decrementado y/o el parámetro del valor pico máximo es mayor que un umbral del parámetro del valor pico máximo decrementado, determinar que la señal de banda ancha es una señal armónica.
Después de relajar la condición determinante de señal armónica, si se cumple cualquier condición de las dos condiciones, que la cantidad de bandas de frecuencia armónicas es mayor que T51 y el parámetro del valor pico máximo es mayor que T41, se puede determinar que la señal de banda ancha después de la conmutación de banda ancha es una señal armónica. Cabe destacar que cuando una señal armónica se realiza en la técnica anterior, necesitan cumplirse las dos condiciones, que la cantidad de bandas de frecuencia armónicas es mayor que T5 y el parámetro del valor pico máximo es mayor que T4; sin embargo, en esta realización, no sólo se decrementan los umbrales determinantes de T5 y T4, sino que también se puede determinar que la señal después de la conmutación de banda ancha es una señal armónica cuando se cumple cualquier condición de las dos condiciones, que la cantidad de bandas de frecuencia armónicas es mayor de T51 y el parámetro del valor pico máximo es mayor que T41, relajando de este modo aún más la condición determinante de señal armónica.
En un caso que la cantidad de bandas de frecuencia armónicas es menor o igual que T51 y el parámetro del valor pico máximo es menor o igual que T41, es decir, ninguna de las dos anteriores condiciones se cumple, en esta realización, la determinación también se puede realizar de acuerdo con un valor del contador de modo armónico. Si el valor del conteo de modo armónico es mayor que un valor T8 preestablecido, la señal de banda ancha después de la conmutación de banda ancha es una señal armónica.
Paso 206. Incrementar al menos un umbral del umbral de la cantidad de bandas de frecuencia armónicas y el umbral del parámetro del valor pico máximo en la condición determinante de señal armónica para la señal de banda ancha.
Debido a que la señal de banda ultra ancha antes de la conmutación de banda ancha es una señal no armónica, por ejemplo, una señal transitoria, una condición de determinar que la señal de banda ancha después de la conmutación de banda ancha es una señal armónica necesita ser incrementada en el paso 206. En este realización, se puede incrementar al menos un umbral del umbral T5 de la cantidad de bandas de frecuencia armónicas y del umbral T4 del parámetro del valor pico máximo en la condición determinante de señal armónica para la señal de banda ancha. Cabe destacar que, para una manera de ajuste de incrementar tanto T4 como T5, un grado de incremento de la condición determinante de señal armónica es relativamente más grande cuando se compara con una manera de ajuste de incrementar T4 solamente o incrementar T5 solamente. En esta realización, un umbral de la cantidad de bandas de frecuencia armónicas incrementado se puede marcar como T52, donde T52 < T5; y un umbral del parámetro del valor pico máximo incrementado se marca como T42, donde T42 < T4. Por ejemplo, T51 puede ser el doble de T5 y T41 es el doble de T4.
Un experto en la técnica puede entender que los valores específicos de T52 y T42 también se pueden ajustar de acuerdo con un requisito determinante de señal armónica. Por ejemplo, si necesita ser determinado que una señal de banda ancha con relativamente muchas características armónicas es una señal armónica, se pueden ajustar T52 y T42 a valores más grandes, de modo que se puede determinar que la señal de banda ancha con características armónicas distintas es una señal armónica.
Paso 207. Si la cantidad de bandas de frecuencia armónicas es mayor que un umbral de la cantidad de bandas de frecuencia armónicas incrementado y/o el parámetro del valor pico máximo es mayor que un umbral del parámetro del valor pico máximo incrementado, determinar que la señal de banda ancha es una señal armónica.
Después de que se incrementa la condición determinante de señal armónica, si se cumple cualquier condición de las dos condiciones, que la cantidad de bandas de frecuencia armónicas es mayor que T52 y el parámetro del valor pico máximo es mayor que T42, se puede determinar que la señal de banda ancha después de la conmutación de banda ancha es una señal armónica.
En un caso que la cantidad de bandas de frecuencia armónicas es menor o igual que T52 y el parámetro del valor pico máximo es menor o igual que T42, es decir, ninguna de las dos condiciones anteriores se cumple, en esta realización, la determinación también se puede realizar de acuerdo con un valor del contador de modo armónico. Si el valor del conteo de modo armónico es mayor que un valor T8 preestablecido, también se puede determinar que la señal de banda ancha después de la conmutación de banda ancha es una señal armónica.
En esta realización, cuando se produce la conmutación de banda ancha en un codificador, un aparato de codificación puede determinar si una señal de banda ultra ancha antes de la conmutación de banda ancha es una señal armónica o una señal no armónica; si la señal de banda ultra ancha es una señal armónica, el aparato de codificación puede reducir un umbral determinante de una cantidad de bandas de frecuencia armónicas y/o un parámetro del valor pico máximo, que se utiliza para representar componentes armónicos de una señal, a fin de determinar tanto como sea posible que una señal de banda ancha después de la conmutación de banda ancha es una señal armónica; si la señal de banda ultra ancha es una señal no armónica, el aparato de codificación puede aumentar el umbral determinante utilizado para la cantidad de bandas de frecuencia armónicas y/o un parámetro del valor pico máximo, a fin de determinar tanto como sea posible que la señal de banda ancha después de la conmutación de banda ancha es una señal no armónica. Además, después de ajustar la condición determinante de señal armónica, aunque la señal de banda ancha después de la conmutación de banda ancha no cumpla la condición anterior, la determinación puede además realizarse con ayuda de un contador de modo armónico. Por lo tanto, en esta realización, durante la conmutación de banda ancha, no se cambia un tipo de señal tanto como sea posible y, por lo tanto, la continuidad de una señal de voz/audio recibida en un decodificador se puede garantizar tanto como sea posible.
La FIG. 3 es un diagrama de flujo de una tercera realización de un método de procesamiento de señal de voz/audio de acuerdo con la presente invención. En esta realización, una primera señal de voz/audio de banda ancha es una señal de banda ancha, una segunda señal de voz/audio de banda ancha es una señal de banda ultra ancha, y la conmutación de banda ancha es conmutar desde la señal de banda ancha a la señal de banda ultra ancha. Como se muestra en la FIG. 3, el método en esta realización puede incluir:
Paso 301: Calcular una cantidad de bandas de frecuencia armónicas y un parámetro del valor pico máximo de una señal de banda ultra ancha después de la conmutación de banda ancha y actualizar un valor del conteo de modo armónico de acuerdo con la cantidad de bandas de frecuencia armónicas, el parámetro del valor pico máximo y una condición determinante de señal armónica para la señal de banda ultra ancha.
Para el paso 301, se refiere a la implementación anterior relacionada con un proceso de determinación de un tipo de señal de una señal de banda ultra ancha y, por lo tanto, no se proporcionan más detalles en el presente documento.
Paso 302. Determinar por defecto que la señal de banda ultra ancha no es una señal transitoria y determinar por defecto que una proporción de la energía global de la señal de banda ancha ultra con la energía global de una señal de banda ancha antes de la conmutación de banda ancha cae dentro de un rango preestablecido.
En esta realización, la conmutación de banda ancha es conmutar desde la señal de banda ancha a la señal de banda ultra ancha, la señal de banda ultra ancha incluye cuatro tipos de señales y se compara con la condición determinante de señal armónica para la señal de banda ancha, la proporción de la energía global de la señal de banda ultra ancha después de la conmutación de banda ancha con la energía global de la señal de banda ancha antes de la conmutación de banda ancha se añade como la condición determinante de señal armónica de la señal de banda ultra ancha. Por lo tanto, en esta realización, para simplificar la condición determinante, puede no realizarse del paso 1 al paso 3 y se determina por defecto que la señal de banda ultra ancha después de la conmutación de banda ancha no es una señal transitoria en el paso 302, y también puede ser determinado por defecto que la proporción de la energía global de la señal de banda ultra ancha después de la conmutación de banda ancha con la energía global de la señal de banda ancha antes de la conmutación de banda ancha cae dentro de un rango (T6, T7) preestablecido.
Paso 303. Determinar si una señal de banda ancha antes de la conmutación de banda ancha es una señal armónica. En caso afirmativo, realizar el paso 304; si no es así, realizar el paso 306.
Paso 304. Reducir al menos un umbral de un umbral de la cantidad de bandas de frecuencia armónicas y un umbral del parámetro del valor pico máximo en una condición determinante de señal armónica para la señal de banda ultra ancha.
Debido a que la señal de banda ancha antes de la conmutación de banda ancha es una señal armónica, una condición de determinar que la señal de banda ultra ancha después de la conmutación de banda ancha es una señal armónica necesita ser relajada en el paso 304. En esta realización, puede ser decrementado al menos un umbral del umbral T5 de la cantidad de bandas de frecuencia armónicas y del umbral T4 del parámetro del valor pico máximo de la condición determinante de señal armónica para la señal de banda ultra ancha. El umbral de la cantidad de bandas de frecuencia armónicas decrementado también se marca como T51 y el umbral del parámetro del valor pico máximo decrementado también se marca como T41.
Paso 305. Si la cantidad de bandas de frecuencia armónicas es mayor que un umbral de la cantidad de bandas de frecuencia armónicas decrementado y/o el parámetro del valor pico máximo es mayor que un umbral del parámetro del valor pico máximo decrementado, determinar que la señal de banda ultra ancha es una señal armónica.
Después de relajar la condición determinante de señal armónica, si se cumple cualquier condición de las dos condiciones, que la cantidad de bandas de frecuencia armónicas es mayor que el umbral de la cantidad de bandas frecuencia armónicas decrementado y el parámetro del valor pico máximo es mayor que el umbral del parámetro del valor pico máximo decrementado, se puede determinar que la señal de banda ultra ancha después de la conmutación de banda ancha es una señal armónica.
En un caso que la cantidad de bandas de frecuencia armónicas es menor o igual que T51 y el parámetro del valor pico máximo es menor o igual que T41, es decir, ninguna de las dos condiciones anteriores se cumple, en esta realización, la determinación también se puede realizar de acuerdo con un valor del contador de modo armónico. Si el valor del conteo de modo armónico es mayor que un valor T8 preestablecido, la señal de banda ultra ancha después de la conmutación de banda ancha es una señal armónica.
Paso 306. Incrementar al menos un umbral del umbral de la cantidad de bandas de frecuencia armónicas y del umbral del parámetro del valor pico máximo en una condición determinante de señal armónica para la señal de banda ultra ancha.
Paso 307. Si la cantidad de bandas de frecuencia armónicas es mayor que un umbral de la cantidad de bandas de frecuencia armónicas incrementado y/o el parámetro del valor pico máximo es mayor que un umbral del parámetro del valor pico máximo incrementado, determinar que la señal de banda ultra ancha es una señal armónica.
Después de que se incrementa la condición determinante de señal armónica, si se cumple cualquier condición de las dos condiciones, que la cantidad de bandas de frecuencia armónicas es mayor que el umbral T52 de la cantidad de bandas frecuencia armónicas incrementado y el parámetro del valor pico máximo es mayor que el umbral T42 del parámetro del valor pico máximo incrementado, se puede determinar que la señal de banda ultra ancha después de la conmutación de banda ancha es una señal armónica.
En un caso que la cantidad de bandas de frecuencia armónicas es menor o igual que T52 y el parámetro del valor pico máximo es menor o igual que T42, es decir, ninguna de los das condiciones anteriores se cumple, en esta realización, la determinación también se puede realizar de acuerdo con un valor del contador de modo armónico. Si el valor del conteo de modo armónico es mayor que un valor T8 preestablecido, también se puede determinar que la señal de banda ultra ancha después de la conmutación de banda ancha es una señal armónica.
Alternativamente, en esta realización, los pasos 1 a 3 también se puede realizar para determinar si la señal de banda ultra ancha después de la conmutación de banda ancha es una señal transitoria. Además, para asegurar la continuidad de la señal, se puede incrementar una condición determinante de señal transitoria en esta realización, de modo que se puede determinar que una señal de banda ultra ancha que en realidad tiene una característica transitoria relativamente significativa es una señal transitoria.
En la implementación real, un aparato de codificación puede utilizar el paso 1 anterior para calcular un parámetro de la envolvente de tiempo de la señal de banda ultra ancha e incrementar un umbral T1 de la envolvente de secuencia del tiempo en el paso 2, donde un umbral de la envolvente incrementado puede ser marcado como T11; y, si el parámetro de la envolvente de tiempo es mayor que T11, se puede determinar que la señal de banda ultra ancha es una señal transitoria. Por ejemplo, si la señal de banda ancha antes de la conmutación de banda ancha es una señal armónica, se puede incrementar por tres veces el umbral de la envolvente; si la señal de banda ancha antes de la conmutación de banda ancha es una señal no armónica, se puede incrementar por dos veces el umbral de la envolvente.
En esta realización, cuando la conmutación de banda ancha se produce en un codificador, un aparato de codificación puede determinar si una señal de banda ancha antes de la conmutación de banda ancha es una señal armónica o una señal no armónica; si la señal de banda ancha es una señal armónica, el aparato de codificación puede reducir un umbral de determinación de una cantidad de bandas de frecuencia armónicas y/o un parámetro del valor pico máximo que se utilizan para representar componentes armónicas de una señal, a fin de determinar tanto como sea posible que una señal de banda ultra ancha después de la conmutación de banda ancha es una señal armónica; si la señal de banda ancha es una señal no armónica, el aparato de codificación puede aumentar un umbral de determinación utilizado para la cantidad de bandas de frecuencia armónicas y/o el parámetro del valor pico máximo, a fin de determinar tanto como sea posible que la señal de banda ultra ancha después de la conmutación de banda ancha es una señal no armónica. Además, después de ajustar la condición determinante de señal armónica, aunque la señal de banda ultra ancha después de la conmutación de banda ancha no cumpla la condición anterior, la determinación puede además realizarse con ayuda de un contador de modo armónico. Por lo tanto, en esta realización, durante la conmutación de banda ancha, un tipo de señal no se cambia tanto como sea posible y, por lo tanto, la continuidad de una señal de voz/audio recibida en un decodificador puede garantizarse tanto como sea posible.
La FIG. 4 es un diagrama de flujo de una cuarta realización de un método de procesamiento de señal basado en la conmutación de banda ancha de acuerdo con la presente invención. En esta realización, una primera señal de voz/audio de banda ancha es una señal de banda ultra ancha, una segunda señal de voz/audio de banda ancha es una señal de banda ancha y la conmutación de banda ancha es conmutar desde la señal de banda ultra ancha a la señal de banda ancha. Como se muestra en la FIG. 4, el método en esta realización puede incluir:
Paso 401. Calcular una cantidad de bandas de frecuencia armónicas y un parámetro del valor pico máximo de una señal de banda ancha después de la conmutación de banda ancha.
Paso 402. Actualizar un valor del conteo de modo armónico de acuerdo con la cantidad de bandas de frecuencia armónicas, el parámetro del valor pico máximo y una condición determinante de señal armónica para la señal de banda ancha.
Paso 403. Determinar si una señal de banda ultra ancha antes de la conmutación de banda ancha es una señal armónica. En caso afirmativo, realizar el paso 404; si no es así, realizar el paso 405.
Para el paso 401 al paso 403, se refiere a un proceso de realización del paso 201 al paso 203 en la realización mostrada en la FIG. 2 y, por lo tanto, no se proporcionan más detalles en el presente documento.
Paso 404. Determinar que la señal de banda ancha después de la conmutación de banda ancha es una señal armónica.
Paso 405. Determinar que la señal de banda ancha después de la conmutación de banda ancha es una señal no armónica.
Una diferencia entre esta realización y la realización del método mostrada en la FIG. 2 reside en que: en la realización del método mostrada en la FIG. 2, la determinación de si la señal de banda ancha después de la conmutación de banda ancha es una señal armónica se realiza ajustando un umbral de determinación de la condición determinante de señal armónica; en esta realización, la condición determinante de señal armónica se ajusta para que: siempre que una señal de banda ultra ancha antes de la conmutación de banda ancha es una señal armónica, también es determinada terminantemente que la señal de banda ancha después de la conmutación de banda ancha es una señal armónica; siempre que la señal de banda ultra ancha antes de la conmutación de banda ancha es una señal no armónica, también se determina terminantemente que la señal de banda ancha después de la conmutación de banda ancha es una señal no armónica.
En esta realización, cuando se produce la conmutación de banda ancha en un codificador, un aparato de codificación puede determinar si una señal de banda ultra ancha antes de la conmutación de banda ancha es una señal armónica o una señal no armónica, y si la señal de banda ultra ancha es una señal armónica, el aparato de codificación determina terminantemente que una señal de banda ancha después de la conmutación de banda ancha es una señal armónica; si la señal de banda ultra ancha es una señal no armónica, el aparato de codificación determina terminantemente que una señal de banda ancha después de la conmutación de banda ancha es una señal no armónica. Por lo tanto, en esta realización, durante la conmutación de banda ancha, no se cambia un tipo de señal y, por lo tanto, se puede garantizar la continuidad de una señal de voz/audio tanto como sea posible para una señal de voz/audio recibida en un decodificador.
La FIG. 5 es un diagrama de flujo de una quinta realización de un método de procesamiento de señal basado en la conmutación de banda ancha de acuerdo con la presente invención. En esta realización, una primera señal de voz/audio de banda ancha es una señal de banda ancha, una segunda señal de voz/audio de banda ancha es una señal de banda ultra ancha y la conmutación de banda ancha es conmutar desde la señal de banda ancha a la señal de banda ultra ancha. Como se muestra en la FIG. 5, el método en esta realización puede incluir:
Paso 501: Calcular una cantidad de bandas de frecuencia armónicas y un parámetro del valor pico máximo de una señal de banda ultra ancha después de la conmutación de banda ancha y actualizar un valor del conteo de modo armónico de acuerdo con la cantidad de bandas de frecuencia armónicas, el parámetro del valor pico máximo y una condición determinante de señal armónica para la señal de banda ultra ancha.
Paso 502. Determinar por defecto que la señal de banda ultra ancha no es una señal transitoria y determinar por defecto que una proporción de la energía global de la señal de banda ultra ancha con la energía global de una señal de banda ancha antes de la conmutación de banda ancha cae dentro de un rango preestablecido.
Paso 503. Determinar si una señal de banda ancha antes de la conmutación de banda ancha es una señal armónica. En caso afirmativo, realizar el paso 504; si no es así, realizar el paso 505.
Para el paso 501 al paso 503, se refiere a un proceso de realización del paso 301 al paso 303 en la realización mostrada en la FIG. 3 y, por lo tanto, no se proporcionan más detalles en el presente documento.
Paso 504. Determinar que la señal de banda ultra ancha después de la conmutación de banda ancha es una señal armónica.
Paso 505. Determinar que la señal de banda ultra ancha después de la conmutación de banda ancha es una señal no armónica.
Una diferencia entre esta realización y la realización del método mostrada en la FIG. 3 reside en que: en la realización del método mostrada en la FIG. 3, la determinación de si la señal de banda ultra ancha después de la conmutación de banda ancha es una señal armónica se realiza ajustando un umbral de determinación en la condición determinante de señal armónica; en esta realización, la condición determinante de señal armónica se ajusta para que: siempre que la señal de banda ancha antes de la conmutación de banda ancha es una señal armónica, también se determina terminantemente que la señal de banda ultra ancha después de la conmutación de banda ancha es una señal armónica; siempre que la señal de banda ancha antes de la conmutación de banda ancha es una señal no armónica, también se determina terminantemente que la señal de banda ultra ancha después de la conmutación de banda ancha es una señal no armónica.
En esta realización, cuando se produce la conmutación de banda ancha en un codificador, un aparato de codificación puede determinar si una señal de banda ancha antes de la conmutación de banda ancha es una señal armónica o una señal no armónica, y si la señal de banda ancha es una señal armónica, el aparato de codificación determina terminantemente que una señal de banda ultra ancha después de la conmutación de banda ancha es una señal armónica; si la señal de banda ancha es una señal no armónica, el aparato de codificación determina terminantemente que una señal de banda ultra ancha después de la conmutación de banda ancha es una señal no armónica. Por lo tanto, en esta realización, durante la conmutación de banda ancha, no se cambia un tipo de señal y, por lo tanto, se puede garantizar la continuidad de una señal de voz/audio tanto como sea posible para una señal de voz/audio recibida en un decodificador.
Asociado con las realizaciones del método, la presente invención proporciona además un aparato de codificación, donde el aparato puede estar ubicado en un dispositivo terminal, un dispositivo de red o un dispositivo de prueba. El aparato de codificación puede ser implementado mediante circuitos de hardware o ser implementado por software que trabaja con el hardware. Por ejemplo, con referencia a la FIG. 6, un procesador invoca a un aparato de codificación para implementar el procesamiento de una señal de voz/audio. El aparato de codificación puede realizar diversos métodos y procesos en las realizaciones de método. El aparato de codificación puede incluir un módulo de ajuste de la condición determinante y un módulo de determinación del tipo de señal.
La FIG. 7 es un diagrama estructural esquemático de una primera realización de un aparato de codificación de acuerdo con la presente invención. Como se muestra en la FIG. 7, el aparato de codificación en esta realización incluye: un módulo de ajuste de la condición determinante 11 y un módulo de determinación del tipo de señal 12. El módulo de ajuste de la condición determinante 11 está configurado para: si una primera señal de voz/audio de banda ancha es una señal armónica, ajustar una condición determinante para determinar que una segunda señal de voz/audio de banda ancha es una señal armónica, para obtener una primera condición determinante a fin de aumentar una posibilidad de determinar que la segunda señal de voz/audio de banda ancha es una señal armónica, donde la primera señal de voz/audio de banda ancha es una señal de voz/audio antes de la conmutación de banda ancha y la segunda señal de voz/audio de banda ancha es una señal de voz/audio después de la conmutación de banda ancha. El módulo de determinación del tipo de señal 12 está configurado para determinar, de acuerdo con la primera condición determinante, si la segunda señal de voz/audio de banda ancha es una señal armónica.
En concreto, el módulo de ajuste de la condición determinante 11 está configurado para relajar la condición determinante para determinar que la segunda señal de voz/audio de banda ancha es una señal armónica, donde se utiliza una condición determinante relajada como la primera condición determinante.
La FIG. 8 es un diagrama estructural esquemático de una segunda realización de un aparato de codificación de acuerdo con la presente invención. Como se muestra en la FIG. 8, además de los módulos del aparato mostrado en la FIG. 7, el aparato en esta realización incluye además: un módulo de actualización del modo armónico 13.
En esta realización, el módulo de ajuste de la condición determinante 11 está configurado específicamente para reducir al menos un umbral de un umbral de la cantidad de bandas de frecuencia armónicas y un umbral del parámetro del valor pico máximo en la condición determinante para determinar que la segunda señal de voz/audio de banda ancha es una señal armónica; y, correspondientemente, el módulo de determinación del tipo de señal 12 puede incluir: una unidad de cálculo 121 y una unidad de procesamiento 122, donde la unidad de cálculo 121 está configurada para calcular una cantidad de bandas de frecuencia armónicas y un parámetro del valor pico máximo de la segunda señal de voz/audio de banda ancha, y la unidad de procesamiento 122 está configurada para, si la cantidad de bandas de frecuencia armónicas es mayor que un umbral de la cantidad de bandas de frecuencia armónicas decrementado y/o el parámetro del valor pico máximo es mayor que un umbral del parámetro del valor pico máximo decrementado, determinar que la segunda señal de voz/audio de banda ancha es una señal armónica.
El módulo de actualización del modo armónico 13 está configurado para actualizar un valor del conteo de modo armónico de acuerdo con una relación entre la cantidad de bandas de frecuencia armónicas, el parámetro del valor pico máximo y la condición determinante para determinar que la segunda señal de voz/audio de banda ancha es una señal armónica; y, correspondientemente, el módulo de determinación del tipo de señal 12 está configurado además para, si la cantidad de bandas de frecuencia armónicas es menor o igual que el umbral de la cantidad de bandas frecuencia armónicas decrementado y el parámetro del valor pico máximo es menor o igual que el umbral del parámetro del valor pico máximo decrementado, determinar que la segunda señal de voz/audio de banda ancha es una señal armónica.
Además, el módulo de actualización del modo armónico 13 está configurado específicamente para: si la cantidad de bandas de frecuencia armónicas es mayor que el umbral de la cantidad de bandas de frecuencia armónicas y el parámetro del valor pico máximo es mayor que el umbral del parámetro del valor pico máximo, incrementar el valor del conteo de modo armónico; y, si la cantidad de bandas de frecuencia armónicas es menor o igual que el umbral de la cantidad de bandas frecuencia armónicas y/o el parámetro del valor pico máximo es menor o igual que el umbral del parámetro del valor pico máximo, decrementar el valor del conteo de modo armónico.
En un caso que la conmutación de banda ancha es conmutar desde una señal de banda ancha a una señal de banda ultra ancha, es decir, la primera señal de voz/audio de banda ancha es una señal de banda ancha y la segunda señal de voz/audio de banda ancha es una señal de banda ultra ancha, el módulo de ajuste de la condición determinante 11 está configurado además para calcular un parámetro de la envolvente de tiempo de la señal de banda ultra ancha e incrementar un umbral de la envolvente en una condición determinante de señal transitoria; si el parámetro de la envolvente de tiempo es mayor o igual que un umbral de la envolvente incrementado, determinar que la señal de banda ultra ancha es una señal transitoria; y, si el parámetro de la envolvente de tiempo es menor que el umbral de la envolvente incrementado, determinar por defecto que la señal de banda ultra ancha no es una señal transitoria y determinar por defecto que una proporción de la energía global de la señal de banda ultra ancha con la energía global de la señal de banda ancha cae dentro de un rango preestablecido. En la implementación real, el módulo de ajuste de la condición determinante 11 está configurado específicamente para: si la señal de banda ancha es una señal armónica, incrementar por tres veces el umbral de la envolvente; y, si la señal de banda ancha es una señal no armónica, incrementar por dos veces el umbral de la envolvente.
En otra realización del aparato de codificación de acuerdo con la presente invención, basado en la realización del aparato de codificación mostrado en la FIG. 7, el módulo de determinación del tipo de señal 12 pueden estar configurado específicamente para determinar, de acuerdo con la primera condición determinante, que la segunda señal de voz/audio de banda ancha es una señal armónica; o, el módulo de determinación del tipo de señal 12 está configurado además para: si la primera señal de voz/audio de banda ancha no es una señal armónica, determinar que la segunda señal de voz/audio de banda ancha es una señal no armónica.
Todavía en otra realización del aparato de codificación de acuerdo con la presente invención, basado en la realización del aparato de codificación mostrado en la FIG. 7, el módulo de ajuste de la condición determinante 11 está configurado además para: si la primera señal de voz/audio de banda ancha no es una señal armónica, ajustar la condición determinante de señal armónica para obtener una segunda condición determinante, a fin de reducir la posibilidad de determinar que la segunda señal de voz/audio de banda ancha es una señal armónica; y, correspondientemente, el módulo de determinación del tipo de señal 12 está configurado además para determinar, de acuerdo con la segunda condición determinante, si la segunda señal de voz/audio de banda ancha es una señal armónica. Específicamente, el módulo de ajuste de la condición determinante 11 está configurado para incrementar al menos un umbral del umbral de la cantidad de bandas de frecuencia armónicas y del umbral del parámetro del valor pico máximo en la condición determinante para determinar que la segunda señal de voz/audio de banda ancha es una señal armónica; y, correspondientemente, el módulo de determinación del tipo de señal 12 está configurado específicamente para: si la cantidad de bandas de frecuencia armónicas es mayor que un umbral de la cantidad de bandas de frecuencia armónicas incrementado y/o el parámetro del valor pico máximo es mayor que un umbral del parámetro del valor pico máximo incrementado, determinar que la segunda señal de voz/audio de banda ancha es una señal armónica.
El aparato de codificación en las realizaciones anteriores de la presente invención puede realizar correspondientemente las soluciones técnicas en las realizaciones del método mostradas en la FIG. 1 a la FIG. 5, y los principios de implementación y efectos técnicos de las mismas son similares. Por lo tanto, no se proporcionan más detalles en el presente documento.

Claims (22)

REIVINDICACIONES
1. Un método de procesamiento de señal de voz/audio, que comprende:
si una primera señal de voz/audio de banda ancha es una señal armónica, ajustar una condición determinante para determinar que una segunda señal de voz/audio de banda ancha es una señal armónica, para obtener una primera condición determinante, a fin de aumentar una posibilidad de determinar que la segunda señal de voz/audio de banda ancha es una señal armónica, en donde la primera señal de voz/audio de banda ancha es una señal de voz/audio antes de la conmutación de banda ancha y la segunda señal de voz/audio de banda ancha es una señal de voz/audio después de la conmutación de banda ancha; en donde, la primera señal de voz/audio de banda ancha es una señal de banda ultra ancha, y la segunda señal de voz/audio de banda ancha después de la conmutación es una señal de banda ancha; o la primera señal de voz/audio de banda ancha es una señal de banda ancha, y la segunda señal de voz/audio de banda ancha después de la conmutación es una señal de banda ultra ancha; y determinar, de acuerdo con la primera condición determinante, si la segunda señal de voz/audio de banda ancha es una señal armónica.
2. El método de acuerdo con la reivindicación 1, en donde el ajuste de una condición determinante para determinar que una segunda señal de voz/audio de banda ancha es una señal armónica, para obtener una primera condición determinante, a fin de aumentar una posibilidad de determinar que la segunda señal de voz/audio de banda ancha es una señal armónica comprende:
relajar la condición determinante para determinar que la segunda señal de voz/audio de banda ancha es una señal armónica, en donde una condición determinante relajada se utiliza como la primera condición determinante.
3. El método de acuerdo con la reivindicación 2, en donde la relajación de la condición determinante para determinar que la segunda señal de voz/audio de banda ancha es una señal armónica comprende:
decrementar al menos un umbral de un umbral de la cantidad de bandas de frecuencia armónicas y un umbral del parámetro del valor pico máximo en la condición determinante para determinar que la segunda señal de voz/audio de banda ancha es una señal armónica; y
la determinación, de acuerdo con la primera condición determinante, de si la segunda señal de voz/audio de banda ancha es una señal armónica comprende:
calcular una cantidad de bandas de frecuencia armónicas y un parámetro del valor pico máximo de la segunda señal de voz/audio de banda ancha; y
si la cantidad de bandas de frecuencia armónicas es mayor que un umbral de la cantidad de bandas de frecuencia armónicas decrementado y/o el parámetro del valor pico máximo es mayor que un umbral del parámetro del valor pico máximo decrementado, determinar que la segunda señal de voz/audio de banda ancha es una señal armónica.
4. El método de acuerdo con la reivindicación 3, que comprende además:
actualizar un valor del conteo de modo armónico de acuerdo con una relación entre la cantidad de bandas de frecuencia armónicas, el parámetro del valor pico máximo y la condición determinante para determinar que la segunda señal de voz/audio de banda ancha es una señal armónica; y
si la cantidad de bandas de frecuencia armónicas es menor o igual que el umbral de la cantidad de bandas frecuencia armónicas decrementado y el parámetro del valor pico máximo es menor o igual que el umbral del parámetro del valor pico máximo decrementado, el método comprende además:
si el valor del conteo de modo armónico es mayor que un valor preestablecido, determinar que la segunda señal de voz/audio de banda ancha es una señal armónica.
5. El método de acuerdo con la reivindicación 4, en donde la actualización de un valor del conteo de modo armónico de acuerdo con una relación entre la cantidad de bandas de frecuencia armónicas, el parámetro del valor pico máximo y la condición determinante para determinar que la segunda señal de voz/audio de banda ancha es una señal armónica comprende:
si la cantidad de bandas de frecuencia armónicas es mayor que el umbral de la cantidad de bandas de frecuencia armónicas y el parámetro del valor pico máximo es mayor que el umbral del parámetro del valor pico máximo, incrementar el valor del conteo de modo armónico; y
si la cantidad de bandas de frecuencia armónicas es menor o igual que el umbral de la cantidad de bandas frecuencia armónicas y/o el parámetro del valor pico máximo es menor o igual que el umbral del parámetro del valor pico máximo, decrementar el valor del conteo de modo armónico.
6. El método de acuerdo con la reivindicación 4 o 5, en donde la primera señal de voz/audio de banda ancha es una señal de banda ancha, la segunda señal de voz/audio de banda ancha es una señal de banda ultra ancha y antes de la determinación, de acuerdo con la primera condición determinante, de si la segunda señal de voz/audio de banda ancha es una señal armónica, el método comprende además:
calcular un parámetro de la envolvente de tiempo de la señal de banda ultra ancha e incrementar un umbral de la envolvente en una condición determinante de señal transitoria;
si el parámetro de la envolvente de tiempo es mayor o igual que un umbral de la envolvente incrementado, determinar que la señal de banda ultra ancha es una señal transitoria; y
si el parámetro de la envolvente de tiempo es menor que el umbral de la envolvente incrementado, determinar por defecto que la señal de banda ultra ancha no es una señal transitoria y determinar por defecto que una proporción de la energía global de la señal de banda ultra ancha con la energía global de la señal de banda ancha cae dentro de un rango preestablecido.
7. El método de acuerdo con la reivindicación 6, en donde el incremento de un umbral de la envolvente en una condición determinante de señal transitoria es específicamente que:
si la señal de banda ancha es una señal armónica, incrementar por tres veces el umbral de la envolvente; y si la señal de banda ancha es una señal no armónica, incrementar por dos veces el umbral de la envolvente.
8. El método de acuerdo con la reivindicación 1 o 2, en donde la determinación, de acuerdo con la primera condición determinante, de si la segunda señal de voz/audio de banda ancha es una señal armónica comprende: determinar, de acuerdo con la primera condición determinante, que la segunda señal de voz/audio de banda ancha es una señal armónica.
9. El método de acuerdo con una cualquiera de las reivindicaciones 1 a 8, que comprende además:
si la primera señal de voz/audio de banda ancha no es una señal armónica, ajustar una condición determinante de la determinación de que una segunda señal de voz/audio de banda ancha es una señal armónica para obtener una segunda condición determinante, a fin de reducir la posibilidad de determinar que la segunda señal de voz/audio de banda ancha es una señal armónica; y
determinar, de acuerdo con la segunda condición determinante, si la segunda señal de voz/audio de banda ancha es una señal armónica.
10. El método de acuerdo con la reivindicación 9, en donde el ajuste de la condición determinante de la determinación de que una segunda señal de voz/audio de banda ancha es una señal armónica para obtener una segunda condición determinante, a fin de reducir la posibilidad de determinar que la segunda señal de voz/audio de banda ancha es una señal armónica comprende:
incrementar al menos un umbral de un umbral de la cantidad de bandas de frecuencia armónicas y un umbral del parámetro del valor pico máximo en la condición determinante para determinar que la segunda señal de voz/audio de banda ancha es una señal armónica; y
la determinación, de acuerdo con la segunda condición determinante, de si la segunda señal de voz/audio de banda ancha es una señal armónica comprende:
si la cantidad de bandas de frecuencia armónicas es mayor que un umbral de la cantidad de bandas de frecuencia armónicas incrementado y/o el parámetro del valor pico máximo es mayor que un umbral del parámetro del valor pico máximo incrementado, determinar que la segunda señal de voz/audio de banda ancha es una señal armónica.
11. El método de acuerdo con una cualquiera de las reivindicaciones 1 a 8, que comprende además:
si la primera señal de voz/audio de banda ancha no es una señal armónica, determinar que la segunda señal de voz/audio de banda ancha es una señal no armónica.
12. Un aparato de codificación, que comprende:
un módulo de ajuste de la condición determinante, configurado para: si una primera señal de voz/audio de banda ancha es una señal armónica, ajustar una condición determinante para determinar que una segunda señal de voz/audio de banda ancha es una señal armónica, para obtener una primera condición determinante, a fin de aumentar una posibilidad de determinar que la segunda señal de voz/audio de banda ancha es una señal armónica, en donde la primera señal de voz/audio de banda ancha es una señal de voz/audio antes de la conmutación de banda ancha y la segunda señal de voz/audio de banda ancha es una señal voz/audio después de la conmutación de banda ancha; en donde, la primera señal de voz/audio de banda ancha es una señal de banda ultra ancha, y la segunda señal de voz/audio de banda ancha después de la conmutación es una señal de banda ancha; o la primera señal de voz/audio de banda ancha es una señal de banda ancha, y la segunda señal de voz/audio de banda ancha después de la conmutación es una señal de banda ultra ancha; y
un módulo de determinación del tipo de señal, configurado para determinar, de acuerdo con la primera condición determinante, si la segunda señal de voz/audio de banda ancha es una señal armónica.
13. El aparato de acuerdo con la reivindicación 12, en donde el módulo de ajuste de la condición determinante está configurado específicamente para relajar la condición determinante para determinar que la segunda señal de voz/audio de banda ancha es una señal armónica, en donde una condición determinante relajada se utiliza como la primera condición determinante.
14. El aparato de acuerdo con la reivindicación 13, en donde el módulo de ajuste de la condición determinante está configurado específicamente para reducir al menos un umbral de un umbral de la cantidad de bandas de frecuencia armónicas y un umbral del parámetro del valor pico máximo en la condición determinante para determinar que la segunda señal de voz/audio de banda ancha es una señal armónica; y
el módulo de determinación del tipo de señal comprende:
una unidad de cálculo, configurada para calcular una cantidad de bandas de frecuencia armónicas y un parámetro del valor pico máximo de la segunda señal de voz/audio de banda ancha; y
una unidad de procesamiento, configurada para: si la cantidad de bandas de frecuencia armónicas es mayor que un umbral de la cantidad de bandas de frecuencia armónicas decrementado y/o el parámetro del valor pico máximo es mayor que un umbral del parámetro del valor pico máximo decrementado, determinar que la segunda señal de voz/audio de banda ancha es una señal armónica.
15. El aparato de acuerdo con la reivindicación 14, en donde el aparato comprende además:
un módulo de actualización del modo armónico, configurado para actualizar un valor del conteo de modo armónico de acuerdo con una relación entre la cantidad de bandas de frecuencia armónicas, el parámetro del valor pico máximo y la condición determinante para determinar que la segunda señal de voz/audio de banda ancha es una señal armónica; y
el módulo de determinación del tipo de señal está configurado además para: si la cantidad de bandas de frecuencia armónicas es menor o igual que el umbral de la cantidad de bandas de frecuencia armónicas decrementado, el parámetro del valor pico máximo es menor o igual que el umbral del parámetro del valor pico máximo decrementado y el valor del conteo de modo armónico es mayor que un valor predeterminado, determinar que la segunda señal de voz/audio de banda ancha es una señal armónica.
16. El aparato de acuerdo con la reivindicación 15, en el que el módulo de actualización de modo armónico está configurado específicamente para: si la cantidad de banda de frecuencia armónica es mayor que el umbral de cantidad de banda de frecuencia armónica y el parámetro de valor de pico máximo es mayor que el umbral de parámetro de valor de pico máximo , aumentar el valor de conteo del modo armónico; y, si la cantidad de banda de frecuencia armónica es menor o igual que el umbral de cantidad de banda de frecuencia armónica y/o el parámetro de valor de pico máximo es menor o igual que el umbral de parámetro de valor de pico máximo, reducir el valor de conteo de modo armónico.
17. El aparato de acuerdo con la reivindicación 14 o 15, en el que la primera señal de voz/audio de banda ancha es una señal de banda ancha, la segunda señal de voz/audio de banda ancha es una señal de banda ultra ancha, el módulo de ajuste de condición determinante se configura además para calcular un parámetro de envolvente de tiempo de la señal de banda ultra ancha y aumentar un umbral de envolvente en una condición determinante de señal transitoria; si el parámetro de envolvente de tiempo es mayor o igual que un umbral de envolvente aumentado, determinar que la señal de banda ultra ancha es una señal transitoria; y, si el parámetro de envolvente de tiempo es menor que el umbral de envolvente aumentado, determinar de manera predeterminada que la señal de banda ultra ancha no es una señal transitoria y determinar de manera predeterminada que una relación de energía global de la señal de banda ultra ancha a la energía global de la señal de banda ancha cae dentro de un rango preestablecido.
18. El aparato de acuerdo con la reivindicación 17, en el que el módulo de ajuste de condición determinante está configurado específicamente para: si la señal de banda ancha es una señal armónica, aumentar por tres el umbral de envolvente; y, si la señal de banda ancha es una señal no armónica, aumente por dos el umbral de envolvente.
19. El aparato de acuerdo con la reivindicación 12 o 13, en el que el módulo de determinación del tipo de señal está configurado específicamente para determinar, de acuerdo con la primera condición determinante, que la segunda señal de voz/audio de banda ancha es una señal armónica.
20. El aparato de acuerdo con una cualquiera de las reivindicaciones 12 a 19, en el que el módulo de ajuste de condición determinante está configurado además para: si la primera señal de voz/audio de banda ancha no es una señal armónica, ajustar una condición determinante para determinar que una segunda señal de voz/audio de banda ancha es una señal armónica para obtener una segunda condición determinante, a fin de reducir la posibilidad de determinar que la segunda señal de voz/audio de banda ancha es una señal armónica; y
el módulo de determinación del tipo de señal está configurado además para determinar, de acuerdo con la primera condición determinante, si la segunda señal de voz/audio de banda ancha es una señal armónica.
21. El aparato de acuerdo con la reivindicación 20, en el que el módulo de ajuste de condición determinante está configurado específicamente para aumentar al menos un umbral de un umbral de cantidad de banda de frecuencia armónica y de un umbral de parámetro de valor de pico máximo en la condición determinante para determinar que la segunda señal de voz/audio de banda ancha es una señal armónica; y
el módulo de determinación del tipo de señal está configurado específicamente para: si la cantidad de banda de frecuencia armónica es mayor que un umbral de cantidad de banda de frecuencia armónica aumentada y/o el parámetro de valor de pico máximo es mayor que un umbral de parámetro de valor de pico máximo aumentado, determinar que la segunda señal de voz/audio de banda ancha es una señal armónica.
22. El aparato de acuerdo con una cualquiera de las reivindicaciones 12 a 19, en el que el módulo de determinación del tipo de señal está configurado además para: si la primera señal de voz/audio de banda ancha no es una señal armónica, determinar que la segunda señal de voz/audio de banda ancha es una señal no armónica.
ES17195365T 2012-06-29 2013-06-06 Método de procesamiento de señal de voz/audio y aparato de codificación Active ES2779857T3 (es)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210223014.0A CN103516440B (zh) 2012-06-29 2012-06-29 语音频信号处理方法和编码装置

Publications (1)

Publication Number Publication Date
ES2779857T3 true ES2779857T3 (es) 2020-08-20

Family

ID=49782211

Family Applications (3)

Application Number Title Priority Date Filing Date
ES17195365T Active ES2779857T3 (es) 2012-06-29 2013-06-06 Método de procesamiento de señal de voz/audio y aparato de codificación
ES20150138T Active ES2930240T3 (es) 2012-06-29 2013-06-06 Método de procesamiento de señal de voz/audio y aparato de codificación
ES13810131.6T Active ES2654488T3 (es) 2012-06-29 2013-06-06 Método de procesamiento para señales de voz o audio y aparato de codificación de las mismas

Family Applications After (2)

Application Number Title Priority Date Filing Date
ES20150138T Active ES2930240T3 (es) 2012-06-29 2013-06-06 Método de procesamiento de señal de voz/audio y aparato de codificación
ES13810131.6T Active ES2654488T3 (es) 2012-06-29 2013-06-06 Método de procesamiento para señales de voz o audio y aparato de codificación de las mismas

Country Status (7)

Country Link
US (2) US10056090B2 (es)
EP (3) EP3748634B1 (es)
JP (3) JP6359529B2 (es)
KR (6) KR101790680B1 (es)
CN (1) CN103516440B (es)
ES (3) ES2779857T3 (es)
WO (1) WO2014000559A1 (es)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103516440B (zh) * 2012-06-29 2015-07-08 华为技术有限公司 语音频信号处理方法和编码装置
EP3117432B1 (en) * 2014-03-14 2019-05-08 Telefonaktiebolaget LM Ericsson (publ) Audio coding method and apparatus
CN106303878A (zh) * 2015-05-22 2017-01-04 成都鼎桥通信技术有限公司 一种啸叫检测和抑制方法
US10431242B1 (en) * 2017-11-02 2019-10-01 Gopro, Inc. Systems and methods for identifying speech based on spectral features

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3070698D1 (en) * 1979-05-28 1985-07-04 Univ Melbourne Speech processor
US5574724A (en) * 1995-05-26 1996-11-12 Lucent Technologies Inc. Adjustment of call bandwidth during a communication call
US20050065786A1 (en) * 2003-09-23 2005-03-24 Jacek Stachurski Hybrid speech coding and system
FI115329B (fi) 2000-05-08 2005-04-15 Nokia Corp Menetelmä ja järjestely lähdesignaalin kaistanleveyden vaihtamiseksi tietoliikenneyhteydessä, jossa on valmiudet useisiin kaistanleveyksiin
KR100462611B1 (ko) * 2002-06-27 2004-12-20 삼성전자주식회사 하모닉 성분을 이용한 오디오 코딩방법 및 장치
FI119533B (fi) * 2004-04-15 2008-12-15 Nokia Corp Audiosignaalien koodaus
CN102103860B (zh) * 2004-09-17 2013-05-08 松下电器产业株式会社 频谱包络信息量化装置及方法、频谱包络信息解码装置及方法
KR100707174B1 (ko) * 2004-12-31 2007-04-13 삼성전자주식회사 광대역 음성 부호화 및 복호화 시스템에서 고대역 음성부호화 및 복호화 장치와 그 방법
US8311840B2 (en) * 2005-06-28 2012-11-13 Qnx Software Systems Limited Frequency extension of harmonic signals
JP5009910B2 (ja) 2005-07-22 2012-08-29 フランス・テレコム レートスケーラブル及び帯域幅スケーラブルオーディオ復号化のレートの切り替えのための方法
US7734462B2 (en) * 2005-09-02 2010-06-08 Nortel Networks Limited Method and apparatus for extending the bandwidth of a speech signal
KR101131880B1 (ko) * 2007-03-23 2012-04-03 삼성전자주식회사 오디오 신호의 인코딩 방법 및 장치, 그리고 오디오 신호의디코딩 방법 및 장치
JP5547081B2 (ja) * 2007-11-02 2014-07-09 華為技術有限公司 音声復号化方法及び装置
US8423371B2 (en) * 2007-12-21 2013-04-16 Panasonic Corporation Audio encoder, decoder, and encoding method thereof
CN101662288B (zh) * 2008-08-28 2012-07-04 华为技术有限公司 音频编码、解码方法及装置、系统
WO2010028301A1 (en) * 2008-09-06 2010-03-11 GH Innovation, Inc. Spectrum harmonic/noise sharpness control
CN101763856B (zh) * 2008-12-23 2011-11-02 华为技术有限公司 信号分类处理方法、分类处理装置及编码系统
JP4945586B2 (ja) * 2009-02-02 2012-06-06 株式会社東芝 信号帯域拡張装置
CN101964189B (zh) * 2010-04-28 2012-08-08 华为技术有限公司 语音频信号切换方法及装置
WO2011156905A2 (en) * 2010-06-17 2011-12-22 Voiceage Corporation Multi-rate algebraic vector quantization with supplemental coding of missing spectrum sub-bands
US20120029926A1 (en) * 2010-07-30 2012-02-02 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for dependent-mode coding of audio signals
CN104011793B (zh) * 2011-10-21 2016-11-23 三星电子株式会社 帧错误隐藏方法和设备以及音频解码方法和设备
CN103999153B (zh) * 2011-10-24 2017-03-01 Lg电子株式会社 用于以带选择的方式量化语音信号的方法和设备
GB2502800B (en) * 2012-06-07 2015-05-20 Jaguar Land Rover Ltd Crane and related method of operation
CN103516440B (zh) * 2012-06-29 2015-07-08 华为技术有限公司 语音频信号处理方法和编码装置
CN105408957B (zh) * 2013-06-11 2020-02-21 弗朗霍弗应用研究促进协会 进行语音信号的频带扩展的装置及方法
US9564141B2 (en) * 2014-02-13 2017-02-07 Qualcomm Incorporated Harmonic bandwidth extension of audio signals
US9697843B2 (en) * 2014-04-30 2017-07-04 Qualcomm Incorporated High band excitation signal generation

Also Published As

Publication number Publication date
WO2014000559A1 (zh) 2014-01-03
KR20160150107A (ko) 2016-12-28
EP2851897B1 (en) 2017-11-15
JP6612808B2 (ja) 2019-11-27
EP3376499B1 (en) 2020-01-08
EP2851897A1 (en) 2015-03-25
JP2017134412A (ja) 2017-08-03
CN103516440A (zh) 2014-01-15
KR20150021100A (ko) 2015-02-27
KR101907494B1 (ko) 2018-10-12
KR20170120209A (ko) 2017-10-30
EP2851897A4 (en) 2015-06-24
JP6359529B2 (ja) 2018-07-18
KR20180112121A (ko) 2018-10-11
KR102005967B1 (ko) 2019-07-31
KR20200118252A (ko) 2020-10-14
US11107486B2 (en) 2021-08-31
JP6892491B2 (ja) 2021-06-23
JP2015526754A (ja) 2015-09-10
US20150095038A1 (en) 2015-04-02
EP3376499A1 (en) 2018-09-19
ES2654488T3 (es) 2018-02-13
KR102331531B1 (ko) 2021-12-01
EP3748634A1 (en) 2020-12-09
KR101689138B1 (ko) 2016-12-23
KR102165827B1 (ko) 2020-10-14
EP3748634B1 (en) 2022-08-10
KR20190091374A (ko) 2019-08-05
KR101790680B1 (ko) 2017-10-26
US20180336910A1 (en) 2018-11-22
JP2020024461A (ja) 2020-02-13
ES2930240T3 (es) 2022-12-09
US10056090B2 (en) 2018-08-21
CN103516440B (zh) 2015-07-08

Similar Documents

Publication Publication Date Title
ES2741849T3 (es) Procedimiento y aparato de procesamiento de señales de voz/audio
ES2779857T3 (es) Método de procesamiento de señal de voz/audio y aparato de codificación
ES2765527T3 (es) Dispositivo y método para la ejecución de la codificación de Huffman
ES2770831T3 (es) Métodos y dispositivos de codificación y descodificación de señal
ES2822607T3 (es) Método de predicción y dispositivo de codificación/decodificación para una señal de banda de alta frecuencia
ES2813956T3 (es) Método de predicción y dispositivo de decodificación para la señal de la banda de expansión del ancho de banda
ES2889929T3 (es) Estimación de compensación temporal
US9270419B2 (en) Wireless communication device and communication terminal
WO2022258036A1 (zh) 编解码方法、装置、设备、存储介质及计算机程序
ES2737889T3 (es) Codificador, decodificador, procedimiento de codificación, procedimiento de decodificación y programa
TW202411983A (zh) 量化方法、反量化方法及其裝置
JP6074661B2 (ja) 無線通信装置及び通信端末