ES2654488T3 - Método de procesamiento para señales de voz o audio y aparato de codificación de las mismas - Google Patents
Método de procesamiento para señales de voz o audio y aparato de codificación de las mismas Download PDFInfo
- Publication number
- ES2654488T3 ES2654488T3 ES13810131.6T ES13810131T ES2654488T3 ES 2654488 T3 ES2654488 T3 ES 2654488T3 ES 13810131 T ES13810131 T ES 13810131T ES 2654488 T3 ES2654488 T3 ES 2654488T3
- Authority
- ES
- Spain
- Prior art keywords
- signal
- harmonic
- broadband
- voice
- audio signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 205
- 238000003672 processing method Methods 0.000 title description 15
- 238000000034 method Methods 0.000 claims abstract description 49
- 238000012545 processing Methods 0.000 claims abstract description 12
- 230000001052 transient effect Effects 0.000 claims description 25
- 230000007423 decrease Effects 0.000 claims description 7
- 230000006854 communication Effects 0.000 description 11
- 238000004891 communication Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 5
- 230000002040 relaxant effect Effects 0.000 description 4
- 230000003247 decreasing effect Effects 0.000 description 2
- 230000000593 degrading effect Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012806 monitoring device Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
- G10L19/265—Pre-filtering, e.g. high frequency emphasis prior to encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/012—Comfort noise or silence coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
Un método de procesamiento de señal de voz/audio, que comprende: si una primera señal de voz/audio de banda ancha es una señal armónica, ajustar una condición determinante para determinar que una segunda señal de voz/audio de banda ancha es una señal armónica, para obtener una primera condición determinante, a fin de aumentar una posibilidad de determinar que la segunda señal de voz/audio de banda ancha es una señal armónica, en donde la primera señal de voz/audio de banda ancha es una señal de voz/audio antes de la conmutación de banda ancha y la segunda señal de voz/audio de banda ancha es una señal de voz/audio después de la conmutación de banda ancha; y determinar, de acuerdo con la primera condición determinante, si la segunda señal de voz/audio de banda ancha es una señal armónica.
Description
Método de procesamiento para señales de voz o audio y aparato de codificación de las mismas
La presente invención se refiere a tecnologías de las comunicaciones y, en particular, a un método de 5 procesamiento de señal de voz/audio y a un aparato de codificación.
En el campo de las comunicaciones digitales, existe una gran demanda de aplicación para la transmisión de voz, imagen, audio y video, tal como la comunicación con teléfonos móviles, conferencias de audio y video, televisión de difusión y entretenimiento multimedia. Una señal de voz/audio se digitaliza y transfiere desde un terminal a otro 10 terminal utilizando una red de comunicaciones. El terminal en el presente documento puede ser un teléfono móvil, un terminal de teléfono digital o un terminal de voz y audio de cualquier otro tipo. El terminal de teléfono digital puede ser, por ejemplo, un teléfono VOIP, un teléfono RDSI, un ordenador o un teléfono de comunicaciones por cable. Para reducir los recursos ocupados en un proceso de almacenamiento o transmisión de una señal de voz/audio, la señal de voz/audio se comprime en un extremo de transmisión y se transmite a un extremo de recepción, y el
15 extremo receptor restaura la señal de voz/audio mediante el procesamiento de descompresión y reproduce la señal de voz/audio.
En un proceso de comunicación de voz real, el ancho de banda de una señal de voz/audio a menudo cambia. Una causa que conduce al cambio de ancho de banda de la señal de voz/audio puede ser un cambio de estado de la red, puede ser un cambio de ancho de banda de la propia señal de voz/audio o puede ser otro factor que puede causar
20 la conmutación de la señal de voz/audio entre una señal de alta frecuencia y una señal de baja frecuencia. El proceso en el que una señal de voz/audio cambia entre frecuencias altas y bajas se denomina conmutación de banda ancha.
Específicamente, el estado de la red a menudo cambia y el ancho de banda de la red se reduce a medida que el estado de la red se deteriora. En consecuencia, con el cambio del ancho de banda de la red, la señal de voz/audio 25 también necesita cambiar entre la señal de alta frecuencia y la señal de baja frecuencia. Cuando el ancho de banda de la red se reduce, la señal de voz/audio necesita cambiar de la señal de alta frecuencia a la señal de baja frecuencia; cuando se recupera una situación de red, la señal de voz/audio necesita recuperarse de la señal de baja frecuencia a la señal de alta frecuencia. Un tamaño de ancho de banda de la señal de alta frecuencia y la señal de baja frecuencia es un concepto relativo. Por ejemplo, el ancho de banda de la señal de alta frecuencia es de 0 -16
30 kHz y el ancho de banda de la señal de baja frecuencia es de 0 -8 kHz; o el ancho de banda de la señal de alta frecuencia es 0 -8 kHz y el ancho de banda de la señal de baja frecuencia es 0 -4 kHz, donde la señal de alta frecuencia es también una señal de banda ultra ancha y la señal de baja frecuencia es también una señal de banda ancha.
Sin embargo, después de que se realiza la conmutación de banda ancha utilizando la técnica anterior en un
35 codificador, a menudo se produce un problema de señales discontinuas de voz/audio en un decodificador, lo que de ese modo degrada la calidad del servicio de comunicación de voz. La Recomendación de UIT-T G.722 Enmienda 1 "7 kHz audio-coding within 64 kbit/s: New Annex B with superwideband embedded extension" da a conocer la modificación de la envolvente espectral de una señal después de la conmutación de banda ancha.
40 Las realizaciones de la presente invención proporcionan un método de procesamiento de señal de voz/audio basado en conmutación de banda ancha y un aparato de codificación.
Una realización de la presente invención proporciona un método de procesamiento de señal de voz/audio basado en conmutación de banda ancha, que incluye: si una primera señal de voz/audio de banda ancha es una señal armónica, ajustar una condición
45 determinante para determinar que una segunda señal de voz/audio de banda ancha es una señal armónica, para obtener una primera condición determinante, para aumentar una posibilidad de determinar que la segunda señal de voz/audio de banda ancha es una señal armónica, donde la primera señal de voz/audio de banda ancha es una
señal antes de la conmutación de banda ancha y la segunda señal de voz/audio de banda ancha es una señal después de la conmutación de banda ancha; y determinar, de acuerdo con la primera condición determinante, si la segunda señal de voz/audio de banda ancha es una señal armónica.
5 Una realización de la presente invención proporciona además un aparato de codificación que incluye:
un módulo de ajuste de la condición determinante, configurado para: si una primera señal de voz/audio de banda ancha es una señal armónica, ajustar una condición determinante para determinar que una segunda señal de voz/audio de banda ancha es una señal armónica, para obtener una primera condición determinante para aumentar una posibilidad de determinar que la segunda señal de voz/audio de banda ancha es una señal armónica, donde la
10 primera señal de voz/audio de banda ancha es una señal antes de la conmutación de banda ancha y la segunda señal de voz/audio de banda ancha es una señal después de la conmutación de banda ancha; y un módulo de determinación del tipo de señal, configurado para determinar, de acuerdo con la primera condición determinante, si la segunda señal de voz/audio de banda ancha es una señal armónica.
En las realizaciones de la presente invención, un aparato de codificación puede determinar si una primera señal de
15 voz/audio de banda ancha antes de la conmutación de banda ancha es una señal armónica, y cuando se determina que la primera señal de voz/audio de banda ancha es una señal armónica, utilizar una manera de ajuste de una condición determinante de señal armónica para una segunda señal de voz/audio de banda ancha después de la conmutación de banda ancha para relajar una condición para determinar si la segunda señal de voz/audio de banda ancha después de la conmutación de banda ancha es una señal armónica, para incrementar, tanto como sea
20 posible, una posibilidad de determinar que la segunda señal de voz/audio de banda ancha es una señal armónica. Por lo tanto, en las realizaciones de la presente invención, en el caso de la conmutación de banda ancha, los tipos de señales de voz/audio permanecen lo más consistentes posible antes y después de la conmutación, de modo que se garantiza la continuidad de la señal de voz/audio decodificada por un dispositivo decodificador, tanto como sea posible, mejorando aún más la calidad del servicio de comunicación de voz.
Para describir las soluciones técnicas en las realizaciones de la presente invención o en la técnica anterior más claramente, lo siguiente introduce brevemente los dibujos adjuntos requeridos para describir las realizaciones o la técnica anterior. Aparentemente, los dibujos que se acompañan en la siguiente descripción muestran algunas realizaciones de la presente invención, y una persona con experiencia ordinaria en la técnica aún puede obtener
30 otros dibujos de estos dibujos adjuntos sin esfuerzos creativos. La FIG. 1 es un diagrama de flujo de una primera realización de un método de procesamiento de señal de voz/audio de acuerdo con la presente invención; la FIG. 2 es un diagrama de flujo de una segunda realización de un método de procesamiento de señal de voz/audio de acuerdo con la presente invención; 35 la FIG. 3 es un diagrama de flujo de una tercera realización de un método de procesamiento de señal de voz/audio de acuerdo con la presente invención; la FIG. 4 es un diagrama de flujo de una cuarta realización de un método de procesamiento de señal de voz/audio de acuerdo con la presente invención; la FIG. 5 es un diagrama de flujo de una quinta realización de un método de procesamiento de señal de 40 voz/audio de acuerdo con la presente invención; la FIG. 6 es un diagrama estructural esquemático de un dispositivo codificador en el que está dispuesto un aparato de codificación de acuerdo con la presente invención; la FIG. 7 es un diagrama estructural esquemático de una primera realización de un aparato de codificación de acuerdo con la presente invención; y 45 la FIG. 8 es un diagrama estructural esquemático de una segunda realización de un aparato de codificación de acuerdo con la presente invención.
Para hacer más claros los objetivos, soluciones técnicas y ventajas de las realizaciones de la presente invención, lo siguiente describe clara y completamente las soluciones técnicas en las realizaciones de la presente invención con
50 referencia a los dibujos adjuntos en las realizaciones de la presente invención. Aparentemente, las realizaciones descritas son una parte en lugar de todas las realizaciones de la presente invención. Todas las demás realizaciones obtenidas sin esfuerzos creativos por una persona con experiencia ordinaria en la técnica en base a las realizaciones de la presente invención, estarán dentro del alcance de protección de la presente invención.
El método de procesamiento de señal de voz/audio de acuerdo con la presente invención se puede aplicar a un codificador de audio. En el campo del procesamiento de señales digitales, los códecs de audio se aplican ampliamente a diversos dispositivos electrónicos, por ejemplo, un teléfono móvil, un aparato inalámbrico, un asistente de datos personales (PDA), una ordenador de mano o portátil, un receptor/navegador GPS, una cámara,
5 un reproductor de audio/video, una videocámara, una grabadora de video y un dispositivo de monitorización. Habitualmente, este tipo de dispositivo electrónico incluye un codificador de audio o un decodificador de audio, donde el codificador o decodificador de audio puede implementarse directamente mediante un circuito digital o un chip, por ejemplo, un DSP (procesador de señal digital) o implementarse mediante código de software que controla un procesador para ejecutar un proceso en el código de software.
10 La FIG. 1 es un diagrama de flujo de una primera realización de un método de procesamiento de señal de voz/audio de acuerdo con la presente invención. Como se muestra en la FIG. 1, el método de acuerdo con esta realización puede incluir:
Paso 101. Si una primera señal de voz/audio de banda ancha es una señal armónica, ajustar una condición determinante para determinar que una segunda señal de voz/audio de banda ancha es una señal armónica, para 15 obtener una primera condición determinante, para aumentar una posibilidad de determinar que la segunda señal de
voz/audio de banda ancha es una señal armónica.
La primera señal de voz/audio de banda ancha es una señal de voz/audio antes de la conmutación de banda ancha, y la segunda señal de voz/audio de banda ancha es una señal de voz/audio después de la conmutación de banda ancha.
20 Paso 102. Determinar, de acuerdo con la primera condición determinante, si la segunda señal de voz/audio de banda ancha es una señal armónica.
Específicamente, una señal de alta frecuencia puede ser una señal de banda ultra ancha y una señal de baja frecuencia puede ser una señal de banda ancha. Una persona experta en la técnica puede autodefinir, de acuerdo con un requisito, una señal por encima de un rango de ancho de banda como una señal de banda ultra ancha y una 25 señal en o por debajo del determinado rango de ancho de banda como una señal de banda ancha. Por ejemplo, puede establecerse que una señal por encima de un rango de ancho de banda de 0 -8 kHz es una señal de banda ultra ancha y una señal en o por debajo del rango de ancho de banda de 0 -8 kHz es una señal de banda ancha. Durante la codificación en un codificador, una señal de banda ultra ancha puede clasificarse en una señal armónica, una señal común, una señal transitoria y una señal de ruido, y una señal de banda ancha puede clasificarse en una
30 señal armónica y una señal común.
La primera señal de voz/audio de banda ancha en esta realización puede ser una señal de banda ultra ancha y la segunda señal de voz/audio de banda ancha después de la conmutación puede ser una señal de banda ancha; o la primera señal de voz/audio de banda ancha puede ser una señal de banda ancha y la segunda señal de voz/audio de banda ancha después de la conmutación puede ser una señal de banda ultra ancha. Para la señal de banda ultra 35 ancha, su tipo de señal puede ser una de la señal armónica, la señal común, la señal transitoria y la señal de ruido; para la señal de banda ancha, su tipo de señal puede ser una de la señal armónica y la señal común. Para la señal de banda ultra ancha, un aparato de codificación puede utilizar una condición determinante de señal armónica correspondiente a una señal de banda ultra ancha para determinar un tipo de señal de la señal de banda ultra ancha; para la señal de banda ancha, el aparato de codificación puede utilizar una condición determinante de señal
40 armónica correspondiente a una señal de banda ancha para determinar un tipo de señal de la señal de banda ancha. En la técnica anterior, tanto la condición determinante de señal armónica correspondiente a una señal de banda ultra ancha como la condición determinante de señal armónica correspondiente a una señal de banda ancha necesitan utilizar información de una señal de una trama previa como información de referencia durante la determinación de una señal armónica.
45 El autor de la invención encuentra en un proceso de práctica de la técnica anterior que: en el caso de conmutación de banda ancha en un codificador, si una señal de voz/audio antes de la conmutación de banda ancha es una señal armónica de una señal de banda ultra ancha o una señal armónica de señal de banda ancha, a menudo se produce voz intermitente en un decodificador, lo que de ese modo afecta a la comunicación normal de los usuarios y degrada la calidad del servicio de comunicación de voz.
50 Después de un estudio cuidadoso, el autor de la invención encuentra que una causa principal del problema anterior reside en que: tanto la condición determinante de señal armónica correspondiente a una señal de banda ultra ancha como la condición determinante de señal armónica correspondiente a una señal de banda ancha necesitan utilizar
información de una señal de una trama previa como información de referencia durante la determinación de una señal armónica; sin embargo, cuando se produce la conmutación de banda ancha, las bandas de energía y frecuencia de las señales antes y después de la conmutación de banda ancha son muy diferentes porque cambia el ancho de banda de la señal. En base a este cambio, si el aparato de codificación todavía utiliza la señal antes de la 5 conmutación de banda ancha como información de referencia para determinar un tipo de la señal después de la conmutación de banda ancha, el aparato de codificación puede realizar la conmutación del tipo de señal durante la conmutación de banda ancha. Por ejemplo, una señal de voz/audio antes de la conmutación de banda ancha es una señal armónica, pero puede determinarse que la señal de voz/audio después de la conmutación de banda ancha es una señal transitoria. El codificador puede utilizar un método de codificación para que una señal armónica codifique 10 una señal armónica antes de la conmutación de banda ancha y utilizar un método de codificación para que una señal no armónica codifique una señal no armónica después de la conmutación de banda ancha. Más tarde, el codificador puede enviar la señal codificada al decodificador, y el decodificador puede utilizar un método de decodificación correspondiente para decodificar la señal codificada después de recibir la señal codificada, para restaurar la señal armónica y la señal no armónica. Debido a que hay una diferencia significativa entre la señal
15 armónica y la señal no armónica en términos de características de señal, la salida de las dos señales hace que la señal de voz/audio, escuchada por un usuario en el decodificador, sea intermitente. Con respecto a la conmutación entre tres tipos de señal de la señal no armónica, es decir, la señal de ruido, la señal transitoria y la señal común, para un dispositivo decodificador, la señal de voz/audio decodificada no se ve afectada significativamente.
Por lo tanto, en esta realización, el aparato de codificación puede determinar si la primera señal de voz/audio de
20 banda ancha antes de la conmutación de banda ancha es una señal armónica. Si la primera señal de voz/audio de banda ancha antes de la conmutación de banda ancha es una señal armónica, el aparato de codificación puede utilizar una manera de ajuste de la condición determinante de señal armónica para aumentar la posibilidad de determinar que la segunda señal de voz/audio de banda ancha después de la conmutación de banda ancha es una señal armónica. Por lo tanto, en el caso de la conmutación de banda ancha, un tipo de señal de la señal de
25 voz/audio no cambia tanto como sea posible durante la determinación de la señal de voz/audio después de la conmutación de banda ancha, de modo que los tipos de señales de las señales de voz/audio recibidas en el dispositivo decodificador son consistentes antes y después de la conmutación de banda ancha, es decir, se puede utilizar una misma manera de decodificación para la decodificación, a fin de garantizar la continuidad de la señal de voz/audio tanto como sea posible. El tipo de señal de la segunda señal de voz/audio de banda ancha cambia solo
30 cuando la segunda señal de voz/audio de banda ancha después de la conmutación no cumple una condición determinante de señal armónica relajada, es decir, solo cuando hay muy pocas componentes armónicas en la segunda señal de voz/audio de banda ancha. En esta realización, si la primera señal de voz/audio de banda ancha es una señal de banda ultra ancha, la segunda señal de voz/audio de banda ancha es una señal de banda ancha; si la primera señal de voz/audio de banda ancha es una señal de banda ancha, la segunda señal de voz/audio de
35 banda ancha es una señal de banda ultra ancha.
En un ejemplo en el cual una primera señal de voz/audio de banda ancha es una señal de banda ultra ancha y una segunda señal de voz/audio de banda ancha es una señal de banda ancha, el aparato de codificación puede utilizar la condición determinante de señal armónica correspondiente a una señal de banda ultra ancha para determinar si una señal de banda ultra ancha antes de la conmutación de banda ancha es una señal armónica o una señal no 40 armónica, donde la señal no armónica es una de la señal transitoria, la señal de ruido y la señal común. Si un resultado de la determinación es que la señal de banda ultra ancha antes de la conmutación de banda ancha es una señal armónica, el aparato de codificación puede relajar la condición determinante de señal armónica correspondiente a una señal de banda ancha para obtener la primera condición determinante y determinar, de acuerdo con la primera condición determinante, si una señal de banda ancha después de la conmutación de banda
45 ancha es una señal armónica. Debido a que se relaja la condición determinante de señal armónica correspondiente a una señal de banda ancha, se aumenta una posibilidad de determinar que la señal de banda ancha después de la conmutación es una señal armónica, de modo que los tipos de señal antes y después de la conmutación de banda ancha no cambian tanto como sea posible y, además, la continuidad de la señal de voz/audio decodificada por el dispositivo decodificador se garantiza tanto como sea posible.
50 Cabe destacar que un experto en la técnica puede diseñar la condición determinante de señal armónica correspondiente a una señal de banda ultra ancha y la condición determinante de señal armónica correspondiente a una señal de banda ancha de acuerdo con un método de procesamiento de señal de voz/audio o utilizar una condición determinante de señal armónica estipulada en un estándar, lo cual no está limitado en esta realización.
En esta realización, un aparato de codificación puede determinar si una primera señal de voz/audio de banda ancha
55 antes de la conmutación de banda ancha es una señal armónica, y cuando se determina que la primera señal de voz/audio de banda ancha es una señal armónica, utilizar una manera de ajuste de una condición determinante de señal armónica para una segunda señal de voz/audio de banda ancha después de la conmutación de banda ancha, para relajar una condición de determinar si la segunda señal de voz/audio de banda ancha después de la conmutación de banda ancha es una señal armónica, para aumentar tanto como sea posible, una posibilidad de determinar que la segunda señal de voz/audio de banda ancha es una señal armónica. Por lo tanto, en esta
5 realización, en el caso de la conmutación de banda ancha, los tipos de señal de las señales de voz/audio permanecen tan consistentes como sea posible antes y después de la conmutación, de modo que la continuidad de una señal de voz/audio decodificada por un dispositivo decodificador se garantiza tanto como sea posible y, además, se mejora la calidad del servicio de comunicación de voz.
En base a la realización del método mostrada en la FIG. 1, si el aparato de codificación determina que la primera
10 señal de voz/audio de banda ancha no es una señal armónica, antes de que el aparato de codificación realice el paso 102 en la realización del método mostrada en la FIG. 1, el método puede incluir además: ajustar la condición determinante de señal armónica para obtener una segunda condición determinante, para decrementar la posibilidad de determinar que la segunda señal de voz/audio de banda ancha es una señal armónica y, además, determinar de acuerdo con la segunda condición determinante, si la segunda señal de
15 voz/audio de banda ancha es una señal armónica.
Específicamente, si el aparato de codificación determina que la primera señal de voz/audio de banda ancha antes de la conmutación de banda ancha no es una señal armónica, el aparato de codificación puede utilizar una manera de ajuste de la condición determinante de señal armónica para incrementar un umbral de determinación para determinar que la segunda señal de voz/audio de banda ancha es una señal armónica, para decrementar la 20 posibilidad de determinar que la segunda señal de voz/audio de banda ancha es una señal armónica. Es decir, si la primera señal de voz/audio de banda ancha antes de la conmutación de banda ancha es una señal no armónica, por ejemplo, una señal de ruido, una señal transitoria o una señal común, puede determinarse en gran medida incrementando el umbral de determinación de la señal armónica, que la segunda señal de voz/audio de banda ancha después de la conmutación de banda ancha es una señal de ruido, una señal transitoria o una señal común, pero no
25 una señal armónica. El codificador no cambia un tipo de señal de la señal de voz/audio durante la conmutación de banda ancha tanto como sea posible y se puede asegurar la continuidad de la señal de voz/audio decodificada por el decodificador tanto como sea posible.
Como se ha mencionado anteriormente, si la primera señal de voz/audio de banda ancha es una señal de banda ultra ancha, la segunda señal de voz/audio de banda ancha es una señal de banda ancha; si la primera señal de
30 voz/audio de banda ancha es una señal de banda ancha, la segunda señal de voz/audio de banda ancha es una señal de banda ultra ancha. Lo siguiente describe en detalle las soluciones técnicas de la presente invención utilizando diferentes realizaciones para diferentes situaciones de conmutación de banda ancha.
Primero, se describen en detalle la condición determinante de señal armónica y una condición determinante de señal no armónica que corresponden a una señal de banda ultra ancha y la condición determinante de señal armónica y
35 una condición determinante de señal no armónica que corresponden a una señal de banda ancha que se utilizan en las siguientes realizaciones. Cabe destacar que en las siguientes realizaciones se utiliza una condición determinante del tipo de señal estipulada en un estándar como un ejemplo para determinar si una señal de voz/audio es una señal armónica o una señal no armónica. Una persona experta en la técnica puede comprender que estas condiciones determinantes se pueden cambiar de acuerdo con el método de procesamiento de señal de voz/audio.
40 Para una señal de banda ultra ancha, se puede utilizar la siguiente manera para determinar un tipo de señal de señal de banda ultra ancha:
(1) Dividir una señal de voz/audio actual en múltiples segmentos de señal para obtener múltiples segmentos de una señal de dominio del tiempo y determinar un valor del parámetro de la envolvente de tiempo para cada uno de los segmentos de la señal de dominio del tiempo. Opcionalmente, antes de que se determine el valor del
45 parámetro de la envolvente de tiempo para cada uno de los segmentos de la señal de dominio del tiempo, cada uno de los segmentos de la señal de dominio del tiempo también se puede multiplicar por un factor de proporción de acuerdo con un grado de importancia de cada uno de los segmentos de la señal de dominio del tiempo en toda la señal de voz/audio para obtener una señal de dominio del tiempo utilizada para determinar el valor del parámetro de la envolvente de tiempo.
50 (2) Determinar si un valor del parámetro de la envolvente de tiempo de múltiples valores de los parámetros de la envolvente de tiempo de la señal de dominio del tiempo es mayor que un umbral de la envolvente T1 dado, donde el umbral de la envolvente T1 se obtiene realizando una suma ponderada de varios valores de la envolvente previos de la señal de voz/audio y luego multiplicar un resultado por un valor preestablecido.
(3) Si al menos un valor del umbral de la envolvente de tiempo es mayor que T1, determinar que la señal de
55 voz/audio actual es una señal transitoria. 6 Los pasos 1 al 3 son una condición determinante de señal transitoria.
(4) Si ningún valor umbral de la envolvente de tiempo es mayor que T1, dividir una señal de dominio de la frecuencia de la señal de voz/audio actual en múltiples bandas de frecuencia, calcular un valor pico de amplitud de dominio de la frecuencia de cada una de las bandas de frecuencia y luego calcular un valor de la característica
5 armónica de cada una de las bandas de frecuencia de acuerdo con los valores pico de amplitud de dominio de la frecuencia, un valor promedio de los valores pico de amplitud de dominio de la frecuencia de las múltiples bandas de frecuencia y un ancho de banda de frecuencia.
(5) Determinar si el valor de la característica armónica de cada una de las bandas de frecuencia es mayor que un umbral dado y si el valor pico de amplitud de dominio de la frecuencia de cada una de las bandas de 10 frecuencia es mayor que un umbral T2 dado. Si tanto el valor de la característica armónica de cada una de las bandas de frecuencia como el valor pico de amplitud de dominio de la frecuencia de cada una de las bandas de frecuencia son mayores que los umbrales dados, determinar que la banda de frecuencia es una banda de frecuencia armónica y realizar el paso 6; de lo contrario, determinar además si el valor de la característica armónica es menor que un umbral T3 dado. Si el valor de la característica armónica es menor que el umbral T3 dado, determinar que la
15 banda de frecuencia es una banda de frecuencia de ruido; de lo contrario, determinar que la banda de frecuencia es una banda de frecuencia común.
(6) Determinar un valor del parámetro del valor pico máximo, es decir, un valor máximo de los valores pico de amplitud de todas las bandas de frecuencia, calcular una cantidad de bandas de frecuencia armónicas y una cantidad de bandas de frecuencia de ruido y calcular una proporción de la energía global de la señal de voz/audio
20 actual con la energía global de una señal de voz/audio previa.
(7) Determinar si el valor del parámetro del valor pico máximo es mayor que un umbral T4 dado, si la cantidad de bandas de frecuencia armónicas es mayor que un umbral T5 dado y si la proporción de la energía global cae dentro de un rango umbral (T6, T7) dado. Si todos los resultados determinantes son sí, determinar que la señal de voz/audio actual es una señal armónica y actualizar un contador de modo armónico, por ejemplo, sumar 1 a un
25 valor del conteo del contador de modo armónico.
(8) Si todos los tres resultados determinantes no son sí, actualizar un contador de modo armónico, por ejemplo, restar 1 de un valor del conteo del contador de modo armónico y determinar si el valor del conteo de modo armónico es mayor que un umbral T8 dado en este caso. Si el valor del conteo de modo armónico es mayor que el umbral T8 dado, determinar que la señal de voz/audio actual es una señal armónica.
30 Los pasos 4 a 8 son una condición determinante de señal armónica. Cabe destacar que el contador de modo armónico es una función opcional. Cuando un valor de un parámetro del valor pico máximo de la señal de voz/audio actual es menor o igual que el umbral T4 dado, la cantidad de bandas de frecuencia armónicas es menor o igual que el umbral T5 dado y la proporción de la energía global no está dentro del rango de umbral (T6, T7) dado, el contador de modo armónico puede utilizarse como una referencia
35 para determinar si la señal de voz/audio actual es una señal armónica. Si una cantidad de señales armónicas acumuladas previamente excede el umbral T8 dado, indica que la señal de voz/audio continua es más probable que sea una señal armónica y, en este caso, aunque las tres condiciones anteriores no se cumplan, también se puede determinar que la señal de voz/audio actual es una señal armónica.
(9) Si se determina que la señal de voz/audio actual no es una señal armónica, determinar además si la
40 cantidad de bandas de frecuencia de ruido y otro parámetro relacionado con el ruido cumplen una condición. Si la cantidad de bandas de frecuencia de ruido y otro parámetro relacionado con el ruido cumplen una condición, determinar que la señal de voz/audio actual es una señal de ruido; de lo contrario, determinar que la señal de voz/audio actual es una señal común.
Para la señal de banda ancha, solo se necesita distinguir una señal armónica y una señal común. Sin embargo, en
45 un proceso de conmutación de banda ancha, la condición determinante de señal armónica es similar a un principio para determinar una señal de banda ultra ancha y es específicamente como sigue: Al determinar si la señal de voz/audio actual es una señal armónica, el aparato de codificación solo necesita determinar si la cantidad de bandas de frecuencia armónicas y el valor del parámetro del valor pico máximo son mayores que los umbrales T4 y T5 dados, respectivamente, y si la cantidad de bandas de frecuencia armónicas y el
50 valor del parámetro del valor pico máximo son mayores que los umbrales T4 y T5 dados respectivamente, determinar que la señal de voz/audio actual es una señal armónica e incrementar el valor del contador de modo armónico, por ejemplo, sumar 1 al valor del conteo del contador de modo armónico, o si cualquiera de la cantidad de bandas de frecuencia armónicas y el valor del parámetro del valor pico máximo es menor o igual que el umbral T4 o T5 dado, decrementar el valor del contador de modo armónico, por ejemplo, restar 1 del valor del conteo del
55 contador de modo armónico; y luego determinar si el valor del conteo del contador de modo armónico es mayor que el umbral T8 dado, y si el valor del conteo del contador de modo armónico es mayor que el umbral T8 dado, determinar que la señal de voz/audio actual es una señal armónica, o si el valor del conteo del contador de modo armónico es mayor que el umbral T8 dado, determinar que la señal de voz/audio actual es una señal común.
En base a la descripción anterior de la determinación de los tipos de señal de la señal de banda ancha y la señal de banda ultra ancha, lo siguiente describe en detalle la solución técnica de la presente invención.
La FIG. 2 es un diagrama de flujo de una segunda realización de un método de procesamiento de señal de voz/audio de acuerdo con la presente invención. En esta realización, una primera señal de voz/audio de banda
5 ancha es una señal de banda ultra ancha, una segunda señal de voz/audio de banda ancha es una señal de banda ancha, y la conmutación de banda ancha es conmutar desde la señal de banda ultra ancha a la señal de banda ancha. Como se muestra en la FIG. 2, el método en esta realización puede incluir:
Paso 201. Calcular una cantidad de bandas de frecuencia armónicas y un parámetro del valor pico máximo de una señal de banda ancha después de la conmutación de banda ancha.
10 Este paso puede implementarse utilizando el paso 6 anterior y, por lo tanto, no se proporcionan más detalles en el presente documento.
Paso 202. Actualizar un valor del conteo de modo armónico de acuerdo con la cantidad de bandas de frecuencia armónicas, el parámetro del valor pico máximo y una condición determinante de señal armónica para la señal de banda ancha.
15 Este paso puede implementarse utilizando, por ejemplo, el paso 7 anterior. Cabe destacar que, para la señal de banda ancha no es necesario calcular una proporción de la energía global, sino solo determinar la cantidad de bandas de frecuencia armónicas y el parámetro del valor pico máximo utilizado en la condición determinante de señal armónica para la señal de banda ancha, de modo que se puede actualizar un contador de modo armónico. Si la cantidad de bandas de frecuencia armónicas es mayor que un umbral T5 dado y el parámetro del valor pico
20 máximo es mayor que un umbral T4 dado, se puede determinar que la señal de banda ancha después de la conmutación de banda ancha es una señal armónica, y luego se puede sumar 1 a un valor del contador de modo armónico; si la cantidad de bandas de frecuencia armónicas es menor o igual que el umbral T5 dado y/o el parámetro del valor pico máximo es menor o igual que el umbral T4 dado, puede determinarse que la señal de banda ancha después de la conmutación de banda ancha es una señal no armónica, y luego se puede restar 1 del
25 valor del contador de modo armónico. Por lo tanto, puede aprenderse que determinar si la señal de banda ancha después de la conmutación de banda ancha es una señal armónica o una señal no armónica se basa en un tipo de señal objetivo de la señal de banda ancha, y el contador de modo armónico actualizado de las mismas es información objetiva de las señales de voz/audio anteriores que pueden utilizarse como referencia durante la determinación de una señal de voz/audio siguiente.
30 Paso 203. Determinar si una señal de banda ultra ancha antes de la conmutación de banda ancha es una señal armónica. Si la señal de banda ultra ancha antes de la conmutación de banda ancha es una señal armónica, realizar el paso 204; si la señal de banda ultra ancha antes de la conmutación de banda ancha no es una señal armónica, realizar el paso 206.
Cabe destacar que el paso 203 se debe realizar antes del paso 204, pero no debe realizarse necesariamente
35 después del paso 201 o del paso 202. En un proceso de procesamiento real, el paso 203 puede realizarse antes de la conmutación de banda ancha.
Paso 204. Reducir al menos un umbral de un umbral de la cantidad de bandas de frecuencia armónicas y un umbral parámetro del valor pico máximo en una condición determinante de señal armónica para la señal de banda ancha.
Debido a que la señal de banda ultra ancha antes de la conmutación de banda ancha es una señal armónica, una
40 condición de determinar que la señal de banda ancha después de la conmutación de banda ancha es una señal armónica tiene que ser relajada en el paso 204. En esta realización, puede decrementarse al menos un umbral del umbral T5 de la cantidad de bandas de frecuencia armónicas y el umbral T4 del parámetro del valor pico máximo en la condición determinante de señal armónica para la señal de banda ancha. Cabe destacar que, para una manera de ajuste del decremento tanto de T4 como de T5, un grado de relajación de la condición determinante de señal
45 armónica es relativamente más grande cuando se compara con una manera de ajuste de decrementar T4 solamente
o decrementar T5 solamente. En esta realización, un umbral de la cantidad bandas de frecuencia armónicas decrementado se puede marcar como T51, donde T51 < T5; y un umbral del parámetro del valor pico máximo decrementado se marca como T41, donde T41 < T4. Por ejemplo, T51 puede ser la mitad de T5 y T41 es la mitad de T4.
5
10
15
20
25
30
35
40
45
Un experto en la técnica puede entender que los valores específicos de T51 y T41 se pueden ajustar de acuerdo con un requisito determinante de señal armónica. Por ejemplo, si necesita ser determinado tanto como sea posible que una señal de banda ancha con una cierta característica armónica es una señal armónica, T51 y T41 se pueden ajustar a valores más pequeños, relajando de esta manera la condición determinante de señal armónica en mayor medida.
Paso 205. Si la cantidad de bandas de frecuencia armónicas es mayor que un umbral de la cantidad bandas de frecuencia armónicas decrementado y/o el parámetro del valor pico máximo es mayor que un umbral del parámetro del valor pico máximo decrementado, determinar que la señal de banda ancha es una señal armónica.
Después de relajar la condición determinante de señal armónica, si se cumple cualquier condición de las dos condiciones, que la cantidad de bandas de frecuencia armónicas es mayor que T51 y el parámetro del valor pico máximo es mayor que T41, se puede determinar que la señal de banda ancha después de la conmutación de banda ancha es una señal armónica. Cabe destacar que cuando una señal armónica se realiza en la técnica anterior, necesitan cumplirse las dos condiciones, que la cantidad de bandas de frecuencia armónicas es mayor que T5 y el parámetro del valor pico máximo es mayor que T4; sin embargo, en esta realización, no sólo se decrementan los umbrales determinantes de T5 y T4, sino que también se puede determinar que la señal después de la conmutación de banda ancha es una señal armónica cuando se cumple cualquier condición de las dos condiciones, que la cantidad de bandas de frecuencia armónicas es mayor de T51 y el parámetro del valor pico máximo es mayor que T41, relajando de este modo aún más la condición determinante de señal armónica.
En un caso que la cantidad de bandas de frecuencia armónicas es menor o igual que T51 y el parámetro del valor pico máximo es menor o igual que T41, es decir, ninguna de las dos anteriores condiciones se cumple, en esta realización, la determinación también se puede realizar de acuerdo con un valor del contador de modo armónico. Si el valor del conteo de modo armónico es mayor que un valor T8 preestablecido, se puede determinar que la señal de banda ancha después de la conmutación de banda ancha es una señal armónica.
Paso 206. Incrementar al menos un umbral del umbral de la cantidad de bandas de frecuencia armónicas y el umbral del parámetro del valor pico máximo en la condición determinante de señal armónica para la señal de banda ancha.
Debido a que la señal de banda ultra ancha antes de la conmutación de banda ancha es una señal no armónica, por ejemplo, una señal transitoria, una condición de determinar que la señal de banda ancha después de la conmutación de banda ancha es una señal armónica necesita ser incrementada en el paso 206. En este realización, se puede incrementar al menos un umbral del umbral T5 de la cantidad de bandas de frecuencia armónicas y del umbral T4 del parámetro del valor pico máximo en la condición determinante de señal armónica para la señal de banda ancha. Cabe destacar que, para una manera de ajuste de incrementar tanto T4 como T5, un grado de incremento de la condición determinante de señal armónica es relativamente más grande cuando se compara con una manera de ajuste de incrementar T4 solamente o incrementar T5 solamente. En esta realización, un umbral de la cantidad de bandas de frecuencia armónicas incrementado se puede marcar como T52, donde T52 < T5; y un umbral del parámetro del valor pico máximo incrementado se marca como T42, donde T42 < T4. Por ejemplo, T51 puede ser el doble de T5 y T41 es el doble de T4.
Un experto en la técnica puede entender que los valores específicos de T52 y T42 también se pueden ajustar de acuerdo con un requisito determinante de señal armónica. Por ejemplo, si necesita ser determinado que una señal de banda ancha con relativamente muchas características armónicas es una señal armónica, se pueden ajustar T52 y T42 a valores más grandes, de modo que se puede determinar que la señal de banda ancha con características armónicas distintas es una señal armónica.
Paso 207. Si la cantidad de bandas de frecuencia armónicas es mayor que un umbral de la cantidad de bandas de frecuencia armónicas incrementado y/o el parámetro del valor pico máximo es mayor que un umbral del parámetro del valor pico máximo incrementado, determinar que la señal de banda ancha es una señal armónica.
Después de que se incrementa la condición determinante de señal armónica, si se cumple cualquier condición de las dos condiciones, que la cantidad de bandas de frecuencia armónicas es mayor que T52 y el parámetro del valor pico máximo es mayor que T42, se puede determinar que la señal de banda ancha después de la conmutación de banda ancha es una señal armónica.
En un caso que la cantidad de bandas de frecuencia armónicas es menor o igual que T52 y el parámetro del valor pico máximo es menor o igual que T42, es decir, ninguna de las dos condiciones anteriores se cumple, en esta realización, la determinación también se puede realizar de acuerdo con un valor del contador de modo armónico. Si el valor del conteo de modo armónico es mayor que un valor T8 preestablecido, también se puede determinar que la
5 señal de banda ancha después de la conmutación de banda ancha es una señal armónica.
En esta realización, cuando se produce la conmutación de banda ancha en un codificador, un aparato de codificación puede determinar si una señal de banda ultra ancha antes de la conmutación de banda ancha es una señal armónica o una señal no armónica; si la señal de banda ultra ancha es una señal armónica, el aparato de codificación puede reducir un umbral determinante de una cantidad de bandas de frecuencia armónicas y/o un 10 parámetro del valor pico máximo, que se utiliza para representar componentes armónicos de una señal, a fin de determinar tanto como sea posible que una señal de banda ancha después de la conmutación de banda ancha es una señal armónica; si la señal de banda ultra ancha es una señal no armónica, el aparato de codificación puede aumentar el umbral determinante utilizado para la cantidad de bandas de frecuencia armónicas y/o un parámetro del valor pico máximo, a fin de determinar tanto como sea posible que la señal de banda ancha después de la 15 conmutación de banda ancha es una señal no armónica. Además, después de ajustar la condición determinante de señal armónica, aunque la señal de banda ancha después de la conmutación de banda ancha no cumpla la condición anterior, la determinación puede además realizarse con ayuda de un contador de modo armónico. Por lo tanto, en esta realización, durante la conmutación de banda ancha, no se cambia un tipo de señal tanto como sea posible y, por lo tanto, la continuidad de una señal de voz/audio recibida en un decodificador se puede garantizar
20 tanto como sea posible.
La FIG. 3 es un diagrama de flujo de una tercera realización de un método de procesamiento de señal de voz/audio de acuerdo con la presente invención. En esta realización, una primera señal de voz/audio de banda ancha es una señal de banda ancha, una segunda señal de voz/audio de banda ancha es una señal de banda ultra ancha, y la conmutación de banda ancha es conmutar desde la señal de banda ancha a la señal de banda ultra ancha. Como se
25 muestra en la FIG. 3, el método en esta realización puede incluir: Paso 301: Calcular una cantidad de bandas de frecuencia armónicas y un parámetro del valor pico máximo de una señal de banda ultra ancha después de la conmutación de banda ancha y actualizar un valor del conteo de modo armónico de acuerdo con la cantidad de bandas de frecuencia armónicas, el parámetro del valor pico máximo y una condición determinante de señal armónica para la señal de banda ultra ancha.
30 Para el paso 301, se refiere a la implementación anterior relacionada con un proceso de determinación de un tipo de señal de una señal de banda ultra ancha y, por lo tanto, no se proporcionan más detalles en el presente documento.
Paso 302. Determinar por defecto que la señal de banda ultra ancha no es una señal transitoria y determinar por defecto que una proporción de la energía global de la señal de banda ancha ultra con la energía global de una señal de banda ancha antes de la conmutación de banda ancha cae dentro de un rango preestablecido.
35 En esta realización, la conmutación de banda ancha es conmutar desde la señal de banda ancha a la señal de banda ultra ancha, la señal de banda ultra ancha incluye cuatro tipos de señales y se compara con la condición determinante de señal armónica para la señal de banda ancha, la proporción de la energía global de la señal de banda ultra ancha después de la conmutación de banda ancha con la energía global de la señal de banda ancha antes de la conmutación de banda ancha se añade como la condición determinante de señal armónica de la señal
40 de banda ultra ancha. Por lo tanto, en esta realización, para simplificar la condición determinante, puede no realizarse del paso 1 al paso 3 y se determina por defecto que la señal de banda ultra ancha después de la conmutación de banda ancha no es una señal transitoria en el paso 302, y también puede ser determinado por defecto que la proporción de la energía global de la señal de banda ultra ancha después de la conmutación de banda ancha con la energía global de la señal de banda ancha antes de la conmutación de banda ancha cae dentro
45 de un rango (T6, T7) preestablecido.
Paso 303. Determinar si una señal de banda ancha antes de la conmutación de banda ancha es una señal armónica. Si la señal de banda ancha antes de la conmutación de banda ancha es una señal armónica, realizar el paso 304; si la señal de banda ancha antes de la conmutación de banda ancha no es una señal armónica, realizar el paso 306.
50 Paso 304. Reducir al menos un umbral de un umbral de la cantidad de bandas de frecuencia armónicas y un umbral del parámetro del valor pico máximo en una condición determinante de señal armónica para la señal de banda ultra ancha.
Debido a que la señal de banda ancha antes de la conmutación de banda ancha es una señal armónica, una condición de determinar que la señal de banda ultra ancha después de la conmutación de banda ancha es una señal armónica necesita ser relajada en el paso 304. En esta realización, puede ser decrementado al menos un umbral del umbral T5 de la cantidad de bandas de frecuencia armónicas y del umbral T4 del parámetro del valor pico máximo de la condición determinante de señal armónica para la señal de banda ultra ancha. El umbral de la cantidad de bandas de frecuencia armónicas decrementado también se marca como T51 y el umbral del parámetro del valor pico máximo decrementado también se marca como T41.
Paso 305. Si la cantidad de bandas de frecuencia armónicas es mayor que un umbral de la cantidad de bandas de frecuencia armónicas decrementado y/o el parámetro del valor pico máximo es mayor que un umbral del parámetro del valor pico máximo decrementado, determinar que la señal de banda ultra ancha es una señal armónica.
Después de relajar la condición determinante de señal armónica, si se cumple cualquier condición de las dos condiciones, que la cantidad de bandas de frecuencia armónicas es mayor que el umbral de la cantidad de bandas frecuencia armónicas decrementado y el parámetro del valor pico máximo es mayor que el umbral del parámetro del valor pico máximo decrementado, se puede determinar que la señal de banda ultra ancha después de la conmutación de banda ancha es una señal armónica.
En un caso que la cantidad de bandas de frecuencia armónicas es menor o igual que T51 y el parámetro del valor pico máximo es menor o igual que T41, es decir, ninguna de las dos condiciones anteriores se cumple, en esta realización, la determinación también se puede realizar de acuerdo con un valor del contador de modo armónico. Si el valor del conteo de modo armónico es mayor que un valor T8 preestablecido, la señal de banda ultra ancha después de la conmutación de banda ancha es una señal armónica.
Paso 306. Incrementar al menos un umbral del umbral de la cantidad de bandas de frecuencia armónicas y del umbral del parámetro del valor pico máximo en una condición determinante de señal armónica para la señal de banda ultra ancha.
Paso 307. Si la cantidad de bandas de frecuencia armónicas es mayor que un umbral de la cantidad de bandas de frecuencia armónicas incrementado y/o el parámetro del valor pico máximo es mayor que un umbral del parámetro del valor pico máximo incrementado, determinar que la señal de banda ultra ancha es una señal armónica.
Después de que se incrementa la condición determinante de señal armónica, si se cumple cualquier condición de las dos condiciones, que la cantidad de bandas de frecuencia armónicas es mayor que el umbral T52 de la cantidad de bandas frecuencia armónicas incrementado y el parámetro del valor pico máximo es mayor que el umbral T42 del parámetro del valor pico máximo incrementado, se puede determinar que la señal de banda ultra ancha después de la conmutación de banda ancha es una señal armónica.
En un caso que la cantidad de bandas de frecuencia armónicas es menor o igual que T52 y el parámetro del valor pico máximo es menor o igual que T42, es decir, ninguna de los das condiciones anteriores se cumple, en esta realización, la determinación también se puede realizar de acuerdo con un valor del contador de modo armónico. Si el valor del conteo de modo armónico es mayor que un valor T8 preestablecido, también se puede determinar que la señal de banda ultra ancha después de la conmutación de banda ancha es una señal armónica.
Alternativamente, en esta realización, los pasos 1 a 3 también se puede realizar para determinar si la señal de banda ultra ancha después de la conmutación de banda ancha es una señal transitoria. Además, para asegurar la continuidad de la señal, se puede incrementar una condición determinante de señal transitoria en esta realización, de modo que se puede determinar que una señal de banda ultra ancha que en realidad tiene una característica transitoria relativamente significativa es una señal transitoria.
En la implementación real, un aparato de codificación puede utilizar el paso 1 anterior para calcular un parámetro de la envolvente de tiempo de la señal de banda ultra ancha e incrementar un umbral T1 de la envolvente de dominio del tiempo en el paso 2, donde un umbral de la envolvente incrementado puede ser marcado como T11; y, si el parámetro de la envolvente de tiempo es mayor que T11, se puede determinar que la señal de banda ultra ancha es una señal transitoria. Por ejemplo, si la señal de banda ancha antes de la conmutación de banda ancha es una señal armónica, se puede incrementar por tres veces el umbral de la envolvente; si la señal de banda ancha antes de la conmutación de banda ancha es una señal no armónica, se puede incrementar por dos veces el umbral de la envolvente.
5
10
15
20
25
30
35
40
45
50
En esta realización, cuando la conmutación de banda ancha se produce en un codificador, un aparato de codificación puede determinar si una señal de banda ancha antes de la conmutación de banda ancha es una señal armónica o una señal no armónica; si la señal de banda ancha es una señal armónica, el aparato de codificación puede reducir un umbral de determinación de una cantidad de bandas de frecuencia armónicas y/o un parámetro del valor pico máximo que se utilizan para representar componentes armónicas de una señal, a fin de determinar tanto como sea posible que una señal de banda ultra ancha después de la conmutación de banda ancha es una señal armónica; si la señal de banda ancha es una señal no armónica, el aparato de codificación puede aumentar un umbral de determinación utilizado para la cantidad de bandas de frecuencia armónicas y/o el parámetro del valor pico máximo, a fin de determinar tanto como sea posible que la señal de banda ultra ancha después de la conmutación de banda ancha es una señal no armónica. Además, después de ajustar la condición determinante de señal armónica, aunque la señal de banda ultra ancha después de la conmutación de banda ancha no cumpla la condición anterior, la determinación puede además realizarse con ayuda de un contador de modo armónico. Por lo tanto, en esta realización, durante la conmutación de banda ancha, un tipo de señal no se cambia tanto como sea posible y, por lo tanto, la continuidad de una señal de voz/audio recibida en un decodificador puede garantizarse tanto como sea posible.
La FIG. 4 es un diagrama de flujo de una cuarta realización de un método de procesamiento de señal de voz/audio basado en la conmutación de banda ancha de acuerdo con la presente invención. En esta realización, una primera señal de voz/audio de banda ancha es una señal de banda ultra ancha, una segunda señal de voz/audio de banda ancha es una señal de banda ancha y la conmutación de banda ancha es conmutar desde la señal de banda ultra ancha a la señal de banda ancha. Como se muestra en la FIG. 4, el método en esta realización puede incluir:
Paso 401. Calcular una cantidad de bandas de frecuencia armónicas y un parámetro del valor pico máximo de una señal de banda ancha después de la conmutación de banda ancha.
Paso 402. Actualizar un valor del conteo de modo armónico de acuerdo con la cantidad de bandas de frecuencia armónicas, el parámetro del valor pico máximo y una condición determinante de señal armónica para la señal de banda ancha.
Paso 403. Determinar si una señal de banda ultra ancha antes de la conmutación de banda ancha es una señal armónica. Si la señal de banda ultra ancha antes de la conmutación de banda ancha es una señal armónica, realizar el paso 404; si la señal de banda ultra ancha antes de la conmutación de banda ancha no es una señal armónica, realizar el paso 405.
Para el paso 401 al paso 403, se refiere a un proceso de realización del paso 201 al paso 203 en la realización mostrada en la FIG. 2 y, por lo tanto, no se proporcionan más detalles en el presente documento.
Paso 404. Determinar que la señal de banda ancha después de la conmutación de banda ancha es una señal armónica.
Paso 405. Determinar que la señal de banda ancha después de la conmutación de banda ancha es una señal no armónica.
Una diferencia entre esta realización y la realización del método mostrada en la FIG. 2 reside en que: en la realización del método mostrada en la FIG. 2, la determinación de si la señal de banda ancha después de la conmutación de banda ancha es una señal armónica se realiza ajustando un umbral de determinación de la condición determinante de señal armónica; en esta realización, la condición determinante de señal armónica se ajusta para que: siempre que una señal de banda ultra ancha antes de la conmutación de banda ancha es una señal armónica, también es determinada terminantemente que la señal de banda ancha después de la conmutación de banda ancha es una señal armónica; siempre que la señal de banda ultra ancha antes de la conmutación de banda ancha es una señal no armónica, también se determina terminantemente que la señal de banda ancha después de la conmutación de banda ancha es una señal no armónica.
En esta realización, cuando se produce la conmutación de banda ancha en un codificador, un aparato de codificación puede determinar si una señal de banda ultra ancha antes de la conmutación de banda ancha es una señal armónica o una señal no armónica, y si la señal de banda ultra ancha es una señal armónica, el aparato de codificación determina terminantemente que una señal de banda ancha después de la conmutación de banda ancha es una señal armónica; si la señal de banda ultra ancha es una señal no armónica, el aparato de codificación determina terminantemente que una señal de banda ancha después de la conmutación de banda ancha es una señal no armónica. Por lo tanto, en esta realización, durante la conmutación de banda ancha, no se cambia un tipo de señal y, por lo tanto, se puede garantizar la continuidad de una señal de voz/audio tanto como sea posible para una señal de voz/audio recibida en un decodificador.
La FIG. 5 es un diagrama de flujo de una quinta realización de un método de procesamiento de señal de voz/audio basado en la conmutación de banda ancha de acuerdo con la presente invención. En esta realización, una primera señal de voz/audio de banda ancha es una señal de banda ancha, una segunda señal de voz/audio de banda ancha es una señal de banda ultra ancha y la conmutación de banda ancha es conmutar desde la señal de banda ancha a
5 la señal de banda ultra ancha. Como se muestra en la FIG. 5, el método en esta realización puede incluir:
Paso 501: Calcular una cantidad de bandas de frecuencia armónicas y un parámetro del valor pico máximo de una señal de banda ultra ancha después de la conmutación de banda ancha y actualizar un valor del conteo de modo armónico de acuerdo con la cantidad de bandas de frecuencia armónicas, el parámetro del valor pico máximo y una condición determinante de señal armónica para la señal de banda ultra ancha.
10 Paso 502. Determinar por defecto que la señal de banda ultra ancha no es una señal transitoria y determinar por defecto que una proporción de la energía global de la señal de banda ultra ancha con la energía global de una señal de banda ancha antes de la conmutación de banda ancha cae dentro de un rango preestablecido. Paso 503. Determinar si una señal de banda ancha antes de la conmutación de banda ancha es una señal
15 armónica. Si la señal de banda ancha antes de la conmutación de banda ancha es una señal armónica, realizar el paso 504; si la señal de banda ancha antes de la conmutación de banda ancha no es una señal armónica, realizar el paso 505.
Para el paso 501 al paso 503, se refiere a un proceso de realización del paso 301 al paso 303 en la realización mostrada en la FIG. 3 y, por lo tanto, no se proporcionan más detalles en el presente documento.
20 Paso 504. Determinar que la señal de banda ultra ancha después de la conmutación de banda ancha es una señal armónica.
Paso 505. Determinar que la señal de banda ultra ancha después de la conmutación de banda ancha es una señal no armónica.
Una diferencia entre esta realización y la realización del método mostrada en la FIG. 3 reside en que: en la
25 realización del método mostrada en la FIG. 3, la determinación de si la señal de banda ultra ancha después de la conmutación de banda ancha es una señal armónica se realiza ajustando un umbral de determinación en la condición determinante de señal armónica; en esta realización, la condición determinante de señal armónica se ajusta para que: siempre que la señal de banda ancha antes de la conmutación de banda ancha es una señal armónica, también se determina terminantemente que la señal de banda ultra ancha después de la conmutación de
30 banda ancha es una señal armónica; siempre que la señal de banda ancha antes de la conmutación de banda ancha es una señal no armónica, también se determina terminantemente que la señal de banda ultra ancha después de la conmutación de banda ancha es una señal no armónica.
En esta realización, cuando se produce la conmutación de banda ancha en un codificador, un aparato de codificación puede determinar si una señal de banda ancha antes de la conmutación de banda ancha es una señal 35 armónica o una señal no armónica, y si la señal de banda ancha es una señal armónica, el aparato de codificación determina terminantemente que una señal de banda ultra ancha después de la conmutación de banda ancha es una señal armónica; si la señal de banda ancha es una señal no armónica, el aparato de codificación determina terminantemente que una señal de banda ultra ancha después de la conmutación de banda ancha es una señal no armónica. Por lo tanto, en esta realización, durante la conmutación de banda ancha, no se cambia un tipo de señal
40 y, por lo tanto, se puede garantizar la continuidad de una señal de voz/audio tanto como sea posible para una señal de voz/audio recibida en un decodificador.
Asociado con las realizaciones del método, la presente invención proporciona además un aparato de codificación, donde el aparato puede estar ubicado en un dispositivo terminal, un dispositivo de red o un dispositivo de prueba. El aparato de codificación puede ser implementado mediante circuitos de hardware o ser implementado por software
45 que trabaja con el hardware. Por ejemplo, con referencia a la FIG. 6, un procesador invoca a un aparato de codificación para implementar el procesamiento de una señal de voz/audio. El aparato de codificación puede realizar diversos métodos y procesos en las realizaciones de método. El aparato de codificación puede incluir un módulo de ajuste de la condición determinante y un módulo de determinación del tipo de señal.
La FIG. 7 es un diagrama estructural esquemático de una primera realización de un aparato de codificación de
50 acuerdo con la presente invención. Como se muestra en la FIG. 7, el aparato de codificación en esta realización incluye: un módulo de ajuste de la condición determinante 11 y un módulo de determinación del tipo de señal 12. El módulo de ajuste de la condición determinante 11 está configurado para: si una primera señal de voz/audio de
5
10
15
20
25
30
35
40
45
50
banda ancha es una señal armónica, ajustar una condición determinante para determinar que una segunda señal de voz/audio de banda ancha es una señal armónica, para obtener una primera condición determinante a fin de aumentar una posibilidad de determinar que la segunda señal de voz/audio de banda ancha es una señal armónica, donde la primera señal de voz/audio de banda ancha es una señal de voz/audio antes de la conmutación de banda ancha y la segunda señal de voz/audio de banda ancha es una señal de voz/audio después de la conmutación de banda ancha. El módulo de determinación del tipo de señal 12 está configurado para determinar, de acuerdo con la primera condición determinante, si la segunda señal de voz/audio de banda ancha es una señal armónica.
En concreto, el módulo de ajuste de la condición determinante 11 está configurado para relajar la condición determinante para determinar que la segunda señal de voz/audio de banda ancha es una señal armónica, donde se utiliza una condición determinante relajada como la primera condición determinante.
La FIG. 8 es un diagrama estructural esquemático de una segunda realización de un aparato de codificación de acuerdo con la presente invención. Como se muestra en la FIG. 8, además de los módulos del aparato mostrado en la FIG. 7, el aparato en esta realización incluye además: un módulo de actualización del modo armónico 13.
En esta realización, el módulo de ajuste de la condición determinante 11 está configurado específicamente para reducir al menos un umbral de un umbral de la cantidad de bandas de frecuencia armónicas y un umbral del parámetro del valor pico máximo en la condición determinante para determinar que la segunda señal de voz/audio de banda ancha es una señal armónica; y, correspondientemente, el módulo de determinación del tipo de señal 12 puede incluir: una unidad de cálculo 121 y una unidad de procesamiento 122, donde la unidad de cálculo 121 está configurada para calcular una cantidad de bandas de frecuencia armónicas y un parámetro del valor pico máximo de la segunda señal de voz/audio de banda ancha, y la unidad de procesamiento 122 está configurada para, si la cantidad de bandas de frecuencia armónicas es mayor que un umbral de la cantidad de bandas de frecuencia armónicas decrementado y/o el parámetro del valor pico máximo es mayor que un umbral del parámetro del valor pico máximo decrementado, determinar que la segunda señal de voz/audio de banda ancha es una señal armónica.
El módulo de actualización del modo armónico 13 está configurado para actualizar un valor del conteo de modo armónico de acuerdo con una relación entre la cantidad de bandas de frecuencia armónicas, el parámetro del valor pico máximo y la condición determinante para determinar que la segunda señal de voz/audio de banda ancha es una señal armónica; y, correspondientemente, el módulo de determinación del tipo de señal 12 está configurado además para, si la cantidad de bandas de frecuencia armónicas es menor o igual que el umbral de la cantidad de bandas frecuencia armónicas decrementado y el parámetro del valor pico máximo es menor o igual que el umbral del parámetro del valor pico máximo decrementado, determinar que la segunda señal de voz/audio de banda ancha es una señal armónica.
Además, el módulo de actualización del modo armónico 13 está configurado específicamente para: si la cantidad de bandas de frecuencia armónicas es mayor que el umbral de la cantidad de bandas de frecuencia armónicas y el parámetro del valor pico máximo es mayor que el umbral del parámetro del valor pico máximo, incrementar el valor del conteo de modo armónico; y, si la cantidad de bandas de frecuencia armónicas es menor o igual que el umbral de la cantidad de bandas frecuencia armónicas y/o el parámetro del valor pico máximo es menor o igual que el umbral del parámetro del valor pico máximo, decrementar el valor del conteo de modo armónico.
En un caso que la conmutación de banda ancha es conmutar desde una señal de banda ancha a una señal de banda ultra ancha, es decir, la primera señal de voz/audio de banda ancha es una señal de banda ancha y la segunda señal de voz/audio de banda ancha es una señal de banda ultra ancha, el módulo de ajuste de la condición determinante 11 está configurado además para calcular un parámetro de la envolvente de tiempo de la señal de banda ultra ancha e incrementar un umbral de la envolvente en una condición determinante de señal transitoria; si el parámetro de la envolvente de tiempo es mayor o igual que un umbral de la envolvente incrementado, determinar que la señal de banda ultra ancha es una señal transitoria; y, si el parámetro de la envolvente de tiempo es menor que el umbral de la envolvente incrementado, determinar por defecto que la señal de banda ultra ancha no es una señal transitoria y determinar por defecto que una proporción de la energía global de la señal de banda ultra ancha con la energía global de la señal de banda ancha cae dentro de un rango preestablecido. En la implementación real, el módulo de ajuste de la condición determinante 11 está configurado específicamente para: si la señal de banda ancha es una señal armónica, incrementar por tres veces el umbral de la envolvente; y, si la señal de banda ancha es una señal no armónica, incrementar por dos veces el umbral de la envolvente.
En otra realización del aparato de codificación de acuerdo con la presente invención, basado en la realización del aparato de codificación mostrado en la FIG. 7, el módulo de determinación del tipo de señal 12 pueden estar
5
10
15
20
25
30
35
configurado específicamente para determinar, de acuerdo con la primera condición determinante, que la segunda señal de voz/audio de banda ancha es una señal armónica; o, el módulo de determinación del tipo de señal 12 está configurado además para: si la primera señal de voz/audio de banda ancha no es una señal armónica, determinar que la segunda señal de voz/audio de banda ancha es una señal no armónica.
Todavía en otra realización del aparato de codificación de acuerdo con la presente invención, basado en la realización del aparato de codificación mostrado en la FIG. 7, el módulo de ajuste de la condición determinante 11 está configurado además para: si la primera señal de voz/audio de banda ancha no es una señal armónica, ajustar la condición determinante de señal armónica para obtener una segunda condición determinante, a fin de reducir la posibilidad de determinar que la segunda señal de voz/audio de banda ancha es una señal armónica; y, correspondientemente, el módulo de determinación del tipo de señal 12 está configurado además para determinar, de acuerdo con la segunda condición determinante, si la segunda señal de voz/audio de banda ancha es una señal armónica. Específicamente, el módulo de ajuste de la condición determinante 11 está configurado para incrementar al menos un umbral del umbral de la cantidad de bandas de frecuencia armónicas y del umbral del parámetro del valor pico máximo en la condición determinante para determinar que la segunda señal de voz/audio de banda ancha es una señal armónica; y, correspondientemente, el módulo de determinación del tipo de señal 12 está configurado específicamente para: si la cantidad de bandas de frecuencia armónicas es mayor que un umbral de la cantidad de bandas de frecuencia armónicas incrementado y/o el parámetro del valor pico máximo es mayor que un umbral del parámetro del valor pico máximo incrementado, determinar que la segunda señal de voz/audio de banda ancha es una señal armónica.
El aparato de codificación en las realizaciones anteriores de la presente invención puede realizar correspondientemente las soluciones técnicas en las realizaciones del método mostradas en la FIG. 1 a la FIG. 5, y los principios de implementación y efectos técnicos en las realizaciones del aparato de codificación son similares a los de las realizaciones del método. Por lo tanto, no se proporcionan más detalles en el presente documento.
Una persona con experiencia ordinaria en la técnica pueden entender que la totalidad o una parte de los pasos de las realizaciones del método pueden ser implementados por un programa de instrucciones a hardware pertinente. El programa se puede almacenar en un medio de almacenamiento legible por ordenador. Cuando se ejecuta el programa, se realizan los pasos de las realizaciones del método. El medio de almacenamiento anterior incluye: cualquier medio que pueda almacenar código de programa, tal como una ROM, una RAM, un disco magnético o un disco óptico.
Por último, cabe destacar que las realizaciones anteriores están destinadas meramente para describir las soluciones técnicas de la presente invención, pero no para limitar la presente invención. Aunque la presente invención se describe en detalle con referencia a las realizaciones anteriores, las personas con experiencia ordinaria en la técnica deben entender que todavía pueden hacer modificaciones a las soluciones técnicas descritas en las realizaciones anteriores o hacer sustituciones equivalentes a algunas de las características técnicas de las mismas, sin apartarse del alcance de las soluciones técnicas de las realizaciones de la presente invención.
Claims (12)
-
imagen1 REIVINDICACIONES1. Un método de procesamiento de señal de voz/audio, que comprende: si una primera señal de voz/audio de banda ancha es una señal armónica, ajustar una condición determinante para determinar que una segunda señal de voz/audio de banda ancha es una señal armónica, para5 obtener una primera condición determinante, a fin de aumentar una posibilidad de determinar que la segunda señal de voz/audio de banda ancha es una señal armónica, en donde la primera señal de voz/audio de banda ancha es una señal de voz/audio antes de la conmutación de banda ancha y la segunda señal de voz/audio de banda ancha es una señal de voz/audio después de la conmutación de banda ancha; ydeterminar, de acuerdo con la primera condición determinante, si la segunda señal de voz/audio de banda 10 ancha es una señal armónica. - 2. El método de acuerdo con la reivindicación 1, en donde el ajuste de una condición determinante para determinar que una segunda señal de voz/audio de banda ancha es una señal armónica, para obtener una primera condición determinante, a fin de aumentar una posibilidad de determinar que la segunda señal de voz/audio de banda ancha es una señal armónica comprende:15 relajar la condición determinante para determinar que la segunda señal de voz/audio de banda ancha es una señal armónica, en donde una condición determinante relajada se utiliza como la primera condición determinante.
- 3. El método de acuerdo con la reivindicación 2, en donde la relajación de la condición determinante para determinar que la segunda señal de voz/audio de banda ancha es una señal armónica comprende:20 decrementar al menos un umbral de un umbral de la cantidad de bandas de frecuencia armónicas y un umbral del parámetro del valor pico máximo en la condición determinante para determinar que la segunda señal de voz/audio de banda ancha es una señal armónica; yla determinación, de acuerdo con la primera condición determinante, de si la segunda señal de voz/audio de banda ancha es una señal armónica comprende: 25 calcular una cantidad de bandas de frecuencia armónicas y un parámetro del valor pico máximo de la segunda señal de voz/audio de banda ancha; ysi la cantidad de bandas de frecuencia armónicas es mayor que un umbral de la cantidad de bandas de frecuencia armónicas decrementado y/o el parámetro del valor pico máximo es mayor que un umbral del parámetro del valor pico máximo decrementado, determinar que la segunda señal de voz/audio de banda ancha es una señal30 armónica.
- 4. El método de acuerdo con la reivindicación 3, que comprende además:actualizar un valor del conteo de modo armónico de acuerdo con una relación entre la cantidad de bandasde frecuencia armónicas, el parámetro del valor pico máximo y la condición determinante para determinar que lasegunda señal de voz/audio de banda ancha es una señal armónica; y35 si la cantidad de bandas de frecuencia armónicas es menor o igual que el umbral de la cantidad de bandas frecuencia armónicas decrementado y el parámetro del valor pico máximo es menor o igual que el umbral del parámetro del valor pico máximo decrementado, el método comprende además:si el valor del conteo de modo armónico es mayor que un valor preestablecido, determinar que la segunda señal de voz/audio de banda ancha es una señal armónica.40 5. El método de acuerdo con la reivindicación 4, en donde la actualización de un valor del conteo de modo armónico de acuerdo con una relación entre la cantidad de bandas de frecuencia armónicas, el parámetro del valor pico máximo y la condición determinante para determinar que la segunda señal de voz/audio de banda ancha es una señal armónica comprende:si la cantidad de bandas de frecuencia armónicas es mayor que el umbral de la cantidad de bandas de 45 frecuencia armónicas y el parámetro del valor pico máximo es mayor que el umbral del parámetro del valor pico máximo, incrementar el valor del conteo de modo armónico; ysi la cantidad de bandas de frecuencia armónicas es menor o igual que el umbral de la cantidad de bandas frecuencia armónicas y/o el parámetro del valor pico máximo es menor o igual que el umbral del parámetro del valor pico máximo, decrementar el valor del conteo de modo armónico.50 6. El método de acuerdo con la reivindicación 4 o 5, en donde la primera señal de voz/audio de banda ancha es una señal de banda ancha, la segunda señal de voz/audio de banda ancha es una señal de banda ultra ancha y antes de la determinación, de acuerdo con la primera condición determinante, de si la segunda señal de voz/audio de banda ancha es una señal armónica, el método comprende además:16
imagen2 calcular un parámetro de la envolvente de tiempo de la señal de banda ultra ancha e incrementar un umbral de la envolvente en una condición determinante de señal transitoria; si el parámetro de la envolvente de tiempo es mayor o igual que un umbral de la envolvente incrementado, determinar que la señal de banda ultra ancha es una señal transitoria; y5 si el parámetro de la envolvente de tiempo es menor que el umbral de la envolvente incrementado, determinar por defecto que la señal de banda ultra ancha no es una señal transitoria y determinar por defecto que una proporción de la energía global de la señal de banda ultra ancha con la energía global de la señal de banda ancha cae dentro de un rango preestablecido. - 7. El método de acuerdo con la reivindicación 6, en donde el incremento de un umbral de la envolvente en una10 condición determinante de señal transitoria es específicamente que: si la señal de banda ancha es una señal armónica, incrementar por tres veces el umbral de la envolvente; y si la señal de banda ancha es una señal no armónica, incrementar por dos veces el umbral de laenvolvente.
- 8. El método de acuerdo con la reivindicación 1 o 2, en donde la determinación, de acuerdo con la primera condición 15 determinante, de si la segunda señal de voz/audio de banda ancha es una señal armónica comprende:determinar, de acuerdo con la primera condición determinante, que la segunda señal de voz/audio de banda ancha es una señal armónica.
- 9. El método de acuerdo con una cualquiera de las reivindicaciones 1 a 8, que comprende además: si la primera señal de voz/audio de banda ancha no es una señal armónica, ajustar una condición20 determinante de la determinación de que una segunda señal de voz/audio de banda ancha es una señal armónica para obtener una segunda condición determinante, a fin de reducir la posibilidad de determinar que la segunda señal de voz/audio de banda ancha es una señal armónica; ydeterminar, de acuerdo con la segunda condición determinante, si la segunda señal de voz/audio de banda ancha es una señal armónica.25 10. El método de acuerdo con la reivindicación 9, en donde el ajuste de la condición determinante de la determinación de que una segunda señal de voz/audio de banda ancha es una señal armónica para obtener una segunda condición determinante, a fin de reducir la posibilidad de determinar que la segunda señal de voz/audio de banda ancha es una señal armónica comprende:incrementar al menos un umbral de un umbral de la cantidad de bandas de frecuencia armónicas y un 30 umbral del parámetro del valor pico máximo en la condición determinante para determinar que la segunda señal de voz/audio de banda ancha es una señal armónica; y la determinación, de acuerdo con la segunda condición determinante, de si la segunda señal de voz/audio de banda ancha es una señal armónica comprende: si la cantidad de bandas de frecuencia armónicas es mayor que un umbral de la cantidad de bandas de35 frecuencia armónicas incrementado y/o el parámetro del valor pico máximo es mayor que un umbral del parámetro del valor pico máximo incrementado, determinar que la segunda señal de voz/audio de banda ancha es una señal armónica.
- 11. El método de acuerdo con una cualquiera de las reivindicaciones 1 a 8, que comprende además:si la primera señal de voz/audio de banda ancha no es una señal armónica, determinar que la segunda 40 señal de voz/audio de banda ancha es una señal no armónica.
- 12. Un aparato de codificación, que comprende:un módulo de ajuste de la condición determinante, configurado para: si una primera señal de voz/audio de banda ancha es una señal armónica, ajustar una condición determinante para determinar que una segunda señal de voz/audio de banda ancha es una señal armónica, para obtener una primera condición determinante, a fin de45 aumentar una posibilidad de determinar que la segunda señal de voz/audio de banda ancha es una señal armónica, en donde la primera señal de voz/audio de banda ancha es una señal de voz/audio antes de la conmutación de banda ancha y la segunda señal de voz/audio de banda ancha es una señal voz/audio después de la conmutación de banda ancha; yun módulo de determinación del tipo de señal, configurado para determinar, de acuerdo con la primera 50 condición determinante, si la segunda señal de voz/audio de banda ancha es una señal armónica.
- 13. El aparato de acuerdo con la reivindicación 12, en donde el módulo de ajuste de la condición determinante está configurado específicamente para relajar la condición determinante para determinar que la segunda señal de17
imagen3 voz/audio de banda ancha es una señal armónica, en donde una condición determinante relajada se utiliza como la primera condición determinante. - 14. El aparato de acuerdo con la reivindicación 13, en donde el módulo de ajuste de la condición determinante está configurado específicamente para reducir al menos un umbral de un umbral de la cantidad de bandas de frecuencia 5 armónicas y un umbral del parámetro del valor pico máximo en la condición determinante para determinar que lasegunda señal de voz/audio de banda ancha es una señal armónica; y el módulo de determinación del tipo de señal comprende: una unidad de cálculo, configurada para calcular una cantidad de bandas de frecuencia armónicas y unparámetro del valor pico máximo de la segunda señal de voz/audio de banda ancha; y10 una unidad de procesamiento, configurada para: si la cantidad de bandas de frecuencia armónicas es mayor que un umbral de la cantidad de bandas de frecuencia armónicas decrementado y/o el parámetro del valor pico máximo es mayor que un umbral del parámetro del valor pico máximo decrementado, determinar que la segunda señal de voz/audio de banda ancha es una señal armónica.
- 15. El aparato de acuerdo con la reivindicación 14, en donde el aparato comprende además:15 un módulo de actualización del modo armónico, configurado para actualizar un valor del conteo de modo armónico de acuerdo con una relación entre la cantidad de bandas de frecuencia armónicas, el parámetro del valor pico máximo y la condición determinante para determinar que la segunda señal de voz/audio de banda ancha es una señal armónica; yel módulo de determinación del tipo de señal está configurado además para: si la cantidad de bandas de20 frecuencia armónicas es menor o igual que el umbral de la cantidad de bandas de frecuencia armónicas decrementado, el parámetro del valor pico máximo es menor o igual que el umbral del parámetro del valor pico máximo decrementado y el valor del conteo de modo armónico es mayor que un valor predeterminado, determinar que la segunda señal de voz/audio de banda ancha es una señal armónica.18
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210223014.0A CN103516440B (zh) | 2012-06-29 | 2012-06-29 | 语音频信号处理方法和编码装置 |
CN201210223014 | 2012-06-29 | ||
PCT/CN2013/076862 WO2014000559A1 (zh) | 2012-06-29 | 2013-06-06 | 语音频信号处理方法和编码装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2654488T3 true ES2654488T3 (es) | 2018-02-13 |
Family
ID=49782211
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES17195365T Active ES2779857T3 (es) | 2012-06-29 | 2013-06-06 | Método de procesamiento de señal de voz/audio y aparato de codificación |
ES13810131.6T Active ES2654488T3 (es) | 2012-06-29 | 2013-06-06 | Método de procesamiento para señales de voz o audio y aparato de codificación de las mismas |
ES20150138T Active ES2930240T3 (es) | 2012-06-29 | 2013-06-06 | Método de procesamiento de señal de voz/audio y aparato de codificación |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES17195365T Active ES2779857T3 (es) | 2012-06-29 | 2013-06-06 | Método de procesamiento de señal de voz/audio y aparato de codificación |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES20150138T Active ES2930240T3 (es) | 2012-06-29 | 2013-06-06 | Método de procesamiento de señal de voz/audio y aparato de codificación |
Country Status (7)
Country | Link |
---|---|
US (2) | US10056090B2 (es) |
EP (3) | EP2851897B1 (es) |
JP (3) | JP6359529B2 (es) |
KR (6) | KR101689138B1 (es) |
CN (1) | CN103516440B (es) |
ES (3) | ES2779857T3 (es) |
WO (1) | WO2014000559A1 (es) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103516440B (zh) | 2012-06-29 | 2015-07-08 | 华为技术有限公司 | 语音频信号处理方法和编码装置 |
US9741349B2 (en) * | 2014-03-14 | 2017-08-22 | Telefonaktiebolaget L M Ericsson (Publ) | Audio coding method and apparatus |
CN106303878A (zh) * | 2015-05-22 | 2017-01-04 | 成都鼎桥通信技术有限公司 | 一种啸叫检测和抑制方法 |
US10431242B1 (en) * | 2017-11-02 | 2019-10-01 | Gopro, Inc. | Systems and methods for identifying speech based on spectral features |
Family Cites Families (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3070698D1 (en) * | 1979-05-28 | 1985-07-04 | Univ Melbourne | Speech processor |
US5574724A (en) * | 1995-05-26 | 1996-11-12 | Lucent Technologies Inc. | Adjustment of call bandwidth during a communication call |
US20050065786A1 (en) * | 2003-09-23 | 2005-03-24 | Jacek Stachurski | Hybrid speech coding and system |
FI115329B (fi) | 2000-05-08 | 2005-04-15 | Nokia Corp | Menetelmä ja järjestely lähdesignaalin kaistanleveyden vaihtamiseksi tietoliikenneyhteydessä, jossa on valmiudet useisiin kaistanleveyksiin |
KR100462611B1 (ko) * | 2002-06-27 | 2004-12-20 | 삼성전자주식회사 | 하모닉 성분을 이용한 오디오 코딩방법 및 장치 |
FI119533B (fi) | 2004-04-15 | 2008-12-15 | Nokia Corp | Audiosignaalien koodaus |
US7848925B2 (en) * | 2004-09-17 | 2010-12-07 | Panasonic Corporation | Scalable encoding apparatus, scalable decoding apparatus, scalable encoding method, scalable decoding method, communication terminal apparatus, and base station apparatus |
KR100707174B1 (ko) * | 2004-12-31 | 2007-04-13 | 삼성전자주식회사 | 광대역 음성 부호화 및 복호화 시스템에서 고대역 음성부호화 및 복호화 장치와 그 방법 |
US8311840B2 (en) * | 2005-06-28 | 2012-11-13 | Qnx Software Systems Limited | Frequency extension of harmonic signals |
DE602006018618D1 (de) | 2005-07-22 | 2011-01-13 | France Telecom | Verfahren zum umschalten der raten- und bandbreitenskalierbaren audiodecodierungsrate |
CA2558595C (en) * | 2005-09-02 | 2015-05-26 | Nortel Networks Limited | Method and apparatus for extending the bandwidth of a speech signal |
KR101131880B1 (ko) * | 2007-03-23 | 2012-04-03 | 삼성전자주식회사 | 오디오 신호의 인코딩 방법 및 장치, 그리고 오디오 신호의디코딩 방법 및 장치 |
BRPI0818927A2 (pt) * | 2007-11-02 | 2015-06-16 | Huawei Tech Co Ltd | Método e aparelho para a decodificação de áudio |
EP3261090A1 (en) * | 2007-12-21 | 2017-12-27 | III Holdings 12, LLC | Encoder, decoder, and encoding method |
CN101662288B (zh) * | 2008-08-28 | 2012-07-04 | 华为技术有限公司 | 音频编码、解码方法及装置、系统 |
US8515747B2 (en) * | 2008-09-06 | 2013-08-20 | Huawei Technologies Co., Ltd. | Spectrum harmonic/noise sharpness control |
CN101763856B (zh) * | 2008-12-23 | 2011-11-02 | 华为技术有限公司 | 信号分类处理方法、分类处理装置及编码系统 |
JP4945586B2 (ja) * | 2009-02-02 | 2012-06-06 | 株式会社東芝 | 信号帯域拡張装置 |
CN101964189B (zh) | 2010-04-28 | 2012-08-08 | 华为技术有限公司 | 语音频信号切换方法及装置 |
WO2011156905A2 (en) * | 2010-06-17 | 2011-12-22 | Voiceage Corporation | Multi-rate algebraic vector quantization with supplemental coding of missing spectrum sub-bands |
US9236063B2 (en) * | 2010-07-30 | 2016-01-12 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for dynamic bit allocation |
CN107068156B (zh) * | 2011-10-21 | 2021-03-30 | 三星电子株式会社 | 帧错误隐藏方法和设备以及音频解码方法和设备 |
EP2772911B1 (en) * | 2011-10-24 | 2017-12-20 | LG Electronics Inc. | Method and device for quantizing voice signals in a band-selective manner |
GB2502800B (en) * | 2012-06-07 | 2015-05-20 | Jaguar Land Rover Ltd | Crane and related method of operation |
CN103516440B (zh) * | 2012-06-29 | 2015-07-08 | 华为技术有限公司 | 语音频信号处理方法和编码装置 |
MX353240B (es) * | 2013-06-11 | 2018-01-05 | Fraunhofer Ges Forschung | Dispositivo y método para extensión de ancho de banda para señales acústicas. |
US9564141B2 (en) * | 2014-02-13 | 2017-02-07 | Qualcomm Incorporated | Harmonic bandwidth extension of audio signals |
US9697843B2 (en) * | 2014-04-30 | 2017-07-04 | Qualcomm Incorporated | High band excitation signal generation |
-
2012
- 2012-06-29 CN CN201210223014.0A patent/CN103516440B/zh active Active
-
2013
- 2013-06-06 JP JP2015518805A patent/JP6359529B2/ja active Active
- 2013-06-06 KR KR1020157000174A patent/KR101689138B1/ko active IP Right Grant
- 2013-06-06 ES ES17195365T patent/ES2779857T3/es active Active
- 2013-06-06 KR KR1020197021968A patent/KR102165827B1/ko active IP Right Grant
- 2013-06-06 EP EP13810131.6A patent/EP2851897B1/en active Active
- 2013-06-06 KR KR1020187028697A patent/KR102005967B1/ko active IP Right Grant
- 2013-06-06 EP EP20150138.4A patent/EP3748634B1/en active Active
- 2013-06-06 KR KR1020207028813A patent/KR102331531B1/ko active IP Right Grant
- 2013-06-06 WO PCT/CN2013/076862 patent/WO2014000559A1/zh active Application Filing
- 2013-06-06 EP EP17195365.6A patent/EP3376499B1/en active Active
- 2013-06-06 ES ES13810131.6T patent/ES2654488T3/es active Active
- 2013-06-06 ES ES20150138T patent/ES2930240T3/es active Active
- 2013-06-06 KR KR1020177030314A patent/KR101907494B1/ko active Application Filing
- 2013-06-06 KR KR1020167035415A patent/KR101790680B1/ko active IP Right Grant
-
2014
- 2014-12-05 US US14/562,494 patent/US10056090B2/en active Active
-
2017
- 2017-03-29 JP JP2017066354A patent/JP6612808B2/ja active Active
-
2018
- 2018-07-31 US US16/051,139 patent/US11107486B2/en active Active
-
2019
- 2019-10-31 JP JP2019198664A patent/JP6892491B2/ja active Active
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2741849T3 (es) | Procedimiento y aparato de procesamiento de señales de voz/audio | |
ES2822607T3 (es) | Método de predicción y dispositivo de codificación/decodificación para una señal de banda de alta frecuencia | |
ES2770831T3 (es) | Métodos y dispositivos de codificación y descodificación de señal | |
RU2673847C2 (ru) | Системы и способы передачи избыточной информации кадра | |
ES2813956T3 (es) | Método de predicción y dispositivo de decodificación para la señal de la banda de expansión del ancho de banda | |
ES2654488T3 (es) | Método de procesamiento para señales de voz o audio y aparato de codificación de las mismas | |
KR101548846B1 (ko) | 워터마킹된 신호의 적응적 인코딩 및 디코딩을 위한 디바이스 | |
BRPI0915358B1 (pt) | método e aparelho para a ocultação de erro de quadro em dados de áudio codificados usando codificação de extensão | |
US20160027445A1 (en) | Stereo audio signal encoder | |
ES2564633T3 (es) | Sistemas y métodos de normalización dinámica para reducir la pérdida de precisión para señales de bajo nivel | |
ES2975073T3 (es) | Codificador, descodificador, procedimiento de codificación, procedimiento de descodificación y programa | |
ES2969736T3 (es) | Dispositivo de decodificación y método de decodificación | |
JP2014507681A (ja) | 帯域幅を拡張する方法および装置 | |
ES2889929T3 (es) | Estimación de compensación temporal | |
WO2015165264A1 (zh) | 处理信号的方法及设备 | |
US20200265856A1 (en) | Speech-to-text conversion based on quality metric | |
WO2024179056A1 (zh) | 音频信号的处理方法及相关装置 | |
WO2024179055A1 (zh) | 音频编解码方法及相关装置 | |
ES2737889T3 (es) | Codificador, decodificador, procedimiento de codificación, procedimiento de decodificación y programa | |
TW202411983A (zh) | 量化方法、反量化方法及其裝置 | |
KR20240017915A (ko) | 인코딩 방법과 장치, 디코딩 방법과 장치, 디바이스, 저장 매체 및 컴퓨터 프로그램 |