ES2822607T3 - Método de predicción y dispositivo de codificación/decodificación para una señal de banda de alta frecuencia - Google Patents
Método de predicción y dispositivo de codificación/decodificación para una señal de banda de alta frecuencia Download PDFInfo
- Publication number
- ES2822607T3 ES2822607T3 ES13873224T ES13873224T ES2822607T3 ES 2822607 T3 ES2822607 T3 ES 2822607T3 ES 13873224 T ES13873224 T ES 13873224T ES 13873224 T ES13873224 T ES 13873224T ES 2822607 T3 ES2822607 T3 ES 2822607T3
- Authority
- ES
- Spain
- Prior art keywords
- signal
- frequency band
- frequency
- band signal
- envelope
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 90
- 230000005236 sound signal Effects 0.000 claims abstract description 87
- 238000001228 spectrum Methods 0.000 claims abstract description 46
- 230000005284 excitation Effects 0.000 description 98
- 238000012545 processing Methods 0.000 description 50
- 238000013139 quantization Methods 0.000 description 31
- 230000008569 process Effects 0.000 description 30
- 238000010586 diagram Methods 0.000 description 27
- 238000005516 engineering process Methods 0.000 description 13
- 238000004364 calculation method Methods 0.000 description 11
- 238000011156 evaluation Methods 0.000 description 11
- 230000009466 transformation Effects 0.000 description 11
- 238000004891 communication Methods 0.000 description 9
- 238000000605 extraction Methods 0.000 description 8
- 238000012986 modification Methods 0.000 description 6
- 230000004048 modification Effects 0.000 description 6
- 238000010606 normalization Methods 0.000 description 5
- 239000004606 Fillers/Extenders Substances 0.000 description 3
- 230000006835 compression Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 230000003595 spectral effect Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000005055 memory storage Effects 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012806 monitoring device Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Un método para predecir una señal de banda de alta frecuencia, que comprende: adquirir (200) un tipo de señal de una señal de audio y una señal de banda de baja frecuencia de la señal de audio; obtener (201) una envolvente de frecuencia de cada subbanda de una señal de banda de alta frecuencia de la señal de audio según el tipo de señal, en donde la señal de banda de alta frecuencia de la señal de audio comprende múltiples coeficientes de espectro, los múltiples coeficientes de espectro se clasifican en múltiples subbandas, cada una de las múltiples subbandas comprende múltiples coeficientes de espectro, y una envolvente de frecuencia de una subbanda se calcula basada en los coeficientes de espectro de la subbanda; y enviar (202) un flujo de bits que transporta el tipo de señal, y los índices de codificación de la señal de banda de baja frecuencia y las envolventes de frecuencia de las subbandas de la señal de banda de alta frecuencia; en donde el tipo de señal es una señal armónica o una señal no armónica, y la obtención de una envolvente de frecuencia de cada subbanda de una señal de banda de alta frecuencia de la señal de audio según el tipo de señal comprende: calcular la envolvente de frecuencia de la subbanda de la señal de banda de alta frecuencia usando una primera cantidad de coeficientes de espectro cuando el tipo de señal es una señal no armónica; o calcular la envolvente de frecuencia de la subbanda de la señal de banda de alta frecuencia usando una segunda cantidad de coeficientes de espectro cuando el tipo de señal es una señal armónica, caracterizado por que la segunda cantidad es mayor que la primera cantidad, y por que una anchura de una subbanda cubierta por una envolvente de frecuencia que es de una señal de banda de alta frecuencia y se corresponde con una señal armónica es más ancha que la cubierta por una envolvente de frecuencia que es de una señal de banda de alta frecuencia y se corresponde con una señal no armónica.
Description
DESCRIPCIÓN
Método de predicción y dispositivo de codificación/decodificación para una señal de banda de alta frecuencia
Campo técnico
Las realizaciones de la presente invención se refieren al campo de las tecnologías de comunicaciones, y en particular, a un método para predecir una señal de banda de alta frecuencia, un dispositivo de codificación y un dispositivo de decodificación.
Antecedentes
En el campo de las comunicaciones digitales, hay requisitos de aplicaciones extremadamente difundidos para la transmisión de voz, imagen, audio y vídeo, tales como una llamada de teléfono, una conferencia de audio y vídeo, la emisión de televisión, y el entretenimiento multimedia. Para reducir un recurso ocupado en un proceso de almacenar o transmitir una señal de audio o vídeo, nace una tecnología de compresión y codificación de audio y vídeo. Surgen muchas ramificaciones técnicas diferentes en el desarrollo de la tecnología de compresión y codificación de audio y vídeo, donde una tecnología en la que una señal se procesa por codificación después de que se transforma de un dominio del tiempo a un dominio de frecuencia se aplica ampliamente debido a una buena cualidad de compresión, y la tecnología también es referida como una tecnología de codificación de transformación de dominio.
Se sitúa un énfasis creciente en la calidad de audio en la transmisión de comunicación; por lo tanto, hay una necesidad de mejorar la calidad de una señal de música tanto como sea posible con una premisa de que la calidad de voz se asegure. Mientras tanto, la cantidad de información de una señal de audio es extremadamente rica; por lo tanto, no se puede adoptar un modo de codificación por predicción lineal excitada por código (en inglés, Code Excited Linear Prediction, CELP para abreviar) de voz convencional; en vez de eso, generalmente, para procesar la señal de audio, una señal del dominio del tiempo se convierte en una señal del dominio de frecuencia usando una tecnología de codificación de audio de codificación de transformación de dominio, mejorando por ello la calidad de codificación de la señal de audio.
En una tecnología de codificación de audio existente, generalmente, adoptando una tecnología de transformación, tal como la transformada de Fourier rápida (en inglés, Fast Fourier Transform, FFT para abreviar) o la transformada discreta del coseno modificada (en inglés, Modified Discrete Cosine Transform, MDCT para abreviar) o la transformada discreta del coseno (en inglés, Discrete Cosine Transform, DCT para abreviar), una señal de banda de alta frecuencia en una señal de audio se convierte de una señal del dominio del tiempo a una señal del dominio de frecuencia, y entonces, se codifica la señal del dominio de frecuencia.
En el caso de una tasa de bits baja, los bits de cuantificación limitados no pueden cuantificar todas las señales de audio a ser cuantificadas; por lo tanto, un dispositivo de codificación usa la mayoría de los bits para cuantificar elaboradamente las señales de banda de baja frecuencia relativamente importantes en las señales de audio, es decir, los parámetros de cuantificación de las señales de banda de baja frecuencia ocupan la mayoría de los bits, y solo unos pocos bits se usan para cuantificar y codificar de forma aproximada las señales de banda de alta frecuencia en las señales de audio para obtener envolventes de frecuencia de las señales de banda de alta frecuencia. Entonces, las envolventes de frecuencia de las señales de banda de alta frecuencia y los parámetros de cuantificación de las señales de banda de baja frecuencia se envían a un dispositivo de decodificación en forma de un flujo de bits. Los parámetros de cuantificación de las señales de banda de baja frecuencia pueden incluir señales de excitación y envolventes de frecuencia. Cuando se cuantifican, las señales de banda de baja frecuencia se pueden primero convertir también de señales del dominio del tiempo a señales de dominio de frecuencia, y entonces, las señales del dominio de frecuencia se cuantifican y se codifican en señales de excitación.
Generalmente, el dispositivo de decodificación puede reconstruir las señales de banda de baja frecuencia según los parámetros de cuantificación que son de las señales de banda de baja frecuencia y en el flujo de bits recibido, entonces adquirir las señales de excitación de las señales de banda de baja frecuencia según las señales de banda de baja frecuencia, predecir las señales de excitación de las señales de banda de alta frecuencia usando una tecnología de extensión de ancho de banda (en inglés, band width extension, BWE para abreviar) y una tecnología de llenado de espectro y según las señales de excitación de las señales de banda de baja frecuencia, y modificar las señales de excitación predichas de las señales de banda de alta frecuencia según las envolventes de frecuencia que son de las señales de banda de alta frecuencia y en el flujo de bits, para obtener las señales de banda de alta frecuencia predichas. En la presente memoria, las señales de banda de alta frecuencia obtenidas son señales del dominio de frecuencia.
En la tecnología de BWE, una sección de frecuencia más alta a la que se asigna un bit puede ser una sección de frecuencia más alta en la que se decodifica una señal de excitación, es decir, no se decodifica ninguna señal de excitación en una sección de frecuencia mayor que la sección de frecuencia más alta. Una banda de frecuencia mayor que la sección de frecuencia más alta a la que se asigna un bit puede ser referida como una banda de alta frecuencia, y una banda de frecuencia menor que la sección de frecuencia más alta a la que se asigna un bit puede ser referida como una banda de baja frecuencia. Que una señal de excitación de una señal de banda de alta frecuencia se predice según una señal de excitación de una señal de banda de baja frecuencia puede ser específicamente como sigue a
continuación: la sección de frecuencia más alta a la que se asigna un bit se considera como un centro, una señal de excitación de una señal de banda de baja frecuencia menor que la sección de frecuencia más alta a la que se asigna un bit se copia en una señal de banda de alta frecuencia que es mayor que la sección de frecuencia más alta a la que se asigna un bit y cuyo ancho de banda es igual al ancho de banda de la señal de banda de baja frecuencia, y la señal de excitación se usa como una señal de excitación de la señal de banda de alta frecuencia.
La técnica anterior tiene las siguientes desventajas: Usando la técnica anteriormente mencionada para predecir una señal de banda de alta frecuencia, la calidad de la señal de banda de alta frecuencia predicha es relativamente pobre, reduciendo por ello la calidad auditiva de una señal de audio.
El documento WO 2010/091013 A1 describe un método, que incluye definir una banda de transición para una señal que tiene un espectro dentro de una primera banda de frecuencia, donde la banda de transición se define como un tramo de la primera banda de frecuencia, y se ubica cerca de una banda de frecuencia adyacente que es adyacente a la primera banda de frecuencia.
El documento WO 2009/078681 A1 describe un método de procesar de una señal de audio, que incluye recibir datos espectrales correspondientes a una primera banda en una banda de frecuencia que incluye la primera banda y una segunda banda, determinar una banda de copia basada en la información de frecuencia de la banda de copia correspondiente a una banda parcial de la primera banda, y generar datos espectrales de una banda objetivo que corresponde a la segunda banda que usa los datos espectrales de la banda de copia, en donde la banda de copia existe en una parte superior de la primera banda.
El documento US 2012/065965 A1 describe un aparato para codificar una señal para una extensión de ancho de banda de alta frecuencia, en donde el aparato puede submuestrear una señal de entrada del dominio del tiempo, codificar centralmente la señal de entrada del dominio del tiempo submuestreada, transformar la señal de entrada del dominio del tiempo codificada centralmente a una señal de entrada del dominio de frecuencia, y realizar una codificación de extensión de ancho de banda usando una señal básica de la señal de entrada del dominio de frecuencia.
Compendio
Las realizaciones de la presente invención proporcionan un método para predecir una señal de banda de alta frecuencia y un dispositivo de codificación para mejorar la calidad de una señal de banda de alta frecuencia predicha, mejorando por ello la calidad auditiva de una señal de audio. La presente invención se define en el conjunto de reivindicaciones correspondiente.
Según un primer aspecto, una realización de la presente invención proporciona además un método para predecir una señal de banda de alta frecuencia, que comprende: adquirir un tipo de señal de una señal de audio y una señal de banda de baja frecuencia de la señal de audio; obtener una envolvente de frecuencia de cada subbanda de una señal de banda de alta frecuencia de la señal de audio según el tipo de señal, en donde la señal de banda de alta frecuencia de la señal de audio comprende múltiples coeficientes de espectro, los múltiples coeficientes de espectro se clasifican en múltiples subbandas, cada una de las múltiples subbandas comprende múltiples coeficientes de espectro, y una envolvente de frecuencia de una subbanda se calcula basado en los coeficientes de espectro de la subbanda; y enviar un flujo de bits que transporta el tipo de señal, y los índices de codificación de la señal de banda de baja frecuencia y las envolventes de frecuencia de las subbandas de la señal de banda de alta frecuencia; en donde el tipo de señal es una señal armónica o una señal no armónica, y la obtención de una envolvente de frecuencia de cada subbanda de una señal de banda de alta frecuencia de la señal de audio según el tipo de señal comprende: calcular la envolvente de frecuencia de la subbanda de la señal de banda de alta frecuencia usando una primera cantidad de coeficientes de espectro cuando el tipo de señal es una señal no armónica; o calcular la envolvente de frecuencia de la subbanda de la señal de banda de alta frecuencia usando una segunda cantidad de coeficientes de espectro cuando el tipo de señal es una señal armónica, caracterizada por que la segunda cantidad es mayor que la primera cantidad, y por que una anchura de una subbanda cubierta por una envolvente de frecuencia que es de una señal de banda de alta frecuencia y se corresponde con una señal armónica es más ancha que la cubierta por una envolvente de frecuencia que es de una señal de banda de alta frecuencia y se corresponde con una señal no armónica.
Según un segundo aspecto, una realización de la presente invención además proporciona un dispositivo de codificación, que incluye:
Un módulo de adquisición, configurado para adquirir un tipo de señal de una señal de audio y una señal de banda de baja frecuencia de la señal de audio; un módulo de codificación, configurado para obtener una envolvente de frecuencia de cada subbanda de una señal de banda de alta frecuencia de la señal de audio según el tipo de señal, en donde la señal de banda de alta frecuencia de la señal de audio comprende múltiples subbandas, cada una de las múltiples subbandas comprende múltiples coeficientes de espectro, y una envolvente de frecuencia de una subbanda se calcula basada en los coeficientes de espectro de la subbanda; y un módulo de envío, configurado para enviar un flujo de bits que lleva el tipo de señal, y los índices de codificación de la señal de banda de baja frecuencia y las envolventes de frecuencia de las subbandas de la señal de banda de alta frecuencia; en donde el tipo de señal es una señal armónica o una
señal no armónica, y el módulo de codificación se configura específicamente para calcular la envolvente de frecuencia de la subbanda de la señal de banda de alta frecuencia usando una primera cantidad de coeficientes de espectro cuando el tipo de señal es una señal no armónica; o el módulo de codificación se configura específicamente para calcular la envolvente de frecuencia de la subbanda de la señal de banda de alta frecuencia usando una segunda cantidad de coeficientes de espectro cuando el tipo de señal es una señal armónica, caracterizada por que la segunda cantidad es mayor que la primera cantidad, y por que una anchura de una subbanda cubierta por una envolvente de frecuencia que es de una señal de banda de alta frecuencia y se corresponde con una señal armónica es más ancha que la cubierta por una envolvente de frecuencia que es de una señal de banda de alta frecuencia y se corresponde con una señal no armónica.
Breve descripción de los dibujos
Para describir las soluciones técnicas en las realizaciones de la presente invención o en la técnica anterior más claramente, a continuación se introducen brevemente los dibujos anexos necesarios para describir las realizaciones o la técnica anterior. Evidentemente, los dibujos anexos en la siguiente descripción muestran algunas realizaciones de la presente invención, y una persona de habilidad ordinaria en la técnica puede todavía derivar otros dibujos de estos dibujos anexos sin esfuerzos creativos.
La FIG. 1 es un diagrama estructural esquemático de un dispositivo de codificación en la técnica anterior;
la FIG. 2 es un diagrama estructural esquemático de un dispositivo de decodificación en la técnica anterior;
la FIG. 3 es un diagrama de flujo de un método para predecir una señal de banda de alta frecuencia según un ejemplo que no comprende todas las características necesarias para implementar la presente invención;
la FIG. 4 es un diagrama de flujo de un método para predecir una señal de banda de alta frecuencia según otra realización de la presente invención;
la FIG. 5 es un diagrama de flujo de un método para predecir una señal de banda de alta frecuencia todavía según otra realización de la presente invención;
la FIG. 6 es un diagrama estructural esquemático de un dispositivo de decodificación según un ejemplo que no comprende todas las características necesarias para implementar la presente invención;
la FIG. 7 es un diagrama estructural esquemático de un dispositivo de decodificación según otro ejemplo que no comprende todas las características necesarias para implementar la presente invención;
la FIG. 8 es un diagrama estructural esquemático de un dispositivo de codificación según una realización de la presente invención;
la FIG. 9 es un diagrama estructural esquemático de un dispositivo de codificación según otra realización de la presente invención;
la FIG. 10 es un diagrama de ejemplo de un dispositivo de codificación según una realización de la presente invención; la FIG. 11 es un diagrama de ejemplo de un dispositivo de decodificación según una realización de la presente invención;
la FIG. 12 es un diagrama estructural esquemático de un sistema para predecir una señal de banda de alta frecuencia según una realización de la presente invención;
la FIG. 13 es otro diagrama de ejemplo de un dispositivo de decodificación según una realización de la presente invención; y
la FIG. 14 es otro diagrama de ejemplo de un dispositivo de codificación según una realización de la presente invención;
Descripción de las realizaciones
Para hacer más claros los objetivos, las soluciones técnicas, y las ventajas de las realizaciones de la presente invención, a continuación se describe clara y completamente las soluciones técnicas en las realizaciones de la presente invención con referencia a los dibujos anexos en las realizaciones de la presente invención. Evidentemente, las realizaciones descritas son algunas pero no todas las realizaciones de la presente invención. Todas las otras realizaciones obtenidas por una persona de habilidad ordinaria en la técnica basadas en las realizaciones de la presente invención sin esfuerzos creativos caerán dentro del alcance de protección de la presente invención.
En el campo del procesamiento de señal digital, los codificadores - decodificadores de audio y los codificadores -decodificadores de vídeo son ampliamente aplicados a dispositivos electrónicos diversos, por ejemplo, un teléfono móvil, un aparato inalámbrico, un asistente de datos personal (PDA), un ordenador de mano o portable, un receptor /
navegador de GPS, una cámara, un reproductor de audio / video, una videocámara, una grabadora de vídeo, y un dispositivo de monitorización. Generalmente, este tipo de dispositivo electrónico incluye un codificador de audio o un decodificador de audio, donde el codificador o decodificador de audio puede estar directamente implementado por un circuito digital o un chip, por ejemplo, un DSP (en inglés, digital signa processor, procesador de señal digital), o estar implementado por un código de software que dirige un procesador para ejecutar un proceso en el código de software.
Por ejemplo, un codificador de audio primero realiza un procesamiento de tramas sobre una señal de entrada para obtener datos del dominio del tiempo con una trama que es de 20ms, entonces realiza un procesamiento de ventana sobre los datos del dominio del tiempo para obtener una señal después de la ventana, realiza una transformación del dominio de frecuencia sobre la señal del dominio del tiempo después de la ventana, para transformar la señal del dominio del tiempo en una señal del dominio de frecuencia, codifica la señal del dominio de frecuencia, y transmite la señal del dominio de frecuencia codificada a un lado decodificador. Después de recibir un flujo de bits comprimido transmitido por un lado codificador, el lado decodificador realiza una operación de decodificación correspondiente sobre la señal, realiza, sobre una señal de dominio de frecuencia obtenida decodificando, la transformación inversa correspondiente a la transformación usada por el lado codificador, para transformar la señal del dominio de frecuencia en una señal del dominio del tiempo, y realiza un post procesamiento sobre la señal del dominio del tiempo para obtener una señal sintetizada, es decir, una señal generada por el lado decodificador.
La FIG. 1 es un diagrama estructural esquemático de un dispositivo de codificación en la técnica anterior. Como se muestra en la FIG. 1, el dispositivo de la técnica anterior incluye un módulo de transformación de tiempo - frecuencia 10, un módulo de extracción de envolvente 11, un módulo de cuantificación y codificación de envolvente 12, un módulo de asignación de bit 13, un módulo de generación de excitación 14, un módulo de cuantificación y codificación de excitación 15, y un módulo de multiplexación 16.
Como se muestra en la FIG. 1, el módulo de transformación de tiempo - frecuencia 10 se configura para: recibir una señal de audio de entrada, y entonces convertir la señal de audio de una señal del dominio del tiempo a una señal del dominio de frecuencia. Entonces, la envolvente que extrae el módulo 11 extrae una envolvente de frecuencia de la señal del dominio de frecuencia obtenida por la transformación por el módulo de transformación de tiempo - frecuencia 10, donde la envolvente de frecuencia también puede ser referida como un factor de normalización de subbanda. En la presente memoria, la envolvente de frecuencia incluye una envolvente de frecuencia de una señal de banda de baja frecuencia y una envolvente de frecuencia de una señal de banda de alta frecuencia, donde la señal de banda de baja frecuencia y la señal de banda de alta frecuencia están en la señal del dominio de frecuencia. El módulo de cuantificación y codificación de envolvente 12 realiza el procesamiento de cuantificación y codificación sobre la envolvente de frecuencia obtenida por el módulo de extracción de envolvente 11, para obtener una envolvente de frecuencia cuantificada y codificada. El módulo de asignación de bit 13 determina una asignación de bit de cada subbanda según la envolvente de frecuencia cuantificada. El módulo de generación de excitación 14 realiza, usando la información de envolvente obtenida después de la cuantificación y la codificación por el módulo de cuantificación y codificación de envolvente 12, el procesamiento de normalización sobre la señal del dominio de frecuencia obtenido por el módulo de transformación de tiempo - frecuencia 10, para obtener una señal de excitación, es decir, una señal del dominio de frecuencia normalizada, y la señal de excitación también incluye una señal de excitación de la señal de banda de alta frecuencia y una señal de excitación de la señal de banda de baja frecuencia. El módulo de cuantificación y codificación de excitación 15 realiza, según la asignación de bit de cada subbanda asignado por el módulo de asignación de bit 13, el procesamiento de cuantificación y codificación sobre la señal de excitación generada por el módulo de generación de excitación 14, para obtener una señal de excitación cuantificada. El módulo de multiplexación 16 multiplexa separadamente la envolvente de frecuencia cuantificada por el módulo de cuantificación y codificación de envolvente 12 y la señal de excitación cuantificada por el módulo de cuantificación y codificación de excitación 15 en un flujo de bits, y hace salir el flujo de bits a un dispositivo de decodificación.
La FIG. 2 es un diagrama estructural esquemático de un dispositivo de decodificación en la técnica anterior. Como se muestra en la FIG. 2, el dispositivo de decodificación de la técnica anterior incluye un módulo de demultiplexación 20, un módulo de decodificación de envolvente de frecuencia 21, un módulo de adquisición de asignación de bit 22, un módulo de decodificación de señal de excitación 23, un módulo de extensión de ancho de banda 24, un módulo de reconstrucción de señal del dominio de frecuencia 25, y un módulo de transformación de frecuencia - tiempo 26.
Como se muestra en la FIG. 2, el módulo de demultiplexación 20 recibe un flujo de bits enviado desde un lado de un dispositivo de codificación, y demultiplexa (que incluye la decodificación) el flujo de bits para obtener separadamente una envolvente de frecuencia cuantificada y una señal de excitación cuantificada. El módulo de decodificación de envolvente de frecuencia 21 adquiere la envolvente de frecuencia cuantificada de una señal obtenida demultiplexando por el módulo de demultiplexión 20, y cuantifica y decodifica la envolvente de frecuencia cuantificada para obtener una envolvente de frecuencia. El módulo de adquisición de asignación de bit 22 determina una asignación de bit de cada subbanda según la envolvente de frecuencia obtenida por el módulo de decodificación de envolvente de frecuencia 21. El módulo de decodificación de señal de excitación 23 adquiere la señal de excitación cuantificada de la señal obtenida demultiplexando por el módulo de demultiplexación 20, y realiza, según la asignación de bit de cada subbanda obtenida por el módulo de adquisición de asignación de bit 22, la cuantificación y la decodificación para obtener una señal de excitación. El módulo de extensión de ancho de banda 24 realiza la extensión sobre un ancho de banda entero según la señal de excitación obtenida por el módulo de decodificación de señal de excitación 23. Específicamente, el módulo de extensión de ancho de banda 24 extiende una señal de excitación de una señal de
banda de alta frecuencia usando una señal de excitación de una señal de banda de baja frecuencia. Cuando se cuantifica y se codifica una señal de excitación y una señal de envolvente, el módulo de cuantificación y codificación de excitación 15 y el módulo de cuantificación y codificación de envolvente 12 usan la mayoría de los bits para cuantificar una señal de la señal de banda de baja frecuencia relativamente importante, y solo usa unos pocos bits para cuantificar una señal de la señal de banda de alta frecuencia que puede incluso excluir la señal de excitación de la señal de banda de alta frecuencia. Por lo tanto, el módulo de extensión de ancho de banda 24 necesita usar la señal de excitación de la señal de banda de baja frecuencia para extender la señal de excitación de la señal de banda de alta frecuencia, para obtener una señal de excitación de una banda de frecuencia entera. El módulo de reconstrucción de señal del dominio de frecuencia 25 está conectado separadamente al módulo de decodificación de envolvente de frecuencia 21 y al módulo de extensión de ancho de banda 24, y el módulo de reconstrucción de señal del dominio de frecuencia 25 reconstruye una señal del dominio de frecuencia según la envolvente de frecuencia obtenida por el módulo de decodificación de envolvente de frecuencia 21 y la señal de excitación que es la de la banda de frecuencia entera y se obtiene por el módulo de extensión de ancho de banda 24. El módulo de transformación de frecuencia -tiempo 26 convierte la señal del dominio de frecuencia reconstruida por el módulo de reconstrucción de señal del dominio de frecuencia 25 en una señal del dominio del tiempo, obteniendo por ello una señal de audio de entrada originalmente.
La FIG. 1 y la FIG. 2 son diagramas estructurales de un dispositivo de codificación y un dispositivo de decodificación correspondiente en la técnica anterior. Según los procesos de procesamiento del dispositivo de codificación y el dispositivo de decodificación en la técnica anterior mostrada en la FIG. 1 y la FIG. 2, se puede aprender que en la técnica anterior, una señal de excitación y una información de envolvente que son de una señal de banda de baja frecuencia y se usan cuando el dispositivo de decodificación reconstruye una señal del dominio de frecuencia de la señal de banda de baja frecuencia se envían desde el lado del dispositivo de codificación. Por lo tanto, la reconstrucción de la señal del dominio de frecuencia de la señal de banda de baja frecuencia es relativamente precisa. Para una señal del dominio de frecuencia de una señal de banda de alta frecuencia, hay una necesidad de usar primero la señal de excitación de la señal de banda de baja frecuencia para predecir una señal de excitación de la señal de banda de alta frecuencia, y entonces usar la información del entorno que es de la señal de banda de alta frecuencia y enviada desde el lado del dispositivo de codificación, para modificar la señal de excitación predicha de la señal de banda de alta frecuencia, para obtener la señal del dominio de frecuencia de la señal de banda de alta frecuencia. Cuando se predice la señal del dominio de frecuencia de la señal de banda de alta frecuencia, el dispositivo de codificación no considera un tipo de señal y usa la misma envolvente de frecuencia. Por ejemplo, cuando el tipo de señal es una señal armónica, un intervalo de subbanda cubierto por la envolvente de frecuencia usada es relativamente estrecha (menos que un intervalo de subbanda cubierto desde una cresta a un valle de una armónica). Cuando la envolvente de frecuencia se usa para modificar la señal de excitación predicha de la señal de banda de alta frecuencia, se producen más ruidos, por lo tanto existe un error relativamente grande entre la señal de banda de alta frecuencia obtenida por modificación y una señal de banda de alta frecuencia real, que afecta severamente una tasa de precisión de predecir la señal de banda de alta frecuencia, y que reduce la calidad de la señal de banda de alta frecuencia predicha y que reduce la calidad auditiva de una señal de audio. Adicionalmente, usando la anteriormente mencionada técnica anterior en la que una señal de excitación de una señal de banda de alta frecuencia se predice según una señal de excitación de una señal de banda de baja frecuencia, las señales de excitación de señales de banda de baja frecuencia diferentes se pueden copiar en una misma señal de banda de alta frecuencia de tramas diferentes, que causa la discontinuidad de la señal de excitación, reduce la calidad de la señal de banda de alta frecuencia, y por ello reduce la calidad auditiva de la señal de audio. Por lo tanto, las siguientes soluciones técnicas de realizaciones de la presente invención se pueden usar para resolver el problema técnico anteriormente mencionado.
La FIG. 3 es un diagrama de flujo de un método para predecir una señal de banda de alta frecuencia según un ejemplo que no comprende todas las características necesarias para implementar la presente invención. En esta realización, el método para predecir una señal de banda de alta frecuencia se puede ejecutar por un dispositivo de decodificación. Como se muestra en la FIG. 3, en esta realización, el método para predecir una señal de banda de alta frecuencia puede incluir específicamente los siguientes pasos:
100. El dispositivo de decodificación adquiere un tipo de señal de una señal de audio y una señal de banda de baja frecuencia de la señal de audio.
En esta realización el tipo de señal es una señal armónica o una señal no armónica, y la señal de audio incluye la señal de banda de baja frecuencia y una señal de banda de alta frecuencia. En una realización, un tipo de señal de una señal de audio es un tipo de señal de una señal de banda de alta frecuencia de la señal de audio, es decir, si la señal de banda de alta frecuencia es una señal armónica o una señal no armónica.
101. El dispositivo de decodificación adquiere una envolvente de frecuencia de una señal de banda de alta frecuencia según el tipo de señal.
102. El dispositivo de decodificación predice una señal de excitación de la señal de banda de alta frecuencia según la señal de banda de baja frecuencia.
103. El dispositivo de decodificación reconstruye la señal de banda de alta frecuencia según la envolvente de frecuencia de la señal de banda de alta frecuencia y la señal de excitación de la señal de banda de alta frecuencia.
En esta realización, la señal de banda de alta frecuencia obtenida por predicción es una señal del dominio de frecuencia.
Según el método para predecir una señal de banda de alta frecuencia en esta realización, una envolvente de frecuencia de una señal de banda de alta frecuencia se adquiere según un tipo de señal, y para una señal de un tipo diferente, se usa un coeficiente de espectro diferente para decodificar una envolvente, de modo que la excitación que es de una señal armónica de banda de alta frecuencia y predicha según una baja frecuencia puede mantener una cualidad armónica original, evitando por ello producir excesivos ruidos en un proceso de predicción, reduciendo de forma efectiva un error que existe entre la señal de banda de alta frecuencia obtenida por predicción y una señal de banda de alta frecuencia real, e incrementando la tasa de precisión de la señal de banda de alta frecuencia predicha.
Opcionalmente, sobre la base de la solución técnica de la realización anteriormente mencionada, una realización de extensión que es de la realización mostrada en la FIG. 3 y se forma por la siguiente solución técnica de extensión se puede incluir también. En esta realización de extensión, en el paso 101, en que “el dispositivo de decodificación adquiere una envolvente de frecuencia de una señal de banda de alta frecuencia según el tipo de señal” puede incluir específicamente los dos casos siguientes:
En el primer caso, cuando el tipo de señal es una señal no armónica, el dispositivo de decodificación decodifica un flujo de bits recibido para obtener la envolvente de frecuencia de la señal de banda de alta frecuencia; cuando el tipo de señal es una armónica, el dispositivo de decodificación decodifica el flujo de bits recibida para obtener una envolvente de frecuencia inicial de la señal de banda de alta frecuencia, y usa un valor obtenido realizando un cálculo de ponderación sobre la envolvente de frecuencia inicial y N envolventes de frecuencia inicial adyacentes como la envolvente de frecuencia de la señal de banda de alta frecuencia, donde N es mayor o igual que 1.
En este caso, independientemente de una armónica o una no armónica, la envolvente de frecuencia que es de la señal de banda de alta frecuencia y se obtiene decodificando el flujo de bits recibido por el dispositivo de decodificación es la misma. Para una señal no armónica, la envolvente de frecuencia que es de la señal de banda de alta frecuencia y se obtiene decodificando es la envolvente de frecuencia que es de la señal de banda de alta frecuencia y necesita obtenerse. Para una señal no armónica, la envolvente de frecuencia que es de la señal de banda de alta frecuencia y se obtiene decodificando por el dispositivo de decodificación es la envolvente de frecuencia inicial de la señal de banda de alta frecuencia, y hay una necesidad de usar además el valor obtenido realizando el cálculo de ponderación sobre la envolvente de frecuencia inicial y las N envolventes de frecuencia inicial adyacentes como la envolvente de frecuencia de la señal de banda de alta frecuencia, donde N es mayor o igual que 1. De este modo, se puede aprender que una anchura de una subbanda cubierta por una envolvente de frecuencia que es de una señal de banda de alta frecuencia y se corresponde con una señal armónica es más ancha que la cubierta por una envolvente de frecuencia que es de una señal de banda de alta frecuencia y se corresponde con una señal no armónica.
Se puede determinar un valor de N según una anchura de una subbanda cubierta por una envolvente de frecuencia de una señal de banda de alta frecuencia de una señal armónica y una anchura de una subbanda cubierta por una envolvente de frecuencia de una señal de banda de alta frecuencia de una señal no armónica. Por ejemplo, en la vez anteriormente mencionada, cuando el tipo de señal es una señal armónica, hay 40 coeficientes de espectro en cada subbanda, y cuando el tipo de señal es una señal no armónica, hay 24 coeficientes de espectro en cada subbanda. Si el dispositivo de decodificación determina que el tipo de señal es una armónica, y la envolvente de frecuencia que es de la señal de banda de alta frecuencia y transportada en el flujo de bits es una envolvente de frecuencia correspondiente a una no armónica, en este caso, se pueden promediar dos envolventes de frecuencia adyacentes en el flujo de bits para obtener una envolvente de frecuencia correspondiente a la armónica.
Por ejemplo, para una señal de ultra banda ancha, hay 240 coeficientes de espectro dentro de un intervalo de 8 kHz - 14 kHz. Cuando un tipo del tipo de señal es una señal armónica, los 240 coeficientes de espectro se pueden clasificar por igual en seis subbandas, hay 40 coeficientes de espectro en cada subbanda, se calcula una envolvente de frecuencia para cada subbanda, y se calculan seis envolventes de frecuencia en total. Sin embargo, cuando el tipo de señal es una señal no armónica los 240 coeficientes de espectro se clasifican por igual en diez subbandas, hay 24 coeficientes de espectro en cada subbanda, se calcula una envolvente de frecuencia por cada subbanda, y se calculan 10 envolventes de frecuencia en total.
En el segundo caso, se decodifica un flujo de bits según el tipo de señal para adquirir la envolvente de frecuencia correspondiente de la señal de banda de alta frecuencia, donde el flujo de bits incluye el tipo de señal y un índice de codificación que es de la envolvente de frecuencia de la señal de banda de alta frecuencia y se corresponde con el tipo de señal.
En el primer caso de implementación anteriormente mencionado del paso 101, el dispositivo de decodificación necesita obtener el tipo de señal de la señal de audio, es decir, la información sobre una señal armónica o una señal no armónica. Puede haber maneras de implementación diferentes. En una manera de implementación, un dispositivo de codificación determina el tipo de señal de la señal de audio, codifica el tipo de señal, y transmite el tipo de señal codificada al dispositivo de decodificación. En la otra manera de implementación, el dispositivo de decodificación determina el tipo de la señal de audio según la señal de banda de baja frecuencia obtenida decodificando. En la presente memoria, el tipo de señal de la señal de audio se puede referir específicamente a un tipo de señal de la señal
de banda de alta frecuencia de la señal de audio, es decir, si la señal de banda de alta frecuencia es una señal armónica o una señal no armónica.
La señal armónica indica una señal cuya amplitud de espectro de frecuencia fluctúa bruscamente en una banda de frecuencia a ser procesada, y puede representar que existen una cantidad particular de picos de amplitud en una banda de frecuencia particular. Se puede usar un método existente por un lado codificador o un lado decodificador para determinar si la señal de audio es una señal armónica o una señal no armónica. Por ejemplo, en un método, una señal del dominio de frecuencia se divide en N subbandas, se calcula una relación pico a promedio (la relación pico a promedio es una relación de un coeficiente de espectro cuya amplitud es la más larga en una subbanda con un valor promedio de amplitudes en la subbanda) de cada subbanda, y cuando la relación pico a promedio es mayor que un umbral dado por un una cantidad de subbandas, y la cantidad de subbandas es mayor que un valor dado, en este caso, la señal es una señal armónica; en caso contrario, la señal es una señal no armónica.
El paso 100 en que “el dispositivo de decodificación adquiere un tipo de señal de una señal de audio y una señal de banda de baja frecuencia de la señal de audio” puede incluir específicamente las dos siguientes maneras:
En la primera manera, el dispositivo de decodificación decodifica el flujo de bits recibido para obtener el tipo de señal y la señal de banda de baja frecuencia. Cabe señalar que un parámetro de cuantificación de la señal de banda de baja frecuencia se puede usar específicamente para identificar de forma única la señal de banda de baja frecuencia. Por lo tanto, decodificar el flujo de bits recibido para obtener la señal de banda de baja frecuencia puede ser también específicamente adquirir el parámetro de cuantificación de la señal de banda de baja frecuencia.
En este caso, el flujo de bits que se envía por el dispositivo de codificación y que se recibe por el dispositivo de decodificación transporta el tipo de señal, el parámetro de cuantificación de la señal de banda de baja frecuencia y la envolvente de frecuencia de la señal de banda de alta frecuencia. En este caso, independientemente de una señal armónica o una señal no armónica, la envolvente de frecuencia de la señal de banda de alta frecuencia es la misma. Correspondientemente, si el tipo de señal es una armónica o una no armónica se determina por un lado del dispositivo de codificación. Sin embargo, el dispositivo de codificación no ajusta la envolvente de frecuencia de la señal de banda de alta frecuencia según el tipo de señal; en vez de eso, el dispositivo de codificación determina la envolvente de frecuencia de la señal de banda de alta frecuencia según una señal de audio original. Mientras tanto, el dispositivo de codificación necesita determinar además la señal de banda de baja frecuencia. Entonces, el dispositivo de codificación envía, al dispositivo de decodificación, el flujo de bits que transporta el tipo de señal, y los índices de codificación de la señal de banda de baja frecuencia y la envolvente de frecuencia de la señal de banda de alta frecuencia. Generalmente, un atributo armónico de una señal de banda de alta frecuencia es consistente con aquel de una señal de banda de baja frecuencia, sin embargo, también existe un caso especial en el que el atributo armónico de la señal de banda de baja frecuencia es fuerte, y la señal de banda de alta frecuencia posiblemente no tiene armónico. Por lo tanto, en esta realización, el tipo de señal que es de la señal de audio y se obtiene por el dispositivo de codificación puede ser el tipo de señal de la señal de banda de alta frecuencia, o puede ser el tipo de señal de la señal de banda de baja frecuencia. La anterior manera es más precisa comparada con el caso posterior.
En la segunda manera, el dispositivo de decodificación demultiplexa el flujo de bits para adquirir la señal de banda de baja frecuencia y determina el tipo de señal según la señal de banda de baja frecuencia.
Comparado con la primera manera anteriormente mencionada, en esta manera, el tipo de señal no se transporta en el flujo de bits que se envía por el dispositivo de codificación y se recibe por el dispositivo de decodificación; en vez de eso, el tipo de señal se determina por el dispositivo de decodificación según la señal de banda de baja frecuencia adquirida por demultiplexación. De forma similar, el parámetro de cuantificación de la señal de banda de baja frecuencia se puede usar para identificar de forma única la señal de banda de baja frecuencia. Opcionalmente, en esta manera, el flujo de bits enviado por el dispositivo de codificación puede transportar también solo los índices de codificación de la señal de banda de baja frecuencia y la envolvente de frecuencia de la señal de banda de alta frecuencia. Después de recibir el flujo de bits, el dispositivo de decodificación demultiplexa el flujo de bits para adquirir la señal de banda de baja frecuencia, y determina el tipo de señal según la señal de banda de baja frecuencia. Cuando esta manera se aplica en el lado del dispositivo de codificación, se puede usar la técnica anterior. Es decir, no hay necesidad de determinar el tipo de señal, y el flujo de bits enviado al dispositivo de decodificación no transporta el tipo de señal, Para detalles sobre el procesamiento en el lado del dispositivo de codificación, consultar la técnica anterior relacionada. Los detalles no se describen de nuevo en la presente memoria. Comparado con la manera anterior, esta manera de implementación puede además reducir los bits de codificación.
Para el segundo caso de implementación anteriormente mencionado del paso 101, en el segundo caso de implementación anteriormente mencionado, el dispositivo de decodificación necesita decodificar el flujo de bits según el tipo de señal para adquirir la envolvente de frecuencia correspondiente de la señal de banda de alta frecuencia, es decir, la envolvente de frecuencia de la señal de banda de alta frecuencia necesita codificarse en el flujo de bits según el tipo de señal en el lado del dispositivo de codificación correspondiente. Por ejemplo, cuando el tipo de señal es una armónica, el dispositivo de codificación puede usar 4 bits para codificar la envolvente de frecuencia de la señal de banda de alta frecuencia, y cuando el tipo de señal es una no armónica, el dispositivo de codificación puede usar 5 bits para codificar la envolvente de frecuencia de la señal de banda de alta frecuencia. Por lo tanto, en este caso, el
flujo de bits recibido por el dispositivo de decodificación necesita transportar el tipo de señal. Por lo tanto, en el segundo caso del paso 101, la segunda manera anteriormente mencionada no se puede usar para implementar el paso 100.
Opcionalmente, en la realización de extensión de la realización mostrada en la FIG. 3, el paso 102 en que “el dispositivo de decodificación predice una señal de excitación de la señal de banda de alta frecuencia según la señal de banda de baja frecuencia” se puede implementar específicamente usando una tecnología convencional relacionada, o preferiblemente, se puede implementar específicamente usando los siguientes pasos:
(1) El dispositivo de decodificación determina la sección de frecuencia más alta, a la que se asigna un bit, de la señal de banda de baja frecuencia.
Por ejemplo, el dispositivo de decodificación puede determinar la sección de frecuencia más alta a la que se asigna un bit según la señal de banda de baja frecuencia en el flujo de bits recibido enviado por el dispositivo de codificación. Cuando el parámetro de cuantificación de la señal de banda de baja frecuencia se usa para identificar de forma única la señal de banda de baja frecuencia, la sección de frecuencia más alta a la que se asigna un bit se puede determinar según el parámetro de cuantificación de la señal de banda de baja frecuencia. Por ejemplo, en esta realización, f last_sfm se usa para indicar la sección de frecuencia más alta a la que se asigna un bit.
(2) El dispositivo de decodificación determina si la sección de frecuencia más alta, a la que se asigna un bit, de la señal de banda de baja frecuencia es menor que una sección de frecuencia de inicio preestablecida de una extensión de ancho de banda de la señal de banda de alta frecuencia; cuando la sección de frecuencia más alta, a la que se asigna un bit, de la señal de banda de baja frecuencia es menor que la sección de frecuencia de inicio preestablecida de la extensión de ancho de banda de la señal de banda de alta frecuencia, realizar el paso (3); en caso contrario, cuando la sección de frecuencia más alta, a la que se asigna un bit, de la señal de banda de baja frecuencia es mayor o igual que la sección de frecuencia de inicio preestablecida de la extensión de ancho de banda de la señal de banda de alta frecuencia, realizar el paso (4).
(3) El dispositivo de decodificación predice la señal de excitación de la señal de banda de alta frecuencia según una señal de excitación que cae dentro de un intervalo de banda de frecuencia predeterminado y en la señal de banda de baja frecuencia y la sección de frecuencia de inicio preestablecida de la extensión de ancho de banda de la señal de banda de alta frecuencia.
(4) El dispositivo de decodificación predice la señal de excitación de la señal de banda de alta frecuencia según una señal de excitación que cae dentro de un intervalo de banda de frecuencia predeterminado y en la señal de banda de baja frecuencia, la sección de frecuencia de inicio preestablecida de la extensión de ancho de banda de la señal de banda de alta frecuencia, y la sección de frecuencia más alta, a la que se asigna un bit, de la señal de banda de baja frecuencia.
Además opcionalmente, el paso (3) en que el dispositivo de decodificación predice la señal de excitación de la señal de banda de alta frecuencia según una señal de excitación que cae dentro de un intervalo de banda predeterminado y en la señal de banda de baja frecuencia y la sección de frecuencia de inicio preestablecida de la extensión de ancho de banda de la señal de banda de alta frecuencia incluye:
hacer n copias de la señal de excitación dentro del intervalo de banda de frecuencia predeterminado, y usar las n copias de la señal de excitación como una señal de excitación entre la sección de frecuencia de inicio preestablecida de la extensión de ancho de banda de la señal de banda de alta frecuencia y una sección de frecuencia más alta de la banda de frecuencia de extensión de ancho de banda.
En esta realización, n es un entero positivo o un positivo decimal, y n es igual a una relación de una cantidad de secciones de frecuencia entre la sección de frecuencia de inicio preestablecida de la extensión de ancho de banda de la señal de banda de alta frecuencia y la sección de frecuencia más alta de la banda de frecuencia de extensión de ancho de banda con una cantidad de secciones de frecuencia dentro del intervalo de bandas de frecuencia predeterminado.
Por ejemplo, en esta realización, fbwe_start se puede usar para indicar la sección de frecuencia de inicio preestablecida de la extensión de ancho de banda de la señal de banda de alta frecuencia. La selección de la fbwe_start está relacionada con una tasa de codificación (es decir, la cantidad total de bits). Una tasa de codificación más alta indica que se puede seleccionar una sección de frecuencia de inicio preestablecida fbwe_start más alta de la extensión de ancho de banda de la señal de banda de alta frecuencia. Por ejemplo, para una señal de ultra banda ancha, cuando la tasa de codificación es 24 kbps, la sección de frecuencia de inicio preestablecida fbwe_start de la extensión de ancho de banda de la señal de banda de alta frecuencia es igual a 6,4 kHz, y cuando la tasa de codificación es 32 kbps, la sección de frecuencia de inicio preestablecida fbwe_start de la extensión de ancho de banda de la señal de banda de alta frecuencia es igual a 8 kHz.
Por ejemplo, en esta realización, la señal de excitación que cae dentro del intervalo de banda de frecuencia predeterminado y en la señal de banda de baja frecuencia se puede indicar como una señal de excitación que cae dentro de un intervalo de banda de frecuencia desde fexc_start hasta fexc_end y en la señal de banda de baja frecuencia, donde la fexc_start es una sección de frecuencia de inicio que es del intervalo de banda de frecuencia predeterminado y
en la señal de banda de baja frecuencia, la fexc_end es una frecuencia final que es del intervalo de banda de frecuencia predeterminado y en la señal de banda de baja frecuencia, y la fexc_end es mayor que la fexc_start. La selección del intervalo de banda de frecuencia predeterminado desde la fexc_start hasta la fexc_end se relaciona con el tipo de señal y la tasa de codificación. Por ejemplo, en el caso de una tasa relativamente baja, para una señal armónica, se selecciona una señal de banda de relativamente baja frecuencia con una relativamente buena codificación en señales de banda de baja frecuencia, y para una señal no armónica, se selecciona una señal de banda de relativamente alta frecuencia con una relativamente pobre codificación en las señales de banda de baja frecuencia, En el caso de una tasa relativamente alta, para una señal armónica, se puede seleccionar una banda de relativamente alta frecuencia en las señales de banda de baja frecuencia.
Por ejemplo, en esta realización, la sección de frecuencia más alta de la banda de frecuencia de extensión de ancho de banda se puede indicar como ftop_sfm.
En este caso, las n copias de la señal de excitación dentro del intervalo de banda de frecuencia desde la fexc_start hasta la fexc_end se usan como una señal de excitación entre la fbwe_start y la ftop_sfm, donde n es igual a una relación de una cantidad de secciones de frecuencia entre la fbwe_start y la ftop_sfm con una cantidad de secciones de frecuencia dentro del intervalo desde la fexc_start hasta la fexc_end, y puede ser específicamente un entero positivo o un decimal positivo.
En esta realización, en que el dispositivo de decodificación, que empieza desde la fbwe_start, hace n copias de la señal de excitación dentro del intervalo de banda de frecuencia desde la fexc_start hasta la fexc_end, y usa las n copias de la señal de excitación como la señal de excitación que es de la señal de banda de alta frecuencia y entre la fbwe_start y la ftop_sfm se puede implementar específicamente de la siguiente manera: el dispositivo de decodificación, que empieza en la fbwe_start, copia sucesivamente la señal de excitación que cae dentro del intervalo de banda de frecuencia desde la fexc_start hasta la fexc_end y en una cantidad de una parte entera de n y copia la señal de excitación que cae dentro del intervalo de banda de frecuencia desde la fexc_start hasta la fexc_end y en una cantidad de una parte no entera de n; y usa las dos partes de señales de excitación como la señal de excitación de banda de alta frecuencia entre la fbwe_start y la ftop_sfm, donde la parte no entera de n es menor que 1.
En esta realización, cuando la señal de excitación de banda de baja frecuencia que cae dentro del intervalo de banda de frecuencia desde la fexc_start hasta la fexc_end y en la cantidad de la parte entera de n se está copiando, la señal de excitación se puede copiar sucesivamente, es decir, se hace una copia de la señal de excitación dentro del intervalo de banda de frecuencia desde la fexc_start hasta la fexc_end cada vez hasta que se hacen las n copias de la señal de excitación dentro del intervalo de banda de frecuencia desde la fexc_start hasta la fexc_end; o se puede realizar un copiado de espejo (o referido como copiado de pliegue), es decir, cuando las copias enteras de la señal de excitación dentro del intervalo de banda de frecuencia desde la fexc_start hasta la fexc_end se están haciendo, se realiza sucesivamente un copiado escalonado del copiado hacia adelante (es decir, desde la fexc_start hasta la fexc_end) y del copiado hacia atrás (es decir, desde la fexc_end hasta la fexc_start) hasta que se completan las n copias.
Alternativamente, el dispositivo de decodificación puede, empezando desde la ftop_sfm, hacer n copias de la señal de excitación dentro del intervalo de banda de frecuencia desde la fexc_start hasta la fexc_end, y usa las n copias de la señal de excitación como la señal de excitación de banda de alta frecuencia entre la fbwe_start y la ftop_sfm, que se puede implementar específicamente de la siguiente manera: el dispositivo de decodificación, empezando en la ftop_sfm, copia sucesivamente la señal de excitación que cae dentro del intervalo de banda de frecuencia desde la fexc_start hasta la fexc_end y en una cantidad de una parte no entera de n y copia la señal de excitación que cae dentro del intervalo de banda de frecuencia desde la fexc_start hasta la fexc_end y en una cantidad de una parte entera de n, y usa las dos partes de señales de excitación como la señal de excitación de banda de alta frecuencia entre la fbwe_start y la ftop_sfm, donde la parte no entera de n es menor que 1.
Específicamente, el copiado, que empieza en la ftop_sfm, la señal de excitación que cae dentro del intervalo de banda de frecuencia desde la fexc_start hasta la fexc_end y en la cantidad de una parte no entera de n pertenece al copiado por bloque. Por ejemplo, una sección de frecuencia más alta de la señal de banda de alta frecuencia es 14 kHz, y la fexc_start hasta la fexc_end es 1,6 kHz hasta 4 kHz. Cuando una señal de excitación de 0,5 copias de la fexc_start hasta la fexc_end, es decir, desde 1,6 kHz hasta 2,8 kHz, se selecciona, usando la solución de este paso, la señal de excitación desde 1,6 kHz hasta 2,8 kHz se puede copiar en una banda de frecuencia de extensión de ancho de banda entre (14 - 1,2) kHz y 14 kHz y usada como una señal de excitación de esta señal de banda de alta frecuencia. En este caso, 1,6 kHz se copia correspondientemente en (14 - 1,2) kHz, y 2,8 kHz se copia correspondientemente en 14 kHz.
En las dos maneras anteriormente mencionadas, independientemente de empezar a realizar la copia desde la fbwe_start o la ftop_sfm, los resultados de la señal de excitación de banda de alta frecuencia que está entre la fbwe_start y la ftop_sfm y se obtiene finalmente por predicción son los mismos.
En un proceso de implementación de la solución anteriormente mencionada, una relación n se puede calcular primero dividiendo la cantidad de las secciones de frecuencia entre la fbwe_start y la ftop_sfm por la cantidad de secciones de frecuencia entre la fexc_start y la fexc_end.
Además opcionalmente, el paso (4) en que el dispositivo de decodificación predice la señal de excitación de la señal de banda de alta frecuencia según una señal de excitación que cae dentro de un intervalo de banda de frecuencia
predeterminado y en la señal de banda de baja frecuencia, la sección de frecuencia de inicio preestablecida de la extensión de ancho de banda de la señal de banda de alta frecuencia, y la sección de frecuencia más alta, a la que se asigna un bit, de la señal de banda de baja frecuencia incluye:
copiar una señal de excitación desde la sección de frecuencia de orden m por encima de la sección de frecuencia de inicio fexc_start del intervalo de banda de frecuencia predeterminado a la sección de frecuencia final fexc_end del intervalo de banda de frecuencia predeterminado y hacer n copias de la señal de excitación dentro del intervalo de banda de frecuencia predeterminado, y usar las dos partes de señales de excitación como una señal de excitación entre la sección de frecuencia más alta, a la que se asigna un bit, de la señal de banda de baja frecuencia y la sección de frecuencia más alta de la banda de frecuencia de extensión de ancho de banda.
En esta realización, n es 0, un entero positivo, o un decimal positivo, y m es una diferencia de una cantidad de secciones de frecuencia entre la sección de frecuencia más alta, a la que se asigna un bit, de la señal de banda de baja frecuencia y la sección de frecuencia de inicio preestablecida de la banda de frecuencia de extensión, y se puede indicar como (flast_sfm - fbwe_start).
En este caso, se copia una señal de excitación desde la frecuencia de orden (flast_sfm - fbwe_start) mayor que la fexc_start hasta la fexc_end y se hacen n copias de la señal de excitación dentro del intervalo de banda de frecuencia desde la fexc_start hasta la fexc_end, y se usan las dos partes de señales de excitación como la señal de excitación entre la f last_sfm y la ftop_sfm, donde n puede ser 0, un entero positivo, o un decimal positivo.
Durante una implementación específica, el dispositivo de decodificación puede, empezando desde la f last_sfm, copiar sucesivamente una señal de excitación dentro de un intervalo de banda de frecuencia desde (fexc_start + (flast_sfm -fbwe_start)) hasta la fexc_end, la señal de excitación que es desde la fexc_start hasta la fexc_end y en la cantidad de una parte entera de n, y la señal de excitación que cae dentro del intervalo de banda de frecuencia desde la fexc_start hasta la fexc_end y en la cantidad de la parte no entera de n; y usa las tres partes de señales de excitación como la señal de excitación de banda de alta frecuencia entre la f last_sfm y la ftop_sfm, donde la parte no entera de n es menor que 1.
Alternativamente, el dispositivo de decodificación puede, empezando desde la ftop_sfm, hacer sucesivamente n copias de la señal de excitación desde la fexc_start hasta la fexc_end y copia una señal de excitación dentro de un intervalo de banda de frecuencia desde (fexc_start + (flast_sfm - fbwe_start)) hasta la fexc_end, y usa las dos partes de señales de excitación como la señal de excitación de banda de alta frecuencia entre la f last_sfm y la ftop_sfm, donde de manera similar, n es 0, un entero positivo, o un decimal positivo.
Durante una implementación específica, el dispositivo de decodificación puede, empezando desde la ft op_sfm, copiar sucesivamente la señal de excitación que cae dentro del intervalo de banda de frecuencia desde la fexc_start hasta la fexc_end y en la cantidad de la parte no entera de n, la señal de excitación que cae dentro del intervalo de banda de frecuencia desde la fexc_start hasta la fexc_end y en la cantidad de la parte entera de n, y la señal de excitación dentro del intervalo de banda de frecuencia desde la (fexc_start + (flast_sfm - fbwe_start)) hasta la fexc_end; y usa las tres partes de señales de excitación como la señal de excitación de banda de alta frecuencia entre la f last_sfm y la ftop_sfm, donde la parte no entera de n es menor que 1.
Cuando el dispositivo de decodificación empieza a realizar la predicción desde la ftop_sfm, que copia la señal de excitación que cae dentro del intervalo de banda de frecuencia desde la fexc_start hasta la fexc_end y en la cantidad de la parte no entera de n también pertenece al copiado por bloque. Una señal de excitación correspondiente a una sección de baja frecuencia dentro de un intervalo de banda de baja frecuencia se ubica sobre una sección de baja frecuencia correspondiente en una banda de alta frecuencia, y una señal de excitación correspondiente a una sección de alta frecuencia dentro de un intervalo de banda de baja frecuencia se ubica sobre una sección de alta frecuencia correspondiente en una banda de alta frecuencia. Para detalles, consultar los registros relacionados anteriormente mencionados. De forma similar, el copiado de la señal de excitación de banda de baja frecuencia que cae dentro del intervalo de banda de frecuencia desde la fexc_start hasta la fexc_end y en la cantidad de la parte entera de n puede ser también un copiado sucesivo o un copiado de espejo. Para detalles, consultar los registros relacionados anteriormente mencionados. Los detalles no se describen de nuevo en la presente memoria.
En las dos maneras anteriormente mencionadas, independientemente de empezar a predecir la señal de excitación de banda de alta frecuencia entre la f last_sfm y la ftop_sfm desde la f last_sfm o la ftop_sfm, los resultados de la señal de excitación de banda de alta frecuencia que está entre la f last_sfm y la ftop_sfm y se obtiene finalmente por predicción son los mismos.
Adicionalmente, en la solución anteriormente mencionada, cuando un ancho de banda desde la (fexc_start + (flast_sfm -fbwe_start)) hasta la fexc_end es mayor o igual que la cantidad de secciones de frecuencia entre la f last_sfm y la ftop_sfm, solo hay una necesidad de adquirir, empezando desde la (fexc_start + (flast_sfm - fbwe_start)) en el ancho de banda desde la (fexc_start + (flast_sfm - fbwe_start)) hasta la fexc_end, una señal de excitación cuyo intervalo de sección de frecuencia es desde la f last_sfm hasta la ftop_sfm y usa la señal de excitación como la señal de excitación entre la f last_sfm y la ftop_sfm.
En un proceso de implementación de la solución anteriormente mencionada, se puede calcular primero una relación, es decir, n, para adquirir dividiendo una diferencia entre la (fexc_start + (flast_sfm - fbwe_start)) y la cantidad de secciones de
frecuencia entre la f iast_ _sfm y la ftop_sfm por la cantidad de secciones de frecuencia entre la fexc_start y la fexc_end, donde n puede ser 0, un entero positivo o un decimal positivo.
Por ejemplo, cuando la tasa de codificación es 24 kbps, la fbwe_start es igual a 6,4 kHz, y la ftop_sfm es 14 kHz. La señal de excitación de la señal de banda de alta frecuencia se predice de la siguiente manera: se asume que un intervalo de extensión de una señal de banda de baja frecuencia preseleccionada es 0 kHz - 4 kHz, y una frecuencia más alta f last_sfm, a la que se asigna un bit, en la trama de orden N es 8 kHz; en este caso, la f last_sfm es mayor que la fbwe_start. Por lo tanto, se realiza un primer procesamiento de normalización auto adaptativo sobre una señal de excitación seleccionada de la señal de banda de baja frecuencia cuyo intervalo de extensión es 0 kHz - 4 kHz (para un proceso específico de procesamiento de normalización auto adaptativo, consultar los registros en la realización anteriormente mencionada; los detalles no se describen de nuevo en la presente memoria), y entonces, una señal de excitación de la señal de banda de alta frecuencia mayor que 8 kHz se predice según la señal de excitación normalizada de la señal de banda de baja frecuencia. Según la manera en la realización anteriormente mencionada, una secuencia para copiar la señal de excitación normalizada seleccionada de la señal de banda de baja frecuencia es como sigue a continuación: primero, se copia una señal de excitación dentro del intervalo de banda de baja frecuencia desde (8 kHz - 6,4 kHz) hasta 4 kHz, entonces, se copia una señal de excitación dentro de 0,9 copias del intervalo de banda de baja frecuencia desde la fexc_start hasta la fexc_end (0 kHz - 4 kHz), es decir, se copia una señal de excitación dentro de un intervalo de banda de baja frecuencia desde 0 kHz hasta 3,6 kHz; y las dos partes de señales de excitación se usan como una señal de excitación de banda de alta frecuencia entre la frecuencia más alta (flast_sfm = 8 kHz) a la que se asigna un bit y la frecuencia más alta ftop_sfm (ftop_sfm = 14 kHz) de la señal de banda de alta frecuencia. Si una frecuencia más alta f last_sfm, a la que se asigna un bit, en la trama de orden (N+1) es menor o igual que 6,4 kHz (una sección de frecuencia de inicio preestablecida fbwe_start de la extensión de ancho de banda de la señal de banda de alta frecuencia es igual a 6,4 kHz), se realiza el procesamiento de normalización auto adaptativo sobre la señal de excitación seleccionada que es de la señal de banda de baja frecuencia y dentro de un intervalo de banda de frecuencia de 0 kHz -4 kHz, y entonces, se predice una señal de excitación de una señal de banda de alta frecuencia mayor que 6,4 kHz según la señal de excitación normalizada de la señal de banda de baja frecuencia. Según la manera en la realización anteriormente mencionada, una secuencia para copiar la señal de excitación normalizada seleccionada de la señal de banda de baja frecuencia es como sigue a continuación: primero, se hace una copia de una señal de excitación dentro de un intervalo de banda de baja frecuencia desde la fexc_start hasta la fexc_end (0 kHz - 4 kHz), entonces, se copia la señal de excitación dentro de 0,9 copias del intervalo de banda de baja frecuencia desde la fexc_start hasta la fexc_end (0 kHz - 4 kHz), y las dos partes de señales de excitación se usan como la señal de excitación de banda de alta frecuencia entre la sección de frecuencia de inicio preestablecida (fbwe_start = 6,4 kHz) de la extensión de ancho de banda de la señal de banda de alta frecuencia y la frecuencia más alta ftop_sfm (ftop_sfm = 14 kHz) de la señal de banda de alta frecuencia.
La sección de frecuencia más alta de la señal de banda de alta frecuencia se determina según un tipo de la señal del dominio de frecuencia. Por ejemplo, cuando el tipo de la señal del dominio de frecuencia es una señal de ultra banda ancha, la frecuencia más alta ftop_sfm de la señal de banda de alta frecuencia es 14 kHz. Antes de comunicar con cada uno de los otros, generalmente, el dispositivo de codificación y el dispositivo de decodificación han determinado un tipo de una señal del dominio de frecuencia a ser transmitida; por lo tanto, se puede considerar determinada una sección de frecuencia más alta de la señal del dominio de frecuencia.
Según el método para predecir una señal de banda de alta frecuencia en la realización anteriormente mencionada, usando la solución técnica anteriormente mencionada, para una armónica y una no armónica, se usa información de envolvente diferente para predecir una señal de banda de alta frecuencia, evitando por ello producir excesivos ruidos en un proceso de predicción, reduciendo de forma efectiva un error que existe entre la señal de banda de alta frecuencia obtenida por modificación y una señal de banda de alta frecuencia real, e incrementando una tasa de precisión de la señal de banda de alta frecuencia predicha.
Adicionalmente, se puede encontrar de la predicción anteriormente mencionada de la señal de excitación de la señal de banda de alta frecuencia que aunque las secciones de frecuencia de inicio de la extensión de ancho de banda en la trama de orden N y la trama de orden (N+1) son diferentes, se obtiene una señal de excitación de una misma banda de frecuencia mayor que 8 kHz por predicción de una señal de excitación de una misma banda de frecuencia de una señal de banda de baja frecuencia; por lo tanto, se puede asegurar la continuidad de las tramas.
Usando la solución técnica de la realización anteriormente mencionada, se puede asegurar de forma efectiva la continuidad de las señales de excitación que son de señales de banda de alta frecuencia y que se predicen en una trama anterior y una trama posterior, asegurando por ello la calidad auditiva de una señal de banda de alta frecuencia reconstruida y mejorando la calidad auditiva de una señal de audio.
La FIG. 4 es un diagrama de flujo de un método para predecir una señal de banda de alta frecuencia según otra realización de la presente invención. En esta realización, el método para predecir una señal de banda de alta frecuencia se puede ejecutar por un dispositivo de codificación. Como se muestra en la FIG. 4, en esta realización, el método para predecir una señal de banda de alta frecuencia puede incluir específicamente los siguientes pasos:
200. El dispositivo de codificación adquiere un tipo de señal de una señal de audio y una señal de banda de baja frecuencia de la señal de audio, donde el tipo de señal en esta realización es una armónica o no armónica, y la señal de audio en esta realización incluye la señal de banda de baja frecuencia y una señal de banda de alta frecuencia.
201. El dispositivo de codificación codifica una envolvente de frecuencia de la señal de banda de alta frecuencia según el tipo de señal para obtener la envolvente de frecuencia de la señal de banda de alta frecuencia;
202. El dispositivo de codificación envía, a un dispositivo de decodificación, un flujo de bits que transporta el tipo de señal, la señal de banda de baja frecuencia, y la envolvente de frecuencia de la señal de banda de alta frecuencia.
En esta realización, las soluciones técnicas en realizaciones de la presente invención se describen en un lado del dispositivo de codificación, y en esta realización, el flujo de bits transporta el tipo de señal, y los índices de codificación de la señal de banda de baja frecuencia y la envolvente de frecuencia de la señal de banda de alta frecuencia.
Correspondientemente, en un lado del dispositivo de decodificación, el dispositivo de decodificación recibe el flujo de bits, demultiplexa el flujo de bits recibido para adquirir el tipo de señal y la señal de banda de baja frecuencia, y entonces decodifica el flujo de bits recibido según el tipo de señal para adquirir la correspondiente envolvente de frecuencia de la señal de banda de alta frecuencia. Entonces, el dispositivo de decodificación predice una señal de excitación de la señal de banda de alta frecuencia según la señal de banda de baja frecuencia, y reconstruye la señal de banda de alta frecuencia según la envolvente de frecuencia de la señal de banda de alta frecuencia y la señal de excitación de la señal de banda de alta frecuencia. Específicamente, esta realización se corresponde con aquella en que el flujo de bits recibido por el dispositivo de decodificación transporta el tipo de señal, y los índices de codificación del parámetro de cuantificación de la señal de banda de baja frecuencia y la envolvente de frecuencia de la señal de banda de alta frecuencia en la realización de extensión anteriormente mencionada de la realización mostrada en la FIG. 3. Para los detalles de un proceso de implementación específico, consultar los registros relacionados en la realización de extensión anteriormente mencionada de la realización mostrada en la FIG. 3. Los detalles no se describen de nuevo en la presente memoria.
Según el método para predecir una señal de banda de alta frecuencia en esta realización, un dispositivo de codificación adquiere un tipo de señal y una señal de banda de baja frecuencia, codifica una envolvente de frecuencia de una señal de banda de alta frecuencia según el tipo de señal para obtener la envolvente de frecuencia de la señal de banda de alta frecuencia, y envía, al dispositivo de decodificación, un flujo de bits que transporta el tipo de señal, la señal de banda de baja frecuencia, y la envolvente de frecuencia de la señal de banda de alta frecuencia, de modo que el dispositivo de decodificación decodifica el flujo de bits para adquirir un parámetro de cuantificación de la señal de banda de baja frecuencia y el tipo de señal, adquiere la envolvente de frecuencia de la señal de banda de alta frecuencia según el tipo de señal, predice una señal de excitación de la señal de banda de alta frecuencia según el parámetro de cuantificación de la señal de banda de baja frecuencia, y entonces predice la señal de banda de alta frecuencia según la envolvente de frecuencia de la señal de banda de alta frecuencia y la señal de excitación de la señal de banda de alta frecuencia. Usando la solución técnica en esta realización, se puede evitar producir excesivos ruidos en un proceso de predicción, se puede reducir de forma efectiva un error que existe entre una señal de banda de alta frecuencia obtenida por predicción y una señal de banda de alta frecuencia real, y se puede incrementar una tasa de precisión de la señal de banda de alta frecuencia predicha.
De forma similar y opcionalmente, en la solución técnica de la realización anteriormente mencionada, en 201, el dispositivo de codificación codifica la envolvente de frecuencia de la señal de banda de alta frecuencia según el tipo de señal para obtener la envolvente de frecuencia de la señal de banda de alta frecuencia. Por ejemplo, cuando el tipo de señal es una señal no armónica, se usa una primera cantidad de coeficientes de espectro para calcular la envolvente de frecuencia de la señal de banda de alta frecuencia, y cuando el tipo de señal es una señal armónica, se usa una segunda cantidad de coeficientes de espectro para calcular la envolvente de frecuencia de la señal de banda de alta frecuencia, donde la segunda cantidad es mayor que la primera cantidad. De este modo, una anchura de una subbanda cubierta por la envolvente de frecuencia que es de la señal de banda de alta frecuencia y se obtiene codificando por el dispositivo de codificación cuando el tipo de señal es armónica es mayor que una anchura de una subbanda cubierta por la envolvente de frecuencia que es de la señal de banda de alta frecuencia y se obtiene codificando por el dispositivo de codificación cuando el tipo de señal es una señal no armónica. Para los detalles de un proceso de implementación específico, consultar la FIG. 3 y los registros en la realización de extensión anteriormente mencionada de la realización mostrada en la FIG. 3. Los detalles no se describen de nuevo en la presente memoria.
La FIG. 5 es un diagrama de flujo de un método para predecir una señal de banda de alta frecuencia según todavía otra realización de la presente invención. En esta realización, el método para predecir una señal de banda de alta frecuencia se puede ejecutar por un dispositivo de codificación. Como se muestra en la FIG. 5, en esta realización, el método para predecir una señal de banda de alta frecuencia puede incluir específicamente los siguientes pasos:
300. El dispositivo de codificación adquiere un tipo de señal de una señal de audio y una señal de banda de baja frecuencia de la señal de audio.
En esta realización, el tipo de señal es una armónica o no armónica, y la señal de audio incluye la señal de banda de baja frecuencia y una señal de banda de alta frecuencia.
301. El dispositivo de codificación calcula una envolvente de frecuencia de una señal de banda de alta frecuencia.
En esta realización, un método para calcular una envolvente de frecuencia de una señal de banda de alta frecuencia de una señal armónica es la misma que la de una señal no armónica.
302. El dispositivo de codificación envía, a un dispositivo de decodificación, un flujo de bits que transporta el tipo de señal, y los índices de codificación de la señal de banda de baja frecuencia y la envolvente de frecuencia de la señal de banda de alta frecuencia.
De forma similar, en esta realización, las soluciones técnicas en realizaciones de la presente invención se describen en el lado del dispositivo de codificación, y en esta realización, el flujo de bits transporta el tipo de señal, y los índices de codificación de la señal de banda de baja frecuencia y la envolvente de frecuencia de la señal de banda de alta frecuencia.
Correspondientemente, en el lado del dispositivo de decodificación, el dispositivo de decodificación recibe el flujo de bits, demultiplexa el flujo de bits recibido para adquirir el tipo de señal y la señal de banda de baja frecuencia, y entonces adquiere la envolvente de frecuencia de la señal de banda de alta frecuencia según el tipo de señal. Por ejemplo, cuando el tipo de señal es una señal no armónica, el dispositivo de decodificación demultiplexa el flujo de bits recibido, decodifica el flujo de bits recibido para obtener la envolvente de frecuencia de la señal de banda de alta frecuencia, y cuando el tipo de señal es una armónica, el dispositivo de decodificación demultiplexa el flujo de bits recibido, decodifica el flujo de bits recibido para obtener una envolvente de frecuencia inicial de la señal de banda de alta frecuencia, y usa un valor obtenido realizando un cálculo de ponderación sobre la envolvente de frecuencia inicial y N envolventes de frecuencia inicial adyacentes como la envolvente de frecuencia de la señal de banda de alta frecuencia, donde N es mayor o igual que 1. Entonces, el dispositivo de decodificación predice una señal de excitación de la señal de banda de alta frecuencia según la señal de banda de baja frecuencia, y reconstruye la señal de banda de alta frecuencia según la envolvente de frecuencia de la señal de banda de alta frecuencia y la señal de excitación de la señal de banda de alta frecuencia. Específicamente, esta realización se corresponde con el otro caso en la realización de extensión anteriormente mencionada de la realización mostrada en la FIG. 3. Para los detalles de un proceso de implementación específico, consultar la FIG. 3 y los registros relacionados en la realización de extensión anteriormente mencionada de la realización mostrada en la FIG. 3. Los detalles no se describen de nuevo en la presente memoria.
Según el método para predecir una señal de banda de alta frecuencia en esta realización, un dispositivo de codificación adquiere un tipo de señal de una señal de audio y una señal de banda de baja frecuencia de la señal de audio, calcula una envolvente de frecuencia de una señal de banda de alta frecuencia, y envía, a un dispositivo de decodificación, un flujo de bits que transporta el tipo de señal, y los índices de codificación de la señal de banda de baja frecuencia y la envolvente de frecuencia de la señal de banda de alta frecuencia, de modo que el dispositivo de decodificación demultiplexa el flujo de bits para adquirir el tipo de señal y la señal de banda de baja frecuencia, entonces adquiere la envolvente de frecuencia de la señal de banda de alta frecuencia según el tipo de señal, entonces predice una señal de excitación de la señal de banda de alta frecuencia según la señal de banda de baja frecuencia, y reconstruye la señal de banda de alta frecuencia según la envolvente de frecuencia de la señal de banda de alta frecuencia. Usando la solución técnica en esta realización, se puede evitar producir excesivos ruidos en el proceso de predicción, se puede reducir de forma efectiva un error que existe entre una señal de banda de alta frecuencia obtenida por predicción y una señal de banda de alta frecuencia real, y se puede incrementar una tasa de precisión de la señal de banda de alta frecuencia predicha.
Una persona de habilidad ordinaria en la técnica puede entender puede entender que todo o una parte de los pasos de las realizaciones de método anteriormente mencionadas se pueden implementar por un programa que da instrucciones a un hardware relevante. El programa se puede almacenar en un medio de almacenamiento legible por ordenador. Cuando el programa se ejecuta, se realizan los pasos de las realizaciones de método. El medio de almacenamiento anteriormente mencionado incluye cualquier medio que pueda almacenar código de programa, tal como una ROM, una RAM, un disco magnético, o un disco óptico.
La FIG. 6 es un diagrama estructural esquemático de un dispositivo de decodificación según un ejemplo que no comprende todas las características necesarias para implementar la presente invención. Como se muestra en la FIG.
6, en esta realización, el dispositivo de decodificación incluye un primer módulo de adquisición 30, un segundo módulo de adquisición 31, un módulo de predicción 32, y un módulo de reconstrucción 33.
El primer módulo de adquisición 30 se configura para adquirir un tipo de señal de una señal de audio y una señal de banda de baja frecuencia de la señal de audio, donde el tipo de señal es una señal armónica o una señal no armónica, y la señal de audio incluye la señal de banda de baja frecuencia y una señal de banda de alta frecuencia. El segundo módulo de adquisición 31 está conectado al primer módulo de adquisición 30, y el segundo módulo de adquisición 31 se configura para adquirir una envolvente de frecuencia de la señal de banda de alta frecuencia según el tipo de señal adquirido por el primer módulo de adquisición 30. El módulo de predicción 32 está conectado al primer módulo de
adquisición 30, y el módulo de predicción 32 se configura para predecir una señal de excitación de la señal de banda de alta frecuencia según la señal de banda de baja frecuencia adquirida por el primer módulo de adquisición 30. El módulo de reconstrucción 33 está conectado separadamente al segundo módulo de adquisición 31 y al módulo de predicción 32, y el módulo de reconstrucción 33 se configura para reconstruir la señal de banda de alta frecuencia según la envolvente de frecuencia que es de la señal de banda de alta frecuencia y adquirida por el segundo módulo de adquisición 31 y la señal de excitación que es de la señal de banda de alta frecuencia y se obtiene por predicción por el módulo de predicción 32.
El dispositivo de decodificación en esta realización usa los módulos anteriormente mencionados para implementar la predicción de una señal de banda de alta frecuencia, que es la misma que en el proceso de implementación de las realizaciones de método relacionadas anteriormente mencionadas. Para detalles, consultar los registros en las realizaciones de método relacionadas mencionadas anteriormente. Los detalles no se describen de nuevo en la presente memoria.
El dispositivo de decodificación en esta realización usa los módulos anteriormente mencionados para implementar que para una señal de un tipo diferente, se usa un coeficiente de espectro diferente para decodificar una envolvente, de modo que la señal de excitación de una señal armónica de banda de alta frecuencia predicha según una señal de banda de baja frecuencia puede mantener una cualidad armónica original, evitando por ello producir excesivos ruidos en un proceso de predicción, reduciendo de forma efectiva un error que existe entre una señal de banda de alta frecuencia obtenida por predicción y una señal de banda de alta frecuencia real, e incrementando una tasa de precisión de la señal de banda de alta frecuencia predicha.
La FIG. 7 es un diagrama estructural esquemático de un dispositivo de decodificación según otro ejemplo que no comprende todas las características necesarias para implementar la presente invención. En esta realización, sobre la base de la realización anteriormente mencionada mostrada en la FIG. 6, el dispositivo de decodificación puede además incluir la siguiente solución técnica de extensión.
En el dispositivo de decodificación en esta realización, el segundo módulo de adquisición 31 se configura específicamente para: cuando el tipo de señal adquirido por el primer módulo de adquisición 30 es una señal no armónica, demultiplexar un flujo de bits recibido, y decodificar el flujo de bits recibido para obtener la envolvente de frecuencia de la señal de banda de alta frecuencia; o el segundo módulo de adquisición 31 se configura específicamente para: cuando el tipo de señal adquirido por el primer módulo de adquisición 30 es una señal armónica, demultiplexar un flujo de bits recibido, decodificar el flujo de bits recibido para obtener una envolvente de frecuencia inicial de la señal de banda de alta frecuencia, y usar un valor obtenido realizando un cálculo de ponderación sobre la envolvente de frecuencia inicial y N envolventes de frecuencia inicial adyacentes como la envolvente de frecuencia de la señal de banda de alta frecuencia, donde N es mayor o igual que 1.
Opcionalmente, en el dispositivo de decodificación en esta realización, el segundo módulo de adquisición 31 se configura específicamente para decodificar un flujo de bits recibido según el tipo de señal adquirido por el primer módulo de adquisición 30, para adquirir la envolvente de frecuencia correspondiente de la señal de banda de alta frecuencia.
Opcionalmente, en el dispositivo de decodificación en esta realización, el primer módulo de adquisición 30 se configura específicamente para demultiplexar el flujo de bits para adquirir el tipo de señal y la señal de banda de baja frecuencia. En este caso, correspondientemente, el flujo de bits que se envía por el dispositivo de codificación y se recibe por el dispositivo de decodificación transporta el tipo de señal, y los índices de codificación de la señal de banda de baja frecuencia y la envolvente de frecuencia de la señal de banda de alta frecuencia.
Alternativamente, opcionalmente, en el dispositivo de decodificación en esta realización, el primer módulo de adquisición 30 específicamente demultiplexa el flujo de bits para adquirir señal de banda de baja frecuencia, y determina el tipo de señal según la señal de banda de baja frecuencia.
Opcionalmente, en el dispositivo de decodificación en esta realización, el módulo de predicción 32 puede específicamente incluir una unidad de determinación 321, una unidad de evaluación 322, una primera unidad de procesamiento 323, y una segunda unidad de procesamiento 324.
La unidad de determinación 321 está conectada al primer módulo de adquisición 30, y la unidad de determinación 321 se configura para determinar una sección de frecuencia más alta, a la que se asigna un bit, de la señal de banda de baja frecuencia adquirida por el primer módulo de adquisición 30. La unidad de evaluación 322 está conectada a la unidad de determinación 321, y la unidad de evaluación 322 se configura para determinar si la sección de frecuencia más alta, a la que se asigna un bit y que se determina por la unidad de determinación 321, de la señal de banda de baja frecuencia es menor que una sección de frecuencia de inicio preestablecida de una extensión de ancho de banda de la señal de banda de alta frecuencia. La primera unidad de procesamiento 323 está conectada a la unidad de evaluación 322, y la primera unidad de procesamiento 323 se configura para: cuando la unidad de evaluación 322 determina que la sección de frecuencia más alta, a la que se asigna un bit, de la señal de banda de baja frecuencia es menor que la sección de frecuencia de inicio preestablecida de la extensión de ancho de banda de la señal de banda de alta frecuencia, predecir la señal de excitación de la señal de banda de alta frecuencia según una señal de
excitación que cae dentro de un intervalo de banda de frecuencia predeterminado y en la señal de banda de baja frecuencia y la sección de frecuencia de inicio preestablecida de la extensión de ancho de banda de la señal de banda de alta frecuencia. La segunda unidad de procesamiento 324 también está conectada a la unidad de evaluación 322, y la segunda unidad de procesamiento 324 se configura para: cuando la unidad de evaluación 322 determina que la sección de frecuencia más alta, a la que se asigna un bit, de la señal de banda de baja frecuencia es mayor o igual que la sección de frecuencia de inicio preestablecida de la extensión de ancho de banda de la señal de banda de alta frecuencia, predecir la señal de excitación de la señal de banda de alta frecuencia según una señal de excitación que cae dentro de un intervalo de banda de frecuencia predeterminado y en la señal de banda de baja frecuencia, la sección de frecuencia de inicio preestablecida de la extensión de ancho de banda de la señal de banda de alta frecuencia, y la sección de frecuencia más alta, a la que se asigna un bit, de la señal de banda de baja frecuencia. En este caso, correspondientemente, el módulo de reconstrucción 33 está conectado separadamente al segundo módulo de adquisición 31, a la primera unidad de procesamiento 323, y a la segunda unidad de procesamiento 324. Sin embargo, en un mismo momento, el módulo de reconstrucción 33 puede estar conectado solo a una de la primera unidad de procesamiento 323 y la segunda unidad de procesamiento 324. Cuando la unidad de evaluación 322 determina que la sección de frecuencia más alta, a la que se asigna un bit, de la señal de banda de baja frecuencia es menor que la sección de frecuencia de inicio preestablecida de la extensión de ancho de banda de la señal de banda de alta frecuencia, el módulo de reconstrucción 33 está conectado a la primera unidad de procesamiento 323. Cuando la unidad de evaluación 322 determina que la sección de frecuencia más alta, a la que se asigna un bit, de la señal de banda de baja frecuencia es mayor o igual que la sección de frecuencia de inicio preestablecida de la extensión de ancho de banda de la señal de banda de alta frecuencia, el módulo de reconstrucción 33 está conectado a la segunda unidad de procesamiento 324. El módulo de reconstrucción 33 se configura específicamente para reconstruir la señal de banda de alta frecuencia según la envolvente de frecuencia que es de la señal de banda de alta frecuencia y adquirida por el segundo módulo de adquisición 31 y la señal de excitación que es de la señal de banda de alta frecuencia y se obtiene por predicción por la primera unidad de procesamiento 323 o la segunda unidad de procesamiento 324.
Además opcionalmente, en el dispositivo de decodificación en esta realización, la primera unidad de procesamiento 323 se configura específicamente para: cuando la unidad de evaluación 322 determina que la sección de frecuencia más alta, a la que se asigna un bit, de la señal de banda de baja frecuencia es menor que la sección de frecuencia de inicio preestablecida de la extensión de ancho de banda de la señal de banda de alta frecuencia, hacer n copias de la señal de excitación dentro del intervalo de banda de frecuencia predeterminado, y usar las n copias de la señal de excitación como una señal de excitación entre la sección de frecuencia de inicio preestablecida de la extensión de ancho de banda de la señal de banda de alta frecuencia y una sección de frecuencia más alta de la banda de frecuencia de extensión de ancho de banda, donde n es un entero positivo o un decimal positivo, y n es igual a una relación de una cantidad de secciones de frecuencia entre la sección de frecuencia de inicio preestablecida de la extensión de ancho de banda de la señal de banda de alta frecuencia y la sección de frecuencia más alta de la banda de frecuencia de extensión de ancho de banda con una cantidad de secciones de frecuencia dentro del intervalo de banda de frecuencia predeterminado. Para una implementación específica de la primera unidad de procesamiento 323, se puede usar la solución técnica registrada en la realización de extensión anteriormente mencionada de la realización mostrada en la FIG. 3. Los detalles no se describen de nuevo en la presente memoria.
Además opcionalmente, en el dispositivo decodificador en esta realización, la segunda unidad de procesamiento 324 se configura específicamente para: cuando la unidad de evaluación 322 determina que la sección de frecuencia más alta, a la que se asigna un bit, de la señal de banda de baja frecuencia es mayor o igual que la sección de frecuencia de inicio preestablecida de la extensión de ancho de banda de la señal de banda de alta frecuencia, copiar una señal de excitación de la sección de frecuencia de orden m por encima de una sección de frecuencia de inicio fexc_start del intervalo de banda de frecuencia predeterminado a una sección de frecuencia final fexc_end del intervalo de banda de frecuencia predeterminado y hacer n copias de la señal de excitación dentro del intervalo de banda de frecuencia predeterminado, y usar las dos partes de señales de excitación como una señal de excitación entre la sección de frecuencia más alta, a la que se asigna un bit, de la señal de banda de baja frecuencia y una sección de frecuencia más alta de la banda de frecuencia de extensión de ancho de banda, donde n es 0, un entero positivo, o un decimal positivo, y m es una diferencia de una cantidad de secciones de frecuencia entre la sección de frecuencia más alta, a la que se asigna un bit, de la señal de banda de baja frecuencia y la sección de frecuencia de inicio preestablecida de la banda de frecuencia de extensión. Para una implementación específica de la segunda unidad de procesamiento 324, se puede usar la solución técnica registrada en la realización de extensión anteriormente mencionada de la realización mostrada en la FIG. 3. Los detalles no se describen de nuevo en la presente memoria.
Según el dispositivo de decodificación en esta realización, se usa una manera en la que las múltiples realizaciones opcionales anteriormente mencionadas coexisten para introducir las soluciones técnicas en la presente invención. En una referencia real, las múltiples realizaciones opcionales anteriormente mencionadas se pueden combinar aleatoriamente para formar realizaciones de la presente invención. Los detalles no se describen de nuevo en la presente memoria.
El dispositivo de decodificación en esta realización usa los módulos anteriormente mencionados para implementar la predicción de una señal de banda de alta frecuencia, que es la misma que el proceso de implementación de las realizaciones de método relacionadas anteriormente mencionadas. Para los detalles, consultar los registros en las
realizaciones de método relacionadas anteriormente mencionadas. Los detalles no se describen de nuevo en la presente memoria.
El dispositivo de decodificación en esta realización usa los módulos anteriormente mencionados para usar, para una señal de un tipo diferente, un coeficiente de espectro diferente para decodificar una envolvente, de modo que la excitación de una señal armónica de banda de alta frecuencia predicha según una baja frecuencia puede mantener una cualidad armónica original, evitando por ello producir excesivos ruidos en el proceso de predicción, reduciendo de forma efectiva un error que existe entre una señal de banda de alta frecuencia obtenida por predicción y una señal de banda de alta frecuencia real, e incrementando una tasa de precisión de la señal de banda de alta frecuencia.
La FIG. 8 es un diagrama estructural esquemático de un dispositivo de codificación según una realización de la presente invención. Como se muestra en la FIG. 8, en esta realización, el dispositivo de codificación puede incluir específicamente un módulo de adquisición 40, un módulo de codificación 41, y un módulo de envío 42.
El módulo de adquisición 40 se configura para adquirir un tipo de señal de una señal de audio y una señal de banda de baja frecuencia de la señal de audio, donde el tipo de señal es una armónica o una no armónica, y la señal de audio incluye la señal de banda de baja frecuencia y una señal de banda de alta frecuencia. El módulo de codificación 41 está conectado al módulo de adquisición 40, y el módulo de codificación 41 se configura para codificar una envolvente de frecuencia de la señal de banda de alta frecuencia según el tipo de señal adquirida por el módulo de adquisición 40, para obtener la envolvente de frecuencia de la señal de banda de alta frecuencia. El módulo de envío 42 está conectado separadamente al módulo de adquisición 40 y al módulo de codificación 41, y el módulo de envío 42 se configura para enviar, a un dispositivo de decodificación, un flujo de bits que transporta el tipo de señal adquirido por el módulo de adquisición 40, y los índices de codificación de la señal de banda de baja frecuencia adquiridos por el módulo de adquisición 40 y la envolvente de frecuencia de la señal de banda de alta frecuencia y se obtiene codificando por el módulo de codificación 41.
Por ejemplo, usando los módulos anteriormente mencionados, el dispositivo de codificación puede enviar, al dispositivo de decodificación, el flujo de bits que transporta el tipo de señal, y los índices de codificación de la señal de banda de baja frecuencia y la envolvente de frecuencia de la señal de banda de alta frecuencia, de modo que el dispositivo de decodificación adquiere el tipo de señal de la señal de audio y la señal de banda de baja frecuencia de la señal de audio, donde el tipo de señal es una armónica o una no armónica, y la señal de audio incluye la señal de banda de baja frecuencia y la señal de banda de alta frecuencia; adquiere la envolvente de frecuencia de la señal de banda de alta frecuencia según el tipo de señal; predice una señal de excitación de la señal de banda de alta frecuencia según la señal de banda de baja frecuencia; y reconstruye la señal de banda de alta frecuencia según la envolvente de frecuencia de la señal de banda de alta frecuencia y la señal de excitación de la señal de banda de alta frecuencia. Para los detalles, consultar los registros en las realizaciones relacionadas anteriormente mencionadas. Los detalles no se describen de nuevo en la presente memoria.
El dispositivo de codificación en esta realización usa los módulos anteriormente mencionados para implementar la predicción de una señal de banda de alta frecuencia, que es la misma que el proceso de implementación de las realizaciones de método relacionadas anteriormente mencionadas. Para los detalles consultar los registros en las realizaciones de método relacionadas anteriormente mencionadas. Los detalles no se describen de nuevo en la presente memoria.
Usando los módulos anteriormente mencionados, el dispositivo de codificación en esta realización puede implementar convenientemente que para una señal de un tipo diferente, se usa un coeficiente de espectro diferente para decodificar una envolvente, de modo que la excitación de una señal armónica de banda de alta frecuencia predicha según una baja frecuencia puede mantener una cualidad armónica original, evitando por ello producir excesivos ruidos en un proceso de predicción, reduciendo de forma efectiva un error que existe entre una señal de banda de alta frecuencia obtenida por predicción y una señal de banda de alta frecuencia real, e incrementando una tasa de precisión de la señal de banda de alta frecuencia predicha.
Opcionalmente, sobre la base de la realización anteriormente mencionada mostrada en la FIG. 8, el módulo de codificación 41 se configura específicamente para: cuando el tipo de señal adquirido por el módulo de adquisición 40 es una señal no armónica, se usa una primera cantidad de coeficientes de espectro para calcular la envolvente de frecuencia de la señal de banda de alta frecuencia; o el módulo de codificación 41 se configura específicamente para: cuando el tipo de señal adquirido por el módulo de adquisición 40 es una señal armónica, se usa una segunda cantidad de coeficientes de espectro para calcular la envolvente de frecuencia de la señal de banda de alta frecuencia, donde la segunda cantidad es mayor que la primera cantidad.
La FIG. 9 es un diagrama estructural esquemático de un dispositivo de codificación según otra realización de la presente invención. Como se muestra en la FIG. 9, en esta realización, el dispositivo de codificación puede incluir específicamente un módulo de adquisición 50, un módulo de cálculo 51, y un módulo de envío 52.
El módulo de adquisición 50 se configura para adquirir un tipo de señal de una señal de audio y una señal de banda de baja frecuencia de la señal de audio, donde el tipo de señal es una armónica o una no armónica, y la señal de audio incluye la señal de banda de baja frecuencia y una señal de banda de alta frecuencia. El módulo de cálculo 51 se
configura para calcular una envolvente de frecuencia de la señal de banda de alta frecuencia, donde un método para calcular una envolvente de frecuencia de una señal de banda de alta frecuencia de una señal armónica es el mismo que el de una señal no armónica. El módulo de envío 52 está conectado separadamente al módulo de adquisición 50 y al módulo de cálculo 51, y el módulo de envío 52 se configura para enviar, a un dispositivo de decodificación, un flujo de bits que transporta el tipo de señal adquirido por el módulo de adquisición 50, y los índices de codificación de la señal de banda de baja frecuencia adquiridos por el módulo de adquisición 50 y la envolvente de frecuencia que es de la señal de banda de alta frecuencia y se obtiene por cálculo por el módulo de cálculo 51.
Por ejemplo, usando los módulos anteriormente mencionados, el dispositivo de codificación puede enviar, al dispositivo de decodificación, el flujo de bits que transporta el tipo de señal, y los índices de codificación de la señal de banda de baja frecuencia y la envolvente de frecuencia de la señal de banda de alta frecuencia, de modo que el dispositivo de decodificación adquiere el tipo de señal de la señal de audio y la señal de banda de baja frecuencia de la señal de audio, donde el tipo de señal es una señal armónica o una señal no armónica, y la señal de audio incluye la señal de banda de baja frecuencia y la señal de banda de alta frecuencia; adquiere la envolvente de frecuencia de señal de banda de alta frecuencia según el tipo de señal; predice una señal de excitación de la señal de banda de alta frecuencia según la señal de banda de baja frecuencia; y reconstruye la señal de banda de alta frecuencia según la envolvente de frecuencia de la señal de banda de alta frecuencia y la señal de excitación de la señal de banda de alta frecuencia. Para los detalles, consultar los registros en las realizaciones relacionadas anteriormente mencionadas. Los detalles no se describen de nuevo en la presente memoria.
El dispositivo de codificación en esta realización usa los módulos anteriormente mencionados para implementar la predicción de una señal de banda de alta frecuencia, que es la misma que el proceso de implementación de las realizaciones de método relacionadas anteriormente mencionadas. Para los detalles, consultar los registros en las realizaciones de método relacionadas anteriormente mencionadas. Los detalles no se describen de nuevo en la presente memoria.
Usando los módulos anteriormente mencionados, el dispositivo de codificación en esta realización puede implementar convenientemente que para una señal de un tipo diferente, se usa un coeficiente de espectro diferente para decodificar una envolvente, de modo que la señal de excitación de una señal armónica de banda de alta frecuencia predicha según una señal de banda de baja frecuencia puede mantener una cualidad armónica original, evitando por ello producir excesivos ruidos en un proceso de predicción, reduciendo de forma efectiva un error que existe entre una señal de banda de alta frecuencia obtenida por predicción y una señal de banda de alta frecuencia real, e incrementando una tasa de precisión de la señal de banda de alta frecuencia predicha.
La FIG. 10 es un diagrama de ejemplo de un dispositivo de codificación según un ejemplo que no comprende todas las características necesarias para implementar la presente invención. Como se muestra en la FIG. 10, en esta realización, el dispositivo de codificación es un diagrama de ejemplo de un dispositivo de codificación formado adicionando las soluciones técnicas en realizaciones de la presente invención al dispositivo de codificación existente anteriormente mencionado mostrado en la FIG. 1. Como se muestra en la FIG. 10, sobre la base del dispositivo de codificación mostrado en la FIG. 1 en la técnica anterior, en esta realización, se añade un módulo de extracción y codificación de clasificación 17 al dispositivo de codificación.
El módulo de extracción y codificación de clasificación 17 está conectado al módulo de transformación de tiempo -frecuencia 10, y el módulo de extracción y codificación de clasificación 17 se configura para: adquirir un tipo de señal obtenido después de la conversión por el módulo de transformación de tiempo - frecuencia 10, y codificar la envolvente de frecuencia que es de la señal de banda de alta frecuencia y cuantificada por el módulo de cuantificación y codificación de envolvente 12. En la presente memoria, el tipo de señal puede ser una señal armónica o una señal no armónica. El módulo de extracción y codificación de clasificación 17 está conectado además al módulo de multiplexación 16, y en este caso, el módulo de multiplexación 16 se configura para: multiplexar separadamente el tipo de señal adquirido por el módulo de extracción y codificación de clasificación 17, un índice de codificación obtenido codificando la envolvente de frecuencia de la señal de banda de alta frecuencia según el tipo de señal, y la señal de excitación cuantificada por el módulo de cuantificación y codificación de excitación 15 en un flujo de bits, y hace salir el flujo de bits a un dispositivo de decodificación. El resto es lo mismo que en la realización anteriormente mencionada mostrada en la FIG. 1. Para los detalles, consultar los registros en la realización relacionada anteriormente mencionada. Los detalles no se describen de nuevo en la presente memoria.
Para una implementación específica de la solución técnica del dispositivo de codificación en esta realización, consultar los registros en las realizaciones anteriormente mencionadas mostradas en la FIG. 1, FIG. 4, y FIG. 6. Los detalles no se describen de nuevo en la presente memoria.
El dispositivo de codificación en esta realización usa la solución técnica anteriormente mencionada para adquirir información de envolvente diferente para una señal armónica y una señal no armónica y enviar la información de envolvente a un dispositivo de decodificación, de modo que el dispositivo de decodificación usa diferente para una señal armónica y una señal no armónica para modificar una señal de excitación predicha de una señal de banda de alta frecuencia, evitando por ello producir excesivos ruidos en un proceso de modificación, reduciendo de forma efectiva un error que existe entre una señal de banda de alta frecuencia obtenida por modificación y una señal de banda de alta frecuencia real, e incrementando una tasa de precisión de la señal de banda de alta frecuencia predicha.
Opcionalmente, en la realización anteriormente mencionada mostrada en la FIG. 10, se puede adicionar además un módulo de cálculo. El módulo de cálculo se configura para calcular la envolvente de frecuencia de una señal de banda de alta frecuencia, donde un método para calcular una envolvente de frecuencia de una señal de banda de alta frecuencia de una señal armónica es el mismo que el de una señal no armónica. En este caso, el módulo de extracción y codificación de clasificación 17 no codifica, según el tipo de señal, la envolvente de frecuencia que es de la señal de banda de alta frecuencia y cuantificada por el módulo de cuantificación y codificación de envolvente 12. La implementación de la cuantificación y codificación de envolvente es la misma que en la realización anteriormente mencionada mostrada en la FIG. 10. Para una implementación específica de la solución técnica del dispositivo de codificación en esta realización, consultar los registros en las realizaciones anteriormente mencionadas mostradas en la FIG. 1, FIG. 5, y FIG. 7. Los detalles no se describen de nuevo en la presente memoria.
La FIG. 11 es un diagrama de ejemplo de un dispositivo de decodificación según un ejemplo que no comprende todas las características necesarias para implementar la presente invención. Como se muestra en la FIG. 11, en esta realización, el dispositivo de decodificación es un diagrama de ejemplo de un dispositivo de decodificación formado adicionando las soluciones técnicas en las realizaciones de la presente invención al dispositivo de decodificación existente anteriormente mencionado mostrado en la FIG. 2. Como se muestra en la FIG. 11, sobre la base de un dispositivo de decodificación mostrado en la FIG. 2 en la técnica anterior, en esta realización, se adiciona un módulo de decodificación de información de clasificación 27 al dispositivo de decodificación.
El módulo de decodificación de información de clasificación 27 se configura para adquirir un tipo de señal de un flujo de bits recibido. El módulo de reconstrucción de señal del dominio de frecuencia 25 está conectado además al módulo de decodificación de información de clasificación 27, y el módulo de reconstrucción de señal del dominio de frecuencia 25 reconstruye la señal del dominio de frecuencia según el tipo de señal obtenido por el módulo de decodificación de información de clasificación 27, la envolvente de frecuencia obtenida por el módulo de decodificación de envolvente de frecuencia 21, y la señal de excitación que es de la banda de frecuencia entera y se obtiene por el módulo de extensión de ancho de banda 24.
Mientras tanto, en esta realización, para extender el ancho de banda entero por el módulo de extensión de ancho de banda 24 según la señal de excitación obtenida por el módulo de decodificación de señal de excitación 23, es decir, que extiende la señal de excitación de la señal de banda de alta frecuencia usando la señal de excitación de la señal de banda de baja frecuencia, se puede usar el método que es para predecir la señal de excitación de la señal de banda de alta frecuencia según la señal de banda de baja frecuencia y se registra en la realización de extensión anteriormente mencionada de la realización mostrada en la FIG. 3. Para los detalles, consultar los registros en las realizaciones relacionadas anteriormente mencionadas. Los detalles no se describen de nuevo en la presente memoria.
Usando la solución anteriormente mencionada, el dispositivo de decodificación en esta realización puede asegurar de forma efectiva la continuidad de las señales de excitación que son de señales de banda de alta frecuencia y se predicen en una trama anterior y una trama posterior; mientras tanto, para una señal armónica y una señal no armónica, usar información de envolvente diferente para modificar una señal de excitación predicha de una señal de banda de alta frecuencia, evitando por ello producir excesivos ruidos en un proceso de modificación, reduciendo de forma efectiva un error existente entre una señal de banda de alta frecuencia obtenida por modificación y una señal de banda de alta frecuencia real, e incrementando una tasa de precisión de la señal de banda de alta frecuencia predicha.
El dispositivo de codificación en la realización anteriormente mencionada mostrada en la FIG. 10 y el dispositivo de decodificación en la realización anteriormente mencionada mostrada en la FIG. 11 son meramente estructuras de instancia opcionales de la presente invención. En una aplicación real, se pueden además deducir más estructuras de instancia opcionales de la presente invención según las soluciones técnicas de las realizaciones anteriormente mencionadas mostradas de la FIG. 3 a la FIG. 9. Para los detalles, consultar los registros en las realizaciones anteriores. Los detalles no se describen de nuevo en la presente memoria.
La FIG. 12 es un diagrama estructural esquemático de un sistema para predecir una señal de banda de alta frecuencia según una realización de la presente invención. En esta realización, el sistema para predecir una señal de banda de alta frecuencia incluye un dispositivo de codificación 70 y un dispositivo de decodificación 80.
En esta realización, el dispositivo de decodificación 80 puede ser el dispositivo de decodificación en las realizaciones anteriormente mencionadas mostradas en la FIG. 6 o la FIG. 7. El dispositivo de codificación 70 puede ser el dispositivo de codificación en la técnica anterior o el dispositivo de codificación en la realización anteriormente mencionada mostrada en la FIG. 8 o la FIG. 9.
En el sistema para predecir una señal de banda de alta frecuencia en esta realización, para los detalles de un proceso de implementación específico de predecir una señal de banda de alta frecuencia usando el dispositivo de codificación 70 y el dispositivo de decodificación 80, consultar los registros en la realización anteriormente mencionada mostrada en la FIG. 6, FIG. 7, FIG. 8, o FIG. 9 y las realizaciones de método relacionadas, y los detalles no se describen de nuevo en la presente memoria.
Según el sistema para predecir una señal de banda de alta frecuencia en esta realización, usando la solución técnica anteriormente mencionada, para una armónica y una no armónica, se usa información de envolvente diferente para predecir una señal de excitación de una señal de banda de alta frecuencia, evitando por ello producir excesivos ruidos en un proceso de modificación, reduciendo de forma efectiva un error que existe entre una señal de banda de alta frecuencia obtenida por modificación y una señal de banda de alta frecuencia real, e incrementando una tasa de precisión de la señal de banda de alta frecuencia predicha. Adicionalmente, cuando el dispositivo de decodificación 80 en la realización mostrada en la FIG. 7 se usa en el sistema para predecir una señal de banda de alta frecuencia, la continuidad de las señales de excitación que son de las señales de banda de alta frecuencia y se predicen en una trama anterior y una trama posterior se puede además asegurar de forma efectiva, asegurando por ello la calidad auditiva de una señal de banda de alta frecuencia reconstruida y mejorando la calidad auditiva de la señal de audio.
La FIG. 13 es un diagrama de bloque de un aparato 90 según otra realización de la presente invención. El aparato 90 en la FIG. 13 se puede usar para implementar los pasos y los métodos en las realizaciones de método anteriormente mencionadas. El aparato 90 se puede aplicar a una estación base o un terminal en diversos sistemas de comunicación. En la realización de la FIG. 13, el aparato 90 incluye un circuito de recepción 902, un procesador de decodificación 903, una unidad de procesamiento 904, una memoria 905, y una antena 901. La unidad de procesamiento 904 controla una operación del aparato 90, y la unidad de procesamiento 904 se puede referir también como una CPU (en inglés, Central Processing Unit, unidad central de procesamiento). La memoria 905 puede incluir una memoria de solo lectura y una memoria de acceso aleatorio, y proporciona una instrucción y datos para la unidad de procesamiento 904. Una parte de la memoria 905 puede además incluir a memoria de acceso aleatorio no volátil (NVRAM). En una aplicación específica, un dispositivo de comunicaciones inalámbricas tal como un teléfono móvil se puede incorporar en el aparato 90, o el aparato 90 puede ser un dispositivo de comunicaciones inalámbricas, y el aparato 90 puede además incluir un transportador que aloja el circuito de recepción 901, para permitir al aparato 90 recibir datos de una ubicación remota. El circuito de recepción 901 se puede acoplar a la antena 901. Todos los componentes del aparato 90 se acoplan juntos usando un sistema de bus 906, donde adicionalmente al bus de datos, el sistema de bus 906 incluye además un bus de potencia, un bus de control, y un bus de señal de estado. Sin embargo, para claridad de la descripción, diversos buses se marcan como el sistema de bus 906 en la FIG. 13. El aparato 90 puede además incluir la unidad de procesamiento 904 configurada para procesar una señal, y adicionalmente, además incluye el procesador de decodificación 903.
Los métodos descritos en las realizaciones anteriormente mencionadas de la presente invención se pueden aplicar al procesador de decodificación 903, o implementados por el procesador de decodificación 903. El procesador de decodificación 903 puede ser un chip de circuito integrado y tiene una capacidad de procesamiento de señal. En un proceso de implementación, los pasos en las realizaciones de método anteriormente mencionadas (por ejemplo, la realización de método correspondiente a la FIG. 3) se puede completar usando un circuito lógico integrado de hardware en el procesador de decodificación 903 o las instrucciones en forma de software. Estas instrucciones se pueden implementar y controlar cooperando con la unidad de procesamiento 904. El procesador de decodificación anteriormente mencionado puede ser un procesador de propósito general, un procesador de señal digital (DSP), un circuito integrado de aplicación específica (ASIC), una matriz de puertas programables en campo (FPGA) u otro componente de lógica programable, una puerta discreta o un componente de lógica de transistor, o un componente de hardware discreto. Los métodos, los pasos, y los diagramas de bloque lógicos descritos en las realizaciones de la presente invención se pueden implementar o realizar. El procesador de propósito general puede ser un microprocesador, o el procesador puede ser cualquier procesador convencional, traductor o similar. Los pasos de los métodos descritos con referencia a las realizaciones de la presente invención se pueden ejecutar y completar directamente por el procesador de decodificación personificado como hardware, o se pueden ejecutar y completar usando una combinación de módulos de hardware y software en el procesador de decodificación. El módulo de software se puede ubicar en un medio de almacenamiento maduro en la técnica, tal como una memoria de acceso aleatorio, una memoria flash, una memoria de solo lectura, una memoria de solo lectura programable, una memoria de solo lectura programable borrable eléctricamente, o un registro. El medio de almacenamiento se localiza en la memoria 905. El procesador de decodificación 903 lee la información de la memoria 905, y completa los pasos de los métodos anteriormente mencionados en combinación con el hardware.
Por ejemplo, el dispositivo de decodificación de señal en la FIG. 6 o la FIG. 7 se puede implementar por el procesador de decodificación 903. Adicionalmente, en la FIG. 6, el primer módulo de adquisición 30, el segundo módulo de adquisición 31, el módulo de predicción 32, y el módulo de reconstrucción 33 se pueden implementar por la unidad de procesamiento 904, o se pueden implementar por el procesador de decodificación 903. De forma similar, cada módulo en la FIG. 7 se puede implementar por la unidad de procesamiento 904, se puede implementar por el procesador de decodificación 903. Sin embargo, los ejemplos anteriormente mencionados son meramente ejemplares, y no tienen la intención de limitar las realizaciones de la presente invención a esta manera de implementación específica.
Específicamente, la memoria 905 almacena las instrucciones que habilitan el procesador 904 o el procesador de decodificación 903 para implementar las siguientes operaciones: adquirir un tipo de señal de una señal de audio y una señal de banda de baja frecuencia de la señal de audio, donde la señal de audio incluye la señal de banda de baja frecuencia y una señal de banda de alta frecuencia; adquirir una envolvente de frecuencia de la señal de banda de alta frecuencia según el tipo de señal; predecir una señal de excitación de la señal de banda de alta frecuencia según la señal de banda de baja frecuencia; y reconstruir la señal de banda de alta frecuencia según la envolvente de frecuencia de la señal de banda de alta frecuencia y la señal de excitación de la señal de banda de alta frecuencia.
La FIG. 14 es un diagrama de bloque de un aparato 100 según otra realización de la presente invención. El aparato 90 en la FIG. 14 se puede usar para implementar los pasos y los métodos en las realizaciones de método anteriormente mencionadas. El aparato 100 se puede aplicar a una estación base o un terminal en diversos sistemas de comunicaciones. En la realización de la FIG. 14, el aparato 100 incluye un circuito de recepción 1002, un procesador de codificación 1003, una unidad de procesamiento 1004, una memoria 1005, y una antena 1001. La unidad de procesamiento 1004 controla una operación del aparato 100, y la unidad de procesamiento 1004 se puede referir también como una CPU (en inglés, Central Processing Unit, unidad central de procesamiento). La memoria 1005 puede incluir una memoria de solo lectura y una memoria de acceso aleatorio, y proporciona una instrucción y datos para la unidad de procesamiento 1004. Una parte de la memoria 1005 puede además incluir una memoria de acceso aleatorio no volátil (NVRAM). En una aplicación específica, un dispositivo de comunicaciones inalámbricas tal como un teléfono móvil se puede incorporar en el aparato 100, o el aparato 100 puede ser un dispositivo de comunicaciones inalámbricas, y el aparato 100 puede además incluir un transportador que aloja el circuito de recepción 1001, para permitir al aparato 100 recibir los datos de una ubicación remota. El circuito de recepción 1001 se puede acoplar a la antena 1001. Todos los componentes del aparato 100 se acoplan juntos usando un sistema de bus 1006, donde adicionalmente a un bus de datos, el sistema de bus 1006 además incluye un bus de potencia, un bus de control, y un bus de señal de estado. Sin embargo, para claridad de la descripción, diversos buses se marcan como el sistema de bus 1006 en la FIG. 14. El aparato 100 puede además incluir la unidad de procesamiento 1004 configurada para procesar una señal, y adicionalmente, además incluye el procesador de codificación 1003.
Los métodos descritos en las realizaciones anteriormente mencionadas de la presente invención se pueden aplicar al procesador de codificación 1003, o implementados por el procesador de codificación 1003. El procesador de codificación 1003 puede ser un chip de circuito integrado y tiene una capacidad de procesamiento de señal. En un proceso de implementación, los pasos en las realizaciones de método anteriormente mencionadas (por ejemplo, la realización de método correspondiente a la FIG. 4 o la FIG. 5) se puede completar usando un circuito lógico integrado de hardware en el procesador de decodificación 1003 o las instrucciones en forma de software. Estas instrucciones se pueden implementar y controlar cooperando con la unidad de procesamiento 1004. El procesador de codificación anteriormente mencionado puede ser un procesador de propósito general, un procesador de señal digital (DSP), un circuito integrado de aplicación específica (ASIC), una matriz de puertas programables en campo (FPGA) u otro componente de lógica programable, una puerta discreta o un componente de lógica de transistor, o un componente de hardware discreto. Los métodos, los pasos, y los diagramas de bloque lógicos descritos en las realizaciones de la presente invención se pueden implementar o realizar. El procesador de propósito general puede ser un microprocesador, o el procesador puede ser cualquier procesador convencional, traductor o similar. Los pasos de los métodos descritos con referencia a las realizaciones de la presente invención se pueden ejecutar y completar directamente por un procesador de decodificación personificado como hardware, o se puede ejecutar y completar usando una combinación de módulos de hardware y software en el procesador de decodificación. El módulo de software se puede ubicar en un medio de almacenamiento maduro en la técnica, tal como una memoria de acceso aleatorio, una memoria flash, una memoria de solo lectura, una memoria de solo lectura programable, una memoria de solo lectura programable borrable eléctricamente, o un registro. El medio de almacenamiento se localiza en la memoria 1005. El procesador de decodificación 1003 lee la información de la memoria 1005, y completa los pasos de los métodos anteriormente mencionados en combinación con el hardware.
Por ejemplo, el dispositivo de codificación de señal en la FIG. 8 o la FIG. 9 se puede implementar por el procesador de codificación 1003. Adicionalmente, en la FIG. 8, el módulo de adquisición 40, el módulo de codificación 41, y el módulo de envío 42 se pueden implementar por la unidad de procesamiento 1004, o se pueden implementar por el procesador de codificación 1003. De forma similar, cada módulo en la FIG. 9 se puede implementar por la unidad de procesamiento 1004, o se puede implementar por el procesador de codificación 1003. Sin embargo, los ejemplos anteriormente mencionados son meramente ejemplares, y no tienen la intención de limitar las realizaciones de la presente invención a esta manera de implementación específica.
Específicamente, el almacenamiento de la memoria 1005 habilita el procesador 1004 o el procesador de codificación 1003 para implementar las instrucciones para las siguientes operaciones: adquirir un tipo de señal de una señal de audio y una señal de banda de baja frecuencia de la señal de audio, donde la señal de audio incluye la señal de banda de baja frecuencia y una señal de banda de alta frecuencia; codificar una envolvente de frecuencia de la señal de banda de alta frecuencia según el tipo de señal para obtener una envolvente de frecuencia de la señal de banda de alta frecuencia; y enviar, a un dispositivo de decodificación, un flujo de bits que transporta el tipo de señal, y los índices de codificación de la señal de banda de baja frecuencia y la envolvente de frecuencia de la señal de banda de alta frecuencia.
Específicamente, el almacenamiento de la memoria 1005 habilita el procesador 1004 o el procesador de codificación 1003 para implementar las instrucciones para las siguientes operaciones: adquirir un tipo de señal de una señal de audio y una señal de banda de baja frecuencia de la señal de audio, donde el tipo de señal es una señal armónica o una señal no armónica, y la señal de audio incluye la señal de banda de baja frecuencia y una señal de banda de alta frecuencia; calcular una envolvente de frecuencia de la señal de banda de alta frecuencia, donde un método para calcular una envolvente de frecuencia de una señal de banda de alta frecuencia de una señal armónica es la misma que la de una señal no armónica; y enviar, a un dispositivo de decodificación, un flujo de bits que transporta el tipo de señal, y los índices de codificación de la señal de banda de baja frecuencia y la envolvente de frecuencia de la señal de banda de alta frecuencia.
La realización del aparato descrito es meramente ejemplar. Las unidades descritas como partes separadas pueden estar o no separadas físicamente, y las partes expuestas como unidades pueden ser o no unidades físicas, pueden estar ubicadas en una posición, o pueden estar distribuidas en al menos dos unidades de red. Algunos o todos los módulos se pueden seleccionar según las necesidades reales de obtener los objetivos de las soluciones de las realizaciones. Una persona de habilidad ordinaria en la técnica puede entender e implementar las realizaciones de la presente invención sin esfuerzos creativos.
Finalmente, cabe señalar que las realizaciones anteriormente mencionadas son meramente con la intención de describir las soluciones técnicas de la presente invención pero no para limitar la presente invención. Aunque la presente invención está descrita en detalle con referencia a las realizaciones anteriormente mencionadas, las personas de habilidad ordinaria en la técnica deberían entender que ellos pueden todavía hacer modificaciones a las soluciones técnicas descritas en las realizaciones anteriormente mencionadas o hacer sustituciones equivalentes a algunas características técnicas de las mismas, sin apartarse del alcance de las soluciones técnicas de las realizaciones de la presente invención.
Claims (2)
1. Un método para predecir una señal de banda de alta frecuencia, que comprende:
adquirir (200) un tipo de señal de una señal de audio y una señal de banda de baja frecuencia de la señal de audio;
obtener (201) una envolvente de frecuencia de cada subbanda de una señal de banda de alta frecuencia de la señal de audio según el tipo de señal, en donde la señal de banda de alta frecuencia de la señal de audio comprende múltiples coeficientes de espectro, los múltiples coeficientes de espectro se clasifican en múltiples subbandas, cada una de las múltiples subbandas comprende múltiples coeficientes de espectro, y una envolvente de frecuencia de una subbanda se calcula basada en los coeficientes de espectro de la subbanda; y
enviar (202) un flujo de bits que transporta el tipo de señal, y los índices de codificación de la señal de banda de baja frecuencia y las envolventes de frecuencia de las subbandas de la señal de banda de alta frecuencia; en donde el tipo de señal es una señal armónica o una señal no armónica, y la obtención de una envolvente de frecuencia de cada subbanda de una señal de banda de alta frecuencia de la señal de audio según el tipo de señal comprende:
calcular la envolvente de frecuencia de la subbanda de la señal de banda de alta frecuencia usando una primera cantidad de coeficientes de espectro cuando el tipo de señal es una señal no armónica; o calcular la envolvente de frecuencia de la subbanda de la señal de banda de alta frecuencia usando una segunda cantidad de coeficientes de espectro cuando el tipo de señal es una señal armónica, caracterizado por que
la segunda cantidad es mayor que la primera cantidad, y por que
una anchura de una subbanda cubierta por una envolvente de frecuencia que es de una señal de banda de alta frecuencia y se corresponde con una señal armónica es más ancha que la cubierta por una envolvente de frecuencia que es de una señal de banda de alta frecuencia y se corresponde con una señal no armónica.
2. Un dispositivo de codificación, que comprende:
un módulo de adquisición (40), configurado para adquirir un tipo de señal de una señal de audio y una señal de banda de baja frecuencia de la señal de audio;
un módulo de codificación (41), configurado para obtener una envolvente de frecuencia de cada subbanda de una señal de banda de alta frecuencia de la señal de audio según el tipo de señal, en donde la señal de banda de alta frecuencia de la señal de audio comprende múltiples subbandas, cada una de las múltiples subbandas comprende múltiples coeficientes de espectro, y una envolvente de frecuencia de una subbanda se calcula basada en los coeficientes de espectro de la subbanda; y
un módulo de envío (42), configurado para enviar un flujo de bits que transporta el tipo de señal, y los índices de codificación de la señal de banda de baja frecuencia y las envolventes de frecuencia de las subbandas de la señal de banda de alta frecuencia;
en donde el tipo de señal es una señal armónica o una señal no armónica, y el módulo de codificación (41) se configura específicamente para calcular la envolvente de frecuencia de cada subbanda de la señal de banda de alta frecuencia usando una primera cantidad de coeficientes de espectro cuando el tipo de señal es una señal no armónica; o
el módulo de codificación (41) se configura específicamente para calcular la envolvente de frecuencia de cada subbanda de la señal de banda de alta frecuencia usando una segunda cantidad de coeficientes de espectro cuando el tipo de señal es una señal armónica,
caracterizado por que
la segunda cantidad es mayor que la primera cantidad, y por que
una anchura de una subbanda cubierta por una envolvente de frecuencia que es de una señal de banda de alta frecuencia y se corresponde con una señal armónica es más ancha que la cubierta por una envolvente de frecuencia que es de una señal de banda de alta frecuencia y se corresponde con una señal no armónica.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310033625.3A CN103971693B (zh) | 2013-01-29 | 2013-01-29 | 高频带信号的预测方法、编/解码设备 |
PCT/CN2013/076408 WO2014117458A1 (zh) | 2013-01-29 | 2013-05-29 | 高频带信号的预测方法、编/解码设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2822607T3 true ES2822607T3 (es) | 2021-05-04 |
Family
ID=51241109
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES13873224T Active ES2822607T3 (es) | 2013-01-29 | 2013-05-29 | Método de predicción y dispositivo de codificación/decodificación para una señal de banda de alta frecuencia |
Country Status (10)
Country | Link |
---|---|
US (3) | US9704500B2 (es) |
EP (2) | EP3779980A3 (es) |
JP (2) | JP6204501B2 (es) |
KR (3) | KR20150108421A (es) |
CN (2) | CN103971693B (es) |
BR (1) | BR112015018064B1 (es) |
ES (1) | ES2822607T3 (es) |
HK (1) | HK1199540A1 (es) |
SG (1) | SG11201505885YA (es) |
WO (1) | WO2014117458A1 (es) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103971693B (zh) * | 2013-01-29 | 2017-02-22 | 华为技术有限公司 | 高频带信号的预测方法、编/解码设备 |
EP4407609A3 (en) * | 2013-12-02 | 2024-08-21 | Top Quality Telephony, Llc | A computer-readable storage medium and a computer software product |
KR20240046298A (ko) * | 2014-03-24 | 2024-04-08 | 삼성전자주식회사 | 고대역 부호화방법 및 장치와 고대역 복호화 방법 및 장치 |
US10839814B2 (en) * | 2017-10-05 | 2020-11-17 | Qualcomm Incorporated | Encoding or decoding of audio signals |
JP7077139B2 (ja) | 2018-05-23 | 2022-05-30 | 株式会社豊田中央研究所 | 歪ゲージの製造方法および歪ゲージ |
JP7061587B2 (ja) | 2019-04-05 | 2022-04-28 | Ckd株式会社 | 流体制御弁 |
US10978083B1 (en) * | 2019-11-13 | 2021-04-13 | Shure Acquisition Holdings, Inc. | Time domain spectral bandwidth replication |
CN113192521B (zh) * | 2020-01-13 | 2024-07-05 | 华为技术有限公司 | 一种音频编解码方法和音频编解码设备 |
CN112767954B (zh) * | 2020-06-24 | 2024-06-14 | 腾讯科技(深圳)有限公司 | 音频编解码方法、装置、介质及电子设备 |
CN114582361B (zh) * | 2022-04-29 | 2022-07-08 | 北京百瑞互联技术有限公司 | 基于生成对抗网络的高解析度音频编解码方法及系统 |
Family Cites Families (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3751225B2 (ja) * | 2001-06-14 | 2006-03-01 | 松下電器産業株式会社 | オーディオ帯域拡張装置 |
JP2003044098A (ja) | 2001-07-26 | 2003-02-14 | Nec Corp | 音声帯域拡張装置及び音声帯域拡張方法 |
US20030187663A1 (en) * | 2002-03-28 | 2003-10-02 | Truman Michael Mead | Broadband frequency translation for high frequency regeneration |
CN101180676B (zh) * | 2005-04-01 | 2011-12-14 | 高通股份有限公司 | 用于谱包络表示的向量量化的方法和设备 |
JP5129117B2 (ja) | 2005-04-01 | 2013-01-23 | クゥアルコム・インコーポレイテッド | 音声信号の高帯域部分を符号化及び復号する方法及び装置 |
KR100770839B1 (ko) * | 2006-04-04 | 2007-10-26 | 삼성전자주식회사 | 음성 신호의 하모닉 정보 및 스펙트럼 포락선 정보,유성음화 비율 추정 방법 및 장치 |
KR20070115637A (ko) | 2006-06-03 | 2007-12-06 | 삼성전자주식회사 | 대역폭 확장 부호화 및 복호화 방법 및 장치 |
US20080109215A1 (en) * | 2006-06-26 | 2008-05-08 | Chi-Min Liu | High frequency reconstruction by linear extrapolation |
CN101140759B (zh) | 2006-09-08 | 2010-05-12 | 华为技术有限公司 | 语音或音频信号的带宽扩展方法及系统 |
DK2571024T3 (en) * | 2007-08-27 | 2015-01-05 | Ericsson Telefon Ab L M | Adaptive transition frequency between the noise filling and bandwidth extension |
JP4529092B2 (ja) * | 2007-09-25 | 2010-08-25 | ソニー株式会社 | チューナ装置 |
KR100970446B1 (ko) | 2007-11-21 | 2010-07-16 | 한국전자통신연구원 | 주파수 확장을 위한 가변 잡음레벨 결정 장치 및 그 방법 |
CA2708861C (en) * | 2007-12-18 | 2016-06-21 | Lg Electronics Inc. | A method and an apparatus for processing an audio signal |
EP3261090A1 (en) | 2007-12-21 | 2017-12-27 | III Holdings 12, LLC | Encoder, decoder, and encoding method |
DE102008015702B4 (de) * | 2008-01-31 | 2010-03-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals |
CN101751926B (zh) * | 2008-12-10 | 2012-07-04 | 华为技术有限公司 | 信号编码、解码方法及装置、编解码系统 |
CN101763856B (zh) * | 2008-12-23 | 2011-11-02 | 华为技术有限公司 | 信号分类处理方法、分类处理装置及编码系统 |
CN101770775B (zh) * | 2008-12-31 | 2011-06-22 | 华为技术有限公司 | 信号处理方法及装置 |
US8463599B2 (en) * | 2009-02-04 | 2013-06-11 | Motorola Mobility Llc | Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder |
EP2239732A1 (en) * | 2009-04-09 | 2010-10-13 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Apparatus and method for generating a synthesis audio signal and for encoding an audio signal |
CN101521014B (zh) * | 2009-04-08 | 2011-09-14 | 武汉大学 | 音频带宽扩展编解码装置 |
CN102044250B (zh) * | 2009-10-23 | 2012-06-27 | 华为技术有限公司 | 频带扩展方法及装置 |
WO2011048820A1 (ja) | 2009-10-23 | 2011-04-28 | パナソニック株式会社 | 符号化装置、復号装置およびこれらの方法 |
KR102020334B1 (ko) | 2010-01-19 | 2019-09-10 | 돌비 인터네셔널 에이비 | 고조파 전위에 기초하여 개선된 서브밴드 블록 |
CN101964189B (zh) | 2010-04-28 | 2012-08-08 | 华为技术有限公司 | 语音频信号切换方法及装置 |
KR101826331B1 (ko) * | 2010-09-15 | 2018-03-22 | 삼성전자주식회사 | 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법 |
CN102436820B (zh) * | 2010-09-29 | 2013-08-28 | 华为技术有限公司 | 高频带信号编码方法及装置、高频带信号解码方法及装置 |
EP3373296A1 (en) * | 2011-02-14 | 2018-09-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Noise generation in audio codecs |
CN102800317B (zh) * | 2011-05-25 | 2014-09-17 | 华为技术有限公司 | 信号分类方法及设备、编解码方法及设备 |
CN103971694B (zh) * | 2013-01-29 | 2016-12-28 | 华为技术有限公司 | 带宽扩展频带信号的预测方法、解码设备 |
CN103971693B (zh) * | 2013-01-29 | 2017-02-22 | 华为技术有限公司 | 高频带信号的预测方法、编/解码设备 |
MX353240B (es) * | 2013-06-11 | 2018-01-05 | Fraunhofer Ges Forschung | Dispositivo y método para extensión de ancho de banda para señales acústicas. |
-
2013
- 2013-01-29 CN CN201310033625.3A patent/CN103971693B/zh active Active
- 2013-01-29 CN CN201710076995.3A patent/CN106847297B/zh active Active
- 2013-05-29 BR BR112015018064-7A patent/BR112015018064B1/pt active IP Right Grant
- 2013-05-29 KR KR1020157022814A patent/KR20150108421A/ko not_active Application Discontinuation
- 2013-05-29 KR KR1020187006404A patent/KR101980057B1/ko active IP Right Grant
- 2013-05-29 EP EP20179865.9A patent/EP3779980A3/en active Pending
- 2013-05-29 ES ES13873224T patent/ES2822607T3/es active Active
- 2013-05-29 SG SG11201505885YA patent/SG11201505885YA/en unknown
- 2013-05-29 JP JP2015555543A patent/JP6204501B2/ja active Active
- 2013-05-29 KR KR1020177009587A patent/KR101837191B1/ko active IP Right Grant
- 2013-05-29 WO PCT/CN2013/076408 patent/WO2014117458A1/zh active Application Filing
- 2013-05-29 EP EP13873224.3A patent/EP2937861B1/en active Active
-
2014
- 2014-12-30 HK HK14113071.9A patent/HK1199540A1/xx unknown
-
2015
- 2015-07-24 US US14/808,145 patent/US9704500B2/en active Active
-
2017
- 2017-06-06 US US15/615,810 patent/US10089997B2/en active Active
- 2017-08-30 JP JP2017165309A patent/JP6574820B2/ja active Active
-
2018
- 2018-08-21 US US16/106,700 patent/US10636432B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
KR20170043665A (ko) | 2017-04-21 |
KR20150108421A (ko) | 2015-09-25 |
KR101980057B1 (ko) | 2019-05-17 |
EP2937861A4 (en) | 2016-08-03 |
CN106847297B (zh) | 2020-07-07 |
CN103971693A (zh) | 2014-08-06 |
JP6574820B2 (ja) | 2019-09-11 |
CN103971693B (zh) | 2017-02-22 |
EP2937861A1 (en) | 2015-10-28 |
EP3779980A2 (en) | 2021-02-17 |
BR112015018064A2 (pt) | 2017-07-18 |
KR20180026812A (ko) | 2018-03-13 |
US10089997B2 (en) | 2018-10-02 |
US20150332699A1 (en) | 2015-11-19 |
EP3779980A3 (en) | 2021-07-07 |
SG11201505885YA (en) | 2015-09-29 |
JP6204501B2 (ja) | 2017-09-27 |
JP2017223987A (ja) | 2017-12-21 |
BR112015018064B1 (pt) | 2020-12-01 |
US20180366134A1 (en) | 2018-12-20 |
US20170270944A1 (en) | 2017-09-21 |
WO2014117458A1 (zh) | 2014-08-07 |
US9704500B2 (en) | 2017-07-11 |
HK1199540A1 (en) | 2015-07-03 |
JP2016509256A (ja) | 2016-03-24 |
EP2937861B1 (en) | 2020-08-12 |
US10636432B2 (en) | 2020-04-28 |
CN106847297A (zh) | 2017-06-13 |
KR101837191B1 (ko) | 2018-03-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2822607T3 (es) | Método de predicción y dispositivo de codificación/decodificación para una señal de banda de alta frecuencia | |
US10607621B2 (en) | Method for predicting bandwidth extension frequency band signal, and decoding device | |
ES2770831T3 (es) | Métodos y dispositivos de codificación y descodificación de señal | |
JP2016505873A (ja) | オーディオ信号符号化及び復号化方法並びにオーディオ信号符号化及び復号化装置 | |
JP6517300B2 (ja) | 信号処理方法及び装置 | |
ES2654488T3 (es) | Método de procesamiento para señales de voz o audio y aparato de codificación de las mismas | |
CN104282312B (zh) | 信号编码和解码方法以及设备 |