ES2716152T3 - Método y aparato para predecir una señal de excitación de alta frecuencia - Google Patents

Método y aparato para predecir una señal de excitación de alta frecuencia Download PDF

Info

Publication number
ES2716152T3
ES2716152T3 ES14849584T ES14849584T ES2716152T3 ES 2716152 T3 ES2716152 T3 ES 2716152T3 ES 14849584 T ES14849584 T ES 14849584T ES 14849584 T ES14849584 T ES 14849584T ES 2716152 T3 ES2716152 T3 ES 2716152T3
Authority
ES
Spain
Prior art keywords
frequency
signal
band
spectral parameters
low band
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES14849584T
Other languages
English (en)
Inventor
Zexin Liu
Lei Miao
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Application granted granted Critical
Publication of ES2716152T3 publication Critical patent/ES2716152T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0016Codebook for LPC parameters

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Digital Transmission Methods That Use Modulated Carrier Waves (AREA)
  • Measuring Frequencies, Analyzing Spectra (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
  • Position Fixing By Use Of Radio Waves (AREA)

Abstract

Un método para predecir una señal de excitación de banda alta en un decodificador de voz, que comprende: obtener (101), a partir de un flujo de bits de banda baja recibido, un conjunto de parámetros espectrales de frecuencia ordenados por frecuencia, en donde los parámetros espectrales de frecuencia comprenden parámetros espectrales de frecuencia de línea, LSF, de banda baja o parámetros espectrales de frecuencia de inmitancia, ISF, de banda baja; calcular (102) una diferencia de los parámetros espectrales de frecuencia entre cada dos parámetros espectrales de frecuencia que tienen un mismo intervalo de posición en algunos o todos los parámetros espectrales de frecuencia; obtener (103) una diferencia mínima de los parámetros espectrales de frecuencia a partir de las diferencias de los parámetros espectrales de frecuencia calculadas; estando el método caracterizado por: determinar (104), de acuerdo con un intervalo de frecuencias (frequency bin) que corresponde a la diferencia mínima de los parámetros espectrales de frecuencia, un intervalo de frecuencias inicial para predecir una señal de excitación de banda alta a partir de una banda baja; y predecir (105) la señal de excitación de banda alta a partir de la banda baja de acuerdo con el intervalo de frecuencias inicial.

Description

DESCRIPCIÓN
Método y aparato para predecir una señal de excitación de alta frecuencia
Campo técnico
La presente invención está relacionada con el campo de las tecnologías de las comunicaciones y, en particular, con un método y un aparato para predecir una señal de excitación de banda alta.
Antecedentes
A medida que los requisitos de calidad de un servicio de voz se hacen cada vez más exigentes en las comunicaciones modernas, el Proyecto de Asociación de 3a Generación (3GPP) propone un códec de voz de banda ancha multivelocidad adaptativa (AMR-WB). El códec de voz AMR-WB tiene ventajas tales como una alta calidad de reconstrucción de voz, una baja tasa de codificación promedio y una buena autoadaptación, y es el primer sistema de codificación de voz en la historia de las comunicaciones que se puede utilizar simultáneamente para servicios inalámbricos y por cable. En una aplicación real, en el lado del decodificador de un códec de voz AMR-WB, después de recibir un flujo de bits de banda baja enviado por un codificador, el decodificador puede decodificar el flujo de bits de banda baja para obtener unos coeficientes de predicción lineal (LPC) de banda baja y predecir unos coeficientes LPC de alta frecuencia o banda ancha a partir de los coeficientes LPC de banda baja. Además, el decodificador puede utilizar ruido aleatorio como señal de excitación de banda alta y sintetizar una señal de banda alta utilizando los coeficientes LPC de banda alta o banda ancha y la señal de excitación de banda alta.
Por otro lado, en la práctica sucede que, aunque la señal de banda alta se puede sintetizar utilizando el ruido aleatorio utilizado como señal de excitación de banda alta y los coeficientes LPC de banda alta o banda ancha, como el ruido aleatorio es frecuentemente muy diferente de una señal de excitación de banda alta original, el rendimiento de la señal de excitación de banda alta es relativamente pobre, lo que finalmente afecta al rendimiento de la señal de banda alta sintetizada. A través de la solicitud de patente US2011/0099004A1, se conoce un método para determinar una señal de voz de banda superior a partir de una señal de voz de banda estrecha. Se determinan las diferencias entre pares de frecuencia espectral de línea (LSF) de banda estrecha adyacentes.
A través de la publicación de Pooja Gajjar y otros "Artificial Bandwidth Extension of Speech & its Applications in Wireless Communication Systems: A review (Extensión artificial del ancho de banda de voz y sus aplicaciones en sistemas de comunicación inalámbrica: una revisión)", Conferencia Internacional del IEEE sobre Sistemas de Comunicación y Tecnologías de Red, 2012, también se conocen técnicas de plegamiento espectral, duplicación espectral y traslación espectral.
A través de la solicitud de patente EP1921610A2 también se conoce un aparato de ampliación de banda de frecuencia que implica la determinación de una frecuencia inicial de extensión a partir de una información complementaria tal como, por ejemplo, el tipo de sistema de codificación, la tasa de muestreo y una tasa de bits. Resumen
La presente invención proporciona un método y un aparato para predecir una señal de excitación de banda alta, que puede predecir mejor una señal de excitación de banda alta, mejorando de este modo el rendimiento de la señal de excitación de banda alta.
Un primer aspecto de la presente invención es un método para predecir una señal de excitación de banda alta en un decodificador de voz de acuerdo con la reivindicación 1, que incluye:
obtener, a partir de un flujo de bits de banda baja recibido, un conjunto de parámetros espectrales de frecuencia ordenados por frecuencia, en donde los parámetros espectrales de frecuencia incluyen parámetros espectrales de frecuencia de línea (LSF) de banda baja o parámetros espectrales de frecuencia de inmitancia (ISF) de banda baja; para el conjunto de parámetros espectrales de frecuencia, calcular la diferencia de los parámetros espectrales de frecuencia entre cada dos parámetros espectrales de frecuencia que tienen un mismo intervalo de posición en algunos de los parámetros espectrales de frecuencia;
obtener la diferencia mínima de los parámetros espectrales de frecuencia a partir de las diferencias de los parámetros espectrales de frecuencia calculados;
determinar, a partir del intervalo de frecuencias (frequency bin) correspondiente a la diferencia mínima de los parámetros espectrales de frecuencia, un intervalo de frecuencias inicial para predecir una señal de excitación de banda alta a partir de una banda baja; y
predecir la señal de excitación de banda alta a partir de la banda baja de acuerdo con el intervalo de frecuencias inicial.
En una primera forma posible de implementación del primer aspecto de la presente invención, la obtención, a partir del flujo de bits de banda baja recibido, de un conjunto de parámetros espectrales de frecuencia ordenados por frecuencia incluye:
decodificar el flujo de bits de banda baja recibido con el fin de obtener el conjunto de parámetros espectrales de frecuencia ordenados por frecuencia; o
decodificar el flujo de bits de banda baja recibido con el fin de obtener una señal de banda baja, y calcular, a partir de la señal de banda baja, el conjunto de parámetros espectrales de frecuencia ordenados por frecuencia.
En relación con la primera forma posible de implementación del primer aspecto de la presente invención, en una segunda forma posible de implementación del primer aspecto de la presente invención, si el conjunto de parámetros espectrales de frecuencia ordenados por frecuencia se obtiene decodificando el flujo de bits de banda baja recibido, el método incluye además:
decodificar el flujo de bits de banda baja recibido con el fin de obtener una señal de excitación de banda baja; y la predicción de la señal de excitación de banda alta a partir de la banda baja de acuerdo con el intervalo de frecuencias inicial incluye:
seleccionar, en función de la señal de excitación de banda baja, una banda de frecuencia con un ancho de banda predeterminado como señal de excitación de banda alta de acuerdo con el intervalo de frecuencias inicial.
En relación con la segunda forma posible de implementación del primer aspecto de la presente invención, en una tercera forma posible de implementación del primer aspecto de la presente invención, el método incluye además: convertir los parámetros espectrales de frecuencia obtenidos mediante decodificación en coeficientes LPC de banda baja;
sintetizar una señal de banda baja utilizando los coeficientes LPC de banda baja y la señal de excitación de banda baja;
predecir los coeficientes LPC de banda alta o banda ancha a partir de los coeficientes LPC de banda baja; sintetizar la señal de banda alta utilizando la señal de excitación de banda alta y los coeficientes LPC de banda alta o banda ancha; y
combinar la señal de banda baja con la señal de banda alta para obtener una señal de banda ancha.
En relación con la segunda forma posible de implementación del primer aspecto de la presente invención, en una cuarta forma posible de implementación del primer aspecto de la presente invención, el método incluye además: convertir los parámetros espectrales de frecuencia obtenidos mediante decodificación en coeficientes LPC de banda baja;
sintetizar una señal de banda baja utilizando los coeficientes LPC de banda baja y la señal de excitación de banda baja;
predecir una envolvente de banda alta en función de la señal de banda baja;
sintetizar una señal de banda alta utilizando la señal de excitación de banda alta y la envolvente de banda alta; y combinar la señal de banda baja con la señal de banda alta, con el fin de obtener una señal de banda ancha.
En relación con la primera forma posible de implementación del primer aspecto de la presente invención, en una quinta forma posible de implementación del primer aspecto de la presente invención, si la señal de banda baja se obtiene decodificando el flujo de bits de banda baja recibido, y el conjunto de parámetros espectrales de frecuencia ordenados por frecuencia se calcula a partir de la señal de banda baja, la predicción de la señal de excitación de banda alta a partir de la banda baja de acuerdo con el intervalo de frecuencias inicial incluye:
procesar la señal de baja frecuencia utilizando un filtro de análisis LPC con el fin de obtener una señal de excitación de banda baja; y
seleccionar, en función de la señal de excitación de banda baja, una banda de frecuencia con un ancho de banda predeterminado como señal de excitación de banda alta de acuerdo con el intervalo de frecuencias inicial.
En relación con la quinta forma posible de implementación del primer aspecto de la presente invención, en una sexta forma posible de implementación del primer aspecto de la presente invención, el método incluye además: convertir los parámetros espectrales de frecuencia calculados en coeficientes LPC de banda baja;
predecir los coeficientes LPC de banda alta o banda ancha a partir de los coeficientes LPC de banda baja; sintetizar una señal de banda alta utilizando la señal de excitación de banda alta y los coeficientes LPC de banda alta o banda ancha; y
combinar la señal de banda baja con la señal de banda alta para obtener una señal de banda ancha.
En relación con la quinta forma posible de implementación del primer aspecto de la presente invención, en una séptima forma posible de implementación del primer aspecto de la presente invención, el método incluye además: predecir una envolvente de banda alta en función de la señal de banda baja;
sintetizar una señal de banda alta utilizando la señal de excitación de banda alta y la envolvente de banda alta; y combinar la señal de banda baja con la señal de banda alta para obtener una señal de banda ancha.
En relación con el primer aspecto de la presente invención o una cualquiera de las posibles formas primera a séptima de implementación del primer aspecto de la presente invención, en una octava forma posible de implementación del primer aspecto de la presente invención, los cada dos parámetros espectrales de frecuencia que tienen un mismo intervalo de posición incluyen cada dos parámetros espectrales de frecuencia adyacentes o cada dos parámetros espectrales de frecuencia espaciados una misma cantidad de parámetros espectrales de frecuencia. Un segundo aspecto de la presente invención es un aparato para predecir una señal de excitación de banda alta en un decodificador de voz de acuerdo con la reivindicación 10, que incluye:
una primera unidad de obtención, configurada para obtener, a partir de un flujo de bits de banda baja recibido, un conjunto de parámetros espectrales de frecuencia ordenados por frecuencia, en donde los parámetros espectrales de frecuencia incluyen parámetros espectrales de frecuencia de línea (LSF) de banda baja o parámetros espectrales de frecuencia de inmitancia ISF de banda baja;
una unidad de cálculo, configurada para: para el conjunto de parámetros espectrales de frecuencia obtenidos por la primera unidad de obtención, calcular la diferencia de los parámetros espectrales de frecuencia entre cada dos parámetros espectrales de frecuencia que tienen un mismo intervalo de posición en algunos de los parámetros espectrales de frecuencia;
una segunda unidad de obtención, configurada para obtener la diferencia mínima de los parámetros espectrales de frecuencia a partir de las diferencias de los parámetros espectrales de frecuencia calculadas por la unidad de cálculo;
una unidad de determinación del intervalo de frecuencias inicial, configurada para determinar, de acuerdo con el intervalo de frecuencias que corresponde a la diferencia mínima de los parámetros espectrales de frecuencia obtenida por la segunda unidad de obtención, un intervalo de frecuencias inicial para predecir una señal de excitación de banda alta a partir de una banda baja; y
una unidad de predicción de excitación de banda alta, configurada para predecir la señal de excitación de banda alta a partir de la banda baja de acuerdo con el intervalo de frecuencias inicial determinada por la unidad de determinación del intervalo de frecuencias inicial.
En una primera forma posible de implementación del segundo aspecto de la presente invención, la primera unidad de obtención está configurada específicamente para decodificar el flujo de bits de banda baja recibido, con el fin de obtener el conjunto de parámetros espectrales de frecuencia ordenados por frecuencia; o está configurada específicamente para decodificar el flujo de bits de banda baja recibido, con el fin de obtener una señal de banda baja, y calcular, a partir de la señal de banda baja, el conjunto de parámetros espectrales de frecuencia ordenados por frecuencia.
En relación con la primera forma posible de implementación del segundo aspecto de la presente invención, en una segunda forma posible de implementación del segundo aspecto de la presente invención, si la primera unidad de obtención está configurada específicamente para decodificar el flujo de bits de banda baja recibido, con el fin de obtener el conjunto de parámetros espectrales de frecuencia ordenados por frecuencia, el aparato incluye además: una unidad de decodificación, configurada para decodificar el flujo de bits de banda baja recibido, con el fin de obtener una señal de excitación de banda baja; y
la unidad de predicción de excitación de banda alta está configurada específicamente para seleccionar, en función de la señal de excitación de banda baja obtenida por la unidad de decodificación, una banda de frecuencia con un ancho de banda predeterminado como señal de excitación de banda alta de acuerdo con el intervalo de frecuencias inicial determinada por la unidad de determinación del intervalo de frecuencias inicial.
En relación con la segunda forma posible de implementación del segundo aspecto de la presente invención, en una tercera forma posible de implementación del segundo aspecto de la presente invención, el aparato incluye además: una primera unidad de conversión, configurada para convertir los parámetros espectrales de frecuencia obtenidos por la primera unidad de obtención en coeficientes de predicción lineal (coeficientes LPC) de banda baja;
una primera unidad sintetizadora de señales de banda baja, configurada para sintetizar los coeficientes LPC de banda baja obtenidos mediante conversión por parte de la primera unidad de conversión y la señal de excitación de banda baja obtenida por la unidad de decodificación en la señal de banda baja;
una primera unidad de predicción de coeficientes LPC, configurada para predecir los coeficientes LPC de banda alta o banda ancha a partir de los coeficientes LPC de banda baja obtenidos mediante conversión por parte de la primera unidad de conversión;
una primera unidad sintetizadora de señales de banda alta, configurada para sintetizar una señal de banda alta utilizando la señal de excitación de banda alta seleccionada por la unidad de predicción de excitación de banda alta y los coeficientes LPC de banda alta o banda ancha predichos por la primera unidad de predicción de coeficientes LPC; y
una primera unidad sintetizadora de señales de banda ancha, configurada para combinar la señal de banda baja sintetizada por la primera unidad sintetizadora de señales de banda baja con la señal de banda alta sintetizada por la primera unidad sintetizadora de señales de banda alta, con el fin de obtener una señal de banda ancha.
En relación con la segunda forma posible de implementación del segundo aspecto de la presente invención, en una cuarta forma posible de implementación del segundo aspecto de la presente invención, el aparato incluye además: una segunda unidad de conversión, configurada para convertir los parámetros espectrales de frecuencia obtenidos por la primera unidad de obtención en coeficientes de predicción lineal (coeficientes LPC) de banda baja;
una segunda unidad sintetizadora de señales de banda baja, configurada para sintetizar los coeficientes LPC de banda baja obtenidos mediante conversión por parte de la segunda unidad de conversión y la señal de excitación de banda baja obtenida por la unidad de decodificación en la señal de banda baja;
una primera unidad de predicción de envolvente de banda alta, configurada para predecir una envolvente de banda alta a partir de la señal de banda baja sintetizada por la segunda unidad sintetizadora de señales de banda baja; una segunda unidad sintetizadora de señales de banda alta, configurada para sintetizar una señal de banda alta utilizando la señal de excitación de banda alta seleccionada por la unidad de predicción de excitación de banda alta y la envolvente de banda alta predicha por la primera unidad de predicción de envolvente de banda alta; y una segunda unidad sintetizadora de señales de banda ancha, configurada para combinar la señal de banda baja sintetizada por la segunda unidad sintetizadora de señales de banda baja con la señal de banda alta sintetizada por la segunda unidad sintetizadora de señales de banda alta, con el fin de obtener una señal de banda ancha.
En relación con la primera forma posible de implementación del segundo aspecto de la presente invención, en una quinta forma posible de implementación del segundo aspecto de la presente invención, si la primera unidad de obtención está configurada específicamente para decodificar el flujo de bits de banda baja recibido, con el fin de obtener la señal de banda baja, y calcular, de acuerdo con la señal de banda baja, el conjunto de parámetros espectrales de frecuencia ordenados por frecuencia, la unidad de predicción de excitación de banda alta está configurada específicamente para procesar la señal de baja frecuencia utilizando un filtro de análisis LPC, con el fin de obtener una señal de excitación de banda baja y seleccionar, a partir de la señal de excitación de banda baja, una banda de frecuencia con un ancho de banda predeterminado como señal de excitación de banda alta de acuerdo con el intervalo de frecuencias inicial determinada por la unidad de determinación del intervalo de frecuencias inicial.
En relación con la quinta forma posible de implementación del segundo aspecto de la presente invención, en una sexta forma posible de implementación del segundo aspecto de la presente invención, el aparato incluye además: una tercera unidad de conversión, configurada para convertir los parámetros espectrales de frecuencia calculados obtenidos por la primera unidad de obtención en coeficientes de predicción lineal (coeficientes LPC) de banda baja; una segunda unidad de predicción de coeficientes LPC, configurada para predecir los coeficientes LPC de banda alta o banda ancha a partir de los coeficientes LPC de banda baja obtenidos mediante conversión por parte de la tercera unidad de conversión;
una tercera unidad sintetizadora de señales de banda alta, configurada para sintetizar una señal de banda alta utilizando la señal de excitación de banda alta seleccionada por la unidad de predicción de excitación de banda alta y los coeficientes LPC de banda alta o banda ancha predichos por la segunda unidad de predicción de coeficientes LPC; y
una tercera unidad sintetizadora de señales de banda ancha, configurada para combinar la señal de banda baja obtenida por la primera unidad de obtención con la señal de banda alta sintetizada por la tercera unidad sintetizadora de señales de banda alta, con el fin de obtener una señal de banda ancha.
En relación con la quinta forma posible de implementación del segundo aspecto de la presente invención, en una séptima forma posible de implementación del segundo aspecto de la presente invención, el aparato incluye además: una tercera unidad de predicción de envolvente de banda alta, configurada para predecir una envolvente de banda alta a partir de la señal de banda baja obtenida por la primera unidad de obtención;
una cuarta unidad sintetizadora de señales de banda alta, configurada para sintetizar una señal de banda alta utilizando la señal de excitación de banda alta seleccionada por la unidad de predicción de excitación de banda alta y la envolvente de banda alta predicha por la tercera unidad de predicción de envolvente de banda alta; y una cuarta unidad sintetizadora de señales de banda ancha, configurada para combinar la señal de banda baja obtenida por la primera unidad de obtención con la señal de banda alta sintetizada por la cuarta unidad sintetizadora de señales de banda alta, con el fin de obtener una señal de banda ancha.
En relación con el segundo aspecto de la presente invención o una cualquiera de las posibles formas primera a séptima de implementación del segundo aspecto de la presente invención, en una octava forma posible de implementación del segundo aspecto de la presente invención, los cada dos parámetros espectrales de frecuencia que tienen un mismo intervalo de posición incluyen cada dos parámetros espectrales de frecuencia adyacentes o cada dos parámetros espectrales de frecuencia espaciados una misma cantidad de parámetros espectrales de frecuencia.
En la presente invención, después de haber obtenido un conjunto de parámetros espectrales de frecuencia ordenados por frecuencia a partir de un flujo de bits de banda baja recibido, se puede calcular la diferencia de los parámetros espectrales de frecuencia entre cualesquiera dos parámetros espectrales de frecuencia que tienen un mismo intervalo de posición en dicho conjunto de parámetros espectrales de frecuencia, y además, se obtiene la diferencia mínima de los parámetros espectrales de frecuencia a partir de las diferencias de los parámetros espectrales de frecuencia calculadas, en donde los parámetros espectrales de frecuencia incluyen parámetros espectrales de frecuencia de línea (LSF) de banda baja o parámetros espectrales de frecuencia de inmitancia ISF de banda baja, y por lo tanto, la diferencia mínima de los parámetros espectrales de frecuencia es la diferencia mínima de los parámetros de LSF o la diferencia mínima de los parámetros de ISF. A partir de la relación de correspondencia entre la energía de la señal y el intervalo de frecuencias correspondiente a la diferencia de parámetros de LSF o la diferencia de parámetros de ISF se puede deducir que una diferencia menor de parámetros de LSF o una diferencia menor de parámetros de ISF indica una mayor energía de la señal y, en consecuencia, se determina un intervalo de frecuencias inicial para predecir una señal de excitación de banda alta a partir de una banda baja en función del intervalo de frecuencias que corresponde a la diferencia mínima de los parámetros espectrales de frecuencia (esto es, la diferencia mínima de los parámetros de LSF o la diferencia mínima de los parámetros de ISF), y la señal de excitación de banda alta se predice a partir de la banda baja de acuerdo con el intervalo de frecuencias inicial, lo cual puede implementar la predicción de una señal de excitación de banda alta con una calidad de codificación relativamente buena, de tal modo que se puede predecir mejor la señal de excitación de banda alta, lo que mejora de forma efectiva el rendimiento de la señal de excitación de banda alta.
Breve descripción de los dibujos
Con el fin de describir con mayor claridad las soluciones técnicas de la presente invención, a continuación se introducen brevemente los dibujos adjuntos describiendo los modos de realización preferidos de la presente invención. Evidentemente, en la siguiente descripción los dibujos adjuntos ilustran únicamente algunos modos de realización de la presente invención.
La FIG. 1 es un diagrama de flujo esquemático de un método para predecir una señal de excitación de banda alta divulgado por un modo de realización de la presente invención;
la FIG. 2 es un diagrama esquemático de un proceso de predicción de una señal de excitación de banda alta divulgado por un modo de realización de la presente invención;
la FIG. 3 es un diagrama esquemático de otro proceso de predicción de una señal de excitación de banda alta divulgado por un modo de realización de la presente invención;
la FIG. 4 es un diagrama esquemático de otro proceso de predicción de una señal de excitación de banda alta divulgado por un modo de realización de la presente invención;
la FIG. 5 es un diagrama esquemático de otro proceso de predicción de una señal de excitación de banda alta divulgado por un modo de realización de la presente invención;
la FIG. 6 es un diagrama esquemático de la estructura de un aparato para predecir una señal de excitación de banda alta divulgado por un modo de realización de la presente invención;
la FIG. 7 es un diagrama esquemático de la estructura de otro aparato para predecir una señal de excitación de banda alta divulgado por un modo de realización de la presente invención;
la FIG. 8 es un diagrama esquemático de la estructura de otro aparato para predecir una señal de excitación de banda alta divulgado por un modo de realización de la presente invención;
la FIG. 9 es un diagrama esquemático de la estructura de otro aparato para predecir una señal de excitación de banda alta divulgado por un modo de realización de la presente invención;
la FIG. 10 es un diagrama esquemático de la estructura de otro aparato para predecir una señal de excitación de banda alta divulgado por un modo de realización de la presente invención; y
la FIG. 11 es un diagrama esquemático de la estructura de un decodificador divulgado por un modo de realización de la presente invención.
Descripción de los modos de realización
A continuación se describen claramente las soluciones técnicas de la presente invención haciendo referencia a los dibujos que acompañan a los modos de realización de la presente invención. Evidentemente, los modos de realización que se describen son solamente algunos en lugar de todos los modos de realización de la presente invención.
Los modos de realización de la presente invención divulgan un método y un aparato para predecir una señal de excitación de banda alta que pueden predecir mejor una señal de excitación de banda alta, mejorando de ese modo el rendimiento de la señal de excitación de banda alta. A continuación se hacen las descripciones detalladas por separado.
Haciendo referencia a la FIG. 1, la FIG. 1 es un diagrama de flujo esquemático de un método para predecir una señal de excitación de banda alta divulgado por un modo de realización de la presente invención. Tal como se ilustra en la FIG. 1, el método para predecir la señal de excitación de banda alta puede incluir los siguientes pasos:
101: Obtener, a partir de un flujo de bits de banda baja recibido, un conjunto de parámetros espectrales de frecuencia ordenados por frecuencia, en donde los parámetros espectrales de frecuencia incluyen parámetros de LSF de banda baja o parámetros de ISF de banda baja.
En este modo de realización de la presente invención, como los parámetros espectrales de frecuencia incluyen parámetros de LSF de banda baja o parámetros de ISF de banda baja, cada parámetro LSF de banda baja o cada parámetro ISF de banda baja se corresponde además con una frecuencia, y en un flujo de bits de banda baja, las frecuencias correspondientes a parámetros de LSF de banda baja o parámetros de ISF de banda baja se disponen habitualmente en orden ascendente, el conjunto de parámetros espectrales de frecuencia ordenados por frecuencia es un conjunto de parámetros espectrales de frecuencia ordenados por las frecuencias que corresponden a los parámetros espectrales de frecuencia.
En este modo de realización de la presente invención, el conjunto de parámetros espectrales de frecuencia ordenados por frecuencia puede ser obtenido por parte de un decodificador a partir del flujo de bits de banda baja recibido. El decodificador puede ser un decodificador en un códec AMR-WB de voz, o puede ser un decodificador de voz, un decodificador de flujo de bits de banda baja, o algo similar de otro tipo, lo cual no se limita en este modo de realización de la presente invención. El decodificador en este modo de realización de la presente invención puede incluir al menos un procesador, y el decodificador puede operar bajo el control de al menos un procesador.
En un modo de realización, después de que el decodificador haya recibido un flujo de bits de banda baja enviado por un codificador, el decodificador puede, en primer lugar, decodificar directamente el flujo de bits de banda baja enviado por el codificador para obtener los parámetros de pares espectrales de línea (LSP), y a continuación convertir los parámetros LSP en parámetros de LSF de banda baja; o el decodificador puede, en primer lugar, decodificar directamente el flujo de bits de banda baja enviado por el codificador para obtener los parámetros de pares espectrales de inmitancia (ISP), y a continuación convertir los parámetros ISP en parámetros de ISF de banda baja.
Los procesos de conversión específicos en los que el decodificador convierte los parámetros LSP en parámetros de LSF de banda baja, y el decodificador convierte los parámetros ISP en parámetros de ISF de banda baja son ampliamente conocidos por una persona experimentada en la técnica, por lo que no se describen en detalle en la presente solicitud en este modo de realización de la presente invención.
En este modo de realización de la presente invención, el parámetro de frecuencia espectral también puede ser cualquier parámetro que indique el dominio de frecuencia de un coeficiente LPC como, por ejemplo, un parámetro LSP o un parámetro LSF, lo cual no se limita en este modo de realización de la presente invención.
En otro modo de realización, después de recibir un flujo de bits de banda baja enviado por un codificador, el decodificador puede decodificar el flujo de bits de banda baja recibido, con el fin de obtener una señal de banda baja y calcular, a partir de la señal de banda baja, el conjunto de parámetros espectrales de frecuencia ordenados por frecuencia.
En particular, el decodificador puede calcular los coeficientes LPC a partir de la señal de banda baja y, a continuación, convertir los coeficientes LPC en parámetros de LSF o parámetros de ISF, en donde el proceso concreto de cálculo en el que los coeficientes LPC se convierten en parámetros de LSF o parámetros de ISF es suficientemente conocido por una persona experimentada en la técnica, por lo que tampoco se describe en detalle en la presente solicitud en este modo de realización de la presente invención.
102: Para el conjunto obtenido de parámetros espectrales de frecuencia, calcular la diferencia de los parámetros espectrales de frecuencia entre cada dos parámetros espectrales de frecuencia que tienen un mismo intervalo de posición en algunos o todos los parámetros espectrales de frecuencia.
En este modo de realización de la presente invención, el decodificador puede seleccionar algunos parámetros espectrales de frecuencia del conjunto de parámetros espectrales de frecuencia obtenido, y calcular la diferencia de los parámetros espectrales de frecuencia entre cada dos parámetros espectrales de frecuencia que tienen un mismo intervalo de posición, en los parámetros espectrales de frecuencia seleccionados. Ciertamente, en este modo de realización de la presente invención, el decodificador puede seleccionar todos los parámetros espectrales de frecuencia del conjunto obtenido de parámetros espectrales de frecuencia, y calcular la diferencia de los parámetros espectrales de frecuencia entre cada dos parámetros espectrales de frecuencia que tienen un mismo intervalo de posición, en todos los parámetros espectrales de frecuencia seleccionados. En otras palabras, los algunos o todos parámetros espectrales de frecuencia son parámetros espectrales de frecuencia en el conjunto de parámetros espectrales de frecuencia obtenido.
En este modo de realización de la presente invención, después de que el decodificador haya obtenido el conjunto de parámetros espectrales de frecuencia (esto es, los parámetros de LSF de banda baja o los parámetros de ISF de banda baja) organizado por frecuencia, el decodificador puede calcular, para esto conjunto de parámetros espectrales de frecuencia obtenido, la diferencia de los parámetros espectrales de frecuencia entre cada dos parámetros espectrales de frecuencia que tienen un mismo intervalo de posición, en (algunos o todos de) este conjunto de parámetros de frecuencia.
En un modo de realización, los cada dos parámetros espectrales de frecuencia que tienen un mismo intervalo de posición comprenden cada dos parámetros espectrales de frecuencia cuyas posiciones son adyacentes, que puede ser, por ejemplo, cada dos parámetros de LSF de banda baja cuyas posiciones son adyacentes (esto es, un intervalo de posición es el parámetro LSF 0) en un conjunto de parámetros de LSF de banda baja organizado por frecuencias en orden ascendente, o pueden ser cada dos parámetros de ISF de banda baja cuyas posiciones son adyacentes (esto es, el intervalo de posición es el parámetro ISF 0) en un conjunto de parámetros de ISF de banda baja organizado por frecuencias en orden ascendente.
En otro modo de realización, los cada dos parámetros espectrales de frecuencia que tienen un mismo intervalo de posición incluyen cada dos parámetros espectrales de frecuencia cuyas posiciones están espaciadas por una misma cantidad de parámetros espectrales de frecuencia (por ejemplo uno o dos), los cuales pueden ser, por ejemplo, LSF [1] y LSF [3], LSF [2] y Ls F [4], LSF [3] y LSF [5], o similares, en un conjunto de parámetros de lSf de banda baja organizado por frecuencias en orden ascendente, en donde los intervalos de posición de LSF [1] y LSF [3], LSF [2] y LSF [4], y LSf [3] y LSF [5] son todos un parámetro LSF, esto es LSF [2], Ls F [3], y LSF [4].
103: Obtener la diferencia mínima de los parámetros espectrales de frecuencia a partir de las diferencias de los parámetros espectrales de frecuencia calculadas.
En este modo de realización de la presente invención, tras haber calculado las diferencias de los parámetros espectrales de frecuencia, el decodificador puede obtener la diferencia mínima de los parámetros espectrales de frecuencia a partir de las diferencias de los parámetros espectrales de frecuencia calculadas.
104: Determinar, en función del intervalo de frecuencias que corresponde a la diferencia mínima de los parámetros espectrales de frecuencia, un intervalo de frecuencias inicial para predecir una señal de excitación de banda alta a partir de una banda baja.
En este modo de realización de la presente invención, como la diferencia mínima de los parámetros espectrales de frecuencia corresponde a dos intervalos de frecuencias, el decodificador puede determinar, a partir de los dos intervalos de frecuencia, el intervalo de frecuencias inicial para predecir la señal de excitación de banda alta a partir de la banda baja. Por ejemplo, el decodificador puede utilizar el intervalo de frecuencias más pequeño de los dos intervalos de frecuencia como intervalo de frecuencias inicial para predecir la señal de excitación de banda alta a partir de la banda baja, o el decodificador puede utilizar el intervalo de frecuencias mayor de los dos intervalos de frecuencias como intervalo de frecuencias inicial para predecir la señal de excitación de banda alta a partir de la banda baja, o el decodificador puede utilizar un intervalo de frecuencias que se encuentra entre los dos intervalos de frecuencias como intervalo de frecuencias inicial para predecir la señal de excitación de banda alta a partir de la banda baja, esto es, el intervalo de frecuencias inicial seleccionado es mayor o igual que el intervalo de frecuencias más pequeño de los dos intervalos de frecuencias, y es menor o igual que el intervalo de frecuencias más grande de los dos intervalos de frecuencias; y la selección concreta del intervalo de frecuencias inicial no se limita en este modo de realización de la presente invención.
Por ejemplo, si la diferencia entre LSF [2] y LSF [4] es la diferencia mínima de LSF, el decodificador puede utilizar el intervalo de frecuencias mínima que corresponde a LSF [2] como intervalo de frecuencias inicial para predecir la señal de excitación de banda alta a partir de la banda baja, o el decodificador puede utilizar el intervalo de frecuencias máxima que corresponde a LSF [4] como intervalo de frecuencias inicial para predecir la señal de excitación de banda alta a partir de la banda baja, o el decodificador puede utilizar un intervalo de frecuencias en el rango de intervalos de frecuencia entre el intervalo de frecuencias mínimo que corresponde a LSF [2] y el intervalo de frecuencias máximo que corresponde a LSF [4] como intervalo de frecuencias inicial para predecir la señal de excitación de banda alta a partir de la banda baja, lo cual no se limita en este modo de realización de la presente invención:
105: Predecir la señal de excitación de banda alta a partir de la banda baja de acuerdo con el intervalo de frecuencias inicial.
En este modo de realización de la presente invención, después de determinar el intervalo de frecuencias inicial para predecir la señal de excitación de banda alta a partir de la banda baja, el decodificador puede predecir la señal de excitación de banda alta a partir de la banda baja. Por ejemplo, el decodificador selecciona, a partir de una señal de excitación de banda baja que corresponde a un flujo de bits de banda baja, una banda de frecuencia con un ancho de banda predeterminado como señal de excitación de banda alta de acuerdo con el intervalo de frecuencias inicial. En el método que se describe en la FIG. 1, después de obtener a partir del flujo de bits de banda baja recibido un conjunto de parámetros espectrales de frecuencia ordenados por frecuencia, un decodificador puede calcular la diferencia de los parámetros espectrales de frecuencia entre cada dos parámetros espectrales de frecuencia, que tienen un mismo intervalo de posición, en este conjunto de parámetros espectrales de frecuencia, y obtener además la diferencia mínima de los parámetros espectrales de frecuencia a partir de las diferencias de los parámetros espectrales de frecuencia calculadas, en donde los parámetros espectrales de frecuencia incluyen parámetros espectrales de frecuencia de línea (LSF) de banda baja o parámetros espectrales de frecuencia de inmitancia ISF de banda baja y, por consiguiente, la diferencia mínima de los parámetros espectrales de frecuencia es la diferencia mínima de los parámetros de LSF o la diferencia mínima de los parámetros de ISF.
A partir de la relación de correspondencia entre la energía de la señal y el intervalo de frecuencias correspondiente a la diferencia de parámetros de LSF o la diferencia de parámetros de ISF se puede deducir que una diferencia menor de parámetros de LSF o una diferencia menor de parámetros de ISF indica una mayor energía de la señal y, en consecuencia, el decodificador determina, de acuerdo con el intervalo de frecuencias que corresponde a la diferencia mínima de los parámetros espectrales de frecuencia (esto es, la diferencia mínima de los parámetros de LSF o la diferencia mínima de los parámetros de ISF), un intervalo de frecuencias inicial para predecir una señal de excitación de banda alta a partir de una banda baja, y predice la señal de excitación de banda alta a partir de la banda baja en función del intervalo de frecuencias inicial de la señal de excitación de banda alta, lo cual puede implementar la predicción de una señal de excitación de banda alta que tenga una buena calidad de codificación, de tal modo que se puede predecir mejor la señal de excitación de banda alta, lo que mejora de forma efectiva el rendimiento de la señal de excitación de banda alta.
Haciendo referencia a la FIG. 2, la FIG. 2 es un diagrama esquemático de un proceso de predicción de una señal de excitación de banda alta divulgado por un modo de realización de la presente invención. Tal como se ilustra en la FIG. 2, el proceso de predicción de la señal de excitación de banda alta es:
1. Un decodificador decodifica un flujo de bits de banda baja recibido, con el fin de obtener un conjunto de parámetros de LSF de banda baja ordenado por frecuencias.
2. El decodificador calcula, para el conjunto de parámetros de LSF de banda baja obtenido, la diferencia LSF_DIFF entre cada dos parámetros de LSF de banda baja, que tienen posiciones adyacentes, en (algunos o todos de) este conjunto de parámetros de LSF de banda baja, y se asume que LSF_DIFF[/] = LSF[i+1] - LSF[i], donde i<M, i indica la LSF i-ésima, y M indica la cantidad de parámetros de LSF de baja banda.
3. El decodificador obtiene la diferencia mínima MIN_LSF_DIFF a partir de las diferencias LSF_DIFF calculadas. Como forma opcional de implementación, el decodificador puede determinar, en función de la tasa del flujo de bits de banda baja, un rango de búsqueda para la MIN_LSF_DIFF mínima, esto es, la posición de la frecuencia más alta que corresponde a una LSF_DIFF, en donde una tasa más alta indica un rango de búsqueda mayor, y una tasa más baja indica un rango de búsqueda menor. Por ejemplo, en una AMR-WB, cuando la tasa es menor o igual que 8,85 kbps, el valor máximo de i es M-8; o cuando la tasa es menor o igual que 12,65 kbps, el valor máximo de i es M-6; o cuando la tasa es menor o igual que 15,85 kbps, el valor máximo de i es M-4.
Como forma opcional de implementación, al buscar la MIN_LSF_DIFF mínima, en primer lugar se puede utilizar un factor de corrección a para corregir las LSF_DIFF, en donde a decrece con el aumento de la frecuencia, esto es: a * LSF_DIFF [i] < MIN_LSF_DIFF, en donde i < M y 0 < a <1.
4. El decodificador determina, en función del intervalo de frecuencias que corresponde a la MlN_LSF_DIFF mínima, un intervalo de frecuencias inicial para predecir una señal de excitación de banda alta a partir de una banda baja. 5. El decodificador decodifica el flujo de bits de banda baja recibido, con el fin de obtener una señal de excitación de banda baja.
6. El decodificador selecciona, a partir de la señal de excitación de banda baja, una banda de frecuencia con un ancho de banda predeterminado como señal de excitación de banda alta de acuerdo con el intervalo de frecuencias inicial.
Aún más, el proceso de predicción de una señal de excitación de banda alta que se ilustra en la FIG. 2 puede incluir además:
7. El decodificador convierte los parámetros de LSF de banda baja obtenidos mediante decodificación en coeficientes LPC de banda baja.
8. El decodificador sintetiza una señal de banda baja utilizando los coeficientes LPC de banda baja y la señal de excitación de banda baja.
9. El decodificador predice los coeficientes LPC de banda alta o banda ancha a partir de los coeficientes LPC de banda baja.
10. El decodificador sintetiza una señal de banda alta utilizando la señal de excitación de banda alta y los coeficientes LPC de banda alta o banda ancha.
11. El decodificador combina la señal de banda baja con la señal de banda alta para obtener una señal de banda ancha.
Como forma opcional de implementación, cuando la tasa del flujo de bits de banda baja es mayor que un umbral especificado, se puede seleccionar permanentemente como señal de excitación de banda alta una señal cuya banda de frecuencia es adyacente a la de la señal de banda alta, en una señal de banda baja obtenida mediante decodificación; por ejemplo, en una AMR-WB, cuando la tasa es mayor o igual a 23,05 kbps, se puede seleccionar permanentemente una señal de la banda de frecuencia de 4 a 6 kHz como señal de excitación de banda alta de la banda de frecuencia de 6 a 8 kHz.
Como forma opcional de implementación, en el método que se describe en la FIG. 2, los parámetros de LSF también pueden ser reemplazados por parámetros de ISF, lo cual no afecta a la implementación de la presente invención. En el proceso que se describe en la FIG. 2, un decodificador predice una señal de excitación de banda alta a partir de una señal de excitación de banda baja de acuerdo con el intervalo de frecuencias inicial de la señal de excitación de banda alta, lo cual puede implementar la predicción de una señal de excitación de banda alta con buena calidad de codificación, de modo que se puede predecir mejor la señal de excitación de banda alta, lo que mejora de forma efectiva el rendimiento de la señal de excitación de banda alta. Además, después de que el decodificador combine una señal de banda baja con una señal de banda alta, también se puede mejorar el rendimiento de la señal de banda ancha.
Haciendo referencia a la FIG. 3, la FIG. 3 es un diagrama esquemático de otro proceso de predicción de una señal de excitación de banda alta divulgado por un modo de realización de la presente invención. Tal como se ilustra en la FIG. 3, el proceso de predicción de la señal de excitación de banda alta es:
1. Un decodificador decodifica un flujo de bits de banda baja recibido, con el fin de obtener un conjunto de parámetros de LSF de banda baja ordenado por frecuencias.
2. El decodificador calcula, para el conjunto de parámetros de LSF de banda baja obtenido, la diferencia LSF_DIFF entre cada dos parámetros de LSF de banda baja, que tienen un intervalo de posición de 2 parámetros de LSF de banda baja, en (algunos o todos de) este conjunto de parámetros de LSF de banda baja, y se asume que LSF_DIFF[i] = LSF[i+2] - LSF[/], donde <M , i indica la LSF /'-ésima, y M indica la cantidad de parámetros de LSF de baja banda.
3. El decodificador obtiene la MIN_LSF_DIFF mínima de las diferencias LSF_DIFF calculadas.
Como forma opcional de implementación, el decodificador puede determinar, en función de la tasa del flujo de bits de banda baja, un rango de búsqueda para la MIN_LSF_DIFF mínima, esto es, la posición de la frecuencia más alta que corresponde a una LSF_DIFF, en donde una tasa más alta indica un rango de búsqueda mayor, y una tasa más baja indica un rango de búsqueda menor. Por ejemplo, en una AMR-WB, cuando la tasa es menor o igual que 8,85 kbps, el valor máximo de i es M-8; o cuando la tasa es menor o igual que 12,65 kbps, el valor máximo de i es M-6; o cuando la tasa es menor o igual que 15,85 kbps, el valor máximo de i es M-4.
Como forma opcional de implementación, al buscar la MIN_LSF_DIFF mínima, se puede utilizar un factor de corrección a para corregir la MIN_LSF_DIFF, en donde a decrece con el aumento de la frecuencia, esto es:
LSF_DIFF [i] < a * MIN_LSF_DIFF, en donde i < M y a >1.
4. El decodificador determina, de acuerdo con el intervalo de frecuencias que corresponde a la MlN_LSF_DIFF mínima, un intervalo de frecuencias inicial para predecir una señal de excitación de banda alta a partir de una banda baja.
5. El decodificador decodifica el flujo de bits de banda baja recibido, con el fin de obtener una señal de excitación de banda baja.
6. El decodificador selecciona, a partir de la señal de excitación de banda baja, una banda de frecuencia con un ancho de banda predeterminado como señal de excitación de banda alta de acuerdo con el intervalo de frecuencias inicial.
Aún más, el proceso de predicción de una señal de excitación de banda alta que se ilustra en la FIG. 3 puede incluir además:
7. El decodificador convierte los parámetros de LSF de banda baja obtenidos mediante decodificación en coeficientes LPC de banda baja.
8. El decodificador sintetiza una señal de banda baja utilizando los coeficientes LPC de banda baja y la señal de excitación de banda baja.
9. El decodificador predice una envolvente de banda alta de acuerdo con la señal de banda baja sintetizada.
10. El decodificador sintetiza una señal de banda alta utilizando la señal de excitación de banda alta y la envolvente de banda alta.
11. El decodificador combina la señal de banda baja con la señal de banda alta con el fin de obtener una señal de banda ancha.
Como forma opcional de implementación, cuando la tasa del flujo de bits de banda baja es mayor que un umbral especificado, se puede seleccionar permanentemente como señal de excitación de banda alta una señal cuya banda de frecuencia es adyacente a la de la señal de banda alta, en una señal de banda baja obtenida mediante decodificación; por ejemplo, en una AMR-WB, cuando la tasa es mayor o igual a 23,05 kbps, se puede seleccionar permanentemente una señal de la banda de frecuencia de 4 a 6 kHz como señal de excitación de banda alta de 6 a 8 kHz.
Como forma opcional de implementación, en el método que se describe en la FIG. 3, los parámetros de LSF también pueden ser reemplazados por parámetros de ISF, lo cual no afecta a la implementación de la presente invención. En el proceso que se describe en la FIG. 3, un decodificador predice una señal de excitación de banda alta a partir de una señal de excitación de banda baja de acuerdo con un intervalo de frecuencias inicial de la señal de excitación de banda alta, lo cual puede implementar la predicción de una señal de excitación de banda alta con buena calidad de codificación, de modo que la señal de excitación de banda alta se puede predecir mejor, lo que mejora de forma efectiva el rendimiento de la señal de excitación de banda alta. Además, después de que el decodificador combine una señal de banda baja con una señal de banda alta, también se puede mejorar el rendimiento de la señal de banda ancha.
Haciendo referencia a la FIG. 4, la FIG. 4 es un diagrama esquemático de otro proceso de predicción de una señal de excitación de banda alta divulgado por un modo de realización de la presente invención. Tal como se ilustra en la FIG. 4, el proceso de predicción de la señal de excitación de banda alta es:
1. Un decodificador decodifica un flujo de bits de banda baja recibido, con el fin de obtener una señal de banda baja.
2. El decodificador calcula, a partir de la señal de banda baja, un conjunto de parámetros de LSF de banda baja ordenado por frecuencias.
3. El decodificador calcula, para el conjunto de parámetros de LSF de banda baja calculados, la diferencia LSF_DIFF entre cada dos parámetros de LSF de banda baja, que tienen posiciones adyacentes, en (algunos o todos de) este conjunto de parámetros de LSF de banda baja, y se asume que LSF_DIFF[/] = LSF[/+1] - LSF[/], donde /<M, / indica la LSF /-ésima, y M indica la cantidad de parámetros de LSF de baja banda.
4. El decodificador obtiene la MIN_LSF_DIFF mínima de las diferencias LSF_DIFF calculadas.
Como forma opcional de implementación, el decodificador puede determinar, de acuerdo con la tasa del flujo de bits de banda baja, un rango de búsqueda para la MIN_LSF_DIFF mínima, esto es, la posición de la frecuencia más alta que corresponde a una LSF_DIFF, en donde una tasa más alta indica un rango de búsqueda mayor, y una tasa más baja indica un rango de búsqueda menor. Por ejemplo, en una AMR-WB, cuando la tasa es menor o igual que 8,85 kbps, el valor máximo de / es M-8; o cuando la tasa es menor o igual que 12,65 kbps, el valor máximo de / es M-6; o cuando la tasa es menor o igual que 15,85 kbps, el valor máximo de / es M-4.
Como forma opcional de implementación, al buscar la MIN_LSF_DIFF mínima, se puede utilizar un factor de corrección a para corregir las LSF_DIFF, en donde a decrece con el aumento de la frecuencia, esto es:
a * LSF_DIFF[/] < MIN_LSF_DIFF, en donde / < M y 0 < a <1.
5. El decodificador determina, en función del intervalo de frecuencias que corresponde a la MlN_LSF_DIFF mínima, un intervalo de frecuencias inicial para predecir una señal de excitación de banda alta a partir de una banda baja. 6. El decodificador procesa la señal de baja frecuencia utilizando un filtro de análisis LPC, con el fin de obtener una señal de excitación de banda baja.
7. El decodificador selecciona, a partir de la señal de excitación de banda baja, una banda de frecuencia con un ancho de banda predeterminado como señal de excitación de banda alta de acuerdo con el intervalo de frecuencias inicial.
Aún más, el proceso de predicción de una señal de excitación de banda alta que se ilustra en la FIG. 4 puede incluir además:
8. El decodificador convierte los parámetros de LSF de banda baja calculados en coeficientes LPC de banda baja.
9. El decodificador predice los coeficientes LPC de banda alta o banda ancha a partir de los coeficientes LPC de banda baja.
10. El decodificador sintetiza una señal de banda alta utilizando la señal de excitación de banda alta y los coeficientes LPC de banda alta o banda ancha.
11. El decodificador combina la señal de banda baja con la señal de banda alta con el fin de obtener una señal de banda ancha.
Como forma opcional de implementación, cuando la tasa del flujo de bits de banda baja es mayor que un umbral especificado, se puede seleccionar permanentemente como señal de excitación de banda alta una señal cuya banda de frecuencia es adyacente a la de la señal de banda alta, en una señal de banda baja obtenida mediante decodificación; por ejemplo, en una AMR-WB, cuando la tasa es mayor o igual a 23,05 kbps, se puede seleccionar permanentemente una señal de la banda de frecuencia de 4 a 6 kHz como señal de excitación de banda alta de 6 a 8 kHz.
Como forma opcional de implementación, en el método que se describe en la FIG. 4, los parámetros de LSF también pueden ser reemplazados por parámetros de ISF, lo cual no afecta a la implementación de la presente invención. En el proceso que se describe en la FIG. 4, un decodificador predice una señal de excitación de banda alta a partir de una señal de banda baja de acuerdo con el intervalo de frecuencias inicial de la señal de excitación de banda alta, lo cual puede implementar la predicción de una señal de excitación de banda alta con una buena calidad de codificación, de modo que la señal de excitación de banda alta se puede predecir mejor, lo que mejora de forma efectiva el rendimiento de la señal de excitación de banda alta. Además, después de que el decodificador combine una señal de banda baja con una señal de banda alta, también se puede mejorar el rendimiento de la señal de banda ancha.
Haciendo referencia a la FIG. 5, la FIG. 5 es un diagrama esquemático de otro proceso de predicción de una señal de excitación de banda alta divulgado por un modo de realización de la presente invención. Tal como se ilustra en la FIG. 5, el proceso de predicción de la señal de excitación de banda alta es:
1. Un decodificador decodifica un flujo de bits de banda baja recibido, con el fin de obtener una señal de banda baja.
2. El decodificador calcula, a partir de la señal de banda baja, un conjunto de parámetros de LSF de banda baja ordenado por frecuencias.
3. El decodificador calcula, para el conjunto de parámetros de LSF de banda baja calculados, la diferencia LSF_DIFF entre cada dos parámetros de LSF de banda baja, que tienen un intervalo de posición de 2 parámetros de LSF de banda baja, en (algunos o todos de) este conjunto de parámetros de LSF de banda baja, y se asume que LSF_DIFF[i] = LSF[i+2] - LSF[/], donde i<M, i indica la diferencia i-ésima, y M indica la cantidad de parámetros de LSF de banda baja.
4. El decodificador obtiene la MIN_LSF_DIFF mínima de las diferencias LSF_DIFF calculadas.
Como forma opcional de implementación, el decodificador puede determinar a partir de la tasa del flujo de bits de banda baja, un rango de búsqueda para la MIN_LSF_DIFF mínima, esto es, la posición de la frecuencia más alta que corresponde a una LSF_DIFF, en donde una tasa más alta indica un rango de búsqueda mayor, y una tasa más baja indica un rango de búsqueda menor. Por ejemplo, en una AMR-WB, cuando la tasa es menor o igual que 8,85 kbps, el valor máximo de i es M-8; o cuando la tasa es menor o igual que 12,65 kbps, el valor máximo de i es M-6; o cuando la tasa es menor o igual que 15,85 kbps, el valor máximo de i es M-4
Como forma opcional de implementación, al buscar la MIN_LSF_DIFF mínima, se puede utilizar un factor de corrección a para corregir la MIN_LSF_DIFF, en donde a decrece con el aumento de la frecuencia, esto es:
LSF_DIFF[/] < a * MIN_LSF_DIFF, en donde i < M y a > 1.
5. El decodificador determina, de acuerdo con el intervalo de frecuencias que corresponde a la MlN_LSF_DIFF mínima, un intervalo de frecuencias inicial para predecir una señal de excitación de banda alta a partir de una banda baja.
6. El decodificador procesa la señal de baja frecuencia utilizando un filtro de análisis LPC, con el fin de obtener una señal de excitación de banda baja.
7. El decodificador selecciona, a partir de la señal de excitación de banda baja, una banda de frecuencia con un ancho de banda predeterminado como señal de excitación de banda alta de acuerdo con el intervalo de frecuencias inicial.
Aún más, el proceso de predicción de una señal de excitación de banda alta que se ilustra en la FIG. 5 puede incluir además:
8. El decodificador predice una envolvente de banda alta de acuerdo con la señal de banda baja.
En un modo de realización, el decodificador puede predecir la envolvente de banda alta a partir de los coeficientes LPC de banda baja y la señal de excitación de banda baja.
9. El decodificador sintetiza una señal de banda alta utilizando la señal de excitación de banda alta y la envolvente de banda alta.
10. El decodificador combina la señal de banda baja con la señal de banda alta con el fin de obtener una señal de banda ancha.
Como forma opcional de implementación, cuando la tasa del flujo de bits de banda baja es mayor que un umbral especificado, se puede seleccionar permanentemente como señal de excitación de banda alta una señal cuya banda de frecuencia es adyacente a la de la señal de banda alta, en una señal de banda baja obtenida mediante decodificación; por ejemplo, en una AMR-WB, cuando la tasa es mayor o igual a 23,05 kbps, se puede seleccionar permanentemente una señal de la banda de frecuencia de 4 a 6 kHz como señal de excitación de banda alta de 6 a 8 kHz.
Como forma opcional de implementación, en el método que se describe en la FIG. 5, los parámetros de LSF también pueden ser reemplazados por parámetros de ISF, lo cual no afecta a la implementación de la presente invención. En el proceso que se describe en la FIG. 5, un decodificador predice una señal de excitación de banda alta a partir de una señal de banda baja de acuerdo con el intervalo de frecuencias inicial de la señal de excitación de banda alta, lo cual puede implementar la predicción de una señal de excitación de banda alta con una buena calidad de codificación, de modo que la señal de excitación de banda alta se puede predecir mejor, lo que mejora de forma efectiva el rendimiento de la señal de excitación de banda alta. Además, después de que el decodificador combine una señal de banda baja con una señal de banda alta, también se puede mejorar el rendimiento de la señal de banda ancha.
Haciendo referencia a la FIG. 6, la FIG. 6 es un diagrama esquemático de la estructura de un aparato para predecir una señal de excitación de banda alta divulgado por un modo de realización de la presente invención. El aparato para predecir una señal de excitación de banda alta que se que se ilustra en la FIG. 6 se puede implementar físicamente como un dispositivo independiente, o se puede utilizar como un nuevo componente incorporado a un decodificador, lo cual no se limita en este modo de realización de la presente invención. Tal como se ilustra en la FIG. 6, el aparato para predecir la señal de excitación de banda alta puede incluir:
una primera unidad 601 de obtención, configurada para obtener, a partir de un flujo de bits de banda baja recibido, un conjunto de parámetros espectrales de frecuencia ordenados por frecuencia, en donde los parámetros espectrales de frecuencia incluyen parámetros de LSF de banda baja o parámetros de ISF de banda baja;
una unidad 602 de cálculo, configurada para: calcular, para el conjunto de parámetros espectrales de frecuencia obtenidos por la primera unidad 601 de obtención, la diferencia de los parámetros espectrales de frecuencia entre cada dos parámetros espectrales de frecuencia que tienen un mismo intervalo de posición en alguno o todos los parámetros espectrales de frecuencia;
una segunda unidad 603 de obtención, configurada para obtener la diferencia mínima de los parámetros espectrales de frecuencia a partir de las diferencias de los parámetros espectrales de frecuencia calculadas por la unidad 602 de cálculo;
una unidad 604 de determinación del intervalo de frecuencias inicial, configurada para determinar, de acuerdo con el intervalo de frecuencias que corresponde a la diferencia mínima de los parámetros espectrales de frecuencia obtenida por la segunda unidad 603 de obtención, un intervalo de frecuencias inicial para predecir una señal de excitación de banda alta a partir de una banda baja; y
una unidad 605 de predicción de excitación de banda alta, configurada para predecir la señal de excitación de banda alta a partir de la banda baja de acuerdo con el intervalo de frecuencias inicial determinado por la unidad 604 de determinación del intervalo de frecuencias inicial.
Como forma opcional de implementación, la primera unidad 601 de obtención se puede configurar específicamente para decodificar el flujo de bits de banda baja recibido, con el fin de obtener el conjunto de parámetros espectrales de frecuencia ordenados por frecuencia; o se puede configurar específicamente para decodificar el flujo de bits de banda baja recibido, con el fin de obtener una señal de banda baja, y calcular, a partir de la señal de banda baja, el conjunto de parámetros espectrales de frecuencia ordenados por frecuencia.
En un modo de realización, los cada dos parámetros espectrales de frecuencia que tienen un mismo intervalo de posición comprenden cada dos parámetros espectrales de frecuencia adyacentes o cada dos parámetros espectrales de frecuencia espaciados una misma cantidad de parámetros espectrales de frecuencia.
El aparato para predecir una señal de excitación de banda alta que se describe en la FIG. 6 puede predecir una señal de excitación de banda alta a partir de una señal de excitación de banda baja de acuerdo con el intervalo de frecuencias inicial de una señal de excitación de banda alta, lo cual puede implementar la predicción de una señal de excitación de banda alta con una buena calidad de codificación, de modo que la señal de excitación de banda alta se puede predecir mejor, lo que mejora de forma efectiva el rendimiento de la señal de excitación de banda alta.
Haciendo también referencia a la FIG. 7, la FIG. 7 es un diagrama esquemático de la estructura de otro aparato para predecir una señal de excitación de banda alta divulgado por un modo de realización de la presente invención. El aparato para predecir una señal de excitación de banda alta que se ilustra en la FIG. 7 se obtiene optimizando el aparato para predecir una señal de excitación de banda alta que se ilustra en la FIG. 6. En el aparato para predecir una señal de excitación de banda alta que se ilustra en la FIG. 7, si la primera unidad 601 de obtención se configura específicamente para decodificar el flujo de bits de banda baja recibido, con el fin de obtener el conjunto de parámetros espectrales de frecuencia ordenados por frecuencia, además de todas las unidades del aparato para predecir una señal de excitación de banda alta que se ilustra en la FIG. 6, el aparato para predecir una señal de excitación de banda alta que se ilustra en la FIG. 7 puede incluir además:
una unidad 606 de decodificación, configurada para decodificar el flujo de bits de banda baja recibido, con el fin de obtener una señal de excitación de banda baja; y
en correspondencia, la unidad 605 de predicción de excitación de banda alta se configura específicamente para seleccionar, en función de la señal de excitación de banda baja obtenida por la unidad 606 de decodificación, una banda de frecuencia con un ancho de banda predeterminado como señal de excitación de banda alta de acuerdo con el intervalo de frecuencias inicial determinado por la unidad 604 de determinación del intervalo de frecuencias inicial.
Como forma opcional de implementación, el aparato para predecir una señal de excitación de banda alta que se ilustra en la FIG. 7 puede incluir además:
una primera unidad 607 de conversión, configurada para convertir los parámetros espectrales de frecuencia obtenidos por la primera unidad 601 de obtención en coeficientes LPC de banda baja;
una primera unidad 608 sintetizadora de señales de banda baja, configurada para sintetizar una señal de banda baja utilizando los coeficientes LPC de banda baja obtenidos mediante conversión por parte de la primera unidad 607 de conversión y la señal de excitación de banda baja obtenida por la unidad 606 de decodificación;
una primera unidad 609 de predicción de coeficientes LPC, configurada para predecir los coeficientes LPC de banda alta o banda ancha a partir de los coeficientes LPC de banda baja obtenidos mediante conversión por parte de la primera unidad 607 de conversión;
una primera unidad 610 sintetizadora de señales de banda alta, configurada para sintetizar una señal de banda alta utilizando la señal de excitación de banda alta seleccionada por la unidad 605 de predicción de excitación de banda alta y los coeficientes LPC de banda alta o banda ancha predichos por la primera unidad 608 de predicción de coeficientes LPC; y
una primera unidad 611 sintetizadora de señales de banda ancha, configurada para combinar la señal de banda baja sintetizada por la primera unidad 607 sintetizadora de señales de banda baja con la señal de banda alta sintetizada por la primera unidad 609 sintetizadora de señales de banda alta, con el fin de obtener una señal de banda ancha. Haciendo también referencia a la FIG. 8, la FIG. 8 es un diagrama esquemático de la estructura de otro aparato para predecir una señal de excitación de banda alta divulgado por un modo de realización de la presente invención. El aparato para predecir una señal de excitación de banda alta que se ilustra en la FIG. 8 se obtiene optimizando el aparato para predecir una señal de excitación de banda alta que se ilustra en la FIG. 6. En el aparato para predecir una señal de excitación de banda alta que se ilustra en la FIG. 8, si la primera unidad 601 de obtención está configurada específicamente para decodificar el flujo de bits de banda baja recibido, con el fin de obtener el conjunto de parámetros espectrales de frecuencia ordenados por frecuencia, además de todas las unidades del aparato para predecir una señal de excitación de banda alta que se ilustra en la FIG. 6, el aparato para predecir una señal de excitación de banda alta que se ilustra en la FIG. 8 también incluye, además, una unidad 606 de decodificación, configurada para decodificar el flujo de bits de banda baja recibido, con el fin de obtener una señal de excitación de banda baja; y en correspondencia, la unidad 605 de predicción de excitación de banda alta también está configurada para seleccionar, en función de la señal de excitación de banda baja obtenida por la unidad 606 de decodificación, una banda de frecuencia con un ancho de banda predeterminado como señal de excitación de banda alta de acuerdo con el intervalo de frecuencias inicial determinado por la unidad 604 de determinación del intervalo de frecuencias inicial.
Como forma opcional de implementación, el aparato para predecir una señal de excitación de banda alta que se ilustra en la FIG. 8 puede incluir además:
una segunda unidad 612 de conversión, configurada para convertir los parámetros espectrales de frecuencia obtenidos por la primera unidad 601 de obtención en coeficientes LPC de banda baja;
una segunda unidad 613 sintetizadora de señales de banda baja, configurada para sintetizar los coeficientes LPC de banda baja obtenidos mediante conversión por la segunda unidad 612 de conversión y la señal de excitación de banda baja obtenida por la unidad 606 de decodificación en la señal de banda baja;
una primera unidad 614 de predicción de envolvente de banda alta, configurada para predecir una envolvente de banda alta de acuerdo con la señal de banda baja sintetizada por la segunda unidad 613 sintetizadora de señales de banda baja;
una segunda unidad 615 sintetizadora de señales de banda alta, configurada para sintetizar una señal de banda alta utilizando la señal de excitación de banda alta seleccionada por la unidad 605 de predicción de excitación de banda alta y la envolvente de banda alta predicha por la primera unidad 614 de predicción de envolvente de banda alta; y una segunda unidad 616 sintetizadora de señales de banda ancha, configurada para combinar la señal de banda baja sintetizada por la segunda unidad 613 sintetizadora de señales de banda baja con la señal de banda alta sintetizada por la segunda unidad 614 sintetizadora de señales de banda alta, con el fin de obtener una señal de banda ancha.
Haciendo también referencia a la FIG. 9, la FIG. 9 es un diagrama esquemático de la estructura de otro aparato para predecir una señal de excitación de banda alta divulgado por un modo de realización de la presente invención. El aparato para predecir una señal de excitación de banda alta que se ilustra en la FIG. 9 se obtiene optimizando el aparato para predecir una señal de excitación de banda alta que se ilustra en la FIG. 6. En el aparato para predecir una señal de excitación de banda alta que se ilustra en la FIG. 9, si la primera unidad 601 de obtención está configurada específicamente para decodificar el flujo de bits de banda baja recibido, con el fin de obtener la señal de banda baja, y calcular, a partir de la señal de banda baja, el conjunto de parámetros espectrales de frecuencia ordenados por frecuencia, la unidad 605 de predicción de excitación de banda alta se configura específicamente para procesar la señal de baja frecuencia utilizando un filtro de análisis LPC (que puede estar incluido en la unidad 605 de predicción de excitación de banda alta), con el fin de obtener una señal de excitación de banda baja, y seleccionar, en función de la señal de excitación de banda baja, una banda de frecuencia con un ancho de banda predeterminado como señal de excitación de banda alta de acuerdo con el intervalo de frecuencias inicial determinado por la unidad 604 de determinación del intervalo de frecuencias inicial.
Como forma opcional de implementación, el aparato para predecir una señal de excitación de banda alta que se ilustra en la FIG. 9 puede incluir además:
una tercera unidad 617 de conversión, configurada para convertir los parámetros espectrales de frecuencia calculados obtenidos por la primera unidad 601 de obtención en coeficientes LPC de banda baja;
una segunda unidad 618 de predicción de coeficientes LPC, configurada para predecir los coeficientes LPC de banda alta o banda ancha a partir de los coeficientes LPC de banda baja obtenidos mediante conversión por la tercera unidad 617 de conversión;
una tercera unidad 619 sintetizadora de señales de banda alta, configurada para sintetizar una señal de banda alta utilizando la señal de excitación de banda alta seleccionada por la unidad 605 de predicción de excitación de banda alta y los coeficientes LPC de banda alta o banda ancha predichos por la segunda unidad 618 de predicción de coeficientes LPC; y
una tercera unidad 620 sintetizadora de señales de banda ancha, configurada para combinar la señal de banda baja obtenida por la primera unidad 601 de obtención con la señal de banda alta sintetizada por la tercera unidad 619 sintetizadora de señales de banda alta, con el fin de obtener una señal de banda ancha.
Haciendo también referencia a la FIG. 10, la FIG. 10 es un diagrama esquemático de la estructura de otro aparato para predecir una señal de excitación de banda alta divulgado por un modo de realización de la presente invención. El aparato para predecir una señal de excitación de banda alta que se ilustra en la FIG. 10 se obtiene optimizando el aparato para predecir una señal de excitación de banda alta que se ilustra en la FIG. 6. En el aparato para predecir una señal de excitación de banda alta que se ilustra en la FIG. 10, la primera unidad 601 de obtención también está configurada para decodificar el flujo de bits de banda baja recibido, con el fin de obtener una señal de banda baja, y calcular, a partir de la señal de banda baja, el conjunto de parámetros espectrales de frecuencia ordenados por frecuencia; y la unidad 605 de predicción de excitación de banda alta también puede estar configurada para procesar la señal de baja frecuencia utilizando un filtro de análisis LPC (que puede estar incluido en la unidad 605 de predicción de excitación de banda alta), con el fin de obtener una señal de excitación de banda baja y seleccionar, en función de la señal de excitación de banda baja, una banda de frecuencia con un ancho de banda predeterminado como señal de excitación de banda alta de acuerdo con el intervalo de frecuencias inicial determinado por la unidad 604 de determinación del intervalo de frecuencias inicial.
Como forma opcional de implementación, el aparato para predecir una señal de excitación de banda alta que se ilustra en la FIG. 10 puede incluir además:
una tercera unidad 621 de predicción de envolvente de banda alta, configurada para predecir una envolvente de banda alta en función de la señal de banda baja obtenida por la primera unidad 601 de obtención;
una cuarta unidad 622 sintetizadora de señales de banda alta, configurada para sintetizar una señal de banda alta utilizando la señal de excitación de banda alta seleccionada por la unidad 605 de predicción de excitación de banda alta y la envolvente de banda alta predicha por la tercera unidad 621 de predicción de envolvente de banda alta; y una cuarta unidad 623 sintetizadora de señales de banda ancha, configurada para combinar la señal de banda baja obtenida por la primera unidad 601 de obtención con la señal de banda alta sintetizada por la cuarta unidad 621 sintetizadora de señales de banda alta, con el fin de obtener una señal de banda ancha.
Los aparatos para predecir una señal de excitación de banda alta que se describen en las FIG. 7 a 10 pueden predecir una señal de excitación de banda alta a partir de una señal de excitación de banda baja o una señal de banda baja de acuerdo con el intervalo de frecuencias inicial de la señal de excitación de banda alta, lo cual puede implementar la predicción de una señal de excitación de banda alta con una buena calidad de codificación, de modo que la señal de excitación de banda alta se puede predecir mejor, mejorando así de forma efectiva el rendimiento de la señal de excitación de banda alta. Además, después de que los aparatos para predecir una señal de excitación de banda alta descritos en las FIG. 7 a 10 combinen una señal de banda baja con una señal de banda alta, también se puede mejorar el rendimiento de una señal de banda ancha.
Haciendo referencia a la FIG. 11, la FIG. 11 es un diagrama esquemático de la estructura de un decodificador divulgado por un modo de realización de la presente invención, configurado para aplicar el método de predicción de una señal de excitación de banda alta divulgado por el modo de realización de la presente invención. Tal como se ilustra en la FIG. 10, el decodificador 1100 incluye: al menos un procesador 1101, como por ejemplo una CPU, al menos una interfaz 1104 de red, una interfaz 1103 de usuario, una memoria 1105 y al menos un bus 1102 de comunicaciones. El bus 1102 de comunicaciones está configurado para implementar la conexión y comunicación entre estos componentes. Opcionalmente, la interfaz 1103 de usuario puede incluir una interfaz USB, u otra interfaz estándar o interfaz por cable. Opcionalmente, la interfaz 1104 de red puede incluir una interfaz Wi-Fi, u otra interfaz inalámbrica. La memoria 1105 puede incluir una memoria RAM de alta velocidad, o puede incluir además una memoria no volátil, tal como al menos un almacenamiento en disco magnético. Opcionalmente, la memoria 1105 puede incluir al menos un aparato de almacenamiento situado alejado del procesador 1101 anterior.
En el decodificador que se ilustra en la FIG. 11, la interfaz 1104 de red puede recibir un flujo de bits de banda baja enviado por un codificador; la interfaz 1103 de usuario puede estar conectada a un dispositivo periférico y estar configurada para emitir una señal; la memoria 1105 puede estar configurada para almacenar un programa, y el procesador 1101 puede estar configurado para invocar el programa almacenado en la memoria 1105, y realizar las siguientes operaciones:
obtener, a partir del flujo de bits de banda baja recibido por la interfaz 1104 de red, un conjunto de parámetros espectrales de frecuencia ordenados por frecuencia, en donde los parámetros espectrales de frecuencia incluyen parámetros de LSF de banda baja o parámetros de ISF de banda baja;
para el conjunto de parámetros espectrales de frecuencia obtenido, calcular la diferencia de los parámetros espectrales de frecuencia entre cada dos parámetros espectrales de frecuencia que tienen un mismo intervalo de posición en algunos o todos los parámetros espectrales de frecuencia;
obtener la diferencia mínima de los parámetros espectrales de frecuencia a partir de las diferencias de los parámetros espectrales de frecuencia calculadas;
determinar, de acuerdo con el intervalo de frecuencias que corresponde a la diferencia mínima de los parámetros espectrales de frecuencia, un intervalo de frecuencias inicial para predecir una señal de excitación de banda alta a partir de una banda baja; y
predecir la señal de excitación de banda alta a partir de la banda baja de acuerdo con el intervalo de frecuencias inicial.
Como forma opcional de implementación, la obtención por parte del procesador 1101, a partir del flujo de bits de banda baja recibido, de un conjunto de parámetros espectrales de frecuencia ordenados por frecuencia puede incluir:
decodificar el flujo de bits de banda baja recibido, con el fin de obtener el conjunto de parámetros espectrales de frecuencia ordenados por frecuencia; o
decodificar el flujo de bits de banda baja recibido, con el fin de obtener una señal de banda baja, y calcular, a partir de la señal de banda baja, el conjunto de parámetros espectrales de frecuencia ordenados por frecuencia.
Como forma opcional de implementación, si el procesador 1101 decodifica el flujo de bits de baja frecuencia recibido, con el fin de obtener el conjunto de parámetros espectrales de frecuencia ordenados por frecuencia, el procesador 11101 puede realizar las siguientes operaciones:
decodificar el flujo de bits de banda baja recibido, con el fin de obtener una señal de excitación de banda baja. En correspondencia, la predicción, por parte del procesador 1101, de la señal de excitación de banda alta a partir de la banda baja de acuerdo con el intervalo de frecuencias inicial puede incluir:
seleccionar, en función de la señal de excitación de banda baja, una banda de frecuencia con un ancho de banda predeterminado como señal de excitación de banda alta de acuerdo con el intervalo de frecuencias inicial.
Como forma opcional de implementación, el procesador 1101 puede realizar además las siguientes operaciones: convertir los parámetros espectrales de frecuencia obtenidos mediante decodificación en coeficientes LPC de banda baja;
sintetizar una señal de banda baja utilizando los coeficientes LPC de banda baja y la señal de excitación de banda baja;
predecir los coeficientes LPC de banda alta o banda ancha a partir de los coeficientes LPC de banda baja; sintetizar una señal de banda alta utilizando la señal de excitación de banda alta y los coeficientes LPC de banda alta o banda ancha; y
combinar la señal de banda baja con la señal de banda alta, para obtener una señal de banda ancha.
Como otra forma opcional de implementación, el procesador 1101 puede realizar además las siguientes operaciones:
convertir los parámetros espectrales de frecuencia obtenidos mediante decodificación en coeficientes LPC de banda baja;
sintetizar una señal de banda baja utilizando los coeficientes LPC de banda baja y la señal de excitación de banda baja;
predecir una envolvente de banda alta en función de la señal de banda baja;
sintetizar una señal de banda alta utilizando la señal de excitación de banda alta y la envolvente de banda alta; y combinar la señal de banda baja con la señal de banda alta, con el fin de obtener una señal de banda ancha.
Como forma opcional de implementación, si el procesador 11101 decodifica el flujo de bits de banda baja recibido, con el fin de obtener la señal de banda baja, y calcula, a partir de la señal de banda baja el conjunto de parámetros espectrales de frecuencia ordenados por frecuencia, la predicción, por parte del procesador 1101, de la señal de excitación de banda alta a partir de la banda baja de acuerdo con el intervalo de frecuencias inicial incluye: procesar la señal de baja frecuencia utilizando un filtro de análisis LPC, con el fin de obtener una señal de excitación de banda baja; y
seleccionar, en función de la señal de excitación de banda baja, una banda de frecuencia con un ancho de banda predeterminado como señal de excitación de banda alta de acuerdo con el intervalo de frecuencias inicial.
Como forma opcional de implementación, el procesador 1101 puede realizar además las siguientes operaciones: convertir los parámetros espectrales de frecuencia calculados en coeficientes LPC de banda baja;
predecir los coeficientes LPC de banda alta o banda ancha a partir de los coeficientes LPC de banda baja; sintetizar una señal de banda alta utilizando la señal de excitación de banda alta y los coeficientes LPC de banda alta o banda ancha; y
combinar la señal de banda baja con la señal de banda alta, con el fin de obtener una señal de banda ancha.
Como otra forma opcional de implementación, el procesador 1101 puede realizar además las siguientes operaciones:
predecir una envolvente de banda alta en función de la señal de banda baja;
sintetizar una señal de banda alta utilizando la señal de excitación de banda alta y la envolvente de banda alta; y combinar la señal de banda baja con la señal de banda alta, para obtener una señal de banda ancha.
El decodificador que se describe en la FIG. 11 puede predecir una señal de excitación de banda alta a partir de una señal de excitación de banda baja o una señal de banda baja de acuerdo con un intervalo de frecuencias inicial de la señal de excitación de banda alta, lo cual permite implementar la predicción de una señal de excitación de banda alta con una buena calidad de codificación, de modo que la señal de excitación de banda alta se puede predecir mejor, mejorando así de forma efectiva el rendimiento de la señal de excitación de banda alta. Además, después de que el decodificador que se describe en la FIG. 11 combine una señal de banda baja con una señal de banda alta, también se puede mejorar el rendimiento de la señal de banda ancha.
Una persona con un conocimiento normal de la técnica puede entender que la totalidad o una parte de los pasos de los métodos que se describen en los modos de realización se puede implementar mediante un programa que controle un hardware apropiado. El programa puede estar almacenado en un medio de almacenamiento legible por un ordenador. El medio de almacenamiento puede incluir una memoria flash, una memoria de solo lectura (Read-Only Memory, ROM), una memoria de acceso aleatorio (Random Access Memory, RAM), un disco magnético, y un disco óptico.
El método y el aparato para predecir una señal de excitación de banda alta divulgados por los modos de realización de la presente invención se han descrito en detalle más arriba. En esta memoria descriptiva se aplican ejemplos específicos con el fin de elaborar el principio y las formas de implementación de la presente invención, y las descripciones de los modos de realización anteriores se utilizan únicamente para ayudar a comprender el método y la idea central de la presente invención. En resumen, el contenido de esta memoria descriptiva no se debe interpretar como una limitación a la presente invención.

Claims (18)

REIVINDICACIONES
1. Un método para predecir una señal de excitación de banda alta en un decodificador de voz, que comprende: obtener (101), a partir de un flujo de bits de banda baja recibido, un conjunto de parámetros espectrales de frecuencia ordenados por frecuencia, en donde los parámetros espectrales de frecuencia comprenden parámetros espectrales de frecuencia de línea, LSF, de banda baja o parámetros espectrales de frecuencia de inmitancia, ISF, de banda baja;
calcular (102) una diferencia de los parámetros espectrales de frecuencia entre cada dos parámetros espectrales de frecuencia que tienen un mismo intervalo de posición en algunos o todos los parámetros espectrales de frecuencia; obtener (103) una diferencia mínima de los parámetros espectrales de frecuencia a partir de las diferencias de los parámetros espectrales de frecuencia calculadas;
estando el método caracterizado por:
determinar (104), de acuerdo con un intervalo de frecuencias (frequency bin) que corresponde a la diferencia mínima de los parámetros espectrales de frecuencia, un intervalo de frecuencias inicial para predecir una señal de excitación de banda alta a partir de una banda baja; y
predecir (105) la señal de excitación de banda alta a partir de la banda baja de acuerdo con el intervalo de frecuencias inicial.
2. El método de acuerdo con la reivindicación 1, en donde la etapa de obtención (101), a partir de un flujo de bits de banda baja recibido, de un conjunto de parámetros espectrales de frecuencia ordenados por frecuencia comprende: decodificar el flujo de bits de banda baja recibido con el fin de obtener el conjunto de parámetros espectrales de frecuencia ordenados por frecuencia; o
decodificar el flujo de bits de banda baja recibido con el fin de obtener una señal de banda baja, y calcular, a partir de la señal de banda baja, el conjunto de parámetros espectrales de frecuencia ordenados por frecuencia.
3. El método de acuerdo con la reivindicación 2, en donde si el conjunto de parámetros espectrales de frecuencia ordenados por frecuencia se obtiene decodificando el flujo de bits de banda baja recibido, el método comprende además:
decodificar el flujo de bits de banda baja recibido con el fin de obtener una señal de excitación de banda baja; y la predicción de la señal de excitación de banda alta a partir de la banda baja de acuerdo con el intervalo de frecuencias inicial comprende:
seleccionar, en función de la señal de excitación de banda baja, una banda de frecuencia con un ancho de banda predeterminado como señal de excitación de banda alta de acuerdo con el intervalo de frecuencias inicial.
4. El método de acuerdo con una cualquiera de las reivindicaciones 1 a 3, en donde el método comprende además: convertir los parámetros espectrales de frecuencia obtenidos mediante decodificación en coeficientes de predicción lineal, coeficientes LPC, de banda baja;
sintetizar una señal de banda baja utilizando los coeficientes LPC de banda baja y la señal de excitación de banda baja;
predecir los coeficientes LPC de banda alta o banda ancha en función de los coeficientes LPC de banda baja; sintetizar una señal de banda alta utilizando la señal de excitación de banda alta y los coeficientes LPC de banda alta o banda ancha; y
combinar la señal de banda baja con la señal de banda alta, con el fin de obtener una señal de banda ancha.
5. El método de acuerdo con la reivindicación 2, en donde si la señal de banda baja se obtiene decodificando el flujo de bits de banda baja recibido, y el conjunto de parámetros espectrales de frecuencia ordenados por frecuencia se calcula a partir de la señal de banda baja, la predicción de la señal de excitación de banda alta a partir de la banda baja de acuerdo con el intervalo de frecuencias inicial comprende:
procesar la señal de baja frecuencia utilizando un filtro de análisis LPC, con el fin de obtener una señal de excitación de banda baja; y
seleccionar, en función de la señal de excitación de banda baja, una banda de frecuencia con un ancho de banda predeterminado como señal de excitación de banda alta de acuerdo con el intervalo de frecuencias inicial.
6. El método de acuerdo con la reivindicación 5, en donde el método comprende además:
convertir los parámetros espectrales de frecuencia calculados obtenidos en coeficientes de predicción lineal (coeficientes LPC) de banda baja;
predecir los coeficientes LPC de banda alta o banda ancha en función de los coeficientes LPC de banda baja; sintetizar una señal de banda alta utilizando la señal de excitación de banda alta y los coeficientes LPC de banda alta o banda ancha; y
combinar la señal de banda baja con la señal de banda alta, con el fin de obtener una señal de banda ancha.
7. El método de acuerdo con una cualquiera de las reivindicaciones 1 a 6, en donde los cada dos parámetros espectrales de frecuencia que tienen un mismo intervalo de posición comprenden cada dos parámetros espectrales de frecuencia adyacentes o cada dos parámetros espectrales de frecuencia espaciados una misma cantidad de parámetros espectrales de frecuencia.
8. El método de acuerdo con una cualquiera de las reivindicaciones 1 a 7, en donde la obtención de una diferencia mínima de los parámetros espectrales de frecuencia a partir de las diferencias de los parámetros espectrales de frecuencia calculadas comprende:
corregir cada una de las diferencias de los parámetros espectrales de frecuencia calculadas, utilizando un factor de corrección a, en donde el factor de corrección decrece con el aumento de la frecuencia;
buscar la diferencia mínima de los parámetros espectrales de frecuencia a partir de las diferencias de los parámetros espectrales de frecuencia corregidas.
9. El método de acuerdo con la reivindicación 8, en donde el intervalo de búsqueda para la diferencia mínima de los parámetros espectrales de frecuencia se determina en función de la tasa del flujo de bits de banda baja; en donde una tasa más alta indica un rango de búsqueda mayor, y una tasa más baja indica un rango de búsqueda menor.
10. Un aparato para predecir una señal de excitación de banda alta en un decodificador de voz, que comprende: una primera unidad (601) de obtención, configurada para obtener, a partir de un flujo de bits de banda baja recibido, un conjunto de parámetros espectrales de frecuencia ordenados por frecuencia, en donde los parámetros espectrales de frecuencia comprenden parámetros espectrales de frecuencia de línea, LSF, de banda baja o parámetros espectrales de frecuencia de inmitancia, ISF, de banda baja;
una unidad (602) de cálculo, configurada para: calcular una diferencia de los parámetros espectrales de frecuencia entre cada dos parámetros espectrales de frecuencia que tienen un mismo intervalo de posición en algunos o todos los parámetros espectrales de frecuencia;
una segunda unidad (603) de obtención, configurada para obtener la diferencia mínima de los parámetros espectrales de frecuencia a partir de las diferencias de los parámetros espectrales de frecuencia calculadas por la unidad de cálculo;
estando el aparato caracterizado por comprender:
una unidad (604) de determinación del intervalo de frecuencias inicial, configurada para determinar, de acuerdo con el intervalo de frecuencias que corresponde a la diferencia mínima de los parámetros espectrales de frecuencia obtenida por la segunda unidad de obtención, un intervalo de frecuencias inicial para predecir una señal de excitación de banda alta a partir de una banda baja; y
una unidad (605) de predicción de excitación de banda alta, configurada para predecir la señal de excitación de banda alta a partir de la banda baja de acuerdo con el intervalo de frecuencias inicial determinado por la unidad de determinación del intervalo de frecuencias inicial.
11. El aparato de acuerdo con la reivindicación 10, en donde
la primera unidad (601) de obtención está configurada específicamente para decodificar el flujo de bits de banda baja recibido, con el fin de obtener el conjunto de parámetros espectrales de frecuencia ordenados por frecuencia; o está configurada específicamente para decodificar el flujo de bits de banda baja recibido, con el fin de obtener una señal de banda baja, y calcular, a partir de la señal de banda baja, el conjunto de parámetros espectrales de frecuencia ordenados por frecuencia.
12. El aparato de acuerdo con la reivindicación 11, en donde si la primera unidad de obtención está configurada específicamente para realizar la decodificación a partir del flujo de bits de baja frecuencia recibido, con el fin de obtener el conjunto de parámetros espectrales de frecuencia ordenados por frecuencia, el aparato comprende además:
una unidad (606) de decodificación, configurada para decodificar el flujo de bits de banda baja recibido, con el fin de obtener una señal de excitación de banda baja; y
la unidad (605) de predicción de excitación de banda alta está configurada específicamente para seleccionar, en función de la señal de excitación de banda baja obtenida por la unidad de decodificación, una banda de frecuencia con un ancho de banda predeterminado como señal de excitación de banda alta de acuerdo con el intervalo de frecuencias inicial determinado por la unidad de determinación del intervalo de frecuencias inicial.
13. El aparato de acuerdo con la reivindicación 12, en donde el aparato comprende además:
una primera unidad (607) de conversión, configurada para convertir los parámetros espectrales de frecuencia obtenidos por la primera unidad de obtención en coeficientes de predicción lineal, coeficientes LPC, de banda baja;
una primera unidad (608) sintetizadora de señales de banda baja, configurada para sintetizar los coeficientes LPC de banda baja obtenidos por la primera unidad de conversión y la señal de excitación de banda baja obtenida por la unidad de decodificación en la señal de banda baja;
una primera unidad (609) de predicción de coeficientes LPC, configurada para predecir los coeficientes LPC de banda alta o banda ancha a partir de los coeficientes LPC de banda baja obtenidos por la primera unidad de conversión;
una primera unidad (610) sintetizadora de señales de banda alta, configurada para sintetizar una señal de banda alta utilizando la señal de excitación de banda alta seleccionada por la unidad de predicción de excitación de banda alta y los coeficientes LPC de banda alta o banda ancha predichos por la primera unidad de predicción de coeficientes LPC; y
una primera unidad (611) sintetizadora de señales de banda ancha, configurada para combinar la señal de banda baja sintetizada por la primera unidad sintetizadora de señales de banda baja con la señal de banda alta sintetizada por la primera unidad sintetizadora de señales de banda alta, para obtener una señal de banda ancha.
14. El aparato de acuerdo con la reivindicación 11, en donde si la primera unidad (601) de obtención está configurada específicamente para decodificar de acuerdo con el flujo de bits de banda baja recibido, con el fin de obtener la señal de banda baja, y calcular, de acuerdo con la señal de banda baja, el conjunto de parámetros espectrales de frecuencia ordenados por frecuencia, la unidad de predicción de excitación de banda alta está configurada específicamente para procesar la señal de baja frecuencia utilizando un filtro de análisis LPC, con el fin de obtener una señal de excitación de banda baja y seleccionar, a partir de la señal de excitación de banda baja, una banda de frecuencia con un ancho de banda predeterminado como señal de excitación de banda alta de acuerdo con el intervalo de frecuencias inicial.
15. El aparato de acuerdo con la reivindicación 14, en donde el aparato comprende además:
una tercera unidad (617) de conversión, configurada para convertir los parámetros espectrales de frecuencia calculados obtenidos por la primera unidad de obtención en coeficientes de predicción lineal (coeficientes LPC) de banda baja;
una segunda unidad (618) de predicción de coeficientes LPC, configurada para predecir los coeficientes LPC de banda alta o banda ancha de acuerdo con los coeficientes LPC de banda baja obtenidos mediante conversión por la tercera unidad de conversión;
una tercera unidad (619) sintetizadora de señales de banda alta, configurada para sintetizar una señal de banda alta utilizando la señal de excitación de banda alta seleccionada por la unidad de predicción de excitación de banda alta y los coeficientes LPC de banda alta o banda ancha predichos por la segunda unidad de predicción de coeficientes LPC; y
una tercera unidad (620) sintetizadora de señales de banda ancha, configurada para combinar la señal de banda baja obtenida por la primera unidad de obtención con la señal de banda alta sintetizada por la tercera unidad sintetizadora de señales de banda alta, para obtener una señal de banda ancha.
16. El aparato de acuerdo con una cualquiera de las reivindicaciones 10 a 15, en donde los cada dos parámetros espectrales de frecuencia que tienen un mismo intervalo de posición comprenden cada dos parámetros espectrales de frecuencia adyacentes o cada dos parámetros espectrales de frecuencia espaciados una misma cantidad de parámetros espectrales de frecuencia.
17. El aparato de acuerdo con una cualquiera de las reivindicaciones 10 a 16, en donde la segunda unidad (603) de obtención está configurada específicamente para:
corregir cada una de las diferencias de los parámetros espectrales de frecuencia calculados, utilizando un factor de corrección a, en donde el factor de corrección decrece con el aumento de una frecuencia;
buscar la diferencia mínima de los parámetros espectrales de frecuencia a partir de las diferencias de los parámetros espectrales de frecuencia corregidas.
18. El aparato de acuerdo con la reivindicación 17, en donde se determina un rango para buscar la diferencia mínima de los parámetros espectrales de frecuencia en función de la tasa del flujo de bits de banda baja; en donde una tasa más alta indica un rango de búsqueda mayor, y una tasa más baja indica un rango de búsqueda menor.
ES14849584T 2013-09-26 2014-04-03 Método y aparato para predecir una señal de excitación de alta frecuencia Active ES2716152T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201310444734.4A CN104517611B (zh) 2013-09-26 2013-09-26 一种高频激励信号预测方法及装置
PCT/CN2014/074711 WO2015043151A1 (zh) 2013-09-26 2014-04-03 一种高频激励信号预测方法及装置

Publications (1)

Publication Number Publication Date
ES2716152T3 true ES2716152T3 (es) 2019-06-10

Family

ID=52741932

Family Applications (1)

Application Number Title Priority Date Filing Date
ES14849584T Active ES2716152T3 (es) 2013-09-26 2014-04-03 Método y aparato para predecir una señal de excitación de alta frecuencia

Country Status (16)

Country Link
US (3) US9685165B2 (es)
EP (3) EP4339946A3 (es)
JP (2) JP6420324B2 (es)
KR (2) KR101805794B1 (es)
CN (2) CN104517611B (es)
AU (1) AU2014328353B2 (es)
BR (1) BR112016006583B1 (es)
CA (1) CA2924952C (es)
ES (1) ES2716152T3 (es)
HK (1) HK1206139A1 (es)
MX (1) MX353022B (es)
MY (1) MY166226A (es)
RU (1) RU2637885C2 (es)
SG (1) SG11201602225WA (es)
WO (1) WO2015043151A1 (es)
ZA (2) ZA201601991B (es)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104217727B (zh) * 2013-05-31 2017-07-21 华为技术有限公司 信号解码方法及设备
FR3008533A1 (fr) 2013-07-12 2015-01-16 Orange Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences
CN104517610B (zh) 2013-09-26 2018-03-06 华为技术有限公司 频带扩展的方法及装置
CN104517611B (zh) 2013-09-26 2016-05-25 华为技术有限公司 一种高频激励信号预测方法及装置
CA2928882C (en) * 2013-11-13 2018-08-14 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Encoder for encoding an audio signal, audio transmission system and method for determining correction values
TWI752166B (zh) * 2017-03-23 2022-01-11 瑞典商都比國際公司 用於音訊信號之高頻重建的諧波轉置器的回溯相容整合
CN107818797B (zh) * 2017-12-07 2021-07-06 苏州科达科技股份有限公司 语音质量评价方法、装置及其系统

Family Cites Families (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5455888A (en) * 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
JPH0955778A (ja) * 1995-08-15 1997-02-25 Fujitsu Ltd 音声信号の広帯域化装置
US7072832B1 (en) * 1998-08-24 2006-07-04 Mindspeed Technologies, Inc. System for speech encoding having an adaptive encoding arrangement
US7389227B2 (en) * 2000-01-14 2008-06-17 C & S Technology Co., Ltd. High-speed search method for LSP quantizer using split VQ and fixed codebook of G.729 speech encoder
WO2003038812A1 (en) * 2001-11-02 2003-05-08 Matsushita Electric Industrial Co., Ltd. Audio encoding and decoding device
WO2003046891A1 (en) * 2001-11-29 2003-06-05 Coding Technologies Ab Methods for improving high frequency reconstruction
US7363218B2 (en) * 2002-10-25 2008-04-22 Dilithium Networks Pty. Ltd. Method and apparatus for fast CELP parameter mapping
KR100499047B1 (ko) * 2002-11-25 2005-07-04 한국전자통신연구원 서로 다른 대역폭을 갖는 켈프 방식 코덱들 간의 상호부호화 장치 및 그 방법
RU2248619C2 (ru) * 2003-02-12 2005-03-20 Рыболовлев Александр Аркадьевич Способ и устройство преобразования речевого сигнала методом линейного предсказания с адаптивным распределением информационных ресурсов
EP2264700A1 (en) * 2003-09-16 2010-12-22 Panasonic Corporation Coding apparatus and decoding apparatus
CA2457988A1 (en) * 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
KR100647290B1 (ko) * 2004-09-22 2006-11-23 삼성전자주식회사 합성된 음성의 특성을 이용하여 양자화/역양자화를선택하는 음성 부호화/복호화 장치 및 그 방법
AU2006232364B2 (en) * 2005-04-01 2010-11-25 Qualcomm Incorporated Systems, methods, and apparatus for wideband speech coding
TWI317933B (en) 2005-04-22 2009-12-01 Qualcomm Inc Methods, data storage medium,apparatus of signal processing,and cellular telephone including the same
JP5100380B2 (ja) * 2005-06-29 2012-12-19 パナソニック株式会社 スケーラブル復号装置および消失データ補間方法
JP2007310296A (ja) * 2006-05-22 2007-11-29 Oki Electric Ind Co Ltd 帯域拡張装置及び方法
KR20070115637A (ko) 2006-06-03 2007-12-06 삼성전자주식회사 대역폭 확장 부호화 및 복호화 방법 및 장치
CN101089951B (zh) * 2006-06-16 2011-08-31 北京天籁传音数字技术有限公司 频带扩展编码方法及装置和解码方法及装置
US8532984B2 (en) * 2006-07-31 2013-09-10 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of active frames
JP5141180B2 (ja) * 2006-11-09 2013-02-13 ソニー株式会社 周波数帯域拡大装置及び周波数帯域拡大方法、再生装置及び再生方法、並びに、プログラム及び記録媒体
US8295507B2 (en) * 2006-11-09 2012-10-23 Sony Corporation Frequency band extending apparatus, frequency band extending method, player apparatus, playing method, program and recording medium
KR101565919B1 (ko) * 2006-11-17 2015-11-05 삼성전자주식회사 고주파수 신호 부호화 및 복호화 방법 및 장치
US8639500B2 (en) 2006-11-17 2014-01-28 Samsung Electronics Co., Ltd. Method, medium, and apparatus with bandwidth extension encoding and/or decoding
KR101375582B1 (ko) * 2006-11-17 2014-03-20 삼성전자주식회사 대역폭 확장 부호화 및 복호화 방법 및 장치
ES2548010T3 (es) 2007-03-05 2015-10-13 Telefonaktiebolaget Lm Ericsson (Publ) Procedimiento y dispositivo para suavizar ruido de fondo estacionario
US8392198B1 (en) * 2007-04-03 2013-03-05 Arizona Board Of Regents For And On Behalf Of Arizona State University Split-band speech compression based on loudness estimation
KR100921867B1 (ko) * 2007-10-17 2009-10-13 광주과학기술원 광대역 오디오 신호 부호화 복호화 장치 및 그 방법
CN101458930B (zh) * 2007-12-12 2011-09-14 华为技术有限公司 带宽扩展中激励信号的生成及信号重建方法和装置
JP4818335B2 (ja) * 2008-08-29 2011-11-16 株式会社東芝 信号帯域拡張装置
JP4945586B2 (ja) * 2009-02-02 2012-06-06 株式会社東芝 信号帯域拡張装置
US8463599B2 (en) 2009-02-04 2013-06-11 Motorola Mobility Llc Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder
JP4932917B2 (ja) * 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
CN101521014B (zh) * 2009-04-08 2011-09-14 武汉大学 音频带宽扩展编解码装置
JP5754899B2 (ja) * 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
US8484020B2 (en) * 2009-10-23 2013-07-09 Qualcomm Incorporated Determining an upperband signal from a narrowband signal
JP2011209548A (ja) * 2010-03-30 2011-10-20 Nippon Logics Kk 帯域拡張装置
CN102870156B (zh) * 2010-04-12 2015-07-22 飞思卡尔半导体公司 音频通信设备、输出音频信号的方法和通信系统
US9294060B2 (en) 2010-05-25 2016-03-22 Nokia Technologies Oy Bandwidth extender
CN103035248B (zh) * 2011-10-08 2015-01-21 华为技术有限公司 音频信号编码方法和装置
EP3279895B1 (en) * 2011-11-02 2019-07-10 Telefonaktiebolaget LM Ericsson (publ) Audio encoding based on an efficient representation of auto-regressive coefficients
EP3089164A1 (en) * 2011-11-02 2016-11-02 Telefonaktiebolaget LM Ericsson (publ) Generation of a high band extension of a bandwidth extended audio signal
EP2774148B1 (en) * 2011-11-03 2014-12-24 Telefonaktiebolaget LM Ericsson (PUBL) Bandwidth extension of audio signals
FR2984580A1 (fr) * 2011-12-20 2013-06-21 France Telecom Procede de detection d'une bande de frequence predeterminee dans un signal de donnees audio, dispositif de detection et programme d'ordinateur correspondant
US9711156B2 (en) * 2013-02-08 2017-07-18 Qualcomm Incorporated Systems and methods of performing filtering for gain determination
MY172616A (en) * 2013-03-13 2019-12-06 Telekom Malaysia Berhad A system for analysing network traffic and a method thereof
CN103165134B (zh) * 2013-04-02 2015-01-14 武汉大学 音频信号高频参数编解码装置
US9666202B2 (en) * 2013-09-10 2017-05-30 Huawei Technologies Co., Ltd. Adaptive bandwidth extension and apparatus for the same
CN104517611B (zh) 2013-09-26 2016-05-25 华为技术有限公司 一种高频激励信号预测方法及装置
CN104517610B (zh) * 2013-09-26 2018-03-06 华为技术有限公司 频带扩展的方法及装置
US10163447B2 (en) * 2013-12-16 2018-12-25 Qualcomm Incorporated High-band signal modeling

Also Published As

Publication number Publication date
CN105761723B (zh) 2019-01-15
EP3051534A1 (en) 2016-08-03
JP2019023749A (ja) 2019-02-14
MY166226A (en) 2018-06-22
JP2016532138A (ja) 2016-10-13
KR101805794B1 (ko) 2017-12-07
US9685165B2 (en) 2017-06-20
EP3573057B1 (en) 2024-06-05
CA2924952C (en) 2018-06-19
AU2014328353A1 (en) 2016-04-14
KR101894927B1 (ko) 2018-09-04
CN104517611B (zh) 2016-05-25
RU2016116016A (ru) 2017-11-01
US20170249948A1 (en) 2017-08-31
AU2014328353B2 (en) 2017-04-20
RU2637885C2 (ru) 2017-12-07
EP3051534B1 (en) 2019-01-02
EP4339946A3 (en) 2024-04-24
EP3051534A4 (en) 2017-05-03
ZA201707083B (en) 2018-11-28
US20160210979A1 (en) 2016-07-21
US20190272838A1 (en) 2019-09-05
EP3573057A1 (en) 2019-11-27
CN105761723A (zh) 2016-07-13
JP6420324B2 (ja) 2018-11-07
KR20160055268A (ko) 2016-05-17
MX2016003882A (es) 2016-06-17
EP4339946A2 (en) 2024-03-20
JP6720266B2 (ja) 2020-07-08
BR112016006583A2 (pt) 2017-09-12
WO2015043151A1 (zh) 2015-04-02
ZA201601991B (en) 2019-04-24
US10339944B2 (en) 2019-07-02
BR112016006583B1 (pt) 2019-11-26
CA2924952A1 (en) 2015-04-02
CN104517611A (zh) 2015-04-15
US10607620B2 (en) 2020-03-31
MX353022B (es) 2017-12-18
HK1206139A1 (zh) 2015-12-31
KR20170137944A (ko) 2017-12-13
SG11201602225WA (en) 2016-05-30

Similar Documents

Publication Publication Date Title
ES2716152T3 (es) Método y aparato para predecir una señal de excitación de alta frecuencia
ES2664185T3 (es) Codificador de audio, decodificador de audio, método para proporcionar una información de audio codificada, método para proporcionar una información de audio decodificada, programa informático y representación codificada utilizando una ampliación de ancho de banda adaptada a la señal
ES2777282T3 (es) Extensión de ancho de banda armónico de señales de audio
ES2460893T3 (es) Sistemas, procedimientos y aparato para limitar el factor de ganancia
BR112016005850B1 (pt) método e aparelho de extensão de largura de banda
ES2967136T3 (es) Sistemas y procedimientos de comunicación de información de trama redundante
ES2659068T3 (es) Procedimiento y aparato de codificación de audio
BR112014021407B1 (pt) método de processamento de sinal de voz/áudio e aparelho
ES2618258T3 (es) Sistemas y procedimientos para realizar el control de ganancia
ES2900594T3 (es) Procedimiento para determinar un modo de codificación
ES2774334T3 (es) Estimación de forma de ganancia para mejorar el rastreo de características temporales de banda alta
JP6397082B2 (ja) 符号化方法、復号化方法、符号化装置及び復号化装置
ES2592522T3 (es) Codificación de audio basada en representación de coeficientes auto-regresivos
ES2755152T3 (es) Método y dispositivo de procesamiento de señal
ES2867477T3 (es) Decodificación de secuencias de bits de audio con metadatos de replicación de banda espectral mejorada en al menos un elemento de relleno