ES2660605T3 - Estimación de factores de mezcla para generar una señal de excitación de banda alta - Google Patents

Estimación de factores de mezcla para generar una señal de excitación de banda alta Download PDF

Info

Publication number
ES2660605T3
ES2660605T3 ES14786583.6T ES14786583T ES2660605T3 ES 2660605 T3 ES2660605 T3 ES 2660605T3 ES 14786583 T ES14786583 T ES 14786583T ES 2660605 T3 ES2660605 T3 ES 2660605T3
Authority
ES
Spain
Prior art keywords
signal
mixing factor
high band
mixing
factor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES14786583.6T
Other languages
English (en)
Inventor
Venkatraman S. Atti
Venkatesh Krishnan
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Application granted granted Critical
Publication of ES2660605T3 publication Critical patent/ES2660605T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/087Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using mixed excitation models, e.g. MELP, MBE, split band LPC or HVXC
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Digital Transmission Methods That Use Modulated Carrier Waves (AREA)
  • Amplitude Modulation (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
  • Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)

Abstract

Un procedimiento (500) que comprende: generar (502), en un codificador de voz, una señal residual de banda alta (224) basada en una parte de banda alta (124) de una señal de audio; generar (504) una señal armónicamente extendida (208) basándose, al menos parcialmente, en una parte de banda baja de la señal de audio (144); determinar (506) un factor de mezcla basado en la señal residual de banda alta, la señal armónicamente extendida y el ruido modulado (220), en donde el ruido modulado se basa, al menos parcialmente, en la señal armónicamente extendida (208) y en el ruido blanco (205); y generar una señal de excitación de banda alta (161) basada en combinar una primera señal correspondiente a la señal extendida armónicamente (208), ajustada a escala basándose en el factor de mezcla, y una segunda señal correspondiente al ruido modulado (220), ajustada a escala basándose en el factor de mezcla.

Description

DESCRIPCIÓN
Estimación de factores de mezcla para generar una señal de excitación de banda alta
CAMPO 5
[0001] La presente divulgación se refiere, en general, al procesamiento de señales.
DESCRIPCIÓN DE LA TÉCNICA RELACIONADA
10
[0002] Los avances en la tecnología han dado lugar a dispositivos informáticos más pequeños y más potentes. Por ejemplo, existe actualmente una variedad de dispositivos informáticos personales portátiles, incluyendo dispositivos informáticos inalámbricos, tales como teléfonos inalámbricos portátiles, asistentes digitales personales (PDA) y dispositivos de búsqueda que son pequeños, ligeros y que pueden ser transportados fácilmente por los usuarios. Más específicamente, los teléfonos inalámbricos portátiles, tales como los teléfonos celulares y los teléfonos del 15 protocolo de Internet (IP), pueden comunicar paquetes de voz y datos por redes inalámbricas. Además, muchos de dichos teléfonos inalámbricos incluyen otros tipos de dispositivos que están incorporados en los mismos. Por ejemplo, un teléfono inalámbrico también puede incluir una cámara fotográfica digital, una cámara de vídeo digital, un grabador digital y un reproductor de archivos de audio.
20
[0003] En los sistemas telefónicos tradicionales (por ejemplo, las redes telefónicas conmutadas públicas (PSTN)), el ancho de banda de la señal está limitado al rango de frecuencias de 300 Hertz (Hz) a 3,4 kiloHertz (kHz). En aplicaciones de banda ancha (WB), como la telefonía celular y la voz sobre el protocolo de Internet (VoIP), el ancho de banda de la señal puede abarcar el rango de frecuencias de 50 Hz a 7 kHz. Las técnicas de codificación de banda super-ancha (SWB) prestan soporte a un ancho de banda que se extiende hasta alrededor de 16 kHz. La 25 ampliación del ancho de banda de la señal desde la telefonía de banda estrecha a 3,4 kHz hasta la telefonía SWB de 16 kHz puede mejorar la calidad de la reconstrucción, la inteligibilidad y la naturalidad de la señal.
[0004] Las técnicas de codificación de SWB habitualmente implican codificar y transmitir la parte de frecuencias más bajas de la señal (por ejemplo, de 50 Hz a 7 kHz, también denominada la "banda baja"). Por ejemplo, la banda baja 30 se puede representar usando parámetros de filtro y/o una señal de excitación de banda baja. Sin embargo, con el fin de mejorar la eficacia de codificación, la parte de frecuencias más altas de la señal (por ejemplo, de 7 kHz a 16 kHz, también llamada "banda alta") puede no codificarse y transmitirse totalmente. En cambio, un receptor puede utilizar el modelado de señales para predecir la banda alta. En algunas implementaciones, los datos asociados a la banda alta pueden proporcionarse al receptor para facilitar la predicción. Tales datos pueden denominarse "información 35 secundaria" y pueden incluir factores de mezcla para allanar la evolución entre sub-tramas, información de ganancia, frecuencias espectrales de línea (las LSF, también denominadas pares espectrales de línea (LSP)), etc. La predicción de banda alta que usa un modelo de señal puede ser aceptablemente precisa cuando la señal de banda baja está correlacionada suficientemente con la señal de banda alta. Sin embargo, en presencia de ruido, la correlación entre la banda baja y la banda alta puede ser débil, y el modelo de señal puede no representar ya con 40 precisión la banda alta. Esto puede provocar distorsiones (por ejemplo, habla distorsionada) en el receptor.
[0005] En el documento WO 2006/107837 A1 se describe un codificador de voz de banda ancha que incluye un codificador de banda baja y un codificador de banda alta. El codificador de banda baja está configurado para codificar una parte de banda baja de una señal de voz de banda ancha como un conjunto de parámetros de filtro y 45 una señal de excitación codificada. El codificador de banda alta está configurado para calcular valores para parámetros de codificación que especifican una envolvente espectral y una envolvente temporal de una parte de banda alta de la señal de voz de banda ancha. La envolvente temporal se basa en una señal de excitación de banda alta que se obtiene de la señal de excitación codificada. En un ejemplo, la envolvente temporal se basa en una diferencia de niveles entre la parte de banda alta y una señal de banda alta sintetizada, en la que la señal de banda 50 alta sintetizada se genera de acuerdo a la señal de excitación de banda alta y un conjunto de parámetros de filtro de banda alta.
SUMARIO
55
[0006] Se divulgan los sistemas y procedimientos de estimación de un factor de mezcla utilizando un análisis de bucle cerrado. La codificación de banda alta puede implicar generar una señal de excitación de banda alta a partir de una señal de excitación de banda baja, generada usando análisis de banda baja (por ejemplo, análisis de predicción lineal (LP) de baja banda). La señal de excitación de banda alta se genera mezclando una señal armónicamente extendida con ruido modulado (por ejemplo, ruido blanco). La razón en la cual se mezclan la señal armónicamente 60 extendida y el ruido modulado puede afectar la calidad de reconstrucción de la señal. En presencia de ruido de fondo, la correlación entre la banda baja y la banda alta puede verse comprometida y la señal armónicamente extendida puede ser inadecuada para la síntesis de banda alta. Por ejemplo, la señal de excitación de banda alta puede introducir distorsiones audibles causadas por fluctuaciones de banda baja dentro de una trama, que son independientes de la banda alta. De acuerdo a las técnicas descritas, la razón en la que se mezclan la señal 65 armónicamente extendida y el ruido modulado se ajusta basándose en una señal representativa de la banda alta (es
decir, una señal residual de banda alta). Por ejemplo, las técnicas descritas en este documento pueden permitir una estimación en bucle cerrado de un factor de mezcla utilizado para determinar la razón en la que se mezclan la señal armónicamente extendida y el ruido modulado. La estimación de ciclo cerrado puede reducir (por ejemplo, minimizar) una diferencia entre la señal de excitación de banda alta y la señal residual de banda alta, generando así una señal de excitación de banda alta que es menos susceptible a las fluctuaciones en la banda baja y más representativa de 5 la banda alta.
[0007] De acuerdo a un primer aspecto de la invención, como se expone en la reivindicación 1, se proporciona un procedimiento que comprende: 1) generar, en un codificador de voz, una señal residual de banda alta basada en una parte de banda alta de una señal de audio; 2) generar una señal armónicamente extendida basada, al menos 10 parcialmente, en una parte de banda baja de la señal de audio; 3) determinar un factor de mezcla basado en la señal residual de banda alta, la señal armónicamente extendida y el ruido modulado, en donde el ruido modulado se basa, al menos parcialmente, en la señal armónicamente extendida y el ruido blanco; y 4) generar una señal de excitación de banda alta basada en la combinación de una primera señal correspondiente a la señal amplificada armónicamente a escala, basada en el factor de mezcla y en una segunda señal correspondiente al ruido modulado 15 a escala, basado en el factor de mezcla.
[0008] De acuerdo a un aspecto adicional de la invención, como se expone en la reivindicación 11, se proporciona un procedimiento que comprende: 1) recibir, en un decodificador de voz, una señal codificada que incluye una señal de excitación de banda baja e información secundaria de banda alta, en la que la información lateral de banda alta 20 incluye un factor de mezcla, y en la que el factor de mezcla se basa en una señal residual de banda alta, una primera señal extendida armónicamente y un primer ruido modulado; y 2) generar una señal de excitación de banda alta mezclando una primera señal correspondiente a una segunda señal armónicamente extendida y una segunda señal correspondiente a un segundo ruido modulado, en donde la segunda señal armónicamente extendida se ajusta a escala basándose en el factor de mezcla, y en donde el segundo ruido modulado se ajusta a escala en 25 función del factor de mezcla.
[0009] De acuerdo a un aspecto adicional de la invención, tal como se expone en la reivindicación 13, se proporciona un medio legible por ordenador no transitorio que incluye instrucciones que, al ser ejecutadas por un procesador en un codificador o decodificador de voz, hacen que el procesador lleve a cabo uno de los 30 procedimientos descritos anteriormente.
[0010] De acuerdo a un aspecto adicional de la invención, tal como se expone en la reivindicación 7, se proporciona un aparato que comprende:
35
1) un filtro de análisis de predicción lineal para generar una señal residual de banda alta basada en una parte de banda alta de una señal de audio; 2) un generador de transformación no lineal para generar una señal armónicamente extendida, basada, al menos parcialmente, en una parte de banda baja de la señal de audio; 3) un calculador de factor de mezcla para determinar un factor de mezcla basado en la señal residual de banda alta, la señal armónicamente extendida y el ruido modulado, en donde el ruido modulado se basa, al menos 40 parcialmente, en la señal armónicamente extendida y en el ruido blanco; y 4) un generador de excitación de banda alta para generar una señal de excitación de banda alta, incluyendo el generador de excitación de banda alta un mezclador para combinar una primera señal correspondiente a la señal extendida armónicamente, basándose en el factor de mezcla y en una segunda señal correspondiente a el ruido modulado, ajustado a escala basándose en el factor de mezcla. 45
[0011] De acuerdo a un aspecto adicional de la invención, tal como se expone en la reivindicación 12, se proporciona un aparato que comprende:
un decodificador del habla, configurado para: 1) recibir una señal codificada que incluye una señal de excitación 50 de banda baja e información secundaria de banda alta, en donde la información secundaria de banda alta incluye un factor de mezcla, y en donde el factor de mezcla se basa en una señal residual de banda alta, una primera señal armónicamente extendida y un primer ruido modulado; y 2) generar una señal de excitación de banda alta mezclando una primera señal correspondiente a una segunda señal armónicamente extendida y a una segunda señal correspondiente a un segundo ruido modulado, en el que la segunda señal armónicamente extendida se 55 ajusta a escala basándose en el factor de mezcla, y en el que el segundo ruido modulado se ajusta a escala en función del factor de mezcla.
[0012] Las ventajas particulares proporcionadas por al menos una de las realizaciones divulgadas incluyen una capacidad para ajustar dinámicamente los factores de mezcla usados durante la síntesis de banda alta, basándose 60 en las características de la banda alta. Por ejemplo, los factores de mezcla se pueden determinar usando un análisis de bucle cerrado para reducir un error entre una señal residual de banda alta y una señal de excitación de banda alta utilizada durante la síntesis de banda alta. Otros aspectos, ventajas y características de la presente divulgación resultarán evidentes después de revisar toda la solicitud, incluyendo las siguientes secciones: Breve descripción de los dibujos, Descripción detallada y Reivindicaciones. 65
BREVE DESCRIPCIÓN DE LOS DIBUJOS
[0013]
La FIG. 1 es un diagrama para ilustrar una realización particular de un sistema que es operable para estimar un 5 factor de mezcla;
La FIG. 2 es un diagrama para ilustrar un modo de realización particular de un sistema que es operable para estimar un factor de mezcla para generar una señal de excitación de banda alta;
10
La FIG. 3 es un diagrama para ilustrar otro modo de realización particular de un sistema que es operable para estimar un factor de mezcla usando un análisis de bucle cerrado para generar una señal de excitación de banda alta;
La FIG. 4 es un diagrama para ilustrar una realización particular de un sistema que es operable para reproducir 15 una señal de audio usando un factor de mezcla;
La FIG. 5 incluye diagramas de flujo para ilustrar realizaciones particulares de procedimientos para reproducir una señal de banda alta usando un factor de mezcla; y
20
La FIG. 6 es un diagrama de bloques de un dispositivo inalámbrico operable para realizar operaciones de procesamiento de señales de acuerdo a los sistemas y procedimientos de las FIGs. 1 a 5.
DESCRIPCIÓN DETALLADA
25
[0014] Con referencia a la FIG. 1, se muestra una realización particular de un sistema que es operable para estimar un factor de mezcla (por ejemplo, usando análisis de bucle cerrado) y que generalmente se designa con 100. En un modo de realización particular, el sistema 100 puede integrarse en un sistema o aparato de codificación (por ejemplo, en un teléfono inalámbrico o codificador / decodificador (CODEC)). En otras realizaciones particulares, el sistema 100 puede integrarse en un decodificador, un reproductor de música, un reproductor de vídeo, una unidad 30 de entretenimiento, un dispositivo de navegación, un dispositivo de comunicaciones, un PDA, una unidad de datos de ubicación fija o un ordenador.
[0015] Debería observarse que, en la siguiente descripción, las diversas funciones realizadas por el sistema 100 de la FIG. 1 se describen como realizadas por ciertos componentes o módulos. Sin embargo, esta división de 35 componentes y módulos es solo para ilustración. En un modo de realización alternativo, una función realizada por un componente o módulo particular puede dividirse, en cambio, entre múltiples componentes o módulos. Además, en una realización alternativa, dos o más componentes o módulos de la FIG. 1 puede integrarse en un solo componente o módulo. Cada componente o módulo ilustrado en la FIG. 1 puede implementarse utilizando hardware (por ejemplo, un dispositivo de formación de compuertas programables en el terreno (FPGA), un circuito integrado específico de la 40 aplicación (ASIC), un procesador de señales digitales (DSP), un controlador, etc.), software (por ejemplo, instrucciones ejecutables por un procesador), o cualquier combinación de los mismos.
[0016] El sistema 100 incluye un banco de filtros de análisis 110 que está configurado para recibir una señal de audio 102. Por ejemplo, la señal de audio 102 puede proporcionarse mediante un micrófono u otro dispositivo de 45 entrada. En un modo de realización particular, la señal de audio de entrada 102 puede incluir voz. La señal de audio de entrada 102 puede ser una señal SWB que incluye datos en el intervalo de frecuencias desde aproximadamente 50 hercios (Hz) hasta aproximadamente 16 kilohercios (kHz). El banco de filtros de análisis 110 puede filtrar la señal de audio de entrada 102 en múltiples partes basándose en la frecuencia. Por ejemplo, el banco de filtros de análisis 110 puede generar una señal de banda baja 122 y una señal de banda alta 124. La señal de banda baja 122 y la 50 señal de banda alta 124 pueden tener anchos de banda iguales o desiguales, y pueden estar superpuestas o no superpuestas. En un modo de realización alternativo, el banco de filtros de análisis 110 puede generar más de dos salidas.
[0017] En el ejemplo de la FIG. 1, la señal de banda baja 122 y la señal de banda alta 124 ocupan bandas de 55 frecuencias no superpuestas. Por ejemplo, la señal de banda baja 122 y la señal de banda alta 124 pueden ocupar bandas de frecuencias no superpuestas de entre 50 Hz y 7 kHz y entre 7 kHz y 16 kHz, respectivamente. En un modo de realización alternativo, la señal de banda baja 122 y la señal de banda alta 124 pueden ocupar bandas de frecuencias no superpuestas de entre 50 Hz y 8 kHz y entre 8 kHz y 16 kHz, respectivamente. En otro modo de realización alternativo, la señal de banda baja 122 y la señal de banda alta 124 se superponen (por ejemplo, entre 60 50 Hz y 8 kHz y entre 7 kHz y 16 kHz, respectivamente), lo cual puede permitir que un filtro de paso bajo y un filtro de paso alto del banco de filtros de análisis 110 tengan una atenuación progresiva suave, lo cual puede simplificar el diseño y reducir el coste del filtro de paso bajo y del filtro de paso alto. La superposición de la señal de banda baja 122 y de la señal de banda alta 124 también puede permitir la mezcla suave de señales de banda baja y banda alta en un receptor, lo cual puede dar como resultado menos distorsiones audibles. 65
[0018] Se debería observar que, aunque el ejemplo de la FIG. 1 ilustra el procesamiento de una señal SWB, esto es solo para ilustración. En un modo de realización alternativo, la señal de audio de entrada 102 puede ser una señal WB que tiene un intervalo de frecuencias desde aproximadamente 50 Hz hasta aproximadamente 8 kHz. En un modo de realización de este tipo, la señal de banda baja 122 puede corresponder a un intervalo de frecuencias desde aproximadamente 50 Hz hasta aproximadamente 6,4 kHz y la señal de banda alta 124 puede corresponder a 5 un intervalo de frecuencias desde aproximadamente 6,4 kHz hasta aproximadamente 8 kHz.
[0019] El sistema 100 puede incluir un módulo de análisis de banda baja 130 configurado para recibir la señal de banda baja 122. En un modo de realización particular, el módulo de análisis de banda baja 130 puede representar un modo de realización de un codificador de predicción lineal excitada por código (CELP). El módulo de análisis de 10 banda baja 130 puede incluir un módulo de análisis y codificación de predicción lineal (LP) 132, un módulo de transformación de coeficientes de predicción lineal (LPC) a pares espectrales de línea (LSP) 134 y un cuantizador 136. Los LSP también pueden denominarse LSF, y los dos términos (LSP y LSF) se pueden usar indistintamente en este documento. El módulo de análisis y codificación de LP 132 puede codificar una envolvente espectral de la señal de banda baja 122 como un conjunto de los LPC. Se pueden generar los LPC para cada trama de audio (por 15 ejemplo, 20 milisegundos (ms) de audio, correspondientes a 320 muestras a una frecuencia de muestreo de 16 kHz), para cada sub-trama de audio (por ejemplo, 5 ms de audio), o para cualquier combinación de las mismas. El número de los LPC generados para cada trama o sub-trama puede determinarse mediante el "orden" del análisis de LP realizado. En un modo de realización particular, el módulo de análisis y codificación de LP 132 puede generar un conjunto de once LPC correspondientes a un análisis de LP de décimo orden. 20
[0020] El módulo de transformación de LPC a LSP 134 puede transformar el conjunto de los LPC generados por el módulo de análisis y codificación de LP 132 en un conjunto correspondiente de los LSP (por ejemplo, usando transformación de uno en uno). Alternativamente, el conjunto de los LPC puede transformarse de uno en uno en un conjunto correspondiente de coeficientes de correlación parcial, valores de razón de logaritmo de área, pares 25 espectrales de impedancia de corriente alterna (ISP) o frecuencias espectrales de impedancia de corriente alterna (ISF). La transformación entre el conjunto de los LPC y el conjunto de los LSP puede ser reversible sin error.
[0021] El cuantizador 136 puede cuantizar el conjunto de los LSP generados por el módulo de transformación 134. Por ejemplo, el cuantizador 136 puede incluir o puede estar acoplado a varios libros de códigos que incluyen 30 múltiples entradas (por ejemplo, vectores). Para cuantizar el conjunto de los LSP, el cuantizador 136 puede identificar entradas de libros de códigos que estén "más cercanas a" (por ejemplo, basándose en una medida de distorsión tal como mínimos cuadrados o error cuadrático medio) el conjunto de los LSP. El cuantizador 136 puede emitir un valor de índice o una serie de valores de índice correspondientes a la ubicación de las entradas identificadas en el libro de códigos. La salida del cuantizador 136 puede por tanto representar parámetros de filtro de 35 banda baja que están incluidos en un flujo de bits de banda baja 142.
[0022] El módulo de análisis de banda baja 130 también puede generar una señal de excitación de banda baja 144. Por ejemplo, la señal de excitación de banda baja 144 puede ser una señal codificada que se genera cuantizando una señal residual de LP que se genera durante el proceso de LP realizado por el módulo de análisis de banda baja 40 130. La señal residual de LP puede representar un error de predicción.
[0023] El sistema 100 puede incluir además un módulo de análisis de banda alta 150 configurado para recibir la señal de banda alta 124 desde el banco de filtros de análisis 110 y la señal de excitación de banda baja 144 desde el módulo de análisis de banda baja 130. El módulo de análisis de banda alta 150 puede generar información 45 secundaria de banda alta 172 basada en la señal de banda alta 124 y en la señal de excitación de banda baja 144. Por ejemplo, la información secundaria de banda alta 172 puede incluir los LSP de banda alta, información de ganancia y factores de mezcla (), tal como se describe adicionalmente en este documento.
[0024] El módulo de análisis de banda alta 150 puede incluir un generador de excitación de banda alta 160. El 50 generador de excitación de banda alta 160 puede generar una señal de excitación de banda alta 161 extendiendo un espectro de la señal de excitación de banda baja 144 al rango de frecuencia de banda alta (por ejemplo, entre 7 kHz y 16 kHz). Para ilustrar, el generador de excitación de banda alta 160 puede aplicar una transformación (por ejemplo, una transformación no lineal tal como una operación de valor absoluto o cuadrado) a la señal de excitación de banda baja 144 y puede mezclar la señal armónicamente ampliada con una señal de ruido (por ejemplo, ruido 55 blanco modulado de acuerdo a una envolvente correspondiente a la señal de excitación de banda baja 144 que imita las características temporales de variación lenta de la señal de banda baja 122) para generar la señal de excitación de banda alta 161. Por ejemplo, la mezcla se puede realizar de acuerdo a la siguiente ecuación:
Excitación de banda alta = ( * armónicamente extendido) + 60
((1 - ) * ruido modulado)
[0025] La razón en la que la señal armónicamente extendida y el ruido modulado se mezclan puede afectar la calidad de reconstrucción de banda alta en un receptor. Para las señales de habla vocalizada, el mezclado puede estar sesgado hacia la armónicamente extendida (por ejemplo, el factor de mezcla  puede estar en el intervalo 65 entre 0,5 y 1,0). Para las señales no vocalizadas, la mezcla puede estar sesgada hacia el ruido modulado (por
ejemplo, el factor de mezcla  puede estar en el intervalo entre 0,0 y 0,5).
[0026] En algunas circunstancias, la señal armónicamente extendida puede ser inadecuada para su uso en la síntesis de banda alta, debido a correlación insuficiente entre la señal de banda alta 124 y una señal ruidosa de banda baja 122. Por ejemplo, la señal de banda baja 122 (y por tanto la señal armónicamente extendida) puede 5 incluir fluctuaciones frecuentes que pueden no ser imitadas en la señal de banda alta 124. Por lo general, el factor de mezcla  se puede determinar en base a los parámetros de vocalización de banda baja que imitan la intensidad de una trama particular asociada a un sonido vocalizado y una intensidad de la trama particular asociada a un sonido no vocalizado. Sin embargo, en presencia de ruido, determinar el factor de mezcla  de tal manera puede dar lugar a amplias fluctuaciones por subtrama. Por ejemplo, debido al ruido, el factor de mezcla  para cuatro 10 subtramas consecutivas puede ser 0,9; 0,25; 0,8 y 0,15, lo que da como resultado distorsiones de modulación o de zumbido. Además, puede estar presente una gran cantidad de distorsión de cuantización.
[0027] Por lo tanto, el generador de excitación de banda alta 160 puede incluir una calculadora de factores de mezcla 162 para estimar el factor de mezcla  como se ha descrito con respecto a las FIGs. 2 a 3. Por ejemplo, la 15 calculadora de factores de mezcla 162 puede generar un factor de mezcla () en función de las características de la señal de banda alta 124. Por ejemplo, un residuo de la señal de banda alta 124 puede usarse para estimar el factor de mezcla (). En una realización particular, la calculadora de factores de mezcla 162 puede generar un factor de mezcla () que reduce el error cuadrático medio de la diferencia entre el residuo de la señal de banda alta 124 y la señal de excitación de banda alta 161. El residuo de la señal de banda alta 124 puede generarse realizando un 20 análisis de predicción lineal en la señal de banda alta 124 (por ejemplo, codificando una envolvente espectral de la señal de banda alta 124) para generar un conjunto de los LPC. Por ejemplo, el módulo de análisis de banda alta 150 puede también incluir un análisis de LP y el módulo de codificación 152, un módulo de transformación de LPC a LSP 154 y un cuantizador 156. El módulo de análisis y codificación de LP 152 puede generar el conjunto de los LPC. El conjunto de los LPC puede ser transformado en los LSP por el módulo de transformación 154 y cuantizado por el 25 cuantizador 156 basándose en un libro de códigos 163.
[0028] La señal de excitación de banda alta 161 puede utilizarse para determinar uno o más parámetros de ganancia de banda alta que se incluyen en la información secundaria de banda alta 172. Cada uno entre el módulo de análisis y codificación de LP 152, el módulo de transformación 154 y el cuantizador 156 puede funcionar como se 30 ha descrito anteriormente con referencia a componentes correspondientes del módulo de análisis de banda baja 130, pero con una resolución comparativamente reducida (por ejemplo, utilizando menos bits para cada coeficiente, LSP, etc.). El módulo de análisis y codificación de LP 152 puede generar un conjunto de los LPC que se transforman en los LSP mediante el módulo de transformación 154 y se cuantizan mediante el cuantizador 156, basándose en un libro de códigos 163. Por ejemplo, el módulo de análisis y codificación de LP 152, el módulo de transformación 154 y 35 el cuantizador 156 pueden utilizar la señal de banda alta 124 para determinar la información de filtro de banda alta (por ejemplo, los LSP de banda alta) que está incluida en la información secundaria de banda alta 172. En un modo de realización particular, la información secundaria de banda alta 172 puede incluir los LSP de banda alta, los parámetros de ganancia de banda alta y los factores de mezcla ().
40
[0029] El flujo de bits de banda baja 142 y la información secundaria de banda alta 172 pueden ser multiplexados por un multiplexor (MUX) 180 para generar un flujo de bits de salida 192. El flujo de bits de salida 192 puede representar una señal de audio codificada que corresponde a la señal de audio de entrada 102. Por ejemplo, el flujo de bits de salida 192 puede transmitirse (por ejemplo, por un canal cableado, inalámbrico u óptico) y/o almacenarse. En un receptor, las operaciones inversas pueden ser realizadas por un demultiplexador (DEMUX), un decodificador 45 de banda baja, un decodificador de banda alta y un banco de filtros, para generar una señal de audio (por ejemplo, una versión reconstruida de la señal de audio de entrada 102 que se proporciona a un altavoz u otro dispositivo de salida). El número de bits utilizados para representar el flujo de bits de banda baja 142 puede ser esencialmente mayor que el número de bits utilizados para representar la información secundaria de banda alta 172. De este modo, la mayoría de los bits en el flujo de bits de salida 192 pueden representar datos de banda baja. La información 50 secundaria de banda alta 172 puede utilizarse en un receptor para regenerar la señal de excitación de banda alta a partir de los datos de banda baja, de acuerdo a un modelo de señal. Por ejemplo, el modelo de señal puede representar un conjunto esperado de relaciones o correlaciones entre datos de banda baja (por ejemplo, la señal de banda baja 122) y datos de banda alta (por ejemplo, la señal de banda alta 124). Por lo tanto, se pueden usar diferentes modelos de señales para diferentes tipos de datos de audio (por ejemplo, voz, música, etc.) y el modelo 55 de señal particular que está en uso puede ser negociado por un transmisor y un receptor (o definirse mediante una norma industrial) antes de la comunicación de datos de audio codificados. Usando el modelo de señal, el módulo de análisis de banda alta 150 en un transmisor puede ser capaz de generar la información secundaria de banda alta 172 de tal manera que un correspondiente módulo de análisis de banda alta en un receptor pueda usar el modelo de señal para reconstruir la señal de banda alta 124 a partir del flujo de bits de salida 192. 60
[0030] El cuantizador 156 puede ser configurado para cuantizar un conjunto de valores de frecuencia espectrales, tales como los LSP proporcionadas por el módulo de transformación 154. En otras realizaciones, el cuantizador 156 puede recibir y cuantizar conjuntos de otros uno o más tipos de valores de frecuencia espectral, además de, o en lugar de, los LSF o los LSP. Por ejemplo, el cuantizador 156 puede recibir y cuantizar un conjunto de los LPC 65
generados por el análisis de LP y el módulo de codificación 152. Otros ejemplos incluyen conjuntos de coeficientes de correlación parcial, valores de razón de logarítmo de área y las ISF que se pueden recibir y cuantizar en el cuantizador 156. El cuantizador 156 puede incluir un cuantizador vectorial que codifica un vector de entrada (por ejemplo, un conjunto de valores de frecuencia espectral en un formato vectorial) como un índice para una entrada correspondiente en una tabla o libro de códigos, tal como el libro de códigos 163. Como otro ejemplo, el cuantizador 5 156 puede configurarse para determinar uno o más parámetros a partir de los cuales el vector de entrada puede generarse dinámicamente en un decodificador, tal como en una realización de libro de código disperso, en lugar de ser recuperado desde el almacenamiento. Para ilustrar, se pueden aplicar ejemplos de libros de códigos dispersos en esquemas de codificación tales como CELP y códecs de acuerdo a normas industriales tales como el EVRC (Códec de Tasa Variable Mejorada) del 3GPP2 (Proyecto 2 de Colaboración de Tercera Generación). En otra 10 realización, el módulo de análisis de banda alta 150 puede incluir el cuantizador 156 y puede configurarse para usar un cierto número de vectores de libro de códigos para generar señales sintetizadas (por ejemplo, de acuerdo a un conjunto de parámetros de filtro) y seleccionar uno de los vectores de libro de códigos asociado a la señal sintetizada que mejor coincida con la señal de banda alta 124, tal como en un dominio ponderado perceptualmente.
15
[0031] El sistema 100 puede reducir las distorsiones que pudieran surgir debido a la sobre-estimación de los parámetros temporales y de ganancia. Por ejemplo, la calculadora de factores de mezcla 162 puede determinar el factor de mezcla () utilizando un análisis de bucle cerrado para mejorar la precisión de una estimación de banda alta durante la predicción de banda alta. Mejorar la precisión de la estimación de banda alta puede reducir las distorsiones en escenarios en los que el aumento del ruido reduce la correlación entre la banda baja y la banda alta. 20 El módulo de análisis de banda alta 150 puede predecir la banda alta usando características (por ejemplo, la señal residual de banda alta) de la banda alta y estimar un factor de mezcla () para producir una señal de excitación de banda alta 161 que modela la señal residual de banda alta. El módulo de análisis de banda alta 150 puede transmitir el factor de mezcla () al receptor junto con la otra información secundaria de banda alta 172, que puede permitir que el receptor realice operaciones inversas para reconstruir la señal de audio de entrada 102. 25
[0032] Con referencia a la FIG. 2, se muestra una realización ilustrativa particular de un sistema 200 que es operable para estimar un factor de mezcla para generar una señal de excitación de banda alta. El sistema 200 incluye un filtro de análisis de predicción lineal 204, un generador de transformación no lineal 207, una calculadora de factores de mezcla 212 y un mezclador 211. El sistema 200 puede implementarse utilizando el módulo de análisis de banda alta 30 150 de la FIG. 1. En una realización particular, la calculadora de factores de mezcla 212 puede corresponder a la calculadora de factores de mezcla 162 de la FIG. 1.
[0033] La señal de banda alta 124 puede proporcionarse al filtro de análisis de predicción lineal 204. El filtro de análisis de predicción lineal 204 puede configurarse para generar una señal residual de banda alta 224 basada en la 35 señal de banda alta 124 (por ejemplo, una parte de banda alta de la señal de audio de entrada 102). Por ejemplo, el filtro de análisis de predicción lineal 204 puede codificar una envolvente espectral de la señal de banda alta 124 como un conjunto de los LPC usados para predecir muestras futuras de la señal de banda alta 124. La señal residual de banda alta 224 se puede usar para predecir el error de la señal de excitación de banda alta 161. La señal residual de banda alta 224 puede proporcionarse a una primera entrada de la calculadora de factores de mezcla 40 212.
[0034] La señal de excitación de banda baja 144 puede proporcionarse al generador de transformación no lineal 207. Como se ha descrito con respecto a la FIG. 1, la señal de excitación de banda baja 144 puede generarse a partir de la señal de banda baja 122 (por ejemplo, la parte de banda baja de la señal de audio de entrada 102) 45 usando el módulo de análisis de banda baja 130. El generador de transformación no lineal 207 puede configurarse para generar una señal armónicamente extendida 208 basándose en la señal de excitación de banda baja 144. Por ejemplo, el generador de transformación no lineal 207 puede realizar una operación de valor absoluto o una operación de cuadrado en tramas de la señal de excitación de banda baja 144 para generar la señal armónicamente extendida 208. 50
[0035] Para ilustrar, el generador de excitación no lineal 207 puede aumentar el muestreo de la señal de excitación de banda baja 144 (por ejemplo, una señal de 8 kHz que va desde aproximadamente 0 kHz hasta 8 kHz) para generar una señal de 16 kHz que oscila desde aproximadamente 0 kHz hasta 16 kHz (por ejemplo, una señal que tiene aproximadamente el doble del ancho de banda de la señal de excitación de banda baja 144). Una parte de 55 banda baja de la señal de 16 kHz (por ejemplo, aproximadamente desde 0 kHz hasta 8 kHz) puede tener armónicos esencialmente similares a la señal de excitación de banda baja 144, y una parte de banda alta de la señal de 16 kHz (por ejemplo, aproximadamente desde 8 kHz hasta 16 kHz) puede estar esencialmente libre de armónicos. El generador de transformación no lineal 204 puede extender los armónicos "dominantes" en la parte de banda baja de la señal de 16 kHz a la parte de banda alta de la señal de 16 kHz para generar la señal armónicamente extendida 60 208. Por lo tanto, la señal extendida armónicamente 208 puede ser una versión armónicamente extendida de la señal de excitación de banda baja 144 que se extiende hacia la banda alta usando operaciones no lineales (por ejemplo, operaciones de cuadrado y / u operaciones de valor absoluto). La señal extendida armónicamente 208 puede proporcionarse a una entrada de un rastreador de envolvente 202, a una segunda entrada de la calculadora de factores de mezcla 212 y a una primera entrada de un primer combinador 254. 65
[0036] El rastreador de envolvente 202 puede estar configurado para recibir la señal armónicamente extendida 208 y para calcular un envolvente del dominio del tiempo de banda baja 203 correspondiente a la señal armónicamente extendida 208. Por ejemplo, el rastreador de envolventes 202 puede configurarse para calcular el cuadrado de cada muestra de una trama de la señal armónicamente extendida 208 para producir una secuencia de valores al cuadrado. El rastreador de envolventes 202 puede configurarse para realizar una operación de allanamiento en la 5 secuencia de valores al cuadrado, tal como mediante la aplicación de un filtro de paso bajo de respuesta de impulso infinito (IIR) de primer orden a la secuencia de valores al cuadrado. El rastreador de envolventes 202 puede configurarse para aplicar una función de raíz cuadrada a cada muestra de la secuencia allanada para producir la envolvente del dominio del tiempo de banda baja 203. La envolvente del dominio del tiempo de banda baja 203 puede proporcionarse a una primera entrada de un combinador de ruido 240. 10
[0037] El combinador de ruido 240 puede estar configurado para combinar el envolvente del dominio del tiempo de banda baja 203 con ruido blanco 205 generado por un generador de ruido blanco (no mostrado) para producir una señal de ruido modulada 220. Por ejemplo, el combinador de ruido 240 puede configurarse para modular en amplitud el ruido blanco 205 de acuerdo a la envolvente del dominio del tiempo de banda baja 203. En una realización 15 particular, el combinador de ruido 240 puede implementarse como un multiplicador que está configurado para ajustar a escala el ruido blanco 205 de acuerdo a la envolvente del dominio del tiempo de banda baja 203, para producir la señal de ruido modulado 220. La señal de ruido modulado 220 puede proporcionarse a una tercera entrada de la calculadora de mezcla 212 y a una primera entrada de un segundo combinador 256.
20
[0038] La calculadora de factores de mezcla 212 puede estar configurada para determinar un factor de mezcla () en base a la señal residual de banda alta 224, la señal extendida armónicamente 208 y la señal de ruido modulada 220. La calculadora de factores de mezcla 212 puede determinar el factor de mezcla (). Por ejemplo, la calculadora de factores de mezcla 212 puede determinar el factor de mezcla () basándose en un error cuadrático medio (E) de una diferencia entre la señal residual de banda alta 224 y la señal de excitación de banda alta 161. La señal de 25 excitación de banda alta 161 puede expresarse según la siguiente ecuación:
ŘHB =  * ŔLB + (1- ) * ŴMOD, (Ecuación 1)
donde ŘHB corresponde a la señal de excitación de banda alta 161,  corresponde al factor de mezcla, ŔLB 30 corresponde a la señal armónicamente extendida 208 y ŴMOD corresponde a la señal de ruido modulado 220. La señal residual de banda alta 224 puede expresarse como RHB.
[0039] Por lo tanto, el error (e) puede corresponder a la diferencia entre la señal residual de banda alta 224 y la señal de excitación de banda alta 161, y se puede expresar según la siguiente ecuación: 35
e = RHB - ŘHB · (Ecuación 2)
Sustituyendo la expresión para la señal de excitación de banda alta 161, descrita en la ecuación 1, en la ecuación 2, el error (e) puede expresarse como una diferencia entre la señal residual de banda alta 224 y la señal de excitación 40 de banda alta 161, y puede expresarse de acuerdo a la siguiente ecuación:
e = RHB – [ * ŔLB + (1 -  ) * ŴMOD]. (Ecuación 3)
Por lo tanto, el error cuadrático medio (E) de la diferencia entre la señal residual de banda alta 224 y la señal de 45 excitación de banda alta 161 se puede expresar de acuerdo a la siguiente ecuación:
E = (RHB – [* ŔLB + (1 - ) * ŴMOD])2. (Ecuación 4)
[0040] La señal de excitación de banda alta 161 se puede hacer aproximadamente igual a la señal residual de 50 banda alta 224 reduciendo el error cuadrático medio (E) (por ejemplo, fjando el error cuadrático medio (E) en cero). Al minimizar el error cuadrático medio (E) en la ecuación 4, el factor de mezcla () puede expresarse de acuerdo a la siguiente ecuación:
 = [(RHB - ŴMOD) * (ŔLB - ŴMOD)]/(ŔLB - ŴMOD)2. (Ecuación 5) 55
En una realización particular, las energías de la señal residual de banda alta 224 y la señal extendida armónicamente 208 se pueden normalizar antes de calcular el factor de mezcla () usando la Ecuación 5. El factor de mezcla () puede estimarse para cada trama (o sub-trama) y transmitirse al receptor con el flujo de bits de salida 192, junto con otra información secundaria de banda alta 172 (por ejemplo, los LSP de banda alta, así como 60 parámetros de ganancia de banda alta), como se ha descrito con respecto a la FIG. 1.
[0041] La calculadora de factores de mezcla 212 puede proporcionar el factor de mezcla estimado () a una segunda entrada del primer combinador 254 y a una entrada de un restador 252. El restador 252 puede restar el factor de mezcla () de uno y proporcionar la diferencia (1-) a una segunda entrada del segundo combinador 256. 65
El primer combinador 254 puede implementarse como un multiplicador que está configurado para ajustar a escala la señal extendida armónicamente 208, de acuerdo al factor de mezcla (), para generar una primera señal ajustada a escala. El segundo combinador 256 puede implementarse como un multiplicador que está configurado para ajustar a escala la señal de ruido modulada 220 en función del factor (1-), para generar una segunda señal ajustada a escala. Por ejemplo, el segundo combinador 256 puede ajustar a escala la señal de ruido modulada 220 basándose 5 en la diferencia (1-) generada en el restador 252. La primera señal ajustada a escala y la segunda señal ajustada a escala se pueden proporcionar al mezclador 211.
[0042] El mezclador 211 puede generar la señal de excitación de banda alta 161 basándose en el factor de mezcla (), la señal extendida armónicamente 208 y la señal de ruido modulado 220. Por ejemplo, el mezclador 211 puede 10 combinar (por ejemplo, agregar) la primera señal ajustada a escala y la segunda señal ajustada a escala para generar la señal de excitación de banda alta 161.
[0043] En una realización particular, la calculadora de factores de mezcla 212 puede estar configurado para generar los factores de mezcla () como factores de mezcla múltiples () para cada trama de la señal de audio. Por ejemplo, 15 cuatro factores de mezcla 1, 2, 3, 4 se pueden generar para una trama de una señal de audio, y cada factor de mezcla () puede corresponder a una sub-trama respectiva de la trama.
[0044] El sistema 200 de la FIG. 2 puede estimar el factor de mezcla () para mejorar la precisión de una estimación de banda alta durante la predicción de banda alta. Por ejemplo, la calculadora de factores de mezcla 212 puede 20 estimar un factor de mezcla () que produciría una señal de excitación de banda alta 161 que es aproximadamente equivalente a la señal residual de banda alta 224. Por lo tanto, en escenarios donde el ruido incrementado reduce una correlación entre la banda baja y la banda alta, el sistema 200 puede predecir la banda alta usando características (por ejemplo, la señal residual de banda alta 224) de la banda alta. Transmitir el factor de mezcla () al receptor, junto con la otra información secundaria de banda alta 172, puede permitir que el receptor realice 25 operaciones inversas para reconstruir la señal de audio de entrada 102.
[0045] Con referencia a la FIG. 3, se muestra otra realización ilustrativa particular de un sistema 300 que es operable para estimar un factor de mezcla () utilizando un análisis de bucle cerrado para generar una señal de excitación de banda alta. El sistema 300 incluye el rastreador de envolvente 202, el filtro de análisis de predicción 30 lineal 204, el generador de transformación no lineal 207 y el combinador de ruido 240.
[0046] La salida del combinador de ruido 240 en la FIG. 3 puede ser ajustada a escala en un factor de escala de ruido (β) usando un multiplicador Beta 304 para generar la señal de ruido modulado 220. El multiplicador Beta 304 es un factor de normalización de potencia entre el ruido blanco modulado y la extensión armónica de la excitación de 35 banda baja. La señal de ruido modulado 220 y la señal armónicamente extendida 208 pueden proporcionarse a un generador de excitación de banda alta 302. Por ejemplo, la señal extendida armónicamente 208 puede proporcionarse al primer combinador 254 y la señal de ruido modulado 220 puede proporcionarse al segundo combinador 220.
40
[0047] El sistema 300 puede incrementar y / o disminuir de forma selectiva los valores del factor de mezcla () para encontrar el factor de mezcla () que reduce (por ejemplo, minimiza) el error cuadrático medio (E) de la diferencia entre la señal residual de banda alta 224 y la señal de excitación de banda alta 161, como se ha descrito con respecto a la FIG. 2. Por ejemplo, el filtro de análisis de predicción lineal 204 puede proporcionar la señal residual de banda alta 224 a una primera entrada del circuito de detección de errores 306. El generador de excitación de banda 45 alta 302 puede proporcionar la señal de excitación de banda alta 161 a una segunda entrada del circuito de detección de errores 306. El circuito de detección de errores 306 puede determinar la diferencia (e) entre la señal residual de banda alta 224 y la señal de excitación de banda alta 161 de acuerdo a la ecuación 3. La diferencia puede estar representada por una señal de error 368. La señal de error 368 puede proporcionarse a una entrada de una calculadora de minimización de errores 308 (por ejemplo, un controlador de errores). 50
[0048] La calculadora de minimización de errores 308 puede calcular el error cuadrático medio (E), según la ecuación 4, para un valor particular del factor de mezcla (). La calculadora de minimización de errores 308 puede enviar una señal 370 al generador de excitación de banda alta 302 para incrementar o disminuir selectivamente el valor particular del factor de mezcla () para producir un error cuadrático medio (E) más pequeño. 55
[0049] Durante el funcionamiento, la calculadora de minimización de errores 308 puede calcular un primer error cuadrático medio (E1) basado en un primer factor de mezcla (1). En una realización particular, al calcular el primer error cuadrático medio (E1), la calculadora de minimización de errores 308 puede enviar una señal 370 al generador de excitación de banda alta 302 para incrementar el primer factor de mezcla (1) en una cantidad particular, para 60 generar un segundo factor de mezcla (2). La calculadora de minimización de errores 308 puede calcular un segundo error cuadrático medio (E2) basado en el segundo factor de mezcla (2), y puede enviar una señal 370 al generador de excitación de banda alta 302 para incrementar el segundo factor de mezcla (2) en la cantidad particular, para generar un tercer factor de mezcla (3). Este proceso puede repetirse para generar valores múltiples
del error cuadrático medio (E). La calculadora de minimización de errores 308 puede determinar qué valor del error cuadrático medio (E) es el valor más bajo, y el factor de mezcla () puede corresponder al valor particular que produce el valor más bajo para el error cuadrático medio (E).
[0050] En otra realización particular, al calcular el primer error cuadrático medio (E1), la calculadora de minimización 5 de errores 308 puede enviar una señal 370 al generador de excitación de banda alta 302 para decrementar el primer factor de mezcla (1) en una cantidad particular, para generar un segundo factor de mezcla (2). La calculadora de minimización de errores 308 puede calcular un segundo error cuadrático medio (E2) basado en el segundo factor de mezcla (2), y puede enviar una señal 370 al generador de excitación de banda alta 302 para decrementar el segundo factor de mezcla (2) en la cantidad particular, para generar un tercer factor de mezcla (3). Este proceso 10 puede repetirse para generar valores múltiples del error cuadrático medio (E). La calculadora de minimización de errores 308 puede determinar qué valor del error cuadrático medio (E) es el valor más bajo, y el factor de mezcla () puede corresponder al valor particular que produce el valor más bajo para el error cuadrático medio (E).
[0051] En una realización particular, múltiples factores de mezcla () se puede usar para cada trama de la señal de 15 audio. Por ejemplo, cuatro factores de mezcla 1, 2, 3, 4 se pueden generar para una trama de una señal de audio, y cada factor de mezcla () puede corresponder a una sub-trama respectiva de la trama. Los valores de los factores de mezcla () pueden incrementarse y / o reducirse para allanar de manera adaptativa los factores de mezcla () dentro de una sola trama o entre múltiples tramas, para reducir una ocurrencia y / o extensión de las fluctuaciones de los factores de mezcla de salida (). Para ilustrar, el primer valor del factor de mezcla (1) puede 20 corresponder a una primera sub-trama de una trama particular y al segundo valor del factor de mezcla (2) puede corresponder a una segunda sub-trama de la trama específica. Un tercer valor del factor de mezcla (3) puede basarse, al menos parcialmente, en el primer valor del factor de mezcla (1) y en el segundo valor del factor de mezcla (2).
25
[0052] El sistema 300 de la FIG. 3 puede determinar el factor de mezcla () utilizando un análisis de bucle cerrado para mejorar la precisión de una estimación de banda alta durante la predicción de banda alta. Por ejemplo, el circuito de detección de errores 306 y la calculadora de minimización de errores 308 pueden determinar el valor del factor de mezcla () que produciría un pequeño error cuadrático medio (E) (por ejemplo, producir una señal de excitación de banda alta 161 que imite estrechamente la señal residual de banda alta 224). Por lo tanto, en 30 escenarios donde el ruido aumentado reduce una correlación entre la banda baja y la banda alta, el sistema 300 puede predecir la banda alta usando características (por ejemplo, la señal residual de banda alta 224) de la banda alta. Transmitir el factor de mezcla () al receptor, junto con la otra información secundaria de banda alta 172, puede permitir que el receptor realice operaciones inversas para reconstruir la señal de audio de entrada 102.
35
[0053] Con referencia a la FIG. 4, se muestra una realización ilustrativa particular de un sistema 400 que es operable para reproducir una señal de audio usando un factor de mezcla (). El sistema 400 incluye un generador de transformación no lineal 407, un rastreador de envolvente 402, un combinador de ruido 440, un primer combinador 454, un segundo combinador 456, un restador 452 y un mezclador 411. En un modo de realización particular, el sistema 400 puede integrarse en un sistema o aparato de codificación (por ejemplo, en un teléfono inalámbrico o 40 CÓDEC). En otras realizaciones particulares, el sistema 400 puede integrarse en un decodificador, un reproductor de música, un reproductor de vídeo, una unidad de entretenimiento, un dispositivo de navegación, un dispositivo de comunicaciones, un PDA, una unidad de datos de ubicación fija o un ordenador.
[0054] El generador de transformación no lineal 407 puede estar configurado para recibir la señal de excitación de 45 banda baja 144 de la FIG. 1. Por ejemplo, la señal de excitación de banda baja 142 de la FIG. 1 puede incluir la señal de excitación de banda baja 144, y puede transmitirse al sistema 400 como el flujo de bits 192. El generador de transformación no lineal 407 puede configurarse para generar una segunda señal armónicamente extendida 408 basándose en la señal de excitación de banda baja 144. Por ejemplo, el generador de transformación no lineal 407 puede realizar una operación de valor absoluto o una operación de cuadrado en tramas de la señal de excitación de 50 banda baja 144 para generar la segunda señal armónicamente extendida 408. En una realización particular, el generador de transformación no lineal 407 puede funcionar de una manera esencialmente similar al generador de transformación no lineal 207 de la FIG. 2. La segunda señal extendida armónicamente 408 puede proporcionarse al rastreador de envolventes 402 y al primer combinador 454.
55
[0055] El rastreador de envolventes 402 puede estar configurado para recibir la segunda señal armónicamente extendida 408 y para calcular un segundo envolvente del domino del tiempo de banda baja 403, correspondiente a la segunda señal armónicamente extendida 408. Por ejemplo, el rastreador de envolventes 402 puede configurarse para calcular el cuadrado de cada muestra de una trama de la segunda señal armónicamente extendida 408, para producir una secuencia de valores al cuadrado. El rastreador de envolventes 402 puede configurarse para realizar 60 una operación de allanamiento en la secuencia de valores al cuadrado, tal como aplicando un filtro de paso bajo IIR de primer orden a la secuencia de valores al cuadrado. El rastreador de envolventes 402 puede configurarse para aplicar una función de raíz cuadrada a cada muestra de la secuencia allanada, para producir el segundo envolvente del dominio del tiempo de banda baja 403. En una realización particular, el rastreador de envolventes 402 puede funcionar de una manera esencialmente similar a la del rastreador de envolventes 202 de la FIG. 2. El segundo 65
envolvente del dominio del tiempo de banda baja 403 puede proporcionarse al combinador de ruido 440.
[0056] El combinador de ruido 440 puede estar configurado para combinar el segundo envolvente del dominio del tiempo de banda baja 403 con ruido blanco 405 generado por un generador de ruido blanco (no mostrado), para producir una segunda señal de ruido modulado 420. Por ejemplo, el combinador de ruido 440 puede configurarse 5 para modular en amplitud el ruido blanco 405 de acuerdo al segundo envolvente del dominio del tiempo de banda baja 403. En una realización particular, el combinador de ruido 440 puede implementarse como un multiplicador que está configurado para ajustar a escala la salida del ruido blanco 405 de acuerdo al segundo envolvente del dominio del tiempo de banda baja 403, para producir la segunda señal de ruido modulado 420. En una realización particular, el combinador de ruido 440 puede funcionar de manera esencialmente similar al combinador de ruido 240 de la FIG. 10 2. La segunda señal de ruido modulado 420 puede proporcionarse al segundo combinador 456.
[0057] El factor de mezcla () de la FIG. 2 puede proporcionarse al primer combinador 454 y al restador 452. Por ejemplo, la información secundaria de banda alta 172 de la FIG. 1 puede incluir el factor de mezcla () y puede transmitirse al sistema 400. El restador 452 puede restar el factor de mezcla () a uno y proporcionar la diferencia (1 15 -) al segundo combinador 256. El primer combinador 454 puede implementarse como un multiplicador que está configurado para ajustar a escala la segunda señal armónicamente extendida 408, de acuerdo al factor de mezcla (), para generar una primera señal ajustada a escala. El segundo combinador 454 puede implementarse como un multiplicador que está configurado para ajustar a escala la señal de ruido modulado 420 en función del factor (1 -), para generar una segunda señal ajustada a escala. Por ejemplo, el segundo combinador 454 puede ajustar a escala 20 la señal de ruido modulado 420 basándose en la diferencia (1 -) generada en el restador 452. La primera señal ajustada a escala y la segunda señal ajustada a escala se pueden proporcionar al mezclador 411.
[0058] El mezclador 411 puede generar una segunda señal de excitación de banda alta 461 basada en el factor de mezcla (), la segunda señal extendida armónicamente 408 y la segunda señal de ruido modulado 420. Por ejemplo, 25 el mezclador 411 puede combinar (por ejemplo, agregar) la primera señal ajustada a escala y la segunda señal ajustada a escala para generar la segunda señal de excitación de banda alta 461.
[0059] El sistema 400 de la FIG. 4 puede reproducir la señal de banda alta 124 de la FIG. 1 usando la segunda señal de excitación de banda alta 461. Por ejemplo, el sistema 400 puede producir una segunda señal de excitación 30 de banda alta 461 que es esencialmente similar a la señal de excitación de banda alta 161 de las FIGs. 1 a 2, recibiendo el factor de mezcla () mediante la información secundaria de banda alta 172. La segunda señal de excitación de banda alta 461 puede someterse a una operación de síntesis de coeficientes de predicción lineal para generar una señal de banda alta que es esencialmente similar a la señal de banda alta 124.
35
[0060] Con referencia a la FIG. 5, se muestran diagramas de flujo para ilustrar realizaciones particulares de los procedimientos 500, 510, para reproducir una señal de banda alta usando un factor de mezcla (). El primer procedimiento 500 puede ser realizado por los sistemas 100 a 300 de la FIG. 3. El segundo procedimiento 510 puede ser realizado por el sistema 400 de la FIG. 4.
40
[0061] El primer procedimiento 500 puede incluir generar una señal residual de banda alta basándose en una parte de banda alta de una señal de audio, en 502. Por ejemplo, en la FIG. 2, el filtro de análisis de predicción lineal 204 puede generar la señal residual de banda alta 224 basándose en la señal de banda alta 124 (por ejemplo, una parte de banda alta de la señal de audio de entrada 102). En una realización particular, el filtro de análisis de predicción lineal 204 puede codificar el envolvente espectral de la señal de banda alta 124 como un conjunto de los LPC 45 usados para predecir futuras muestras de la señal de banda alta 124. La señal residual de banda alta 224 se puede usar para predecir el error de la señal de excitación de banda alta 161.
[0062] Una señal armónicamente extendida se puede generar, al menos, basándose en una parte de banda baja de la señal de audio, en 504. Por ejemplo, la señal de excitación de banda baja 144 de la FIG. 1 puede generarse a 50 partir de la señal de banda baja 122 (por ejemplo, la parte de banda baja de la señal de audio de entrada 102) usando el módulo de análisis de banda baja 130. El generador de transformación no lineal 207 de la FIG. 2 puede realizar una operación de valor absoluto o una operación de cuadrado en la señal de excitación de banda baja 144 para generar la señal armónicamente extendida 208.
55
[0063] Un factor de mezcla puede ser determinado basándose en la señal residual de banda alta, la señal armónicamente extendida y el ruido modulado, en 506. Por ejemplo, la calculadora de factores de mezcla 212 de la FIG. 2 puede determinar el factor de mezcla () basándose en un error cuadrático medio (E) de una diferencia entre la señal residual de banda alta 224 y la señal de excitación de banda alta 161. Usando el análisis de bucle cerrado, la señal de excitación de banda alta 161 puede ser aproximadamente igual a la señal residual de banda alta 224, 60 para minimizar efectivamente el error cuadrático medio (E) (por ejemplo, establecer el error cuadrático medio (E) en cero). Como se ha explicado con respecto a la FIG. 2, el factor de mezcla () puede expresarse como:
 = [(RHB - ŴMOD) * (ŔLB - ŴMOD)]/(ŔLB - ŴMOD)2. (Ecuación 5)
65
El factor de mezcla () puede transmitirse a un decodificador de voz. Por ejemplo, la información secundaria de banda alta 172 de la FIG. 1 puede incluir el factor de mezcla ().
[0064] El segundo procedimiento 510 puede incluir recibir, en un decodificador de voz, una señal codificada que incluye la señal de excitación de banda baja y la información secundaria de banda alta, en 512. Por ejemplo, el 5 estimador de transformación no lineal 407 de la FIG. 4 puede recibir la señal de excitación de banda baja 144 de la FIG. 1. El flujo de bits de banda baja 142 de la FIG. 1 puede incluir la señal de excitación de banda baja 144, y puede transmitirse al sistema 400 como el flujo de bits 192. El primer combinador 454 y el restador 452 pueden recibir la información secundaria de banda alta 172. La información secundaria de banda alta 172 puede incluir el factor de mezcla () determinado sobre la base de la señal residual de banda alta 224, la señal extendida 10 armónicamente 208 y la señal de ruido modulado 220.
[0065] La señal de excitación de banda alta puede ser generada basándose en la información secundaria de banda alta y en la señal de excitación de banda baja, en 514. Por ejemplo, el mezclador 411 de la FIG. 4 puede generar la segunda señal de excitación de banda alta 461 basándose en el factor de mezcla (), la segunda señal extendida 15 armónicamente 408 y la señal de ruido modulado 420.
[0066] Los procedimientos 500, 510 de la FIG. 5 pueden estimar el factor de mezcla () (por ejemplo, utilizando un análisis de circuito cerrado) para mejorar la precisión de una estimación de banda alta durante la predicción de banda alta y pueden usar el factor de mezcla () para reconstruir la señal de banda alta 124. Por ejemplo, la 20 calculadora de factores de mezcla 212 puede estimar un factor de mezcla () que produciría una señal de excitación de banda alta 161 que es aproximadamente equivalente a la señal residual de banda alta 224. Por lo tanto, en escenarios donde el ruido aumentado reduce una correlación entre la banda baja y la banda alta, el procedimiento 500 puede predecir la banda alta usando características (por ejemplo, la señal residual de banda alta 224) de la banda alta. Transmitir el factor de mezcla () al receptor, junto con la otra información secundaria de banda alta 172, 25 puede permitir que el receptor realice operaciones inversas para reconstruir la señal de audio de entrada 102. Por ejemplo, puede producirse la segunda señal de excitación de banda alta 461, que es esencialmente similar a la señal de excitación de banda alta 161 de las FIGs. 1 a 2. La segunda señal de excitación de banda alta 461 puede experimentar una operación de síntesis de coeficientes de predicción lineal para generar una señal de banda alta sintetizada que es esencialmente similar a la señal de banda alta 124. 30
[0067] En realizaciones particulares, los procedimientos 500, 510 de la FIG. 5 pueden implementarse mediante hardware (por ejemplo, un dispositivo de FPGA, un ASIC, etc.) de una unidad de procesamiento, tal como una unidad de procesamiento central (CPU), un DSP o un controlador, mediante un dispositivo de firmware o cualquier combinación de los mismos. Como ejemplo, el procedimiento 500, 510 de la FIG. 5 puede ser realizado por un 35 procesador que ejecuta instrucciones, como se ha descrito con respecto a la FIG. 6.
[0068] Con referencia a la FIG. 6, se representa un diagrama de bloques de un modo de realización particular ilustrativo de un dispositivo de comunicación inalámbrica y se designa en general con 600. El dispositivo 600 incluye un procesador 610 (por ejemplo, una unidad central de procesamiento (CPU)), acoplado a una memoria 632. La 40 memoria 632 puede incluir instrucciones 660 ejecutables por el procesador 610 y / o un CÓDEC 634, para realizar los procedimientos y procesos divulgados en el presente documento, tales como los procedimientos 500, 510 de la FIG. 5.
[0069] En una realización particular, el CÓDEC 634 puede incluir un sistema de estimación de factores de mezcla 45 682 y un sistema de decodificación 684 de acuerdo a un factor de mezcla estimado. En una realización particular, el sistema de estimación de factores de mezclado 682 incluye uno o más componentes de la calculadora de factores de mezclado 162 de la FIG. 1, uno o más componentes del sistema 200 de la FIG. 2 y/o uno o más componentes del sistema 300 de la FIG. 3. Por ejemplo, el sistema de estimación de factores de mezcla 682 puede realizar operaciones de codificación asociadas al sistema 100 a 300 de las FIGs. 1 a 3 y al procedimiento 500 de la FIG. 5. 50 En una realización particular, el sistema de decodificación 684 puede incluir uno o más componentes del sistema 400 de la FIG. 4. Por ejemplo, el sistema de decodificación 684 puede realizar operaciones de decodificación asociadas al sistema 400 de la FIG. 4 y al procedimiento 510 de la FIG. 5. El sistema de estimación de factores de mezcla 682 y / o el sistema de decodificación 684 pueden implementarse mediante hardware dedicado (por ejemplo, circuitos), mediante un procesador que ejecuta instrucciones para realizar una o más tareas, o una combinación de 55 los mismos.
[0070] A modo de ejemplo, la memoria 632 o una memoria 690 en el CÓDEC 634 puede ser un dispositivo de memoria, tal como una memoria de acceso aleatorio (RAM), una memoria de acceso aleatorio magneto-resistiva (MRAM), una MRAM de transferencia de par de giro (STT-MRAM), una memoria flash, una memoria de solo lectura 60 (ROM), una memoria de solo lectura programable (PROM), una memoria de solo lectura programable y borrable (EPROM), una memoria de lectura programable y borrable eléctricamente (EEPROM), registros, un disco duro, un disco extraíble o una memoria de solo lectura de disco compacto (CD-ROM). El dispositivo de memoria puede incluir instrucciones (por ejemplo, las instrucciones 660 o las instrucciones 695) que, cuando son ejecutadas por un ordenador (por ejemplo, un procesador en el CÓDEC 634 y / o el procesador 610), pueden hacer que el ordenador 65
realice al menos un parte de uno de los procedimientos 500, 510 de la FIG. 5. Como ejemplo, la memoria 632 o la memoria 690 en el CÓDEC 634 puede ser un medio no transitorio legible por ordenador que incluye instrucciones (por ejemplo, las instrucciones 660 o las instrucciones 695, respectivamente) que, cuando son ejecutadas por un ordenador (por ejemplo, un procesador en el CÓDEC 634 y/o el procesador 610), hacen que el ordenador ejecute al menos una parte de uno de los procedimientos 500, 510 de la FIG. 5. 5
[0071] El dispositivo 600 también puede incluir un DSP 696 acoplado al CÓDEC 634 y al procesador 610. En una realización particular, el DSP 696 puede incluir un sistema de estimación de factores de mezcla 697 y un sistema de decodificación 698 de acuerdo a un factor de mezcla estimado. En una realización particular, el sistema de estimación de factores de mezcla 697 incluye uno o más componentes de la calculadora de factores de mezcla 162 10 de la FIG. 1, uno o más componentes del sistema 200 de la FIG. 2 y/o uno o más componentes del sistema 300 de la FIG. 3. Por ejemplo, el sistema de estimación de factores de mezcla 697 puede realizar operaciones de codificación asociadas al sistema 100 a 300 de las FIGs. 1 a 3 y al procedimiento 500 de la FIG. 5. En una realización particular, el sistema de decodificación 698 puede incluir uno o más componentes del sistema 400 de la FIG. 4. Por ejemplo, el sistema de decodificación 698 puede realizar operaciones de decodificación asociadas al 15 sistema 400 de la FIG. 4 y al procedimiento 510 de la FIG. 5. El sistema de estimación de factores de mezcla 697 y / o el sistema de decodificación 698 pueden implementarse mediante hardware dedicado (por ejemplo, circuitos), mediante un procesador que ejecuta instrucciones para realizar una o más tareas, o una combinación de los mismos.
20
[0072] La FIG. 6 también muestra un controlador de pantalla 626 que está acoplado al procesador 610 y a una pantalla 628. El CÓDEC 634 puede estar acoplado al conector 610, tal como se muestra. Un altavoz 636 y un micrófono 638 se pueden acoplar al CÓDEC 634. Por ejemplo, el micrófono 638 puede generar la señal de audio de entrada 102 de la FIG. 1, y el CÓDEC 634 puede generar el flujo de bits de salida 192 para su transmisión a un receptor, basándose en la señal de audio de entrada 102. Como otro ejemplo, el altavoz 636 puede usarse para 25 emitir una señal reconstruida por el CÓDEC 634 a partir del flujo de bits de salida 192 de la FIG. 1, donde el flujo de bits de salida 192 se recibe desde un transmisor. La FIG. 6 también indica que un controlador inalámbrico 640 se puede acoplar al procesador 610 y a una antena inalámbrica 642.
[0073] En un modo de realización particular, el procesador 610, el controlador de pantalla 626, la memoria 632, el 30 CÓDEC 634 y el controlador inalámbrico 640 están incluidos en un dispositivo de sistema en un paquete, o sistema en un chip (por ejemplo, un módem de estación móvil (MSM)) 622. En un modo de realización particular, un dispositivo de entrada 630, tal como una pantalla táctil y/o un panel de teclas, y una fuente de alimentación 644, están acoplados al dispositivo de sistema en un chip 622. Además, en un modo de realización particular, como se ilustra en la FIG. 6, la pantalla 628, el dispositivo de entrada 630, el altavoz 636, el micrófono 638, la antena 35 inalámbrica 642 y la fuente de alimentación 644 son externos al dispositivo de sistema en un chip 622. Sin embargo, cada uno entre la pantalla 628, el dispositivo de entrada 630, el altavoz 636, el micrófono 638, la antena inalámbrica 642 y la fuente de alimentación 644 se puede acoplar a un componente del dispositivo de sistema en un chip 622, tal como una interfaz o un controlador.
40
[0074] Conjuntamente con las realizaciones descritas, se divulga un primer aparato que incluye medios para generar una señal residual de banda alta basándose en una parte de banda alta de una señal de audio. Por ejemplo, los medios para generar la señal residual de banda alta pueden incluir el banco de filtros de análisis 110 de la FIG. 1, el módulo de análisis y codificación de LP 152 de la FIG. 1, el filtro de análisis de predicción lineal 204 de las FIGs. 2 a 3, el sistema de estimación de factores de mezcla 682 de la FIG. 6, el CÓDEC 634 de la FIG. 6, el sistema de 45 estimación de factores de mezcla 697 de la FIG. 6, el DSP 696 de la FIG. 6, uno o más dispositivos, tales como un filtro, configurados para generar la señal residual de banda alta (por ejemplo, un procesador que ejecuta instrucciones en un medio de almacenamiento no transitorio legible por ordenador), o cualquier combinación de los mismos.
50
[0075] El primer aparato puede incluir también medios para generar una señal armónicamente extendida basándose, al menos parcialmente, en una parte de banda baja de la señal de audio. Por ejemplo, los medios para generar la señal armónicamente extendida pueden incluir el banco de filtros de análisis 110 de la FIG. 1, el filtro de análisis de banda baja 130 de la FIG. 1 o un componente de los mismos, el generador de transformación no lineal 207 de las FIGs. 2 a 3, el sistema de estimación de factores de mezcla 682 de la FIG. 6, el sistema de estimación de 55 factores de mezcla 697 de la FIG. 6, el DSP 696 de la FIG. 6, uno o más dispositivos configurados para generar la señal armónicamente extendida (por ejemplo, un procesador que ejecuta instrucciones en un medio de almacenamiento no transitorio legible por ordenador), o cualquier combinación de los mismos.
[0076] El primer aparato también incluye medios para determinar un factor de mezcla basándose en la señal 60 residual de banda alta, la señal armónicamente extendida y el ruido modulado. Por ejemplo, los medios para determinar el factor de mezcla pueden incluir el generador de excitación de banda alta 160 de la FIG. 1, la calculadora de factores de mezcla 162 de la FIG. 1, la calculadora de factores de mezcla 212 de la FIG. 2, el circuito de detección de errores 306 de la FIG. 3, la calculadora de minimización de errores 308 de la FIG. 3, el generador de excitación de banda alta 302 de la FIG. 3, el sistema de estimación de factores de mezcla 682 de la FIG. 6, el 65 CÓDEC 634 de la FIG. 6, el sistema de estimación de factores de mezcla 697 de la FIG. 6, el DSP 696 de la FIG. 6,
uno o más dispositivos configurados para determinar el factor de mezcla (por ejemplo, un procesador que ejecuta instrucciones en un medio de almacenamiento no transitorio legible por ordenador), o cualquier combinación de los mismos.
[0077] Conjuntamente con las realizaciones descritas, un segundo aparato incluye medios para recibir una señal 5 codificada que incluye una señal de excitación de banda baja e información secundaria de banda alta. La información secundaria de banda alta incluye un factor de mezcla determinado basándose en una señal residual de banda alta, una señal armónicamente extendida y ruido modulado. Por ejemplo, los medios para recibir la señal codificada pueden incluir el generador de transformación no lineal 407 de la FIG. 4, el primer combinador 454 de la FIG. 4, el restador 452 de la FIG. 4, el CÓDEC 634 de la FIG. 6, el sistema de decodificación 684 de la FIG. 6, el 10 sistema de decodificación 698 de la FIG. 6, el DSP 696 de la FIG. 6, uno o más dispositivos configurados para recibir la señal codificada (por ejemplo, un procesador que ejecuta instrucciones en un medio de almacenamiento no transitorio legible por ordenador), o cualquier combinación de los mismos.
[0078] El segundo aparato puede incluir también medios para generar una señal de excitación de banda alta 15 basándose en la información secundaria de banda alta y la señal de excitación de banda baja. Por ejemplo, los medios para generar la señal de excitación de banda alta pueden incluir el generador de transformación no lineal 407 de la FIG. 4, el rastreador de envolventes 402 de la FIG. 4, el combinador de ruidos 440 de la FIG. 4, el primer combinador 454 de la FIG. 4, el segundo combinador 456 de la FIG. 4, el restador 452 de la FIG. 4, el mezclador 411 de la FIG. 4, el CÓDEC 634 de la FIG. 6, el sistema de decodificación 684 de la FIG. 6, el sistema de 20 decodificación 698 de la FIG. 6, el DSP 696 de la FIG. 6, uno o más dispositivos configurados para generar la señal de excitación de banda alta (por ejemplo, un procesador que ejecuta instrucciones en un medio de almacenamiento no transitorio legible por ordenador), o cualquier combinación de los mismos.
[0079] Los expertos en la técnica apreciarán además que los diversos bloques lógicos, configuraciones, módulos, 25 circuitos y pasos de algoritmo ilustrativos descritos en relación con los modos de realización divulgados en el presente documento pueden implementarse como hardware electrónico, software informático ejecutado por un dispositivo de procesamiento tal como un procesador de hardware, o combinaciones de ambos. Diversos componentes, bloques, configuraciones, módulos, circuitos y etapas ilustrativos se han descrito anteriormente, en general, en lo que respecta a su funcionalidad. Si dicha funcionalidad se implementa como hardware o software 30 ejecutable depende de la aplicación específica y de las restricciones de diseño impuestas al sistema global. Los expertos en la técnica pueden implementar la funcionalidad descrita de varias maneras para cada aplicación particular, pero no se debería interpretar que dichas decisiones de implementación suponen apartarse del alcance de la presente divulgación.
35
[0080] Las etapas de un procedimiento o algoritmo descritos en relación con los modos de realización divulgados en el presente documento pueden realizarse directamente en hardware, en un módulo de software ejecutado por un procesador o en una combinación de los dos. Un módulo de software puede residir en un dispositivo de memoria, tal como una memoria de acceso aleatorio (RAM), una memoria de acceso aleatorio magneto-resistiva (MRAM), una MRAM de transferencia de par de giro (STT-MRAM), una memoria flash, una memoria de solo lectura (ROM), una 40 memoria de solo lectura programable (PROM), una memoria de solo lectura programable y borrable (EPROM), una memoria de lectura programable y borrable eléctricamente (EEPROM), registros, un disco duro, un disco extraíble o una memoria de solo lectura de disco compacto (CD-ROM). Un dispositivo de memoria ejemplar está acoplado al procesador de tal manera que el procesador pueda leer información de, y escribir información en, el dispositivo de memoria. De forma alternativa, el dispositivo de memoria puede estar integrado en el procesador. El procesador y el 45 medio de almacenamiento pueden residir en un ASIC. El ASIC puede residir en un dispositivo informático o en un terminal de usuario. De forma alternativa, el procesador y el medio de almacenamiento pueden residir como componentes discretos en un dispositivo informático o un terminal de usuario.
[0081] La anterior descripción de los modos de realización divulgados se proporciona para permitir que cualquier 50 experto en la técnica realice o use los modos de realización divulgados. Diversas modificaciones de estos modos de realización resultarán inmediatamente evidentes para los expertos en la técnica, y los principios definidos en el presente documento se pueden aplicar a otros modos de realización sin apartarse del alcance de la divulgación. Por lo tanto, la presente divulgación no pretende limitarse a los modos de realización mostrados en el presente documento, sino que se le ha de conceder el alcance más amplio posible compatible con los principios y 55 características novedosas, según lo definido en las reivindicaciones siguientes.

Claims (13)

  1. REIVINDICACIONES
    1. Un procedimiento (500) que comprende:
    generar (502), en un codificador de voz, una señal residual de banda alta (224) basada en una parte de 5 banda alta (124) de una señal de audio;
    generar (504) una señal armónicamente extendida (208) basándose, al menos parcialmente, en una parte de banda baja de la señal de audio (144);
    10
    determinar (506) un factor de mezcla basado en la señal residual de banda alta, la señal armónicamente extendida y el ruido modulado (220), en donde el ruido modulado se basa, al menos parcialmente, en la señal armónicamente extendida (208) y en el ruido blanco (205); y
    generar una señal de excitación de banda alta (161) basada en combinar una primera señal 15 correspondiente a la señal extendida armónicamente (208), ajustada a escala basándose en el factor de mezcla, y una segunda señal correspondiente al ruido modulado (220), ajustada a escala basándose en el factor de mezcla.
  2. 2. El procedimiento de la reivindicación 1, en el que el factor de mezcla se ajusta usando un análisis de bucle 20 cerrado, en el que el ajuste del factor de mezcla, usando el análisis de bucle cerrado, comprende:
    comparar la señal residual de banda alta con una señal de excitación de banda alta;
    generar una señal de error basada en la comparación; y 25
    ajustar el factor de mezcla basándose en la señal de error.
  3. 3. El procedimiento de la reivindicación 1, en el que el factor de mezcla se ajusta basándose en un error cuadrático medio de una diferencia entre la señal residual de banda alta y la señal de excitación de banda 30 alta.
  4. 4. El procedimiento de la reivindicación 3, en el que el factor de mezcla se ajusta adicionalmente basándose en la vocalización de banda baja, la inclinación de banda baja o cualquier combinación de los mismos.
    35
  5. 5. El procedimiento de la reivindicación 3, que comprende además:
    aumentar o disminuir selectivamente un primer factor de mezcla para generar un segundo factor de mezcla; y
    40
    en el que el factor de mezcla corresponde al primer factor de mezcla en respuesta a una determinación de que el error cuadrático medio basado en el primer factor de mezcla es menor que el error cuadrático medio basado en el segundo factor de mezcla, y
    en el que el factor de mezcla corresponde al segundo factor de mezcla en respuesta a una determinación 45 de que el error cuadrático medio basado en el segundo factor de mezcla es menor que el error cuadrático medio basado en el primer factor de mezcla.
  6. 6. El procedimiento de la reivindicación 1, que comprende además transmitir el factor de mezcla a un receptor como parte de un flujo de bits. 50
  7. 7. Un aparato que comprende:
    un filtro de análisis de predicción lineal (204) para generar una señal residual de banda alta (224) basada en una parte de banda alta (124) de una señal de audio; 55
    un generador de transformación no lineal (207) para generar una señal armónicamente extendida (208) basándose, al menos parcialmente, en una parte de banda baja de la señal de audio (144);
    una calculadora de factores de mezcla (212) para determinar un factor de mezcla basado en la señal 60 residual de banda alta, la señal armónicamente extendida y el ruido modulado (220), en donde el ruido modulado se basa, al menos parcialmente, en la señal armónicamente extendida (208) y en el ruido blanco (205); y
    un generador de excitación de banda alta (302) para generar una señal de excitación de banda alta (161), 65 incluyendo el generador de excitación de banda alta un mezclador (211) para combinar una primera
    señal, correspondiente a la señal amplificada armónicamente ajustada a escala, basándose en el factor de mezcla, y una segunda señal correspondiente al ruido modulado a ajustado a escala, basándose en el factor de mezcla.
  8. 8. El aparato de la reivindicación 7, en el que el factor de mezcla se ajusta usando un análisis de bucle cerrado 5 y el aparato comprende además un circuito de detección de errores (306) y una calculadora de minimización de errores (308) para ajustar el factor de mezcla usando el análisis de bucle cerrado;
    en el que el circuito de detección de errores está configurado para comparar la señal residual de banda alta (224) con una señal de excitación de banda alta (161); y 10
    en el que la calculadora de minimización de errores está configurada para:
    generar una señal de error basada en la comparación; y
    15
    ajustar el factor de mezcla basándose en la señal de error.
  9. 9. El aparato de la reivindicación de la reivindicación 7, en el que el factor de mezcla se ajusta basándose en un error cuadrático medio de una diferencia entre la señal residual de banda alta y la señal de excitación de banda alta, y el aparato comprende además un controlador de errores configurado para: 20
    aumentar o disminuir selectivamente un primer factor de mezcla para generar un segundo factor de mezcla; y
    en el que el factor de mezcla corresponde al primer factor de mezcla en respuesta a una determinación de 25 que el error cuadrático medio basado en el primer factor de mezcla es menor que el error cuadrático medio basado en el segundo factor de mezcla, y
    en el que el factor de mezcla corresponde al segundo factor de mezcla en respuesta a una determinación de que el error cuadrático medio basado en el segundo factor de mezcla es menor que el error cuadrático 30 medio basado en el primer factor de mezcla.
  10. 10. El aparato de la reivindicación 7, que comprende además un transmisor para transmitir el factor de mezcla a un receptor como parte de un flujo de bits.
    35
  11. 11. Un procedimiento (510) que comprende:
    recibir (512), en un decodificador de voz, una señal codificada que incluye una señal de excitación de banda baja e información secundaria de banda alta, en el que la información secundaria de banda alta incluye un factor de mezcla, y en el que el factor de mezcla se basa en una señal residual de banda alta, 40 una primera señal extendida armónicamente y un primer ruido modulado; y
    generar (514) una señal de excitación de banda alta mezclando una primera señal correspondiente a una segunda señal armónicamente extendida y una segunda señal correspondiente a un segundo ruido modulado, en el que la segunda señal armónicamente extendida se ajusta a escala basándose en el 45 factor de mezcla, y en el que el segundo ruido modulado se ajusta a escala basándose en el factor de mezcla.
  12. 12. Un aparato que comprende un decodificador de voz configurado para:
    50
    recibir una señal codificada que incluye una señal de excitación de banda baja e información secundaria de banda alta,
    en el que la información secundaria de banda alta incluye un factor de mezcla, y
    en el que el factor de mezcla se basa en una señal residual de banda alta, una primera señal amplificada armónicamente y un primer ruido modulado; y 55
    generar una señal de excitación de banda alta mezclando una primera señal correspondiente a una segunda señal armónicamente extendida y una segunda señal correspondiente al segundo ruido modulado, en donde la segunda señal armónicamente extendida se ajusta a escala basándose en el factor de mezcla, y en el que el segundo ruido modulado se ajusta a escala basándose en el factor de 60 mezcla.
  13. 13. Un medio no transitorio legible por ordenador que comprende instrucciones que, cuando son ejecutadas por un procesador en un decodificador de voz, hacen que el procesador lleve a cabo un procedimiento de acuerdo a cualquiera de las reivindicaciones 1 a 6 y 11. 65
ES14786583.6T 2013-10-11 2014-10-09 Estimación de factores de mezcla para generar una señal de excitación de banda alta Active ES2660605T3 (es)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201361889727P 2013-10-11 2013-10-11
US201361889727P 2013-10-11
US14/509,676 US10083708B2 (en) 2013-10-11 2014-10-08 Estimation of mixing factors to generate high-band excitation signal
US201414509676 2014-10-08
PCT/US2014/059901 WO2015054492A1 (en) 2013-10-11 2014-10-09 Estimation of mixing factors to generate high-band excitation signal

Publications (1)

Publication Number Publication Date
ES2660605T3 true ES2660605T3 (es) 2018-03-23

Family

ID=52810390

Family Applications (1)

Application Number Title Priority Date Filing Date
ES14786583.6T Active ES2660605T3 (es) 2013-10-11 2014-10-09 Estimación de factores de mezcla para generar una señal de excitación de banda alta

Country Status (21)

Country Link
US (2) US10083708B2 (es)
EP (1) EP3055861B1 (es)
JP (1) JP6469664B2 (es)
KR (1) KR101941755B1 (es)
CN (2) CN105612578B (es)
AU (2) AU2014331890B2 (es)
CA (1) CA2925573C (es)
CL (1) CL2016000818A1 (es)
DK (1) DK3055861T3 (es)
ES (1) ES2660605T3 (es)
HK (1) HK1220033A1 (es)
HU (1) HUE036838T2 (es)
MX (1) MX354886B (es)
MY (1) MY182788A (es)
NZ (1) NZ717750A (es)
PH (1) PH12016500506A1 (es)
RU (1) RU2672179C2 (es)
SA (1) SA516370877B1 (es)
SG (1) SG11201601790QA (es)
SI (1) SI3055861T1 (es)
WO (1) WO2015054492A1 (es)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR3011408A1 (fr) * 2013-09-30 2015-04-03 Orange Re-echantillonnage d'un signal audio pour un codage/decodage a bas retard
US10083708B2 (en) 2013-10-11 2018-09-25 Qualcomm Incorporated Estimation of mixing factors to generate high-band excitation signal
US10163447B2 (en) * 2013-12-16 2018-12-25 Qualcomm Incorporated High-band signal modeling
US9984699B2 (en) 2014-06-26 2018-05-29 Qualcomm Incorporated High-band signal coding using mismatched frequency ranges
US10847170B2 (en) 2015-06-18 2020-11-24 Qualcomm Incorporated Device and method for generating a high-band signal from non-linearly processed sub-ranges
US10217468B2 (en) * 2017-01-19 2019-02-26 Qualcomm Incorporated Coding of multiple audio signals
US10825467B2 (en) * 2017-04-21 2020-11-03 Qualcomm Incorporated Non-harmonic speech detection and bandwidth extension in a multi-source environment
WO2020157888A1 (ja) * 2019-01-31 2020-08-06 三菱電機株式会社 周波数帯域拡張装置、周波数帯域拡張方法、及び周波数帯域拡張プログラム

Family Cites Families (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6141638A (en) 1998-05-28 2000-10-31 Motorola, Inc. Method and apparatus for coding an information signal
US7117146B2 (en) 1998-08-24 2006-10-03 Mindspeed Technologies, Inc. System for improved use of pitch enhancement with subcodebooks
US7272556B1 (en) 1998-09-23 2007-09-18 Lucent Technologies Inc. Scalable and embedded codec for speech and audio signals
GB2342829B (en) 1998-10-13 2003-03-26 Nokia Mobile Phones Ltd Postfilter
CA2252170A1 (en) 1998-10-27 2000-04-27 Bruno Bessette A method and device for high quality coding of wideband speech and audio signals
US6449313B1 (en) 1999-04-28 2002-09-10 Lucent Technologies Inc. Shaped fixed codebook search for celp speech coding
US6704701B1 (en) 1999-07-02 2004-03-09 Mindspeed Technologies, Inc. Bi-directional pitch enhancement in speech coding systems
AU2001241475A1 (en) 2000-02-11 2001-08-20 Comsat Corporation Background noise reduction in sinusoidal based speech coding systems
AU2001287970A1 (en) 2000-09-15 2002-03-26 Conexant Systems, Inc. Short-term enhancement in celp speech coding
US6760698B2 (en) 2000-09-15 2004-07-06 Mindspeed Technologies Inc. System for coding speech information using an adaptive codebook with enhanced variable resolution scheme
US6766289B2 (en) 2001-06-04 2004-07-20 Qualcomm Incorporated Fast code-vector searching
JP3457293B2 (ja) 2001-06-06 2003-10-14 三菱電機株式会社 雑音抑圧装置及び雑音抑圧方法
US6993207B1 (en) 2001-10-05 2006-01-31 Micron Technology, Inc. Method and apparatus for electronic image processing
US7146313B2 (en) 2001-12-14 2006-12-05 Microsoft Corporation Techniques for measurement of perceptual audio quality
BR0315179A (pt) * 2002-10-11 2005-08-23 Nokia Corp Método e dispositivo para codificar um sinal de fala amostrado compreendendo quadros de fala
US7047188B2 (en) 2002-11-08 2006-05-16 Motorola, Inc. Method and apparatus for improvement coding of the subframe gain in a speech coding system
US7788091B2 (en) 2004-09-22 2010-08-31 Texas Instruments Incorporated Methods, devices and systems for improved pitch enhancement and autocorrelation in voice codecs
JP2006197391A (ja) 2005-01-14 2006-07-27 Toshiba Corp 音声ミクシング処理装置及び音声ミクシング処理方法
ES2358125T3 (es) * 2005-04-01 2011-05-05 Qualcomm Incorporated Procedimiento y aparato para un filtrado de antidispersión de una señal ensanchada de excitación de predicción de velocidad de ancho de banda.
CA2603255C (en) 2005-04-01 2015-06-23 Qualcomm Incorporated Systems, methods, and apparatus for wideband speech coding
US8280730B2 (en) 2005-05-25 2012-10-02 Motorola Mobility Llc Method and apparatus of increasing speech intelligibility in noisy environments
US8612216B2 (en) * 2006-01-31 2013-12-17 Siemens Enterprise Communications Gmbh & Co. Kg Method and arrangements for audio signal encoding
DE102006022346B4 (de) 2006-05-12 2008-02-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Informationssignalcodierung
US8682652B2 (en) 2006-06-30 2014-03-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic
US8239190B2 (en) * 2006-08-22 2012-08-07 Qualcomm Incorporated Time-warping frames of wideband vocoder
US9009032B2 (en) 2006-11-09 2015-04-14 Broadcom Corporation Method and system for performing sample rate conversion
US20100332223A1 (en) 2006-12-13 2010-12-30 Panasonic Corporation Audio decoding device and power adjusting method
US20080208575A1 (en) 2007-02-27 2008-08-28 Nokia Corporation Split-band encoding and decoding of an audio signal
PL2146344T3 (pl) * 2008-07-17 2017-01-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Sposób kodowania/dekodowania sygnału audio obejmujący przełączalne obejście
PT2945159T (pt) * 2008-12-15 2018-06-26 Fraunhofer Ges Forschung Codificador de áudio e descodificador de extensão de largura de banda
US8463599B2 (en) * 2009-02-04 2013-06-11 Motorola Mobility Llc Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder
US8484020B2 (en) 2009-10-23 2013-07-09 Qualcomm Incorporated Determining an upperband signal from a narrowband signal
JP5812998B2 (ja) 2009-11-19 2015-11-17 テレフオンアクチーボラゲット エル エム エリクソン(パブル) オーディオコーデックにおけるラウドネスおよびシャープネスの補償のための方法および装置
AU2011226212B2 (en) 2010-03-09 2014-03-27 Dolby International Ab Apparatus and method for processing an input audio signal using cascaded filterbanks
US9443534B2 (en) * 2010-04-14 2016-09-13 Huawei Technologies Co., Ltd. Bandwidth extension system and approach
US8600737B2 (en) 2010-06-01 2013-12-03 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for wideband speech coding
US8924200B2 (en) * 2010-10-15 2014-12-30 Motorola Mobility Llc Audio signal bandwidth extension in CELP-based speech coder
US8738385B2 (en) 2010-10-20 2014-05-27 Broadcom Corporation Pitch-based pre-filtering and post-filtering for compression of audio signals
RU2596584C2 (ru) * 2010-10-25 2016-09-10 Войсэйдж Корпорейшн Кодирование обобщенных аудиосигналов на низких скоростях передачи битов и с низкой задержкой
EP2710590B1 (en) 2011-05-16 2015-10-07 Google, Inc. Super-wideband noise supression
CN102802112B (zh) 2011-05-24 2014-08-13 鸿富锦精密工业(深圳)有限公司 具有音频文件格式转换功能的电子装置
US9070361B2 (en) 2011-06-10 2015-06-30 Google Technology Holdings LLC Method and apparatus for encoding a wideband speech signal utilizing downmixing of a highband component
EP2791937B1 (en) * 2011-11-02 2016-06-08 Telefonaktiebolaget LM Ericsson (publ) Generation of a high band extension of a bandwidth extended audio signal
CN104221082B (zh) * 2012-03-29 2017-03-08 瑞典爱立信有限公司 谐波音频信号的带宽扩展
US9601125B2 (en) 2013-02-08 2017-03-21 Qualcomm Incorporated Systems and methods of performing noise modulation and gain adjustment
US10083708B2 (en) 2013-10-11 2018-09-25 Qualcomm Incorporated Estimation of mixing factors to generate high-band excitation signal

Also Published As

Publication number Publication date
WO2015054492A1 (en) 2015-04-16
RU2016116044A3 (es) 2018-07-10
KR20160067210A (ko) 2016-06-13
MY182788A (en) 2021-02-05
EP3055861B1 (en) 2017-12-27
PH12016500506B1 (en) 2016-06-13
RU2016116044A (ru) 2017-11-16
SG11201601790QA (en) 2016-04-28
SA516370877B1 (ar) 2019-04-11
US10410652B2 (en) 2019-09-10
CA2925573C (en) 2019-04-23
MX354886B (es) 2018-03-23
JP2016532886A (ja) 2016-10-20
EP3055861A1 (en) 2016-08-17
DK3055861T3 (en) 2018-03-26
KR101941755B1 (ko) 2019-01-23
SI3055861T1 (en) 2018-03-30
CN110634503A (zh) 2019-12-31
CN105612578A (zh) 2016-05-25
MX2016004535A (es) 2016-07-22
AU2014331890B2 (en) 2019-05-16
US20150106084A1 (en) 2015-04-16
JP6469664B2 (ja) 2019-02-13
AU2019203827B2 (en) 2020-07-16
CN110634503B (zh) 2023-07-14
CA2925573A1 (en) 2015-04-16
NZ754130A (en) 2020-09-25
HUE036838T2 (hu) 2018-08-28
CL2016000818A1 (es) 2016-10-14
AU2019203827A1 (en) 2019-06-20
RU2672179C2 (ru) 2018-11-12
PH12016500506A1 (en) 2016-06-13
HK1220033A1 (zh) 2017-04-21
US10083708B2 (en) 2018-09-25
AU2014331890A1 (en) 2016-03-31
US20180268839A1 (en) 2018-09-20
CN105612578B (zh) 2019-10-11
NZ717750A (en) 2019-07-26

Similar Documents

Publication Publication Date Title
ES2660605T3 (es) Estimación de factores de mezcla para generar una señal de excitación de banda alta
ES2690252T3 (es) Ajuste de ganancia temporal basado en la característica de señal de banda alta
ES2711524T3 (es) Generación de señal de excitación de banda alta
ES2777282T3 (es) Extensión de ancho de banda armónico de señales de audio
US9858941B2 (en) Selective phase compensation in high band coding of an audio signal
ES2844231T3 (es) Modelado de señales de banda alta
ES2715476T3 (es) Sistemas y procedimientos para realizar la modulación de ruido y el ajuste de ganancia
ES2774334T3 (es) Estimación de forma de ganancia para mejorar el rastreo de características temporales de banda alta
ES2807258T3 (es) Escalado para circuitería de forma de ganancia
ES2690096T3 (es) Codificación de señal de banda alta usando intervalos de frecuencias no coincidentes
ES2755364T3 (es) Codificación de señal de banda alta que utiliza múltiples subbandas
ES2643828T3 (es) Procedimiento, aparato, dispositivo, medio legible por ordenador para la extensión de ancho de banda de una señal de audio que usa una excitación de banda alta escalada
AU2014331903A1 (en) Gain shape estimation for improved tracking of high-band temporal characteristics
BR112016007938B1 (pt) Estimação de fatores de mistura para gerar sinal de excitação de banda alta
BR112016007914B1 (pt) Estimativa de formato de ganho para rastreamento aperfeiçoado de características temporais de banda alta