ES2643828T3 - Procedimiento, aparato, dispositivo, medio legible por ordenador para la extensión de ancho de banda de una señal de audio que usa una excitación de banda alta escalada - Google Patents

Procedimiento, aparato, dispositivo, medio legible por ordenador para la extensión de ancho de banda de una señal de audio que usa una excitación de banda alta escalada Download PDF

Info

Publication number
ES2643828T3
ES2643828T3 ES14796594.1T ES14796594T ES2643828T3 ES 2643828 T3 ES2643828 T3 ES 2643828T3 ES 14796594 T ES14796594 T ES 14796594T ES 2643828 T3 ES2643828 T3 ES 2643828T3
Authority
ES
Spain
Prior art keywords
high band
signal
modeled
frame
sub
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES14796594.1T
Other languages
English (en)
Inventor
Venkatraman S. ATTI
Venkatesh Krishnan
Stephane Pierre Villette
Vivek Rajendran
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Application granted granted Critical
Publication of ES2643828T3 publication Critical patent/ES2643828T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/035Scalar quantisation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/083Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • G10L21/0388Details of processing therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Stereophonic System (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)

Description

DESCRIPCIÓN
Procedimiento, aparato, dispositivo, medio legible por ordenador para la extensión de ancho de banda de una señal de audio que usa una excitación de banda alta escalada
imagen1
5
REFERENCIA CRUZADA A SOLICITUDES RELACIONADAS
[0001]La presente solicitud reivindica prioridad de la Solicitud de Patente Provisional de Estados Unidos 61/890 812, titulada "SISTEMAS Y PROCEDIMIENTOS DE PROCESAMIENTO DE SEÑALES ESCALADAS POR ENERGÍA", presentada el 14 de octubre de 2013 y la Solicitud de Patente No Provisional de Estados Unidos 14/512 892, titulada 10 "SISTEMAS Y PROCEDIMIENTOS DE PROCESAMIENTO DE SEÑALES ESCALADAS POR ENERGÍA, presentado el 13 de octubre de 2014.
CAMPO
15
[0002] La presente divulgación se refiere en general al procesamiento de señales.
DESCRIPCIÓN DE LA TÉCNICA RELACIONADA
[0003] Los avances en la tecnología han dado lugar a dispositivos informáticos más pequeños y más potentes. Por 20 ejemplo, existe actualmente una variedad de dispositivos informáticos personales portátiles, incluyendo dispositivos informáticos inalámbricos, tales como teléfonos inalámbricos portátiles, asistentes digitales personales (PDA) y dispositivos de búsqueda que son pequeños y ligeros y que pueden ser fácilmente transportados por los usuarios. Más específicamente, los teléfonos inalámbricos portátiles, tales como teléfonos celulares y teléfonos de protocolo de Internet (IP), pueden comunicar paquetes de voz y datos a través de redes inalámbricas. Además, muchos de 25 tales teléfonos inalámbricos incluyen otros tipos de dispositivos que se incorporan en ellos. Por ejemplo, un teléfono inalámbrico también puede incluir una cámara digital, una cámara de vídeo digital, un grabador digital y un reproductor de archivos de audio.
[0004] En los sistemas telefónicos tradicionales (por ejemplo, las redes telefónicas conmutadas públicas (PSTN)), el 30 ancho de banda de la señal se limita al rango de frecuencias de 300 Hertz (Hz) a 3,4 kilohercios (kHz). En aplicaciones de banda ancha (WB), como la telefonía celular y el protocolo de voz por Internet (VoIP), el ancho de banda de señal puede abarcar el rango de frecuencias de 50 Hz a 7 kHz. Las técnicas de codificación de banda súper-ancha (SWB) soportan ancho de banda que se extiende hasta alrededor de 16 kHz. La ampliación del ancho de banda de la señal de telefonía de banda estrecha a 3,4 kHz a telefonía SWB de 16 kHz puede mejorar la 35 inteligibilidad y la naturalidad del habla.
[0005] Las técnicas de codificación SWB típicamente implican codificar y transmitir la porción de frecuencias más bajas de la señal (por ejemplo, de 50 Hz a 7 kHz, también denominada la "banda baja"). Por ejemplo, la banda baja se puede representar usando parámetros de filtro y/o una señal de excitación de banda baja. Sin embargo, con el fin 40 de mejorar la eficiencia de codificación, la porción de frecuencias más altas de la señal (por ejemplo, de 7 kHz a 16 kHz, también llamada "banda alta") puede codificarse usando técnicas de modelado de señales para predecir la banda alta. En algunas implementaciones, los datos asociados con la banda alta pueden proporcionarse al receptor para facilitar la predicción. Tales datos pueden denominarse "información lateral" y pueden incluir información de ganancia, frecuencias espectrales de línea (LSF, también denominadas pares espectrales de línea (LSP)), etc. La 45 información de ganancia puede incluir información de forma de ganancia determinada basándose en energías de sub-trama de la señal de banda alta y la señal de banda alta modelada. La información de forma de ganancia puede tener un rango dinámico más amplio (por ejemplo, oscilaciones grandes) debido a diferencias en la señal de banda alta original con respecto a la señal de banda alta modelada. El rango dinámico más amplio puede reducir la eficiencia de un codificador utilizado para codificar / transmitir la información de forma de ganancia. En la técnica 50 anterior, la solicitud de patente US2008/0027718A1 divulga un procedimiento para obtener una señal de excitación de banda alta a partir de una señal de excitación de banda estrecha codificada, y determinar un factor de ganancia para la banda alta.
RESUMEN 55
[0006] Se divulgan los sistemas y procedimientos de realización de la codificación de señales de audio. En un modo de realización particular, una señal de audio se codifica en un flujo de bits o flujo de datos que incluye un flujo de bits de banda baja (que representa una porción de banda baja de la señal de audio) e información lateral de banda alta (que representa una porción de banda alta de la señal de audio). La información lateral de banda alta puede 60 generarse usando la porción de banda baja de la señal de audio. Por ejemplo, una señal de excitación de banda baja puede extenderse para generar una señal de excitación de banda alta. La señal de excitación de banda alta puede usarse para generar (por ejemplo, sintetizar) una primera señal de banda alta modelada. Las diferencias de energía entre la señal de banda alta y la señal de banda alta modelada pueden utilizarse para determinar los factores de escalado (por ejemplo, un primer conjunto de uno o más factores de escalado). Los factores de escalado 65 (o un segundo conjunto de factores de escalado determinados basándose en el primer conjunto de factores de
escalado) se pueden aplicar a la señal de excitación de banda alta para generar (por ejemplo, sintetizar) una segunda señal de banda alta modelada. La segunda señal de banda alta modelada puede usarse para determinar la información lateral de banda alta. Dado que la segunda señal de banda alta modelada se escala para tener en cuenta las diferencias de energía con respecto a la señal de banda alta, la información lateral de banda alta basada en la segunda señal de banda alta modelada puede tener un rango dinámico reducido con respecto a la información 5 lateral de banda alta determinada sin escalado para tener en cuenta las diferencias de energía.
[0007] En un modo de realización particular, un procedimiento incluye la determinación de una primera señal de banda alta modelada basándose en una señal de excitación de banda baja de una señal de audio. La señal de audio incluye una porción de banda alta y una porción de banda baja. El procedimiento también incluye determinar 10 factores de escalado basados en energía de sub-tramas de la primera señal de banda alta modelada y energía de sub-tramas correspondientes de la porción de banda alta de la señal de audio. El procedimiento incluye aplicar los factores de escalado a una señal de excitación de banda alta modelada para determinar una señal de excitación de banda alta escalada y determinar una segunda señal de banda alta modelada basándose en la señal de excitación de banda alta escalada. El procedimiento también incluye determinar la información de ganancia basada en la 15 segunda señal de banda alta modelada y la porción de banda alta de la señal de audio.
[0008] En otro modo de realización particular, un dispositivo incluye medios para determinar una primera señal de banda alta modelada basándose en una señal de excitación de banda baja de una señal de audio, donde la señal de audio incluye una porción de banda alta y una porción de banda baja. El dispositivo también incluye medios para 20 determinar factores de escalado basados en energía de sub-tramas de la primera señal de banda alta modelada y energía de las sub-tramas correspondientes de la porción de banda alta de la señal de audio. El dispositivo incluye también medios para aplicar los factores de escalado a una señal de excitación de banda alta modelada para determinar una señal de excitación de banda alta escalada. El dispositivo también incluye medios para determinar una segunda señal de banda alta modelada basándose en la señal de excitación de banda alta escalada. El 25 dispositivo también incluye medios para determinar información de ganancia basada en la segunda señal de banda alta modelada y la porción de banda alta de la señal de audio.
[0009] En otro modo de realización particular, un medio legible por ordenador no transitorio incluye instrucciones que, cuando son ejecutadas por un ordenador, hacen que el ordenador lleve a cabo operaciones, incluyendo la 30 determinación de una primera señal de banda alta modelada basándose en una señal de excitación de banda baja de una señal de audio, donde la señal de audio incluye una porción de banda alta y una porción de banda baja. Las operaciones también incluyen determinar factores de escalado basados en energía de sub-tramas de la primera señal de banda alta modelada y energía de sub-tramas correspondientes de la porción de banda alta de la señal de audio. Las operaciones también incluyen la aplicación de los factores de escalado a una señal de excitación de 35 banda alta modelada para determinar una señal de excitación de banda alta escalada. Las operaciones también incluyen la determinación de una segunda señal de banda alta modelada basándose en la señal de excitación de banda alta escalada. Las operaciones también incluyen determinar parámetros de ganancia basados en la segunda señal de banda alta modelada y la porción de banda alta de la señal de audio.
40
[0010] Las ventajas particulares proporcionadas por al menos uno de los modos de realización divulgados incluyen la reducción de un rango dinámico de información de ganancia proporcionada a un codificador escalando una señal de excitación de banda alta modelada que se utiliza para calcular la información de ganancia. Por ejemplo, la señal de excitación de banda alta modelada puede escalarse basándose en energías de sub-tramas de una señal de banda alta modelada y las sub-tramas correspondientes de una porción de banda alta de una señal de audio. El 45 escalado de la señal de excitación de banda alta modelada de esta manera puede capturar variaciones en las características temporales de sub-trama a sub-trama y reducir la dependencia de la información de forma de ganancia en los cambios temporales en la porción de banda alta de una señal de audio. Otros aspectos, ventajas y características de la presente divulgación resultarán evidentes después de revisar toda la solicitud, incluyendo las siguientes secciones: Breve descripción de los dibujos, Descripción detallada y Reivindicaciones. 50
BREVE DESCRIPCIÓN DE LOS DIBUJOS
[0011]
55
La FIG. 1 es un diagrama para ilustrar un modo de realización particular de un sistema que es operable para generar información lateral de banda alta basada en una señal de excitación de banda alta modelada escalada;
La FIG. 2 es un diagrama para ilustrar un modo de realización particular de un módulo de análisis de banda alta de la FIG. 1; 60
La FIG. 3 es un diagrama para ilustrar un modo de realización particular de interpolación de información de sub-trama;
La FIG. 4 es un diagrama para ilustrar otro modo de realización particular de interpolación de información de sub-65 trama;
Las FIGs. 5-7 juntas son diagramas para ilustrar otro modo de realización particular de un módulo de análisis de banda alta de la FIG. 1;
La FIG. 8 es un diagrama de flujo para ilustrar un modo de realización particular de un procedimiento de 5 procesamiento de señales de audio;
La FIG. 9 es un diagrama de bloques de un dispositivo inalámbrico operable para realizar operaciones de procesamiento de señales de acuerdo con los sistemas y procedimientos de las FIGs. 1-8.
10
DESCRIPCIÓN DETALLADA
[0012] La FIG. 1 es un diagrama para ilustrar un modo de realización particular de un sistema 100 que es operable para generar información lateral de banda alta basada en una señal de excitación de banda alta modelada escalada. En un modo de realización particular, el sistema 100 puede integrarse en un sistema o aparato de codificación (por 15 ejemplo, en un teléfono inalámbrico o codificador / descodificador (CODEC)).
[0013] En la siguiente descripción, las diversas funciones realizadas por el sistema 100 de la FIG. 1 se describen como realizadas por ciertos componentes o módulos. Sin embargo, esta división de componentes y módulos es solo para ilustración. En un modo de realización alternativo, una función realizada por un componente o módulo particular 20 puede dividirse en su lugar entre múltiples componentes o módulos. Además, en un modo de realización alternativo, dos o más componentes o módulos de la FIG. 1 pueden integrarse en un único componente o módulo. Cada componente o módulo ilustrado en la FIG. 1 puede implementarse utilizando hardware (por ejemplo, un dispositivo de matriz de compuertas programables de campo (FPGA), un circuito integrado específico de aplicación (ASIC), un procesador de señal digital (DSP), un controlador, etc.), software (por ejemplo, instrucciones ejecutables por un 25 procesador), o cualquier combinación de los mismos.
[0014] El sistema 100 incluye un banco de filtros de análisis 110 que está configurado para recibir una señal de audio 102. Por ejemplo, la señal de audio 102 puede proporcionarse mediante un micrófono u otro dispositivo de entrada. En un modo de realización particular, la señal de audio de entrada 102 puede incluir voz. La señal de audio 30 102 puede ser una señal SWB que incluye datos en el intervalo de frecuencias de aproximadamente 50 hertzios (Hz) a aproximadamente 16 kilohercios (kHz). El banco de filtros de análisis 110 puede filtrar la señal de audio de entrada 102 en múltiples porciones basadas en la frecuencia. Por ejemplo, el banco de filtros de análisis 110 puede generar una señal de banda baja 122 y una señal de banda alta 124. La señal de banda baja 122 y la señal de banda alta 124 pueden tener anchos de banda iguales o desiguales, y pueden estar superpuestas o no superpuestas. En un 35 modo de realización alternativo, el banco de filtros de análisis 110 puede generar más de dos salidas.
[0015] En el ejemplo de la FIG. 1, la señal de banda baja 122 y la señal de banda alta 124 ocupan bandas de frecuencias no superpuestas. Por ejemplo, la señal de banda baja 122 y la señal de banda alta 124 pueden ocupar bandas de frecuencias no superpuestas de 50 Hz-7 kHz y 7 kHz-16 kHz, respectivamente. En un modo de 40 realización alternativo, la señal de banda baja 122 y la señal de banda alta 124 pueden ocupar bandas de frecuencias no superpuestas de 50 Hz-8 kHz y 8 kHz-16 kHz, respectivamente. En otro modo de realización alternativo, la señal de banda baja 122 y la señal de banda alta 124 se superponen (por ejemplo, 50 Hz-8 kHz y 7 kHz-16 kHz, respectivamente), lo cual puede permitir que un filtro de paso bajo y un filtro de paso alto del banco de filtros de análisis 110 tengan una atenuación progresiva suave, lo cual puede simplificar el diseño y reducir el coste 45 del filtro de paso bajo y del filtro de paso alto. La superposición de la señal de banda baja 122 y de la señal de banda alta 124 también puede permitir la mezcla suave de señales de banda baja y banda alta en un receptor, lo cual puede dar como resultado menos artefactos audibles.
[0016] Aunque la descripción de la FIG. 1 se refiere al procesamiento de una señal SWB, esto es solo para 50 ilustración. En un modo de realización alternativo, la señal de audio de entrada 102 puede ser una señal WB que tiene un intervalo de frecuencias de aproximadamente 50 Hz a aproximadamente 8 kHz. En un modo de realización de este tipo, la señal de banda baja 122 puede corresponder a un intervalo de frecuencias de aproximadamente 50 Hz a aproximadamente 6,4 kHz y la señal de banda alta 124 puede corresponder a un intervalo de frecuencias de aproximadamente 6,4 kHz a aproximadamente 8 kHz. 55
[0017] El sistema 100 puede incluir un módulo de análisis de banda baja 130 (también denominado codificador de banda baja) configurado para recibir la señal de banda baja 122. En un modo de realización particular, el módulo de análisis de banda baja 130 puede representar un modo de realización de un codificador de predicción lineal excitada por código (CELP). El módulo de análisis de banda baja 130 puede incluir un módulo 132 de análisis y codificación 60 de predicción lineal (LP), un módulo 134 de transformación de coeficiente de predicción lineal (LPC) a par espectral de línea (LSP) y un cuantificador 136. Los LSP también pueden denominarse frecuencias espectrales de línea (LSF), y los dos términos se pueden usar indistintamente en el presente documento. El módulo 132 de análisis y codificación de LP puede codificar una envolvente espectral de la señal de banda baja 122 como un conjunto de LPC. Se pueden generar LPC para cada trama de audio (por ejemplo, 20 milisegundos (ms) de audio, 65 correspondientes a 320 muestras a una frecuencia de muestreo de 16 kHz), cada sub-trama de audio (por ejemplo,
5 ms de audio), o cualquier combinación de las mismas. El número de LPC generados para cada trama o sub-trama puede determinarse mediante el "orden" del análisis de LP realizado. En un modo de realización particular, el módulo 132 de análisis y codificación de LP puede generar un conjunto de once LPC correspondientes a un análisis de LP de décimo orden.
5
[0018] El módulo 134 de transformación de LPC a LSP puede transformar el conjunto de LPC generados por el módulo 132 de análisis y codificación de LP en un conjunto correspondiente de LSP (por ejemplo, usando transformación de uno en uno). Alternativamente, el conjunto de LPC pueden transformarse de uno en uno en un conjunto correspondiente de coeficientes de parcor, valores de relación de área de registro, pares espectrales de imitación (ISPs) o frecuencias espectrales de imitación (ISF). La transformación entre el conjunto de LPC y el 10 conjunto de LSP puede ser reversible sin error.
[0019] El cuantificador 136 puede cuantificar el conjunto de LSP generado por el módulo de transformación 134. Por ejemplo, el cuantificador 136 puede incluir o puede estar conectado a varios libros de códigos (no mostrados) que incluyen múltiples entradas (por ejemplo, vectores). Para cuantificar el conjunto de LSP, el cuantificador 136 puede 15 identificar entradas de libros de códigos que están "más cercanas al" (por ejemplo, basándose en una medida de distorsión como mínimos cuadrados o error cuadrático medio) conjunto de LSP. El cuantificador 136 puede emitir un valor de índice o una serie de valores de índice correspondientes a la ubicación de las entradas identificadas en el libro de códigos. La salida del cuantificador 136 puede representar parámetros de filtro de banda baja que están incluidos en un flujo de bits de banda baja 142. El flujo de bits de banda baja 142 puede incluir así datos de código 20 de predicción lineal que representan la porción de banda baja de la señal de audio 102.
[0020] El módulo de análisis de banda baja 130 también puede generar una señal de excitación de banda baja 144. Por ejemplo, la señal de excitación de banda baja 144 puede ser una señal codificada que se genera cuantificando una señal residual de LP que se genera durante el proceso de LP realizado por el módulo de análisis de banda baja 25 130. La señal residual de LP puede representar un error de predicción.
[0021] El sistema 100 puede incluir además un módulo de análisis de banda alta 150 configurado para recibir la señal de banda alta 124 del banco de filtros de análisis 110 y la señal de excitación de banda baja 144 del módulo de análisis de banda baja 130. El módulo de análisis de banda alta 150 puede generar información lateral de banda 30 alta 172 basada en la señal de banda alta 124 y la señal de excitación de banda baja 144. Por ejemplo, la información lateral de banda alta 172 puede incluir datos que representan LSP de banda alta, datos que representan información de ganancia (por ejemplo, basados en al menos una relación de energía de banda alta a energía de banda baja), datos que representan factores de escalado o una combinación de los mismos.
35
[0022] El módulo de análisis de banda alta 150 puede incluir un generador de excitación de banda alta 152. El generador de excitación de banda alta 152 puede generar una señal de excitación de banda alta (tal como la señal de excitación de banda alta 202 de la FIG. 2) extendiendo un espectro de la señal de excitación de banda baja 144 al intervalo de frecuencias de banda alta (por ejemplo, 7 kHz-16 kHz). Para ilustrar, el generador de excitación de banda alta 152 puede aplicar una transformación (por ejemplo, una transformación no lineal tal como una operación 40 de valor absoluto o cuadrado) a la señal de excitación de banda baja 144 y puede mezclar la señal de excitación de banda baja transformada con una señal de ruido (por ejemplo, ruido blanco modulado o configurado de acuerdo con una envolvente correspondiente a la señal de excitación de banda baja 144 que imita las características temporales variables lentamente de la señal de banda baja 122) para generar la señal de excitación de banda alta. Por ejemplo, la mezcla se puede realizar de acuerdo con la siguiente ecuación: 45
modulado ruido-1 ada transformbaja banda de excitaciónalta banda de Excitación
[0023]Una relación en la que la señal de excitación de banda baja transformada y el ruido modulado se mezclan puede afectar la calidad de la reconstrucción de banda alta en un receptor. Para las señales de voz sonoras, el 50 mezclado puede estar polarizado hacia la excitación de banda baja transformada (por ejemplo, el factor de mezcla α puede estar en el intervalo de 0,5 a 1,0). Para las señales no emitidas, la mezcla puede estar polarizada hacia el ruido modulado (por ejemplo, el factor de mezcla α puede estar en el intervalo de 0,0 a 0,5).
[0024] La señal de excitación de banda alta puede utilizarse para determinar uno o más parámetros de ganancia de 55 banda alta que se incluyen en la información lateral de banda alta 172. En un modo de realización particular, la señal de excitación de banda alta y la señal de banda alta 124 pueden usarse para determinar la información de escalado (por ejemplo, factores de escalado) que se aplican a la señal de excitación de banda alta para determinar una señal de excitación de banda alta escalada. La señal de excitación de banda alta escalada puede usarse para determinar los parámetros de ganancia de banda alta. Por ejemplo, como se describe posteriormente, con referencia a las FIGs. 60 2 y 5-7, el estimador de energía 154 puede determinar la energía estimada de tramas o sub-tramas de la señal de banda alta y de las tramas o sub-tramas correspondientes de una primera señal de banda alta modelada. La primera señal de banda alta modelada puede determinarse aplicando síntesis de predicción lineal sin memoria en la señal de
excitación de banda alta. El módulo de escalado 156 puede determinar factores de escalado (por ejemplo, un primer conjunto de factores de escalado) basándose en la energía estimada de tramas o sub-tramas de la señal de banda alta 124 y la energía estimada de las tramas o sub-tramas correspondientes de una primera señal de banda alta modelada. Por ejemplo, cada factor de escalado puede corresponder a una relación Ei/Ei’, donde Ei es una energía estimada de una sub-trama, i, de la señal de banda alta y Ei’es una energía estimada de una sub-trama, i, de la 5 primera señal de banda alta modelada. El módulo de escalado 156 también puede aplicar los factores de escalado (o un segundo conjunto de factores de escalado determinados basándose en el primer conjunto de factores de escalado, por ejemplo, promediando las ganancias sobre varias sub-tramas del primer conjunto de factores de escalado), sub-trama a sub-trama, a la señal de excitación de banda alta para determinar la señal de excitación de banda alta escalada. 10
[0025] Como se ilustra, el módulo de análisis de banda alta 150 puede también incluir un análisis de LP y el módulo de codificación 158, un módulo de transformación de LPC a LSP 160, y un cuantificador 162. Cada módulo de análisis y codificación de LP 158, el módulo de transformación 160 y el cuantificador 162 pueden funcionar como se ha descrito anteriormente con referencia a componentes correspondientes del módulo de análisis de banda baja 15 130, pero a una resolución comparativamente reducida (por ejemplo, utilizando menos bits para cada coeficiente, LSP, etc.). El módulo de análisis y codificación de LP 158 puede generar un conjunto de LPC que se transforman en LSP mediante el módulo de transformación 160 y se cuantifican mediante el cuantificador 162 basándose en un libro de códigos 166. Por ejemplo, el módulo de análisis y codificación de LP 158, el módulo de transformación 160 y el cuantificador 162 pueden utilizar la señal de banda alta 124 para determinar la información de filtro de banda alta 20 (por ejemplo, LSP de banda alta) que está incluida en la información lateral de banda alta 172. En un modo de realización particular, la información lateral de banda alta 172 puede incluir LSP de banda alta, información de ganancia de banda alta, los factores de escalado, o una combinación de los mismos. Como se ha explicado anteriormente, la información de ganancia de banda alta puede determinarse basándose en una señal de excitación de banda alta escalada. 25
[0026] El flujo de bits de banda baja 142 y la información lateral de banda alta 172 pueden ser multiplexados por un multiplexor (MUX) 180 para generar un flujo de datos de salida o un flujo de bits de salida 192. El flujo de bits de salida 192 puede representar una señal de audio codificada que corresponde a la señal de audio de entrada 102. Por ejemplo, el flujo de bits de salida 192 puede transmitirse (por ejemplo, a través de un canal cableado, 30 inalámbrico u óptico) y/o almacenarse. En un receptor, las operaciones inversas pueden ser realizadas por un desmultiplexor (DEMUX), un descodificador de banda baja, un descodificador de banda alta y un banco de filtros para generar una señal de audio (por ejemplo, una versión reconstruida de la señal de audio de entrada 102 que se proporciona a un altavoz u otro dispositivo de salida). El número de bits utilizados para representar el flujo de bits de banda baja 142 puede ser sustancialmente mayor que el número de bits utilizados para representar la información 35 lateral de banda alta 172. De este modo, la mayoría de los bits en el flujo de bits de salida 192 pueden representar datos de banda baja. La información lateral de banda alta 172 puede utilizarse en un receptor para regenerar la señal de excitación de banda alta a partir de los datos de banda baja de acuerdo con un modelo de señal. Por ejemplo, el modelo de señal puede representar un conjunto esperado de relaciones o correlaciones entre datos de banda baja (por ejemplo, la señal de banda baja 122) y datos de banda alta (por ejemplo, la señal de banda alta 40 124). Por lo tanto, se pueden usar diferentes modelos de señales para diferentes tipos de datos de audio (por ejemplo, voz, música, etc.) y el modelo de señal particular que está en uso puede ser negociado por un transmisor y un receptor (o definirse mediante un estándar de la industria) antes de la comunicación de datos de audio codificados. Usando el modelo de señal, el módulo de análisis de banda alta 150 en un transmisor puede ser capaz de generar la información lateral de banda alta 172 de tal manera que un módulo de análisis de banda alta 45 correspondiente en un receptor pueda usar el modelo de señal para reconstruir la señal de banda alta 124 a partir del flujo de bits de salida 192.
[0027] La FIG. 2 es un diagrama que ilustra un modo de realización particular del módulo de análisis de banda alta 150 de la FIG. 1. El módulo de análisis de banda alta 150 está configurado para recibir una señal de excitación de 50 banda alta 202 y una porción de banda alta de una señal de audio (por ejemplo, la señal de banda alta 124) y para generar información de ganancia, tal como parámetros de ganancia 250 y ganancia de trama 254, basándose en la señal de excitación de banda alta 202 y la señal de banda alta 124. La señal de excitación de banda alta 202 puede corresponder a la señal de excitación de banda alta generada por el generador de excitación de banda alta 152 que utiliza la señal de excitación de banda baja 144. 55
[0028] Los parámetros de filtro 204 se pueden aplicar a la señal de excitación de banda alta 202 utilizando un filtro de síntesis de LP de todos los polos 206 (por ejemplo, un filtro de síntesis) para determinar una primera señal de banda alta modelada 208. Los parámetros de filtro 204 pueden corresponder a la memoria de realimentación del filtro de síntesis de LP de todos los polos 206. Con el fin de determinar los factores de escalado, los parámetros de 60 filtro 204 pueden no tener memoria. En particular, la memoria de filtro o los estados de filtro que están asociados con el filtro de síntesis de LP de la i-ésima sub-trama, 1/Ai(z) se reinician antes de llevar a cabo el filtro de síntesis de LP de todos los polos 206.
[0029] La primera señal de banda alta modelada 208 puede aplicarse a un estimador de energía 210 para 65 determinar la energía de sub-trama 212 de cada trama o sub-trama de la primera señal de banda alta modelada 208.
La señal de banda alta 124 también se puede aplicar a un estimador de energía 222 para determinar la energía 224 de cada trama o sub-trama de la señal de banda alta 124. La energía de sub-trama 212 de la primera señal de banda alta modelada 208 y la energía 224 de la señal de banda alta 124 pueden usarse para determinar los factores de escalado 230. Los factores de escalado 230 pueden cuantificar las diferencias de energía entre tramas o sub-tramas de la primera señal de banda alta modelada 208 y las tramas o sub-tramas correspondientes de la señal de 5 banda alta 124. Por ejemplo, los factores de escalado 230 se pueden determinar como una relación de energía 224 de la señal de banda alta 124 y la energía de sub-trama 212 estimada de la primera señal de banda alta modelada 208. En un modo de realización particular, los factores de escalado 230 se determinan sub-trama a sub-trama, donde cada trama incluye cuatro sub-tramas. En este modo de realización, se determina un factor de escalado para cada conjunto de sub-tramas, incluyendo una sub-trama de la primera señal de banda alta modelada 208 y una sub-10 trama correspondiente de la señal de banda alta 124.
[0030] Para determinar la información de ganancia, cada sub-trama de la señal de excitación de banda alta 202 puede compensarse (por ejemplo, multiplicarse) con un factor de escalado correspondiente 230 para generar una señal de excitación de banda alta escalada 240. Los parámetros de filtro 242 pueden aplicarse a la señal de 15 excitación de banda alta escalada 240 utilizando un filtro de todos los polos 244 para determinar una segunda señal de banda alta modelada 246. Los parámetros de filtro 242 pueden corresponder a parámetros de un módulo de análisis y codificación de predicción lineal, tal como el módulo de análisis y codificación de LP 158 de la FIG. 1. Con el fin de determinar la información de ganancia, los parámetros de filtro 242 pueden incluir información asociada con tramas previamente procesadas (por ejemplo, memoria de filtro). 20
[0031] La segunda señal de banda alta modelada 246 puede aplicarse a un estimador de forma de ganancia 248, junto con la señal de banda alta 124 para determinar los parámetros de ganancia 250. Los parámetros de ganancia 250, la segunda señal de banda alta modelada 246 y la señal de banda alta 124 pueden aplicarse a un estimador de tramas de ganancia 252 para determinar una ganancia de trama 254. Los parámetros de ganancia 250 y la ganancia 25 de trama 254 forman conjuntamente la información de ganancia. La información de ganancia puede tener un rango dinámico reducido en relación con la información de ganancia determinada sin aplicar los factores de escalado 230 puesto que los factores de escalado representan algunas de las diferencias de energía entre la señal de banda alta 124 y la segunda señal de banda alta modelada 246 determinada basándose en la señal de excitación de banda alta 202. 30
[0032] La FIG. 3 es un diagrama que ilustra un modo de realización particular de interpolación de información de sub-trama. El diagrama de la FIG. 3 ilustra un procedimiento particular de determinación de la información de sub-trama para una N-ésima trama 304. La N-ésima trama 304 está precedida en una secuencia de tramas por una N-1-ésima trama 302 y seguida en la secuencia de tramas por una N+1-ésima trama 306. Se calcula un LSP para cada 35 trama. Por ejemplo, se calcula un N-1-ésimo LSP 310 para la N-1-ésima trama 302, se calcula una N-ésima LSP 312 para la N-ésima trama 304 y se calcula un N+1-ésimo LSP 314 para la N+1-ésima trama 306. Los LSP pueden representar la evolución espectral de la señal de banda alta, SHB 124, 502 de las FIGs. 1, 2 o 5-7.
[0033] Una pluralidad de LSP de sub-trama para la N-ésima trama 304 se puede determinar por interpolación 40 utilizando los valores LSP de una trama anterior (por ejemplo, la N-1-ésima trama 302) y una trama actual (por ejemplo, la N-ésima trama 304). Por ejemplo, se pueden aplicar factores de ponderación a los valores de un LSP anterior (por ejemplo, el N-1-ésimo LSP 310) y a valores de un LSP actual
[0034] (por ejemplo, el N-ésimo LSP 312). En el ejemplo ilustrado en la FIG. 3, se calculan LSP para cuatro sub-45 tramas (incluyendo una primera sub-trama 320, una segunda sub-trama 322, una tercera sub-trama 324 y una cuarta sub-trama 326). Los cuatro LSP de sub-trama 320-326 se pueden calcular usando ponderación igual o ponderación desigual.
[0035] Los LSP de sub-trama (320-326) se pueden utilizar para llevar a cabo la síntesis de LP sin actualizaciones de 50 memoria de filtro para estimar la primera señal de banda alta modelada 208. La primera señal de banda alta modelada 208 se utiliza entonces para estimar la energía de sub-trama Ei’ 212. El estimador de energía 154 puede proporcionar estimaciones de energía de sub-trama para la primera señal de banda alta modelada 208 y para la señal de banda alta 124 para el módulo de escalado 156 que puede determinar factores de escalado de sub-trama a sub-trama 230. Los factores de escalado pueden usarse para ajustar un nivel de energía de la señal de excitación 55 de banda alta 202 para generar una señal de excitación de banda alta escalada 240, que puede ser utilizada por el módulo de análisis y codificación de LP 158 para generar una segunda señal de banda alta modelada (o sintetizada) 246. La segunda señal de banda alta modelada 246 puede usarse para generar información de ganancia (tal como los parámetros de ganancia 250 y/o la ganancia de trama 254). Por ejemplo, la segunda señal de banda alta modelada 246 puede proporcionarse al estimador de ganancia 164, que puede determinar los parámetros de 60 ganancia 250 y la ganancia de trama 254.
[0036] La FIG. 4 es un diagrama que ilustra otro modo de realización particular de interpolación de información de sub-trama. El diagrama de la FIG. 4 ilustra un procedimiento particular de determinación de la información de sub-trama para una N-ésima trama 404. La N-ésima trama 404 está precedida en una secuencia de tramas por una N-1-65 ésima trama 402 y seguida en la secuencia de tramas por una N+1-ésima trama 406. Se calculan dos LSP para
cada trama. Por ejemplo, se calcula un LSP_1 408 y un LSP_2 410 para la N-1-ésima trama 402, se calcula un LSP_1 412 y un LSP_2 414 para la N-ésima trama 404, y se calcula un LSP_1 416 y un LSP_2 418 para la N+1-ésima trama 406. Los LSP pueden representar la evolución espectral de la señal de banda alta, SHB 124, 502 de las FIGs. 1, 2 o 5-7.
5
[0037] Una pluralidad de LSP de sub-trama para la N-ésima trama 404 se puede determinar por interpolación usando uno o más de los valores LSP de una trama anterior (por ejemplo, el LSP_1 408 y/o el LSP_2 410 de la N-1-ésima trama 402) y uno o más de los valores de LSP de una trama actual (por ejemplo, la N-ésima trama 404). Mientras que las ventanas LSP (por ejemplo, líneas discontinuas 412, 414 ventanas LSP asimétricas para la N-ésima trama 404) mostradas en la FIG. 4 tienen fines ilustrativos, es posible ajustar las ventanas de análisis de LP 10 de tal manera que la superposición dentro o entre tramas (con anticipación) pueda mejorar la evolución espectral de los LSP estimados de trama a trama o sub-trama a sub-trama. Por ejemplo, los factores de ponderación pueden aplicarse a los valores de un LSP anterior (por ejemplo, el LSP_2 410) y a los valores LSP de la trama actual (por ejemplo, el LSP_1 412 y/o el LSP_2 414). En el ejemplo ilustrado en la FIG. 4, se calculan LSP para cuatro sub-tramas (incluyendo una primera sub-trama 420, una segunda sub-trama 422, una tercera sub-trama 424 y una 15 cuarta sub-trama 426). Los cuatro LSP de sub-trama 420-426 se pueden calcular usando ponderación igual o ponderación desigual.
[0038] Los LSP de sub-trama (420-426) se pueden utilizar para llevar a cabo la síntesis de LP sin actualizaciones de memoria de filtro para estimar la primera señal de banda alta modelada 208. La primera señal de banda alta 20 modelada 208 se utiliza entonces para estimar la energía de sub-trama Ei’ 212. El estimador de energía 154 puede proporcionar estimaciones de energía de sub-trama para la primera señal de banda alta modelada 208 y para la señal de banda alta 124 para el módulo de escalado 156 que puede determinar factores de escalado de sub-trama a sub-trama 230. Los factores de escalado pueden usarse para ajustar un nivel de energía de la señal de excitación de banda alta 202 para generar una señal de excitación de banda alta escalada 240, que puede ser utilizada por el 25 módulo de análisis y codificación de LP 158 para generar una segunda señal de banda alta modelada (o sintetizada) 246. La segunda señal de banda alta modelada 246 puede usarse para generar información de ganancia (tal como los parámetros de ganancia 250 y/o la ganancia de trama 254). Por ejemplo, la segunda señal de banda alta modelada 246 puede proporcionarse al estimador de ganancia 164, que puede determinar los parámetros de ganancia 250 y la ganancia de trama 254. 30
[0039] Las FIGs. 5-7 son diagramas que ilustran colectivamente otro modo de realización particular de un módulo de análisis de banda alta, tal como el módulo de análisis de banda alta 150 de la FIG. 1. El módulo de análisis de banda alta está configurado para recibir una señal de banda alta 502 en un estimador de energía 504. El estimador de energía 504 puede estimar la energía de cada sub-trama de la señal de banda alta. La energía estimada 506, Ei, de 35 cada sub-trama de la señal de banda alta 502 puede proporcionarse a un cuantificador 508, que puede generar índices de energía de banda alta 510.
[0040] La señal de banda alta 502 también se puede recibir en un módulo de ventana 520. El módulo de ventana 520 puede generar coeficientes de predicción lineal (LPC) para cada par de tramas de la señal de banda alta 502. 40 Por ejemplo, el módulo de ventana 520 puede generar un primer LPC 522 (por ejemplo, LPC_1). El módulo de ventana 520 también puede generar un segundo LPC 524 (por ejemplo, LPC_2). El primer LPC 522 y el segundo LPC 524 pueden transformarse cada uno en LSP utilizando los módulos de transformación de LSP 526 y 528. Por ejemplo, el primer LPC 522 puede transformarse en un primer LSP 530 (por ejemplo, LSP_1), y el segundo LPC 524 puede transformarse en un segundo LSP 532 (por ejemplo LSP_2). El primer y el segundo LSP 530, 532 pueden 45 proporcionarse a un codificador 538, que puede codificar los LSP 530, 532 para formar índices LSP de banda alta 540.
[0041] Puede proporcionarse el primer y el segundo LSP 530, 532 y un tercer LSP 534 (por ejemplo, LSP_2old) a un interpolador 536. El tercer LSP 534 puede corresponder a una trama previamente procesada, tal como la N-1-ésima 50 trama 302 de la FIG. 3 (cuando se están determinando sub-tramas de la N-ésima trama 304). El interpolador 536 puede usar el primer, el segundo y el tercer LSP 530, 532 y 534 para generar LSP 542, 544, 546 y 548 de sub-trama interpolados. Por ejemplo, el interpolador 536 puede aplicar ponderaciones a los LSP 530, 532 y 534 para determinar los LSP de sub-trama 542, 544, 546 y 548.
55
[0042] Los LSP de sub-trama 542, 544, 546, y 548 pueden ser proporcionados a un módulo de transformación de LSP a LPC 550 para determinar los LPC de sub-trama y los parámetros de filtro 552, 554, 556, y 558.
[0043] Como también se ilustra en la FIG. 5, una señal de excitación de banda alta 560 (por ejemplo, una señal de excitación de banda alta determinada por el generador de excitación de banda alta 152 de la FIG. 1 basado en la 60 señal de excitación de banda baja 144) puede proporcionarse a un módulo de sub-tramas 562. El módulo de sub-tramas 562 puede analizar la señal de excitación de banda alta 560 en las sub-tramas 570, 572, 574 y 576 (por ejemplo, cuatro sub-tramas por trama de la señal de excitación de banda alta 560).
[0044] Con referencia a la FIG. 6, los parámetros de filtro 552, 554, 556 y 558 desde el módulo de transformación de 65 LSP a LPC 550 y las sub-tramas 570, 572, 574, 576 de la señal de excitación de banda alta 560 pueden
proporcionarse a los correspondientes filtros de todos los polos 612, 614, 616, 618. Cada uno de los filtros de todos los polos 612, 614, 616, 618 puede generar sub-tramas 622, 624, 626, 628 de una primera señal de banda alta modelada (o sintetizada) (HBi’, donde i es un índice de una sub-trama particular) de una sub-trama 570, 572, 574, 576 correspondiente de la señal de excitación de banda alta 560. En un modo de realización particular, con el fin de determinar factores de escalado, tales como factores de escalado 672, 674, 676 y 678, los parámetros de filtro 552, 5 554, 556 y 558 pueden no tener memoria. Es decir, con el fin de generar una primera sub-trama 622 de una primera señal de banda alta modelada, se realiza la síntesis de LP 1/A1(z) con sus parámetros de filtro 552 (por ejemplo, memoria de filtro o estados de filtro) reiniciados.
[0045] Las sub-tramas 622, 624, 626, 628 de la primera señal de banda alta modelada pueden ser proporcionados a 10 los estimadores de energía 632, 634, 636, y 638. Los estimadores de energía 632, 634, 636 y 638 pueden generar estimaciones de energía 642, 644, 646, 648 (Ei’, donde i es un índice de una sub-trama particular) de las sub-tramas 622, 624, 626, 628 de la primera señal de banda alta modelada.
[0046] Las estimaciones de energía 652, 654, 656 y 658 de la señal de banda alta 502 de la FIG. 5 puede 15 combinarse con (por ejemplo, dividirse por) las estimaciones de energía 642, 644, 646, 648 de las sub-tramas 622, 624, 626, 628 de las primeras señales de banda alta modeladas para formar los factores de escalado 672, 674, 676 y 678. En un modo de realización particular, cada factor de escalado es una relación de la energía de una sub-trama de la señal de banda alta, Ei, a la energía de una sub-trama 622, 624, 626, 628 correspondiente de la primera señal de banda alta modelada, Ei’. Por ejemplo, un primer factor de escalado 672 (SF1) puede determinarse como una 20 relación de E1 652 dividido por E1’642. De este modo, el primer factor de escalado 672 representa numéricamente una relación entre la energía de la primera sub-trama de la señal de banda alta 502 de la FIG. 5 y la primera sub-trama 622 de la primera señal de banda alta modelada determinada basándose en la señal de excitación de banda alta 560.
25
[0047] Con referencia a la FIG. 7, cada sub-trama 570, 572, 574, 576 de la señal de excitación de banda alta 560 puede combinarse (por ejemplo, multiplicarse) con un correspondiente factor de escalado 672, 674, 676 y 678 para generar una sub-trama 702, 704, 706 y 708 de una señal de excitación de banda alta escalada (, donde i es un índice de una sub-trama particular). Por ejemplo, la primera sub-trama 570 de la señal de excitación de banda alta 560 puede multiplicarse por el primer factor de escalado 672 para generar una primera sub-trama 702 de la 30 señal de excitación de banda alta escalada.
[0048] Las sub-tramas 702, 704, 706, y 708 de la señal de excitación de banda alta escalada se pueden aplicar a filtros de todos los polos 712, 714, 716, 718 (por ejemplo, filtros de síntesis) para determinar las sub-tramas 742, 744, 746, 748 de una segunda señal de banda alta modelada (o sintetizada). Por ejemplo, la primera sub-trama 702 35 de la señal de excitación de banda alta escalada puede aplicarse a un primer filtro de todos los polos 712, junto con los primeros parámetros de filtro 722, para determinar una primera sub-trama 742 de la segunda señal de banda alta modelada. Los parámetros de filtro 722, 724, 726 y 728 aplicados a los filtros de todos los polos 712, 714, 716, 718 pueden incluir información relacionada con tramas (o sub-tramas) previamente procesadas. Por ejemplo, cada filtro de todos los polos 712, 714, 716 puede emitir información de actualización de estado de filtro 732, 734, 736 que se 40 proporciona a otro de los filtros de todos los polos 714, 716, 718. La actualización de estado del filtro 738 desde el filtro de todos los polos 718 puede usarse en la trama siguiente (es decir, la primera sub-trama) para actualizar la memoria de filtro.
[0049] Las sub-tramas 742, 744, 746, 748 de la segunda señal de banda alta modelada pueden combinarse, en un 45 módulo de tramas 750, para generar una trama 752 de la segunda señal de banda alta modelada. La trama 752 de la segunda señal de banda alta modelada puede aplicarse a un estimador de forma de ganancia 754 junto con la señal de banda alta 502 para determinar los parámetros de ganancia 756. Los parámetros de ganancia 756, la trama 752 de la segunda señal de banda alta modelada y la señal de banda alta 502 pueden aplicarse a un estimador de trama de ganancia 758 para determinar una ganancia de trama 760. Los parámetros de ganancia 756 y la ganancia 50 de trama 760 forman conjuntamente la información de ganancia. La información de ganancia puede tener un rango dinámico reducido en relación con la información de ganancia determinada sin aplicar los factores de escalado 672, 674, 676, 678 ya que los factores de escalado 672, 674, 676, 678 explican algunas de las diferencias de energía entre la señal de banda alta 502 y una señal modelada utilizando la señal de excitación de banda alta 560.
55
[0050] La FIG. 8 es un diagrama de flujo que ilustra un modo de realización particular de un procedimiento de procesamiento de señales de audio designado 800. El procedimiento 800 puede realizarse en un módulo de análisis de banda alta, tal como el módulo de análisis de banda alta 150 de la FIG. 1. El procedimiento 800 incluye, en 802, la determinación de una primera señal de banda alta modelada basándose en una señal de excitación de banda baja de una señal de audio. La señal de audio incluye una porción de banda alta y una porción de banda baja. Por 60 ejemplo, la primera señal de banda alta modelada puede corresponder a la primera señal de banda alta modelada 208 de la FIG. 2 o a un conjunto de sub-tramas 622, 624, 626, 628 de la primera señal de banda alta modelada de la FIG. 6. La primera señal de banda alta modelada puede determinarse usando un análisis de predicción lineal aplicando una señal de excitación de banda alta a un filtro de todos los polos con parámetros de filtro sin memoria.
Por ejemplo, la señal de excitación de banda alta 202 puede aplicarse al filtro de síntesis de LP de todos los polos 206 de la FIG. 2. En este ejemplo, los parámetros de filtro 204 aplicados al filtro de síntesis de LP de todos los polos 206 no tienen memoria. Es decir, los parámetros de filtro 204 relacionan la trama o sub-trama particular de la señal de excitación de banda alta 202 que se está procesando y no incluyen información relacionada con tramas o sub-tramas procesadas previamente. En otro ejemplo, las sub-tramas 570, 572, 574, 576 de la señal de excitación de 5 banda alta 560 de las FIGs. 5 y 6 pueden aplicarse a los filtros de todos los polos 612, 614, 616, 618 correspondientes. En este ejemplo, los parámetros de filtro 552, 554, 556, 558 aplicados a cada uno de los filtros de todos los polos 612, 614, 616, 618 no tienen memoria.
[0051] El procedimiento 800 incluye también, en 804, la determinación de factores de escalado basándose en la 10 energía de sub-tramas de la primera señal de banda alta modelada y la energía de las sub-tramas correspondientes de la porción de banda alta de la señal de audio. Por ejemplo, los factores de escalado 230 de la FIG. 2 pueden determinarse dividiendo la energía estimada 224 de una sub-trama de la señal de banda alta 124 por la energía de sub-trama 212 estimada de una sub-trama correspondiente de la primera señal de banda alta modelada 208. En otro ejemplo, los factores de escalado 672, 674, 676, 678 de la FIG. 6 pueden determinarse dividiendo la energía 15 estimada 652, 654, 656, 658 de una sub-trama de la señal de banda alta 502 por la energía estimada 642, 644, 646, 648 de una sub-trama 622, 624, 626, 628 correspondiente, de la primera señal de banda alta modelada.
[0052] El procedimiento 800 incluye, en 806, la aplicación de los factores de escalado a una señal de excitación de banda alta modelada para determinar una señal de excitación de banda alta escalada. Por ejemplo, el factor de 20 escalado 230 de la FIG. 2 puede aplicarse a la señal de excitación de banda alta 202, sub-trama a sub-trama, para generar la señal de excitación de banda alta escalada. En otro ejemplo, los factores de escalado 672, 674, 676, 678 de la FIG. 6 pueden aplicarse a las correspondientes sub-tramas 570, 572, 574, 576 de la señal de excitación de banda alta 560 para generar las sub-tramas 702, 704, 706, 708 de la señal de excitación de banda alta escalada. En un modo de realización particular, se puede determinar un primer conjunto de uno o más factores de escalado en 25 804, y un segundo conjunto de uno o más factores de escalado puede aplicarse a la señal de excitación de banda alta modelada en 806. El segundo conjunto de uno o más factores de escalado se puede determinar basándose en el primer conjunto de uno o más factores de escalado. Por ejemplo, las ganancias asociadas con múltiples sub-tramas usadas para determinar el primer conjunto de uno o más factores de escalado se pueden promediar para determinar el segundo conjunto de uno o más factores de escalado. En este ejemplo, el segundo conjunto de uno o 30 más factores de escalado puede incluir menos factores de escalado que el primer conjunto de uno o más factores de escalado.
[0053] El procedimiento 800 incluye, en 808, la determinación de una segunda señal de banda alta modelada basándose en la señal de excitación de banda alta escalada. Para ilustrar, se puede realizar un análisis de 35 predicción lineal de la señal de excitación de banda alta escalada. Por ejemplo, la señal de excitación de banda alta escalada 240 de la FIG. 2 puede aplicarse al filtro de todos los polos 244 con los parámetros de filtro 242 para determinar la segunda señal de banda alta modelada (por ejemplo, sintetizada) 246. Los parámetros de filtro 242 pueden incluir memoria (por ejemplo, se pueden actualizar basándose en tramas o sub-tramas procesadas previamente). En otro ejemplo, las sub-tramas 702, 704, 706, 708 de la señal de excitación de banda alta escalada 40 de la FIG. 7 pueden aplicarse a los filtros de todos los polos 714, 716, 718 con los parámetros de filtro 722, 724, 726, 728 para determinar las sub-tramas 742, 744, 746, 748 de la segunda señal de banda alta modelada (por ejemplo, sintetizada). Los parámetros de filtro 722, 724, 726, 728 pueden incluir memoria (por ejemplo, se pueden actualizar basándose en tramas o sub-tramas previamente procesadas).
45
[0054] El procedimiento 800 incluye, en 810, la determinación de parámetros de ganancia basándose en la segunda señal de banda alta modelada y la porción de banda alta de la señal de audio. Por ejemplo, la segunda señal de banda alta modelada 246 y la señal de banda alta 124 pueden proporcionarse al estimador de forma de ganancia 248 de la FIG. 2. El estimador de forma de ganancia 248 puede determinar los parámetros de ganancia 250. Además, la segunda señal de banda alta modelada 246, la señal de banda alta 124 y los parámetros de ganancia 50 250 pueden proporcionarse al estimador de trama de ganancia 252, que puede determinar la ganancia de trama 254. En otro ejemplo, las sub-tramas 742, 744, 746, 748 de la segunda señal de banda alta modelada pueden usarse para formar una trama 752 de la segunda señal de banda alta modelada. La trama 752 de la segunda señal de banda alta modelada y una trama correspondiente de la señal de banda alta 502 pueden proporcionarse al estimador de forma de ganancia 754 de la FIG. 7. El estimador de forma de ganancia 754 puede determinar los 55 parámetros de ganancia 756. Además, la trama 752 de la segunda señal de banda alta modelada, la trama correspondiente de la señal de banda alta 502 y los parámetros de ganancia 756 pueden proporcionarse al estimador de trama de ganancia 758, que puede determinar la ganancia de trama 760. Los parámetros de ganancia y ganancia de trama pueden incluirse en la información lateral de banda alta, tal como la información lateral de banda alta 172 de la FIG. 1, que se incluye en un flujo de bits 192 utilizado para codificar una señal de audio, tal 60 como la señal de audio 102.
[0055] Las FIGs. 1-8 ilustran, por lo tanto, ejemplos que incluyen sistemas y procedimientos que realizan la codificación de señales de audio de una manera que utiliza factores de escalado para explicar las diferencias de energía entre una porción de banda alta de una señal de audio, tal como la señal de banda alta 124 de la FIG. 1 y 65 una versión modelada o sintetizada de la señal de banda alta que se basa en una señal de excitación de banda baja,
tal como la señal de excitación de banda baja 144. El uso de los factores de escalado para representar las diferencias de energía puede mejorar el cálculo de la información de ganancia, por ejemplo, reduciendo un rango dinámico de la información de ganancia. Los sistemas y procedimientos de las FIGs. 1-8 pueden integrarse en y/o realizarse mediante uno o más dispositivos electrónicos, tales como un teléfono móvil, una unidad de sistemas de comunicación personal de mano (PCS), un dispositivo de comunicaciones, un reproductor de música, un reproductor 5 de vídeo, una unidad de entretenimiento, un descodificador, un dispositivo de navegación, un dispositivo habilitado para el sistema de posicionamiento global (GPS), un PDA, un ordenador, una unidad de datos portátil (tal como un asistente de datos personales), una unidad de datos de localización fija (como un equipo medidor), o cualquier otro dispositivo que realice funciones de codificación y/o descodificación de señal de audio.
10
[0056] Con referencia a la FIG. 9, se representa un diagrama de bloques de un modo de realización particular ilustrativo de un dispositivo de comunicación inalámbrica y se designa en general como 900. El dispositivo 900 incluye al menos un procesador conectado a una memoria 932. Por ejemplo, en el modo de realización ilustrado en la FIG. 9, el dispositivo 900 incluye un primer procesador 910 (por ejemplo, una unidad central de procesamiento (CPU)) y un segundo procesador 912 (por ejemplo, un DSP, etc.). En otros modos de realización, el dispositivo 900 15 puede incluir solamente un único procesador, o puede incluir más de dos procesadores. La memoria 932 puede incluir instrucciones 960 ejecutables por al menos uno de los procesadores 910, 912 para realizar los procedimientos y procesos divulgados en el presente documento, tales como el procedimiento 700 de la FIG. 8 o uno o más de los procedimientos descritos con referencia a las FIGs. 1-7.
20
[0057]Por ejemplo, las instrucciones 960 pueden incluir o corresponder a un módulo de análisis de banda baja 976 y un módulo de análisis de banda alta 978. En un modo de realización particular, el módulo de análisis de banda baja 976 corresponde al módulo de análisis de banda baja 130 de la FIG. 1, y el módulo de análisis de banda alta 978 corresponde al módulo de análisis de banda alta 150 de la FIG. 1. Además, o de forma alternativa, el módulo de análisis de banda alta 978 puede corresponder a o incluir una combinación de componentes de las FIGs. 2 o 5-7. 25
[0058] En diversos modos de realización, el módulo de análisis de banda baja 976, el módulo de alta banda de análisis 978, o ambos, pueden implementarse a través de hardware dedicado (por ejemplo, circuitos), mediante un procesador (por ejemplo, el procesador 912) que ejecute las instrucciones 960 o instrucciones 961 en una memoria 980 para realizar una o más tareas, o una combinación de las mismas. A modo de ejemplo, la memoria 932 o la 30 memoria 980 puede incluir o corresponder a un dispositivo de memoria, tal como una memoria de acceso aleatorio (RAM), memoria de acceso aleatorio magnetorresistiva (MRAM), MRAM de transferencia de par de giro (STT-MRAM), memoria flash, memoria de solo lectura (ROM), memoria de solo lectura programable (PROM), memoria de solo lectura programable borrable (EPROM), memoria de solo lectura programable borrable eléctricamente (EEPROM), registros, disco duro, disco extraíble o memoria de solo lectura de disco compacto (CD-ROM). El 35 dispositivo de memoria puede incluir instrucciones (por ejemplo, las instrucciones 960 o las instrucciones 961) que, cuando son ejecutadas por un ordenador (por ejemplo, el procesador 910 y/o el procesador 912), pueden hacer que el ordenador determine factores de escalado basados en energía de sub-tramas de una primera señal de banda alta modelada y energía de sub-tramas correspondientes de una porción de banda alta de una señal de audio, aplique los factores de escalado a una señal de excitación de banda alta modelada para determinar una señal de excitación 40 de banda alta escalada, determine una segunda señal de banda alta modelada basándose en la señal de excitación de banda alta escalada y determine parámetros de ganancia basados en la segunda señal de banda alta modelada y la porción de banda alta de la señal de audio. Como ejemplo, la memoria 932 o la memoria 980 puede ser un medio no transitorio legible por ordenador que incluye instrucciones que, cuando son ejecutadas por un ordenador (por ejemplo, el procesador 910 y/o el procesador 912), hacen que el ordenador ejecute al menos una porción del 45 procedimiento 800 de la FIG. 8.
[0059] La FIG. 9 también muestra un controlador de visualización 926 que está conectado al procesador 910 y a una pantalla 928. Un CODEC 934 puede estar conectado al procesador 912, como se muestra, al procesador 910, o a ambos. Un altavoz 936 y un micrófono 938 se pueden conectar al CODEC 934. Por ejemplo, el micrófono 938 puede 50 generar la señal de audio de entrada 102 de la FIG. 1, y el procesador 912 puede generar el flujo de bits de salida 192 para su transmisión a un receptor basándose en la señal de audio de entrada 102. Como otro ejemplo, el altavoz 936 puede usarse para emitir una señal reconstruida a partir del flujo de bits de salida 192 de la FIG. 1, donde el flujo de bits de salida 192 se recibe desde un transmisor. La FIG. 9 indica también que un controlador inalámbrico 940 puede estar conectado al procesador 910, al procesador 912, o ambos, y a una antena 942. En un 55 modo de realización particular, el CODEC 934 es un componente de interfaz de usuario de procesamiento de audio analógico. Por ejemplo, el CODEC 934 puede realizar un ajuste de ganancia analógico y un ajuste de parámetros para señales recibidas desde el micrófono 938 y señales transmitidas al altavoz 936. El CODEC 934 también puede incluir convertidores analógico a digital (A/D) y digital a analógico (D/A). En un ejemplo particular, el CODEC 934 también incluye uno o más moduladores y filtros de procesamiento de señales. El CODEC 934 puede incluir una 60 memoria para almacenar en memoria intermedia los datos de entrada recibidos desde el micrófono 938 y para almacenar en memoria intermedia datos de salida que han de proporcionarse al altavoz 936.
[0060] En un modo de realización particular, el procesador 910, el procesador 912, el controlador de visualización 926, la memoria 932, el CODEC 934 y el controlador inalámbrico 940 pueden estar incluidos en un dispositivo de 65 sistema en paquete o sistema en chip 922. En un modo de realización particular, un dispositivo de entrada 930,
como una pantalla táctil y/o un teclado, y una fuente de alimentación 944 están conectados al dispositivo de sistema en chip 922. Además, en un modo de realización particular, ilustrado en la FIG. 9, la pantalla 928, el dispositivo de entrada 930, el altavoz 936, el micrófono 938, la antena 942 y la fuente de alimentación 944 son externos al dispositivo de sistema en chip 922. Sin embargo, cada uno de la pantalla 928, el dispositivo de entrada 930, el altavoz 936, el micrófono 938, la antena 942 y la fuente de alimentación 944 pueden conectarse a un componente 5 del dispositivo de sistema en chip 922, tal como una interfaz o un controlador.
[0061] En conjunción con los modos de realización descritos, se divulga un aparato que incluye medios para determinar una primera señal de banda alta modelada basándose en una señal de excitación de banda baja de una señal de audio, donde la señal de audio incluye una porción de banda alta y una porción de banda baja. Por 10 ejemplo, el módulo de análisis de banda alta 150 (o un componente del mismo, tal como el módulo de análisis y codificación de LP 158) puede determinar la primera señal de banda alta modelada basándose en la señal de excitación de banda baja 144 de la señal de audio 102. Como otro ejemplo, un primer filtro de síntesis, tal como el filtro de síntesis de LP de todos los polos 206 de la FIG. 2 puede determinar la primera señal de banda alta modelada 208 basada en la señal de excitación de banda alta 202. La señal de excitación de banda alta 202 puede 15 ser determinada por el generador de excitación de banda alta 152 de la FIG. 1 basándose en la señal de excitación de banda baja 144) de una señal de audio. Como otro ejemplo más, un conjunto de primeros filtros de síntesis, tales como los filtros de todos los polos 612, 614, 616, 618 de la FIG. 6 pueden determinar las sub-tramas 622, 624, 626, 628 de la primera señal de banda alta modelada basándose en las sub-tramas 570, 572, 574, 576 de la señal de excitación de banda alta. Como otro ejemplo más, el procesador 910 de la FIG. 9, el procesador 912 o un 20 componente de uno de los procesadores 910, 912 (tal como el módulo de análisis de banda alta 978 o las instrucciones 961) puede determinar la primera señal de banda alta modelada basándose en la señal de excitación de banda baja.
[0062] El aparato también incluye medios para determinar los factores de escalado basándose en la energía de sub-25 tramas de la primera señal de banda alta modelada y la energía de sub-tramas correspondiente de la porción de banda alta de la señal de audio. Por ejemplo, el estimador de energía 154 y el módulo de escalado 156 de la FIG. 1 pueden determinar los factores de escalado. En otro ejemplo, los factores de escalado 230 pueden determinarse basándose en la energía de sub-trama estimada 212 y 224 de la FIG. 2. En otro ejemplo más, los factores de escalado 672, 674, 676, 678 pueden determinarse basándose en la energía estimada 642, 644, 646, 648 y la 30 energía estimada 652, 654, 656, 658, respectivamente, de la FIG. 6. Como otro ejemplo más, el procesador 910 de la FIG. 9, el procesador 912 o un componente de uno de los procesadores 910, 912 (tal como el módulo de análisis de banda alta 978 o las instrucciones 961) puede determinar los factores de escalado.
[0063] El aparato también incluye medios para aplicar los factores de escalado para una señal de excitación de 35 banda alta modelada para determinar una señal de excitación de banda alta escalada. Por ejemplo, el módulo de escalado 156 de la FIG. 1 puede aplicar los factores de escalado a la señal de excitación de banda alta modelada para determinar la señal de excitación de banda alta escalada. En otro ejemplo, un combinador (por ejemplo, un multiplicador) puede aplicar los factores de escalado 230 a la señal de excitación de banda alta modelada 202 para determinar la señal de excitación de banda alta escalada 240 de la FIG. 2. En otro ejemplo más, los combinadores 40 (por ejemplo, los multiplicadores) pueden aplicar los factores de escalado 672, 674, 676, 678 a las sub-tramas 570, 572, 574, 576 de la señal de excitación de banda alta para determinar las sub-tramas 702, 704, 706, 708 de la señal de excitación de banda alta escalada de la FIG. 7. Como otro ejemplo más, el procesador 910 de la FIG. 9, el procesador 912 o un componente de uno de los procesadores 910, 912 (tal como el módulo de análisis de banda alta 978 o las instrucciones 961) pueden aplicar los factores de escalado a una señal de excitación de banda alta 45 modelada para determinar una señal de excitación de banda alta escalada.
[0064] El dispositivo también incluye medios para determinar una segunda señal de banda alta modelada basándose en la señal de excitación de banda alta escalada. Por ejemplo, el módulo de análisis de banda alta 150 (o un componente del mismo, tal como el módulo de análisis y codificación de LP 158) puede determinar la segunda 50 señal de banda alta modelada basándose en la señal de excitación de banda alta escalada. Como otro ejemplo, un segundo filtro de síntesis, tal como el filtro de todos los polos 244 de la FIG. 2, puede determinar la segunda señal de banda alta modelada 246 basándose en la señal de excitación de banda alta escalada 240. Como otro ejemplo más, un conjunto de segundos filtros de síntesis, tales como los filtros de todos los polos 712, 714, 716, 718 de la FIG. 7 pueden determinar las sub-tramas 742, 744, 746, 748 de la segunda señal de banda alta modelada 55 basándose en las sub-tramas 702, 704, 706, 708 de la señal de excitación de banda alta escalada. Como otro ejemplo más, el procesador 910 de la FIG. 9, el procesador 912 o un componente de uno de los procesadores 910, 912 (tal como el módulo de análisis de banda alta 978 o las instrucciones 961) pueden determinar la segunda señal de banda alta modelada basándose en la señal de excitación de banda alta escalada.
60
[0065] El aparato también incluye medios para determinar parámetros de ganancia basándose en la segunda señal de banda alta modelada y la porción de banda alta de la señal de audio. Por ejemplo, el estimador de ganancia 164 de la FIG. 1 puede determinar los parámetros de ganancia. En otro ejemplo, el estimador de forma de ganancia 248, el estimador de trama de ganancia 252, o ambos, pueden determinar información de ganancia, tal como los parámetros de ganancia 250 y la ganancia de trama 254. En otro ejemplo más, el estimador de forma de ganancia 65 754, el estimador de trama de ganancia 758, o ambos, pueden determinar información de ganancia, tal como los
parámetros de ganancia 756 y la ganancia de trama 760. Como otro ejemplo más, el procesador 910 de la FIG. 9, el procesador 912 o un componente de uno de los procesadores 910, 912 (tal como el módulo de análisis de banda alta 978 o las instrucciones 961) puede determinar los parámetros de ganancia basándose en la segunda señal de banda alta modelada y la porción de banda alta de la señal de audio.
5
[0066] Los expertos en la técnica apreciarán además que los diversos bloques lógicos, configuraciones, módulos, circuitos y pasos de algoritmo ilustrativos descritos en relación con los modos de realización divulgados en el presente documento pueden implementarse como hardware electrónico, software informático ejecutado por un dispositivo de procesamiento tal como un procesador de hardware, o combinaciones de ambos. Diversos componentes, bloques, configuraciones, módulos, circuitos y pasos ilustrativos se han descrito anteriormente en 10 general en lo que respecta a su funcionalidad. Si dicha funcionalidad se implementa como hardware o software ejecutable depende de la aplicación específica y las restricciones de diseño impuestas al sistema completo. Los expertos en la técnica pueden implementar la funcionalidad descrita de varias maneras para cada aplicación particular, pero no debería interpretarse que tales decisiones de implementación suponen apartarse del alcance de la presente invención. 15
[0067] Las etapas de un procedimiento o algoritmo descrito en relación con los modos de realización divulgados en el presente documento pueden realizarse directamente en hardware, en un módulo de software ejecutado por un procesador o en una combinación de los dos. Un módulo de software puede residir en un dispositivo de memoria, tal como RAM, MRAM, STT-MRAM, memoria flash, ROM, PROM, EPROM, EEPROM, registros, disco duro, un disco 20 extraíble o un CD-ROM. Un dispositivo de memoria a modo de ejemplo está conectado al procesador de tal manera que el procesador puede leer información de, y escribir información en, el medio de almacenamiento. De forma alternativa, el dispositivo de memoria puede estar integrado en el procesador. El procesador y el medio de almacenamiento pueden residir en un ASIC. El ASIC puede residir en un dispositivo informático o un terminal de usuario. De forma alternativa, el procesador y el medio de almacenamiento pueden residir como componentes 25 discretos en un dispositivo informático o en un terminal de usuario.
[0068] La anterior descripción de los modos de realización divulgados se proporciona para permitir que cualquier experto en la técnica realice o use los modos de realización divulgados. Diversas modificaciones de estos modos de realización resultarán fácilmente evidentes a los expertos en la técnica, y los principios definidos en el presente 30 documento pueden aplicarse a otros modos de realización sin apartarse del alcance de la divulgación. Por lo tanto, la presente divulgación no pretende limitarse a los modos de realización mostrados en el presente documento, sino que se le concede el alcance más amplio posible compatible con los principios y características novedosas definidos en las reivindicaciones siguientes.

Claims (15)

  1. REIVINDICACIONES
    1. Un procedimiento que comprende:
    determinar una primera señal de banda alta modelada basándose en una señal de excitación de 5 banda baja de una señal de audio, incluyendo la señal de audio una porción de banda alta y una porción de banda baja;
    determinar un primer conjunto de uno o más factores de escalado basándose en energía de sub-tramas de la primera señal de banda alta modelada y energía de sub-tramas correspondientes de la 10 porción de banda alta de la señal de audio;
    estando el procedimiento caracterizado por:
    aplicar un segundo conjunto de uno o más factores de escalado basándose en al menos uno entre el 15 primer conjunto de uno o más factores de escalado a una señal de excitación de banda alta modelada para determinar una señal de excitación de banda alta escalada;
    determinar una segunda señal de banda alta modelada basándose en la señal de excitación de banda alta escalada; y 20
    determinar parámetros de ganancia basándose en la segunda señal de banda alta modelada y la porción de banda alta de la señal de audio.
  2. 2. El procedimiento según la reivindicación 1, en el que una sub-trama particular de la primera señal de banda 25 alta modelada se determina aplicando un filtro de síntesis en una sub-trama particular de la señal de excitación de banda alta modelada.
  3. 3. El procedimiento según la reivindicación 2, en el que el filtro de síntesis utiliza parámetros de filtro correspondientes a la sub-trama particular de la señal de excitación de banda alta modelada. 30
  4. 4. El procedimiento según la reivindicación 3, en el que los estados de filtro o la memoria de filtro se reinician antes de aplicar el filtro de síntesis en la sub-trama particular de la señal de excitación de banda alta modelada.
    35
  5. 5. El procedimiento según la reivindicación 3, en el que los parámetros de filtro no incluyen información relacionada con sub-tramas que preceden a la sub-trama particular de la señal de excitación de banda alta modelada.
  6. 6. El procedimiento según la reivindicación 1, en el que una sub-trama particular de la segunda señal de banda 40 alta modelada se determina aplicando un filtro de síntesis en una sub-trama particular de la señal de excitación de banda alta escalada que corresponde a la sub-trama particular de la segunda señal de banda alta modelada.
  7. 7. El procedimiento según la reivindicación 6, en el que el filtro de síntesis utiliza una memoria de filtro o 45 actualiza estados de filtro basándose en la sub-trama particular de la señal de excitación de banda alta escalada y una o más sub-tramas anteriores.
  8. 8. El procedimiento según la reivindicación 7, en el que la memoria de filtro o los estados de filtro no se reinician y se transfieren desde una trama o sub-trama anterior antes de aplicar el filtro de síntesis en la sub-trama 50 particular de la señal de excitación de banda alta escalada.
  9. 9. El procedimiento según la reivindicación 1, que comprende además estimar la energía de uno o más de las sub-tramas de la primera señal de banda alta modelada que se sintetiza basándose en filtros de síntesis de todos los polos, en el que los filtros de síntesis de todos los polos tienen coeficientes de filtro que son 55 interpolados basándose en una suma ponderada de uno o más pares espectrales de línea asociados con una trama actual y de uno o más pares espectrales de línea asociados con una trama anterior.
  10. 10. El procedimiento según la reivindicación 1, en el que la determinación de un factor de escalado para una sub-trama particular comprende: 60
    determinar una energía de la sub-trama particular de la porción de banda alta de la señal de audio;
    determinar una energía de una sub-trama correspondiente de la primera señal de banda alta modelada;
    65
    dividir la energía de la sub-trama particular de la porción de banda alta de la señal de audio por la energía
    de la sub-trama correspondiente de la primera señal de banda alta modelada; y
    cuantificar y transmitir el factor de escalado.
  11. 11. El procedimiento según la reivindicación 10, en el que el primer conjunto de uno o más factores de escalado 5 se determina sobre cada sub-trama o sobre cada trama que constituye múltiples sub-tramas.
  12. 12. El procedimiento según la reivindicación 1, en el que los parámetros de ganancia incluyen una forma de ganancia y una trama de ganancia.
    10
  13. 13. El procedimiento según la reivindicación 1, que comprende además determinar la señal de excitación de banda alta modelada combinando una señal de excitación de banda baja transformada con una señal de ruido configurada.
  14. 14. Un dispositivo que comprende: 15
    medios configurados para determinar una primera señal de banda alta modelada basándose en una señal de excitación de banda baja de una señal de audio, incluyendo la señal de audio una porción de banda alta y una porción de banda baja;
    20
    medios configurados para determinar factores de escalado basándose en energía de sub-tramas de la primera señal de banda alta modelada y energía de las sub-tramas correspondientes de la porción de banda alta de la señal de audio;
    estando el dispositivo caracterizado por comprender además: medios configurados para aplicar los 25 factores de escalado a una señal de excitación de banda alta modelada para determinar una señal de excitación de banda alta escalada;
    medios configurados para determinar una segunda señal de banda alta modelada basándose en la señal de excitación de banda alta escalada; y 30
    medios configurados para determinar parámetros de ganancia basándose en la segunda señal de banda alta modelada y la porción de banda alta de la señal de audio.
  15. 15. Un medio legible por ordenador no transitorio que almacena instrucciones que son ejecutables por un 35 procesador para hacer que el procesador realice el procedimiento de cualquiera de las reivindicaciones 1 a 13.
ES14796594.1T 2013-10-14 2014-10-14 Procedimiento, aparato, dispositivo, medio legible por ordenador para la extensión de ancho de banda de una señal de audio que usa una excitación de banda alta escalada Active ES2643828T3 (es)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201361890812P 2013-10-14 2013-10-14
US201361890812P 2013-10-14
US14/512,892 US9384746B2 (en) 2013-10-14 2014-10-13 Systems and methods of energy-scaled signal processing
US201414512892 2014-10-13
PCT/US2014/060448 WO2015057680A1 (en) 2013-10-14 2014-10-14 Method, apparatus, device, computer-readable medium for bandwidth extension of an audio signal using a scaled high-band excitation

Publications (1)

Publication Number Publication Date
ES2643828T3 true ES2643828T3 (es) 2017-11-24

Family

ID=52810406

Family Applications (1)

Application Number Title Priority Date Filing Date
ES14796594.1T Active ES2643828T3 (es) 2013-10-14 2014-10-14 Procedimiento, aparato, dispositivo, medio legible por ordenador para la extensión de ancho de banda de una señal de audio que usa una excitación de banda alta escalada

Country Status (22)

Country Link
US (1) US9384746B2 (es)
EP (1) EP3058570B1 (es)
JP (1) JP6045762B2 (es)
KR (1) KR101806058B1 (es)
CN (1) CN105593935B (es)
AU (1) AU2014337537C1 (es)
CA (1) CA2925894C (es)
CL (1) CL2016000834A1 (es)
DK (1) DK3058570T3 (es)
ES (1) ES2643828T3 (es)
HK (1) HK1219800A1 (es)
HU (1) HUE033434T2 (es)
MX (1) MX352483B (es)
MY (1) MY182138A (es)
NZ (1) NZ717786A (es)
PH (1) PH12016500600A1 (es)
RU (1) RU2679346C2 (es)
SA (1) SA516370876B1 (es)
SG (1) SG11201601783YA (es)
SI (1) SI3058570T1 (es)
WO (1) WO2015057680A1 (es)
ZA (1) ZA201602115B (es)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9697843B2 (en) * 2014-04-30 2017-07-04 Qualcomm Incorporated High band excitation signal generation
CN105336336B (zh) 2014-06-12 2016-12-28 华为技术有限公司 一种音频信号的时域包络处理方法及装置、编码器
US9984699B2 (en) 2014-06-26 2018-05-29 Qualcomm Incorporated High-band signal coding using mismatched frequency ranges
US10475457B2 (en) * 2017-07-03 2019-11-12 Qualcomm Incorporated Time-domain inter-channel prediction
EP3669542B1 (en) * 2017-08-15 2023-10-11 Dolby Laboratories Licensing Corporation Bit-depth efficient image processing
US10580420B2 (en) * 2017-10-05 2020-03-03 Qualcomm Incorporated Encoding or decoding of audio signals

Family Cites Families (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6141638A (en) 1998-05-28 2000-10-31 Motorola, Inc. Method and apparatus for coding an information signal
US7117146B2 (en) 1998-08-24 2006-10-03 Mindspeed Technologies, Inc. System for improved use of pitch enhancement with subcodebooks
US7272556B1 (en) 1998-09-23 2007-09-18 Lucent Technologies Inc. Scalable and embedded codec for speech and audio signals
GB2342829B (en) 1998-10-13 2003-03-26 Nokia Mobile Phones Ltd Postfilter
CA2252170A1 (en) 1998-10-27 2000-04-27 Bruno Bessette A method and device for high quality coding of wideband speech and audio signals
US6449313B1 (en) 1999-04-28 2002-09-10 Lucent Technologies Inc. Shaped fixed codebook search for celp speech coding
US6704701B1 (en) 1999-07-02 2004-03-09 Mindspeed Technologies, Inc. Bi-directional pitch enhancement in speech coding systems
CA2399706C (en) 2000-02-11 2006-01-24 Comsat Corporation Background noise reduction in sinusoidal based speech coding systems
US7110953B1 (en) 2000-06-02 2006-09-19 Agere Systems Inc. Perceptual coding of audio signals using separated irrelevancy reduction and redundancy reduction
US6760698B2 (en) 2000-09-15 2004-07-06 Mindspeed Technologies Inc. System for coding speech information using an adaptive codebook with enhanced variable resolution scheme
WO2002023536A2 (en) 2000-09-15 2002-03-21 Conexant Systems, Inc. Formant emphasis in celp speech coding
CA2327041A1 (en) * 2000-11-22 2002-05-22 Voiceage Corporation A method for indexing pulse positions and signs in algebraic codebooks for efficient coding of wideband signals
US6766289B2 (en) 2001-06-04 2004-07-20 Qualcomm Incorporated Fast code-vector searching
JP3457293B2 (ja) 2001-06-06 2003-10-14 三菱電機株式会社 雑音抑圧装置及び雑音抑圧方法
US7146313B2 (en) 2001-12-14 2006-12-05 Microsoft Corporation Techniques for measurement of perceptual audio quality
US7047188B2 (en) 2002-11-08 2006-05-16 Motorola, Inc. Method and apparatus for improvement coding of the subframe gain in a speech coding system
US20050004793A1 (en) * 2003-07-03 2005-01-06 Pasi Ojala Signal adaptation for higher band coding in a codec utilizing band split coding
FI118550B (fi) 2003-07-14 2007-12-14 Nokia Corp Parannettu eksitaatio ylemmän kaistan koodaukselle koodekissa, joka käyttää kaistojen jakoon perustuvia koodausmenetelmiä
KR20050027179A (ko) * 2003-09-13 2005-03-18 삼성전자주식회사 오디오 데이터 복원 방법 및 그 장치
US7613607B2 (en) * 2003-12-18 2009-11-03 Nokia Corporation Audio enhancement in coded domain
US7788091B2 (en) 2004-09-22 2010-08-31 Texas Instruments Incorporated Methods, devices and systems for improved pitch enhancement and autocorrelation in voice codecs
JP2006197391A (ja) 2005-01-14 2006-07-27 Toshiba Corp 音声ミクシング処理装置及び音声ミクシング処理方法
CN101185124B (zh) * 2005-04-01 2012-01-11 高通股份有限公司 用于语音信号的分割频带编码的方法和设备
NZ562182A (en) * 2005-04-01 2010-03-26 Qualcomm Inc Method and apparatus for anti-sparseness filtering of a bandwidth extended speech prediction excitation signal
US8280730B2 (en) 2005-05-25 2012-10-02 Motorola Mobility Llc Method and apparatus of increasing speech intelligibility in noisy environments
DE102006022346B4 (de) 2006-05-12 2008-02-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Informationssignalcodierung
US8682652B2 (en) 2006-06-30 2014-03-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic
US9454974B2 (en) * 2006-07-31 2016-09-27 Qualcomm Incorporated Systems, methods, and apparatus for gain factor limiting
US9009032B2 (en) 2006-11-09 2015-04-14 Broadcom Corporation Method and system for performing sample rate conversion
US8005671B2 (en) * 2006-12-04 2011-08-23 Qualcomm Incorporated Systems and methods for dynamic normalization to reduce loss in precision for low-level signals
JPWO2008072671A1 (ja) 2006-12-13 2010-04-02 パナソニック株式会社 音声復号化装置およびパワ調整方法
US20080208575A1 (en) 2007-02-27 2008-08-28 Nokia Corporation Split-band encoding and decoding of an audio signal
US8352279B2 (en) * 2008-09-06 2013-01-08 Huawei Technologies Co., Ltd. Efficient temporal envelope coding approach by prediction between low band signal and high band signal
US8484020B2 (en) 2009-10-23 2013-07-09 Qualcomm Incorporated Determining an upperband signal from a narrowband signal
JP5812998B2 (ja) 2009-11-19 2015-11-17 テレフオンアクチーボラゲット エル エム エリクソン(パブル) オーディオコーデックにおけるラウドネスおよびシャープネスの補償のための方法および装置
US8600737B2 (en) 2010-06-01 2013-12-03 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for wideband speech coding
US8738385B2 (en) 2010-10-20 2014-05-27 Broadcom Corporation Pitch-based pre-filtering and post-filtering for compression of audio signals
EP2710590B1 (en) 2011-05-16 2015-10-07 Google, Inc. Super-wideband noise supression
CN102802112B (zh) 2011-05-24 2014-08-13 鸿富锦精密工业(深圳)有限公司 具有音频文件格式转换功能的电子装置
CN102800317B (zh) * 2011-05-25 2014-09-17 华为技术有限公司 信号分类方法及设备、编解码方法及设备
US9082398B2 (en) * 2012-02-28 2015-07-14 Huawei Technologies Co., Ltd. System and method for post excitation enhancement for low bit rate speech coding
CN105976830B (zh) * 2013-01-11 2019-09-20 华为技术有限公司 音频信号编码和解码方法、音频信号编码和解码装置

Also Published As

Publication number Publication date
KR101806058B1 (ko) 2017-12-06
KR20160067972A (ko) 2016-06-14
HUE033434T2 (en) 2017-11-28
EP3058570B1 (en) 2017-07-26
EP3058570A1 (en) 2016-08-24
DK3058570T3 (en) 2017-10-02
MY182138A (en) 2021-01-18
PH12016500600B1 (en) 2016-06-13
NZ717786A (en) 2018-05-25
RU2679346C2 (ru) 2019-02-07
CN105593935B (zh) 2017-06-09
JP6045762B2 (ja) 2016-12-14
RU2016113836A (ru) 2017-11-20
RU2016113836A3 (es) 2018-07-06
SI3058570T1 (sl) 2017-10-30
WO2015057680A1 (en) 2015-04-23
ZA201602115B (en) 2017-09-27
US20150106107A1 (en) 2015-04-16
HK1219800A1 (zh) 2017-04-13
SG11201601783YA (en) 2016-04-28
US9384746B2 (en) 2016-07-05
SA516370876B1 (ar) 2019-08-03
JP2016532912A (ja) 2016-10-20
MX2016004630A (es) 2016-08-01
CL2016000834A1 (es) 2016-11-25
PH12016500600A1 (en) 2016-06-13
MX352483B (es) 2017-11-27
CA2925894C (en) 2018-01-02
CA2925894A1 (en) 2015-04-23
AU2014337537C1 (en) 2018-02-01
AU2014337537B2 (en) 2017-08-03
CN105593935A (zh) 2016-05-18

Similar Documents

Publication Publication Date Title
ES2643828T3 (es) Procedimiento, aparato, dispositivo, medio legible por ordenador para la extensión de ancho de banda de una señal de audio que usa una excitación de banda alta escalada
ES2350494T3 (es) Procedimiento y aparatos para codificar y decodificar una parte de banda alta de una señal de habla.
ES2391292T3 (es) Sistemas, procedimientos y aparato para la generación de una señal de excitación de banda alta
ES2777282T3 (es) Extensión de ancho de banda armónico de señales de audio
ES2660605T3 (es) Estimación de factores de mezcla para generar una señal de excitación de banda alta
ES2715476T3 (es) Sistemas y procedimientos para realizar la modulación de ruido y el ajuste de ganancia
ES2774334T3 (es) Estimación de forma de ganancia para mejorar el rastreo de características temporales de banda alta
ES2618258T3 (es) Sistemas y procedimientos para realizar el control de ganancia
ES2807258T3 (es) Escalado para circuitería de forma de ganancia
AU2014337537A1 (en) Method, apparatus, device, computer-readable medium for bandwidth extension of an audio signal using a scaled high-band excitation
ES2688037T3 (es) Aparato y procedimientos de conmutación de tecnologías de codificación en un dispositivo
BR112016008236B1 (pt) Método, aparelho, dispositivo, meio legível por computador para extensão de largura de banda de um sinal de áudio com uso de uma excitação de banda alta dimensionada
BR112016007938B1 (pt) Estimação de fatores de mistura para gerar sinal de excitação de banda alta