ES2774334T3 - Estimación de forma de ganancia para mejorar el rastreo de características temporales de banda alta - Google Patents

Estimación de forma de ganancia para mejorar el rastreo de características temporales de banda alta Download PDF

Info

Publication number
ES2774334T3
ES2774334T3 ES14790439T ES14790439T ES2774334T3 ES 2774334 T3 ES2774334 T3 ES 2774334T3 ES 14790439 T ES14790439 T ES 14790439T ES 14790439 T ES14790439 T ES 14790439T ES 2774334 T3 ES2774334 T3 ES 2774334T3
Authority
ES
Spain
Prior art keywords
signal
band
gain shape
audio signal
shape parameters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES14790439T
Other languages
English (en)
Inventor
Venkata Subrahmanyam Chandra Sekhar Chebiyyam
Venkatraman S Atti
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Application granted granted Critical
Publication of ES2774334T3 publication Critical patent/ES2774334T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)

Abstract

Un procedimiento para generar una versión codificada (199) de una señal de audio (102), en el que la versión codificada de la señal de audio se genera codificando una porción de banda baja (122) de la señal de audio, y a partir de información secundaria de banda alta (172) para reconstruir una porción de banda alta (124) de la señal de audio, comprendiendo el procedimiento: determinar, en un codificador de voz, primeros parámetros de forma de ganancia en base a una señal residual de banda alta asociada con la porción de banda alta de la señal de audio; generar una señal de excitación de banda alta en base a una señal armónicamente ampliada y a los primeros parámetros de forma de ganancia, en el que la señal armónicamente ampliada se basa en una señal de excitación de banda baja generada a partir de la porción de banda baja de la señal de audio; realizar una operación de síntesis de predicción lineal en la señal de excitación de banda alta para generar una señal de banda alta sintetizada; determinar segundos parámetros de forma de ganancia en base a la segunda señal de banda alta sintetizada y a la porción de banda alta de la señal de audio; e insertar al menos los primeros parámetros de forma de ganancia y los segundos parámetros de forma de ganancia en la versión codificada de la señal de audio para permitir el ajuste de ganancia durante la reproducción de la señal de audio a partir de la versión codificada de la señal de audio.

Description

DESCRIPCIÓN
Estimación de forma de ganancia para mejorar el rastreo de características temporales de banda alta
CAMPO
[0001] La presente divulgación se refiere en general al procesamiento de señales.
DESCRIPCIÓN DE LA TÉCNICA RELACIONADA
[0002] Los avances en la tecnología han dado como resultado dispositivos informáticos más pequeños y más potentes. Por ejemplo, existe actualmente una variedad de dispositivos informáticos personales portátiles, incluyendo dispositivos informáticos inalámbricos, tales como teléfonos inalámbricos portátiles, asistentes digitales personales (PDA) y dispositivos de paginación que son pequeños, ligeros y fáciles de transportar por los usuarios. Más específicamente, los teléfonos inalámbricos portátiles, tales como los teléfonos móviles y los teléfonos de Protocolo de Internet (IP), pueden transmitir paquetes de voz y datos a través de redes inalámbricas. Además, muchos de dichos teléfonos inalámbricos incluyen otros tipos de dispositivos que están incorporados en los mismos. Por ejemplo, un teléfono inalámbrico también puede incluir una cámara fotográfica digital, una cámara de vídeo digital, un grabador digital y un reproductor de ficheros de audio.
[0003] En los sistemas telefónicos tradicionales (por ejemplo, las redes telefónicas conmutadas públicas (PSTN)), el ancho de banda de señal está limitado al intervalo de frecuencias de 300 hercios (Hz) a 3,4 kilohercios (kHz). En aplicaciones de banda ancha (WB), tales como la telefonía móvil y la voz sobre protocolo de Internet (VoIP), el ancho de banda de señal puede abarcar el intervalo de frecuencias de 50 Hz a 7 kHz. Las técnicas de codificación de banda superancha (SWB) soportan un ancho de banda que se extiende hasta aproximadamente 16 kHz. La ampliación del ancho de banda de señal desde la telefonía de banda estrecha a 3,4 kHz hasta la telefonía SWB de 16 kHz puede mejorar la calidad de la reconstrucción, la inteligibilidad y la naturalidad de la señal.
[0004] Las técnicas de codificación SWB implican típicamente codificar y transmitir la porción de frecuencia más baja de la señal (por ejemplo, de 50 Hz a 7 kHz, también denominada “banda baja”). Por ejemplo, la banda baja se puede representar usando parámetros de filtro y/o una señal de excitación de banda baja. Sin embargo, con el fin de mejorar la eficacia de la codificación, la porción de frecuencia más alta de la señal (por ejemplo, de 7 kHz a 16 kHz, también llamada “banda alta”) puede no codificarse y transmitirse por completo. En su lugar, un receptor puede usar el modelado de señales para predecir la banda alta. En algunas implementaciones, los datos asociados a la banda alta se pueden proporcionar al receptor para asistir en la predicción. Dichos datos se pueden denominar “información secundaria” y pueden incluir información de ganancia, frecuencias espectrales de línea (LSF, también denominadas pares espectrales de línea (LSP)), etc. Las propiedades de la señal de banda baja se pueden usar para generar la información secundaria; sin embargo, las disparidades de energía entre la banda baja y la banda alta pueden dar como resultado información secundaria que caracterice incorrectamente a la banda alta.
[0005] El documento US 2005/004793 A1 describe una metodología para ajustar un algoritmo de ampliación de ancho de banda mediante la adaptación de uno o más parámetros de percepción de mejora de una señal codificada de banda alta en base a las características de la señal de entrada y a un rendimiento de codificación en una banda baja con un códec que usa la codificación de división de banda de audio por codificadores y decodificadores separados para cada banda de audio. Un bloque de control de ganancia coincide con las energías de la señal de error de predicción de LPC y de la señal de excitación exc(n).
[0006] El documento US 2006/282262 A1 describe una calculadora de factor de ganancia configurada para realizar el cálculo del factor de ganancia. Calcula un valor de ganancia para una subtrama correspondiente de acuerdo con las energías relativas de la señal de banda alta y la señal de banda alta sintetizada.
SUMARIO
[0007] La invención es como se define por las reivindicaciones adjuntas. Todas las apariciones de la palabra “modo(s) de realización”, excepto las correspondientes a las reivindicaciones, se refieren a ejemplos útiles para comprender la invención que se presentaron originalmente pero que no representan modos de realización de la invención actualmente reivindicada. Estos ejemplos se muestran solo con propósitos ilustrativos.
[0008] Se divulgan sistemas y procedimientos para realizar la estimación de la forma de ganancia en dos etapas para mejorar el rastreo de las características temporales de banda alta. Un codificador de voz usa una porción de banda baja (por ejemplo, una excitación de banda baja armónicamente ampliada) de una señal de audio para generar información (por ejemplo, información secundaria) usada para reconstruir una porción de banda alta de la señal de audio en un decodificador. Un primer estimador de forma de ganancia puede determinar variaciones de energía en la señal residual de banda alta que no están presentes en la excitación de banda baja armónicamente ampliada. Por ejemplo, el estimador de forma de ganancia puede estimar las variaciones o desviaciones temporales (por ejemplo, los niveles de energía) en la banda alta que están conmutadas, o ausentes, en la señal residual de banda alta relativa a la señal de excitación de banda baja armónicamente ampliada. El primer ajustador de forma de ganancia (en base a los primeros parámetros de forma de ganancia) puede ajustar la evolución temporal de la excitación de banda baja armónicamente ampliada de modo que imita estrechamente el envolvente temporal del residuo de banda alta. Se genera una señal de banda alta sintetizada en base a la excitación de banda baja armónicamente ampliada ajustada/modificada, y un segundo estimador de forma de ganancia puede determinar variaciones de energía entre la señal de banda alta sintetizada y la porción de banda alta de la señal de audio en una segunda etapa. La señal de banda alta sintetizada se puede ajustar para modelar la porción de banda alta de la señal de audio en base a datos (por ejemplo, los segundos parámetros de forma de ganancia) del segundo estimador de forma de ganancia. Los primeros parámetros de forma de ganancia y los segundos parámetros de forma de ganancia se transmiten al decodificador junto con otra información secundaria para reconstruir la porción de banda alta de la señal de audio.
[0009] En un aspecto particular, un procedimiento incluye determinar, en un codificador de voz, los primeros parámetros de forma de ganancia en base a una señal armónicamente ampliada y en base a una señal residual de banda alta asociada con una porción de banda alta de una señal de audio. En otro aspecto particular, los primeros parámetros de forma de ganancia se determinan en base a la evolución temporal en la señal residual de banda alta asociada con una porción de banda alta de una señal de audio. El procedimiento también incluye determinar los segundos parámetros de forma de ganancia en base a una señal de banda alta sintetizada y en base a la porción de banda alta de la señal de audio. El procedimiento incluye además insertar los primeros parámetros de forma de ganancia y los segundos parámetros de forma de ganancia en una versión codificada de la señal de audio para permitir el ajuste de ganancia durante la reproducción de la señal de audio de la versión codificada a partir de la señal de audio.
[0010] En otro aspecto particular, un aparato incluye un primer estimador de forma de ganancia configurado para determinar los primeros parámetros de forma de ganancia en base a una señal armónicamente ampliada y/o en base a una señal residual de banda alta asociada con una porción de banda alta de una señal de audio. El aparato también incluye un segundo estimador de forma de ganancia configurado para determinar los segundos parámetros de forma de ganancia en base a una señal de banda alta sintetizada y en base a la porción de banda alta de la señal de audio. El aparato incluye además un multiplexor configurado para insertar los primeros parámetros de forma de ganancia y los segundos parámetros de forma de ganancia en una versión codificada de la señal de audio para permitir el ajuste de ganancia durante la reproducción de la señal de audio a partir de la versión codificada de la señal de audio.
[0011] En otro aspecto particular, un medio no transitorio legible por ordenador incluye instrucciones que, cuando se ejecutan por un procesador, causan que el procesador determine los primeros parámetros de forma de ganancia en base a una señal armónicamente ampliada y en base a una señal residual de banda alta asociada con una porción de banda alta de una señal de audio. Las instrucciones también son ejecutables para causar que el procesador determine los segundos parámetros de forma de ganancia en base a una señal de banda alta sintetizada y en base a la porción de banda alta de la señal de audio. Las instrucciones también son ejecutables para causar que el procesador inserte los primeros parámetros de forma de ganancia y los segundos parámetros de forma de ganancia en una versión codificada de la señal de audio para permitir el ajuste de ganancia durante la reproducción de la señal de audio a partir de la versión codificada de la señal de audio.
[0012] En otro aspecto particular, un aparato incluye medios para determinar los primeros parámetros de forma de ganancia en base a una señal armónicamente ampliada y en base a una señal residual de banda alta asociada con una porción de banda alta de una señal de audio. El dispositivo también incluye medios para determinar los segundos parámetros de forma de ganancia en base a una señal de banda alta sintetizada y en base a la porción de banda alta de la señal de audio. El aparato también incluye medios para insertar los primeros parámetros de forma de ganancia y los segundos parámetros de forma de ganancia en una versión codificada de la señal de audio para permitir el ajuste de ganancia durante la reproducción de la señal de audio de la versión codificada de la señal de audio.
[0013] En otro aspecto particular, un procedimiento incluye recibir, en un decodificador de voz, una señal de audio codificada a partir de un codificador de voz. La señal de audio codificada incluye los primeros parámetros de forma de ganancia en base a una primera señal armónicamente ampliada generada en el codificador de voz y en base a una señal residual de banda alta generada en el codificador de voz. La señal de audio codificada también incluye los segundos parámetros de forma de ganancia en base a una primera señal de banda alta sintetizada generada en el codificador de voz y en base a una banda alta de una señal de audio. El procedimiento también incluye reproducir la señal de audio a partir de la señal de audio codificada en base a los primeros parámetros de forma de ganancia y en base a los segundos parámetros de forma de ganancia.
[0014] En otro aspecto particular, un decodificador de voz está configurado para recibir una señal de audio codificada desde un codificador de voz. La señal de audio codificada incluye los primeros parámetros de forma de ganancia en base a una señal armónicamente ampliada generada en el codificador de voz y en base a una señal residual de banda alta generada en el codificador de voz. La señal de audio codificada también incluye los segundos parámetros de forma de ganancia en base a una primera señal de banda alta sintetizada generada en el codificador de voz y en base a una banda alta de una señal de audio. El decodificador de voz está configurado además para reproducir la señal de audio a partir de la señal de audio codificada en base a los primeros parámetros de forma de ganancia y a los segundos parámetros de forma de ganancia.
[0015] En otro aspecto particular, un aparato incluye medios para recibir una señal de audio codificada desde un codificador de voz. La señal de audio codificada incluye los primeros parámetros de forma de ganancia en base a una primera señal armónicamente ampliada generada en el codificador de voz y en base a una señal residual de banda alta generada en el codificador de voz. La señal de audio codificada también incluye los segundos parámetros de forma de ganancia en base a una primera señal de banda alta sintetizada generada en el codificador de voz y en base a una banda alta de una señal de audio. El aparato también incluye medios para reproducir la señal de audio a partir de la señal de audio codificada en base a los primeros parámetros de forma de ganancia y en base a los segundos parámetros de forma de ganancia.
[0016] En otro aspecto particular, un medio no transitorio legible por ordenador incluye instrucciones que, cuando se ejecutan por un procesador, causan que el procesador reciba una señal de audio codificada desde un codificador de voz. La señal de audio codificada incluye los primeros parámetros de forma de ganancia en base a una primera señal armónicamente ampliada generada en el codificador de voz y en base a una señal residual de banda alta generada en el codificador de voz. La señal de audio codificada también incluye los segundos parámetros de forma de ganancia en base a una primera señal de banda alta sintetizada generada en el codificador de voz y en base a una banda alta de una señal de audio. Las instrucciones también son ejecutables para causar que el procesador reproduzca la señal de audio a partir de la señal de audio codificada en base a los primeros parámetros de forma de ganancia y a los segundos parámetros de forma de ganancia.
[0017] Las ventajas particulares proporcionadas por al menos uno de los modos de realización divulgados incluyen la mejora de la correlación de energía entre una excitación de banda baja armónicamente ampliada de una señal de audio y un residuo de banda alta de la señal de audio. Por ejemplo, la excitación de banda baja armónicamente ampliada se puede ajustar en base a los parámetros de forma de ganancia para imitar estrechamente las características temporales de la señal residual de banda alta. Otros aspectos, ventajas y rasgos característicos de la presente divulgación quedarán evidentes después de revisar la solicitud completa, incluyendo las siguientes secciones: Breve descripción de los dibujos, Descripción detallada y las Reivindicaciones.
BREVE DESCRIPCIÓN DE LOS DIBUJOS
[0018]
La FIG. 1 es un diagrama para ilustrar un modo de realización particular de un sistema que es operable para determinar los parámetros de forma de ganancia en dos etapas para la reconstrucción de banda alta;
la FIG. 2 es un diagrama para ilustrar un modo de realización particular de un sistema que es operable para determinar los parámetros de forma de ganancia en una primera etapa en base a una señal armónicamente ampliada y/o a una señal residual de banda alta;
la FIG. 3 es un diagrama de temporización para ilustrar los parámetros de forma de ganancia en base a disparidades de energía entre la señal armónicamente ampliada y la señal residual de banda alta;
la FIG. 4 es un diagrama para ilustrar un modo de realización particular de un sistema que es operable para determinar los segundos parámetros de forma de ganancia en una segunda etapa en base a una señal de banda alta sintetizada y a una porción de banda alta de una señal de audio de entrada;
la FIG. 5 es un diagrama para ilustrar un modo de realización particular de un sistema que es operable para reproducir una señal de audio usando los parámetros de forma de ganancia;
la FIG. 6 es un diagrama de flujo para ilustrar modos de realización particulares de procedimientos para usar estimaciones de ganancia para la reconstrucción de banda alta; y
la FIG. 7 es un diagrama de bloques de un dispositivo inalámbrico operativo para realizar operaciones de procesamiento de señales de acuerdo con los sistemas y procedimientos de las FIGS. 1-6.
DESCRIPCIÓN DETALLADA
[0019] Con referencia a la FIG. 1, se muestra un modo de realización particular de un sistema que es operable para determinar los parámetros de forma de ganancia en dos etapas para la reconstrucción de banda alta y en general se designa como 100. En un modo de realización particular, el sistema 100 puede estar integrado en un sistema o aparato de codificación (por ejemplo, en un teléfono inalámbrico, en un codificador/decodificador (CODEC) o en un procesador de señales digitales (DSP)). En otros modos de realización particulares, el sistema 100 se puede integrar en un decodificador, un reproductor de música, un reproductor de vídeo, una unidad de entretenimiento, un dispositivo de navegación, un dispositivo de comunicaciones, un PDA, una unidad de datos de localización fija o un ordenador.
[0020] Cabe destacar que, en la siguiente descripción, se indica que diversas funciones realizadas por el sistema 100 de la FIG. 1 se describen como realizadas por determinados componentes o módulos. Sin embargo, esta división de componentes y módulos sirve solo para ilustrar. En un modo de realización alternativo, una función realizada por un componente o módulo particular se puede, en su lugar, dividir entre múltiples componentes o módulos. Además, en un modo de realización alternativo, dos o más componentes o módulos de la FIG. 1 pueden estar integrados en un único componente o módulo. Cada componente o módulo ilustrado en la FIG. 1 se puede implementar usando hardware (por ejemplo, un dispositivo de matriz de puertas programables por campo (FPGA), un circuito integrado específico de la aplicación (ASIC), un DSP, un controlador, etc.), software (por ejemplo, instrucciones ejecutables por un procesador), o una combinación de los mismos.
[0021] El sistema 100 incluye un banco de filtros de análisis 110 que está configurado para recibir una señal de audio de entrada 102. Por ejemplo, se puede proporcionar la señal de audio de entrada 102 mediante un micrófono u otro dispositivo de entrada. En un modo de realización particular, la señal de audio de entrada 102 puede incluir voz. La señal de audio de entrada 102 puede ser una señal SWB que incluya datos en el intervalo de frecuencias desde aproximadamente 50 Hz hasta aproximadamente 16 kHz. El banco de filtros de análisis 110 puede filtrar la señal de audio de entrada 102 en múltiples porciones en base a la frecuencia. Por ejemplo, el banco de filtros de análisis 110 puede generar una señal de banda baja 122 y una señal de banda alta 124. La señal de banda baja 122 y la señal de banda alta 124 pueden tener anchos de banda iguales o desiguales, y pueden estar superpuestas o no superpuestas. En un modo de realización alternativo, el banco de filtros de análisis 110 puede generar más de dos salidas.
[0022] En el ejemplo de la FIG. 1, la señal de banda baja 122 y la señal de banda alta 124 ocupan bandas de frecuencia no superpuestas. Por ejemplo, la señal de banda baja 122 y la señal de banda alta 124 pueden ocupar bandas de frecuencia no superpuestas de 50 Hz - 7 kHz y de 7 kHz - 16 kHz, respectivamente. En un modo de realización alternativo, la señal de banda baja 122 y la señal de banda alta 124 pueden ocupar bandas de frecuencias no superpuestas de entre 50 Hz - 8 kHz y entre de 8 kHz - 16 kHz, respectivamente. En otro modo de realización alternativo, la señal de banda baja 122 y la señal de banda alta 124 se superponen (por ejemplo, entre 50 Hz - 8 kHz y entre 7 kHz - 16 kHz, respectivamente), lo cual puede permitir que un filtro de paso bajo y un filtro de paso alto del banco de filtros de análisis 110 tengan una atenuación progresiva suave, lo cual puede simplificar el diseño y reducir el coste del filtro de paso bajo y del filtro de paso alto. La superposición de la señal de banda baja 122 y de la señal de banda alta 124 también puede permitir un mezclado suave de señales de banda baja y de banda alta en un receptor, lo cual puede dar como resultado menos artefactos audibles.
[0023] Cabe destacar que, aunque el ejemplo de la FIG. 1 ilustra un procesamiento de una señal SWB, esto se realiza solo con propósitos ilustrativos. En un modo de realización alternativo, la señal de audio de entrada 102 puede ser una señal WB que tenga un intervalo de frecuencias desde aproximadamente 50 Hz hasta aproximadamente 8 kHz. En dicho modo de realización, la señal de banda baja 122 puede corresponder a un intervalo de frecuencias desde aproximadamente 50 Hz hasta aproximadamente 6,4 kHz y la señal de banda alta 124 puede corresponder a un intervalo de frecuencias desde aproximadamente 6,4 kHz hasta aproximadamente 8 kHz.
[0024] El sistema 100 puede incluir un módulo de análisis de banda baja 130 configurado para recibir la señal de banda baja 122. En un modo de realización particular, el módulo de análisis de banda baja 130 puede representar un modo de realización de un codificador de predicción lineal con excitación por código (CELP). El módulo de análisis de banda baja 130 puede incluir un módulo de análisis y codificación de predicción lineal (LP) 132, un módulo de transformada de coeficiente de predicción lineal (LPC) a LSP 134 y un cuantificador 136. Los LSP también se pueden denominar LSF, y los dos términos (LSP y LSF) se pueden usar de manera intercambiable en el presente documento. El módulo de análisis y codificación de LP 132 puede codificar un envolvente espectral de la señal de banda baja 122 como un conjunto de LPC. Se pueden generar unos LPC para cada trama de audio (por ejemplo, 20 milisegundos (ms) de audio, correspondientes a 320 muestras a una tasa de muestreo de 16 kHz), para cada subtrama de audio (por ejemplo, 5 ms de audio), o para cualquier combinación de las mismas. El número de LPC generados para cada trama o subtrama se puede determinar mediante el “orden” del análisis de LP realizado. En un modo de realización particular, el módulo de análisis y codificación de LP 132 puede generar un conjunto de once LPC correspondientes a un análisis de LP de décimo orden.
[0025] El módulo de transformada de LPC a LSP 134 puede transformar el conjunto de LPC generados por el módulo de análisis y codificación de LP 132 en un conjunto correspondiente de LSP (por ejemplo, usando una transformada uno a uno). De forma alternativa, se puede transformar el documento de LPC en un conjunto correspondiente de coeficientes parcor, valores de la relación logaritmo-área, pares espectrales de inmitancia (ISP) o frecuencias espectrales de inmitancia (ISF). La transformada entre el conjunto de LPC y el conjunto de LSP puede ser reversible sin errores.
[0026] El cuantificador 136 puede cuantificar el conjunto de LSP generados por el módulo de transformada 134. Por ejemplo, el cuantificador 136 puede incluir, o estar acoplado a, múltiples libros de códigos que incluyan múltiples entradas (por ejemplo, vectores). Para cuantificar el conjunto de LSP, el cuantificador 136 puede identificar entradas de libros de códigos que estén “más cerca de” (por ejemplo, en base a una medida de distorsión tal como mínimos cuadrados o error cuadrático medio) el conjunto de los LSP. El cuantificador 136 puede emitir un valor de índice o una serie de valores de índice correspondientes a la localización de las entradas identificadas en el libro de códigos. La salida del cuantificador 136 puede representar por tanto parámetros de filtro de banda baja que están incluidos en un flujo de bits de banda baja 142.
[0027] El módulo de análisis de banda baja 130 también puede generar una señal de excitación de banda baja 144. Por ejemplo, la señal de excitación de banda baja 144 puede ser una señal codificada que se genere cuantificando una señal residual de LP que se genere durante el proceso de LP realizado por el módulo de análisis de banda baja 130. La señal residual de LP puede representar un error de predicción.
[0028] El sistema 100 puede incluir además un módulo de análisis de banda alta 150 configurado para recibir la señal de banda alta 124 desde el banco de filtros de análisis 110 y la señal de excitación de banda baja 144 desde el módulo de análisis de banda baja 130. El módulo de análisis de banda alta 150 puede generar información secundaria de banda alta 172 en base a la señal de banda alta 124 y a la señal de excitación de banda baja 144. Por ejemplo, la información secundaria de banda alta 172 puede incluir LSP de banda alta y/o información de ganancia (por ejemplo, en base al menos a una relación de energía de banda alta con energía de banda baja), como se describe además en el presente documento. En un modo de realización particular, la información de ganancia puede incluir parámetros de forma de ganancia en base a una señal armónicamente ampliada y/o a una señal residual de banda alta. La señal armónicamente ampliada puede ser inadecuada para su uso en la síntesis de banda alta, debido a la correlación insuficiente entre la señal de banda alta 124 y una señal de banda baja 122. Por ejemplo, las subtramas de la señal de banda alta 124 pueden incluir fluctuaciones en los niveles de energía que no se imitan adecuadamente en la señal de excitación de banda alta modelada 161.
[0029] El módulo de análisis de banda alta 150 incluye un primer estimador de forma de ganancia 190. El primer estimador de forma de ganancia 190 determina los primeros parámetros de forma de ganancia en base a una primera señal asociada con la señal de banda baja 122 y en base a un residuo de banda alta de la señal de banda alta 124. Como se describe en el presente documento, la primera señal puede ser una excitación de banda baja transformada (por ejemplo, no lineal o armónicamente ampliada) de la señal de banda baja 122. La información secundaria de banda alta 172 incluye los primeros parámetros de forma de ganancia. El módulo de análisis de banda alta 150 también puede incluir un primer ajustador de forma de ganancia 192 configurado para ajustar la excitación de banda baja armónicamente ampliada en base a los primeros parámetros de forma de ganancia. Por ejemplo, el primer ajustador de forma de ganancia 192 puede escalar subtramas particulares de la excitación de banda baja armónicamente ampliada para aproximar los niveles de energía de las subtramas correspondientes del residuo de la señal de banda alta 124.
[0030] El módulo de análisis de banda alta 150 puede incluir un generador de excitación de banda alta 160. El generador de excitación de banda alta 160 puede generar una señal de excitación de banda alta 161 ampliando un espectro de la señal de excitación de banda baja 144 al intervalo de frecuencias de banda alta (por ejemplo, 7 kHz -16 kHz). Para ilustrar, el generador de excitación de banda alta 160 puede mezclar la excitación de banda baja armónicamente ampliada ajustada con una señal de ruido (por ejemplo, ruido blanco modulado de acuerdo con un envolvente correspondiente a la señal de excitación de banda baja 144 que imita las características temporales de variación lenta de la señal de banda baja 122) para generar la señal de excitación de banda alta 161. Por ejemplo, la mezcla se puede realizar de acuerdo con la siguiente ecuación:
Excitación de banda alta -(a * excitación de banda baja armónicamente ampliada ajustada)
((1- a) * ruido modulado)
[0031] La relación en la cual se mezclan la excitación de banda baja armónicamente ampliada ajustada y el ruido modulado puede afectar la calidad de reconstrucción de banda alta en un receptor. Para las señales de voz sonoras [voiced], el mezclado se puede desviar hacia la excitación de banda baja armónicamente ampliada ajustada (por ejemplo, el factor de mezcla a puede estar en el intervalo de 0,5 a 1,0). Para las señales no sonoras [unvoiced], la mezcla se puede desviar hacia el ruido modulado (por ejemplo, el factor de mezcla a puede estar en el intervalo de 0,0 a 0,5).
[0032] Como se ilustra, el módulo de análisis de banda alta 150 también puede incluir un módulo de análisis y codificación de LP 152, un módulo de transformada de LPC a LSP 154 y un cuantificador 156. Cada uno del módulo de análisis y codificación de LP 152, el módulo de transformada 154 y el cuantificador 156 pueden funcionar como se describe anteriormente con referencia a unos componentes correspondientes del módulo de análisis de banda baja 130, pero a una resolución comparativamente reducida (por ejemplo, usando menos bits para cada coeficiente, LSP, etc.). El módulo de análisis y codificación de LP 152 puede generar un conjunto de LPC que se transformen en los LSP mediante el módulo de transformada 154 y se cuantifican mediante el cuantificador 156 en base a un libro de códigos 163. Por ejemplo, el módulo de análisis y codificación de LP 152, el módulo de transformada 154 y el cuantificador 156 pueden usar la señal de banda alta 124 para determinar la información de filtro de banda alta (por ejemplo, los LSP de banda alta) que esté incluida en la información secundaria de banda alta 172.
[0033] El cuantificador 156 se puede configurar para cuantificar un conjunto de valores de frecuencia espectrales, tales como los LSP proporcionados por el módulo de transformada 154. En otros modos de realización, el cuantificador 156 puede recibir y cuantificar conjuntos de uno o más de otros tipos de valores de frecuencia espectral además de, o en lugar de, los LSF o los LSP. Por ejemplo, el cuantificador 156 puede recibir y cuantificar un conjunto de LPC generados por el módulo de análisis y codificación de LP 152. Otros ejemplos incluyen conjuntos de coeficientes parcor, valores de la relación logaritmo-área e ISF que se pueden recibir y cuantificar en el cuantificador 156. El cuantificador 156 puede incluir un cuantificador vectorial que codifique un vector de entrada (por ejemplo, un conjunto de valores de frecuencia espectral en un formato vectorial) como un índice para una entrada correspondiente en una tabla o libro de códigos, tal como el libro de códigos 163. Como otro ejemplo, el cuantificador 156 se puede configurar para determinar uno o más parámetros a partir de los cuales el vector de entrada se puede generar dinámicamente en un decodificador, tal como en un modo de realización de libro de códigos disperso, en lugar de recuperarse del almacenamiento. Para ilustrar, se pueden aplicar ejemplos de libros de códigos dispersos en esquemas de codificación tales como CELP y códecs de acuerdo con estándares industriales tales como el EVRC (Códec de Tasa Variable Mejorada) del 3GPP2 (Proyecto 2 de Colaboración de Tercera Generación). En otro modo de realización, el módulo de análisis de banda alta 150 puede incluir el cuantificador 156 y se puede configurar para usar un número de vectores de libro de códigos para generar señales sintetizadas (por ejemplo, de acuerdo con un conjunto de parámetros de filtro) y seleccionar uno de los vectores de libro de códigos asociados con la señal sintetizada que mejor coincida con la señal de banda alta 124, tal como en un dominio ponderado perceptualmente.
[0034] En un modo de realización particular, la información secundaria de banda alta 172 puede incluir LSP de banda alta, así como parámetros de ganancia de banda alta. Por ejemplo, la señal de excitación de banda alta 161 se puede usar para determinar uno o más parámetros de ganancia de banda alta que se incluyan en la información secundaria de banda alta 172. El módulo de análisis de banda alta 150 puede incluir un segundo estimador de forma de ganancia 194 y un segundo ajustador de forma de ganancia 196. Se realiza una operación de síntesis de coeficiente de predicción lineal en la señal de excitación de banda alta 161 para generar una señal de banda alta sintetizada. El segundo estimador de forma de ganancia 194 determina los segundos parámetros de forma de ganancia en base a la señal de banda alta sintetizada y a la señal de banda alta 124. La información secundaria de banda alta 172 incluye los segundos parámetros de forma de ganancia. El segundo ajustador de forma de ganancia 196 se puede configurar para ajustar la señal de banda alta sintetizada en base a los segundos parámetros de forma de ganancia. Por ejemplo, el segundo ajustador de forma de ganancia 196 puede escalar subtramas particulares de la señal de banda alta sintetizada para aproximar los niveles de energía de las subtramas correspondientes de la señal de banda alta 124.
[0035] El flujo de bits de banda baja 142 y la información secundaria de banda alta 172 se pueden multiplexar por un multiplexor (MUX) 180 para generar un flujo de bits de salida 199. El flujo de bits de salida 199 puede representar una señal de audio codificada correspondiente a la señal de audio de entrada 102. Por ejemplo, el flujo de bits de salida 199 se puede transmitir (por ejemplo, a través de un canal alámbrico, inalámbrico u óptico) y/o almacenar. Por tanto, el multiplexor 180 inserta los primeros parámetros de forma de ganancia determinados por el primer estimador de forma de ganancia 190 y los segundos parámetros de forma de ganancia determinados por el segundo estimador de forma de ganancia 194 en el flujo de bits de salida 199 para permitir el ajuste de ganancia de excitación de banda alta durante la reproducción de la señal de audio de entrada 102. En un receptor, un demultiplexor (DEMUX), un decodificador de banda baja, un decodificador de banda alta y un banco de filtros pueden realizar operaciones inversas para generar una señal de audio (por ejemplo, una versión reconstruida de la señal de audio de entrada 102 que se proporcione a un altavoz o a otro dispositivo de salida). El número de bits usados para representar el flujo de bits de banda baja 142 puede ser sustancialmente mayor que el número de bits usados para representar la información secundaria de banda alta 172. Por tanto, la mayoría de los bits en el flujo de bits de salida 199 pueden representar datos de banda baja. La información secundaria de banda alta 172 se puede usar en un receptor para regenerar la señal de excitación de banda alta a partir de los datos de banda baja, de acuerdo con un modelo de señal. Por ejemplo, el modelo de señal puede representar un conjunto esperado de relaciones o correlaciones entre datos de banda baja (por ejemplo, la señal de banda baja 122) y datos de banda alta (por ejemplo, la señal de banda alta 124). Por tanto, se pueden usar diferentes modelos de señal para diferentes tipos de datos de audio (por ejemplo, voz, música, etc.), y un transmisor y un receptor pueden negociar el modelo de señal particular que se use (o que puede estar definido por un estándar industrial) antes de la transmisión de datos de audio codificados. Mediante el uso del modelo de señal, el módulo de análisis de banda alta 150 en un transmisor puede ser capaz de generar la información secundaria de banda alta 172 de modo que un correspondiente módulo de análisis de banda alta de un receptor puede usar el modelo de señal para reconstruir la señal de banda alta 124 a partir del flujo de bits de salida 199.
[0036] El sistema 100 puede mejorar una correlación de energía trama por trama (por ejemplo, mejorar una evolución temporal) entre una excitación de banda baja armónicamente ampliada de la señal de audio 102 y un residuo de banda alta de la señal de audio de entrada 102. Por ejemplo, durante una primera etapa de ganancia, el primer estimador de forma de ganancia 190 y el primer ajustador de forma de ganancia 192 pueden ajustar la excitación de banda baja armónicamente ampliada en base a los primeros parámetros de ganancia. La excitación de banda baja armónicamente ampliada se puede ajustar para aproximarse al residuo de banda alta trama por trama. El ajuste de la excitación de banda baja armónicamente ampliada puede mejorar la estimación de forma de ganancia en el dominio de síntesis y reducir los artefactos audibles durante la reconstrucción de banda alta de la señal de audio de entrada 102. El sistema 100 también puede mejorar una correlación de energía trama por trama entre la señal de banda alta 124 y una versión sintetizada de la señal de banda alta 124. Por ejemplo, durante una segunda etapa de ganancia, el segundo estimador de forma de ganancia 194 y el segundo ajustador de forma de ganancia 196 pueden ajustar la versión sintetizada de la señal de banda alta 124 en base a los segundos parámetros de ganancia. La versión sintetizada de la señal de banda alta 124 se puede ajustar para aproximarse a la señal de banda alta 124 trama por trama. Los primeros y segundos parámetros de forma de ganancia se pueden transmitir a un decodificador para reducir los artefactos audibles durante la reconstrucción de banda alta de la señal de audio de entrada 102.
[0037] En referencia a la FIG. 2, se muestra un modo de realización particular de un sistema 200 que es operable para determinar los parámetros de forma de ganancia en una primera etapa en base a una señal armónicamente ampliada y/o a una señal residual de banda alta. El sistema 200 incluye un filtro de análisis de predicción lineal 204, un generador de excitación no lineal 207, un módulo de identificación de trama 214, el primer estimador de forma de ganancia 190 y el primer ajustador de forma de ganancia 192.
[0038] La señal de banda alta 124 se puede proporcionar al filtro de análisis de predicción lineal 204. El filtro de análisis de predicción lineal 204 se puede configurar para generar una señal residual de banda alta 224 en base a la señal de banda alta 124 (por ejemplo, una porción de banda alta de la señal de audio de entrada 102). Por ejemplo, el filtro de análisis de predicción lineal 204 puede codificar un envolvente espectral de la señal de banda alta 124 como un conjunto de los LPC usados para predecir muestras futuras (en base a muestras actuales) de la señal de banda alta 124. La señal residual de banda alta 224 se puede proporcionar al módulo de identificación de trama 214 y al primer estimador de forma de ganancia 190.
[0039] El módulo de identificación de trama 214 se puede configurar para determinar un modo de codificación para una trama particular de la señal residual de banda alta 224 y para generar una señal de indicación de modo de codificación 216 en base al modo de codificación. Por ejemplo, el módulo de identificación de trama 214 puede determinar si la trama particular de la señal residual de banda alta 224 es una trama sonora o una trama no sonora. En un modo de realización particular, una trama sonora puede corresponder a un primer modo de codificación (por ejemplo, una primera métrica) y una trama no sonora puede corresponder a un segundo modo de codificación (por ejemplo, una segunda métrica).
[0040] La señal de excitación de banda baja 144 se puede proporcionar al generador de excitación no lineal 207. Como se describe con respecto a la FIG. 1, la señal de excitación de banda baja 144 se puede generar a partir de la señal de banda baja 122 (por ejemplo, la porción de banda baja de la señal de audio de entrada 102) usando el módulo de análisis de banda baja 130. El generador de excitación no lineal 207 se puede configurar para generar una señal armónicamente ampliada 208 en base a la señal de excitación de banda baja 144. Por ejemplo, el generador de excitación no lineal 207 puede realizar una operación de valor absoluto o una operación al cuadrado en tramas (o subtramas) de la señal de excitación de banda baja 144 para generar la señal armónicamente ampliada 208.
[0041] Para ilustrar, el generador de excitación no lineal 207 puede muestrear de forma ascendente la señal de excitación de banda baja 144 (por ejemplo, una señal que oscile desde aproximadamente 0 kHz hasta 8 kHz) para generar una señal de 16 kHz que oscile desde aproximadamente 0 kHz hasta 16 kHz (por ejemplo, una señal que tenga aproximadamente el doble del ancho de banda de la señal de excitación de banda baja 144) y posteriormente realizar una operación no lineal en la señal mostrada de forma ascendente. Una porción de banda baja de la señal de 16 kHz (por ejemplo, aproximadamente desde 0 kHz hasta 8 kHz) puede tener armónicos sustancialmente similares a la señal de excitación de banda baja 144, y una porción de banda alta de la señal de 16 kHz (por ejemplo, aproximadamente desde 8 kHz hasta 16 kHz) puede estar esencialmente libre de armónicos. El generador de excitación no lineal 207 puede ampliar los armónicos “dominantes” en la porción de banda baja de la señal de 16 kHz a la porción de banda alta de la señal de 16 kHz para generar la señal armónicamente ampliada 208. Por tanto, la señal armónicamente ampliada 208 puede ser una versión armónicamente ampliada de la señal de excitación de banda baja 144 que extiende los armónicos hacia la banda alta usando operaciones no lineales (por ejemplo, operaciones al cuadrado y/u operaciones de valor absoluto). La señal armónicamente ampliada 208 se puede proporcionar al primer estimador de forma de ganancia 190 y al primer ajustador de forma de ganancia 192.
[0042] El primer estimador de forma de ganancia 190 puede recibir la señal de indicación de modo de codificación 216 y determinar una tasa de muestreo en base al modo de codificación. Por ejemplo, el primer estimador de forma de ganancia 190 puede muestrear una primera trama de la señal armónicamente ampliada 208 para generar una primera pluralidad de subtramas y puede muestrear una segunda trama de la señal residual de banda alta 224 en instancias de tiempo similares para generar una segunda pluralidad de subtramas. El número de subtramas (por ejemplo, las dimensiones vectoriales) en la primera y segunda pluralidad de subtramas se puede basar en el modo de codificación. Por ejemplo, la primera (y segunda) pluralidad de subtramas puede incluir un primer número de subtramas en respuesta a una determinación de que el modo de codificación indica que la trama particular de la señal residual de banda alta 224 es una trama sonora. En un modo de realización particular, la primera y segunda pluralidad de subtramas puede incluir cada una dieciséis subtramas en respuesta a una determinación de que la trama particular de la señal residual de banda alta 224 es una trama sonora. De forma alternativa, la primera (y segunda) pluralidad de subtramas puede incluir un segundo número de subtramas que sea menor que el primer número de subtramas en respuesta a una determinación de que el modo de codificación indica que la trama particular de la señal residual de banda alta 224 no es una trama sonora. Por ejemplo, la primera y segunda pluralidad de subtramas puede incluir cada una ocho subtramas en respuesta a una determinación de que el modo de codificación indica que la trama particular de la señal residual de banda alta 224 no es una trama sonora.
[0043] El primer estimador de forma de ganancia 190 está configurado para determinar los primeros parámetros de forma de ganancia 242 en base a la señal armónicamente ampliada 208 y a la señal residual de banda alta 224. El primer estimador de forma de ganancia 190 puede evaluar los niveles de energía de cada subtrama de la primera pluralidad de subtramas y evaluar los niveles de energía de cada subtrama correspondiente de la segunda pluralidad de subtramas. Por ejemplo, los primeros parámetros de forma de ganancia 242 pueden identificar subtramas particulares de la señal armónicamente ampliada 208 que tienen niveles de energía más bajos o más altos que las subtramas correspondientes de la señal residual de banda alta 224. El primer estimador de forma de ganancia 190 también puede determinar una cantidad de ajuste a escala de energía para proporcionar a cada subtrama particular de la señal armónicamente ampliada 208 en base al modo de codificación. El ajuste a escala de energía se puede realizar a un nivel de subtrama de la señal armónicamente ampliada 208 que tiene un nivel de energía más bajo o más alto en comparación con las subtramas correspondientes de la señal residual de banda alta 224. Por ejemplo, en respuesta a una determinación de que el modo de codificación tiene una primera métrica (por ejemplo, una trama sonora), una subtrama particular de la señal armónicamente ampliada 208 se puede ajustar a escala por un factor de (ZRhb2)/(ZR'lb2), donde (ZR'lb2) corresponde a un nivel de energía de la subtrama particular de la señal armónicamente ampliada 208 y (ZRhb2) corresponde a un nivel de energía de una subtrama correspondiente de la señal residual de banda alta 224. De forma alternativa, en respuesta a una determinación de que el modo de codificación tiene una segunda métrica (por ejemplo, una trama no sonora), la subtrama particular de la señal armónicamente ampliada 208 se puede ajustar a escala por un factor de Z[(Rhb)* (R'lb)]/(ZR'lb2). Los primeros parámetros de forma de ganancia 242 pueden identificar cada subtrama de la señal armónicamente ampliada 208 que requiere un ajuste a escala de energía y pueden identificar el factor de escala de energía calculado para las respectivas subtramas. Los primeros parámetros de forma de ganancia 242 se pueden proporcionar al primer ajustador de forma de ganancia 192 y al multiplexor 180 de la FIG. 1 como información secundaria de banda alta 172.
[0044] El primer ajustador de forma de ganancia 192 se puede configurar para ajustar la señal armónicamente ampliada 208 en base a los primeros parámetros de forma de ganancia 242 para generar una señal armónicamente ampliada ajustada 244. Por ejemplo, el primer ajustador de forma de ganancia 192 puede ajustar a escala las subtramas identificadas de la señal ampliada armónicamente 208 de acuerdo con el ajuste a escala de energía calculado para generar la señal armónicamente ampliada ajustada 244. La segunda señal armónicamente ampliada ajustada 244 se puede proporcionar al rastreador de envolvente 202 y a un primer combinador 254 para realizar una operación de ajuste a escala.
[0045] El rastreador de envolvente 202 se puede configurar para recibir la señal armónicamente ampliada ajustada 244 y para calcular un envolvente de dominio de tiempo de banda baja 203 correspondiente a la señal armónicamente ampliada ajustada 244. Por ejemplo, el rastreador de envolvente 202 se puede configurar para calcular el cuadrado de cada muestra de una trama de la señal armónicamente ampliada ajustada 244 para producir una secuencia de valores al cuadrado. El rastreador de envolventes 202 se puede configurar para realizar una operación de alisamiento en la secuencia de valores al cuadrado, tal como mediante la aplicación de un filtro de paso bajo de respuesta de impulso infinito (IIR) de primer orden a la secuencia de valores al cuadrado. El rastreador de envolvente 202 se puede configurar para aplicar una función de raíz cuadrada a cada muestra de la secuencia alisada para producir el envolvente del dominio de tiempo de banda baja 203. El rastreador de envolvente 202 también puede usar una operación absoluta en lugar de una operación al cuadrado. El segundo envolvente del dominio de tiempo de banda baja 203 se puede proporcionar al combinador de ruido 240.
[0046] El combinador de ruido 240 se puede configurar para combinar el envolvente de dominio de tiempo de banda baja 203 con el ruido blanco 205 generado por un generador de ruido blanco (no mostrado) para producir una señal de ruido modulada 220. Por ejemplo, el combinador de ruido 240 se puede configurar para modular en amplitud el ruido blanco 205 de acuerdo con el envolvente de dominio de tiempo de banda baja 203. En un modo de realización particular, el combinador de ruido 240 se puede implementar como un multiplicador que está configurado para ajustar a escala el ruido blanco 205 de acuerdo con el envolvente de dominio de tiempo de banda baja 203 para producir la señal de ruido modulado 220. La segunda señal de ruido modulada 220 se puede proporcionar al segundo combinador 256.
[0047] El primer combinador 254 se puede implementar como un multiplicador que está configurado para ajustar a escala la señal armónicamente ampliada ajustada 244, de acuerdo al factor de mezcla (a) para generar una primera señal ajustada a escala. El segundo combinador 256 se puede implementar como un multiplicador que está configurado para ajustar a escala la señal de ruido modulada 220 en base al factor de mezcla (1 -a) para generar una segunda señal ajustada a escala. Por ejemplo, el segundo combinador 256 puede ajustar a escala la señal de ruido modulada 220 en base a la diferencia de uno menos el factor de mezcla (por ejemplo, 1 - a). La primera señal ajustada a escala y la segunda señal ajustada a escala se pueden proporcionar al mezclador 211.
[0048] El mezclador 211 puede generar la señal de excitación de banda alta 161 en base al factor de mezcla (a), la señal armónicamente ampliada ajustada 244 y la señal de ruido modulada 220. Por ejemplo, el mezclador 211 puede combinar la primera señal ajustada a escala y la segunda señal ajustada a escala para generar la señal de excitación de banda alta 161.
[0049] El sistema 200 de la FIG. 2 puede mejorar una evolución temporal de energía entre la señal armónicamente ampliada 208 y la señal residual de banda alta 224. Por ejemplo, el primer estimador de forma de ganancia 190 y el primer ajustador de forma de ganancia 192 pueden ajustar la señal armónicamente ampliada 208 en base a los primeros parámetros de forma de ganancia 242. La señal armónicamente ampliada 208 se puede ajustar a niveles de energía aproximados de la señal residual de banda alta 224 subtrama por subtrama. El ajuste de la señal armónicamente ampliada 208 puede reducir los artefactos audibles en el dominio de síntesis como se describe con respecto a la FIG. 4. El sistema 200 también puede ajustar dinámicamente el número de subtramas en base al modo de codificación para modificar los parámetros de forma de ganancia 242 en base a las variaciones de tono. Por ejemplo, se puede generar un número relativamente pequeño de parámetros de forma de ganancia 242 (por ejemplo, un número relativamente pequeño de subtramas) para una trama no sonora que tenga una variación relativamente baja en la evolución temporal dentro de la trama. De forma alternativa, se puede generar un número relativamente grande de parámetros de forma de ganancia 242 para una trama sonora que tenga una variación relativamente alta en la evolución temporal dentro de una trama. En un modo de realización alternativo, el número de subtramas seleccionadas para ajustar la evolución temporal de la banda baja armónicamente ampliada puede ser el mismo tanto para una trama no sonora como para una trama sonora.
[0050] En referencia a la FIG. 3, se muestra un diagrama de temporización 300 para ilustrar parámetros de forma de ganancia en base a disparidades de energía entre una señal armónicamente ampliada y una señal residual de banda alta. El diagrama de temporización 300 incluye una primera traza de la señal residual de banda alta 224, una segunda traza de la señal armónicamente ampliada 208 y una tercera traza de parámetros estimados de forma de ganancia 242.
[0051] El diagrama de temporización 300 representa una trama particular de la señal residual de banda alta 224 y una trama correspondiente de la señal armónicamente ampliada 208. El diagrama de temporización 300 incluye una primera ventana de temporización 302, una segunda ventana de temporización 304, una tercera ventana de temporización 306, una cuarta ventana de temporización 308, una quinta ventana de temporización 310, una sexta ventana de temporización 312 y una séptima ventana de temporización 314. Cada ventana de temporización 302-314 puede representar una subtrama de las respectivas señales 224, 208. Aunque se representan siete ventanas de temporización, en otros modos de realización, pueden haber presentes ventanas de temporización adicionales (o menos). Por ejemplo, en un modo de realización particular, cada respectiva señal 224, 208 puede incluir cuatro ventanas de temporización como mínimo o dieciséis ventanas de temporización como máximo (es decir, cuatro subtramas o dieciséis subtramas). El número de ventanas de temporización se puede basar en el modo de codificación como se describe con respecto a la FIG. 2.
[0052] El nivel de energía de la señal residual de banda alta 224 en la primera ventana de temporización 302 se puede aproximar al nivel de energía de la señal armónicamente ampliada 208 correspondiente en la primera ventana de temporización 302. Por ejemplo, el primer estimador de forma de ganancia 190 puede medir el nivel de energía de la señal residual de banda alta 224 en la primera ventana de temporización 302, medir el nivel de energía de la señal armónicamente ampliada 208 en la primera ventana de temporización 302 y comparar una diferencia con un umbral. El nivel de energía de la señal residual de banda alta 224 se puede aproximar al nivel de energía de la señal armónicamente ampliada 208 si la diferencia está por debajo del umbral. Por tanto, en este caso, el primer parámetro de forma de ganancia 242 para la primera ventana de temporización 302 puede indicar que no se necesita un ajuste a escala de energía para las subtramas correspondientes de la señal armónicamente ampliada 208. Los niveles de energía de la señal residual de banda alta 224 para las tercera y cuarta ventanas de temporización 306, 308 también se pueden aproximar al nivel de energía de la señal armónicamente ampliada 208 correspondiente en las tercera y cuarta ventanas de temporización 306, 308. Por tanto, los primeros parámetros de forma de ganancia 242 para las tercera y cuarta ventanas de temporización 306, 308 también pueden indicar que un ajuste a escala de energía puede no ser necesaria para las subtramas correspondientes de la señal armónicamente ampliada 208.
[0053] El nivel de energía de la señal residual de banda alta 224 en la segunda y quinta ventana de temporización 304, 310 puede fluctuar y el nivel de energía correspondiente de la señal armónicamente ampliada 208 en la segunda y quinta ventana de temporización 304, 310 puede no reflejar con precisión la fluctuación en la señal residual de banda alta 224. El primer estimador de forma de ganancia 190 de las FIGS. 1-2 puede generar el parámetro de forma de ganancia 242 en la segunda y quinta ventana de temporización 304, 310 para ajustar la señal armónicamente ampliada 208. Por ejemplo, el primer estimador de forma de ganancia 190 puede indicar al primer ajustador de forma de ganancia 192 que "ajuste a escala" la señal armónicamente ampliada 208 en la segunda y quinta ventana de temporización 304, 310 (por ejemplo, la segunda y la quinta subtrama). La cantidad que la señal armónicamente ampliada 208 se ajusta se puede basar en el modo de codificación de la señal residual de banda alta 224. Por ejemplo, la señal armónicamente ampliada 208 se puede ajustar por un factor de ( IR hb2)/(IR 'lb2) si el modo de codificación indica que la trama es una trama sonora. De forma alternativa, la señal armónicamente ampliada 208 se puede ajustar por un factor de I[(R hb)*(R’lb)]/(IR ’lb2) si el modo de codificación indica que la trama es una trama no sonora.
[0054] El nivel de energía de la señal residual de banda alta 224 para las sexta y séptima ventanas de temporización 312, 314 se puede aproximar al nivel de energía de la señal armónicamente ampliada 208 correspondiente en las sexta y séptima ventanas de temporización 312, 314. Por tanto, los primeros parámetros de forma de ganancia 242 para las sexta y séptima ventanas de temporización 312, 314 pueden indicar que no se necesita un ajuste a escala de energía pata las subtramas correspondientes de la señal armónicamente ampliada 208.
[0055] Generar los primeros parámetros de forma de ganancia 242 como se describe con respecto a la FIG. 3 puede mejorar una evolución temporal de energía entre la señal armónicamente ampliada 208 y la señal residual de banda alta 224. Por ejemplo, las fluctuaciones de energía en la señal residual de banda alta 224 se pueden explicar en la señal armónicamente ampliada 208 ajustándola en base a los primeros parámetros de forma de ganancia 242. El ajuste de la señal armónicamente ampliada 208 puede reducir los artefactos audibles en el dominio de síntesis como se describe con respecto a la FIG. 4.
[0056] Con referencia a la FIG. 4, se muestra un modo de realización particular de un sistema 400 que es operable para determinar los segundos parámetros de forma de ganancia en una segunda etapa en base a una señal de banda alta sintetizada y a una porción de banda alta de una señal de audio de entrada. El sistema 400 puede incluir un sintetizador de predicción lineal (LP) 402, el segundo estimador de forma de ganancia 194, el segundo ajustador de forma de ganancia 196 y un estimador de trama de ganancia 410.
[0057] El sintetizador de predicción lineal (LP) 402 se puede configurar para recibir la señal de excitación de banda alta 161 y realizar una operación de síntesis de predicción lineal en la señal de excitación de banda alta 161 para generar una señal de banda alta sintetizada 404. La señal sintetizada de banda alta 404 se puede proporcionar al segundo estimador de forma de ganancia 194 y al segundo ajustador de forma de ganancia 196.
[0058] El segundo estimador de forma de ganancia 194 está configurado para determinar los segundos parámetros de forma de ganancia 406 en base a la señal de banda alta sintetizada 404 y a la señal de banda alta 124. Por ejemplo, el segundo estimador de forma de ganancia 194 puede evaluar los niveles de energía de cada subtrama de la señal de banda alta sintetizada 404 y evaluar los niveles de energía de cada subtrama correspondiente de la señal de banda alta 124. Por ejemplo, los segundos parámetros de forma de ganancia 406 pueden identificar subtramas particulares de la señal sintetizada de banda alta 404 que tengan niveles de energía más bajos que las subtramas correspondientes de la señal de banda alta 124. Los segundos parámetros de forma de ganancia 406 se pueden determinar en un dominio de síntesis. Por ejemplo, los segundos parámetros de forma de ganancia 406 se pueden determinar usando una señal sintetizada (por ejemplo, la señal sintetizada de banda alta 404) a diferencia de una señal de excitación (por ejemplo, la señal armónicamente ampliada 208) en un dominio de excitación. Los segundos parámetros de forma de ganancia 406 se pueden proporcionar al segundo ajustador de forma de ganancia 196 y al multiplexor 180 como información secundaria de banda alta 172.
[0059] El segundo ajustador de forma de ganancia 196 se puede configurar para generar una señal de banda alta sintetizada ajustada 418 en base a los segundos parámetros de forma de ganancia 406. Por ejemplo, el segundo ajustador de forma de ganancia 196 puede “ajustar a escala” subtramas particulares de la señal de banda alta sintetizada 404 en base a los segundos parámetros de forma de ganancia 406 para generar la señal de banda alta sintetizada ajustada 418. El segundo ajustador de forma de ganancia 196 puede “escalar” subtramas de la señal sintetizada de banda alta 404 de una manera similar al primer ajustador de forma de ganancia 192 de las FIGS. 1 -2 ajusta subtramas particulares de la señal armónicamente ampliada 208 en base a los primeros parámetros de forma de ganancia 242. La señal de banda alta sintetizada ajustada 418 también se puede proporcionar al estimador de trama de ganancia 410.
[0060] El estimador de trama de ganancia 410 puede generar los parámetros de trama de ganancia 412 en base a la señal de banda alta sintetizada ajustada 404 y a la señal de banda alta 124. Los parámetros de trama de ganancia 412 se pueden proporcionar al multiplexor 180 como información secundaria de banda alta 172.
[0061] El sistema 400 de la FIG. 4 puede mejorar la reconstrucción de banda alta de la señal de audio de entrada 102 de la FIG. 1 generando los segundos parámetros de forma de ganancia 406 en base a los niveles de energía de la señal de banda alta sintetizada 404 y a los niveles de energía correspondientes de la señal de banda alta 124. Los segundos parámetros de forma de ganancia 406 pueden reducir los artefactos audibles durante la reconstrucción de banda alta de la señal de audio de entrada 102.
[0062] En referencia a la FIG. 5, se muestra un modo de realización ilustrativo particular de un sistema 500 que es operable para reproducir una señal de audio usando los parámetros de forma de ganancia. El sistema 500 incluye un generador de excitación no lineal 507, un primer ajustador de forma de ganancia 592, un generador de excitación de banda alta 520, un sintetizador de predicción lineal (LP) 522 y un segundo ajustador de forma de ganancia 526. En un modo de realización particular, el sistema 500 se puede integrar en un sistema o aparato de decodificación (por ejemplo, en un teléfono inalámbrico, un CODEC o un DSP). En otros modos de realización particulares, el sistema 500 se puede integrar en un decodificador, un reproductor de música, un reproductor de vídeo, una unidad de entretenimiento, un dispositivo de navegación, un dispositivo de comunicaciones, un PDA, una unidad de datos de localización fija o un ordenador.
[0063] El generador de excitación no lineal 507 se puede configurar para recibir la señal de excitación de banda baja 144 de la FIG. 1. Por ejemplo, el flujo de bits de banda baja 142 de la FIG. 1 puede incluir datos que representen la señal de excitación de banda baja 144, y se puede transmitir al sistema 500 como el flujo de bits 199. El generador de excitación no lineal 507 se puede configurar para generar una segunda señal armónicamente ampliada 508 en base a la señal de excitación de banda baja 144. Por ejemplo, el generador de excitación no lineal 507 puede realizar una operación de valor absoluto o una operación al cuadrado en tramas (o subtramas) de la señal de excitación de banda baja 144 para generar la segunda señal armónicamente ampliada 508. En un modo de realización particular, el generador de excitación no lineal 507 puede funcionar de una manera sustancialmente similar al generador de excitación no lineal 207 de la FIG. 2. La segunda señal armónicamente ampliada 508 se puede proporcionar al primer ajustador de forma de ganancia 592.
[0064] Los primeros parámetros de forma de ganancia, tales como los primeros parámetros de forma de ganancia 242 de la FIG. 2, también se proporcionan al primer ajustador de forma de ganancia 592. Por ejemplo, la información secundaria de banda alta 172 de la FIG. 1 incluye datos que representan los primeros parámetros de forma de ganancia 242 y se pueden transmitir al sistema 500. El primer ajustador de forma de ganancia 592 está configurado para ajustar la segunda señal armónicamente ampliada 508 en base a los primeros parámetros de forma de ganancia 242 para generar una segunda señal armónicamente ampliada ajustada 544. En un modo de realización particular, el primer ajustador de forma de ganancia 592 puede funcionar de manera sustancialmente similar al primer ajustador de forma de ganancia 192 de las FIGS. 1-2. La segunda señal armónicamente ampliada ajustada 544 se puede proporcionar al generador de excitación de banda alta 520.
[0065] El generador de excitación de banda alta 520 puede generar una segunda señal de excitación de banda alta 561 en base a la segunda señal armónicamente ampliada ajustada 544. Por ejemplo, el generador de excitación de banda alta 520 puede incluir un rastreador de envolvente, un combinador de ruido, un primer combinador, un segundo combinador y un mezclador. En un modo de realización particular, los componentes del generador de excitación de banda alta 520 pueden funcionar de manera sustancialmente similar al rastreador de envolvente 202 de la FIG. 2, el combinador de ruido 240 de la FIG. 2, el primer combinador 254 de la FIG. 2, el segundo combinador 256 de la FIG.
2 y el mezclador 211 de la FIG. 2. La señal de excitación de banda alta 561 se puede proporcionar al sintetizador de predicción lineal 522.
[0066] El sintetizador de predicción lineal 522 se puede configurar para recibir la segunda señal de excitación de banda alta 561 y realizar una operación de síntesis de predicción lineal en la segunda señal de excitación de banda alta 561 para generar una segunda señal de banda alta sintetizada 524. En un modo de realización particular, el sintetizador de predicción lineal 522 puede funcionar de una manera sustancialmente similar al sintetizador de predicción lineal 402 de la FIG. 4. La segunda señal de banda alta sintetizada 524 también se puede proporcionar al segundo ajustador de forma de ganancia 526.
[0067] Los segundos parámetros de forma de ganancia, tales como los segundos parámetros de forma de ganancia 406 de la FIG. 4, también se proporcionan al segundo ajustador de forma de ganancia 526. Por ejemplo, la información secundaria de banda alta 172 de la FIG. 1 incluye datos que representan los segundos parámetros de forma de ganancia 406 y se pueden transmitir al sistema 500. El segundo ajustador de forma de ganancia 526 está configurado para ajustar la segunda señal de banda alta sintetizada 524 en base a los segundos parámetros de forma de ganancia 406 para generar una segunda señal de banda alta sintetizada ajustada 528. En un modo de realización particular, el segundo ajustador de forma de ganancia 526 puede funcionar de manera sustancialmente similar al segundo ajustador de forma de ganancia 196 de las FIGS. 1 y 4. En un modo de realización particular, la segunda señal de banda alta sintetizada ajustada 528 puede ser una versión reproducida de la señal de banda alta 124 de la FIG. 1.
[0068] El sistema 500 de la FIG. 5 reproduce la señal de banda alta 124 usando la señal de excitación de banda alta 144, los primeros parámetros de forma de ganancia 242 y los segundos parámetros de forma de ganancia 406. Usar los parámetros de forma de ganancia 242, 406 puede mejorar la precisión de la reproducción ajustando la segunda señal armónicamente ampliada 508 y la segunda señal sintetizada de banda alta 524 en base a evoluciones temporales de energía detectadas en el codificador de voz.
[0069] En referencia a la FIG. 6, se muestran diagramas de flujo de modos de realización particulares de los procedimientos 600, 610 del uso de estimaciones de ganancia para la reconstrucción de banda alta. El primer procedimiento 600 se puede realizar por los sistemas 100-200 de las FIGS. 1-2 y el sistema 400 de la FIG. 4. El segundo procedimiento 610 se puede realizar por el sistema 500 de la FIG. 5.
[0070] El primer procedimiento 600 incluye determinar, en un codificador de voz, los primeros parámetros de forma de ganancia en base a una señal armónicamente ampliada y en base a una señal residual de banda alta asociada con una porción de banda alta de una señal de audio, en 602. Por ejemplo, el primer estimador de forma de ganancia 190 de la FIG. 1 puede determinar los primeros parámetros de forma de ganancia (por ejemplo, los primeros parámetros de forma de ganancia 242 de la FIG. 2) en base a una señal armónicamente ampliada (por ejemplo, la señal armónicamente ampliada 208 de la FIG. 2) y/o el residuo de banda alta de la señal de banda alta 124.
[0071] El procedimiento 600 también incluye determinar los segundos parámetros de forma de ganancia en base a una señal de banda alta sintetizada y en base a la porción de banda alta de la señal de audio, en 604. Por ejemplo, el segundo estimador de forma de ganancia 194 puede determinar los segundos parámetros de forma de ganancia 406 en base a la señal de banda alta sintetizada 404 y a la señal de banda alta 124.
[0072] Los primeros parámetros de forma de ganancia y los segundos parámetros de forma de ganancia se insertan en una versión codificada de la señal de audio para permitir el ajuste de ganancia durante la reproducción de la señal de audio a partir de la versión codificada de la señal de audio, en 606. Por ejemplo, la información secundaria de banda alta 172 de la FIG. 1 puede incluir los primeros parámetros de forma de ganancia 242 y los segundos parámetros de forma de ganancia 406. El multiplexor 180 puede insertar los primeros parámetros de forma de ganancia 242 y los segundos parámetros de forma de ganancia 406 en el flujo de bits 199, y el flujo de bits 199 se puede transmitir a un decodificador (por ejemplo, el sistema 500 de la FIG. 5). El primer ajustador de forma de ganancia 592 de la FIG. 5 puede ajustar la señal armónicamente ampliada 508 en base al primer parámetro de forma de ganancia 242 para generar la segunda señal armónicamente ampliada ajustada 544. La segunda señal de excitación de banda alta 561 se basa al menos parcialmente en la segunda señal armónicamente ampliada ajustada 544. Adicionalmente, el segundo ajustador de forma de ganancia 526 de la FIG. 5 puede ajustar la señal sintetizada de banda alta 524 en base a los segundos parámetros de forma de ganancia 406 para reproducir una versión de la señal de banda alta 124.
[0073] El segundo procedimiento 610 puede incluir recibir, en un decodificador de voz, una señal de audio codificada desde un codificador de voz, en 612. La señal de audio codificada incluye los primeros parámetros de forma de ganancia 242 en base a la señal armónicamente ampliada 208 generada en el codificador de voz y a la señal residual de banda alta 224 generada en el codificador de voz. La señal de audio codificada también incluye los segundos parámetros de forma de ganancia 406 en base a la señal de banda alta sintetizada 404 y a la señal de banda alta 124.
[0074] Se reproduce una señal de audio de la señal de audio codificada en base a los primeros parámetros de forma de ganancia y en base a los segundos parámetros de forma de ganancia, en 614. Por ejemplo, el primer ajustador de forma de ganancia 592 de la FIG. 5 puede ajustar la señal armónicamente ampliada 508 en base a los primeros parámetros de forma de ganancia 242 para generar la segunda señal armónicamente ampliada ajustada 544. El generador de excitación de banda alta 520 de la FIG. 5 puede generar la segunda señal de excitación de banda alta 561 en base a la segunda señal armónicamente ampliada ajustada 544. El sintetizador de predicción lineal 522 puede realizar una operación de síntesis de predicción lineal en la segunda señal de excitación de banda alta 561 para generar la segunda señal de banda alta sintetizada 524, y el segundo ajustador de forma de ganancia 526 puede ajustar la segunda señal de banda alta sintetizada 524 en base a los segundos parámetros de forma de ganancia 406 para generar una segunda señal de banda alta sintetizada ajustada 528 (por ejemplo, la señal de audio reproducida).
[0075] Los procedimientos 600, 610 de la FIG. 6 puede mejorar una correlación de energía subtrama por subtrama (por ejemplo, mejorar una evolución temporal) entre una excitación de banda baja armónicamente ampliada de la señal de audio 102 y un residuo de banda alta de la señal de audio de entrada 102. Por ejemplo, durante una primera etapa de ganancia, el primer estimador de forma de ganancia 190 y el primer ajustador de forma de ganancia 192 pueden ajustar la excitación de banda baja armónicamente ampliada en base a los primeros parámetros de ganancia para modelar la excitación de banda baja armónicamente ampliada en base al residuo de la banda alta. Los procedimientos 600, 610 también pueden mejorar una correlación de energía subtrama por subtrama entre la señal de banda alta 124 y una versión sintetizada de la señal de banda alta 124. Por ejemplo, durante una segunda etapa de ganancia, el segundo estimador de forma de ganancia 194 y el segundo ajustador de forma de ganancia 196 pueden ajustar la versión sintetizada de la señal de banda alta 124 en base a los segundos parámetros de ganancia para modelar la versión sintetizada de la señal de banda alta 124 en base a la señal de banda alta 124.
[0076] En modos de realización particulares, los procedimientos 600, 610 de la FIG. 6 se pueden implementar por medio de hardware (por ejemplo, un dispositivo FPGA, un ASIC, etc.) de una unidad de procesamiento, tal como una unidad central de procesamiento (CPU), un procesador de señales digitales (DSP) o un controlador, a través de un dispositivo de firmware, o cualquier combinación de los mismos. Como ejemplo, los procedimientos 600, 610 de la FIG. 6 se pueden realizar por un procesador que ejecuta instrucciones, como se describe con respecto a la FIG. 7.
[0077] En referencia a la FIG. 7, se representa y se designa en general como 700 un diagrama de bloques de un modo de realización ilustrativo particular de un dispositivo de comunicación inalámbrica. El dispositivo 700 incluye un procesador 710 (por ejemplo, una CPU), acoplado a una memoria 732. La memoria 732 puede incluir instrucciones 760 ejecutables por el procesador 710 y/o un CODEC 734 para realizar los procedimientos y procesos divulgados en el presente documento, tales como los procedimientos 600, 610 de la FIG. 6.
[0078] En un modo de realización particular, el CODEC 734 puede incluir un sistema de estimación de ganancia en dos etapas 782 y un sistema de ajuste de ganancia en dos etapas 784. En un modo de realización particular, el sistema de estimación de ganancia en dos etapas 782 incluye uno o más componentes del sistema 100 de la FIG. 1, uno o más componentes del sistema 200 de la FIG. 2, y/o uno o más componentes del sistema 400 de la FIG. 4. Por ejemplo, el sistema de estimación de ganancia en dos etapas 782 puede realizar operaciones de codificación asociadas con los sistemas 100-200 de la FIG. 2, con el sistema 400 de la FIG. 4 y con el procedimiento 600 de la FIG. 6. En un modo de realización particular, el sistema de ajuste de ganancia en dos etapas 784 puede incluir uno o más componentes del sistema 500 de la FIG. 5. Por ejemplo, el sistema de ajuste de ganancia en dos etapas 784 puede realizar operaciones de decodificación asociadas con el sistema 500 de la FIG. 5 y con el procedimiento 610 de la FIG. 6. El sistema de estimación de ganancia en dos etapas 782 y/o el sistema de ajuste de ganancia en dos etapas 784 se pueden implementar por medio de hardware dedicado (por ejemplo, circuitería), mediante un procesador que ejecuta instrucciones para realizar una o más tareas, o una combinación de los mismos.
[0079] Como ejemplo, la memoria 732 o una memoria 790 en el CODEC 734 puede ser un dispositivo de memoria, tal como una memoria de acceso aleatorio (RAM), una memoria de acceso aleatorio magnetorresistiva (MRAM), una MRAM por transferencia de par de espín (STT-MRAM), una memoria flash, una memoria de solo lectura (ROM), una memoria de solo lectura programable (PROM), una memoria de solo lectura programable y borrable (EPROM), una memoria de solo lectura programable y borrable eléctricamente (EEPROM), unos registros, un disco duro, un disco extraíble o una memoria de solo lectura de disco compacto (CD-ROM). El dispositivo de memoria puede incluir instrucciones (por ejemplo, las instrucciones 760 o las instrucciones 795) que, cuando se ejecutan por un ordenador (por ejemplo, un procesador en el CODEC 734 y/o el procesador 710), pueden causar que el ordenador realice al menos una porción de uno de los procedimientos 600, 610 de la FIG. 6. Como ejemplo, la memoria 732 o la memoria 790 en el CODEC 734 puede ser un medio no transitorio legible por ordenador que incluya instrucciones (por ejemplo, las instrucciones 760 o las instrucciones 795, respectivamente) que, cuando se ejecuten por un ordenador (por ejemplo, un procesador en el CODEC 734 y/o en el procesador 710), causen que el ordenador ejecute al menos una porción de uno de los procedimientos 600, 610 de la FIG. 6.
[0080] El dispositivo 700 también puede incluir un DSP 796 acoplado al CODEC 734 y al procesador 710. En un modo de realización particular, el DSP 796 puede incluir un sistema de estimación de ganancia en dos etapas 797 y un sistema de ajuste de ganancia en dos etapas 798. El sistema de estimación de ganancia en dos etapas 797 puede incluir uno o más componentes del sistema 100 de la FIG. 1, uno o más componentes del sistema 200 de la FIG. 2, y/o uno o más componentes del sistema 400 de la FIG. 4. Por ejemplo, el sistema de estimación de ganancia en dos etapas 797 puede realizar operaciones de codificación asociadas con los sistemas 100-200 de la FIG. 2, el sistema 400 de la FIG. 4 y el procedimiento 600 de la FIG. 6. El sistema de ajuste de ganancia en dos etapas 798 puede incluir uno o más componentes del sistema 500 de la FIG. 5. Por ejemplo, el sistema de ajuste de ganancia en dos etapas 798 puede realizar operaciones de decodificación asociadas con el sistema 500 de la FIG. 5 y con el procedimiento 610 de la FIG. 6. El sistema de estimación de ganancia en dos etapas 797 y/o el sistema de ajuste de ganancia en dos etapas 798 se pueden implementar por medio de hardware dedicado (por ejemplo, circuitería), mediante un procesador que ejecute instrucciones para realizar una o más tareas, o una combinación de los mismos.
[0081] La FIG. 7 también muestra un controlador de pantalla 726 que está acoplado al procesador 710 y a una pantalla 728. El CODEC 734 puede estar acoplado al procesador 710, como se muestra. Un altavoz 736 y un micrófono 738 se pueden acoplar al CODEC 734. Por ejemplo, el micrófono 738 puede generar la señal de audio de entrada 102 de la FIG. 1, y el CODEC 734 puede generar el flujo de bits de salida 199 para su transmisión a un receptor en base a la señal de audio de entrada 102. Como otro ejemplo, el altavoz 736 se puede usar para facilitar una señal reconstruida por el CODEC 734 a partir del flujo de bits de salida 199 de la FIG. 1, donde el flujo de bits de salida 199 se recibe desde un transmisor. La FIG. 7 también indica que un controlador inalámbrico 740 se puede acoplar al procesador 710 y a una antena inalámbrica 742.
[0082] En un modo de realización particular, el procesador 710, el controlador de pantalla 726, la memoria 732, el CODEC 734, el DSP 796 y el controlador inalámbrico 740 están incluidos en un dispositivo de sistema en paquete o de sistema en chip (por ejemplo, un módem de estación móvil (MSM)) 722. En un modo de realización particular, un dispositivo de entrada 730, tal como una pantalla táctil y/o un teclado, y una fuente de alimentación 744 están acoplados al dispositivo de sistema en chip 722. Además, en un modo de realización particular, como se ilustra en la FIG. 7, la pantalla 728, el dispositivo de entrada 730, el altavoz 736, el micrófono 738, la antena 742 y la fuente de alimentación 744 son externos con respecto al dispositivo de sistema en chip 722. Sin embargo, cada uno de la pantalla 728, el dispositivo de entrada 730, el altavoz 736, el micrófono 738, la antena 742 y la fuente de alimentación 744 se pueden acoplar a un componente del dispositivo de sistema en chip 722, tal como una interfaz o un controlador.
[0083] Junto con los modos de realización descritos, se divulga un primer aparato que incluye medios para determinar los primeros parámetros de forma de ganancia en base a una señal armónicamente ampliada y en base a una señal residual de banda alta asociada con una porción de banda alta de una señal de audio. Por ejemplo, los medios para determinar los primeros parámetros de forma de ganancia pueden incluir el primer estimador de forma de ganancia 190 de las FIGS. 1-2, el módulo de identificación de trama 214 de la FIG. 2, el sistema de estimación de ganancia en dos etapas 782 de la FIG. 7, el sistema de estimación de ganancia en dos etapas 797 de la FIG. 7, uno o más dispositivos configurados para determinar los primeros parámetros de forma de ganancia (por ejemplo, un procesador que ejecuta instrucciones en un medio de almacenamiento no transitorio legible por ordenador), o cualquier combinación de los mismos.
[0084] El primer aparato también incluye medios para determinar los segundos parámetros de forma de ganancia en base a una señal de banda alta sintetizada y en base a la porción de banda alta de la señal de audio. Por ejemplo, los medios para determinar los segundos parámetros de forma de ganancia pueden incluir el segundo estimador de forma de ganancia 194 de las FIGS. 1 y 4, el sistema de estimación de ganancia en dos etapas 782 de la FIG. 7, el sistema de estimación de ganancia en dos etapas 797 de la FIG. 7, uno o más dispositivos configurados para determinar los segundos parámetros de ganancia (por ejemplo, un procesador que ejecuta instrucciones en un medio de almacenamiento no transitorio legible por ordenador), o cualquier combinación de los mismos.
[0085] El primer aparato también incluye medios para insertar los primeros parámetros de forma de ganancia y los segundos parámetros de forma de ganancia en una versión codificada de la señal de audio para permitir el ajuste de ganancia durante la reproducción de la señal de audio a partir de la versión codificada de la señal de audio. Por ejemplo, los medios para insertar los primeros parámetros de forma de ganancia y los segundos parámetros de forma de ganancia en la versión codificada de la señal de audio pueden incluir el multiplexor 180 de la FIG. 1, el sistema de estimación de ganancia en dos etapas 782 de la FIG. 7, el sistema de estimación de ganancia en dos etapas 797 de la FIG. 7, uno o más dispositivos configurados para insertar los primeros parámetros de ganancia en la versión codificada de la señal de audio (por ejemplo, un procesador que ejecuta instrucciones en un medio de almacenamiento no transitorio legible por ordenador), o cualquier combinación de los mismos.
[0086] Junto con los modos de realización descritos, se divulga un segundo aparato que incluye medios para recibir una señal de audio codificada desde un codificador de voz. La señal de audio codificada incluye los primeros parámetros de forma de ganancia en base a una primera señal armónicamente ampliada generada en el codificador de voz y en base a una señal residual de banda alta generada en el codificador de voz. La señal de audio codificada también incluye los segundos parámetros de forma de ganancia en base a una primera señal de banda alta sintetizada generada en el codificador de voz y en base a una banda alta de una señal de audio. Por ejemplo, los medios para recibir la señal de audio codificada pueden incluir el generador de excitación no lineal 507 de la FIG. 5, el primer estimador de forma de ganancia 592 de la FIG. 5, el segundo estimador de forma de ganancia 526 de la FIG. 5, el sistema de ajuste de ganancia en dos etapas 784 de la FIG. 7, el sistema de ajuste de ganancia en dos etapas 798 de la FIG. 7, uno o más dispositivos configurados para determinar la recepción de la señal de audio codificada (por ejemplo, un procesador que ejecuta instrucciones en un medio de almacenamiento no transitorio legible por ordenador), o cualquier combinación de los mismos.
[0087] El segundo aparato también incluye medios para reproducir la señal de audio a partir de la señal de audio codificada en base a los primeros parámetros de forma de ganancia y en base a los segundos parámetros de forma de ganancia. Por ejemplo, los medios para reproducir la señal de audio pueden incluir el generador de excitación no lineal 507 de la FIG. 5, el primer estimador de forma de ganancia 592 de la FIG. 5, el generador de excitación de banda alta 520 de la FIG. 5, el sintetizador de coeficiente de predicción lineal 522 de la FIG. 5, el segundo estimador de forma de ganancia 526 de la FIG. 5, el sistema de ajuste de ganancia en dos etapas 784 de la FIG. 7, el sistema de ajuste de ganancia en dos etapas 798 de la FIG. 7, uno o más dispositivos configurados para reproducir la señal de audio (por ejemplo, un procesador que ejecuta instrucciones en un medio de almacenamiento no transitorio legible por ordenador), o cualquier combinación de los mismos.
[0088] Los expertos en la técnica apreciarían además que los diversos bloques lógicos, configuraciones, módulos, circuitos y etapas de algoritmo ilustrativos descritos en relación con los modos de realización divulgados en el presente documento se pueden implementar como hardware electrónico, software informático ejecutado por un dispositivo de procesamiento, tal como un procesador de hardware, o combinaciones de los mismos. Se han descrito anteriormente diversos componentes, bloques, configuraciones, módulos, circuitos y etapas ilustrativos en general en lo que respecta a su funcionalidad. Que dicha funcionalidad se implemente como hardware o software ejecutable depende de la solicitud particular y de las restricciones de diseño impuestas al sistema global. Los expertos en la técnica pueden implementar la funcionalidad descrita de distintas formas para cada solicitud en particular, pero no se debe interpretar que dichas decisiones de implementación suponen apartarse del alcance de la presente divulgación.
[0089] Las etapas de un procedimiento o algoritmo descrito en relación con los modos de realización divulgados en el presente documento se pueden realizar directamente en hardware, en un módulo de software ejecutado por un procesador o en una combinación de los dos. Un módulo de software puede residir en un dispositivo de memoria, tal como una memoria de acceso aleatorio (RAM), una memoria de acceso aleatorio magnetorresistiva (MRAM), una MRAM de transferencia de par de espín (STT-MRAM), una memoria flash, una memoria de solo lectura (ROM), una memoria de solo lectura programable (PROM), una memoria de solo lectura programable y borrable (EPROM), una memoria de solo lectura programable y borrable eléctricamente (EEPROM), unos registros, un disco duro, un disco extraíble o una memoria de solo lectura de disco compacto (CD-ROM). Un dispositivo de memoria ejemplar está acoplado al procesador de modo que el procesador puede leer información de, y escribir información en, el dispositivo de memoria. De forma alternativa, el dispositivo de memoria puede estar integrado en el procesador. El procesador y el medio de almacenamiento pueden residir en un ASIC. El ASIC puede residir en un dispositivo informático o en un terminal de usuario. De forma alternativa, el procesador y el medio de almacenamiento pueden residir como componentes discretos en un dispositivo informático o en un terminal de usuario.
[0090] La descripción previa de los modos de realización divulgados se proporciona para permitir a un experto en la técnica crear o usar los modos de realización divulgados. Diversas modificaciones de estos modos de realización resultarán fácilmente evidentes para los expertos en la técnica, y los principios definidos en el presente documento se pueden aplicar a otros modos de realización sin apartarse del alcance de la divulgación. Por tanto, la presente divulgación no pretende limitarse a los modos de realización mostrados en el presente documento, sino que se le ha de conceder el alcance más amplio posible consecuente con los principios y rasgos característicos novedosos como se define en las reivindicaciones siguientes.

Claims (15)

REIVINDICACIONES
1. Un procedimiento para generar una versión codificada (199) de una señal de audio (102), en el que la versión codificada de la señal de audio se genera codificando una porción de banda baja (122) de la señal de audio, y a partir de información secundaria de banda alta (172) para reconstruir una porción de banda alta (124) de la señal de audio, comprendiendo el procedimiento:
determinar, en un codificador de voz, primeros parámetros de forma de ganancia en base a una señal residual de banda alta asociada con la porción de banda alta de la señal de audio;
generar una señal de excitación de banda alta en base a una señal armónicamente ampliada y a los primeros parámetros de forma de ganancia, en el que la señal armónicamente ampliada se basa en una señal de excitación de banda baja generada a partir de la porción de banda baja de la señal de audio;
realizar una operación de síntesis de predicción lineal en la señal de excitación de banda alta para generar una señal de banda alta sintetizada;
determinar segundos parámetros de forma de ganancia en base a la segunda señal de banda alta sintetizada y a la porción de banda alta de la señal de audio; e
insertar al menos los primeros parámetros de forma de ganancia y los segundos parámetros de forma de ganancia en la versión codificada de la señal de audio para permitir el ajuste de ganancia durante la reproducción de la señal de audio a partir de la versión codificada de la señal de audio.
2. El procedimiento de la reivindicación 1, en el que los primeros parámetros de forma de ganancia se determinan en un dominio residual de predicción lineal, y/o en el que los segundos parámetros de forma de ganancia se determinan en un dominio de síntesis de predicción lineal.
3. El procedimiento de la reivindicación 1, en el que la señal armónicamente ampliada se genera a partir de la porción de banda baja de la señal de audio a través de una ampliación armónica no lineal.
4. El procedimiento de la reivindicación 1, que comprende además:
ajustar la señal armónicamente ampliada en base a los primeros parámetros de forma de ganancia para generar una señal armónicamente ampliada modificada, en el que la señal de excitación de banda alta se basa al menos parcialmente en la señal armónicamente ampliada modificada; y/o
ajustar la señal de banda alta sintetizada en base a los segundos parámetros de forma de ganancia.
5. El procedimiento de la reivindicación 4, que comprende además:
muestrear una trama de banda baja de la señal armónicamente ampliada para generar una primera pluralidad de subtramas;
muestrear una trama correspondiente de banda alta de la señal residual de banda alta para generar una segunda pluralidad de subtramas; y
generar los primeros parámetros de forma de ganancia en base a los niveles de energía de la primera pluralidad de subtramas, en base a los niveles de energía de la segunda pluralidad de subtramas, o a cualquier combinación de los mismos
6. El procedimiento de la reivindicación 5, en el que la primera pluralidad de subtramas y la segunda pluralidad de subtramas incluyen el mismo número de subtramas tanto para una trama sonora como para una trama no sonora, en el que la primera pluralidad de subtramas y la segunda pluralidad de subtramas incluye cuatro subtramas si una tasa de muestreo de núcleo de banda baja es de 12,8 kilohercios (kHz), y en el que la primera pluralidad de subtramas y la segunda pluralidad de subtramas incluyen cinco subtramas si la tasa de muestreo del núcleo de banda baja es de 16 kHz.
7. Un aparato para generar una versión codificada (199) de una señal de audio (102), en el que la versión codificada de la señal de audio se genera codificando una porción de banda baja (122) de la señal de audio, y a partir de información secundaria de banda alta (172) para reconstruir una porción de banda alta (124) de la señal de audio, comprendiendo el aparato:
un primer estimador de forma de ganancia configurado para determinar primeros parámetros de forma de ganancia en base a una señal residual de banda alta asociada con la porción de banda alta de la señal de audio;
un primer ajustador de forma de ganancia configurado para generar una señal de excitación de banda alta en base a una señal armónicamente ampliada y a los primeros parámetros de forma de ganancia, en el que la señal armónicamente ampliada se basa en una señal de excitación de banda baja generada a partir de la porción de banda baja de la señal de audio;
un sintetizador de predicción lineal configurado para realizar una operación de síntesis de predicción lineal en la señal de excitación de banda alta para generar una señal de banda alta sintetizada;
un segundo estimador de forma de ganancia configurado para determinar segundos parámetros de forma de ganancia en base a la señal de banda alta sintetizada y en base a la porción de banda alta de la señal de audio; y
circuitería configurada para insertar al menos los primeros parámetros de forma de ganancia y los segundos parámetros de forma de ganancia en la versión codificada de la señal de audio para permitir el ajuste de ganancia durante la reproducción de la señal de audio de la versión codificada de la señal de audio.
8. El aparato de la reivindicación 7, en el que la circuitería incluye un multiplexor.
9. El aparato de acuerdo con la reivindicación 7, en el que el primer ajustador de forma de ganancia está configurado además para ajustar la señal armónicamente ampliada en base a los primeros parámetros de forma de ganancia para generar una señal armónicamente ampliada modificada.
10. El aparato de la reivindicación 9, en el que el primer estimador de canal está configurado además para:
muestrear una trama de banda baja de la señal armónicamente ampliada para generar una primera pluralidad de subtramas;
muestrear una trama de banda alta correspondiente de la señal residual de banda alta para generar una segunda pluralidad de subtramas; y
generar los primeros parámetros de forma de ganancia en base a los niveles de energía de la primera pluralidad de subtramas, en base a los niveles de energía de la segunda pluralidad de subtramas, o a cualquier combinación de los mismos.
11. El aparato de la reivindicación 10, en el que el primer ajustador de forma de ganancia está configurado además para ajustar la señal armónicamente ampliada ajustando a escala una subtrama particular de la primera pluralidad de subtramas para aproximar un nivel de energía de una subtrama correspondiente de la segunda pluralidad de subtramas.
12. El aparato de la reivindicación 10, en el que la primera pluralidad de subtramas incluye un primer número de subtramas en respuesta a una determinación de que la trama de banda alta es una trama sonora, y en el que la primera pluralidad de subtramas incluye un segundo número de subtramas que es menor que el primer número de subtramas en respuesta a una determinación de que la trama de banda alta no es una trama sonora.
13. El aparato de la reivindicación 10, en el que la primera pluralidad de subtramas incluye dieciséis subtramas en respuesta a una determinación de que la trama de banda alta es una trama sonora.
14. Un procedimiento para reproducir una señal de audio de una versión codificada de la señal de audio, comprendiendo el procedimiento:
recibir, en un decodificador de voz, la versión codificada de la señal de audio;
determinar primeros parámetros de forma de ganancia a partir de la versión codificada de la señal de audio; determinar segundos parámetros de forma de ganancia a partir de la versión codificada de la señal de audio; generar una señal armónicamente ampliada en base a ampliar de forma no lineal una excitación de banda baja de la versión codificada de la señal de audio;
ajustar la señal armónicamente ampliada en base a los primeros parámetros de forma de ganancia para obtener una señal armónicamente ampliada modificada;
generar una señal de excitación de banda alta en base a la señal armónicamente ampliada modificada; realizar una operación de síntesis de predicción lineal en la señal de excitación de banda alta para generar una segunda señal de banda alta sintetizada; y
ajustar la señal de banda alta sintetizada en base a los segundos parámetros de forma de ganancia.
15. Un decodificador de voz para reproducir una señal de audio a partir de una versión codificada de la señal de audio, estando configurado el decodificador de voz para:
recibir la versión codificada de la señal de audio;
determinar primeros parámetros de forma de ganancia a partir de la versión codificada de la señal de audio; determinar segundos parámetros de forma de ganancia de la versión codificada de la señal de audio; generar una señal armónicamente ampliada en base a ampliar de forma no lineal una excitación de banda baja de la versión codificada de la señal de audio;
ajustar la señal armónicamente ampliada en base a los primeros parámetros de forma de ganancia para obtener una señal armónicamente ampliada modificada;
generar una señal de excitación de banda alta en base a la señal armónicamente ampliada modificada; realizar una operación de síntesis de predicción lineal en la señal de excitación de banda alta para generar una segunda señal de banda alta sintetizada; y
ajustar la señal de banda alta sintetizada en base a los segundos parámetros de forma de ganancia.
ES14790439T 2013-10-10 2014-10-08 Estimación de forma de ganancia para mejorar el rastreo de características temporales de banda alta Active ES2774334T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201361889434P 2013-10-10 2013-10-10
US14/508,486 US9620134B2 (en) 2013-10-10 2014-10-07 Gain shape estimation for improved tracking of high-band temporal characteristics
PCT/US2014/059753 WO2015054421A1 (en) 2013-10-10 2014-10-08 Gain shape estimation for improved tracking of high-band temporal characteristics

Publications (1)

Publication Number Publication Date
ES2774334T3 true ES2774334T3 (es) 2020-07-20

Family

ID=52810401

Family Applications (1)

Application Number Title Priority Date Filing Date
ES14790439T Active ES2774334T3 (es) 2013-10-10 2014-10-08 Estimación de forma de ganancia para mejorar el rastreo de características temporales de banda alta

Country Status (21)

Country Link
US (1) US9620134B2 (es)
EP (1) EP3055860B1 (es)
JP (1) JP6262337B2 (es)
KR (1) KR101828193B1 (es)
CN (1) CN105593933B (es)
AU (1) AU2014331903B2 (es)
BR (1) BR112016007914B1 (es)
CA (1) CA2925572C (es)
CL (1) CL2016000819A1 (es)
DK (1) DK3055860T3 (es)
ES (1) ES2774334T3 (es)
HU (1) HUE047305T2 (es)
MX (1) MX350816B (es)
MY (1) MY183940A (es)
NZ (1) NZ717833A (es)
PH (1) PH12016500470B1 (es)
RU (1) RU2648570C2 (es)
SA (1) SA516370898B1 (es)
SI (1) SI3055860T1 (es)
TW (1) TWI604440B (es)
WO (1) WO2015054421A1 (es)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR3011408A1 (fr) * 2013-09-30 2015-04-03 Orange Re-echantillonnage d'un signal audio pour un codage/decodage a bas retard
US9984699B2 (en) 2014-06-26 2018-05-29 Qualcomm Incorporated High-band signal coding using mismatched frequency ranges
US9659564B2 (en) * 2014-10-24 2017-05-23 Sestek Ses Ve Iletisim Bilgisayar Teknolojileri Sanayi Ticaret Anonim Sirketi Speaker verification based on acoustic behavioral characteristics of the speaker
US10109284B2 (en) * 2016-02-12 2018-10-23 Qualcomm Incorporated Inter-channel encoding and decoding of multiple high-band audio signals
US10825467B2 (en) * 2017-04-21 2020-11-03 Qualcomm Incorporated Non-harmonic speech detection and bandwidth extension in a multi-source environment
US10431231B2 (en) * 2017-06-29 2019-10-01 Qualcomm Incorporated High-band residual prediction with time-domain inter-channel bandwidth extension
TWI895201B (zh) * 2018-01-26 2025-08-21 瑞典商都比國際公司 用於執行一音訊信號之高頻重建之方法、音訊處理單元及非暫時性電腦可讀媒體
US10957331B2 (en) 2018-12-17 2021-03-23 Microsoft Technology Licensing, Llc Phase reconstruction in a speech decoder
US10847172B2 (en) * 2018-12-17 2020-11-24 Microsoft Technology Licensing, Llc Phase quantization in a speech encoder
CN118038877B (zh) * 2022-11-01 2026-03-10 抖音视界有限公司 一种音频信号的编码、解码方法及装置
CN116434764A (zh) * 2023-02-01 2023-07-14 深圳大学 一种基于神经网络的语音增强方法、装置、设备及介质

Family Cites Families (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9512284D0 (en) * 1995-06-16 1995-08-16 Nokia Mobile Phones Ltd Speech Synthesiser
US6233554B1 (en) * 1997-12-12 2001-05-15 Qualcomm Incorporated Audio CODEC with AGC controlled by a VOCODER
US6141638A (en) 1998-05-28 2000-10-31 Motorola, Inc. Method and apparatus for coding an information signal
US7117146B2 (en) 1998-08-24 2006-10-03 Mindspeed Technologies, Inc. System for improved use of pitch enhancement with subcodebooks
US7272556B1 (en) 1998-09-23 2007-09-18 Lucent Technologies Inc. Scalable and embedded codec for speech and audio signals
GB2342829B (en) 1998-10-13 2003-03-26 Nokia Mobile Phones Ltd Postfilter
CA2252170A1 (en) 1998-10-27 2000-04-27 Bruno Bessette A method and device for high quality coding of wideband speech and audio signals
US6449313B1 (en) 1999-04-28 2002-09-10 Lucent Technologies Inc. Shaped fixed codebook search for celp speech coding
US6704701B1 (en) 1999-07-02 2004-03-09 Mindspeed Technologies, Inc. Bi-directional pitch enhancement in speech coding systems
WO2001059766A1 (en) 2000-02-11 2001-08-16 Comsat Corporation Background noise reduction in sinusoidal based speech coding systems
US6760698B2 (en) 2000-09-15 2004-07-06 Mindspeed Technologies Inc. System for coding speech information using an adaptive codebook with enhanced variable resolution scheme
AU2001287970A1 (en) 2000-09-15 2002-03-26 Conexant Systems, Inc. Short-term enhancement in celp speech coding
US6766289B2 (en) 2001-06-04 2004-07-20 Qualcomm Incorporated Fast code-vector searching
JP3457293B2 (ja) 2001-06-06 2003-10-14 三菱電機株式会社 雑音抑圧装置及び雑音抑圧方法
US6993207B1 (en) 2001-10-05 2006-01-31 Micron Technology, Inc. Method and apparatus for electronic image processing
US7146313B2 (en) 2001-12-14 2006-12-05 Microsoft Corporation Techniques for measurement of perceptual audio quality
US7047188B2 (en) 2002-11-08 2006-05-16 Motorola, Inc. Method and apparatus for improvement coding of the subframe gain in a speech coding system
US20050004793A1 (en) 2003-07-03 2005-01-06 Pasi Ojala Signal adaptation for higher band coding in a codec utilizing band split coding
US7788091B2 (en) 2004-09-22 2010-08-31 Texas Instruments Incorporated Methods, devices and systems for improved pitch enhancement and autocorrelation in voice codecs
JP2006197391A (ja) 2005-01-14 2006-07-27 Toshiba Corp 音声ミクシング処理装置及び音声ミクシング処理方法
CN101185127B (zh) * 2005-04-01 2014-04-23 高通股份有限公司 用于编码和解码语音信号的高频带部分的方法和设备
JP5129117B2 (ja) * 2005-04-01 2013-01-23 クゥアルコム・インコーポレイテッド 音声信号の高帯域部分を符号化及び復号する方法及び装置
PL1875463T3 (pl) 2005-04-22 2019-03-29 Qualcomm Incorporated Układy, sposoby i urządzenie do wygładzania współczynnika wzmocnienia
US8280730B2 (en) 2005-05-25 2012-10-02 Motorola Mobility Llc Method and apparatus of increasing speech intelligibility in noisy environments
DE102006022346B4 (de) 2006-05-12 2008-02-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Informationssignalcodierung
US8682652B2 (en) 2006-06-30 2014-03-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic
US9009032B2 (en) 2006-11-09 2015-04-14 Broadcom Corporation Method and system for performing sample rate conversion
US20100332223A1 (en) 2006-12-13 2010-12-30 Panasonic Corporation Audio decoding device and power adjusting method
US20080208575A1 (en) 2007-02-27 2008-08-28 Nokia Corporation Split-band encoding and decoding of an audio signal
KR101413968B1 (ko) 2008-01-29 2014-07-01 삼성전자주식회사 오디오 신호의 부호화, 복호화 방법 및 장치
PL2304723T3 (pl) * 2008-07-11 2013-03-29 Fraunhofer Ges Forschung Urządzenie i sposób dekodowania zakodowanego sygnału audio
US8484020B2 (en) 2009-10-23 2013-07-09 Qualcomm Incorporated Determining an upperband signal from a narrowband signal
US9031835B2 (en) 2009-11-19 2015-05-12 Telefonaktiebolaget L M Ericsson (Publ) Methods and arrangements for loudness and sharpness compensation in audio codecs
US8600737B2 (en) 2010-06-01 2013-12-03 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for wideband speech coding
US8738385B2 (en) 2010-10-20 2014-05-27 Broadcom Corporation Pitch-based pre-filtering and post-filtering for compression of audio signals
EP2710590B1 (en) 2011-05-16 2015-10-07 Google, Inc. Super-wideband noise supression
CN102802112B (zh) 2011-05-24 2014-08-13 鸿富锦精密工业(深圳)有限公司 具有音频文件格式转换功能的电子装置
PT2772913T (pt) * 2011-10-28 2018-05-10 Fraunhofer Ges Forschung Aparelho de codificação e método de codificação

Also Published As

Publication number Publication date
MX350816B (es) 2017-09-25
JP2016539355A (ja) 2016-12-15
HK1219344A1 (zh) 2017-03-31
EP3055860B1 (en) 2019-11-20
EP3055860A1 (en) 2016-08-17
JP6262337B2 (ja) 2018-01-17
BR112016007914A2 (pt) 2017-08-01
CN105593933B (zh) 2019-10-15
NZ717833A (en) 2019-01-25
WO2015054421A1 (en) 2015-04-16
KR101828193B1 (ko) 2018-02-09
RU2016113271A (ru) 2017-11-15
SI3055860T1 (sl) 2020-03-31
CA2925572A1 (en) 2015-04-16
RU2648570C2 (ru) 2018-03-26
HUE047305T2 (hu) 2020-04-28
TWI604440B (zh) 2017-11-01
CN105593933A (zh) 2016-05-18
US9620134B2 (en) 2017-04-11
PH12016500470A1 (en) 2016-05-16
TW201521020A (zh) 2015-06-01
MY183940A (en) 2021-03-17
PH12016500470B1 (en) 2018-08-24
KR20160067207A (ko) 2016-06-13
CL2016000819A1 (es) 2016-10-14
MX2016004528A (es) 2016-07-22
DK3055860T3 (da) 2020-02-03
SA516370898B1 (ar) 2019-01-03
AU2014331903B2 (en) 2018-03-01
CA2925572C (en) 2019-05-21
BR112016007914B1 (pt) 2021-12-21
US20150106102A1 (en) 2015-04-16

Similar Documents

Publication Publication Date Title
ES2774334T3 (es) Estimación de forma de ganancia para mejorar el rastreo de características temporales de banda alta
ES2844231T3 (es) Modelado de señales de banda alta
ES2715476T3 (es) Sistemas y procedimientos para realizar la modulación de ruido y el ajuste de ganancia
ES2618258T3 (es) Sistemas y procedimientos para realizar el control de ganancia
US10410652B2 (en) Estimation of mixing factors to generate high-band excitation signal
ES2807258T3 (es) Escalado para circuitería de forma de ganancia
AU2014331903A1 (en) Gain shape estimation for improved tracking of high-band temporal characteristics
DK3058570T3 (en) PROCEDURE, DEVICE, DEVICE, COMPUTER READABLE MEDIUM FOR BANDWIDTH EXTENSION OF AN AUDIO SIGNAL USING SCALED HIGH-BAND EXCITATION