ES2955855T3 - Generación de señal de banda alta - Google Patents

Generación de señal de banda alta Download PDF

Info

Publication number
ES2955855T3
ES2955855T3 ES16732032T ES16732032T ES2955855T3 ES 2955855 T3 ES2955855 T3 ES 2955855T3 ES 16732032 T ES16732032 T ES 16732032T ES 16732032 T ES16732032 T ES 16732032T ES 2955855 T3 ES2955855 T3 ES 2955855T3
Authority
ES
Spain
Prior art keywords
signal
function
generate
band
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES16732032T
Other languages
English (en)
Inventor
Venkatraman Atti
Venkata Subrahmanyam Chandra Sekhar Chebiyyam
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Application granted granted Critical
Publication of ES2955855T3 publication Critical patent/ES2955855T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/087Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using mixed excitation models, e.g. MELP, MBE, split band LPC or HVXC
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/03Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • G10L21/0388Details of processing therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Stereophonic System (AREA)
  • Circuits Of Receivers In General (AREA)
  • Radar Systems Or Details Thereof (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Complex Calculations (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

Un dispositivo para procesamiento de señales incluye una memoria y un procesador. La memoria está configurada para almacenar un parámetro asociado con una transmisión de audio con ancho de banda extendido. El procesador está configurado para seleccionar una pluralidad de funciones de procesamiento no lineal basándose al menos en parte en un valor del parámetro. El procesador también está configurado para generar una señal de excitación de banda alta basada en la pluralidad de funciones de procesamiento no lineal. (Traducción automática con Google Translate, sin valor legal)

Description

DESCRIPCIÓN
Generación de señal de banda alta
II. Campo
La presente divulgación se refiere en general a la generación de señales de banda alta.
III. Descripción de la técnica relacionada
Los avances en la tecnología han dado como resultado dispositivos informáticos más pequeños y más potentes. Por ejemplo, existe actualmente una diversidad de dispositivos informáticos personales portátiles, que incluyen teléfonos inalámbricos tales como teléfonos móviles e inteligentes, tabletas y ordenadores de portátil que son pequeños, ligeros y se llevan fácilmente por los usuarios. Estos dispositivos pueden comunicar paquetes de voz y datos a través de redes inalámbricas. Además, muchos de tales dispositivos incorporan funcionalidad adicional tal como una cámara fija digital, una cámara de vídeo digital, un grabador digital y un reproductor de ficheros de audio. También, tales dispositivos pueden procesar instrucciones ejecutables, que incluyen aplicaciones de software, tales como una aplicación de explorador web, que pueden usarse para acceder a Internet. Como tal, estos dispositivos pueden incluir capacidades informáticas significativas.
La transmisión de audio, tal como la voz, mediante técnicas digitales está muy extendida. Si la voz se transmite muestreando y digitalizando, se puede usar una tasa de datos del orden de sesenta y cuatro kilobits por segundo (kbps) para lograr la calidad de voz de un teléfono analógico. Se pueden usar técnicas de compresión para reducir la cantidad de información que se envía a través de un canal mientras se mantiene al mismo tiempo una calidad percibida de la voz reconstruida. Mediante el uso de análisis de voz, seguido de codificación, transmisión y resíntesis en un receptor, se puede lograr una reducción significativa en la tasa de datos.
Los codificadores de voz se pueden implementar como codificadores del dominio del tiempo, que intentan capturar la forma de onda de la voz del dominio del tiempo empleando procesamiento de alta resolución de tiempo para codificar pequeños segmentos de voz (por ejemplo, subtramas de 5 milisegundos (ms)) a la vez. Para cada subtrama, se encuentra un representante de alta precisión de un espacio del libro de códigos por medio de un algoritmo de búsqueda.
Un codificador de voz del dominio del tiempo es el codificador predictivo lineal excitado por código (CELP). En un codificador CELP, las correlaciones o redundancias a corto plazo en la señal de voz se eliminan mediante un análisis de predicción lineal (LP), que encuentra los coeficientes de un filtro de formantes a corto plazo. Aplicar el filtro de predicción a corto plazo a la trama de voz entrante genera una señal residual de LP, que se modela y cuantifica además con parámetros de filtro de predicción a largo plazo y un libro de códigos estocástico posterior. Por lo tanto, la codificación CELP divide la tarea de codificar la forma de onda de la voz del dominio del tiempo en tareas separadas de codificación de los coeficientes de filtro de corto plazo de LP y codificación del residuo de LP. La codificación del dominio del tiempo se puede realizar a una tasa fija (es decir, usando el mismo número de bits, No, para cada trama) o a una tasa variable (en la que se usan diferentes tasas de bits para diferentes tipos de contenidos de trama). Los codificadores de tasa variable intentan usar la cantidad de bits necesarios para codificar los parámetros a un nivel adecuado para obtener una calidad objetivo.
Las técnicas de codificación de banda ancha implican codificar y transmitir una porción de frecuencia inferior de una señal (por ejemplo, de 50 hercios (Hz) a 7 kilohercios (kHz), también denominada "banda baja". Para mejorar la eficiencia de la codificación, es posible que la porción de frecuencia superior de la señal (por ejemplo, de 7 kHz a 16 kHz, también denominada "banda alta") no se codifique ni transmita completamente. Las propiedades de la señal de banda baja pueden usarse para generar la señal de banda alta. Por ejemplo, se puede generar una señal de excitación de banda alta basándose en un residual de banda baja usando un modelo no lineal. El documento EP1947644 A1 divulga un método y un aparato para proporcionar una señal acústica con ancho de banda extendido que comprende proporcionar una señal de extensión superior para extender una señal acústica recibida en frecuencias superiores, en donde proporcionar la señal de extensión superior comprende desplazar la señal acústica recibida al menos por encima de un valor de frecuencia inferior predeterminado y/o por debajo de un valor de frecuencia superior predeterminado por un valor de frecuencia de desplazamiento predeterminado para obtener una señal desplazada. El documento EP2709106 A1 describe un aparato para generar una señal de ancho de banda extendido a partir de una señal de audio de ancho de banda limitado, comprendiendo la señal de audio de ancho de banda limitado una pluralidad de bloques de tiempo consecutivos de ancho de banda limitado, teniendo cada bloque de tiempo de ancho de banda limitado al menos un parámetro de replicación de banda espectral asociado que comprende una banda de frecuencia de núcleo y la señal extendida de ancho de banda que comprende una pluralidad de bloques de tiempo extendidos de ancho de banda consecutivos, comprende un generador de parche, un manipulador de señal y un combinador. El generador de parche está configurado para generar una señal parcheada que comprende una banda de frecuencia superior usando un bloque de tiempo de ancho de banda limitado de la señal de audio de ancho de banda limitado. El generador de parche está configurado para realizar un algoritmo de parcheo armónico para obtener la señal parcheada. El generador de parche está configurado para realizar el algoritmo de parcheo armónico para un bloque de tiempo extendido de ancho de banda actual de la pluralidad de bloques de tiempo extendidos de ancho de banda consecutivos usando un bloque de tiempo de ancho de banda limitado anterior de la pluralidad de bloques de tiempo de ancho de banda limitado consecutivos de la señal de audio de ancho de banda limitado. El documento EP 1866914 A1 divulga un cuantificador según una realización que está configurado para cuantificar un valor suavizado de un valor de entrada (por ejemplo, un vector de frecuencias espectrales de línea) para producir un valor de salida correspondiente, donde el valor suavizado se basa en un factor de escala y un error de cuantificación de un valor de salida anterior.
IV. Sumario
La invención se define en las reivindicaciones adjuntas, a las que se debería hacer referencia a continuación. En las reivindicaciones dependientes se definen características preferentes.
Otros aspectos, ventajas y características de la presente divulgación se harán evidentes después de revisar la totalidad de la solicitud, incluyendo las secciones siguientes: Breve descripción de los dibujos, descripción detallada y reivindicaciones.
V. Breve descripción de los dibujos
La Figura 1 es un diagrama de bloques de un aspecto ilustrativo particular de un sistema que incluye dispositivos que son operables para generar una señal de banda alta;
La Figura 2 es un diagrama de otro aspecto de un sistema que incluye dispositivos que son operables para generar una señal de banda alta;
La Figura 3 es un diagrama de otro aspecto de un sistema que incluye dispositivos que son operables para generar una señal de banda alta;
La Figura 4 es un diagrama de otro aspecto de un sistema que incluye dispositivos que son operables para generar una señal de banda alta;
La Figura 5 es un diagrama de un aspecto ilustrativo particular de un remuestreador que puede incluirse en uno o más de los sistemas de las Figuras 1-4;
La Figura 6 es un diagrama de un aspecto ilustrativo particular de inversión espectral de una señal que puede realizarse mediante uno o más de los sistemas de las Figuras 1-4;
La Figura 7 es un diagrama de flujo para ilustrar un aspecto de un método de generación de señal de banda alta;
La Figura 8 es un diagrama de flujo para ilustrar otro aspecto de un método de generación de señal de banda alta;
La Figura 9 es un diagrama de flujo para ilustrar otro aspecto de un método de generación de señal de banda alta;
La Figura 10 es un diagrama de flujo para ilustrar otro aspecto de un método de generación de señal de banda alta;
La Figura 11 es un diagrama de flujo para ilustrar otro aspecto de un método de generación de señal de banda alta;
La Figura 12 es un diagrama de flujo para ilustrar otro aspecto de un método de generación de señal de banda alta;
La Figura 13 es un diagrama de otro aspecto de un sistema que incluye dispositivos que son operables para generar una señal de banda alta;
La Figura 14 es un diagrama de componentes del sistema de la Figura 13;
La Figura 15 es un diagrama para ilustrar otro aspecto de un método de generación de señal de - banda alta;
La Figura 16 es un diagrama para ilustrar otro aspecto de un método de generación de señal de - banda alta;
La Figura 17 es un diagrama de componentes del sistema de la Figura 13;
La Figura 18 es un diagrama para ilustrar otro aspecto de un método de generación de señal de - banda alta; La Figura 19 es un diagrama de componentes del sistema de la Figura 13;
La Figura 20 es un diagrama para ilustrar otro aspecto de un método de generación de señal de - banda alta;
La Figura 21 es un diagrama de flujo para ilustrar otro aspecto de un método de generación de señal de banda alta;
La Figura 22 es un diagrama de flujo para ilustrar otro aspecto de un método de generación de señal de banda alta;
La Figura 23 es un diagrama de flujo para ilustrar otro aspecto de un método de generación de señal de banda alta;
La Figura 24 es un diagrama de flujo para ilustrar otro aspecto de un método de generación de señal de banda alta;
La Figura 25 es un diagrama de flujo para ilustrar otro aspecto de un método de generación de señal de banda alta;
La Figura 26 es un diagrama de bloques de un dispositivo operable para realizar generación de señal de banda alta de acuerdo con los sistemas y métodos de las Figuras 1-25; y
La Figura 27 es un diagrama de bloques de una estación base operable para realizar generación de señal de banda alta de acuerdo con los sistemas y métodos de las Figuras 1-26.
VI. Descripción detallada
Haciendo referencia a la Figura 1, se divulga un aspecto ilustrativo particular de un sistema que incluye dispositivos que son operables para generar una señal de banda alta y generalmente se designa con 100.
El sistema 100 incluye un primer dispositivo 102 en comunicación, mediante una red 107, con un segundo dispositivo 104. El primer dispositivo 102 puede incluir un procesador 106. El procesador 106 puede estar acoplado o puede incluir un codificador 108. El segundo dispositivo 104 puede estar acoplado o en comunicación con uno o más altavoces 122. El segundo dispositivo 104 puede incluir un procesador 116, una memoria 132 o ambos. El procesador 116 puede estar acoplado o puede incluir un decodificador 118. El decodificador 118 puede incluir un primer decodificador 134 (por ejemplo, un decodificador de predicción lineal excitada por código algebraico (ACELP)) y un segundo decodificador 136 (por ejemplo, un decodificador de extensión de ancho de banda del dominio del tiempo (TBE)). En aspectos ilustrativos, una o más técnicas descritas en el presente documento pueden incluirse en una norma industrial, que incluye, pero sin limitación, una norma para audio tridimensional (3D) del grupo de expertos en imágenes en movimiento (MPEg )-H.
El segundo decodificador 136 puede incluir un convertidor de trama de TBE 156 acoplado a un módulo de extensión de ancho de banda 146, un módulo de decodificación 162 o ambos. El módulo de decodificación 162 puede incluir un generador de señal de excitación de banda alta (HB) 147, un generador 148 de señal de HB, o ambos. El módulo de extensión de ancho de banda 146 puede acoplarse, a través del módulo de decodificación, a un generador de señal 138. El primer decodificador 134 puede estar acoplado al segundo decodificador 136, al generador de señal 138 o a ambos. Por ejemplo, el primer decodificador 134 puede estar acoplado al módulo de extensión de ancho de banda 146, al generador de señal de excitación de HB 147 o a ambos. El generador de señal de excitación de HB 147 puede estar acoplado al generador de señal de HB 148. La memoria 132 puede configurarse para almacenar instrucciones para realizar una o más funciones (por ejemplo, una primera función 164, una segunda función 166 o ambas). La primera función 164 puede incluir una primera función no lineal (por ejemplo, una función cuadrada) y la segunda función 166 puede incluir una segunda función no lineal (por ejemplo, una función de valor absoluto) que es distinta de la primera función no lineal. Como alternativa, tales funciones pueden implementarse usando hardware (por ejemplo, circuitería) en el segundo dispositivo 104. La memoria 132 puede configurarse para almacenar una o más señales (por ejemplo, una primera señal de excitación 168, una segunda señal de excitación 170 o ambas). El segundo dispositivo 104 puede incluir además un receptor 192. En una implementación particular, el receptor 192 puede incluirse en un transceptor.
Durante la operación, el primer dispositivo 102 puede recibir (o generar) una señal de entrada 114. La señal de entrada 114 puede corresponder a la voz de uno o más usuarios, ruido de fondo, silencio o una combinación de los mismos. En un aspecto particular, la señal de entrada 114 puede incluir datos en el intervalo de frecuencia de aproximadamente 50 hercios (Hz) a aproximadamente 16 kilohercios (kHz). La porción de banda baja de la señal de entrada 114 y la porción de banda alta de la señal de entrada 114 pueden ocupar bandas de frecuencia no superpuestas de 50 Hz - 7 kHz y 7 kHz - 16 kHz, respectivamente. En un aspecto alternativo, la porción de banda baja y la porción de banda alta pueden ocupar bandas de frecuencia no superpuestas de 50 Hz - 8 kHz y 8 kHz - 16 kHz, respectivamente. En otro aspecto alternativo, la porción de banda baja y la porción de banda alta pueden superponerse (por ejemplo, 50 Hz - 8 kHz y 7 kHz - 16 kHz, respectivamente).
El codificador 108 puede generar datos de audio 126 codificando la señal de entrada 114. Por ejemplo, el codificador 108 puede generar un primer flujo de bits 128 (por ejemplo, un flujo de bits de ACELP) basándose en una señal de banda baja de la señal de entrada 114. El primer flujo de bits 128 puede incluir información de parámetro de banda baja (por ejemplo, coeficientes de predicción lineal (LPC) de banda baja, frecuencias espectrales de línea (LSF) de banda baja, o ambos) y una señal de excitación de banda baja (por ejemplo, una residual de banda baja de la señal de entrada 114).
En un aspecto particular, el codificador 108 puede generar una señal de excitación de banda alta y puede codificar una señal de banda alta de la señal de entrada 114 basándose en la señal de excitación de banda alta. Por ejemplo, el codificador 108 puede generar un segundo flujo de bits 130 (por ejemplo, un flujo de bits de TBE) basado en la señal de excitación de banda alta. El segundo flujo de bits 130 puede incluir parámetros de flujo de bits, como se describe además con referencia a la Figura 3. Por ejemplo, los parámetros de flujo de bits pueden incluir uno o más parámetros de flujo de bits 160 como se ilustra en la Figura 1, un modo de configuración no lineal (NL) 158, o una combinación de los mismos. Los parámetros del flujo de bits pueden incluir información de parámetro de banda alta. Por ejemplo, el segundo flujo de bits 130 puede incluir al menos uno de coeficientes de LPC de banda alta, LSF de banda alta, coeficientes de par espectral de línea (LSP) de banda alta, información de forma de ganancia (por ejemplo, parámetros de ganancia temporal correspondientes a subtramas de una trama particular), información de trama de ganancia (por ejemplo, parámetros de ganancia correspondientes a una relación de energía de banda alta a banda baja para una trama particular) y/u otros parámetros correspondientes a una porción de banda alta de la señal de entrada 114. En un aspecto particular, el codificador 108 puede determinar los coeficientes de LPC de banda alta usando al menos uno de un cuantificador vectorial, un modelo de Markov oculto (HMM), un modelo de mezcla gaussiana (GMM) u otro modelo o método. El codificador 108 puede determinar la LSF de banda alta, el LSP de banda alta o ambos, basándose en los coeficientes de LPC.
El codificador 108 puede generar información de parámetro de banda alta basándose en la señal de banda alta de la señal de entrada 114. Por ejemplo, un decodificador "local" del primer dispositivo 102 puede emular el decodificador 118 del segundo dispositivo 104. El decodificador "local" puede generar una señal de audio sintetizada basándose en la señal de excitación de banda alta. El codificador 108 puede generar valores de ganancia (por ejemplo, forma de ganancia, trama de ganancia o ambos) basándose en una comparación de la señal de audio sintetizada y la señal de entrada 114. Por ejemplo, los valores de ganancia pueden corresponder a una diferencia entre la señal de audio sintetizada y la señal de entrada 114. Los datos de audio 126 pueden incluir el primer flujo de bits 128, el segundo flujo de bits 130 o ambos. El primer dispositivo 102 puede transmitir los datos de audio 126 al segundo dispositivo 104 a través de la red 107.
El receptor 192 puede recibir los datos de audio 126 desde el primer dispositivo 102 y puede proporcionar los datos de audio 126 al decodificador 118. El receptor 192 también puede almacenar los datos de audio 126 (o porciones de los mismos) en la memoria 132. En una implementación alternativa, la memoria 132 puede almacenar la señal de entrada 114, los datos de audio 126 o ambos. En esta implementación, la señal de entrada 114, los datos de audio 126, o ambos, pueden generarse por el segundo dispositivo 104. Por ejemplo, los datos de audio 126 pueden corresponder a medios (por ejemplo, música, películas, programas de televisión, etc.) que están almacenados en el segundo dispositivo 104 o que están transmitiéndose por flujo continuo por el segundo dispositivo 104.
El decodificador 118 puede proporcionar el primer flujo de bits 128 al primer decodificador 134 y el segundo flujo de bits 130 al segundo decodificador 136. El primer decodificador 134 puede extraer (o decodificar) información de parámetro de banda baja, tal como coeficientes de LPC de banda baja, LSF de banda baja, o ambos, y una señal de excitación de banda baja (LB) 144 (por ejemplo, un residual de banda baja la señal de entrada 114) del primer flujo de bits 128. El primer decodificador 134 puede proporcionar la señal de excitación de LB 144 al módulo de extensión de ancho de banda 146. El primer decodificador 134 puede generar una señal de LB 140 basándose en los parámetros de banda baja y la señal de excitación de LB 144 usando un modelo de LB particular. El primer decodificador 134 puede proporcionar la señal de LB 140 al generador de señal 138, como se muestra.
El primer decodificador 134 puede determinar un factor de sonoridad de LB (VF) 154 (por ejemplo, un valor de 0,0 a 1,0) basándose en la información de parámetro de LB. El VF de LB 154 puede indicar una naturaleza sonora/no sonora (por ejemplo, fuertemente sonora, débilmente sonora, débilmente no sonora o fuertemente no sonora) de la señal de LB 140. El primer decodificador 134 puede proporcionar el VF de LB 154 al generador de señal de excitación de HB 147.
El convertidor de trama TBE 156 puede generar parámetros de flujo de bits analizando el segundo flujo de bits 130. Por ejemplo, los parámetros de flujo de bits pueden incluir los parámetros de flujo de bits 160, el modo de configuración NL 158, o una combinación de los mismos, como se describe además con referencia a la Figura 3. El convertidor de trama TBE 156 puede proporcionar el modo de configuración NL 158 al módulo de extensión de ancho de banda 146, los parámetros de flujo de bits 160 al módulo de decodificación 162, o ambos.
El módulo de extensión de ancho de banda 146 puede generar una señal extendida 150 (por ejemplo, una señal de excitación de banda alta armónicamente extendida) basándose en la señal de excitación de LB 144, el modo de configuración NL 158, o ambos, como se describe con referencia a las Figuras 4-5. El módulo de extensión de ancho de banda 146 puede proporcionar la señal extendida 150 al generador de señal de excitación de HB 147. El generador de señal de excitación de HB 147 puede sintetizar una señal de excitación de HB 152 basándose en los parámetros del flujo de bits 160, la señal extendida 150, el VF de LB 154 o una combinación de los mismos, como se describe además con referencia a la Figura 4. El generador de señal de HB 148 puede generar una señal de HB 142 basándose en la señal de excitación de HB 152, los parámetros del flujo de bits 160 o una combinación de los mismos, como se describe además con referencia a la Figura 4. El generador de señal de HB 148 puede proporcionar la señal de HB 142 al generador de señal 138.
El generador de señal 138 puede generar una señal de salida 124 basándose en la señal de LB 140, la señal de HB 142 o ambas. Por ejemplo, el generador de señal 138 puede generar una señal de HB sobremuestreada sobremuestreando la señal de HB 142 por un factor particular (por ejemplo, 2). El generador de señal 138 puede generar una señal de HB invertida espectralmente invirtiendo espectralmente la señal de HB sobremuestreada en un dominio del tiempo, como se describe con referencia a la Figura 6. La señal de HB invertida espectralmente puede corresponder a una señal de banda alta (por ejemplo, 32 kHz). El generador de señal 138 puede generar una señal de LB sobremuestreada sobremuestreando la señal de LB 140 por un factor particular (por ejemplo, 2). La señal de LB sobremuestreada puede corresponder a una señal de 32 kHz. El generador de señal 138 puede generar una señal de HB retardada retardando la señal de HB invertida espectralmente para alinear en el tiempo la señal de HB retardada y la señal de LB sobremuestreada. El generador de señal 138 puede generar la señal de salida 124 combinando la señal de HB retardada y la señal de LB muestreada. El generador de señal 138 puede almacenar la señal de salida 124 en la memoria 132. El generador de señal 138 puede emitir, a través de los altavoces 122, la señal de salida 124.
Haciendo referencia a la Figura 2, se divulga un sistema y se designa generalmente con 200. En un aspecto particular, el sistema 200 puede corresponder al sistema 100 de la Figura 1. El sistema 200 puede incluir un remuestreador y banco de filtros 202, el codificador 108 o ambos. El remuestreador y banco de filtros 202, el codificador 108, o ambos, pueden incluirse en el primer dispositivo 102 de la Figura 1. El codificador 108 puede incluir un primer codificador 204 (por ejemplo, un codificador ACELP) y un segundo codificador 296 (por ejemplo, un codificador TBE). El segundo codificador 296 puede incluir un módulo de extensión de ancho de banda de codificador 206, un módulo de codificación 208 (por ejemplo, un codificador TBE), o ambos. El módulo de extensión de ancho de banda de codificador 206 puede realizar procesamiento y modelado no lineal, como se describe con referencia a la Figura 13. En un aspecto particular, un dispositivo de recepción/decodificación puede estar acoplado o puede incluir almacenamiento de medios 292. Por ejemplo, el almacenamiento de medios 292 puede almacenar medios codificados. El audio para los medios codificados puede representarse mediante un flujo de bits ACELP y un flujo de bits TBE. Como alternativa, el almacenamiento de medios 292 puede corresponder a un servidor accesible en red desde el que se reciben el flujo de bits ACELP y el flujo de bits TBE durante una sesión de envío por flujo continuo.
El sistema 200 puede incluir el primer decodificador 134, el segundo decodificador 136, el generador de señal 138 (por ejemplo, un remuestreador, un ajustador de retardo y un mezclador), o una combinación de los mismos. El segundo decodificador 136 puede incluir el módulo de extensión de ancho de banda 146, el módulo de decodificación 162 o ambos. El módulo de extensión de ancho de banda 146 puede realizar procesamiento y modelado no lineal, como se describe con referencia a las Figuras 1 y 4.
Durante la operación, el remuestreador y banco de filtros 202 pueden recibir la señal de entrada 114. El remuestreador y banco de filtros 202 pueden generar una primera señal de LB 240 aplicando un filtro de paso bajo a la señal de entrada 114 y pueden proporcionar la primera señal de LB 240 al primer codificador 204. El remuestreador y banco de filtros 202 pueden generar una primera señal de HB 242 aplicando un filtro de paso alto a la señal de entrada 114 y pueden proporcionar la primera señal de HB 242 al módulo de codificación 208.
El primer codificador 204 puede generar una primera señal de excitación de LB 244 (por ejemplo, un residual de LB), el primer flujo de bits 128, o ambos, basándose en la primera señal de LB 240. El primer codificador 204 puede proporcionar la primera señal de excitación de LB 244 al módulo de extensión de ancho de banda de codificador 206. El primer codificador 204 puede proporcionar el primer flujo de bits 128 al primer decodificador 134.
El módulo de extensión de ancho de banda de codificador 206 puede generar una primera señal extendida 250 basada en la primera señal de excitación de LB 244. El módulo de extensión de ancho de banda de codificador 206 puede proporcionar la primera señal extendida 250 al módulo de codificación 208. El módulo de codificación 208 puede generar el segundo flujo de bits 130 basándose en la primera señal de HB 242 y la primera señal extendida 250. Por ejemplo, el módulo de codificación 208 puede generar una señal de HB sintetizada basándose en la primera señal extendida 250, puede generar los parámetros de flujo de bits 160 de la Figura 1 para reducir una diferencia entre la señal de HB sintetizada y la primera señal de HB 242, y puede generar el segundo flujo de bits 130 que incluye los parámetros de flujo de bits 160.
El primer decodificador 134 puede recibir el primer flujo de bits 128 desde el primer codificador 204. El módulo de decodificación 162 puede recibir el segundo flujo de bits 130 del módulo de codificación 208. En una implementación particular, el primer decodificador 134 puede recibir el primer flujo de bits 128, el segundo flujo de bits 130, o ambos, desde el almacenamiento de medios 292. Por ejemplo, el primer flujo de bits 128, el segundo flujo de bits 130, o ambos, pueden corresponder a medios (por ejemplo, música o una película) almacenados en el almacenamiento de medios 292. En un aspecto particular, el almacenamiento de medios 292 puede corresponder a un dispositivo de red que envía por flujo continuo el primer flujo de bits 128 al primer decodificador 134 y el segundo flujo de bits 130 al módulo de decodificación 162. El primer decodificador 134 puede generar la señal de LB 140, la señal de excitación de LB 144, o ambas, basándose en el primer flujo de bits 128, como se describe con referencia a la Figura 1. La señal de LB 140 puede incluir una señal de LB sintetizada que se aproxima a la primera señal de LB 240. El primer decodificador 134 puede proporcionar la señal de LB 140 al generador de señal 138. El primer decodificador 134 puede proporcionar la señal de excitación de LB 144 al módulo de extensión de ancho de banda 146. El módulo de extensión de ancho de banda 146 puede generar la señal extendida 150 basándose en la señal de excitación de LB 144, como se describe con referencia a la Figura 1. El módulo de extensión de ancho de banda 146 puede proporcionar la señal extendida 150 al módulo de decodificación 162. El módulo de decodificación 162 puede generar la señal de HB 142 basándose en el segundo flujo de bits 130 y la señal extendida 150, como se describe con referencia a la Figura 1. La señal de HB 142 puede incluir una señal de HB sintetizada que se aproxima a la primera señal de HB 242. El módulo de decodificación 162 puede proporcionar la señal de HB 142 al generador de señal 138. El generador de señal 138 puede generar la señal de salida 124 basándose en la señal de LB 140 y la señal de HB 142, como se describe con referencia a la Figura 1.
Haciendo referencia a la Figura 3, se divulga un sistema y se designa generalmente con 300. En un aspecto particular, el sistema 300 puede corresponder al sistema 100 de la Figura 1, al sistema 200 de la Figura 2, o a ambos. El sistema 300 puede incluir el primer decodificador 134, el convertidor de trama TBE 156, el módulo de extensión de ancho de banda 146, el módulo de decodificación 162 o una combinación de los mismos. El primer decodificador 134 puede incluir un decodificador ACELP, un decodificador MPEG, un decodificador de audio 3D MPEG-H, un decodificador de dominio de predicción lineal (LPD), o una combinación de los mismos.
Durante la operación, el convertidor de trama TBE 156 puede recibir el segundo flujo de bits 130, como se describe con referencia a la Figura 1. El segundo flujo de bits 130 puede corresponder a una estructura de datos tbe_data() ilustrada en la Tabla 1:
Figure imgf000007_0001
Tabla 1
El convertidor de trama TBE 156 puede generar los parámetros de flujo de bits 160, el modo de configuración NL 158, o una combinación de los mismos, analizando el segundo flujo de bits 130. Los parámetros de flujo de bits 160 pueden incluir un modo de alta eficiencia (HE) 360 (por ejemplo, tbe_heMode), información de ganancia 362 (por ejemplo, idxFrameGain e idxSubGains), datos de LSF de HB 364 (por ejemplo, lsf_idx[0,1]), un modo de configuración de alta resolución (HR) 366 (por ejemplo, tbe_hrConfig), un modo de configuración de mezcla 368 (por ejemplo, idxMixConfig, denominado como alternativa "parámetro de configuración de mezcla"), datos de ganancia objetivo de HB 370 (por ejemplo, idxShbFrGain), datos de forma de ganancia 372 (por ejemplo, idxResSubGains), información de filtro 374 (por ejemplo, idxShbExcResp[0,1]), o una combinación de los mismos. El convertidor de trama TBE 156 puede proporcionar el modo de configuración NL 158 al módulo de extensión de ancho de banda 146. El convertidor de trama TBE 156 también puede proporcionar uno o más de los parámetros de flujo de bits 160 al módulo de decodificación 162, como se muestra.
En un aspecto particular, la información de filtro 374 puede indicar un filtro de respuesta finita al impulso (FIR). La información de ganancia 362 puede incluir información de ganancia de referencia de HB, información de forma de ganancia residual de subtrama temporal, o ambas. Los datos de ganancia objetivo de HB 370 pueden indicar energía de trama.
En un aspecto particular, el convertidor de trama TBE 156 puede extraer el modo de configuración NL 158 del segundo flujo de bits 130 en respuesta a determinar que el modo de HE 360 tiene un primer valor (por ejemplo, 0). Como alternativa, el convertidor de trama TBE 156 puede establecer el modo de configuración NL 158 en un valor por defecto (por ejemplo, 1) en respuesta a determinar que el modo de HE 360 tiene un segundo valor (por ejemplo, 1). En un aspecto particular, el convertidor de trama t Be 156 puede establecer el modo de configuración n L 158 al valor por defecto (por ejemplo, 1) en respuesta a determinar que el modo de configuración NL 158 tiene un primer valor particular (por ejemplo, 2) y que el modo de configuración de mezcla 368 tiene un segundo valor particular (por ejemplo, un valor mayor que 1).
En un aspecto particular, el convertidor de trama TBE 156 puede extraer el modo de configuración de HR 366 del segundo flujo de bits 130 en respuesta a determinar que el modo de HE 360 tiene el primer valor (por ejemplo, 0). Como alternativa, el convertidor de trama TBE 156 puede establecer el modo de configuración de HR 366 en un valor por defecto (por ejemplo, 0) en respuesta a determinar que el modo de HE 360 tiene el segundo valor (por ejemplo, 1). El primer decodificador 134 puede recibir el primer flujo de bits 128, como se describe con referencia a la Figura 1.
Haciendo referencia a la Figura 4, se divulga un sistema y se designa generalmente con 400. En un aspecto particular, el sistema 400 puede corresponder al sistema 100 de la Figura 1, al sistema 200 de la Figura 2, al sistema 300 de la Figura 3, o una combinación de los mismos. El sistema 400 puede incluir el módulo de extensión de ancho de banda 146, el generador de señal de excitación de HB 147, el generador de señal de HB 148 o una combinación de los mismos. El módulo de extensión de ancho de banda 146 puede incluir un remuestreador 402, un módulo de extensión de armónicos 404 o ambos. El generador de señal de excitación de HB 147 puede incluir un módulo de inversión y decimación espectral 408, un módulo de blanqueamiento adaptativo 410, un modulador de envolvente temporal 412, un estimador de excitación de HB 414 o una combinación de los mismos. El generador de señal de HB 148 puede incluir un módulo de predicción lineal de HB 416, un módulo de síntesis 418 o ambos.
Durante la operación, el módulo de extensión de ancho de banda 146 genera la señal extendida 150 extendiendo la señal de excitación de LB 144, como se describe en el presente documento. El remuestreador 402 puede recibir la señal de excitación de LB 144 desde el primer decodificador 134 de la Figura 1, tal como el decodificador ACELP. El remuestreador 402 genera una señal remuestreada 406 basándose en la señal de excitación de LB 144, como se describe con referencia a la Figura 5. El remuestreador 402 proporciona la señal remuestreada 406 al módulo de extensión de armónicos 404.
El módulo de extensión de armónicos 404 puede recibir el modo de configuración NL 158 desde el convertidor de trama TBE 156 de la Figura 1. El módulo de extensión de armónicos 404 puede generar la señal extendida 150 (por ejemplo, una señal de excitación de HB) extendiendo armónicamente la señal remuestreada 406 en un dominio del tiempo basándose en el modo de configuración NL 158. En un aspecto particular, el módulo de extensión de armónicos 404 puede generar la señal extendida 150 (Ehe) basándose en la Ecuación 1:
Figure imgf000008_0001
donde Elb corresponde a la señal remuestreada 406, £n corresponde a un factor de normalización de energía entre Elb y E lBy the_nlConfig corresponde al modo de configuración NL 158. El factor de normalización de energía puede corresponder a una relación de energías de trama de Elb y E lB. Hlp y Hhp corresponden a un filtro de paso bajo y un filtro de paso alto respectivamente, con una frecuencia de corte particular (por ejemplo, 3/4 fs o aproximadamente 12 kHz). Una función de transferencia de la Hlp puede basarse en la Ecuación 2:
Figure imgf000008_0002
Una función de transferencia de la Hhp puede basarse en la Ecuación 3:
Figure imgf000008_0003
Por ejemplo, el módulo de extensión de armónicos 404 selecciona la primera función 164, la segunda función 166, o ambas, basándose en un valor del modo de configuración NL 158. Para ilustrar, el módulo de extensión de armónicos 404 puede seleccionar la primera función 164 (por ejemplo, una función cuadrada) en respuesta a determinar que el modo de configuración n L 158 tiene un primer valor (por ejemplo, NL HARMONIC o 0). El módulo de extensión de armónicos 404 puede generar, en respuesta a la selección de la primera función 164, la señal extendida 150 aplicando la primera función 164 (por ejemplo, la función cuadrada) a la señal remuestreada 406. La función cuadrada puede preservar la información de signo de la señal remuestreada 406 en la señal extendida 150 y puede elevar al cuadrado los valores de la señal remuestreada 406.
En un aspecto particular, el módulo de extensión de armónicos 404 puede seleccionar la segunda función 166 (por ejemplo, una función de valor absoluto) en respuesta a determinar que el modo de configuración NL 158 tiene un segundo valor (por ejemplo, NL_SMOOTH o 1). El módulo de extensión de armónicos 404 puede generar, en respuesta a la selección de la segunda función 166, la señal extendida 150 aplicando la segunda función 166 (por ejemplo, la función de valor absoluto) a la señal remuestreada 406.
En un aspecto particular, el módulo de extensión de armónicos 404 puede seleccionar una función híbrida en respuesta a determinar que el modo de configuración NL 158 tiene un tercer valor (por ejemplo, NL_HYBRID o 2). En este aspecto, el convertidor de trama TBE 156 puede proporcionar el modo de configuración de mezcla 368 al módulo de extensión de armónicos 404. La función híbrida puede incluir una combinación de múltiples funciones (por ejemplo, la primera función 164 y la segunda función 166).
El módulo de extensión de armónicos 404, en respuesta a la selección de la función híbrida, genera una pluralidad de señales de excitación (al menos la primera señal de excitación 168 y la segunda señal de excitación 170) correspondientes a una pluralidad de subintervalos de frecuencia de banda alta basándose en la señal remuestreada 406. El módulo de extensión de armónicos 404 genera la primera señal de excitación 168 aplicando la primera función 164 a la señal remuestreada 406 o a una porción de la misma. La primera señal de excitación 168 corresponde a un primer subintervalo de frecuencia de banda alta (aproximadamente 8-12 kHz). El módulo de extensión de armónicos 404 genera la segunda señal de excitación 170 aplicando la segunda función 166 a la señal remuestreada 406 o a una porción de la misma. La segunda señal de excitación 170 corresponde a un segundo subintervalo de frecuencia de banda alta (aproximadamente 12-16 kHz).
El módulo de extensión de armónicos 404 puede generar una primera señal filtrada aplicando un primer filtro (por ejemplo, un filtro de paso bajo, tal como un filtro de 8-12 kHz) a la primera señal de excitación 168 y puede generar una segunda señal filtrada aplicando un segundo filtro (por ejemplo, un filtro de paso alto, tal como un filtro de 12-16 kHz) a la segunda señal de excitación 170. El primer filtro y el segundo filtro pueden tener una frecuencia de corte particular (por ejemplo, 12 kHz). El módulo de extensión de armónicos 404 genera la señal extendida 150 combinando la primera señal filtrada y la segunda señal filtrada. El primer subintervalo de frecuencia de banda alta (por ejemplo, aproximadamente 8-12 kHz) puede corresponder a datos de armónicos (por ejemplo, de sonoridad débil o sonoridad fuerte). El segundo subintervalo de frecuencia de banda alta (aproximadamente 12-16 kHz) puede corresponder a datos similares a ruido (por ejemplo, de no sonoridad débil o de no sonoridad fuerte). El módulo de extensión de armónicos 404 puede por lo tanto usar distintas funciones de procesamiento no lineal para distintas bandas en el espectro.
En una implementación particular, el módulo de extensión de armónicos 404 puede seleccionar la segunda función 166 en respuesta a determinar que el modo de configuración NL 158 tiene el segundo valor (por ejemplo, NL_SMOOTH o 1) y que el modo de configuración de mezcla 368 tiene un valor particular (por ejemplo, un valor mayor que 1). Como alternativa, el módulo de extensión de armónicos 404 puede seleccionar la función híbrida en respuesta a determinar que el modo de configuración NL 158 tiene el segundo valor (por ejemplo, NL_SMOOTH o 1) y que el modo de configuración de mezcla 368 tiene otro valor particular (por ejemplo, un valor menor o igual que 1).
En un aspecto particular, el módulo de extensión de armónicos 404 puede, en respuesta a determinar que el modo de HE 360 tiene el primer valor (por ejemplo, 0), generar la señal extendida 150 (por ejemplo, una señal de excitación de HB) extendiendo armónicamente la señal remuestreada 406 en un dominio del tiempo basándose en el modo de configuración NL 158. El módulo de extensión de armónicos 404 puede generar, en respuesta a determinar que el modo de HE 360 tiene el segundo valor (por ejemplo, 1) la señal extendida 150 (por ejemplo, una señal de excitación de HB) extendiendo armónicamente la señal remuestreada 406 en un dominio del tiempo basándose en la información de ganancia 362 (por ejemplo, idxSubGains). Por ejemplo, el módulo de extensión de armónicos 404 puede generar la señal extendida 150 usando el tbe_nlConfig = 1 configuración (por ejemplo, Ehe = |Elb|) en respuesta a determinar que la información de ganancia 362 (por ejemplo, idxSubGains) corresponde a un valor particular (por ejemplo, un valor impar) y puede generar la señal extendida 150 usando la configuración tbe_nlConfig = 0 (por ejemplo, Ehe = eNsign (E LB)E l B ) de otra manera. Para ilustrar, el módulo de extensión de armónicos 404 puede, en respuesta a determinar que la información de ganancia 362 (por ejemplo, idxSubGains) no corresponde al valor particular (por ejemplo, un valor impar) o que la información de ganancia 362 (por ejemplo, idxSubGains) corresponde a otro valor (por ejemplo, un valor par), puede generar la señal extendida 150 usando la configuración tbe_nlConfig = 0 (por ejemplo, Ehe = £Ns ign {E LB)E l B ).
El módulo de extensión de armónicos 404 puede proporcionar la señal extendida 150 al módulo de inversión y decimación espectral 408. El módulo de inversión espectral y decimación 408 puede generar una señal invertida espectralmente realizando una inversión espectral de la señal extendida 150 del dominio del tiempo basándose en la Ecuación 4:
Figure imgf000010_0003
donde EijE(n) corresponde a la señal invertida espectralmente y N (por ejemplo, 512) corresponde a un número de muestras por trama.
El módulo de inversión y decimación espectral 408 puede generar una primera señal 450 (por ejemplo, una señal de excitación de HB) decimando la señal invertida espectralmente basándose en un primer filtro de paso todo y un segundo filtro de paso todo. El primer filtro de paso todo puede corresponder a una primera función de transferencia indicada por la Ecuación 5:
Figure imgf000010_0002
El segundo filtro de paso todo puede corresponder a una segunda función de transferencia indicada por la Ecuación 6:
Figure imgf000010_0001
En la Tabla 2 a continuación se proporcionan valores ilustrativos de los coeficientes del filtro de paso todo:
Tabla 2
Figure imgf000010_0004
El módulo de inversión y decimación espectral 408 puede generar una primera señal filtrada aplicando el primer filtro de paso todo para filtrar muestras pares de la señal invertida espectralmente. El módulo de inversión y decimación espectral 408 puede generar una segunda señal filtrada aplicando el segundo filtro de paso todo para filtrar muestras impares de la señal invertida espectralmente. El módulo de inversión y decimación espectral 408 puede generar la primera señal 450 promediando la primera señal filtrada y la segunda señal filtrada.
El módulo de inversión y decimación espectral 408 puede proporcionar la primera señal 450 al módulo de blanqueamiento adaptativo 410. El módulo de blanqueamiento adaptativo 410 puede generar una segunda señal 452 (por ejemplo, una señal de excitación de HB) aplanando un espectro de la primera señal 450 realizando un blanqueamiento de LP de cuarto orden de la primera señal 450. Por ejemplo, el módulo de blanqueamiento adaptativo 410 puede estimar coeficientes de autocorrelación de la primera señal 450. El módulo de blanqueamiento adaptativo 410 puede generar primeros coeficientes aplicando expansión del ancho de banda a los coeficientes de autocorrelación basándose en multiplicar los coeficientes de autocorrelación por una función de expansión. El módulo de blanqueamiento adaptativo 410 puede generar primeros LPC aplicando un algoritmo (por ejemplo, un algoritmo de Levinson-Durbin) a los primeros coeficientes. El módulo de blanqueamiento adaptativo 410 puede generar la segunda señal 452 filtrando a la inversa los primeros LPC.
En una implementación particular, el módulo de blanqueamiento adaptativo 410 puede modular la segunda señal 452 basándose en la energía residual normalizada en respuesta a determinar que el modo de configuración de HR 366 tiene un valor particular (por ejemplo, 1). El módulo de blanqueamiento adaptativo 410 puede determinar la energía residual normalizada basándose en los datos de forma de ganancia 372. Como alternativa, el módulo de blanqueamiento adaptativo 410 puede filtrar la segunda señal 452 basándose en un filtro particular (por ejemplo, un filtro FIR) en respuesta a determinar que el modo de configuración de HR 366 tiene un primer valor (por ejemplo, 0). El módulo de blanqueamiento adaptativo 410 puede determinar (o generar) el filtro particular basándose en la información de filtro 374. El módulo de blanqueamiento adaptativo 410 puede proporcionar la segunda señal 452 al modulador de envolvente temporal 412, al estimador de excitación de HB 414 o a ambos.
El modulador de envolvente temporal 412 puede recibir la segunda señal 452 del módulo de blanqueamiento adaptativo 410, una señal de ruido 440 de un generador de ruido aleatorio, o ambas. El generador de ruido aleatorio puede estar acoplado o incluido en el segundo dispositivo 104. El modulador de envolvente temporal 412 puede generar una tercera señal 454 basándose en la señal de ruido 440, la segunda señal 452 o ambas. Por ejemplo, el modulador de envolvente temporal 412 puede generar una primera señal de ruido aplicando conformación temporal a la señal de ruido 440. El modulador de envolvente temporal 412 puede generar una envolvente de señal basándose en la segunda señal 452 (o la señal de excitación de LB 144). El modulador de envolvente temporal 412 puede generar la primera señal de ruido basándose en la envolvente de señal y la señal de ruido 440. Por ejemplo, el modulador de envolvente temporal 412 puede combinar la envolvente de señal y la señal de ruido 440. Combinar la envolvente de la señal y la señal de ruido 440 puede modular la amplitud de la señal de ruido 440. El modulador de envolvente temporal 412 puede generar la tercera señal 454 aplicando conformación espectral a la primera señal de ruido. En una implementación alternativa, el modulador de envolvente temporal 412 puede generar la primera señal de ruido aplicando conformación espectral a la señal de ruido 440 y puede generar la tercera señal 454 aplicando conformación temporal a la primera señal de ruido. Por lo tanto, se puede aplicar conformación espectral y temporal en cualquier orden a la señal de ruido 440. El modulador de envolvente temporal 412 puede proporcionar la tercera señal 454 al estimador de excitación de HB 414.
El estimador de excitación de HB 414 puede recibir la segunda señal 452 del módulo de blanqueamiento adaptativo 410, la tercera señal 454 del modulador de envolvente temporal 412, o ambas. El estimador de excitación de HB 414 puede generar la señal de excitación de HB 152 combinando la segunda señal 452 y la tercera señal 454.
En un aspecto particular, el estimador de excitación de HB 414 puede combinar la segunda señal 452 y la tercera señal 454 basándose en el VF de LB 154. Por ejemplo, el estimador de excitación de HB 414 puede determinar un VF de HB basándose en uno o más parámetros de LB. El VF de HB puede corresponder a una configuración de mezcla de HB. Uno o más parámetros de LB pueden incluir el VF de LB 154. El estimador de excitación de HB 414 puede determinar el VF de HB basándose en la aplicación de una función sigmoidea en el VF de LB 154. Por ejemplo, el estimador de excitación de HB 414 puede determinar el VF de HB basándose en la Ecuación 7:
Figure imgf000011_0001
donde VFi puede corresponder a un VF de HB correspondiente a una subtrama i, y ai puede corresponder a una correlación normalizada de la LB. En un aspecto particular, a puede corresponder al VF de LB 154 para la subtrama i. El estimador de excitación de HB 414 puede "suavizar" el VF de HB para tener en cuenta variaciones repentinas en el VF de LB 154. Por ejemplo, el estimador de excitación de HB 414 puede reducir las variaciones en el VF de HB basándose en el modo de configuración de mezcla 368 en respuesta a determinar que el modo de configuración de HR 366 tiene un valor particular (por ejemplo, 1). Modificar el Vf de HB basándose en el modo de configuración de mezcla 368 puede compensar un desajuste entre el VF de LB 154 y el VF de HB. El estimador de excitación de HB 414 puede normalizar la potencia de la tercera señal 454 de modo que la tercera señal 454 tenga el mismo nivel de potencia que la segunda señal 452.
El estimador de excitación de HB 414 puede determinar un primer peso (por ejemplo, VF de HB) y un segundo peso (por ejemplo, 1 - VF de HB). El estimador de excitación de HB 414 puede generar la señal de excitación de HB 152 realizando una suma ponderada de la segunda señal 452 y la tercera señal 454, donde el primer peso se asigna a la segunda señal 452 y el segundo peso se asigna a la tercera señal 454. Por ejemplo, el estimador de excitación de HB 414 puede generar la subtrama (i) de la señal de excitación de HB 152 mezclando la subtrama (i) de la segunda señal 452 que está escalada basándose en VFi (por ejemplo, escalada basándose en una raíz cuadrada de VFi) y la subtrama (i) de la tercera señal 454 que está escalada basándose en (1 - VFi) (por ejemplo, escalada basándose en una raíz cuadrada de (1 - VFi)). El estimador de excitación de HB 414 puede proporcionar la señal de excitación de HB 152 al módulo de síntesis 418.
El módulo de predicción lineal de HB 416 puede recibir los parámetros de flujo de bits 160 desde el convertidor de trama TBE 156. El módulo de predicción lineal de HB 416 puede generar coeficientes de LSP 456 basándose en los datos de LSF de HB 364. Por ejemplo, el módulo de predicción lineal de HB 416 puede determinar las LSF basándose en los datos de LSF de HB 364 y puede convertir las LSF en los coeficientes de LSP 456. Los parámetros de flujo de bits 160 pueden corresponder a una primera trama de audio de una secuencia de tramas de audio. El módulo de predicción lineal de HB 416 puede interpolar los coeficientes de LSP 456 basándose en segundos coeficientes de LSP asociados con otra trama en respuesta a determinar que la otra trama corresponde a una trama TBE. La otra trama puede preceder a la primera trama de audio en la secuencia de tramas de audio. Los coeficientes de LSP 456 pueden interpolarse a través de un número particular de (por ejemplo, cuatro) subtramas. El módulo de predicción lineal de HB 416 puede abstenerse de interpolar los coeficientes de LSP 456 en respuesta a determinar que la otra trama no corresponde a una trama TBE. El módulo de predicción lineal de HB 416 puede proporcionar los coeficientes de LSP 456 al módulo de síntesis 418.
El módulo de síntesis 418 puede generar la señal de HB 142 basándose en los coeficientes de LSP 456, la señal de excitación de HB 152 o ambas. Por ejemplo, el módulo de síntesis 418 puede generar (o determinar) filtros de síntesis de banda alta basándose en los coeficientes de LSP 456. El módulo de síntesis 418 puede generar una primera señal de HB aplicando los filtros de síntesis de banda alta a la señal de excitación de HB 152. El módulo de síntesis 418 puede, en respuesta a determinar que el modo de configuración de HR 366 tiene un valor particular (por ejemplo, 1), realizar una síntesis sin memoria para generar la primera señal de HB. Por ejemplo, la primera señal de HB puede generarse con las memorias de filtro LP pasadas a cero. El módulo de síntesis 418 puede hacer coincidir la energía de la primera señal de HB con la energía de la señal objetivo indicada por los datos de ganancia objetivo de HB 370. La información de ganancia 362 puede incluir información de ganancia de trama e información de forma de ganancia. El módulo de síntesis 418 puede generar una señal de HB escalada escalando la primera señal de HB basándose en la información de forma de ganancia. El módulo de síntesis 418 puede generar la señal de HB 142 multiplicando la señal de HB escalada por la trama de ganancia indicada por la información de ganancia de trama. El módulo de síntesis 418 puede proporcionar la señal de HB 142 al generador de señal 138 de la Figura 1.
En una implementación particular, el módulo de síntesis 418 puede modificar la señal de excitación de HB 152 antes de generar la primera señal de HB. Por ejemplo, el módulo de síntesis 418 puede generar una señal de excitación de HB modificada basándose en la señal de excitación de HB 152 y puede generar la primera señal de HB aplicando los filtros de síntesis de banda alta a la señal de excitación de HB modificada. Para ilustrar, el módulo de síntesis 418 puede generar, en respuesta a determinar que el modo de configuración de HR 366 tiene un primer valor (por ejemplo, 0), un filtro (por ejemplo, un filtro FIR) basándose en la información de filtro 374. El módulo de síntesis 418 puede generar la señal de excitación de HB modificada aplicando el filtro a al menos una porción (por ejemplo, una porción de armónicos) de la señal de excitación de HB 152. Aplicar el filtro a la señal de excitación de h B 152 puede reducir la distorsión entre la señal de HB 142 generada en el segundo dispositivo 104 y una señal de HB de la señal de entrada 114. Como alternativa, el módulo de síntesis 418 puede, en respuesta a determinar que el modo de configuración de HR 366 tiene un segundo valor (por ejemplo, 1), generar la señal de excitación de Hb modificada basándose en la información de ganancia objetivo. La información de ganancia objetivo puede incluir los datos de forma de ganancia 372, los datos de ganancia objetivo HB 370, o ambos.
En una implementación particular, el estimador de excitación de HB 414 puede modificar la segunda señal 452 antes de generar la señal de excitación de HB 152. Por ejemplo, el estimador de excitación de HB 414 puede generar una segunda señal modificada basándose en la segunda señal 452 y puede generar la señal de excitación de HB 152 combinando la segunda señal modificada y la tercera señal 454. Para ilustrar, el estimador de excitación de HB 414 puede generar, en respuesta a determinar que el modo de configuración de HR 366 tiene un primer valor (por ejemplo, 0), un filtro (por ejemplo, un filtro FIR) basándose en la información de filtro 374. El estimador de excitación de HB 414 puede generar la segunda señal modificada aplicando el filtro a al menos una porción (por ejemplo, una porción de armónicos) de la segunda señal 452. Como alternativa, el estimador de excitación de h B 414 puede, en respuesta a determinar que el modo de configuración de HR 366 tiene un segundo valor (por ejemplo, 1), generar la segunda señal modificada basándose en la información de ganancia objetivo. La información de ganancia objetivo puede incluir los datos de forma de ganancia 372, los datos de ganancia objetivo HB 370, o ambos.
Haciendo referencia a la Figura 5, se muestra el remuestreador 402. El remuestreador 402 puede incluir un primer módulo de escalamiento 502, un módulo de remuestreo 504, un sumador 514, un segundo módulo de escalamiento 508 o una combinación de los mismos.
Durante la operación, el primer módulo de escalamiento 502 puede recibir la señal de excitación de LB 144 y puede generar una primera señal escalada 510 escalando la señal de excitación de LB 144 basándose en una ganancia de libro de códigos fija (FCB) (gc). El primer módulo de escalamiento 502 puede proporcionar la primera señal escalada 510 al módulo de remuestreo 504. El módulo de remuestreo 504 puede generar una señal remuestreada 512 sobremuestreando la primera señal escalada 510 en un factor particular (por ejemplo, 2). El módulo de remuestreo 504 puede proporcionar la señal remuestreada 512 al sumador 514. El segundo módulo de escalamiento 508 puede generar una segunda señal escalada 516 escalando una segunda señal remuestreada 515 basándose en una ganancia de tono (gp). La segunda señal remuestreada 515 puede corresponder a una señal remuestreada anterior. Por ejemplo, la señal remuestreada 406 puede corresponder a una enésima trama de audio de una secuencia de tramas. La señal remuestreada anterior puede corresponder a la (n-1)ésima trama de audio de la secuencia de tramas. El segundo módulo de escalamiento 508 puede proporcionar la segunda señal escalada 516 al sumador 514. El sumador 514 puede combinar la señal remuestreada 512 y la segunda señal escalada 516 para generar la señal remuestreada 406. El sumador 514 puede proporcionar la señal remuestreada 406 al segundo módulo de escalamiento 508 para usarse durante el procesamiento de la (n+1)ésima trama de audio. El sumador 514 puede proporcionar la señal remuestreada 406 al módulo de extensión de armónicos 404 de la Figura 4.
Haciendo referencia a la Figura 6, se muestra un diagrama y se designa generalmente con 600. El diagrama 600 puede ilustrar la inversión espectral de una señal. La inversión espectral de la señal puede realizarse mediante uno o más de los sistemas de las Figuras 1-4. Por ejemplo, el generador de señal 138 puede realizar una inversión espectral de la señal de banda alta 142 en el dominio del tiempo, como se describe con referencia a la Figura 1. El diagrama 600 incluye un primer gráfico 602 y un segundo gráfico 604.
El primer gráfico 602 puede corresponder a una primera señal antes de la inversión espectral. La primera señal puede corresponder a la señal de banda alta 142. Por ejemplo, la primera señal puede incluir una señal de HB sobremuestreada generada sobremuestreando la señal de banda alta 142 por un factor particular (por ejemplo, 2), como se describe con referencia a la Figura 1. El segundo gráfico 604 puede corresponder a una señal invertida espectralmente generada invirtiendo espectralmente la primera señal. Por ejemplo, la señal invertida espectralmente puede generarse invirtiendo espectralmente la señal de HB sobremuestreada en un dominio del tiempo. La primera señal se puede invertir a una frecuencia particular (por ejemplo, fs/2 o aproximadamente 8 kHz). Los datos de la primera señal en un primer intervalo de frecuencia (por ejemplo, 0 - fs/2) pueden corresponder a segundos datos de la señal invertida espectralmente en un segundo intervalo de frecuencia (por ejemplo, fs - fs/2).
Haciendo referencia a la Figura 7, se muestra un diagrama de flujo de un aspecto de un método de generación de señal de banda alta y se designa generalmente con 700. El método 700 puede realizarse por uno o más componentes de los sistemas 100-400 de las Figuras 1-4. Por ejemplo, el método 700 puede realizarse por el segundo dispositivo 104, el módulo de extensión de ancho de banda 146 de la Figura 1, el remuestreador 402, el módulo de extensión de armónicos 404 de la Figura 4, o una combinación de los mismos.
El método 700 incluye generar, en un dispositivo, una señal remuestreada basándose en una señal de excitación de banda baja, en 702. Por ejemplo, el remuestreador 402 puede generar la señal remuestreada 406, como se describe con referencia a la Figura 4.
El método 700 también incluye generar, en el dispositivo, al menos una primera señal de excitación correspondiente a un primer subintervalo de frecuencia de banda alta y una segunda señal de excitación correspondiente a un segundo subintervalo de frecuencia de banda alta basándose en la señal remuestreada, en 704. El módulo de extensión de armónicos 404 genera al menos la primera señal de excitación 168 y la segunda señal de excitación 170 basándose en la señal remuestreada 406, como se describe con referencia a la Figura 4. La primera señal de excitación 168 corresponde a un primer subintervalo de frecuencia de banda alta (aproximadamente 8-12 kHz). La segunda señal de excitación 170 corresponde a un segundo subintervalo de frecuencia de banda alta (aproximadamente 12-16 kHz). El módulo de extensión de armónicos 404 genera la primera señal de excitación 168 basándose en la aplicación de la primera función 164 a la señal remuestreada 406. El módulo de extensión de armónicos 404 genera la segunda señal de excitación 170 basándose en la aplicación de la segunda función 166 a la señal remuestreada 406.
El método 700 incluye además generar, en el dispositivo, una señal de excitación de banda alta basándose en la primera señal de excitación y la segunda señal de excitación, en 706. Por ejemplo, el módulo de extensión de armónicos 404 genera la señal extendida 150 basándose en la primera señal de excitación 168 y la segunda señal de excitación 170, como se describe con referencia a la Figura 4.
Haciendo referencia a la Figura 8, se muestra un diagrama de flujo de un aspecto de un método de generación de señal de banda alta y se designa generalmente con 800. El método 800 puede realizarse por uno o más componentes de los sistemas 100-400 de las Figuras 1-4. Por ejemplo, el método 800 puede realizarse por el segundo dispositivo 104, el receptor 192, el módulo de extensión de ancho de banda 146 de la Figura 1, el módulo de extensión de armónicos 404 de la Figura 4, o una combinación de los mismos.
El método 800 incluye recibir, en un dispositivo, un parámetro asociado con un flujo de audio de ancho de banda extendido, en 802. Por ejemplo, el receptor 192 puede recibir el modo de configuración NL 158 asociado con los datos de audio 126, como se describe con referencia a las Figuras 1 y 3.
El método 800 también incluye seleccionar, en el dispositivo, una o más funciones de procesamiento no lineal basándose, al menos en parte, en un valor del parámetro, en 804. Por ejemplo, el módulo de extensión de armónicos 404 selecciona la primera función 164, la segunda función 166, o ambas, basándose, al menos en parte, en un valor del modo de configuración NL 158.
El método 800 incluye además generar, en el dispositivo, una señal de excitación de banda alta basándose en la una o más funciones de procesamiento no lineal, en 806. Por ejemplo, el módulo de extensión de armónicos 404 puede generar la señal extendida 150 basándose en la primera función 164, la segunda función 166 o ambas.
Haciendo referencia a la Figura 9, se muestra un diagrama de flujo de un aspecto de un método de generación de señal de banda alta y se designa generalmente con 900. El método 900 puede realizarse por uno o más componentes de los sistemas 100-400 de las Figuras 1-4. Por ejemplo, el método 900 puede realizarse por el segundo dispositivo 104, el receptor 192, el generador de señal de excitación de HB 147, el módulo de decodificación 162, el segundo decodificador 136, el decodificador 118, el procesador 116 de la Figura 1, o una combinación de los mismos.
El método 900 incluye recibir, en un dispositivo, un parámetro asociado con un flujo de audio de ancho de banda extendido, en 902. Por ejemplo, el receptor 192 puede recibir el modo de configuración HR 366 asociado con los datos de audio 126, como se describe con referencia a las Figuras 1 y 3.
El método 900 también incluye determinar, en el dispositivo, un valor del parámetro, en 904. Por ejemplo, el módulo de síntesis 418 puede determinar un valor del modo de configuración de Hr 366, como se describe con referencia a la Figura 4.
El método 900 incluye, además, en respuesta al valor del parámetro, generar una señal de excitación de banda alta basándose en información de ganancia objetivo asociada con el flujo de audio de ancho de banda extendido o basándose en información de filtro asociada con el flujo de audio de ancho de banda extendido, en 906. Por ejemplo, cuando el valor del modo de configuración de HR 366 es 1, el módulo de síntesis 418 puede generar una señal de excitación modificada basándose en información de ganancia objetivo, tal como uno o más de los datos de forma de ganancia 372, los datos de ganancia objetivo de HB 370, o la información de ganancia 362, como se describe con referencia a la Figura 4. Cuando el valor del modo de configuración de HR 366 es 0, el módulo de síntesis 418 puede generar la señal de excitación modificada basándose en la información de filtro 374, como se describe con referencia a la Figura 4.
Haciendo referencia a la Figura 10, se muestra un diagrama de flujo de un aspecto de un método de generación de señal de banda alta y se designa generalmente con 1000. El método 1000 puede realizarse por uno o más componentes de los sistemas 100-400 de las Figuras 1-4. Por ejemplo, el método 1000 puede realizarse mediante el segundo dispositivo 104, el receptor 192, el generador de señal de excitación de h B 147 de la Figura 1, o una combinación de los mismos.
El método 1000 incluye recibir, en un dispositivo, información de filtro asociada con un flujo de audio de ancho de banda extendido, en 1002. Por ejemplo, el receptor 192 puede recibir la información de filtro 374 asociada con los datos de audio 126, como se describe con referencia a las Figuras 1 y 3.
El método 1000 también incluye determinar, en el dispositivo, un filtro basándose en la información del filtro, en 1004. Por ejemplo, el módulo de síntesis 418 puede determinar un filtro (por ejemplo, coeficientes de filtro FIR) basándose en la información de filtro 374, como se describe con referencia a la Figura 4.
El método 1000 incluye además generar, en el dispositivo, una señal de excitación de banda alta modificada basándose en la aplicación del filtro a una primera señal de excitación de banda alta, en 1006. Por ejemplo, el módulo de síntesis 418 puede generar una señal de excitación de banda alta modificada basándose en la aplicación del filtro a la señal de excitación de HB 152, como se describe con referencia a la Figura 4.
Haciendo referencia a la Figura 11, se muestra un diagrama de flujo de un aspecto de un método de generación de señal de banda alta y se designa generalmente con 1100. El método 1100 puede realizarse por uno o más componentes de los sistemas 100-400 de las Figuras 1-4. Por ejemplo, el método 1100 puede realizarse mediante el segundo dispositivo 104, el generador de señal de excitación de HB 147 de la Figura 1, o ambos.
El método 1100 incluye generar, en un dispositivo, una señal de ruido modulada aplicando conformación espectral a una primera señal de ruido, en 1102. Por ejemplo, el estimador de excitación de h B 414 puede generar una señal de ruido modulada aplicando conformación espectral a una primera señal, como se describe con referencia a la Figura 4. La primera señal puede basarse en la señal de ruido 440.
El método 1100 también incluye generar, en el dispositivo, una señal de excitación de banda alta combinando la señal de ruido modulada y una señal armónicamente extendida, en 1104. Por ejemplo, el estimador de excitación de HB 414 puede generar la señal de excitación de HB 152 combinando la señal de ruido modulada y la segunda señal 442. La segunda señal 442 puede basarse en la señal extendida 150.
Haciendo referencia a la Figura 12, se muestra un diagrama de flujo de un aspecto de un método de generación de señal de banda alta y se designa generalmente con 1200. El método 1200 puede realizarse por uno o más componentes de los sistemas 100-400 de las Figuras 1-4. Por ejemplo, el método 1200 puede realizarse mediante el segundo dispositivo 104, el receptor 192, el generador de señal de excitación de h B 147 de la Figura 1, o una combinación de los mismos.
El método 1200 incluye recibir, en un dispositivo, un factor de sonoridad de banda baja y un parámetro de configuración de mezcla asociado con un flujo de audio de ancho de banda extendido, en 1202. Por ejemplo, el receptor 192 puede recibir el VF de LB 154 y el modo de configuración de mezcla 368 asociado con los datos de audio 126, como se describe con referencia a la Figura 1.
El método 1200 también incluye determinar, en el dispositivo, un factor de sonorización de banda alta basándose en el factor de sonoridad de banda baja y el parámetro de configuración de mezcla, en 1204. Por ejemplo, el estimador de excitación de HB 414 puede determinar un VF de HB basándose en el VF de LB 154 y el modo de configuración de mezcla 368, como se describe con referencia a la Figura 4. En un aspecto ilustrativo, el estimador de excitación de HB 414 puede determinar el VF de HB basándose en la aplicación de una función sigmoidea en el VF de LB 154.
El método 1200 incluye además generar, en el dispositivo, una señal de excitación de banda alta basándose en la configuración de mezcla de banda alta, en 1206. Por ejemplo, el estimador de excitación de HB 414 puede generar la señal de excitación de HB 152 basándose en el VF de HB, como se describe con referencia a la Figura 4.
Haciendo referencia a la Figura 13, se divulga un aspecto ilustrativo particular de un sistema que incluye dispositivos que son operables para generar una señal de banda alta y generalmente se designa con 1300.
El sistema 1300 incluye el primer dispositivo 102 en comunicación, mediante la red 107, con el segundo dispositivo 104. El primer dispositivo 102 puede incluir el procesador 106, una memoria 1332 o ambos. El procesador 106 puede estar acoplado o puede incluir el codificador 108, el remuestreador y banco de filtros 202, o ambos. El codificador 108 puede incluir el primer codificador 204 (por ejemplo, un codificador ACELP) y el segundo codificador 296 (por ejemplo, un codificador TBE). El segundo codificador 296 puede incluir el módulo de extensión de ancho de banda de codificador 206, el módulo de codificación 208 o ambos. El módulo de codificación 208 puede incluir un generador de señal de excitación de banda alta (HB) 1347, un generador de parámetro de flujo de bits 1348 o ambos. El segundo codificador 296 puede incluir además un módulo de configuración 1305, un normalizador de energía 1306 o ambos. El remuestreador y banco de filtros 202 pueden acoplarse al primer codificador 204, al segundo codificador 296, a uno o más micrófonos 1338 o a una combinación de los mismos.
La memoria 1332 puede configurarse para almacenar instrucciones para realizar una o más funciones (por ejemplo, la primera función 164, la segunda función 166 o ambas). La primera función 164 puede incluir una primera función no lineal (por ejemplo, una función cuadrada) y la segunda función 166 puede incluir una segunda función no lineal (por ejemplo, una función de valor absoluto) que es distinta de la primera función no lineal. Como alternativa, tales funciones pueden implementarse usando hardware (por ejemplo, circuitería) en el primer dispositivo 102. La memoria 1332 puede configurarse para almacenar una o más señales (por ejemplo, una primera señal de excitación 1368, una segunda señal de excitación 1370 o ambas). El primer dispositivo 102 puede incluir además un transmisor 1392. En una implementación particular, el transmisor 1392 puede incluirse en un transceptor.
Durante la operación, el primer dispositivo 102 puede recibir (o generar) una señal de entrada 114. Por ejemplo, el remuestreador y banco de filtros 202 pueden recibir la señal de entrada 114 a través de los micrófonos 1338. El remuestreador y banco de filtros 202 pueden generar la primera señal de LB 240 aplicando un filtro de paso bajo a la señal de entrada 114 y pueden proporcionar la primera señal de LB 240 al primer codificador 204. El remuestreador y banco de filtros 202 pueden generar la primera señal de HB 242 aplicando un filtro de paso alto a la señal de entrada 114 y pueden proporcionar la primera señal de HB 242 al segundo codificador 296.
El primer codificador 204 puede generar la primera señal de excitación de LB 244 (por ejemplo, un residual de LB), el primer flujo de bits 128, o ambos, basándose en la primera señal de LB 240. El primer flujo de bits 128 puede incluir información de parámetro LB (por ejemplo, coeficientes de LPC, LSF o ambos). El primer codificador 204 puede proporcionar la primera señal de excitación de LB 244 al módulo de extensión de ancho de banda de codificador 206. El primer codificador 204 puede proporcionar el primer flujo de bits 128 al primer decodificador 134 de la Figura 1. En un aspecto particular, el primer codificador 204 puede almacenar el primer flujo de bits 128 en la memoria 1332. Los datos de audio 126 pueden incluir el primer flujo de bits 128.
El primer codificador 204 puede determinar un factor de sonoridad de LB (VF) 1354 (por ejemplo, un valor de 0,0 a 1,0) basándose en la información de parámetro de LB. El VF de LB 1354 puede indicar una naturaleza sonora/no sonora (por ejemplo, fuertemente sonora, débilmente sonora, débilmente no sonora o fuertemente no sonora) de la primera señal de LB 240. El primer codificador 204 puede proporcionar el VF de LB 1354 al módulo de configuración 1305. El primer codificador 204 puede determinar un tono de Lb basándose en la primera señal de LB 240. El primer codificador 204 puede proporcionar datos de tono de LB 1358 que indican el tono de LB al módulo de configuración 1305.
El módulo de configuración 1305 puede generar factores de mezcla estimados (por ejemplo, factores de mezcla 1353), un indicador de armonicidad 1364 (por ejemplo, que indica una coherencia de banda alta), un indicador de pico 1366, el modo de configuración NL 158, o una combinación de los mismos, como se describe con referencia a la Figura 14. El módulo de configuración 1305 puede proporcionar el modo de configuración NL 158 al módulo de extensión de ancho de banda de codificador 206. El módulo de configuración 1305 puede proporcionar el indicador de armonicidad 1364, los factores de mezcla 1353, o ambos, al generador de señal de excitación de HB 1347.
El módulo de extensión de ancho de banda de codificador 206 puede generar la primera señal extendida 250 basándose en la primera señal de excitación de LB 244, el modo de configuración NL 158, o ambos, como se describe con referencia a la Figura 17. El módulo de extensión de ancho de banda de codificador 206 puede proporcionar la primera señal extendida 250 al normalizador de energía 1306. El normalizador de energía 1306 puede generar una segunda señal extendida 1350 basándose en la primera señal extendida 250, como se describe con referencia a la Figura 19.
El normalizador de energía 1306 puede proporcionar la segunda señal extendida 1350 al módulo de codificación 208. El generador de señal de excitación de Hb 1347 puede generar una señal de excitación de HB 1352 basándose en la segunda señal extendida 1350, como se describe con referencia a la Figura 17. El generador de parámetro de flujo de bits 1348 puede generar los parámetros de flujo de bits 160 para reducir una diferencia entre la señal de excitación de HB 1352 y la primera señal de HB 242. El módulo de codificación 208 puede generar el segundo flujo de bits 130, que incluye los parámetros del flujo de bits 160, el modo de configuración NL 158 o ambos. Los datos de audio 126 pueden incluir el primer flujo de bits 128, el segundo flujo de bits 130 o ambos. El primer dispositivo 102 puede transmitir los datos de audio 126, a través del transmisor 1392, al segundo dispositivo 104. El segundo dispositivo 104 puede generar la señal de salida 124 basándose en los datos de audio 126, como se describe con referencia a la Figura 1.
Haciendo referencia a la Figura 14, se representa un diagrama de un aspecto ilustrativo del módulo de configuración 305. El módulo de configuración 1305 puede incluir un estimador de picos 1402, un estimador de medidas de extensión de tono de LB a HB 1404, un generador de modo de configuración 1406 o una combinación de los mismos.
El módulo de configuración 1305 puede generar una señal de excitación de HB particular (por ejemplo, un residual HB) asociada con la primera señal de HB 242. El estimador de pico 1402 puede determinar el indicador de pico 1366 basándose en la primera señal de HB 242 o la señal de excitación de HB particular. El indicador de pico 1366 puede corresponder a una relación de energía pico a promedio asociada con la primera señal de HB 242 o la señal de excitación de HB particular. El indicador de pico 1366 puede indicar por lo tanto un nivel de pico temporal de la primera señal de HB 242. El estimador de pico 1402 puede proporcionar el indicador de pico 1366 al generador de modo de configuración 1406. El estimador de pico 1402 también puede almacenar el indicador de pico 1366 en la memoria 1332 de la Figura 13.
El estimador 1404 de medida de extensión de tono de LB a HB puede determinar el indicador de armonicidad 1364 (por ejemplo, una medida de extensión de tono de LB a HB) basándose en la primera señal de HB 242 o la señal de excitación de HB particular, como se describe con referencia a la Figura 15. El indicador de armonicidad 1364 puede indicar una intensidad de sonorización de la primera señal de HB 242 (o la señal de excitación de HB particular). El estimador 1404 de la medida de extensión del tono de LB a HB puede determinar el indicador de armonicidad 1364 basándose en los datos de tono de LB 1358. Por ejemplo, el estimador de medida de extensión de tono de LB a HB 1404 puede determinar un retardo de tono basándose en un tono de LB indicado por los datos de tono de LB 1358 y puede determinar coeficientes de autocorrelación correspondientes a la primera señal de HB 242 (o la señal de excitación de HB particular ) basándose en el retardo de tono. El indicador de armonicidad 1364 puede indicar un valor particular (por ejemplo, máximo) de los coeficientes de autocorrelación. De este modo, el indicador de armonicidad 1364 puede distinguirse de un indicador de armonicidad tonal. El estimador 1404 de medida de extensión de tono de LB a HB puede proporcionar el indicador 1364 de armonicidad al generador de modo de configuración 1406. El estimador 1404 de medida de extensión de tono de LB a HB también puede almacenar el indicador de armonicidad 1364 en la memoria 1332 de la Figura 13.
El estimador de medida de extensión de tono de LB a HB 1404 puede determinar los factores de mezcla 1353 basándose en el VF de LB 1354. Por ejemplo, el estimador de excitación de HB 414 puede determinar un VF de HB basándose en el VF de LB 1354. El VF de HB puede corresponder a una configuración de mezcla de HB. En un aspecto particular, el estimador de medida de extensión de tono de LB a HB 1404 determina el VF de HB basándose en la aplicación de una función sigmoidea al VF de LB 1354. Por ejemplo, el estimador de medida de extensión de tono de LB a HB 1404 puede determinar el VF de HB basándose en la Ecuación 7, como se describe con referencia a la Figura 4, donde VFi puede corresponder a un VF de HB correspondiente a una subtrama i, y a puede corresponder a una correlación normalizada de la LB. En un aspecto particular, a de la Ecuación 7 puede corresponder al VF de LB 1354 para la subtrama i. El estimador de medida de extensión de tono de LB a HB 1404 puede determinar un primer peso (por ejemplo, VF de HB) y un segundo peso (por ejemplo, 1 - VF de HB). Los factores de mezcla 1353 pueden indicar el primer peso y el segundo peso. El estimador 1404 de medida de extensión de tono de LB a HB también puede almacenar los factores de mezcla 1353 en la memoria 1332 de la Figura 13.
El generador de modo de configuración 1406 puede generar el modo de configuración NL 158 basándose en el indicador de pico 1366, el indicador de armonicidad 1364 o ambos. Por ejemplo, el generador de modo de configuración 1406 puede generar el modo de configuración NL 158 basándose en el indicador de armonicidad 1364, como se describe con referencia a la Figura 16.
En una implementación particular, el generador de modo de configuración 1406 puede generar el modo de configuración NL 158 que tiene un primer valor (por ejemplo, NL HARMONIC o 0) en respuesta a determinar que el indicador de armonicidad 1364 satisface un primer umbral, que el indicador de pico 1366 satisface un segundo umbral, o ambos. El generador de modo de configuración 1406 puede generar el modo de configuración NL 158 que tiene un segundo valor (por ejemplo, NL_SMOOTH o 1) en respuesta a determinar que el indicador de armonicidad 1364 falla al satisfacer el primer umbral, que el indicador de pico 1366 falla al satisfacer el segundo umbral, o ambos. El generador de modo de configuración 1406 puede generar el modo de configuración NL 158 que tiene un tercer valor (por ejemplo, NL_HYBRID o 2) en respuesta a determinar que el indicador de armonicidad 1364 falla al satisfacer el primer umbral y que el indicador de pico 1366 satisface el segundo umbral. En otro aspecto, el generador de modo de configuración 1406 puede generar el modo de configuración NL 158 que tiene el tercer valor (por ejemplo, NL_HYBRID o 2) en respuesta a determinar que el indicador de armonicidad 1364 satisface el primer umbral y que el indicador de pico 1366 falla al satisfacer el segundo umbral.
En una implementación particular, el módulo de configuración 1305 puede generar el modo de configuración NL 158 que tiene el segundo valor (por ejemplo, NL_SMOOTH o 1) y el modo de configuración mixta 368 de la Figura 3 que tiene un valor particular (por ejemplo, un valor mayor que 1) en respuesta a determinar que el indicador de armonicidad 1364 falla al satisfacer el primer umbral, que el indicador de picos 1366 falla al satisfacer el segundo umbral, o ambos.
El módulo de configuración 1305 puede generar el modo de configuración NL 158 que tiene el segundo valor (por ejemplo, NL_SMOOTH o 1) y el modo de configuración de mezcla 368 que tiene otro valor particular (por ejemplo, un valor menor o igual que 1) en respuesta a determinar uno del indicador de armonicidad 1364 y el indicador de pico 1366 satisface un umbral correspondiente y el otro del indicador de armonicidad 1364 y el indicador de pico 1366 falla al satisfacer un umbral correspondiente. El generador de modo de configuración 1406 también puede almacenar el modo de configuración NL 158 en la memoria 1332 de la Figura 13.
Ventajosamente, determinar el modo de configuración NL 158 basándose en parámetros de banda alta (por ejemplo, el indicador de pico 1366, el indicador de armonicidad 1364 o ambos) puede ser robusto en los casos donde hay poca (por ejemplo, ninguna) correlación entre la primera señal de LB 240 y la primera señal de HB 242. Por ejemplo, la señal de banda alta 142 puede aproximarse a la primera señal de HB 242 cuando el modo de configuración NL 158 se determina basándose en los parámetros de banda alta.
Haciendo referencia a la Figura 15, se muestra un aspecto ilustrativo de un método de generación de señal de banda alta y se designa generalmente con 1500. El método 1500 puede realizarse por uno o más componentes de los sistemas 100-200, 1300-1400 de las Figuras 1-2, 13-14. Por ejemplo, el método 1500 puede realizarse mediante el primer dispositivo 102, el procesador 106, el codificador 108 de la Figura 1, el segundo codificador 296 de la Figura 2, el módulo de configuración 1305 de la Figura 13, el estimador de medida de extensión de tono de LB a HB 1404 de la Figura 14, o una combinación de los mismos.
El método 1500 puede incluir estimar una autocorrelación de una señal de HB en índices de retardo (T-L a T+L), en 1502. Por ejemplo, el módulo de configuración 1305 de la Figura 13 puede generar una señal de excitación de HB particular (por ejemplo, una señal residual HB) basándose en la primera señal de HB 242. El estimador 1404 de medida de extensión del tono de LB a HB de la Figura 14 puede generar una señal de autocorrelación (por ejemplo, coeficientes de autocorrelación 1512) basándose en la primera señal de HB 242 o la señal de excitación de HB particular. El estimador de medida de extensión de tono de LB a HB 1404 puede generar los coeficientes de autocorrelación 1512 (R) basándose en índices de retardo dentro de una distancia umbral (por ejemplo, T-L a T+L) de un tono de LB (T) indicado por los datos de tono de LB 1358. Los coeficientes de autocorrelación 1512 pueden incluir un primer número (por ejemplo, 2L) de coeficientes.
El método 1500 también puede incluir interpolar los coeficientes de autocorrelación (R), en 1506. Por ejemplo, el estimador de medida de extensión de tono de LB a HB 1404 de la Figura 14 puede generar segundos coeficientes de autocorrelación 1514 (R_interp) aplicando una función sinc en ventanas 1504 a los coeficientes de autocorrelación 1512 (R). La función sinc en ventanas 1504 puede corresponder a un factor de escalamiento (por ejemplo, N). Los segundos coeficientes de autocorrelación 1514 (R_interp) pueden incluir un segundo número (por ejemplo, 2LN) de coeficientes.
El método 1500 incluye la estimación de coeficientes de autocorrelación interpolados normalizados, en 1508. Por ejemplo, el estimador de medida de extensión de tono de LB a HB 1404 puede determinar una segunda señal de autocorrelación (por ejemplo, coeficientes de autocorrelación normalizados) normalizando los segundos coeficientes de autocorrelación 1514 (R_interp). El estimador de la medida de extensión de tono de LB a HB 1404 puede determinar el indicador de armónico 1364 basándose en un valor particular (por ejemplo, máximo) de la segunda señal de autocorrelación (por ejemplo, los coeficientes de autocorrelación normalizados). El indicador de armonicidad 1364 puede indicar una intensidad de un componente de tono repetitivo en la primera señal de HB 242. El indicador de armonicidad 1364 puede indicar una coherencia relativa asociada con la primera señal de HB 242. El indicador de armonicidad 1364 puede indicar una medida de extensión de tono LB a HB.
Haciendo referencia a la Figura 16, se muestra un aspecto ilustrativo de un método de generación de señal de banda alta y se designa generalmente con 1600. El método 1600 puede realizarse por uno o más componentes de los sistemas 100-200, 1300-1400 de las Figuras 1-2, 13-14. Por ejemplo, el método 1600 puede realizarse mediante el primer dispositivo 102, el procesador 106, el codificador 108 de la Figura 1, el segundo codificador 296 de la Figura 2, el módulo de configuración 1305 de la Figura 13, el generador de modo de configuración 1406 de la Figura 14, o una combinación de los mismos.
El método 1600 incluye determinar si una medida de extensión de tono de LB a HB satisface un umbral, en 1602. Por ejemplo, el generador de modo de configuración 1406 de la Figura 14 puede determinar si el indicador de armonicidad 1364 (por ejemplo, una medida de extensión de tono de LB a HB) satisface un primer umbral.
El método 1600 incluye, en respuesta a determinar que la medida de extensión de tono de LB a HB satisface el umbral, en 1602, seleccionar un primer modo de configuración NL, en 1604. Por ejemplo, el generador de modo de configuración 1406 de la Figura 14 puede generar, en respuesta a determinar que el indicador de armonicidad 1364 satisface el primer umbral, el modo de configuración NL 158 que tiene un primer valor (por ejemplo, NL HARMONIC o 0).
Como alternativa, en respuesta a determinar que la medida de extensión de tono de LB a HB falla al satisfacer el umbral, en 1602, el método 1600 determina si la medida de extensión de tono de LB a HB falla al satisfacer un segundo umbral, en 1606. Por ejemplo, el generador de modo de configuración 1406 de la Figura 14 puede determinar, en respuesta a determinar que el indicador de armonicidad 1364 falla al satisfacer el primer umbral, determinar si el indicador de armonicidad 1364 satisface un segundo umbral.
El método 1600 incluye, en respuesta a determinar que la medida de extensión de tono de LB a HB satisface el segundo umbral, en 1606, seleccionar un segundo modo de configuración NL, en 1608. Por ejemplo, el generador de modo de configuración 1406 de la Figura 14 puede generar, en respuesta a determinar que el indicador de armonicidad 1364 satisface el segundo umbral, el modo de configuración Nl 158 que tiene un segundo valor (por ejemplo, NL_SMOOTH o 1).
En respuesta a determinar que la medida de extensión de tono de LB a HB falla al satisfacer el segundo umbral, en 1606, el método 1600 incluye seleccionar un tercer modo de configuración de NL, en 1610. Por ejemplo, el generador de modo de configuración 1406 de la Figura 14 puede, en respuesta a determinar que el indicador de armonicidad 1364 falla al satisfacer el segundo umbral, generar el modo de configuración NL 158 que tiene un tercer valor (por ejemplo, NL_HYBRID o 2).
Haciendo referencia a la Figura 17, se divulga un sistema y se designa generalmente con 1700. En un aspecto particular, el sistema 1700 puede corresponder al sistema 100 de la Figura 1, al sistema 200 de la Figura 2, al sistema 1300 de la Figura 13, o una combinación de los mismos. El sistema 1700 puede incluir el módulo de extensión de ancho de banda de codificador 206, el normalizador de energía 1306, el generador de señal de excitación de HB 1347, el generador de parámetro de flujo de bits 1348 o una combinación de los mismos. El módulo de extensión de ancho de banda de codificador 206 puede incluir el remuestreador 402, el módulo de extensión de armónicos 404 o ambos. El generador de señal de excitación de HB 1347 puede incluir el módulo de inversión y decimación espectral 408, el módulo de blanqueamiento adaptativo 410, el modulador de envolvente temporal 412, el estimador de excitación de HB 414 o una combinación de los mismos.
Durante la operación, el módulo de extensión de ancho de banda de codificador 206 puede generar la primera señal extendida 250 extendiendo la primera señal de excitación de LB 244, como se describe en el presente documento. El remuestreador 402 puede recibir la primera señal de excitación de LB 244 desde el primer codificador 204 de las Figuras 2 y 13. El remuestreador 402 puede generar una señal remuestreada 1706 basándose en la primera señal de excitación de LB 244, como se describe con referencia a la Figura 5. El remuestreador 402 puede proporcionar la señal remuestreada 1706 al módulo de extensión de armónicos 404.
El módulo de extensión de armónicos 404 puede generar la primera señal extendida 250 (por ejemplo, una señal de excitación de HB) extendiendo armónicamente la señal remuestreada 1706 en un dominio del tiempo basándose en el modo de configuración NL 158, como se describe con referencia a la Figura 4. El modo de configuración NL 158 puede generarse por el módulo de configuración 1305, como se describe con referencia a la Figura 14. Por ejemplo, el módulo de extensión de armónicos 404 puede seleccionar la primera función 164, la segunda función 166 o una función híbrida basándose en un valor del modo de configuración NL 158. La función híbrida puede incluir una combinación de múltiples funciones (por ejemplo, la primera función 164 y la segunda función 166). El módulo de extensión de armónicos 404 puede generar la primera señal extendida 250 basándose en la función seleccionada (por ejemplo, la primera función 164, la segunda función 166 o la función híbrida).
El módulo de extensión de armónicos 404 puede proporcionar la primera señal extendida 150 al normalizador de energía 1306. El normalizador de energía 1306 puede generar la segunda señal extendida 1350 basándose en la primera señal extendida 250, como se describe con referencia a la Figura 19. El normalizador de energía 1306 puede proporcionar la segunda señal extendida 1350 al módulo de inversión y decimación espectral 408.
El módulo de inversión espectral y decimación 408 puede generar una señal invertida espectralmente realizando una inversión espectral de la segunda señal extendida 1350 del dominio del tiempo, como se describe con referencia a la Figura 4. El módulo de inversión y decimación espectral 408 puede generar una primera señal 1750 (por ejemplo, una señal de excitación de HB) decimando la señal invertida espectralmente basándose en un primer filtro de paso todo y un segundo filtro de paso todo, como se describe con referencia a la Figura 4.
El módulo de inversión y decimación espectral 408 puede proporcionar la primera señal 1750 al módulo de blanqueamiento adaptativo 410. El módulo de blanqueamiento adaptativo 410 puede generar una segunda señal 1752 (por ejemplo, una señal de excitación de HB) aplanando un espectro de la primera señal 1750 realizando un blanqueamiento de LP de cuarto orden de la primera señal 1750, como se describe con referencia a la Figura 4. El módulo de blanqueamiento adaptativo 410 puede proporcionar la segunda señal 452 al modulador de envolvente temporal 412, al estimador de excitación de HB 414 o a ambos.
El modulador de envolvente temporal 412 puede recibir la segunda señal 1752 del módulo de blanqueamiento adaptativo 410, una señal de ruido 1740 de un generador de ruido aleatorio, o ambas. El generador de ruido aleatorio puede estar acoplado o incluido en el primer dispositivo 102. El modulador de envolvente temporal 412 puede generar una tercera señal 1754 basándose en la señal de ruido 1740, la segunda señal 1752 o ambas. Por ejemplo, el modulador de envolvente temporal 412 puede generar una primera señal de ruido aplicando conformación temporal a la señal de ruido 1740. El modulador de envolvente temporal 412 puede generar una envolvente de señal basándose en la segunda señal 1752 (o la primera señal de excitación de LB 244). El modulador de envolvente temporal 412 puede generar la primera señal de ruido basándose en la envolvente de señal y la señal de ruido 1740. Por ejemplo, el modulador de envolvente temporal 412 puede combinar la envolvente de señal y la señal de ruido 1740. Combinar la envolvente de la señal y la señal de ruido 1740 puede modular la amplitud de la señal de ruido 1740. El modulador de envolvente temporal 412 puede generar la tercera señal 1754 aplicando conformación espectral a la primera señal de ruido. En una implementación alternativa, el modulador de envolvente temporal 412 puede generar la primera señal de ruido aplicando conformación espectral a la señal de ruido 1740 y puede generar la tercera señal 1754 aplicando conformación temporal a la primera señal de ruido. Por lo tanto, se puede aplicar conformación espectral y temporal en cualquier orden a la señal de ruido 1740. El modulador de envolvente temporal 412 puede proporcionar la tercera señal 1754 al estimador de excitación de HB 414.
El estimador de excitación de HB 414 puede recibir la segunda señal 1752 del módulo de blanqueamiento adaptativo 410, la tercera señal 1754 del modulador de envolvente temporal 412, el indicador de armonicidad 1364, los factores de mezcla 1353 del módulo de configuración 1305, o una combinación de los mismos. El estimador de excitación de HB 414 puede generar la señal de excitación de HB 1352 combinando la segunda señal 1752 y la tercera señal 1754 basándose en el indicador de armonicidad 1364, los factores de mezcla 1353 o ambos.
Los factores de mezcla 1353 pueden indicar un VF de HB, como se describe con referencia a la Figura 14. Por ejemplo, los factores de mezcla 1353 pueden indicar un primer peso (por ejemplo, VF de HB) y un segundo peso (por ejemplo, 1 - VF de HB). El estimador de excitación de HB 414 puede ajustar los factores de mezcla 1353 basándose en el indicador de armonicidad 1364, como se describe con referencia a la Figura 18. El estimador de excitación de HB 414 puede normalizar la potencia de la tercera señal 1754 de modo que la tercera señal 1754 tenga el mismo nivel de potencia que la segunda señal 1752.
El estimador de excitación de HB 414 puede generar la señal de excitación de HB 1352 realizando una suma ponderada de la segunda señal 1752 y la tercera señal 1754 basándose en los factores de mezcla ajustados 1353, donde el primer peso se asigna a la segunda señal 1752 y el segundo peso se asigna a la tercera señal 1754. Por ejemplo, el estimador de excitación de HB 414 puede generar la subtrama (i) de la señal de excitación de HB 1352 mezclando la subtrama (i) de la segunda señal 1752 que se escala basándose en VFi de la Ecuación 7 (por ejemplo, escalada basándose en una raíz cuadrada de VFi) y la subtrama (i) de la tercera señal 1754 que se escala basándose en (1 - VFi) de la Ecuación 7 (por ejemplo, escalada basándose en una raíz cuadrada de (1 - VFi)). El estimador de excitación de HB 414 puede proporcionar la señal de excitación de HB 1352 al generador de parámetro de flujo de bits 1348.
El generador de parámetro de flujo de bits 1348 puede generar los parámetros de flujo de bits 160. Por ejemplo, los parámetros de flujo de bits 160 pueden incluir el modo de configuración de mezcla 368. El modo de configuración de mezcla 368 puede corresponder a los factores de mezcla 1353 (por ejemplo, los factores de mezcla ajustados 1353). Como otro ejemplo, los parámetros de flujo de bits 160 pueden incluir el modo de configuración NL 158, la información de filtro 374, los datos de LSF de HB 364 o una combinación de los mismos. La información de filtro 374 puede incluir un índice generado por el normalizador de energía 1306, como se describe además con referencia a la Figura 19. Los datos de LSF de HB 364 pueden corresponder a un filtro cuantificado (por ejemplo, LSF cuantificadas) generado por el normalizador de energía 1306, como se describe además con referencia a la Figura 19.
El generador de parámetro de flujo de bits 1348 puede generar información de ganancia objetivo (por ejemplo, los datos de ganancia objetivo de HB 370, los datos de forma de ganancia 372, o ambos) basándose en una comparación de la señal de excitación de HB 1352 y la primera señal de HB 242. El generador de parámetro de flujo de bits 1348 puede actualizar la información de ganancia objetivo basándose en el indicador de armonicidad 1364, el indicador de pico 1366 o ambos. Por ejemplo, el generador de parámetro de flujo de bits 1348 puede reducir una trama de ganancia de HB indicada por la información de ganancia objetivo cuando el indicador de armonicidad 1364 indica un componente armónico intenso, el indicador de pico 1366 indica un pico alto, o ambos. Para ilustrar, el generador de parámetro de flujo de bits 1348 puede reducir, en respuesta a determinar que el indicador de pico 1366 satisface un primer umbral y el indicador de armonicidad 1364 satisface un segundo umbral, la trama de ganancia de HB indicada por la información de ganancia objetivo.
El generador de parámetro de flujo de bits 1348 puede actualizar la información de ganancia objetivo para modificar una forma de ganancia de una subtrama particular cuando el indicador de pico 1366 indica picos de energía en la primera señal de HB 242. El indicador de pico 1366 puede incluir valores de pico de subtrama. Por ejemplo, el indicador de pico 1366 puede indicar un valor de pico de la subtrama particular. Los valores de pico de subtrama pueden "suavizarse" para determinar si la primera señal de HB 242 corresponde a un HB de armónicos, un HB no de armónicos o un HB con uno o más picos. Por ejemplo, el generador de parámetro de flujo de bits 1348 puede realizar un suavizado aplicando una función de aproximación (por ejemplo, una media móvil) al indicador de pico 1366. Además, o como alternativa, el generador de parámetro de flujo de bits 1348 puede actualizar la información de ganancia objetivo para modificar (por ejemplo, atenuar) una forma de ganancia de la subtrama particular. Los parámetros de flujo de bits 160 pueden incluir la información de ganancia objetivo.
Haciendo referencia a la Figura 18, se muestra un aspecto ilustrativo de un método de generación de señal de banda alta y se designa generalmente con 1800. El método 1800 puede realizarse por uno o más componentes de los sistemas 100-200, 1300-1400 de las Figuras 1-2, 13-14. Por ejemplo, el método 1800 puede realizarse mediante el primer dispositivo 102, el procesador 106, el codificador 108 de la Figura 1, el segundo codificador 296 de la Figura 2, el generador de señal de excitación de HB 1347 de la Figura 13, el estimador de medida de extensión de tono de LB a HB 1404 de la Figura 14, o una combinación de los mismos.
El método 1800 incluye recibir una medida de extensión de tono de LB a HB, en 1802. Por ejemplo, el estimador de excitación de HB 414 puede recibir el indicador de armonicidad 1364 (por ejemplo, un valor de coherencia de HB) del módulo de configuración 1305, como se describe con referencia a las Figuras 13-14 y 17.
El método 1800 también incluye recibir factores de mezcla estimados basándose en información de sonoridad de banda baja, en 1804. Por ejemplo, el estimador de excitación de HB 414 puede recibir los factores de mezcla 1353 del módulo de configuración 1305, como se describe con referencia a las Figuras 13-14 y 17. Los factores de mezcla 1353 pueden basarse en el VF de LB 1354, como se describe con referencia a la Figura 14.
El método 1800 incluye además ajustar los factores de mezcla estimados basándose en el conocimiento de la coherencia de HB (por ejemplo, la medida de extensión de tono de LB a HB), en 1806. Por ejemplo, el estimador de excitación de HB 414 puede ajustar los factores de mezcla 1353 basándose en el indicador de armonicidad 1364, como se describe con referencia a la Figura 17.
La Figura 18 también incluye un diagrama de un aspecto ilustrativo de un método de ajuste de factores de mezcla estimados que generalmente se designa con 1820. El método 1820 puede corresponder a la etapa 1806 del método 1800.
El método 1820 incluye determinar si un VF de LB es mayor que un primer umbral y la coherencia de HB es menor que un segundo umbral, en 1808. Por ejemplo, el estimador de excitación de HB 414 puede determinar si el VF de LB 1354 es mayor que un primer umbral y el indicador de armonicidad 1364 es menor que un segundo umbral. En un aspecto particular, los factores de mezcla 1353 pueden indicar el VF de LB 1354.
El método 1820 incluye, en respuesta a determinar que el VF de LB es mayor que el primer umbral y que la coherencia de HB es menor que el segundo umbral, en 1808, factores de mezcla de atenuación, en 1810. Por ejemplo, el estimador de excitación de HB 414 puede atenuar los factores de mezcla 1353 en respuesta a determinar que el VF de LB 1354 es mayor que el primer umbral y que el indicador de armonicidad 1364 falla al satisfacer que es menor que el segundo umbral.
El método 1820 incluye, en respuesta a determinar que el VF de LB es menor o igual que el primer umbral o que la coherencia de HB es mayor o igual al segundo umbral, en 1808, determinar si el VF de LB es menor que el primer umbral y que la coherencia de HB es menor que el segundo umbral, en 1812. Por ejemplo, el estimador de excitación de HB 414 puede determinar, en respuesta a determinar que el VF de LB 1354 es menor o igual que el primer umbral o que el indicador de armonicidad 1364 es mayor o igual que el segundo umbral, si el VF de LB 1354 es menor que el primer umbral y que el indicador de armonicidad 1364 es mayor que el segundo umbral.
El método 1820 incluye, en respuesta a determinar que el VF de LB es menor que el primer umbral y que la coherencia de HB es menor que el segundo umbral, en 1812, factores de mezcla de potenciación, en 1814. Por ejemplo, el estimador de excitación de HB 414 puede potenciar, en respuesta a determinar que el VF de LB 1354 es menor que el primer umbral y que el indicador de armonicidad 1364 es mayor que el segundo umbral, los factores de mezcla 1353.
El método 1820 incluye, en respuesta a determinar que el VF de LB es mayor o igual que el primer umbral o que la coherencia de HB es mayor o igual que el segundo umbral, en 1812, dejar los factores de mezcla sin cambios, en 1816. Por ejemplo, el estimador de excitación de HB 414 puede dejar, en respuesta a determinar que el VF de LB 1354 es mayor o igual que el primer umbral o que el indicador de armonicidad 1364 es menor o igual que el segundo umbral, los factores de mezcla 1353 sin cambios. Para ilustrar, el estimador de excitación de HB 414 puede dejar los factores de mezcla 1353 sin cambios en respuesta a determinar que el VF de LB 1354 es igual al primer umbral, que el indicador de armonicidad 1364 es igual al segundo umbral, que el VF de LB 1354 es menor que el primer umbral y el indicador de armonicidad 1364 es menor que el segundo umbral, o que el VF de LB 1354 es mayor que el primer umbral y el indicador de armonicidad 1364 es mayor que el segundo umbral.
El estimador de excitación de HB 414 puede ajustar los factores de mezcla 1353 basándose en el indicador de armonicidad 1364, el VF de LB 1354 o ambos. Los factores de mezcla 1353 pueden indicar el VF de HB, como se describe con referencia a la Figura 14. El estimador de excitación de HB 414 puede reducir (o aumentar) las variaciones en el VF de HB basándose en el indicador de armonicidad 1364, el VF de LB 1354 o ambos. La modificación del VF de HB basándose en el indicador de armonicidad 1364 y el VF de LB 1354 puede compensar un desajuste entre el VF de LB 1354 y el VF de HB.
Las frecuencias inferiores de señales de voz generalmente pueden mostrar una estructura armónica más intensa que las frecuencias superiores. Una salida (por ejemplo, la señal extendida 150 de la Figura 1) de modelado no lineal, en ocasiones, puede sobreenfatizar los armónicos en una porción de banda alta y puede conducir a artefactos de sonido de zumbido poco naturales. Atenuar los factores de mezcla puede producir una señal de banda alta con un sonido agradable (por ejemplo, la señal de banda alta 142 de la Figura 1).
Haciendo referencia a la Figura 19, se representa un diagrama de un aspecto ilustrativo del normalizador de energía 1306. El normalizador de energía 1306 puede incluir un estimador de filtro 1902, un aplicador de filtro 1912 o ambos.
El estimador de filtro 1902 puede incluir un ajustador de filtro 1908, un sumador 1914 o ambos. El segundo codificador 296 (por ejemplo, el estimador de filtro 1902) puede generar una señal de excitación de HB particular (por ejemplo, un residual de h B) asociada con la primera señal de HB 242. El estimador de filtro 1902 puede seleccionar (o generar) un filtro 1906 basándose en una comparación de la primera señal extendida 250 y la primera señal de HB 242 (o la señal de excitación de HB particular). Por ejemplo, el estimador de filtro 1902 puede seleccionar (o generar) el filtro 1906 para reducir (por ejemplo, eliminar) la distorsión entre la primera señal extendida 250 y la primera señal de HB 242 (o la señal de excitación de HB particular), como se describe en el presente documento. El ajustador de filtro 1908 puede generar una señal escalada 1916 aplicando el filtro 1906 (por ejemplo, un filtro FIR) a la primera señal extendida 250. El ajustador de filtro 1908 puede proporcionar la señal escalada 1916 al sumador 1914. El sumador 1914 puede generar una señal de error 1904 correspondiente a una distorsión (por ejemplo, una diferencia) entre la señal escalada 1916 y la primera señal de HB 242 (o la señal de excitación de Hb particular). Por ejemplo, la señal de error 1904 puede corresponder a un error cuadrático medio entre la señal escalada 1916 y la primera señal de HB 242 (o la señal de excitación de HB particular). El sumador 1914 puede generar la señal de error 1904 basándose en un algoritmo de mínimos cuadrados medios (LMS). El sumador 1914 puede proporcionar la señal de error 1904 al ajustador de filtro 1908.
El ajustador de filtro 1908 puede seleccionar (por ejemplo, ajustar) el filtro 1906 basándose en la señal de error 1904. Por ejemplo, el ajustador de filtro 1908 puede ajustar iterativamente el filtro 1906 para reducir una métrica de distorsión (por ejemplo, una métrica de error cuadrático medio) entre un primer componente de armónicos de la señal escalada 1916 y un segundo componente de armónicos de la primera señal de HB 242 (o la señal de excitación de HB particular) reduciendo (o eliminando) una energía de la señal de error 1904. El ajustador de filtro 1908 puede generar la señal escalada 1916 aplicando el filtro ajustado 1906 a la primera señal extendida 250. El estimador de filtro 1902 puede proporcionar el filtro 1906 (por ejemplo, el filtro ajustado 1906) al aplicador de filtro 1912.
El aplicador de filtro 1912 puede incluir un cuantificador 1918, un motor de filtro FIR 1924 o ambos. El cuantificador 1918 puede generar un filtro cuantificado 1922 basándose en el filtro 1906. Por ejemplo, el cuantificador 1918 puede generar coeficientes de filtro (por ejemplo, coeficientes de LSP o LPC) correspondientes al filtro 1906. El cuantificador 1918 puede generar coeficientes de filtro cuantificados realizando una cuantificación vectorial (VQ) de múltiples etapas (por ejemplo, de 2 etapas) en los coeficientes de filtro. El filtro cuantificado 1922 puede incluir los coeficientes de filtro cuantificados. El cuantificador 1918 puede proporcionar un índice de cuantificación 1920 correspondiente al filtro cuantificado 1922 al generador de parámetro de flujo de bits 1348 de la Figura 13. Los parámetros de flujo de bits 160 pueden incluir la información de filtro 374 que indica el índice de cuantificación 1920, los datos de LSF de HB 364 correspondientes al filtro cuantificado 1922 (por ejemplo, los coeficientes de LSP cuantificados o los LPC cuantificados), o ambos.
El cuantificador 1918 puede proporcionar el filtro cuantificado 1922 al motor de filtro FIR 1924. El motor de filtro FIR 1924 puede generar la segunda señal extendida 1350 filtrando la primera señal extendida 250 basándose en el filtro cuantificado 1922. El motor de filtro FIR 1924 puede proporcionar la segunda señal extendida 1350 al generador de señal de excitación de HB 1347 de la Figura 13.
Haciendo referencia a la Figura 20, se muestra un diagrama de un aspecto de un método de generación de señal de banda alta y se designa generalmente con 2000. El método 2000 puede realizarse por uno o más componentes de los sistemas 100, 200 o 1300 de las Figuras 1, 2, o 13. Por ejemplo, el método 2000 puede realizarse mediante el primer dispositivo 102, el procesador 106, el codificador 108 de la Figura 1, el segundo codificador 296 de la Figura 2, el normalizador de energía 1306 de la Figura 13, el estimador de filtro 1902, el aplicador de filtro 1912 de la Figura 19, o una combinación de los mismos.
El método 2000 incluye recibir una señal de banda alta y una primera señal extendida, en 2002. Por ejemplo, el normalizador de energía 1306 de la Figura 13 puede recibir la primera señal de HB 242 y la primera señal extendida 250, como se describe con referencia a la Figura 13.
El método 2000 también incluye estimar un filtro (h(n)) que minimiza (o reduce) la energía de error, en 2004. Por ejemplo, el estimador de filtro 1902 de la Figura 19 puede estimar el filtro 1906 para reducir una energía de la señal de error 1904, como se describe con referencia a la Figura 19.
El método 2000 incluye además cuantificar y transmitir un índice correspondiente a h(n), en 2006. Por ejemplo, el cuantificador 1918 puede generar el filtro cuantificado 1922 cuantificando el filtro 1906, como se describe con referencia a la Figura 19. El cuantificador 1918 puede generar el índice de cuantificación 1920 correspondiente al filtro 1906, como se describe con referencia a la Figura 19.
El método 2000 también incluye usar el filtro cuantificado y filtrar la primera señal extendida para generar una segunda señal extendida, en 2008. Por ejemplo, el motor de filtro FIR 1924 puede generar la segunda señal extendida 1350 filtrando la primera señal extendida 250 basándose en el filtro cuantificado 1922.
Haciendo referencia a la Figura 21, se muestra un diagrama de flujo de un aspecto de un método de generación de señal de banda alta y se designa generalmente con 2100. El método 2100 puede realizarse por uno o más componentes de los sistemas 100, 200 o 1300 de las Figuras 1,2, o 13. Por ejemplo, el método 2100 puede realizarse mediante el primer dispositivo 102, el procesador 106, el codificador 108 de la Figura 1, el primer codificador 204, el segundo codificador 296 de la Figura 2, el generador de parámetro de flujo de bits 1348, el transmisor 1392 de la Figura 13, o una combinación de los mismos.
El método 2100 incluye recibir una señal de audio en un primer dispositivo, en 2102. Por ejemplo, el codificador 108 del segundo dispositivo 104 puede recibir la señal de entrada 114, como se describe con referencia a la Figura 13.
El método 2100 también incluye generar, en el primer dispositivo, un parámetro de modelado de señal basándose en un indicador de armonicidad, un indicador de pico, o ambos, el parámetro de modelado de señal asociado con una porción de banda alta de la señal de audio, en 2104. Por ejemplo, el codificador 108 del segundo dispositivo 104 puede generar el modo de configuración NL 158, el modo de configuración de mezcla 368, información de ganancia objetivo (por ejemplo, los datos de ganancia objetivo de HB 370, los datos de forma de ganancia 372, o ambos), o una combinación de los mismos, como se describe con referencia a la Figura 13, 14, 16 y 17. Para ilustrar, el generador de modo de configuración 1406 puede generar el modo de configuración NL 158, como se describe con referencia a las Figuras 14 y 16. El estimador de excitación de HB 414 puede generar el modo de configuración de mezcla 368 basándose en los factores de mezcla 1353, el indicador de armonicidad 1364 o ambos, como se describe con referencia a la Figura 17. El generador de parámetro de flujo de bits 1348 puede generar la información de ganancia objetivo, como se describe con referencia a la Figura 17.
El método 2100 incluye además enviar, desde el primer dispositivo a un segundo dispositivo, el parámetro de modelado de señal junto con un flujo de audio de ancho de banda extendido correspondiente a la señal de audio, en 2106. Por ejemplo, el transmisor 1392 de la Figura 13 puede transmitir, desde el segundo dispositivo 104 al primer dispositivo 102, el modo de configuración NL 158, el modo de configuración de mezcla 368, los datos de ganancia objetivo de HB 370, los datos de forma de ganancia 372, o una combinación de los mismos, junto con los datos de audio 126.
Haciendo referencia a la Figura 22, se muestra un diagrama de flujo de un aspecto de un método de generación de señal de banda alta y se designa generalmente con 2200. El método 2200 puede realizarse por uno o más componentes de los sistemas 100, 200 o 1300 de las Figuras 1,2, o 13. Por ejemplo, el método 2200 puede realizarse mediante el primer dispositivo 102, el procesador 106, el codificador 108 de la Figura 1, el primer codificador 204, el segundo codificador 296 de la Figura 2, el generador de parámetro de flujo de bits 1348, el transmisor 1392 de la Figura 13, o una combinación de los mismos.
El método 2200 incluye recibir una señal de audio en un primer dispositivo, en 2202. Por ejemplo, el codificador 108 del segundo dispositivo 104 puede recibir la señal de entrada 114 (por ejemplo, una señal de audio), como se describe con referencia a la Figura 13.
El método 2200 también incluye generar, en el primer dispositivo, una señal de excitación de banda alta basándose en una porción de banda alta de la señal de audio, en 2204. Por ejemplo, el remuestreador y banco de filtros 202 del segundo dispositivo 104 pueden generar la primera señal de HB 242 basándose en una porción de banda alta de la señal de entrada 114, como se describe con referencia a la Figura 13. El segundo codificador 296 puede generar una señal de excitación de HB particular (por ejemplo, un residual de HB) basándose en la primera señal de HB 242.
El método 2200 incluye además generar, en el primer dispositivo, una señal de excitación de banda alta modelada basándose en una porción de banda baja de la señal de audio, en 2206. Por ejemplo, el módulo de extensión de ancho de banda de codificador 206 del segundo dispositivo 104 puede generar la primera señal extendida 250 basándose en la primera señal de LB 240, como se describe con referencia a la Figura 13. La primera señal de LB 240 puede corresponder a una porción de banda baja de la señal de entrada 114.
El método 2200 también incluye seleccionar, en el primer dispositivo, un filtro basándose en una comparación de la señal de excitación de banda alta modelada y la señal de excitación de banda alta, en 2208. Por ejemplo, el estimador de filtro 1902 del segundo dispositivo 104 puede seleccionar el filtro 1906 basándose en una comparación de la primera señal extendida 250 y la primera señal de HB 242 (o la señal de excitación de HB particular), como se describe con referencia a la Figura 19.
El método 2200 incluye además enviar, desde el primer dispositivo a un segundo dispositivo, información de filtro correspondiente al filtro junto con un flujo de audio con ancho de banda extendido correspondiente a la señal de audio, en 2210. Por ejemplo, el transmisor 1392 puede transmitir, desde el segundo dispositivo 104 al primer dispositivo 102, la información de filtro 374, los datos de LSF de HB 364, o ambos, junto con los datos de audio 126 correspondientes a la señal de entrada 114, como se describe con referencia a las Figuras 13 y 19.
Haciendo referencia a la Figura 23, se muestra un diagrama de flujo de un aspecto de un método de generación de señal de banda alta y se designa generalmente con 2300. El método 2300 puede realizarse por uno o más componentes de los sistemas 100, 200 o 1300 de las Figuras 1,2, o 13. Por ejemplo, el método 2300 puede realizarse mediante el primer dispositivo 102, el procesador 106, el codificador 108 de la Figura 1, el primer codificador 204, el segundo codificador 296 de la Figura 2, el generador de parámetro de flujo de bits 1348, el transmisor 1392 de la Figura 13, o una combinación de los mismos.
El método 2300 incluye recibir una señal de audio en un primer dispositivo, en 2302. Por ejemplo, el codificador 108 del segundo dispositivo 104 puede recibir la señal de entrada 114 (por ejemplo, una señal de audio), como se describe con referencia a la Figura 13.
El método 2300 también incluye generar, en el primer dispositivo, una señal de excitación de banda alta basándose en una porción de banda alta de la señal de audio, en 2304. Por ejemplo, el remuestreador y banco de filtros 202 del segundo dispositivo 104 pueden generar la primera señal de HB 242 basándose en una porción de banda alta de la señal de entrada 114, como se describe con referencia a la Figura 13. El segundo codificador 296 puede generar una señal de excitación de HB particular (por ejemplo, un residual de HB) basándose en la primera señal de HB 242.
El método 2300 incluye además generar, en el primer dispositivo, una señal de excitación de banda alta modelada basándose en una porción de banda baja de la señal de audio, en 2306. Por ejemplo, el módulo de extensión de ancho de banda de codificador 206 del segundo dispositivo 104 puede generar la primera señal extendida 250 basándose en la primera señal de LB 240, como se describe con referencia a la Figura 13. La primera señal de LB 240 puede corresponder a una porción de banda baja de la señal de entrada 114.
El método 2300 también incluye generar, en el primer dispositivo, coeficientes de filtro basándose en una comparación de la señal de excitación de banda alta modelada y la señal de excitación de banda alta, en 2308. Por ejemplo, el estimador de filtro 1902 del segundo dispositivo 104 puede generar coeficientes de filtro correspondientes al filtro 1906 basándose en una comparación de la primera señal extendida 250 y la primera señal de HB 242 (o la señal de excitación de HB particular), como se describe con referencia a la Figura 19.
El método 2300 incluye además generar, en el primer dispositivo, información de filtro cuantificando los coeficientes de filtro, en 2310. Por ejemplo, el cuantificador 1918 del segundo dispositivo 104 puede generar el índice de cuantificación 1920 y el filtro cuantificado 1922 (por ejemplo, coeficientes de filtro cuantificados) cuantificando los coeficientes de filtro correspondientes al filtro 1906, como se describe con referencia a la Figura 19. El cuantificador 1918 puede generar la información de filtro 374 que indica el índice de cuantificación 1920, los datos de LSF de HB 364 que indican los coeficientes de filtro cuantificados, o ambos.
El método 2300 incluye también enviar, desde el primer dispositivo a un segundo dispositivo, la información de filtro junto con un flujo de audio de ancho de banda extendido correspondiente a la señal de audio, en 2210. Por ejemplo, el transmisor 1392 puede transmitir, desde el segundo dispositivo 104 al primer dispositivo 102, la información de filtro 374, los datos de LSF de HB 364, o ambos, junto con los datos de audio 126 correspondientes a la señal de entrada 114, como se describe con referencia a las Figuras 13 y 19.
Haciendo referencia a la Figura 24, se muestra un diagrama de flujo de un aspecto de un método de generación de señal de banda alta y se designa generalmente con 2400. El método 2400 puede realizarse por uno o más componentes de los sistemas 100, 200 o 1300 de las Figuras 1, 2, o 13. Por ejemplo, el método 2400 puede ser realizado por el primer dispositivo 102, el procesador 106, el codificador 108, el segundo dispositivo 104, el procesador 116, el decodificador 118, el segundo decodificador 136, el módulo de decodificación 162, el generador de señal de excitación de HB 147 de la Figura 1, el segundo codificador 296, el módulo de codificación 208, el módulo de extensión de ancho de banda de codificador 206 de la Figura 2, el sistema 400, el módulo de extensión de armónicos 404 de la Figura 4, o una combinación de los mismos.
El método 2400 incluye seleccionar, en un dispositivo, una pluralidad de funciones de procesamiento no lineal basándose al menos en parte en un valor de un parámetro, en 2402. Por ejemplo, el módulo de extensión de armónicos 404 puede seleccionar la primera función 164 y la segunda función 166 de la Figura 1 basándose al menos en parte en un valor del modo de configuración NL 158, como se describe con referencia a las Figuras 4 y 17.
El método 2400 incluye también generar, en el dispositivo, una señal de excitación de banda alta basándose en la pluralidad de funciones de procesamiento no lineal, en 2404. El módulo de extensión de armónicos 404 genera la señal extendida 150 basándose en la primera función 164 y la segunda función 166, como se describe con referencia a la Figura 4. Como otro ejemplo, el módulo de extensión de armónicos 404 puede generar la primera señal extendida 250 basándose en la primera función 164 y la segunda función 166, como se describe con referencia a la Figura 17.
El método 2400 permite la selección de una pluralidad de funciones no lineales basándose en un valor de un parámetro. Se puede generar una señal de excitación de banda alta, en un codificador, un decodificador o ambos, basándose en la pluralidad de funciones no lineales.
Haciendo referencia a la Figura 25, se muestra un diagrama de flujo de un aspecto de un método de generación de señal de banda alta y se designa generalmente con 2500. El método 2500 puede realizarse por uno o más componentes de los sistemas 100, 200 o 1300 de las Figuras 1,2, o 13. Por ejemplo, el método 2500 puede realizarse por el segundo dispositivo 104, el receptor 192, el generador de señal de excitación de HB 147, el módulo de decodificación 162, el segundo decodificador 136, el decodificador 118, el procesador 116 de la Figura 1, o una combinación de los mismos.
El método 2500 incluye recibir, en un dispositivo, un parámetro asociado con un flujo de audio de ancho de banda extendido, en 2502. Por ejemplo, el receptor 192 puede recibir el modo de configuración HR 366 asociado con los datos de audio 126, como se describe con referencia a las Figuras 1 y 3.
El método 2500 también incluye determinar, en el dispositivo, un valor del parámetro, en 2504. Por ejemplo, el módulo de síntesis 418 puede determinar un valor del modo de configuración de HR 366, como se describe con referencia a la Figura 4.
El método 2500 incluye además seleccionar, basándose en el valor del parámetro, una de la información de ganancia objetivo asociada con el flujo de audio con ancho de banda extendido o la información de filtro asociada con el flujo de audio con ancho de banda extendido, en 2506. Por ejemplo, cuando el valor del modo de configuración de HR 366 es 1, el módulo de síntesis 418 puede seleccionar información de ganancia objetivo, tal como uno o más de los datos de forma de ganancia 372, los datos de ganancia objetivo de HB 370, o la información de ganancia 362, como se describe con referencia a la Figura 4. Cuando el valor del modo de configuración de HR 366 es 0, el módulo de síntesis 418 puede seleccionar la información de filtro 374, como se describe con referencia a la Figura 4.
El método 2500 también incluye generar, en el dispositivo, una señal de excitación de banda alta basándose en la información de ganancia objetivo o la información de filtro, en 2508. Por ejemplo, el módulo de síntesis 418 puede generar una señal de excitación modificada basándose en la seleccionada de la información de ganancia objetivo o la información de filtro 374, como se describe con referencia a la Figura 4.
Por lo tanto, el método 2500 puede permitir la selección de información de ganancia objetivo o información de filtro basándose en un valor de un parámetro. Se puede generar una señal de excitación de banda alta, en un decodificador, basándose en la seleccionada de la información de ganancia objetivo o la información de filtro.
Haciendo referencia a la Figura 26, se representa un diagrama de bloques de un aspecto ilustrativo particular de un dispositivo (por ejemplo, un dispositivo de comunicación inalámbrica) y se designa en general 2600. En diversos aspectos, el dispositivo 2600 puede tener menos o más componentes que los ilustrados en la Figura 26. En un aspecto ilustrativo, el dispositivo 2600 puede corresponder al primer dispositivo 102 o al segundo dispositivo 104 de la Figura 1. En un aspecto ilustrativo, el dispositivo 2600 puede realizar una o más operaciones descritas con referencia a sistemas y métodos de las Figuras 1-25.
En un aspecto particular, el dispositivo 2600 incluye un procesador 2606 (por ejemplo, una unidad de procesamiento central (CPU)). El dispositivo 2600 puede incluir uno o más procesadores 2610 adicionales (por ejemplo, uno o más procesadores de señales digitales (DSP)). Los procesadores 2610 pueden incluir un codificador-decodificador (CÓDEC) 2608 de medios (por ejemplo, de voz y de música) y un cancelador de eco 2612. El CÓDEC de medios 2608 puede incluir el decodificador 118, el codificador 108 o ambos. El decodificador 118 puede incluir el primer decodificador 134, el segundo decodificador 136, el generador de señal 138 o una combinación de los mismos. El segundo decodificador 136 puede incluir el convertidor de trama TBE 156, el módulo de extensión de ancho de banda 146, el módulo de decodificación 162 o una combinación de los mismos. El módulo de decodificación 162 puede incluir el generador de señal de excitación de HB 147, el generador de señal de HB 148 o ambos. El codificador 108 puede incluir el primer codificador 204, el segundo codificador 296, el remuestreador y banco de filtros 202, o una combinación de los mismos. El segundo codificador 296 puede incluir el normalizador de energía 1306, el módulo de codificación 208, el módulo de extensión de ancho de banda de codificador 206, el módulo de configuración 1305 o una combinación de los mismos. El módulo de codificación 208 puede incluir el generador de señal de excitación de HB 1347, el generador de parámetro de flujo de bits 1348 o ambos.
Aunque se ilustra el CÓDEC de medios 2608 como un componente de los procesadores 2610 (por ejemplo, circuitería especializada y/o código de programación ejecutable), en otros aspectos, uno o más componentes del CÓDEC de medios 2608, tal como el decodificador 118, el codificador 108 o ambos, pueden incluirse en el procesador 2606, el CÓDEC 2634, otro componente de procesamiento o en una combinación de los mismos.
El dispositivo 2600 puede incluir una memoria 2632 y un CÓDEC 2634. La memoria 2632 puede corresponder a la memoria 132 de la Figura 1, la memoria 1332 de la Figura 13, o ambas. El dispositivo 2600 puede incluir un transceptor 2650 acoplado a una antena 2642. El transceptor 2650 puede incluir el receptor 192 de la Figura 1, el transmisor 1392 de la Figura 13, o ambos. El dispositivo 2600 puede incluir una pantalla 2628 acoplada a un controlador de pantalla 2626. Uno o más altavoces 2636, uno o más micrófonos 2638, o una combinación de los mismos, pueden acoplarse al CÓDEC 2634. En un aspecto particular, los altavoces 2636 pueden corresponder a los altavoces 122 de la Figura 1. Los micrófonos 2638 pueden corresponder a los micrófonos 1338 de la Figura 13. El CÓDEC 2634 puede incluir un convertidor de digital a analógico (DAC) 2602 y un convertidor de analógico a digital (ADC) 2604.
La memoria 2632 puede incluir instrucciones 2660 que pueden ejecutarse por el procesador 2606, los procesadores 2610, el CÓDEC 2634, otra unidad de procesamiento del dispositivo 2600 o una combinación de los mismos, para realizar una o más operaciones descritas con referencia a las Figuras 1-25.
Uno o más componentes del dispositivo 2600 pueden implementarse mediante hardware especializado (por ejemplo, circuitería), por un procesador que ejecuta instrucciones para realizar una o más tareas o una combinación de los mismos. Como un ejemplo, la memoria 2632 o uno o más componentes del procesador 2606, los procesadores 2610 y/o el CÓDEC 2634 pueden ser un dispositivo de memoria, tal como una memoria de acceso aleatorio (RAM), memoria de acceso aleatorio magnetorresistiva (MRAM), MRAM de transferencia de par de giro (STT-MRAM), memoria flash, memoria de solo lectura (ROM), memoria de solo lectura programable (PROM), memoria de solo lectura programable y borrable (EPROM), memoria de solo lectura programable y borrable eléctricamente (EEPROM), registros, disco duro, un disco extraíble o un disco compacto de memoria de sólo lectura (CD-ROM). El dispositivo de memoria puede incluir instrucciones (por ejemplo, las instrucciones 2660) que, cuando son ejecutadas por un ordenador (por ejemplo, un procesador en el CÓDEC 2634, el procesador 2606 y/o los procesadores 2610), pueden hacer que el ordenador realice una o más operaciones descritas con referencia a las figuras 1-25. Como un ejemplo, la memoria 2632 o el uno o más componentes del procesador 2606, los procesadores 2610, el CÓDEC 2634 pueden ser un medio legible por ordenador no transitorio que incluye instrucciones (por ejemplo, las instrucciones 2660) que, cuando son ejecutadas por un ordenador (por ejemplo, un procesador en el CÓDEC 2634, el procesador 2606 y/o los procesadores 2610), hacen que el ordenador realice una o más operaciones descritas con referencia a las Figuras 1-25.
En un aspecto particular, el dispositivo 2600 puede estar incluido en un sistema en paquete o en un dispositivo de sistema en chip (por ejemplo, un módem de estación móvil (MSM)) 2622. En un aspecto particular, el procesador 2606, los procesadores 2610, el controlador de pantalla 2626, la memoria 2632, el CÓDEC 2634 y el transceptor 2650 están incluidos en un sistema en paquete o en el dispositivo de sistema en chip 2622. En un aspecto particular, un dispositivo de entrada 2630, tal como una pantalla táctil y/o teclado numérico y una fuente de alimentación 2644 se acoplan al dispositivo de sistema en chip 2622. Además, en un aspecto particular, como se ilustra en la Figura 26, la pantalla 2628, el dispositivo de entrada 2630, los altavoces 2636, los micrófonos 2638, la antena 2642 y la fuente de alimentación 2644 son externos al dispositivo de sistema en chip 2622. Sin embargo, cada uno de la pantalla 2628, el dispositivo de entrada 2630, los altavoces 2636, los micrófonos 2638, la antena 2642 y la fuente de alimentación 2644 pueden acoplarse a un componente del dispositivo de sistema en chip 2622, tal como una interfaz o un controlador.
El dispositivo 2600 puede incluir un teléfono inalámbrico, un dispositivo de comunicación móvil, un teléfono inteligente, un teléfono celular, un ordenador portátil, un ordenador de sobremesa, un ordenador, un ordenador de tableta, un decodificador de salón, un asistente digital personal, un dispositivo de visualización, una televisión, una consola de juegos, un reproductor de música, una radio, un reproductor de vídeo, una unidad de entretenimiento, un dispositivo de comunicación, una unidad de datos de ubicación fija, un reproductor de medios personal, un reproductor de vídeo digital, un reproductor de disco de vídeo digital (DVD), un sintonizador, una cámara, un dispositivo de navegación, un sistema de decodificador, un sistema de codificador, un dispositivo de reproducción de medios, un dispositivo de difusión de medios o cualquier combinación de los mismos.
En un aspecto particular, uno o más componentes de los sistemas descritos con referencia a las Figuras 1-25 y el dispositivo 2600 pueden estar integrados en un sistema o aparato de decodificación (por ejemplo, un dispositivo electrónico, un CÓDEC o un procesador en el mismo), en un sistema o aparato de codificación o ambos. En otros aspectos, uno o más componentes de los sistemas descritos con referencia a las Figuras 1-25 y el dispositivo 2600 pueden integrarse en un teléfono inalámbrico, un ordenador de tableta, un ordenador de sobremesa, un ordenador portátil, un decodificador de salón, un reproductor de música, un reproductor de vídeo, una unidad de entretenimiento, una televisión, una consola de juegos, un dispositivo de navegación, un dispositivo de comunicaciones, un asistente digital personal (PDA), una unidad datos de ubicación fija, un reproductor de medios personal u otro tipo de dispositivo.
Debería observarse que diversas funciones realizadas por el uno o más componentes de los sistemas descritos con referencia a las Figuras 1-25 y el dispositivo 2600 se describen como que se realizan por ciertos componentes o módulos. Esta división de componentes y módulos es para ilustración únicamente. En un aspecto alternativo, una función realizada por un componente o módulo particular puede dividirse entre múltiples componentes o módulos. Además, en un aspecto alternativo, dos o más componentes o módulos descritos con referencia a las Figuras 1-26 pueden integrarse en un único componente o módulo. Cada componente o módulo ilustrado en las Figuras 1-26 puede implementarse usando hardware (por ejemplo, un dispositivo de campo de matriz de puertas programables (FPGA), un circuito integrado específico de la aplicación (ASIC), un DSP, un controlador, etc.), software (por ejemplo, instrucciones ejecutables por un procesador), o cualquier combinación de los mismos.
Junto con los aspectos descritos, se divulga un aparato que incluye medios para almacenar un parámetro asociado con un flujo de audio con ancho de banda extendido. Por ejemplo, los medios para almacenar pueden incluir el segundo dispositivo 104, la memoria 132 de la Figura 1, el almacenamiento de medios 292 de la Figura 2, la memoria 2632 de la Figura 25, uno o más dispositivos configurados para almacenar un parámetro, o una combinación de los mismos.
El aparato también incluye medios para generar una señal de excitación de banda alta basándose en una pluralidad de funciones de procesamiento no lineal. Por ejemplo, los medios para generar pueden incluir el primer dispositivo 102, el procesador 106, el codificador 108, el segundo dispositivo 104, el procesador 116, el decodificador 118, el segundo decodificador 136, el módulo de decodificación 162 de la Figura 1, el segundo codificador 296, el módulo de codificación 208, el módulo de extensión de ancho de banda de codificador 206 de la Figura 2, el sistema 400, el módulo de extensión de armónicos 404 de la Figura 4, los procesadores 2610, el códec de medios 2608, el dispositivo 2600 de la Figura 25, uno o más dispositivos configurados para generar una señal de excitación de banda alta basándose en una pluralidad de funciones de procesamiento no lineal (por ejemplo, un procesador que ejecuta instrucciones almacenadas en un dispositivo de almacenamiento legible por ordenador), o una combinación de los mismos. La pluralidad de funciones de procesamiento no lineal se selecciona basándose al menos en parte en un valor del parámetro.
Además, junto con los aspectos descritos, se divulga un aparato que incluye medios para recibir un parámetro asociado con un flujo de audio con ancho de banda extendido. Por ejemplo, los medios para recibir pueden incluir el receptor 192 de la Figura 1, el transceptor 2695 de la Figura 25, uno o más dispositivos configurados para recibir un parámetro asociado con un flujo de audio con ancho de banda extendido, o una combinación de los mismos.
El aparato también incluye medios para generar una señal de excitación de banda alta basada en una de información de ganancia objetivo asociada con el flujo de audio con ancho de banda extendido o información de filtro asociada con el flujo de audio con ancho de banda extendido. Por ejemplo, los medios para generar pueden incluir el generador de señal de excitación de HB 147, el módulo de decodificación 162, el segundo decodificador 136, el decodificador 118, el procesador 116, el segundo dispositivo 104 de la Figura 1, el módulo de síntesis 418 de la Figura 4, los procesadores 2610, el códec multimedia 2608, el dispositivo 2600 de la Figura 25, uno o más dispositivos configurados para generar una señal de excitación de banda alta, o una combinación de los mismos. Una de la información de ganancia objetivo o la información de filtro se pueden seleccionar basándose en un valor del parámetro.
Además, junto con los aspectos descritos, se divulga un aparato que incluye medios para generar un parámetro de modelado de señal basándose en un indicador de armonicidad, un indicador de pico o ambos. Por ejemplo, los medios para generar pueden incluir el primer dispositivo 102, el procesador 106, el codificador 108 de la Figura 1, el segundo codificador 296, el módulo de codificación 208 de la Figura 2, el módulo de configuración 1305, el normalizador de energía 1306, el generador de parámetro de flujo de bits 1348 de la Figura 13, uno o más dispositivos configurados para generar un parámetro de modelado de señal basándose en el indicador de armonicidad, el indicador de pico o ambos (por ejemplo, un procesador que ejecuta instrucciones almacenadas en un dispositivo de almacenamiento legible por ordenador), o una combinación de los mismos. El parámetro de modelado de señal puede estar asociado con una porción de banda alta de una señal de audio.
El aparato también incluye medios para transmitir el parámetro de modelado de señal junto con un flujo de audio con ancho de banda extendido correspondiente a la señal de audio. Por ejemplo, los medios para transmitir pueden incluir el transmisor 1392 de la Figura 13, el transceptor 2695 de la Figura 25, uno o más dispositivos configurados para transmitir el parámetro de modelado de señal, o una combinación de los mismos.
Además, junto con los aspectos descritos, se divulga un aparato que incluye medios para seleccionar un filtro basándose en una comparación de una señal de excitación de banda alta modelada y una señal de excitación de banda alta. Por ejemplo, los medios para seleccionar pueden incluir el primer dispositivo 102, el procesador 106, el codificador 108 de la Figura 1, el segundo codificador 296, el módulo de codificación 208 de la Figura 2, el normalizador de energía 1306 de la Figura 13, el estimador de filtro 1902 de la Figura 19, uno o más dispositivos configurados para seleccionar el filtro (por ejemplo, un procesador que ejecuta instrucciones almacenadas en un dispositivo de almacenamiento legible por ordenador), o una combinación de los mismos. La señal de excitación de banda alta puede basarse en una porción de banda alta de una señal de audio. La señal de excitación de banda alta modelada puede basarse en una porción de banda baja de la señal de audio.
El aparato también incluye medios para transmitir información de filtro correspondiente al filtro junto con un flujo de audio con ancho de banda extendido correspondiente a la señal de audio. Por ejemplo, los medios para transmitir pueden incluir el transmisor 1392 de la Figura 13, el transceptor 2695 de la Figura 25, uno o más dispositivos configurados para transmitir el parámetro de modelado de señal, o una combinación de los mismos.
Además, junto con los aspectos descritos, un aparato incluye medios para cuantificar coeficientes de filtro que se generan basándose en una comparación de una señal de excitación de banda alta modelada y una señal de excitación de banda alta. Por ejemplo, los medios para cuantificar coeficientes de filtro pueden incluir el primer dispositivo 102, el procesador 106, el codificador 108 de la Figura 1, el segundo codificador 296, el módulo de codificación 208 de la Figura 2, el normalizador de energía 1306 de la Figura 13, el aplicador de filtro 1912, el cuantificador 1918 de la Figura 19, uno o más dispositivos configurados para cuantificar coeficientes de filtro (por ejemplo, un procesador que ejecuta instrucciones almacenadas en un dispositivo de almacenamiento legible por ordenador), o una combinación de los mismos. La señal de excitación de banda alta puede basarse en una porción de banda alta de una señal de audio. La señal de excitación de banda alta modelada puede basarse en una porción de banda baja de la señal de audio.
El aparato también incluye medios para transmitir información de filtro junto con un flujo de audio con ancho de banda extendido correspondiente a la señal de audio. Por ejemplo, los medios para transmitir pueden incluir el transmisor 1392 de la Figura 13, el transceptor 2695 de la Figura 25, uno o más dispositivos configurados para transmitir el parámetro de modelado de señal, o una combinación de los mismos. La información del filtro puede basarse en los coeficientes de filtro cuantificados.
Haciendo referencia a la Figura 27, se representa un diagrama de bloques de un ejemplo ilustrativo particular de una estación base 2700. En diversas implementaciones, la estación base 2700 puede tener más componentes o menos componentes que los ilustrados en la Figura 27. En un ejemplo ilustrativo, la estación base 2700 puede incluir el primer dispositivo 102, el segundo dispositivo 104 de la Figura 1, o ambos. En un ejemplo ilustrativo, la estación base 2700 puede realizar una o más operaciones descritas con referencia a las Figuras 1-26.
La estación base 2700 puede ser parte de un sistema de comunicación inalámbrica. El sistema de comunicación inalámbrica puede incluir múltiples estaciones base y múltiples dispositivos inalámbricos. El sistema de comunicación inalámbrica puede ser un sistema de la Evolución a Largo Plazo (LTE), un sistema de Acceso Múltiple por División de Código (CDMA), un sistema del Sistema Global para Comunicaciones Móviles (GSM), un sistema de red de área local inalámbrica (WLAN) o algún otro sistema inalámbrico. Un sistema de CDMA puede implementar CDMA de banda ancha (WCDMA), CDMA 1X, Datos de Evolución Optimizados (EVDO), CDMA Síncrona de División en el Tiempo (TD-SCDMA) o alguna otra versión de CDMA.
Los dispositivos inalámbricos pueden denominarse también como un equipo de usuario (UE), una estación móvil, un terminal, un terminal de acceso, una unidad de abonado, una estación, etc. Los dispositivos inalámbricos pueden incluir un teléfono celular, un teléfono inteligente, una tableta, un módem inalámbrico, un asistente digital personal (PDA), un dispositivo portátil, un ordenador portátil, un libro inteligente, un portátil, una tableta, un teléfono inalámbrico, una estación de bucle local inalámbrico (w Ll ), un dispositivo de Bluetooth, etc. Los dispositivos inalámbricos pueden incluir o corresponder al dispositivo 2600 de la Figura 26.
Pueden realizarse diversas funciones por uno o más componentes de la estación base 2700 (y/o en otros componentes no mostrados), tal como enviar y recibir mensajes y datos (por ejemplo, datos de audio). En un ejemplo particular, la estación base 2700 incluye un procesador 2706 (por ejemplo, una CPU). El procesador 2706 puede corresponder al procesador 106, al procesador 116 de la Figura 1, o a ambos. La estación base 2700 puede incluir un transcodificador 2710. El transcodificador 2710 puede incluir un CÓDEC de audio 2708. Por ejemplo, el transcodificador 2710 puede incluir uno o más componentes (por ejemplo, circuitería) configurados para realizar operaciones del CÓDEC de audio 2708. Como otro ejemplo, el transcodificador 2710 puede configurarse para ejecutar una o más instrucciones legibles por ordenador para realizar las operaciones del CÓDEC de audio 2708. Aunque el CÓDEC de audio 2708 se ilustra como un componente del transcodificador 2710, en otros ejemplos pueden incluirse uno o más componentes del códec de audio 2708 en el procesador 2706, otro componente de procesamiento o una combinación de los mismos. Por ejemplo, se puede incluir un decodificador de codificador de voz 2738 en un procesador de datos de receptor 2764. Como otro ejemplo, se puede incluir un codificador de codificador de voz 2736 en un procesador de datos de transmisión 2766.
El transcodificador 2710 puede funcionar para transcodificar mensajes y datos entre dos o más redes. El transcodificador 2710 puede configurarse para convertir mensajes y datos de audio de un primer formato (por ejemplo, un formato digital) a un segundo formato. Para ilustrar, el decodificador de codificador de voz 2738 puede decodificar señales codificadas que tienen un primer formato y el codificador de codificador de voz 2736 puede codificar las señales decodificadas en señales codificadas que tienen un segundo formato. Adicionalmente, o como alternativa, el transcodificador 2710 puede configurarse para realizar adaptación de tasa de datos. Por ejemplo, el transcodificador 2710 puede convertir de manera descendente una tasa de datos o convertir de manera ascendente la tasa de datos sin cambiar un formato de los datos de audio. Para ilustrar, el transcodificador 2710 puede convertir de manera descendente señales de 64 kbit/s en señales de 16 kbit/s.
El CÓDEC de audio 2708 puede incluir el codificador de codificador de voz 2736 y el decodificador de codificador de voz 2738. El codificador de codificador de voz 2736 puede incluir un selector de codificador, un codificador de voz y un codificador que no es de voz. El codificador de codificador de voz 2736 puede incluir el codificador 108. El decodificador de codificador de voz 2738 puede incluir un selector de decodificador, un decodificador de voz y un decodificador que no es de voz. El decodificador de codificador de voz 2738 puede incluir el decodificador 118.
La estación base 2700 puede incluir una memoria 2732. La memoria 2732, tal como un dispositivo de almacenamiento legible por ordenador, puede incluir instrucciones. Las instrucciones pueden incluir una o más instrucciones que son ejecutables por el procesador 2706, el transcodificador 2710 o una combinación de los mismos, para realizar una o más operaciones descritas con referencia a las Figuras 1-26. La estación base 2700 puede incluir múltiples transmisores y receptores (por ejemplo, transceptores), tal como un primer transceptor 2752 y un segundo transceptor 2754, acoplados a una serie de antenas. La serie de antenas puede incluir una primera antena 2742 y una segunda antena 2744. La serie de antenas puede estar configurada para comunicarse inalámbricamente con uno o más dispositivos inalámbricos, tal como el dispositivo 2600 de la Figura 26. Por ejemplo, la segunda antena 2744 puede recibir un flujo de datos 2714 (por ejemplo, un flujo de bits) de un dispositivo inalámbrico. El flujo de datos 2714 puede incluir mensajes, datos (por ejemplo, datos de voz codificados) o una combinación de los mismos.
La estación base 2700 puede incluir una conexión de red 2760, tal como una conexión de enlace de retroceso. La conexión de red 2760 puede configurase para comunicarse con una red principal o una o más estaciones base de la red de comunicación inalámbrica. Por ejemplo, la estación base 2700 puede recibir un segundo flujo de datos (por ejemplo, mensajes o datos de audio) de una red principal mediante la conexión de red 2760. La estación base 2700 puede procesar el segundo flujo de datos para generar mensajes o datos de audio y proporcionar los mensajes o los datos de audio a uno o más dispositivos inalámbricos mediante una o más antenas de la serie de antenas o a otra estación base mediante la conexión de red 2760. En una implementación particular, la conexión de red 2760 puede ser una conexión de red de área extensa (WAN), como un ejemplo ilustrativo no limitante.
La estación base 2700 puede incluir un demodulador 2762 que está acoplado a los transceptores 2752, 2754, al procesador 2764 de datos de receptor y al procesador 2706, y el procesador de datos de receptor 2764 puede acoplarse al procesador 2706. El demodulador 2762 puede estar configurado para demodular señales moduladas recibidas de los transceptores 2752, 2754 y para proporcionar datos demodulados al procesador de datos de receptor 2764. El procesador de datos de receptor 2764 puede estar configurado para extraer un mensaje o datos de audio de los datos demodulados y enviar el mensaje o los datos de audio al procesador 2706.
La estación base 2700 puede incluir un procesador de datos de transmisión 2766 y un procesador de múltiple entradamúltiple salida (MIMO) de transmisión 2768. El procesador de datos de transmisión 2766 puede estar acoplado al procesador 2706 y al procesador de MIMO de transmisión 2768. El procesador de MIMO de transmisión 2768 puede estar acoplado a los transceptores 2752, 2754 y al procesador 2706. El procesador de datos de transmisión 2766 puede estar configurado para recibir los mensajes o los datos de audio desde el procesador 2706 y para codificar los mensajes o los datos de audio basándose en un esquema de codificación, tal como CDMA o multiplexación por división de frecuencia ortogonal (OFDM), como un ejemplo ilustrativo y no limitante. El procesador de datos de transmisión 2766 puede proporcionar los datos codificados al procesador de MIMO de transmisión 2768.
Los datos codificados se pueden multiplexar con otros datos, tales como datos de piloto, usando técnicas de CDMA o de OFDM para generar datos multiplexados. A continuación, los datos multiplexados pueden modularse (es decir, mapearse en símbolos) por el procesador de datos de transmisión 2766 basándose en un esquema de modulación particular (por ejemplo, codificación por desplazamiento de fase binaria ("BPSK"), modulación por desplazamiento de fase cuaternaria ("QSPK"), codificación por desplazamiento de fase M-aria ("M-PSK"), modulación por amplitud en cuadratura M-aria ("M-QAM"), etc.) para generar símbolos de modulación. En una implementación particular, los datos codificados y otros datos se pueden modular usando diferentes esquemas de modulación. La tasa de datos, la codificación y la modulación para cada flujo de datos se puede determinar mediante instrucciones ejecutadas por el procesador 2706.
El procesador de MIMO de transmisión 2768 se puede configurar para recibir los símbolos de modulación desde el procesador de datos de transmisión 2766 y puede procesar además los símbolos de modulación y puede realizar una formación de haces sobre los datos. Por ejemplo, el procesador de MIMO de transmisión 2768 puede aplicar pesos de formación de haces a los símbolos de modulación. Los pesos de formación de haces pueden corresponder a una o más antenas de la serie de antenas desde las que se transmiten los símbolos de modulación.
Durante la operación, la segunda antena 2744 de la estación 2700 base puede recibir un flujo de datos 2714. El segundo transceptor 2754 puede recibir el flujo de datos 2714 desde la segunda antena 2744 y puede proporcionar el flujo de datos 2714 al demodulador 2762. El demodulador 2762 puede demodular señales moduladas del flujo de datos 2714 y proporcionar datos demodulados al procesador de datos de receptor 2764. El procesador de datos de receptor 2764 puede extraer datos de audio de los datos demodulados y proporcionar los datos de audio extraídos al procesador 2706. En un aspecto particular, el flujo de datos 2714 puede corresponder a los datos de audio 126.
El procesador 2706 puede proporcionar los datos de audio al transcodificador 2710 para transcodificación. El decodificador de codificador de voz 2738 del transcodificador 2710 puede decodificar los datos de audio de un primer formato en datos de audio decodificados y el codificador de codificador de voz 2736 puede codificar los datos de audio decodificados en un segundo formato. En algunas implementaciones, el codificador de codificador de voz 2736 puede codificar los datos de audio usando una tasa de datos superior (por ejemplo, convirtiendo de manera ascendente) o una tasa de datos inferior (por ejemplo, convirtiendo de manera descendente) que la recibida desde el dispositivo inalámbrico. En otras implementaciones, los datos de audio pueden no transcodificarse. Aunque se ilustra la transcodificación (por ejemplo, decodificación y codificación) como realizándose por un transcodificador 2710, las operaciones de transcodificación (por ejemplo, decodificación y codificación) pueden realizarse por múltiples componentes de la estación base 2700. Por ejemplo, la decodificación puede realizarse por el procesador de datos de receptor 2764 y la codificación puede realizarse por el procesador de datos de transmisión 2766.
El decodificador de codificador de voz 2738 y el codificador de codificador de voz 2736 pueden seleccionar un decodificador correspondiente (por ejemplo, un decodificador de voz o un decodificador que no es de voz) y un codificador correspondiente para transcodificar (por ejemplo, decodificar y codificar) la trama. Los datos de audio codificados generados en el codificador de codificador de voz 2736, tal como los datos transcodificados, pueden proporcionarse al procesador de datos de transmisión 2766 o a la conexión de red 2760 mediante el procesador 2706.
Los datos de audio transcodificados del transcodificador 2710 pueden proporcionarse al procesador de datos de transmisión 2766 para codificación de acuerdo con un esquema de modulación, tal como OFDM, para generar los símbolos de modulación. El procesador de datos de transmisión 2766 puede proporcionar los símbolos de modulación al procesador de MIMO de transmisión 2768 para su procesamiento y formación de haces adicional. El procesador de MIMO de transmisión 2768 puede aplicar pesos de formación de haces y puede proporcionar los símbolos de modulación a una o más antenas de la serie de antenas, tal como la primera antena 2742 mediante el primer transceptor 2752. Por lo tanto, la estación base 2700 puede proporcionar un flujo de datos transcodificado 2716, que corresponde al flujo de datos 2714 recibido del dispositivo inalámbrico, a otro dispositivo inalámbrico. El flujo de datos transcodificado 2716 puede tener un formato de codificación diferente, tasa de datos diferente o ambos, que el flujo de datos 2714. En otras implementaciones, el flujo de datos transcodificado 2716 puede proporcionarse a la conexión de red 2760 para su transmisión a otra estación base o a una red principal.
Por lo tanto, la estación base 2700 puede incluir un dispositivo de almacenamiento legible por ordenador (por ejemplo, la memoria 2732) que almacena instrucciones que, cuando son ejecutadas por un procesador (por ejemplo, el procesador 2706 o el transcodificador 2710), hacen que el procesador realice operaciones que incluyen seleccionar una pluralidad de funciones de procesamiento no lineal basándose al menos en parte en un valor de un parámetro. El parámetro está asociado con un envío por flujo continuo de audio con ancho de banda extendido. Las operaciones también incluyen generar una señal de excitación de banda alta basándose en la pluralidad de funciones de procesamiento no lineal.
En un aspecto particular, la estación base 2700 puede incluir un dispositivo de almacenamiento legible por ordenador (por ejemplo, la memoria 2732) que almacena instrucciones que, cuando son ejecutadas por un procesador (por ejemplo, el procesador 2706 o el transcodificador 2710), hacen que el procesador realice operaciones que incluyen la recepción de un parámetro asociado con un envío por flujo continuo de audio con ancho de banda extendido. Las operaciones también incluyen determinar un valor del parámetro. Las operaciones incluyen además seleccionar, basándose en el valor del parámetro, una de la información de ganancia objetivo asociada con el flujo de audio con ancho de banda extendido o la información de filtro asociada con el flujo de audio con ancho de banda extendido. Las operaciones también incluyen generar una señal de excitación de banda alta basándose en una de la información de ganancia objetivo o la información de filtro.
Los expertos en la materia apreciarían que los diversos bloques lógicos ilustrativos, configuraciones, módulos, circuitos y etapas de algoritmo descritos en relación con los aspectos desvelados en el presente documento pueden implementarse como hardware electrónico, software informático ejecutado por un dispositivo de procesamiento, tal como un procesador de hardware o combinaciones de ambos. Se han descrito anteriormente diversos componentes, bloques, configuraciones, módulos, circuitos y etapas ilustrativos en general en términos de su funcionalidad. Que tal funcionalidad se implemente como hardware o software ejecutable depende de la aplicación particular y de restricciones de diseño impuestas al sistema general. Los expertos pueden implementar la funcionalidad descrita de diversas formas para cada aplicación particular, pero tales decisiones de implementación no deberían interpretarse como que provocan una desviación del alcance de las reivindicaciones.
Las etapas de un método o algoritmo descritas en conexión con los aspectos divulgados en el presente documento pueden incorporarse directamente en hardware, en un módulo de software ejecutado por un procesador o en una combinación de los dos. Un módulo de software puede residir en un dispositivo de memoria, tal como memoria de acceso aleatorio (RAM), memoria de acceso aleatorio magnetorresistiva (MRAM), MRAM de transferencia de par de giro (STT-MRAM), memoria flash, memoria de solo lectura (ROM), memoria de solo lectura programable (PROM), memoria de solo lectura programable y borrable (EPROM), memoria de solo lectura programable y borrable eléctricamente (EEPROM), registros, disco duro, un disco extraíble o un disco compacto de memoria de solo lectura (CD-ROM). Un dispositivo de memoria ilustrativo está acoplado al procesador de tal modo que el procesador puede leer información desde, y escribir información en, el dispositivo de memoria. Como alternativa, el dispositivo de memoria puede ser una parte integrante del procesador. El procesador y el medio de almacenamiento pueden residir en un circuito integrado específico de la aplicación (ASIC). El ASIC puede residir en un dispositivo informático o en un terminal de usuario. Como alternativa, el procesador y el medio de almacenamiento pueden residir como componentes discretos en un dispositivo informático o un terminal de usuario.
La descripción anterior de los aspectos desvelados se proporciona para posibilitar a un experto en la materia hacer o usar los aspectos desvelados. Diversas modificaciones a estos aspectos como será fácilmente evidente para los expertos en la materia, y los principios definidos en el presente documento pueden aplicarse a otros aspectos sin alejarse del alcance de las reivindicaciones. Por lo tanto, la presente divulgación no pretende limitarse a los aspectos mostrados en el presente documento, sino que debe concedérsele el alcance más amplio, según se define en las reivindicaciones siguientes.

Claims (12)

REIVINDICACIONES
1. Un dispositivo para procesamiento de señales que comprende:
un receptor (192) configurado para recibir un parámetro (158) asociado con una señal de audio codificada; y un procesador (116) configurado para:
generar una señal remuestreada basándose en una señal de excitación de banda baja;
seleccionar una pluralidad de funciones de procesamiento no lineal basándose al menos en parte en un valor del parámetro en donde la pluralidad de funciones de procesamiento no lineal comprende una primera función (164) y una segunda función (166), en donde la primera función es diferente de la segunda función; generar una primera señal de excitación basándose en la primera función de procesamiento no lineal aplicando la primera función (164) a una señal remuestreada (406);
generar una segunda señal de excitación basándose en la segunda función de procesamiento no lineal aplicando la segunda función (166) a la señal remuestreada (406); y
generar una señal de excitación de banda alta (150) basándose en la primera señal de excitación y la segunda señal de excitación en donde la primera señal de excitación corresponde a un primer subintervalo de frecuencia de banda alta que está entre aproximadamente 8 kilohercios y 12 kilohercios, y en donde la segunda señal de excitación corresponde a un segundo subintervalo de frecuencia de banda alta que está entre aproximadamente 12 kilohercios y 16 kilohercios.
2. El dispositivo de la reivindicación 1, en donde el procesador está configurado además para:
generar una primera señal filtrada aplicando un filtro de paso bajo a la primera señal de excitación; y generar una segunda señal filtrada aplicando un filtro de paso alto a la segunda señal de excitación, en donde la señal de excitación de banda alta se genera combinando la primera señal filtrada y la segunda señal filtrada.
3. El dispositivo de la reivindicación 2, en donde la primera función incluye una función cuadrada, y en donde la segunda función incluye una función de valor absoluto.
4. El dispositivo de la reivindicación 1, en donde el parámetro incluye un modo de configuración no lineal o que comprende además un receptor configurado para recibir el parámetro desde un codificador.
5. El dispositivo de la reivindicación 1, en donde la pluralidad de funciones de procesamiento no lineal incluye una función de valor absoluto y una función cuadrada, y en donde el procesador está configurado para:
seleccionar la función de valor absoluto en respuesta a determinar que el parámetro tiene un primer valor, y seleccionar una función cuadrada o la pluralidad de funciones de procesamiento no lineal en respuesta a determinar que el parámetro tiene un segundo valor.
6. Un método de procesamiento de señales que comprende:
recibir un parámetro (158) asociado con una señal de audio codificada; y
generar una señal remuestreada basándose en una señal de excitación de banda baja; estando el método caracterizado además por comprender:
seleccionar una pluralidad de funciones de procesamiento no lineal basándose al menos en parte en un valor del parámetro en donde la pluralidad de funciones de procesamiento no lineal comprende una primera función (164) y una segunda función (166), en donde la primera función es diferente de la segunda función; generar una primera señal de excitación basándose en la primera función de procesamiento no lineal aplicando la primera función (164) a una señal remuestreada (406);
generar una segunda señal de excitación basándose en la segunda función de procesamiento no lineal aplicando la segunda función (166) a la señal remuestreada (406); y
generar una señal de excitación de banda alta (150) basándose en la primera señal de excitación y la segunda señal de excitación en donde la primera señal de excitación corresponde a un primer subintervalo de frecuencia de banda alta que está entre aproximadamente 8 kilohercios y 12 kilohercios, y en donde la segunda señal de excitación corresponde a un segundo subintervalo de frecuencia de banda alta que está entre aproximadamente 12 kilohercios y 16 kilohercios.
7. El método de la reivindicación 6 realizado en un dispositivo en donde el dispositivo comprende un dispositivo de comunicación móvil.
8. El método de la reivindicación 6, que comprende, además:
generar una primera señal filtrada aplicando un filtro de paso bajo a la primera señal de excitación; y
generar una segunda señal filtrada aplicando un filtro de paso alto a la segunda señal de excitación, en donde la señal de excitación de banda alta se genera combinando la primera señal filtrada y la segunda señal filtrada.
9. El método de la reivindicación 6, en donde la primera función incluye una función cuadrada, y en donde la segunda función incluye una función de valor absoluto.
10. El método de la reivindicación 6, en donde el parámetro incluye un modo de configuración no lineal o que comprende además recibir el parámetro desde un codificador.
11. El método de la reivindicación 6, en donde la pluralidad de funciones de procesamiento no lineal incluye una función de valor absoluto y una función cuadrada, y que comprende, además:
seleccionar la función de valor absoluto en respuesta a determinar que el parámetro tiene un primer valor, y seleccionar una función cuadrada o la pluralidad de funciones de procesamiento no lineal en respuesta a determinar que el parámetro tiene un segundo valor.
12. Un dispositivo de almacenamiento legible por ordenador que almacena instrucciones que, cuando son ejecutadas por un procesador, hacen que el procesador ejecute el método de una cualquiera de las reivindicaciones 6 a 11.
ES16732032T 2015-06-18 2016-05-26 Generación de señal de banda alta Active ES2955855T3 (es)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201562181702P 2015-06-18 2015-06-18
US201562241065P 2015-10-13 2015-10-13
US15/164,583 US10847170B2 (en) 2015-06-18 2016-05-25 Device and method for generating a high-band signal from non-linearly processed sub-ranges
PCT/US2016/034444 WO2016204955A1 (en) 2015-06-18 2016-05-26 High-band signal generation

Publications (1)

Publication Number Publication Date
ES2955855T3 true ES2955855T3 (es) 2023-12-07

Family

ID=56203915

Family Applications (1)

Application Number Title Priority Date Filing Date
ES16732032T Active ES2955855T3 (es) 2015-06-18 2016-05-26 Generación de señal de banda alta

Country Status (22)

Country Link
US (4) US10847170B2 (es)
EP (1) EP3311382B1 (es)
JP (1) JP6710706B2 (es)
KR (2) KR102754976B1 (es)
CN (1) CN107743644B (es)
AU (1) AU2016280531B2 (es)
BR (1) BR112017027294B1 (es)
CA (1) CA2986430C (es)
CL (1) CL2017003158A1 (es)
CO (1) CO2017012863A2 (es)
ES (1) ES2955855T3 (es)
MX (1) MX381646B (es)
MY (1) MY190143A (es)
NZ (1) NZ737169A (es)
PH (1) PH12017502191A1 (es)
PL (1) PL3311382T3 (es)
RU (1) RU2742296C2 (es)
SA (1) SA517390518B1 (es)
SG (1) SG10201912525UA (es)
TW (1) TWI677866B (es)
WO (1) WO2016204955A1 (es)
ZA (1) ZA201708558B (es)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9837089B2 (en) 2015-06-18 2017-12-05 Qualcomm Incorporated High-band signal generation
US10847170B2 (en) * 2015-06-18 2020-11-24 Qualcomm Incorporated Device and method for generating a high-band signal from non-linearly processed sub-ranges
WO2019091576A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
EP3483883A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding and decoding with selective postfiltering
EP3483878A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder supporting a set of different loss concealment tools
EP3483886A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Selecting pitch lag
EP3483882A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Controlling bandwidth in encoders and/or decoders
EP3483880A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Temporal noise shaping
EP3483879A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analysis/synthesis windowing function for modulated lapped transformation
EP3483884A1 (en) * 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Signal filtering
WO2019091573A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters
DK3570598T3 (da) 2018-01-19 2021-05-10 Guangdong Oppo Mobile Telecommunications Corp Ltd Effektstyringsproces, terminalanordning og netværksanordning
KR102271357B1 (ko) * 2019-06-28 2021-07-01 국방과학연구소 보코더 유형 판별 방법 및 장치
JP7710054B2 (ja) * 2021-06-29 2025-07-17 テレフオンアクチーボラゲット エルエム エリクソン(パブル) オーディオ符号化モード選択のためのスペクトル分類器

Family Cites Families (96)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3438015A (en) 1965-08-16 1969-04-08 Bunker Ramo Content addressable memories
JPS60239800A (ja) 1984-05-14 1985-11-28 日本電気株式会社 残差励振型ボコ−ダ
US4797926A (en) 1986-09-11 1989-01-10 American Telephone And Telegraph Company, At&T Bell Laboratories Digital speech vocoder
EP0422232B1 (en) 1989-04-25 1996-11-13 Kabushiki Kaisha Toshiba Voice encoder
US5455888A (en) 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
JP3189614B2 (ja) 1995-03-13 2001-07-16 松下電器産業株式会社 音声帯域拡大装置
US6047254A (en) 1996-05-15 2000-04-04 Advanced Micro Devices, Inc. System and method for determining a first formant analysis filter and prefiltering a speech signal for improved pitch estimation
SE9700772D0 (sv) 1997-03-03 1997-03-03 Ericsson Telefon Ab L M A high resolution post processing method for a speech decoder
EP0878790A1 (en) 1997-05-15 1998-11-18 Hewlett-Packard Company Voice coding system and method
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
JP3134817B2 (ja) 1997-07-11 2001-02-13 日本電気株式会社 音声符号化復号装置
US6233550B1 (en) 1997-08-29 2001-05-15 The Regents Of The University Of California Method and apparatus for hybrid coding of speech at 4kbps
EP1002237B1 (en) 1998-06-09 2011-08-10 Panasonic Corporation Speech coding and speech decoding
CA2252170A1 (en) 1998-10-27 2000-04-27 Bruno Bessette A method and device for high quality coding of wideband speech and audio signals
DE60035453T2 (de) 1999-05-11 2008-03-20 Nippon Telegraph And Telephone Corp. Auswahl des Synthesefilters für eine CELP Kodierung von breitbandigen Audiosignalen
US6226616B1 (en) 1999-06-21 2001-05-01 Digital Theater Systems, Inc. Sound quality of established low bit-rate audio coding systems without loss of decoder compatibility
EP1132892B1 (en) 1999-08-23 2011-07-27 Panasonic Corporation Speech encoding and decoding system
CA2290037A1 (en) 1999-11-18 2001-05-18 Voiceage Corporation Gain-smoothing amplifier device and method in codecs for wideband speech and audio signals
US7260523B2 (en) 1999-12-21 2007-08-21 Texas Instruments Incorporated Sub-band speech coding system
US6704711B2 (en) 2000-01-28 2004-03-09 Telefonaktiebolaget Lm Ericsson (Publ) System and method for modifying speech signals
US7330814B2 (en) * 2000-05-22 2008-02-12 Texas Instruments Incorporated Wideband speech coding with modulated noise highband excitation system and method
EP1199711A1 (en) 2000-10-20 2002-04-24 Telefonaktiebolaget Lm Ericsson Encoding of audio signal using bandwidth expansion
WO2002082428A1 (en) 2001-04-05 2002-10-17 Koninklijke Philips Electronics N.V. Time-scale modification of signals applying techniques specific to determined signal types
SE522553C2 (sv) 2001-04-23 2004-02-17 Ericsson Telefon Ab L M Bandbreddsutsträckning av akustiska signaler
WO2003003770A1 (en) 2001-06-26 2003-01-09 Nokia Corporation Method for transcoding audio signals, transcoder, network element, wireless communications network and communications system
DE50113277D1 (de) 2001-09-28 2007-12-27 Nokia Siemens Networks Spa Sprachextender und verfahren zum schätzen eines breitbandigen sprachsignals anhand eines schmalbandigen sprachsignals
US6895375B2 (en) 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech
US6988066B2 (en) 2001-10-04 2006-01-17 At&T Corp. Method of bandwidth extension for narrow-band speech
US7191136B2 (en) 2002-10-01 2007-03-13 Ibiquity Digital Corporation Efficient coding of high frequency signal information in a signal using a linear/non-linear prediction model based on a low pass baseband
US20040138876A1 (en) 2003-01-10 2004-07-15 Nokia Corporation Method and apparatus for artificial bandwidth expansion in speech processing
US7634399B2 (en) 2003-01-30 2009-12-15 Digital Voice Systems, Inc. Voice transcoder
US7155386B2 (en) 2003-03-15 2006-12-26 Mindspeed Technologies, Inc. Adaptive correlation window for open-loop pitch
FR2853174B1 (fr) 2003-03-27 2005-07-08 Schlumberger Systems & Service Systeme de telephone securisee
US20050004793A1 (en) 2003-07-03 2005-01-06 Pasi Ojala Signal adaptation for higher band coding in a codec utilizing band split coding
FI118550B (fi) 2003-07-14 2007-12-14 Nokia Corp Parannettu eksitaatio ylemmän kaistan koodaukselle koodekissa, joka käyttää kaistojen jakoon perustuvia koodausmenetelmiä
US7461003B1 (en) * 2003-10-22 2008-12-02 Tellabs Operations, Inc. Methods and apparatus for improving the quality of speech signals
KR100587953B1 (ko) 2003-12-26 2006-06-08 한국전자통신연구원 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치 및 그를 이용한 비트스트림 복호화 시스템
EP1758099A1 (en) 2004-04-30 2007-02-28 Matsushita Electric Industrial Co., Ltd. Scalable decoder and expanded layer disappearance hiding method
US7630902B2 (en) 2004-09-17 2009-12-08 Digital Rise Technology Co., Ltd. Apparatus and methods for digital audio coding using codebook application ranges
KR100707174B1 (ko) 2004-12-31 2007-04-13 삼성전자주식회사 광대역 음성 부호화 및 복호화 시스템에서 고대역 음성부호화 및 복호화 장치와 그 방법
DE602005013906D1 (de) 2005-01-31 2009-05-28 Harman Becker Automotive Sys Bandbreitenerweiterung eines schmalbandigen akustischen Signals
US20070147518A1 (en) 2005-02-18 2007-06-28 Bruno Bessette Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX
CN101185127B (zh) * 2005-04-01 2014-04-23 高通股份有限公司 用于编码和解码语音信号的高频带部分的方法和设备
JP5129117B2 (ja) 2005-04-01 2013-01-23 クゥアルコム・インコーポレイテッド 音声信号の高帯域部分を符号化及び復号する方法及び装置
PL1875463T3 (pl) 2005-04-22 2019-03-29 Qualcomm Incorporated Układy, sposoby i urządzenie do wygładzania współczynnika wzmocnienia
US7707034B2 (en) 2005-05-31 2010-04-27 Microsoft Corporation Audio codec post-filter
JP4604864B2 (ja) 2005-06-14 2011-01-05 沖電気工業株式会社 帯域拡張装置及び不足帯域信号生成器
US20070005351A1 (en) 2005-06-30 2007-01-04 Sathyendra Harsha M Method and system for bandwidth expansion for voice communications
US7734462B2 (en) 2005-09-02 2010-06-08 Nortel Networks Limited Method and apparatus for extending the bandwidth of a speech signal
EP1772855B1 (en) 2005-10-07 2013-09-18 Nuance Communications, Inc. Method for extending the spectral bandwidth of a speech signal
ATE528748T1 (de) 2006-01-31 2011-10-15 Nuance Communications Inc Verfahren und entsprechendes system zur erweiterung der spektralen bandbreite eines sprachsignals
WO2007096550A2 (fr) * 2006-02-22 2007-08-30 France Telecom Codage/decodage perfectionnes d'un signal audionumerique, en technique celp
US8837446B2 (en) 2006-05-16 2014-09-16 Autonet Mobile, Inc. Mobile router network with rate limiting
KR20070115637A (ko) 2006-06-03 2007-12-06 삼성전자주식회사 대역폭 확장 부호화 및 복호화 방법 및 장치
US8260609B2 (en) * 2006-07-31 2012-09-04 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of inactive frames
BRPI0716315A2 (pt) 2006-10-25 2017-05-30 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E V aparelhagem e método para gerar valores de sub-banda de áudio e aparelhagem e método para gerar amostras de áudio de domínio de tempo
US8005671B2 (en) 2006-12-04 2011-08-23 Qualcomm Incorporated Systems and methods for dynamic normalization to reduce loss in precision for low-level signals
EP1947644B1 (en) 2007-01-18 2019-06-19 Nuance Communications, Inc. Method and apparatus for providing an acoustic signal with extended band-width
JP4984983B2 (ja) 2007-03-09 2012-07-25 富士通株式会社 符号化装置および符号化方法
DK3288028T3 (da) 2007-08-27 2019-09-02 Ericsson Telefon Ab L M Spektralanalyse/syntese med lav kompleksitet ved anvendelse af selekterbar tidsopløsning
RU2449386C2 (ru) 2007-11-02 2012-04-27 Хуавэй Текнолоджиз Ко., Лтд. Способ и устройство для аудиодекодирования
DE102008015702B4 (de) 2008-01-31 2010-03-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals
US8433582B2 (en) 2008-02-01 2013-04-30 Motorola Mobility Llc Method and apparatus for estimating high-band energy in a bandwidth extension system
EP2250641B1 (en) 2008-03-04 2011-10-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus for mixing a plurality of input data streams
JP2009300707A (ja) 2008-06-13 2009-12-24 Sony Corp 情報処理装置および方法、並びにプログラム
US8768690B2 (en) * 2008-06-20 2014-07-01 Qualcomm Incorporated Coding scheme selection for low-bit-rate applications
CA2730200C (en) 2008-07-11 2016-09-27 Max Neuendorf An apparatus and a method for generating bandwidth extension output data
PL2304723T3 (pl) 2008-07-11 2013-03-29 Fraunhofer Ges Forschung Urządzenie i sposób dekodowania zakodowanego sygnału audio
AU2009267529B2 (en) 2008-07-11 2011-03-03 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for calculating bandwidth extension data using a spectral tilt controlling framing
JP2010079275A (ja) 2008-08-29 2010-04-08 Sony Corp 周波数帯域拡大装置及び方法、符号化装置及び方法、復号化装置及び方法、並びにプログラム
US9037474B2 (en) 2008-09-06 2015-05-19 Huawei Technologies Co., Ltd. Method for classifying audio signal into fast signal or slow signal
HUE064653T2 (hu) 2008-12-15 2024-04-28 Fraunhofer Ges Forschung Audió sávszélesség kiterjesztés dekódoló, megfelelõ eljárás és számítógépi program
EP4145446B1 (en) 2009-01-16 2023-11-22 Dolby International AB Cross product enhanced harmonic transposition
US8463599B2 (en) 2009-02-04 2013-06-11 Motorola Mobility Llc Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder
PL4152320T3 (pl) 2009-10-21 2024-02-19 Dolby International Ab Nadpróbkowanie w banku filtrów połączonym z modułem transpozycji
US9159337B2 (en) 2009-10-21 2015-10-13 Dolby International Ab Apparatus and method for generating a high frequency audio signal using adaptive oversampling
US8484020B2 (en) 2009-10-23 2013-07-09 Qualcomm Incorporated Determining an upperband signal from a narrowband signal
JP5619177B2 (ja) 2009-11-19 2014-11-05 テレフオンアクチーボラゲット エル エムエリクソン(パブル) 低域オーディオ信号の帯域拡張
KR101381272B1 (ko) 2010-01-08 2014-04-07 니뽄 덴신 덴와 가부시키가이샤 부호화 방법, 복호 방법, 부호화 장치, 복호 장치, 프로그램 및 기록 매체
SG185606A1 (en) 2010-05-25 2012-12-28 Nokia Corp A bandwidth extender
US8600737B2 (en) 2010-06-01 2013-12-03 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for wideband speech coding
US9208792B2 (en) * 2010-08-17 2015-12-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for noise injection
US8924200B2 (en) 2010-10-15 2014-12-30 Motorola Mobility Llc Audio signal bandwidth extension in CELP-based speech coder
US9378746B2 (en) 2012-03-21 2016-06-28 Samsung Electronics Co., Ltd. Method and apparatus for encoding and decoding high frequency for bandwidth extension
EP2709106A1 (en) 2012-09-17 2014-03-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating a bandwidth extended signal from a bandwidth limited audio signal
CN105976830B (zh) 2013-01-11 2019-09-20 华为技术有限公司 音频信号编码和解码方法、音频信号编码和解码装置
US9728200B2 (en) * 2013-01-29 2017-08-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for adaptive formant sharpening in linear prediction coding
US9336789B2 (en) * 2013-02-21 2016-05-10 Qualcomm Incorporated Systems and methods for determining an interpolation factor set for synthesizing a speech signal
EP2830065A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency
CN104517610B (zh) 2013-09-26 2018-03-06 华为技术有限公司 频带扩展的方法及装置
US10083708B2 (en) 2013-10-11 2018-09-25 Qualcomm Incorporated Estimation of mixing factors to generate high-band excitation signal
KR102271852B1 (ko) 2013-11-02 2021-07-01 삼성전자주식회사 광대역 신호 생성방법 및 장치와 이를 채용하는 기기
WO2015077641A1 (en) 2013-11-22 2015-05-28 Qualcomm Incorporated Selective phase compensation in high band coding
US9564141B2 (en) 2014-02-13 2017-02-07 Qualcomm Incorporated Harmonic bandwidth extension of audio signals
US9837089B2 (en) 2015-06-18 2017-12-05 Qualcomm Incorporated High-band signal generation
US10847170B2 (en) * 2015-06-18 2020-11-24 Qualcomm Incorporated Device and method for generating a high-band signal from non-linearly processed sub-ranges

Also Published As

Publication number Publication date
KR102754976B1 (ko) 2025-01-14
CO2017012863A2 (es) 2018-02-28
KR20230175333A (ko) 2023-12-29
JP6710706B2 (ja) 2020-06-17
RU2017143773A (ru) 2019-07-19
SA517390518B1 (ar) 2020-09-21
KR102621209B1 (ko) 2024-01-04
NZ737169A (en) 2022-09-30
CN107743644B (zh) 2021-05-25
TWI677866B (zh) 2019-11-21
BR112017027294B1 (pt) 2024-01-23
JP2018522271A (ja) 2018-08-09
MX381646B (es) 2025-03-13
MX2017015421A (es) 2018-03-01
US20220406319A1 (en) 2022-12-22
US20160372126A1 (en) 2016-12-22
US10847170B2 (en) 2020-11-24
EP3311382B1 (en) 2023-09-06
MY190143A (en) 2022-03-30
AU2016280531B2 (en) 2021-02-04
US20210065727A1 (en) 2021-03-04
PL3311382T3 (pl) 2023-12-27
US11437049B2 (en) 2022-09-06
TW201711021A (zh) 2017-03-16
BR112017027294A2 (pt) 2018-09-11
CA2986430C (en) 2023-10-03
SG10201912525UA (en) 2020-02-27
US20240304199A1 (en) 2024-09-12
RU2742296C2 (ru) 2021-02-04
CL2017003158A1 (es) 2018-06-01
HK1245493A1 (zh) 2018-08-24
EP3311382C0 (en) 2023-09-06
EP3311382A1 (en) 2018-04-25
ZA201708558B (en) 2021-06-30
WO2016204955A1 (en) 2016-12-22
CN107743644A (zh) 2018-02-27
KR20180019582A (ko) 2018-02-26
PH12017502191A1 (en) 2018-05-28
US12009003B2 (en) 2024-06-11
CA2986430A1 (en) 2016-12-22
RU2017143773A3 (es) 2019-12-04
US20220139410A9 (en) 2022-05-05
AU2016280531A1 (en) 2017-11-30

Similar Documents

Publication Publication Date Title
ES2955855T3 (es) Generación de señal de banda alta
ES3054919T3 (en) High-band signal generation
HK1245494A1 (en) High-band signal generation
HK1245493B (zh) 高频带信号产生