ES2711524T3 - Generación de señal de excitación de banda alta - Google Patents

Generación de señal de excitación de banda alta Download PDF

Info

Publication number
ES2711524T3
ES2711524T3 ES15716340T ES15716340T ES2711524T3 ES 2711524 T3 ES2711524 T3 ES 2711524T3 ES 15716340 T ES15716340 T ES 15716340T ES 15716340 T ES15716340 T ES 15716340T ES 2711524 T3 ES2711524 T3 ES 2711524T3
Authority
ES
Spain
Prior art keywords
signal
envelope
loudness
white noise
band
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES15716340T
Other languages
English (en)
Inventor
Pravin Kumar Ramadas
Daniel J Sinder
Stephane Pierre Villette
Vivek Rajendran
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Application granted granted Critical
Publication of ES2711524T3 publication Critical patent/ES2711524T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering

Abstract

Un procedimiento para generación de señal de excitación de banda alta que comprende: determinar, en un dispositivo, una clasificación de sonoridad de una señal de entrada, en el que la señal de entrada corresponde a una señal de audio; controlar una envolvente de una señal de excitación de la señal de entrada basándose en la clasificación de sonoridad, en el que el intervalo de frecuencia de la envolvente se controla basándose en una frecuencia de corte de un filtro de paso bajo aplicado a la señal de excitación de la señal de entrada; modular una señal de ruido blanco basándose en la envolvente controlada; y generar una señal de excitación de banda alta basándose en la señal de ruido blanco modulada.

Description

DESCRIPCION
Generacion de senal de excitacion de banda alta
REIVINDICACION DE PRIORIDAD
[0001] La presente solicitud reivindica la prioridad de la solicitud de patente estadounidense n° 14/265,693, presentada el 30 de abril de 2014, titulada "HIGH BAND EXCITATION SIGNAL GENERATION" ["GENERACION DE SENAL DE EXCITACION DE BANDA ALTA"].
I. Campo
[0002] La presente divulgacion se refiere, en general, a la generacion de senal de excitacion de banda alta.
II. Descripcion de la tecnica relacionada
[0003] Los avances en la tecnologfa han dado como resultado dispositivos informaticos mas pequenos y mas potentes. Por ejemplo, existe actualmente una variedad de dispositivos informaticos personales portatiles, incluyendo dispositivos informaticos inalambricos, tales como telefonos inalambricos portatiles, asistentes digitales personales (PDA) y dispositivos de radiolocalizacion que son pequenos, ligeros y se transportan facilmente por los usuarios. Mas especfficamente, los telefonos inalambricos portatiles, tales como los telefonos celulares y los telefonos de protocolo de Internet (IP), pueden comunicar paquetes de voz y datos a traves de redes inalambricas. Ademas, muchos de dichos telefonos inalambricos incluyen otros tipos de dispositivos que estan incorporados en los mismos. Por ejemplo, un telefono inalambrico tambien puede incluir una camara fotografica digital, una camara de video digital, un grabador digital y un reproductor de archivos de audio.
[0004] La transmision de voz mediante tecnicas digitales esta extendida, en particular en aplicaciones radiotelefonicas de larga distancia y digitales. Si la voz se transmite mediante muestreo y digitalizacion, se puede usar una velocidad de transferencia de datos del orden de sesenta y cuatro kilobits por segundo (kbps) para lograr una calidad de voz de un telefono analogico. Se pueden usar tecnicas de compresion para reducir la cantidad de informacion que se envfa a traves de un canal mientras se mantiene una calidad percibida de la voz reconstruida. Mediante el uso del analisis de la voz, seguido de la codificacion, la transmision y la resfntesis en un receptor, se puede lograr una reduccion significativa en la velocidad de transferencia de datos.
[0005] Los dispositivos para comprimir la voz pueden tener uso en muchos campos de las telecomunicaciones. Por ejemplo, las comunicaciones inalambricas tienen muchas aplicaciones, incluyendo, por ejemplo, telefonos sin cables, radiolocalizacion, bucles locales inalambricos, telefonfa inalambrica, tal como sistemas telefonicos de servicio de comunicacion personal (PCS) y celulares, telefonfa de protocolo de Internet (IP) movil y sistemas de comunicacion satelital. Una aplicacion particular es la telefonfa inalambrica para abonados moviles.
[0006] Se han desarrollado diversas interfaces aereas para sistemas de comunicacion inalambrica, incluyendo, por ejemplo, acceso multiple por division de frecuencia (FDMA), acceso multiple por division de tiempo (TDMA), acceso multiple por division de codigo (CDMA) y CDMA sfncrono con division de tiempo (TD-SCDMA). En relacion con eso, se han establecido diversas normas nacionales e internacionales, incluyendo, por ejemplo, el Servicio telefonico movil avanzado (AMPS), el Sistema global para comunicaciones moviles (GSM) y la Norma transitoria 95 (IS-95). Un sistema de comunicacion de telefonfa inalambrica a modo de ejemplo es un sistema de acceso multiple por division de codigo (CDMA). La norma IS-95 y sus derivados, IS-95A, ANSI J-STD-008 e IS-95B (denominados de manera colectiva en el presente documento IS-95) se promulgan por la Asociacion de la Industria de las Telecomunicaciones (TIA) y por otros organismos de normalizacion conocidos para especificar el uso de una interfaz aerea CDMA para sistemas de comunicacion de telefonfa celular o PCS.
[0007] Posteriormente, la norma IS-95 se convirtio en sistemas "3G", tales como cdma2000 y WCDMA, que proporcionan mas capacidad y servicios de paquetes de datos de alta velocidad. Se presentan dos variaciones de cdma2000 mediante los documentos IS-2000 (cdma20001xRTT) e IS-856 (cdma2000 1xEV-DO), que presenta la TIA. El sistema de comunicacion cdma2000 1xRTT ofrece una velocidad de transferencia de datos maxima de 153 kbps, mientras que el sistema de comunicacion cdma2000 1xEV-DO define un conjunto de velocidades de transferencia datos, que varfan de 38,4 kbps a 2,4 Mbps. La norma WCDMA se realiza en el Proyecto de Colaboracion de Tercera Generacion "3GPP", documentos n.os 3G TS 25.211,3G TS 25.212, 3G TS 25.213 y 3G TS 25.214. La especificacion de telecomunicaciones moviles internacionales avanzadas (IMT-Advanced) expone las normas "4G". La especificacion de IMT-Advanced establece una velocidad de transferencia de datos maxima para el servicio 4G en 100 megabits por segundo (Mbit/s) para la comunicacion de alta movilidad (por ejemplo, de trenes y automoviles) y de 1 gigabit por segundo (Gbit/s) para la comunicacion de baja movilidad (por ejemplo, de peatones y usuarios estacionarios).
[0008] Los dispositivos que emplean tecnicas para comprimir la voz extrayendo parametros que se relacionan con un modelo de generacion de voz humana se denominan codificadores de voz. Los codificadores de voz pueden comprender un codificador y un descodificador. El codificador divide la senal de voz entrante en bloques de tiempo o tramas de analisis. Se puede seleccionar la duracion de cada segmento de tiempo (o "trama") para que sea suficientemente corta como para que se pueda esperar que la envolvente espectral de la senal permanezca relativamente estacionaria. Por ejemplo, una longitud de trama puede ser de veinte milisegundos, que corresponde a 160 muestras a una velocidad de muestreo de ocho kilohercios (kHz), aunque se puede usar cualquier longitud de trama o velocidad de muestreo que se considere adecuada para una aplicacion particular.
[0009] El codificador analiza la trama de voz entrante para extraer determinados parametros relevantes y, a continuacion, cuantifica los parametros en una representacion binaria, por ejemplo, en un conjunto de bits o un paquete de datos binarios. Los paquetes de datos se transmiten a traves de un canal de comunicacion (por ejemplo, una conexion de red alambrica y/o inalambrica) a un receptor y a un descodificador. El descodificador procesa los paquetes de datos, descuantifica los paquetes de datos procesados para producir los parametros y resintetiza las tramas de voz usando los parametros descuantificados.
[0010] La funcion del codificador de voz es comprimir la senal de voz digitalizada en una senal de baja velocidad binaria eliminando las redundancias naturales inherentes en la voz. Se puede lograr la compresion digital representando una trama de voz de entrada con un conjunto de parametros y empleando la cuantificacion para representar los parametros con un conjunto de bits. Si la trama de voz de entrada tiene un numero de bits Ni y un paquete de datos producido por el codificador de voz tiene un numero de bits No , el factor de compresion logrado mediante el codificador de voz es Cr = N/No . El desaffo es mantener la alta calidad de voz de la voz descodificada al tiempo que se logra el factor de compresion objetivo. El rendimiento de un codificador de voz depende de (1) lo bien que se lleve a cabo el modelo de voz, o la combinacion del proceso de analisis y sfntesis descrito anteriormente, y (2) lo bien que se lleve a cabo el proceso de cuantificacion de parametros a la velocidad binaria objetivo de No bits por trama. El objetivo del modelo de voz es por tanto capturar la esencia de la senal de voz, o la calidad de voz objetivo, con un pequeno conjunto de parametros para cada trama.
[0011] Los codificadores de voz en general utilizan un conjunto de parametros (incluyendo vectores) para describir la senal de voz. Un buen conjunto de parametros proporciona, idealmente, un ancho de banda de sistema bajo para la reconstruccion de una senal de voz perceptualmente precisa. El tono, la potencia de senal, la envolvente espectral (o formantes), los espectros de amplitud y fase son ejemplos de parametros de codificacion de voz.
[0012] Se pueden implementar los codificadores de voz como codificadores de dominio de tiempo, que intentan capturar la forma de onda de voz de dominio de tiempo empleando un procesamiento de alta resolucion temporal para codificar pequenos segmentos de voz (por ejemplo, sub-tramas de 5 milisegundos (ms)) de uno en uno. Para cada sub-trama, se encuentra un representante de alta precision de un espacio de libro de codigos por medio de un algoritmo de busqueda. De forma alternativa, se pueden implementar codificadores de voz como codificadores de dominio de frecuencia, que intentan capturar el espectro de voz a corto plazo de la trama de voz de entrada con un conjunto de parametros (analisis) y emplear un proceso de sfntesis correspondiente para recrear la forma de onda de voz a partir de los parametros espectrales. El cuantificador de parametros conserva los parametros representandolos con representaciones almacenadas de vectores de codigo de acuerdo con tecnicas de cuantificacion conocidas.
[0013] Un codificador de voz de dominio de tiempo es el codificador de prediccion lineal excitada por codigo (CELP). En un codificador CELP, se eliminan las correlaciones a corto plazo, o redundancias, en la senal de voz mediante un analisis de prediccion lineal (LP), que encuentra los coeficientes de un filtro de formantes a corto plazo. La aplicacion del filtro de prediccion a corto plazo a la trama de voz entrante genera una senal residual senal residual de LP, que se modela y se cuantifica ademas con parametros de filtro de prediccion a largo plazo y un libro de codigos estocastico posterior. Por tanto, la codificacion CELP divide la tarea de codificar la forma de onda de voz de dominio de tiempo en tareas separadas de codificacion de los coeficientes de filtro a corto plazo de LP y de codificacion del residuo de LP. Se puede realizar la codificacion de dominio de tiempo a una velocidad fija (por ejemplo, usando el mismo numero de bits, No, para cada trama) o a una velocidad variable (en la que se usan diferentes velocidades binarias para diferentes tipos de contenido de trama). Los codificadores de velocidad variable intentan usar la cantidad de bits necesarios para codificar los parametros a un nivel adecuado para obtener una calidad objetivo.
[0014] Los codificadores de dominio de tiempo, tales como el codificador CELP, pueden depender de un alto numero de bits, N0, por trama para conservar la precision de la forma de onda de voz de dominio de tiempo. Dichos codificadores pueden proporcionar una excelente calidad de voz siempre que el numero de bits, No, por trama sea relativamente grande (por ejemplo, 8 kbps o superior). A bajas velocidades binarias (por ejemplo, 4 kbps e inferiores), los codificadores de dominio de tiempo pueden dejar de mantener una alta calidad y un solido rendimiento debido al numero limitado de bits disponibles. A bajas velocidades binarias, el espacio de libro de codigos limitado recorta la capacidad de igualar la forma de onda de los codificadores de dominio de tiempo, que se instalan en aplicaciones comerciales de velocidad mas alta. Por lo tanto, muchos sistemas de codificacion CELP que funcionan a bajas velocidades binarias son susceptibles de distorsion perceptualmente significativa caracterizada como ruido.
[0015] Una alternativa a los codificadores CELP a bajas velocidades binarias es el codificador de "prediccion lineal excitada por ruido" (NELP), que opera bajo principios similares a un codificador CELP. Los codificadores NELP usan una senal de ruido pseudoaleatorio filtrado para modelar la voz, en lugar de un libro de codigos. Puesto que NELP usa un modelo mas simple para la voz codificada, la NELP logra una velocidad binaria mas baja que la CELP. La NELP puede usarse para comprimir o representar la voz sorda o el silencio.
[0016] Los sistemas de codificacion que operan a velocidades del orden de 2,4 kbps son en general de naturaleza parametrica. Es decir, dichos sistemas de codificacion funcionan transmitiendo parametros que describen el perfodo de tono y la envolvente espectral (o formantes) de la senal de voz a intervalos regulares. El vocoder de LP ilustra dichos codificadores parametricos.
[0017] Los vocoders de LP modelan una senal de voz sonora con un unico impulso por perfodo de tono. Esta tecnica basica se puede aumentar para incluir la transmision de informacion acerca de la envolvente espectral, entre otras cosas. Aunque los vocoders de LP proporcionan un rendimiento razonable en general, pueden introducir distorsion perceptualmente significativa, caracterizada como zumbido.
[0018] En los ultimos anos, han aparecido codificadores que son hfbridos tanto de codificadores de forma de onda como de codificadores parametricos. El sistema de codificacion de voz de interpolacion de forma de onda prototipo (PWI) ilustra estos codificadores hfbridos. El sistema de codificacion de voz PWI tambien se puede conocer como un codificador de voz de perfodo de tono prototipo (PPP). Un sistema de codificacion de voz PWI proporciona un procedimiento eficaz para codificar voz sonora. El concepto basico de PWI es extraer un ciclo de tono representativo (la forma de onda prototipo) a intervalos fijos, transmitir su descripcion y reconstruir la senal de voz interpolando entre las formas de onda prototipo. El procedimiento PWI puede operar en la senal residual de LP o bien en la senal de voz.
[0019] En los sistemas telefonicos tradicionales (por ejemplo, las redes telefonicas conmutadas publicas (PSTN)), el ancho de banda de senal esta limitado al intervalo de frecuencia de 300 hercios (Hz) a 3,4 kilohercios (kHz). En aplicaciones de banda ancha (WB), tales como la telefonfa celular y la voz sobre el protocolo de Internet (VoIP), el ancho de banda de senal puede abarcar el intervalo de frecuencia de 50 Hz a 7 kHz. Las tecnicas de codificacion de superbanda ancha (SWB) soportan un ancho de banda que se extiende hasta aproximadamente 16 kHz. La extension del ancho de banda de senal desde la telefonfa de banda estrecha a 3,4 kHz hasta la telefonfa SWB de 16 kHz puede mejorar la calidad de la reconstruccion de senal, la inteligibilidad y la naturalidad.
[0020] Las tecnicas de codificacion de banda ancha implican codificar y transmitir una porcion de frecuencia inferior de una senal (por ejemplo, de 50 Hz a 7 kHz, tambien denominada la "banda baja"). Con el a fin de mejorar la eficiencia de codificacion, es posible que la porcion de frecuencia superior de la senal (por ejemplo, de 7 kHz a 16 kHz, tambien denominada la "banda alta") no se codifique y transmita completamente. Las propiedades de la senal de banda baja se pueden usar para generar la senal de banda alta. Por ejemplo, una senal de excitacion de banda alta se puede generar basandose en un residuo de banda baja que usa un modelo no lineal (por ejemplo, una funcion de valor absoluto). Cuando el residuo de banda baja se codifica escasamente con impulsos, la senal de excitacion de banda alta generada a partir del residuo codificado escasamente puede dar lugar a artefactos en regiones sordas de la banda alta.
[0021] La publicacion de la solicitud de patente US 2004/0181399 A1 divulga un codificador CELP modificado en el que, basandose en un grado de sonoridad de una senal de entrada, el espectro de la senal de excitacion se separa en una parte armonica inferior y una parte de ruido superior, usando un par de filtros de paso alto y de paso bajo con las correspondientes frecuencias de corte. La parte superior de la senal se regenera filtrando un ruido blanco con el filtro de paso alto.
[0022] La publicacion de solicitud de patente US 2011/0099004 A1 divulga la generacion de una senal de excitacion de banda alta extendiendo armonicamente una senal de excitacion de banda baja en la banda alta, y calculando la envolvente espectral de la senal de excitacion extendida. La senal de excitacion de banda alta se genera entonces basandose en un ruido blanco modulado mediante la envolvente.
III. Sumario
[0023] La invencion se define mediante las reivindicaciones. En lo que sigue, las declaraciones que se extienden mas alla de la materia objeto de las reivindicaciones se proporcionan solo a modo de ilustracion y no pretenden ampliar el alcance de la invencion como se reivindica. Se divulgan sistemas y procedimientos para la generacion de senal de excitacion de banda alta. Un descodificador de audio puede recibir senales de audio codificadas mediante un codificador de audio en un dispositivo de transmision. El descodificador de audio determina una clasificacion de sonoridad (por ejemplo, fuertemente sonora, debilmente sonora, debilmente sorda, fuertemente sorda) de una senal de audio particular. Por ejemplo, la senal de audio particular puede variar desde fuertemente sonora (por ejemplo, una senal de voz) hasta fuertemente sorda (por ejemplo, una senal de ruido). El descodificador de audio controla una envolvente de una representacion de una senal de entrada basandose en la clasificacion de sonoridad.
[0024] Controlar la envolvente incluye controlar una caracterfstica (por ejemplo, una forma, un intervalo de frecuencia, una ganancia y/o una magnitud) de la envolvente. Por ejemplo, el descodificador de audio puede generar una senal de excitacion de banda baja a partir de una senal de audio codificada y puede controlar una forma de una envolvente de la senal de excitacion de banda baja basandose en la clasificacion de sonoridad. En particular, el descodificador de audio controla un intervalo de frecuencia de la envolvente basandose en una frecuencia de corte de un filtro aplicado a la senal de excitacion de banda baja. Ademas, el descodificador de audio puede controlar una magnitud de la envolvente, una forma de la envolvente, una ganancia de la envolvente, o una combinacion de las mismas, ajustando uno o mas polos de los coeficientes de codificacion predictiva lineal (LPC) basandose en la clasificacion de sonoridad.
[0025] El descodificador de audio modula una senal de ruido blanco basandose en la envolvente controlada. Por ejemplo, la senal de ruido blanco modulada puede corresponder mas a la senal de excitacion de banda baja cuando la clasificacion de sonoridad es fuertemente sonora que cuando la clasificacion de sonoridad es fuertemente sorda. El descodificador de audio genera una senal de excitacion de banda alta basandose en la senal de ruido blanco modulada. Por ejemplo, el descodificador de audio puede extender la senal de excitacion de banda baja y puede combinar la senal de ruido blanco modulada y la senal de banda baja extendida para generar la senal de excitacion de banda alta.
[0026] De acuerdo con la invencion, un procedimiento para la generacion de senal de excitacion de banda alta incluye determinar, en un dispositivo, una clasificacion de sonoridad de una senal de entrada. La senal de entrada corresponde a una senal de audio. El procedimiento tambien incluye controlar una envolvente de una senal de excitacion de la senal de entrada basandose en la clasificacion de sonoridad, en el que el intervalo de frecuencia de la envolvente se controla basandose en una frecuencia de corte de un filtro de paso bajo aplicado a la senal de excitacion de la senal de entrada. El procedimiento incluye ademas modular una senal de ruido blanco basandose en la envolvente controlada. El procedimiento incluye generar una senal de excitacion de banda alta basandose en la senal de ruido blanco modulada.
[0027] De acuerdo con otro aspecto de la invencion, un aparato para generar una senal de excitacion de banda alta incluye un clasificador de sonoridad, un ajustador de envolvente, un modulador y un circuito de salida. El clasificador de sonoridad se configura para determinar una clasificacion de sonoridad de una senal de entrada. La senal de entrada corresponde a una senal de audio. El ajustador de envolvente se configura para controlar una envolvente de una senal de excitacion de la senal de entrada basandose en la clasificacion de sonoridad, en el que el intervalo de frecuencia de la envolvente se controla basandose en una frecuencia de corte de un filtro de paso bajo aplicado a la senal de excitacion de la senal de entrada. El modulador se configura para modular una senal de ruido blanco basandose en la envolvente controlada. El circuito de salida se configura para generar una senal de excitacion de banda alta basandose en la senal de ruido blanco modulada.
[0028] De acuerdo con otro aspecto de la invencion, un dispositivo de almacenamiento legible por ordenador almacena instrucciones que, cuando se ejecutan mediante al menos un procesador, hacen que el al menos un procesador determine una clasificacion de sonoridad de una senal de entrada. Las instrucciones, cuando se ejecutan mediante el al menos un procesador, hacen ademas que el al menos un procesador controle una envolvente de una senal de excitacion de la senal de entrada basandose en la clasificacion de sonoridad, en el que el intervalo de frecuencia de la envolvente se controla basandose en una frecuencia de corte de un filtro de paso bajo aplicado a la senal de excitacion de la senal de entrada, module una senal de ruido blanco basandose en la cantidad controlada de la envolvente, y genere una senal de excitacion de banda alta basandose en la senal de ruido blanco modulada.
[0029] Las ventajas particulares proporcionadas mediante al menos uno de los modos de realizacion descritos incluyen generar una senal de audio sintetizada de sonoridad suave correspondiente a una senal de audio sorda. Por ejemplo, la senal de audio sintetizada correspondiente a la senal de audio sorda puede tener pocos artefactos (o ninguno). Otros aspectos, ventajas y caracterfsticas de la presente divulgacion resultaran evidentes despues de revisar la solicitud, que incluye las siguientes secciones: Breve descripcion de los dibujos, Descripcion detallada y Reivindicaciones.
IV. Breve descripcion de los dibujos
[0030]
La FIG. 1 es un diagrama para ilustrar un modo de realizacion particular de un sistema que incluye un dispositivo que se puede operar para realizar la generacion de senal de excitacion de banda alta;
La FIG. 2 es un diagrama para ilustrar un modo de realizacion particular de un descodificador que se puede operar para realizar la generacion de senal de excitacion de banda alta;
La FIG. 3 es un diagrama para ilustrar un modo de realizacion particular de un codificador que se puede operar para realizar la generacion de senal de excitacion de banda alta;
La FIG. 4 es un diagrama para ilustrar un modo de realizacion particular de un procedimiento de generacion de senal de excitacion de banda alta;
La FIG. 5 es un diagrama para ilustrar un ejemplo de un procedimiento de generacion de senal de excitacion de banda alta;
La FIG. 6 es un diagrama para ilustrar otro ejemplo de un procedimiento de generacion de senal de excitacion de banda alta;
La FIG. 7 es un diagrama para ilustrar otro ejemplo de un procedimiento de generacion de senal de excitacion de banda alta;
La FIG. 8 es un diagrama de flujo para ilustrar otro modo de realizacion de un procedimiento de generacion de senal de excitacion de banda alta; y
La FIG. 9 es un diagrama de bloques de un dispositivo que se puede operar para realizar la generacion de senal de excitacion de banda alta de acuerdo con los sistemas y procedimientos de las FIG. 1-8.
V. Descripcion detallada
[0031] Los principios descritos en el presente documento se pueden aplicar, por ejemplo, a unos auriculares, un telefono u otro dispositivo de audio que este configurado para realizar la generacion de senal de excitacion de banda alta. A menos que se limite expresamente por su contexto, el termino "senal" se usa en el presente documento para indicar cualquiera de sus significados comunes, incluyendo un estado de una posicion de memoria (o conjunto de posiciones de memoria) como se expresa en un cable, bus u otro medio de transmision. A menos que se limite expresamente por su contexto, el termino "generar" se usa en el presente documento para indicar cualquiera de sus significados comunes, tales como calcular o de otro modo producir. A menos que se limite expresamente por su contexto, el termino "calcular" se usa en el presente documento para indicar cualquiera de sus significados comunes, tales como calcular, evaluar, suavizar y/o seleccionar a partir de una pluralidad de valores. A menos que se limite expresamente por su contexto, el termino "obtener" se usa para indicar cualquiera de sus significados comunes, tales como calcular, derivar, recibir (por ejemplo, de otro componente, bloque o dispositivo) y/o recuperar (por ejemplo, de un registro de memoria o una matriz de elementos de almacenamiento).
[0032] A menos que se limite expresamente por su contexto, el termino "producir" se usa para indicar cualquiera de sus significados comunes, tales como calcular, generar y/o proporcionar. A menos que se limite expresamente por su contexto, el termino "proporcionar" se usa para indicar cualquiera de sus significados comunes, tales como calcular, generar y/o producir. A menos que se limite expresamente por su contexto, el termino "acoplado" se utiliza para indicar una conexion electrica o ffsica directa o indirecta. Si la conexion es indirecta, un experto en la materia medio entiende bien que puede haber otros bloques o componentes entre las estructuras que estan "acopladas".
[0033] El termino "configuracion" puede usarse en referencia a un procedimiento, aparato/dispositivo y/o sistema como se indica por su contexto particular. Cuando se usa el termino "que comprende" en la presente descripcion y en las reivindicaciones, no excluye otros elementos u operaciones. El termino "basado en" (como en "A esta basado en B") se usa para indicar cualquiera de sus significados comunes, incluyendo los casos (i) "basado al menos en" (p. ej., "A esta basado al menos en B") y, si corresponde en el contexto particular, (ii) "igual a" (p. ej., "A es igual a B"). En el caso (i) donde A esta basado en B incluye basado en al menos, esto puede incluir la configuracion en la que A esta acoplado a B. Del mismo modo, el termino "en respuesta a" se usa para indicar cualquiera de sus significados comunes, incluyendo "en respuesta a al menos". El termino "al menos uno" se usa para indicar cualquiera de sus significados comunes, incluyendo "uno o mas". El termino "al menos dos" se usa para indicar cualquiera de sus significados comunes, incluyendo "dos o mas".
[0034] Los terminos "aparato" y "dispositivo" se usan de forma generica e intercambiable a menos que el contexto particular indique lo contrario. A menos que se indique otra cosa, cualquier divulgacion de una operacion de un aparato que tiene una caracterfstica particular tambien pretende expresamente divulgar un procedimiento que tenga una caracterfstica analoga (y viceversa), y cualquier divulgacion de una operacion de un aparato de acuerdo con una configuracion particular tambien pretende expresamente divulgar un procedimiento de acuerdo con una configuracion analoga (y viceversa). Los terminos "procedimiento", "proceso" y "tecnica" se usan de forma generica e intercambiable a menos que el contexto particular indique lo contrario. Los terminos "elemento" y "modulo" se pueden usar para indicar una porcion de una configuracion mayor.
[0035] Como se usa en el presente documento, el termino "dispositivo de comunicacion" se refiere a un dispositivo electronico que puede usarse para la comunicacion de voz y/o datos a traves de una red de comunicacion inalambrica. Los ejemplos de dispositivos de comunicacion incluyen telefonos celulares, asistentes digitales personales (PDA), dispositivos portatiles, auriculares, modems inalambricos, ordenadores portatiles, ordenadores personales, etc.
[0036] Haciendo referencia a la FIG. 1, se muestra un modo de realizacion particular de un sistema que incluye dispositivos que se pueden operar para realizar la generacion de senal de excitacion de banda alta y, en general, se designa como 100. En un modo de realizacion particular, uno o mas componentes del sistema 100 pueden estar integrados en un sistema o aparato de descodificacion (por ejemplo, en un telefono inalambrico o en un codificador/descodificador (CODEC)), en un sistema o aparato de codificacion, o en ambos. En otros modos de realizacion, uno o mas componentes del sistema 100 pueden estar integrados en un descodificador, un reproductor de musica, un reproductor de video, una unidad de entretenimiento, un dispositivo de navegacion, un dispositivo de comunicaciones, un asistente digital personal (PDA), una unidad de datos de localizacion fija o un ordenador.
[0037] Debe observarse que, en la siguiente descripcion, diversas funciones realizadas mediante el sistema 100 de la FlG. 1 se describen como realizadas mediante ciertos componentes o modulos. Esta division de componentes y modulos tiene solo fines ilustrativos. En un modo de realizacion alternativo, una funcion realizada mediante un componente o modulo particular puede dividirse entre multiples componentes o modulos. Ademas, en un modo de realizacion alternativo, dos o mas componentes o modulos de la FIG. 1 pueden estar integrados en un unico componente o modulo. Cada componente o modulo ilustrado en la FIG. 1 puede implementarse usando hardware (por ejemplo, un dispositivo de matriz de puertas programable por campo (FPGA), un circuito integrado especffico de la aplicacion (ASlC), un procesador de senales digitales (DSP), un controlador, etc.), software (por ejemplo, instrucciones ejecutables mediante un procesador), o cualquier combinacion de los mismos.
[0038] Aunque los modos de realizacion y ejemplos ilustrativos representados en las FIG. 1-9 se describen con respecto a un modelo de banda alta similar al usado en el codec de velocidad variable mejorado - Banda estrecha-Banda ancha (EVRC-NW), uno o mas de los modos de realizacion ilustrativos pueden usar cualquier otro modelo de banda alta. Debe entenderse que el uso de cualquier modelo particular se describe solo como ejemplo.
[0039] El sistema 100 incluye un dispositivo movil 104 en comunicacion con un primer dispositivo 102 a traves de una red 120. El dispositivo movil 104 puede estar acoplado o en comunicacion con un microfono 146. El dispositivo movil 104 puede incluir un modulo de generacion de senal de excitacion 122, un codificador de banda alta 172, un multiplexor (MUX) 174, un transmisor 176, o una combinacion de los mismos. El primer dispositivo 102 puede estar acoplado o en comunicacion con un altavoz 142. El primer dispositivo 102 puede incluir el modulo de generacion de senal de excitacion 122 acoplado a un MUX 170 a traves de un sintetizador de banda alta 168. El modulo de generacion de senal de excitacion 122 puede incluir un clasificador de sonoridad 160, un ajustador de envolvente 162, un modulador 164, un circuito de salida 166, o una combinacion de los mismos.
[0040] Durante la operacion, el dispositivo movil 104 puede recibir una senal de entrada 130 (por ejemplo, una senal de voz de usuario de un primer usuario 152, una senal sorda, o ambas). Por ejemplo, el primer usuario 152 puede participar en una llamada de voz con un segundo usuario 154. El primer usuario 152 puede usar el dispositivo movil 104 y el segundo usuario 154 puede usar el primer dispositivo 102 para la llamada de voz. Durante la llamada de voz, el primer usuario 152 puede hablar al microfono 146 acoplado al dispositivo movil 104. La senal de entrada 130 puede corresponder a la voz del primer usuario 152, a ruido de fondo (por ejemplo, musica, ruido de la calle, la voz de otra persona, etc.), o una combinacion de los mismos. El dispositivo movil 104 puede recibir la senal de entrada 130 a traves del microfono 146.
[0041] En un modo de realizacion particular, la senal de entrada 130 puede ser una senal de super banda ancha (SWB) que incluye datos en el intervalo de frecuencia desde aproximadamente 50 hercios (Hz) hasta aproximadamente 16 kilohercios (kHz). La porcion de banda baja de la senal de entrada 130 y la porcion de banda alta de la senal de entrada 130 pueden ocupar bandas de frecuencia no superpuestas de 50 Hz - 7 kHz y 7 kHz -16 kHz, respectivamente. En un modo de realizacion alternativo, la porcion de banda baja y la porcion de banda alta pueden ocupar bandas de frecuencias no superpuestas de 50 Hz - 8 kHz y 8 kHz - 16 kHz, respectivamente. En otro modo de realizacion alternativo, la porcion de banda baja y la porcion de banda alta pueden superponerse (por ejemplo, 50 Hz - 8 kHz y 7 kHz - 16 kHz, respectivamente).
[0042] En un modo de realizacion particular, la senal de entrada 130 puede ser una senal de banda ancha (WB) que tiene un intervalo de frecuencia de aproximadamente 50 Hz a aproximadamente 8 kHz. En un modo de realizacion de este tipo, la porcion de banda baja de la senal de entrada 130 puede corresponder a un intervalo de frecuencia desde aproximadamente 50 Hz hasta aproximadamente 6,4 kHz y la porcion de banda alta de la senal de entrada 130 puede corresponder a un intervalo de frecuencia desde aproximadamente 6,4 kHz hasta aproximadamente 8 kHz.
[0043] En un modo de realizacion particular, el microfono 146 puede capturar la senal de entrada 130 y un convertidor de analogico a digital (ADC) en el dispositivo movil 104 puede convertir la senal de entrada capturada 130 de una forma de onda analogica a una forma de onda digital que se compone de muestras de audio digital. Las muestras de audio digital pueden procesarse mediante un procesador de senales digitales. Un ajustador de ganancia puede ajustar una ganancia (por ejemplo, de la forma de onda analogica o de la forma de onda digital) aumentando o disminuyendo un nivel de amplitud de una senal de audio (por ejemplo, la forma de onda analogica o la forma de onda digital). Los ajustadores de ganancia pueden operar en el dominio analogico o bien en el digital. Por ejemplo, un ajustador de ganancia puede operar en el dominio digital y puede ajustar las muestras de audio digital producidas por el convertidor de analogico a digital. Despues del ajuste de ganancia, un cancelador de eco puede reducir cualquier eco que se pueda haber creado mediante una salida de un altavoz que entra en el microfono 146. Las muestras de audio digital pueden "comprimirse" mediante un vocoder (un codificadordescodificador de voz). La salida del cancelador de eco se puede acoplar a bloques de preprocesamiento de vocoder, por ejemplo, filtros, procesadores de ruido, convertidores de velocidad, etc. Un codificador del vocoder puede comprimir las muestras de audio digital y formar un paquete de transmision (una representacion de los bits comprimidos de las muestras de audio digital). En un modo de realizacion particular, el codificador del vocoder puede incluir el modulo de generacion de senal de excitacion 122. El modulo de generacion de senal de excitacion 122 puede generar una senal de excitacion de banda alta 186, como se describe con referencia al primer dispositivo 102. El modulo de generacion de senal de excitacion 122 puede proporcionar la senal de excitacion de banda alta 186 al codificador de banda alta 172.
[0044] El codificador de banda alta 172 puede codificar una senal de banda alta de la senal de entrada 130 basandose en la senal de excitacion de banda alta 186. Por ejemplo, el codificador de banda alta 172 puede generar un flujo de bits de banda alta 190 basandose en la senal de excitacion de banda alta 186. El flujo de bits de banda alta 190 puede incluir informacion de parametros de banda alta. Por ejemplo, el flujo de bits de banda alta 190 puede incluir al menos uno de coeficientes de codificacion predictiva lineal (LPC) de banda alta, frecuencias espectrales de lfnea de banda alta (LSF), pares espectrales de lfnea de banda alta (LSP), forma de ganancia (por ejemplo, parametros de ganancia temporales correspondientes a sub-tramas de una trama particular), trama de ganancia (por ejemplo, parametros de ganancia correspondientes a una relacion de energfa de banda alta a banda baja para una trama particular), u otros parametros correspondientes a una porcion de banda alta de la senal de entrada 130. En un modo de realizacion particular, el codificador de banda alta 172 puede determinar los coeficientes de LPC de banda alta usando al menos uno de un cuantificador vectorial, un modelo de markov oculto (HMM), o un modelo de mezcla gaussiana (GMM). El codificador de banda alta 172 puede determinar las LSF de banda alta, los LSP de banda alta, o ambos, basandose en los coeficientes de LPC.
[0045] El codificador de banda alta 172 puede generar la informacion de parametros de banda alta basandose en la senal de banda alta de la senal de entrada 130. Por ejemplo, un descodificador del dispositivo movil 104 puede emular un descodificador del primer dispositivo 102. El descodificador del dispositivo movil 104 puede generar una senal de audio sintetizada basandose en la senal de excitacion de banda alta 186, como se describe con referencia al primer dispositivo 102. El codificador de banda alta 172 puede generar valores de ganancia (por ejemplo, forma de ganancia, trama de ganancia, o ambas) basandose en una comparacion de la senal de audio sintetizada y la senal de entrada 130. Por ejemplo, los valores de ganancia pueden corresponder a una diferencia entre la senal de audio sintetizada y la senal de entrada 130. El codificador de banda alta 172 puede proporcionar el flujo de bits de banda alta 190 al MUX 174.
[0046] El MUX 174 puede combinar el flujo de bits de banda alta 190 con un flujo de bits de banda baja para generar el flujo de bits 132. Un codificador de banda baja del dispositivo movil 104 puede generar el flujo de bits de banda baja basandose en una senal de banda baja de la senal de entrada 130. El flujo de bits de banda baja puede incluir informacion de parametros de banda baja (por ejemplo, coeficientes de LPC de banda baja, LSF de banda baja, o ambos) y una senal de excitacion de banda baja (por ejemplo, un residuo de banda baja de la senal de entrada 130). El paquete de transmision puede corresponder al flujo de bits 132.
[0047] El paquete de transmision se puede almacenar en una memoria que se puede compartir con un procesador del dispositivo movil 104. El procesador puede ser un procesador de control que esta en comunicacion con un procesador de senales digitales. El dispositivo movil 104 puede transmitir el flujo de bits 132 al primer dispositivo 102 a traves de la red 120. Por ejemplo, el transmisor 176 puede modular alguna forma (puede anadirse otra informacion al paquete de transmision) del paquete de transmision y enviar la informacion modulada por el aire a traves de una antena.
[0048] El modulo de generacion de senal de excitacion 122 del primer dispositivo 102 puede recibir el flujo de bits 132. Por ejemplo, una antena del primer dispositivo 102 puede recibir alguna forma de paquetes entrantes que comprenden el paquete de transmision. El flujo de bits 132 puede corresponder a tramas de una senal de audio codificada mediante modulacion por codificacion de impulsos (PCM). Por ejemplo, un convertidor de analogico a digital (ADC) en el primer dispositivo 102 puede convertir el flujo de bits 132 de una senal analogica a una senal PCM digital que tiene multiples tramas.
[0049] El paquete de transmision puede "descomprimirse" mediante un descodificador de un vocoder en el primer dispositivo 102. La forma de onda (o la senal PCM digital) descomprimida puede denominarse muestras de audio reconstruidas. Las muestras de audio reconstruidas pueden postprocesarse mediante bloques de postprocesamiento de vocoder y pueden usarse mediante un cancelador de eco para eliminar el eco. Para mayor claridad, el descodificador del vocoder y los bloques de postprocesamiento de vocoder pueden denominarse un modulo de descodificador de vocoder. En algunas configuraciones, el modulo de generacion de senal de excitacion 122 puede procesar una salida del cancelador de eco. De forma alternativa, en otras configuraciones, la salida del modulo de descodificador de vocoder puede procesarse mediante el modulo de generacion de senal de excitacion 122.
[0050] El modulo de generacion de senal de excitacion 122 puede extraer la informacion de parametros de banda baja, la senal de excitacion de banda baja y la informacion de parametros de banda alta del flujo de bits 132. El clasificador de sonoridad 160 puede determinar una clasificacion de sonoridad 180 (por ejemplo, un valor de 0,0 a 1,0) que indica una naturaleza sonora/sorda (por ejemplo, fuertemente sonora, debilmente sonora, debilmente sorda o fuertemente sorda) de la senal de entrada 130, como se describe con referencia a la FIG. 2. El clasificador de sonoridad 160 puede proporcionar la clasificacion de sonoridad 180 al ajustador de envolvente 162.
[0051] El ajustador de envolvente 162 puede determinar una envolvente de una representacion de la senal de entrada 130. La envolvente puede ser una envolvente que varfa con el tiempo. Por ejemplo, la envolvente puede actualizarse mas de una vez por trama de la senal de entrada 130. Como otro ejemplo, la envolvente puede actualizarse en respuesta al ajustador de envolvente 162 que recibe cada muestra de la senal de entrada 130. Un grado de variacion de la forma de la envolvente puede ser mayor cuando la clasificacion de sonoridad 180 corresponde a fuertemente sonora que cuando la clasificacion de sonoridad corresponde a fuertemente sorda. La representacion de la senal de entrada 130 puede incluir una senal de excitacion de banda baja de la senal de entrada 130 (o de una version codificada de la senal de entrada 130), una senal de excitacion de banda alta de la senal de entrada 130 (o de la version codificada de la senal de entrada 130), o una senal de excitacion extendida armonicamente. Por ejemplo, el modulo de generacion de senal de excitacion 122 puede generar la senal de excitacion extendida armonicamente extendiendo la senal de excitacion de banda baja de la senal de entrada 130 (o de la version codificada de la senal de entrada 130).
[0052] El ajustador de envolvente 162 puede controlar una cantidad de la envolvente basandose en la clasificacion de sonoridad 180, como se describe con referencia a las FIG. 4-7. El ajustador de envolvente 162 puede controlar la cantidad de la envolvente controlando una caracterfstica (por ejemplo, una forma, una magnitud, una ganancia y/o un intervalo de frecuencia) de la envolvente. Por ejemplo, el ajustador de envolvente 162 puede controlar el intervalo de frecuencia de la envolvente basandose en una frecuencia de corte de un filtro, como se describe con referencia a la FIG. 4. La frecuencia de corte se puede determinar basandose en la clasificacion de sonoridad 180.
[0053] Como otro ejemplo, el ajustador de envolvente 162 puede controlar la forma de la envolvente, la magnitud de la envolvente, la ganancia de la envolvente, o una combinacion de las mismas, ajustando uno o mas polos de los coeficientes de codificacion predictiva lineal (LPC) de banda alta basandose en la clasificacion de sonoridad 180, como se describe con referencia a la FIG. 5. Como otro ejemplo, el ajustador de envolvente 162 puede controlar la forma de la envolvente, la magnitud de la envolvente, la ganancia de la envolvente, o una combinacion de las mismas, ajustando los coeficientes de un filtro basandose en la clasificacion de sonoridad 180, como se describe con referencia a la FIG. 6. La caracterfstica de la envolvente se puede controlar en un dominio de transformada (por ejemplo, un dominio de frecuencia) o en un dominio de tiempo, como se describe con referencia a las FIG. 4-6.
[0054] El ajustador de envolvente 162 puede proporcionar la envolvente de senal 182 al modulador 164. La envolvente de senal 182 puede corresponder a la cantidad controlada de la envolvente de la representacion de la senal de entrada 130.
[0055] El modulador 164 puede usar la envolvente de senal 182 para modular un ruido blanco 156 para generar el ruido blanco modulado 184. El modulador 164 puede proporcionar el ruido blanco modulado 184 al circuito de salida 166.
[0056] El circuito de salida 166 puede generar la senal de excitacion de banda alta 186 basandose en el ruido blanco modulado 184. Por ejemplo, el circuito de salida 166 puede combinar el ruido blanco modulado 184 con otra senal para generar la senal de excitacion de banda alta 186. En un modo de realizacion particular, la otra senal puede corresponder a una senal extendida generada basandose en la senal de excitacion de banda baja. Por ejemplo, el circuito de salida 166 puede generar la senal extendida muestreando de forma ascendente la senal de excitacion de banda baja, aplicando una funcion de valor absoluto a la senal muestreada de forma ascendente, muestreando de forma descendente el resultado de aplicar la funcion de valor absoluto, y usando un blanqueo adaptativo para aplanar espectralmente la senal muestreada de forma descendente con un filtro de prediccion lineal (por ejemplo, un filtro de prediccion lineal de cuarto orden). En un modo de realizacion particular, el circuito de salida 166 puede escalar el ruido blanco modulado 184 y la otra senal basandose en un parametro de armonicidad, como se describe con referencia a las FIG. 4-7.
[0057] En un modo de realizacion particular, el circuito de salida 166 puede combinar una primera relacion de ruido blanco modulado con una segunda relacion de ruido blanco sin modular para generar ruido blanco escalado, donde la primera relacion y la segunda relacion se determinan basandose en la clasificacion de sonoridad 180, como se describe con referencia a la FIG. 7. En este modo de realizacion, el circuito de salida 166 puede combinar el ruido blanco escalado con la otra senal para generar la senal de excitacion de banda alta 186. El circuito de salida 166 puede proporcionar la senal de excitacion de banda alta 186 al sintetizador de banda alta 168.
[0058] El sintetizador de banda alta 168 puede generar una senal de banda alta sintetizada 188 basandose en la senal de excitacion de banda alta 186. Por ejemplo, el sintetizador de banda alta 168 puede modelar y/o descodificar la informacion de parametros de banda alta basandose en un modelo de banda alta particular y puede usar la senal de excitacion de banda alta 186 para generar la senal de banda alta sintetizada 188. El sintetizador de banda alta 168 puede proporcionar la senal de banda alta sintetizada 188 al MUX 170.
[0059] Un descodificador de banda baja del primer dispositivo 102 puede generar una senal de banda baja sintetizada. Por ejemplo, el descodificador de banda baja puede descodificar y/o modelar la informacion de parametros de banda baja basandose en un modelo de banda baja particular y puede usar la senal de excitacion de banda baja para generar la senal de banda baja sintetizada. El MUX 170 puede combinar la senal de banda alta sintetizada 188 y la senal de banda baja sintetizada para generar una senal de salida 116 (por ejemplo, una senal de audio descodificada).
[0060] La senal de salida 116 se puede amplificar o reducir mediante un ajustador de ganancia. El primer dispositivo 102 puede proporcionar la senal de salida 116, a traves del altavoz 142, al segundo usuario 154. Por ejemplo, la salida del ajustador de ganancia puede convertirse de una senal digital a una senal analogica mediante un convertidor de digital a analogico, y reproducirse a traves del altavoz 142.
[0061] Por tanto, el sistema 100 puede permitir la generacion de una senal sintetizada de sonoridad "suave" cuando la senal de audio sintetizada corresponde a una senal de entrada sorda (o fuertemente sorda). Una senal de banda alta sintetizada se puede generar usando una senal de ruido que se modula basandose en una clasificacion de sonoridad de una senal de entrada. La senal de ruido modulada puede corresponder mas estrechamente a la senal de entrada cuando la senal de entrada es fuertemente sonora que cuando la senal de entrada es fuertemente sorda. En un modo de realizacion particular, la senal de banda alta sintetizada puede tener una dispersion reducida o nula cuando la senal de entrada es fuertemente sorda, lo que resulta en una senal de audio sintetizada mas suave (por ejemplo, que tiene menos artefactos).
[0062] Haciendo referencia a la FIG. 2, se divulga un modo de realizacion particular de un descodificador que se puede operar para realizar la generacion de senal de excitacion de banda alta y, en general, se designa como 200. En un modo de realizacion particular, el descodificador 200 puede corresponder a, o estar incluido en, el sistema 100 de la FIG. 1. Por ejemplo, el descodificador 200 puede estar incluido en el primer dispositivo 102, en el dispositivo movil 104, o en ambos. El descodificador 200 puede ilustrar la descodificacion de una senal de audio codificada en un dispositivo de recepcion (por ejemplo, el primer dispositivo 102).
[0063] El descodificador 200 incluye un desmultiplexor (DEMUX) 202 acoplado a un sintetizador de banda baja 204, un generador de factor de sonoridad 208, y el sintetizador de banda alta 168. El sintetizador de banda baja 204 y el generador de factor de sonoridad 208 pueden estar acoplados al sintetizador de banda alta 168 a traves de un generador de senal de excitacion 222. En un modo de realizacion particular, el generador de factor de sonoridad 208 puede corresponder al clasificador de sonoridad 160 de la FIG. 1. El generador de senal de excitacion 222 puede ser un modo de realizacion particular del modulo de generacion de senal de excitacion 122 de la FIG. 1. Por ejemplo, el generador de senal de excitacion 222 puede incluir el ajustador de envolvente 162, el modulador 164, el circuito de salida 166, el clasificador de sonoridad 160, o una combinacion de los mismos. El sintetizador de banda baja 204 y el sintetizador de banda alta 168 pueden estar acoplados al MUX 170.
[0064] Durante la operacion, el DEMUX 202 puede recibir el flujo de bits 132. El flujo de bits 132 puede corresponder a tramas de una senal de audio codificada mediante modulacion por codificacion de impulsos (PCM). Por ejemplo, un convertidor de analogico a digital (ADC) en el primer dispositivo 102 puede convertir el flujo de bits 132 de una senal analogica a una senal PCM digital que tiene multiples tramas. El DEMUX 202 puede generar una porcion de banda baja del flujo de bits 232 y una porcion de banda alta del flujo de bits 218 a partir del flujo de bits 132. El DEMUX 202 puede proporcionar la porcion de banda baja del flujo de bits 232 al sintetizador de banda baja 204 y puede proporcionar la porcion de banda alta del flujo de bits 218 al sintetizador de banda alta 168.
[0065] El sintetizador de banda baja 204 puede extraer y/o descodificar uno o mas parametros 242 (por ejemplo, informacion de parametros de banda baja de la senal de entrada 130) y una senal de excitacion de banda baja 244 (por ejemplo, un residuo de banda baja de la senal de entrada 130) de la porcion de banda baja del flujo de bits 232. En un modo de realizacion particular, el sintetizador de banda baja 204 puede extraer un parametro de armonicidad 246 de la porcion de banda baja del flujo de bits 232.
[0066] El parametro de armonicidad 246 se puede integrar en la porcion de banda baja del flujo de bits 232 durante la codificacion del flujo de bits 232 y puede corresponder a una relacion de energfa armonica a ruido en una banda alta de la senal de entrada 130. El sintetizador de banda baja 204 puede determinar el parametro de armonicidad 246 basandose en un valor de ganancia de tono. El sintetizador de banda baja 204 puede determinar el valor de ganancia de tono basandose en los parametros 242. En un modo de realizacion particular, el sintetizador de banda baja 204 puede extraer el parametro de armonicidad 246 de la porcion de banda baja del flujo de bits 232. Por ejemplo, el dispositivo movil 104 puede incluir el parametro de armonicidad 246 en el flujo de bits 132, como se describe con referencia a la FIG. 3.
[0067] El sintetizador de banda baja 204 puede generar una senal de banda baja sintetizada 234 basandose en los parametros 242 y la senal de excitacion de banda baja 244 usando un modelo de banda baja particular. El sintetizador de banda baja 204 puede proporcionar la senal de banda baja sintetizada 234 al MUX 170.
[0068] El generador de factor de sonoridad 208 puede recibir los parametros 242 del sintetizador de banda baja 204. El generador de factor de sonoridad 208 puede generar un factor de sonoridad 236 (por ejemplo, un valor de 0,0 a 1,0) basandose en los parametros 242, una decision de sonoridad previa, uno o mas factores diferentes, o una combinacion de los mismos. El factor de sonoridad 236 puede indicar una naturaleza sonora/sorda (por ejemplo, fuertemente sonora, debilmente sonora, debilmente sorda o fuertemente sorda) de la senal de entrada 130. Los parametros 242 pueden incluir una tasa de cruces por cero de una senal de banda baja de la senal de entrada 130, un primer coeficiente de reflexion, una relacion de energfa de una contribucion de libro de codigos adaptativo en la excitacion de la banda baja a energfa de una suma de contribuciones de libro de codigos adaptativo y libro de codigos fijo en la excitacion de banda baja, una ganancia de tono de la senal de banda baja de la senal de entrada 130, o una combinacion de los mismos. El generador de factor de sonoridad 208 puede determinar el factor de sonoridad 236 basandose en la Ecuacion 1.
Factor de sonoridad = Eai* p i c, (Ecuacion 1)
donde i e {0, ..., M - 1}, donde ai y c son pesos, pi corresponde a un parametro de senal medido particular, y M corresponde a un cierto numero de parametros usados en la determinacion del factor de sonoridad.
[0069] En un modo de realizacion ilustrativo, el Factor de sonoridad = -0,4231 * ZCR + 0,2712 * FR + 0,0458 * ACB_to_excitation + 0,1849 * PG + 0,0138 * prev_voicing_decision + 0.0611, donde ZCR corresponde a la tasa de cruces por cero, FR corresponde al primer coeficiente de reflexion, ACB_to_excitation correspondiente a la relacion de energfa de una contribucion de libro de codigos adaptativo en la excitacion de banda baja a energfa de una suma de contribuciones de libro de codigos adaptativo y libro de codigos fijo en la excitacion de banda baja, PG corresponde a la ganancia de tono, y previous_voicing_decision corresponde a otro factor de sonoridad calculado previamente para otra trama. En un modo de realizacion particular, el generador de factor de sonoridad 208 puede usar un umbral mas alto para clasificar una trama como sorda que como sonora. Por ejemplo, el generador de factor de sonoridad 208 puede clasificar la trama como sorda si una trama precedente se clasifico como sorda y la trama tiene un valor de sonoridad que cumple un primer umbral (por ejemplo, un umbral bajo). El generador de factor de sonoridad 208 puede determinar el valor de sonoridad basandose en la tasa de cruces por cero de la senal de banda baja de la senal de entrada 130, el primer coeficiente de reflexion, la relacion de energfa de la contribucion de libro de codigos adaptativo en la excitacion de banda baja a energfa de la suma de contribuciones de libro de codigos adaptativo y libro de codigos fijo en la excitacion de banda baja, la ganancia de tono de la senal de banda baja de la senal de entrada 130, o una combinacion de los mismos. De forma alternativa, el generador de factor de sonoridad 208 puede clasificar la trama como sorda si el valor de sonoridad de la trama cumple un segundo umbral (por ejemplo, un umbral muy bajo). En un modo de realizacion particular, el factor de sonoridad 236 puede corresponder a la clasificacion de sonoridad 180 de la FIG. 1.
[0070] El generador de senal de excitacion 222 puede recibir la senal de excitacion de banda baja 244 y el parametro de armonicidad 246 del sintetizador de banda baja 204 y puede recibir el factor de sonoridad 236 del generador de factor de sonoridad 208. El generador de senal de excitacion 222 puede generar la senal de excitacion de banda alta 186 basandose en la senal de excitacion de banda baja 244, el parametro de armonicidad 246 y el factor de sonoridad 236, como se describe con referencia a las FIG. 1 y 4-7. Por ejemplo, el ajustador de envolvente 162 puede controlar una cantidad de una envolvente de la senal de excitacion de banda baja 244 basandose en el factor de sonoridad 236, como se describe con referencia a las FIG. 1 y 4-7. En un modo de realizacion particular, la envolvente de senal 182 puede corresponder a la cantidad controlada de la envolvente. El ajustador de envolvente 162 puede proporcionar la envolvente de senal 182 al modulador 164.
[0071] El modulador 164 puede modular el ruido blanco 156 usando la envolvente de senal 182 para generar el ruido blanco modulado 184, como se describe con referencia a las FIG. 1 y 4-7. El modulador 164 puede proporcionar el ruido blanco modulado 184 al circuito de salida 166.
[0072] El circuito de salida 166 puede generar la senal de excitacion de banda alta 186 combinando el ruido blanco modulado 184 y otra senal, como se describe con referencia a las FIG. 1 y 4-7. En un modo de realizacion particular, el circuito de salida 166 puede combinar el ruido blanco modulado 184 y la otra senal basandose en el parametro de armonicidad 246, como se describe con referencia a las FIG. 4-7.
[0073] El circuito de salida 166 puede proporcionar la senal de excitacion de banda alta 186 al sintetizador de banda alta 168. El sintetizador de banda alta 168 puede proporcionar una senal de banda alta sintetizada 188 al MUX 170 basandose en la senal de excitacion de banda alta 186 y la porcion de banda alta del flujo de bits 218. Por ejemplo, el sintetizador de banda alta 168 puede extraer parametros de banda alta de la senal de entrada 130 de la porcion de banda alta del flujo de bits 218. El sintetizador de banda alta 168 puede usar los parametros de banda alta y la senal de excitacion de banda alta 186 para generar la senal de banda alta sintetizada 188 basandose en un modelo de banda alta particular. En un modo de realizacion particular, el MUX 170 puede combinar la senal de banda baja sintetizada 234 y la senal de banda alta sintetizada 188 para generar la senal de salida 116.
[0074] El descodificador 200 de la FIG. 2 puede permitir por tanto la generacion de una senal sintetizada de sonoridad "suave" cuando la senal de audio sintetizada corresponde a una senal de entrada sorda (o fuertemente sorda). Una senal de banda alta sintetizada se puede generar usando una senal de ruido que se modula basandose en una clasificacion de sonoridad de una senal de entrada. La senal de ruido modulada puede corresponder mas estrechamente a la senal de entrada cuando la senal de entrada es fuertemente sonora que cuando la senal de entrada es fuertemente sorda. En un modo de realizacion particular, la senal de banda alta sintetizada puede tener una dispersion reducida o nula cuando la senal de entrada es fuertemente sorda, lo que resulta en una senal de audio sintetizada mas suave (por ejemplo, que tiene menos artefactos). Ademas, determinar la clasificacion de sonoridad (o el factor de sonoridad) basandose en una decision de sonoridad previa puede mitigar los efectos de una clasificacion erronea de una trama y puede dar como resultado una transicion mas suave entre tramas sonoras y sordas.
[0075] Haciendo referencia a la FIG. 3, se divulga un modo de realizacion particular de un codificador que se puede operar para realizar la generacion de senal de excitacion de banda alta y, en general, se designa como 300. En un modo de realizacion particular, el codificador 300 puede corresponder a, o estar incluido en, el sistema 100 de la FIG. 1. Por ejemplo, el codificador 300 puede estar incluido en el primer dispositivo 102, en el dispositivo movil 104, o en ambos. El codificador 300 puede ilustrar la codificacion de una senal de audio en un dispositivo de transmision (por ejemplo, el dispositivo movil 104).
[0076] El codificador 300 incluye un banco de filtros 302 acoplado a un codificador de banda baja 304, el generador de factor de sonoridad 208 y el codificador de banda alta 172. El codificador de banda baja 304 puede estar acoplado al MUX 174. El codificador de banda baja 304 y el generador de factor de sonoridad 208 pueden estar acoplados al codificador de banda alta 172 a traves del generador de senal de excitacion 222. El codificador de banda alta 172 puede estar acoplado al MUX 174.
[0077] Durante la operacion, el banco de filtros 302 puede recibir la senal de entrada 130. Por ejemplo, la senal de entrada 130 puede recibirse mediante el dispositivo movil 104 de la FIG. 1 a traves del microfono 146. El banco de filtros 302 puede separar la senal de entrada 130 en multiples senales incluyendo una senal de banda baja 334 y una senal de banda alta 340. Por ejemplo, el banco de filtros 302 puede generar la senal de banda baja 334 usando un filtro de paso bajo correspondiente a una sub-banda de frecuencia inferior (por ejemplo, 50 Hz - 7 kHz) de la senal de entrada 130 y puede generar la senal de banda alta 340 usando un filtro de paso alto correspondiente a una sub-banda de frecuencia superior (por ejemplo, 7 kHz - 16 kHz) de la senal de entrada 130. El banco de filtros 302 puede proporcionar la senal de banda baja 334 al codificador de banda baja 304 y puede proporcionar la senal de banda alta 340 al codificador de banda alta 172.
[0078] El codificador de banda baja 304 puede generar los parametros 242 (por ejemplo, informacion de parametros de banda baja) y la senal de excitacion de banda baja 244 basandose en la senal de banda baja 334. Por ejemplo, los parametros 242 pueden incluir coeficientes de LPC de banda baja, LSF de banda baja, pares espectrales de lfnea (LSP) de banda baja o una combinacion de los mismos. La senal de excitacion de banda baja 244 puede corresponder a una senal residual de banda baja. El codificador de banda baja 304 puede generar los parametros 242 y la senal de excitacion de banda baja 244 basandose en un modelo de banda baja particular (por ejemplo, un modelo de prediccion lineal particular). Por ejemplo, el codificador de banda baja 304 puede generar los parametros 242 (por ejemplo, los coeficientes de filtro correspondientes a los formantes) de la senal de banda baja 334, puede filtrar de forma inversa la senal de banda baja 334 basandose en los parametros 242, y puede restar la senal filtrada de forma inversa a la senal de banda baja 334 para generar la senal de excitacion de banda baja 244 (por ejemplo, la senal residual de banda baja de la senal de banda baja 334). El codificador de banda baja 304 puede generar el flujo de bits de banda baja 342 incluyendo los parametros 242 y la senal de excitacion de banda baja 244. En un modo de realizacion particular, el flujo de bits de banda baja 342 puede incluir el parametro de armonicidad 246. Por ejemplo, el codificador de banda baja 304 puede determinar el parametro de armonicidad 246, como se describe con referencia al sintetizador de banda baja 204 de la FIG. 2.
[0079] El codificador de banda baja 304 puede proporcionar los parametros 242 al generador de factor de sonoridad 208 y puede proporcionar la senal de excitacion de banda baja 244 y el parametro de armonicidad 246 al generador de senal de excitacion 222. El generador de factor de sonoridad 208 puede determinar el factor de sonoridad 236 basandose en los parametros 242, como se describe con referencia a la FIG. 2. El generador de senal de excitacion 222 puede determinar la senal de excitacion de banda alta 186 basandose en la senal de excitacion de banda baja 244, el parametro de armonicidad 246 y el factor de sonoridad 236, como se describe con referencia a las FIG. 2 y 4-7.
[0080] El generador de senal de excitacion 222 puede proporcionar la senal de excitacion de banda alta 186 al codificador de banda alta 172. El codificador de banda alta 172 puede generar el flujo de bits de banda alta 190 basandose en la senal de banda alta 340 y la senal de excitacion de banda alta 186, como se describe con referenda a la FIG. 1. El codificador de banda alta 172 puede proporcionar el flujo de bits de banda alta 190 al MUX 174. El MUX 174 puede combinar el flujo de bits de banda baja 342 y el flujo de bits de banda alta 190 para generar el flujo de bits 132.
[0081] El codificador 300 puede permitir por tanto la emulacion de un descodificador en un dispositivo de recepcion que genera una senal de audio sintetizada usando una senal de ruido que se modula basandose en una clasificacion de sonoridad de una senal de entrada. El codificador 300 puede generar parametros de banda alta (por ejemplo, valores de ganancia) que se usan para generar la senal de audio sintetizada para aproximarse mucho a la senal de entrada 130.
[0082] Las FIG.4-7 son diagramas para ilustrar modos de realizacion y ejemplos particulares de procedimientos de generacion de senal de excitacion de banda alta. Cada uno de los procedimientos de las FlG. 4-7 puede realizarse mediante uno o mas componentes de los sistemas 100-300 de las FIG. 1-3. Por ejemplo, cada uno de los procedimientos de las FIG. 4-7 puede realizarse mediante uno o mas componentes del modulo de generacion de senal de excitacion de banda alta 122 de la FIG. 1, el generador de senal de excitacion 222 de la FIG. 2 y/o la FIG. 3, el generador de factor de sonoridad 208 de la FIG. 2, o una combinacion de los mismos. Las figuras 4-7 ilustran modos de realizacion y ejemplos alternativos de procedimientos para generar una senal de excitacion de banda alta representada en un dominio de transformada, en un dominio de tiempo, o bien en el dominio de transformada o en el dominio de tiempo.
[0083] Haciendo referencia a la FIG. 4, se muestra un diagrama de un modo de realizacion particular de un procedimiento de generacion de senal de excitacion de banda alta y, en general, se designa 400. El procedimiento 400 puede corresponder a generar una senal de excitacion de banda alta representada en un dominio de transformada o bien en un dominio de tiempo.
[0084] El procedimiento 400 incluye determinar un factor de sonoridad, en 404. Por ejemplo, el generador de factor de sonoridad 208 de la FIG. 2 puede determinar el factor de sonoridad 236 basandose en una senal representativa 422. En un modo de realizacion particular, el generador de factor de sonoridad 208 puede determinar el factor de sonoridad 236 basandose en uno o mas de parametros de senal diferentes. En un modo de realizacion particular, varios parametros de senal pueden funcionar de forma combinada para determinar el factor de sonoridad 236. Por ejemplo, el generador de factor de sonoridad 208 puede determinar el factor de sonoridad 236 basandose en la porcion de banda baja del flujo de bits 232 (o la senal de banda baja 334 de la FIG.
3), los parametros 242, una decision de sonoridad anterior, uno o mas factores diferentes, o una combinacion de los mismos, como se describe con referencia a las FIG. 2-3. La senal representativa 422 puede incluir la porcion de banda baja del flujo de bits 232, la senal de banda baja 334, o una senal extendida generada extendiendo la senal de excitacion de banda baja 244. La senal representativa 422 se puede representar en un dominio de transformada (por ejemplo, frecuencia) o en un dominio de tiempo. Por ejemplo, el modulo de generacion de senal de excitacion 122 puede generar la senal representativa 422 aplicando una transformada (por ejemplo, una transformada de Fourier) a la senal de entrada 130, el flujo de bits 132 de la FIG. 1, la porcion de banda baja del flujo de bits 232, la senal de banda baja 334, la senal extendida generada extendiendo la senal de excitacion de banda baja 244 de la FIG. 2, o una combinacion de los mismos.
[0085] El procedimiento 400 tambien incluye calcular una frecuencia de corte de filtro de paso bajo (LPF), en 408, y controlar una cantidad de envolvente de senal, en 410. Por ejemplo, el ajustador de envolvente 162 de la FIG. 1 puede calcular una frecuencia de corte de LPF 426 basandose en el factor de sonoridad 236. Si el factor de sonoridad 236 indica un audio fuertemente sonoro, la frecuencia de corte de LPF 426 puede ser mas alta, lo que indica una mayor influencia de una componente armonica de una envolvente temporal. Cuando el factor de sonoridad 236 indica un audio fuertemente sordo, la frecuencia de corte de LPF 426 puede ser mas baja correspondiendo a una influencia menor (o nula) de la componente armonica de la envolvente temporal.
[0086] El ajustador de envolvente 162 puede controlar la cantidad de la envolvente de senal 182 controlando una caracterfstica (por ejemplo, un intervalo de frecuencia) de la envolvente de senal 182. Por ejemplo, el ajustador de envolvente 162 puede controlar la caracterfstica de la envolvente de senal 182 aplicando un filtro de paso bajo 450 a la senal representativa 422. Una frecuencia de corte del filtro de paso bajo 450 puede ser sustancialmente igual a la frecuencia de corte de LPF 426. El ajustador de envolvente 162 puede controlar el intervalo de frecuencia de la envolvente de senal 182 siguiendo una envolvente temporal de la senal representativa 422 basada en la frecuencia de corte de LPF 426. Por ejemplo, el filtro de paso bajo 450 puede filtrar la senal representativa 422 de tal manera que la senal filtrada tenga un intervalo de frecuencia definido mediante la frecuencia de corte de LPF 426. Para ilustrar, el intervalo de frecuencia de la senal filtrada puede estar por debajo de la frecuencia de corte de LPF 426. En un modo de realizacion particular, la senal filtrada puede tener una amplitud que coincide con una amplitud de la senal representativa 422 por debajo de la frecuencia de corte de LPF 426 y puede tener una amplitud baja (por ejemplo, sustancialmente igual a 0) por encima de la frecuencia de corte de LPF 426.
[0087] Un grafico 470 ilustra una forma espectral original 482. La forma espectral original 482 puede representar la envolvente de senal 182 de la senal representativa 422. Una primera forma espectral 484 puede corresponder a la senal filtrada generada aplicando el filtro que tiene la frecuencia de corte de LPF 426 a la senal representativa 422.
[0088] La frecuencia de corte de LPF 426 puede determinar una velocidad de seguimiento. Por ejemplo, la envolvente temporal se puede seguir mas rapido (por ejemplo, actualizarse con mas frecuencia) cuando el factor de sonoridad 236 indica sonoro que cuando el factor de sonoridad 236 indica sordo. En un modo de realizacion particular, el ajustador de envolvente 162 puede controlar la caracterfstica de la envolvente de senal 182 en el dominio de tiempo. Por ejemplo, el ajustador de envolvente 162 puede controlar la caracterfstica de la envolvente de senal 182 muestra a muestra. En un modo de realizacion alternativo, el ajustador de envolvente 162 puede controlar la caracterfstica de la envolvente de senal 182 representada en el dominio de transformada. Por ejemplo, el ajustador de envolvente 162 puede controlar la caracterfstica de la envolvente de senal 182 siguiendo una forma espectral basandose en la velocidad de seguimiento. El ajustador de envolvente 162 puede proporcionar la envolvente de senal 182 al modulador 164 de la FIG. 1.
[0089] El procedimiento 400 incluye ademas multiplicar la envolvente de senal 182 por ruido blanco 156, en 412. Por ejemplo, el modulador 164 de la FIG.1 puede usar la envolvente de senal 182 para modular el ruido blanco 156 para generar el ruido blanco modulado 184. La envolvente de senal 182 puede modular el ruido blanco 156 representado en un dominio de transformada o un dominio de tiempo.
[0090] El procedimiento 400 tambien incluye decidir una mezcla, en 406. Por ejemplo, el modulador 164 de la FIG. 1 puede determinar una primera ganancia (por ejemplo, la ganancia de ruido 434) a aplicar al ruido blanco modulado 184 y una segunda ganancia (por ejemplo, la ganancia de armonicos 436) a aplicar a la senal representativa 422 basandose en el parametro de armonicidad 246 y el factor de sonoridad 236. Por ejemplo, la ganancia de ruido 434 (por ejemplo, entre 0 y 1) y la ganancia de armonicos 436 se pueden calcular para que coincidan con la relacion de energfa armonica a ruido indicada mediante el parametro de armonicidad 246. El modulador 164 puede aumentar la ganancia de ruido 434 cuando el factor de sonoridad 236 indica fuertemente sordo y puede reducir la ganancia de ruido 434 cuando el factor de sonoridad 236 indica fuertemente sonoro. En un modo de realizacion particular, el modulador 164 puede determinar la ganancia de armonicos 436 basandose en la ganancia de ruido 434. En un modo de realizacion particular, la ganancia de armonicos 436 = ■^ 1 — (ganancia de ruido 434)2.
[0091] El procedimiento 400 incluye ademas multiplicar el ruido blanco modulado 184 por la ganancia de ruido 434, en 414. Por ejemplo, el circuito de salida 166 de la FIG. 1 puede generar ruido blanco modulado escalado 438 aplicando la ganancia de ruido 434 al ruido blanco modulado 184.
[0092] El procedimiento 400 tambien incluye multiplicar la senal representativa 422 por la ganancia de armonicos 436, en 416. Por ejemplo, el circuito de salida 166 de la FIG. 1 puede generar una senal representativa escalada 440 aplicando la ganancia de armonicos 436 a la senal representativa 422.
[0093] El procedimiento 400 incluye ademas sumar el ruido blanco modulado escalado 438 y la senal representativa escalada 440, en 418. Por ejemplo, el circuito de salida 166 de la FIG. 1 puede generar la senal de excitacion de banda alta 186 combinando (por ejemplo, sumando) el ruido blanco modulado escalado 438 y la senal representativa escalada 440. En modos de realizacion alternativos, la operacion 414, la operacion 416, o ambas, pueden realizarse mediante el modulador 164 de la FIG. 1. La senal de excitacion de banda alta 186 puede estar en el dominio de transformada o en el dominio de tiempo.
[0094] Por tanto, el procedimiento 400 puede permitir que se controle una cantidad de envolvente de senal controlando una caracterfstica de la envolvente basandose en el factor de sonoridad 236. En un modo de realizacion particular, la proporcion del ruido blanco modulado 184 y la senal representativa 422 puede determinarse dinamicamente mediante factores de ganancia (por ejemplo, la ganancia de ruido 434 y la ganancia de armonicos 436) basandose en el parametro de armonicidad 246. El ruido blanco modulado 184 y la senal representativa 422 se pueden escalar de tal manera que una relacion de energfa armonica a ruido de la senal de excitacion de banda alta 186 se aproxime a la relacion de energfa armonica a ruido de la senal de banda alta de la senal de entrada 130.
[0095] En modos de realizacion particulares, el procedimiento 400 de la FIG. 4 puede implementarse mediante hardware (por ejemplo, un dispositivo de matriz de puertas programables por campo (FPGA), un circuito integrado especffico de la aplicacion (ASIC), etc.) de una unidad de procesamiento, tal como una unidad de procesamiento central (CPU), un procesador de senales digitales (DSP), o un controlador, mediante un dispositivo de firmware, o cualquier combinacion de los mismos. Como un ejemplo, el procedimiento 400 de la FIG. 4 puede realizarse mediante un procesador que ejecuta instrucciones, como se describe con respecto a la FIG. 9.
[0096] Haciendo referencia a la FIG. 5, se muestra un diagrama de un ejemplo ilustrativo de un procedimiento de generacion de senal de excitacion de banda alta y, en general, se designa 500. El procedimiento 500 puede incluir generar la senal de excitacion de banda alta controlando una cantidad de una envolvente de senal representada en un dominio de transformada, modulando el ruido blanco representado en un dominio de transformada, o ambos.
[0097] El procedimiento 500 incluye las operaciones 404, 406, 412 y 414 del procedimiento 400. La senal representativa 422 se puede representar en un dominio de transformada (por ejemplo, frecuencia), como se describe con referencia a la FIG. 4.
[0098] El procedimiento 500 tambien incluye calcular un factor de expansion de ancho de banda, en 508. Por ejemplo, el ajustador de envolvente 162 de la FIG. 1 puede determinar un factor de expansion de ancho de banda 526 basandose en el factor de sonoridad 236. Por ejemplo, el factor de expansion de ancho de banda 526 puede indicar una mayor expansion de ancho de banda cuando el factor de sonoridad 236 indica fuertemente sonoro que cuando el factor de sonoridad 236 indica fuertemente sordo.
[0099] El procedimiento 500 incluye ademas generar un espectro ajustando los polos de LPC de banda alta, en 510. Por ejemplo, el ajustador de envolvente 162 puede determinar los polos de LPC asociados con la senal representativa 422. El ajustador de envolvente 162 puede controlar una caracterfstica de la envolvente de senal 182 controlando una magnitud de la envolvente de senal 182, una forma de la envolvente de senal 182, una ganancia de la envolvente de senal 182, o una combinacion de las mismas. Por ejemplo, el ajustador de envolvente 162 puede controlar la magnitud de la envolvente de senal 182, la forma de la envolvente de senal 182, la ganancia de la envolvente de senal 182, o una combinacion de las mismas, ajustando los polos de LPC basandose en el factor de expansion de ancho de banda 526 . En un ejemplo particular, los polos de LPC se pueden ajustar en un dominio de transformada. El ajustador de envolvente 162 puede generar un espectro basandose en los polos de LPC ajustados.
[0100] Un grafico 570 ilustra una forma espectral original 582. La forma espectral original 582 puede representar la envolvente de senal 182 de la senal representativa 422. La forma espectral original 582 se puede generar basandose en los polos de LPC asociados con la senal representativa 422. El ajustador de envolvente 162 puede ajustar los polos de LPC basandose en el factor de sonoridad 236. El ajustador de envolvente 162 puede aplicar un filtro correspondiente a los polos de LPC ajustados a la senal representativa 422 para generar una senal filtrada que tiene una primera forma espectral 584 o una segunda forma espectral 586. La primera forma espectral 584 de la senal filtrada puede corresponder a los polos de LPC ajustados cuando el factor de sonoridad 236 indica fuertemente sonoro. La segunda forma espectral 586 de la senal filtrada puede corresponder a los polos de LPC ajustados cuando el factor de sonoridad 236 indica fuertemente sordo.
[0101] La envolvente de senal 182 puede corresponder al espectro generado, los polos de LPC ajustados, los coeficientes LPC asociados con la senal representativa 422 que tiene los polos de LPC ajustados, o una combinacion de los mismos. El ajustador de envolvente 162 puede proporcionar la envolvente de senal 182 al modulador 164 de la FIG. 1.
[0102] El modulador 164 puede modular el ruido blanco 156 usando la envolvente de senal 182 para generar el ruido blanco modulado 184, como se describe con referencia a la operacion 412 del procedimiento 400. El modulador 164 puede modular el ruido blanco 156 representado en un dominio de transformada. El circuito de salida 166 de la FIG. 1 puede generar el ruido blanco modulado escalado 438 basandose en el ruido blanco modulado 184 y la ganancia de ruido 434, como se describe con referencia a la operacion 414 del procedimiento 400.
[0103] El procedimiento 500 tambien incluye multiplicar un espectro de LPC de banda alta 542 por la senal representativa 422, en 512. Por ejemplo, el circuito de salida 166 de la FIG. 1 puede filtrar la senal representativa 422 usando el espectro de LPC de banda alta 542 para generar una senal filtrada 544. En un ejemplo particular, el circuito de salida 166 puede determinar el espectro de LPC de banda alta 542 basandose en parametros de banda alta (por ejemplo, coeficientes de LPC de banda alta) asociados con la senal representativa 422. Para ilustrar, el circuito de salida 166 puede determinar el espectro de LPC de banda alta 542 basandose en la porcion de banda alta del flujo de bits 218 de la FIG. 2 o basandose en la informacion de parametros de banda alta generada a partir de la senal de banda alta 340 de la FIG. 3.
[0104] La senal representativa 422 puede corresponder a una senal extendida generada a partir de la senal de excitacion de banda baja 244 de la FIG. 2. El circuito de salida 166 puede sintetizar la senal extendida usando el espectro de LPC de banda alta 542 para generar la senal filtrada 544. La sfntesis puede estar en el dominio de transformada. Por ejemplo, el circuito de salida 166 puede realizar la sfntesis usando la multiplicacion en el dominio de frecuencia.
[0105] El procedimiento 500 incluye ademas multiplicar la senal filtrada 544 por la ganancia de armonicos 436, en 516. Por ejemplo, el circuito de salida 166 de la FIG. 1 puede multiplicar la senal filtrada 544 por la ganancia de armonicos 436 para generar una senal filtrada escalada 540. En un ejemplo particular, la operacion 512, la operacion 516, o ambas, pueden realizarse mediante el modulador 164 de la FIG. 1.
[0106] El procedimiento 500 tambien incluye sumar el ruido blanco modulado escalado 438 y la senal filtrada escalada 540, en 518. Por ejemplo, el circuito de salida 166 de la FIG. 1 puede combinar el ruido blanco modulado escalado 438 y la senal filtrada escalada 540 para generar la senal de excitacion de banda alta 186. La senal de excitacion de banda alta 186 se puede representar en el dominio de transformada.
[0107] Por tanto, el procedimiento 500 puede permitir que una cantidad de envolvente de senal se controle ajustando los polos de LPC de banda alta en el dominio de transformada basandose en el factor de sonoridad 236. En un ejemplo particular, la proporcion del ruido blanco modulado 184 y la senal filtrada 544 puede determinarse dinamicamente mediante ganancias (por ejemplo, la ganancia de ruido 434 y la ganancia de armonicos 436) basandose en el parametro de armonicidad 246. El ruido blanco modulado 184 y la senal filtrada 544 se pueden escalar de tal manera que una relacion de energfa armonica a ruido de la senal de excitacion de banda alta 186 se aproxime a la relacion de energfa armonica a ruido de la senal de banda alta de la senal de entrada 130.
[0108] En ejemplos particulares, el procedimiento 500 ilustrado en la FIG. 5 puede implementarse mediante hardware (por ejemplo, un dispositivo de matriz de puertas programables por campo (FPGA), un circuito integrado especffico de la aplicacion (ASIC), etc.) de una unidad de procesamiento, tal como una unidad de procesamiento central (CPU), un procesador de senales digitales (DSP), o un controlador, a traves de un dispositivo de firmware, o cualquier combinacion de los mismos. Como un ejemplo, el procedimiento 500 de la FIG. 5 puede realizarse mediante un procesador que ejecuta instrucciones, como se describe con respecto a la FIG. 9.
[0109] Haciendo referencia a la FIG. 6, se muestra un diagrama de un ejemplo ilustrativo de un procedimiento de generacion de senal de excitacion de banda alta y, en general, se designa 600. El procedimiento 600 puede incluir generar una senal de excitacion de banda alta controlando una cantidad de una envolvente de senal en un dominio de tiempo.
[0110] El procedimiento 600 incluye las operaciones 404, 406 y 414 del procedimiento 400 y la operacion 508 del procedimiento 500. La senal representativa 422 y el ruido blanco 156 pueden estar en un dominio de tiempo.
[0111] El procedimiento 600 tambien incluye realizar la sfntesis de LPC, en 610. Por ejemplo, el ajustador de envolvente 162 de la FIG. 1 puede controlar una caracterfstica (por ejemplo, una forma, una magnitud y/o una ganancia) de la envolvente de senal 182 ajustando los coeficientes de un filtro basandose en el factor de expansion de ancho de banda 526. En un ejemplo particular, la sfntesis de LPC se puede realizar en un dominio de tiempo. Los coeficientes del filtro pueden corresponder a los coeficientes de LPC de banda alta. Los coeficientes de filtro de LPC pueden representar picos espectrales. Controlar los picos espectrales ajustando los coeficientes de filtro de LPC puede permitir el control de un grado de modulacion del ruido blanco 156 basandose en el factor de sonoridad 236.
[0112] Por ejemplo, los picos espectrales se pueden mantener cuando el factor de sonoridad 236 indica voz sonora. Como otro ejemplo, los picos espectrales se pueden suavizar al tiempo que se conserva una forma espectral global cuando el factor de sonoridad 236 indica voz sorda.
[0113] Un grafico 670 ilustra una forma espectral original 682. La forma espectral original 682 puede representar la envolvente de senal 182 de la senal representativa 422. La forma espectral original 682 se puede generar basandose en los coeficientes de filtro de LPC asociados con la senal representativa 422. El ajustador de envolvente 162 puede ajustar los coeficientes de filtro de LPC basandose en el factor de sonoridad 236. El ajustador de envolvente 162 puede aplicar un filtro correspondiente a los coeficientes de filtro de LPC ajustados a la senal representativa 422 para generar una senal filtrada que tiene una primera forma espectral 684 o una segunda forma espectral 686. La primera forma espectral 684 de la senal filtrada puede corresponder a los coeficientes de filtro de LPC ajustados cuando el factor de sonoridad 236 indica fuertemente sonoro. Los picos espectrales se pueden mantener cuando el factor de sonoridad 236 indica fuertemente sonoro, como se ilustra mediante la primera forma espectral 684. La segunda forma espectral 686 puede corresponder a los coeficientes de filtro de LPC ajustados cuando el factor de sonoridad 236 indica fuertemente sordo. Se puede mantener una forma espectral global al tiempo que se pueden suavizar los picos espectrales cuando el factor de sonoridad 236 indica fuertemente sordo, como se ilustra mediante la segunda forma espectral 686. La envolvente de senal 182 puede corresponder a los coeficientes de filtro ajustados. El ajustador de envolvente 162 puede proporcionar la envolvente de senal 182 al modulador 164 de la FIG. 1.
[0114] El modulador 164 puede modular el ruido blanco 156 usando la envolvente de senal 182 (por ejemplo, los coeficientes de filtro ajustados) para generar el ruido blanco modulado 184. Por ejemplo, el modulador 164 puede aplicar un filtro al ruido blanco 156 para generar el ruido blanco modulado 184, donde el filtro tiene los coeficientes de filtro ajustados. El modulador 164 puede proporcionar el ruido blanco modulado 184 al circuito de salida 166 de la FIG. 1. El circuito de salida 166 puede multiplicar el ruido blanco modulado 184 por la ganancia de ruido 434 para generar el ruido blanco modulado escalado 438, como se describe con referencia a la operacion 414 de la FIG. 4.
[0115] El procedimiento 600 incluye ademas realizar la sfntesis de LPC de banda alta, en 612. Por ejemplo, el circuito de salida 166 de la FIG. 1 puede sintetizar la senal representativa 422 para generar una senal de banda alta sintetizada 614. La sfntesis se puede realizar en el dominio de tiempo. En un ejemplo particular, la senal representativa 422 se puede generar extendiendo una senal de excitacion de banda baja. El circuito de salida 166 puede generar la senal de banda alta sintetizada 614 aplicando un filtro de sfntesis que usa LPC de banda alta a la senal representativa 422.
[0116] El procedimiento 600 tambien incluye multiplicar la senal de banda alta sintetizada 614 por la ganancia de armonicos 436, en 616. Por ejemplo, el circuito de salida 166 de la FIG. 1 puede aplicar la ganancia de armonicos 436 a la senal de banda alta sintetizada 614 para generar la senal de banda alta sintetizada escalada 640. En un ejemplo alternativo, el modulador 164 de la FIG. 1 puede realizar la operacion 612, la operacion 616 o ambas.
[0117] El procedimiento 600 incluye ademas sumar el ruido blanco modulado escalado 438 y la senal de banda alta sintetizada escalada 640, en 618. Por ejemplo, el circuito de salida 166 de la FIG. 1 puede combinar el ruido blanco modulado escalado 438 y la senal de banda alta sintetizada escalada 640 para generar la senal de excitacion de banda alta 186.
[0118] Por tanto, el procedimiento 600 puede permitir que se controle una cantidad de envolvente de senal ajustando los coeficientes de un filtro basandose en el factor de sonoridad 236. En un ejemplo particular, la proporcion del ruido blanco modulado 184 y la senal de banda alta sintetizada 614 se puede determinar dinamicamente basandose en el factor de sonoridad 236. El ruido blanco modulado 184 y la senal de banda alta sintetizada 614 se pueden escalar de tal manera que una relacion de energfa armonica a ruido de la senal de excitacion de banda alta 186 se aproxime a la relacion de energfa armonica a ruido de la senal de banda alta de la senal de entrada 130.
[0119] En ejemplos particulares, el procedimiento 600 ilustrado en la FIG. 6 puede implementarse mediante hardware (por ejemplo, un dispositivo de matriz de puertas programables por campo (FPGA), un circuito integrado especffico de la aplicacion (ASIC), etc.) de una unidad de procesamiento, tal como una unidad de procesamiento central (CPU), un procesador de senales digitales (DSP), o un controlador, a traves de un dispositivo de firmware, o cualquier combinacion de los mismos. Como un ejemplo, el procedimiento 600 de la FIG. 6 puede realizarse mediante un procesador que ejecuta instrucciones, como se describe con respecto a la FIG. 9.
[0120] Haciendo referencia a la FIG. 7, se muestra un diagrama de un ejemplo ilustrativo de un procedimiento de generacion de senal de excitacion de banda alta y, en general, se designa 700. El procedimiento 700 puede corresponder a generar una senal de excitacion de banda alta controlando una cantidad de envolvente de senal representada en un dominio de tiempo o un dominio de transformada (por ejemplo, frecuencia).
[0121] El procedimiento 700 incluye las operaciones 404, 406, 412, 414 y 416 del procedimiento 400. La senal representativa 422 se puede representar en un dominio de transformada o en un dominio de tiempo. El procedimiento 700 tambien incluye determinar una envolvente de senal, en 710. Por ejemplo, el ajustador de envolvente 162 de la FIG. 1 puede generar la envolvente de senal 182 aplicando un filtro de paso bajo a la senal representativa 422 con un coeficiente constante.
[0122] El procedimiento 700 tambien incluye determinar un valor cuadratico medio, en 702. Por ejemplo, el modulador 164 de la FIG. 1 puede determinar una energfa cuadratica media de la envolvente de senal 182.
[0123] El procedimiento 700 incluye ademas multiplicar el valor cuadratico medio por el ruido blanco 156, en 712. Por ejemplo, el circuito de salida 166 de la FIG. 1 puede multiplicar el valor cuadratico medio por el ruido blanco 156 para generar ruido blanco sin modular 736.
[0124] El modulador 164 de la FIG. 1 puede multiplicar la envolvente de senal 182 por el ruido blanco 156 para generar ruido blanco modulado 184, como se describe con referencia a la operacion 412 del procedimiento 400. El ruido blanco 156 se puede representar en un dominio de transformada o en un dominio de tiempo.
[0125] El procedimiento 700 tambien incluye determinar una proporcion de ganancia para ruido blanco modulado y sin modular, en 704. Por ejemplo, el circuito de salida 166 de la FIG. 1 puede determinar una ganancia de ruido sin modular 734 y una ganancia de ruido modulado 732 basandose en la ganancia de ruido 434 y el factor de sonoridad 236. Si el factor de sonoridad 236 indica que la senal de audio codificada corresponde a audio fuertemente sonoro, la ganancia de ruido modulado 732 puede corresponder a una mayor proporcion de la ganancia de ruido 434. Si el factor de sonoridad 236 indica que la senal de audio codificada corresponde a audio fuertemente sordo, la ganancia de ruido sin modular 734 puede corresponder a una mayor proporcion de la ganancia de ruido 434.
[0126] El procedimiento 700 incluye ademas multiplicar la ganancia de ruido sin modular 734 por el ruido blanco sin modular 736, en 714. Por ejemplo, el circuito de salida 166 de la FIG. 1 puede aplicar la ganancia de ruido sin modular 734 al ruido blanco sin modular 736 para generar ruido blanco sin modular escalado 742.
[0127] El circuito de salida 166 puede aplicar la ganancia de ruido modulado 732 al ruido blanco modulado 184 para generar ruido blanco modulado escalado 740, como se describe con referencia a la operacion 414 del procedimiento 400.
[0128] El procedimiento 700 tambien incluye sumar el ruido blanco sin modular escalado 742 y el ruido blanco escalado 744, en 716. Por ejemplo, el circuito de salida 166 de la FIG. 1 puede combinar el ruido blanco sin modular escalado 742 y el ruido blanco modulado escalado 740 para generar ruido blanco escalado 744.
[0129] El procedimiento 700 incluye ademas sumar el ruido blanco escalado 744 y la senal representativa escalada 440, en 718. Por ejemplo, el circuito de salida 166 puede combinar el ruido blanco escalado 744 y la senal representativa escalada 440 para generar la senal de excitacion de banda alta 186. El procedimiento 700 puede generar la senal de excitacion de banda alta 186 representada en un dominio de transformada (o tiempo) usando la senal representativa 422 y el ruido blanco 156 representados en el dominio de transformada (o tiempo).
[0130] Por tanto, el procedimiento 700 puede permitir que una proporcion del ruido blanco sin modular 736 y el ruido blanco modulado 184 se determinen dinamicamente mediante factores de ganancia (por ejemplo, la ganancia de ruido sin modular 734 y la ganancia de ruido modulado 732) basandose en el factor de sonoridad 236. La senal de excitacion de banda alta 186 para audio fuertemente sordo puede corresponder a ruido blanco sin modular con menos artefactos que una senal de banda alta correspondiente a ruido blanco modulado basandose en un residuo de banda baja escasamente codificado.
[0131] En ejemplos particulares, el procedimiento 700 ilustrado en la FIG. 7 puede implementarse mediante hardware (por ejemplo, un dispositivo de matriz de puertas programables por campo (FPGA), un circuito integrado especffico de la aplicacion (ASIC), etc.) de una unidad de procesamiento, tal como una unidad de procesamiento central (CPU), un procesador de senales digitales (DSP), o un controlador, a traves de un dispositivo de firmware, o cualquier combinacion de los mismos. Como un ejemplo, el procedimiento 700 de la FIG. 7 puede realizarse mediante un procesador que ejecuta instrucciones, como se describe con respecto a la FIG. 9.
[0132] Haciendo referencia a la FIG. 8, se muestra un diagrama de flujo de un modo de realizacion particular de un procedimiento de generacion de senal de excitacion de banda alta y, en general, se designa 800. El procedimiento 800 puede realizarse mediante uno o mas componentes de los sistemas 100-300 de las FIG. 1-3. Por ejemplo, el procedimiento 800 puede realizarse mediante uno o mas componentes del modulo de generacion de senal de excitacion de banda alta 122 de la FIG. 1, el generador de senal de excitacion 222 de la FIG. 2 o la FIG. 3, el generador de factor de sonoridad 208 de la FIG. 2, o una combinacion de los mismos.
[0133] El procedimiento 800 incluye determinar, en un dispositivo, una clasificacion de sonoridad de una senal de entrada, en 802. La senal de entrada puede corresponder a una senal de audio. Por ejemplo, el clasificador de sonoridad 160 de la FIG. 1 puede determinar la clasificacion de sonoridad 180 de la senal de entrada 130, como se describe con referencia a la FIG. 1. La senal de entrada 130 puede corresponder a una senal de audio.
[0134] El procedimiento 800 tambien incluye controlar una cantidad de una envolvente de una representacion de la senal de entrada basandose en la clasificacion de sonoridad, en 804. Por ejemplo, el ajustador de envolvente 162 de la FIG. 1 puede controlar una cantidad de una envolvente de una representacion de la senal de entrada 130 basandose en la clasificacion de sonoridad 180, como se describe con referencia a la FIG. 1. La representacion de la senal de entrada 130 puede ser una porcion de banda baja de un flujo de bits (por ejemplo, el flujo de bits 232 de la FIG. 2), una senal de banda baja (por ejemplo, la senal de banda baja 334 de la FIG. 3), una senal extendida generada extendiendo una senal de excitacion de banda baja (por ejemplo, la senal de excitacion de banda baja 244 de la FIG. 2), otra senal, o una combinacion de las mismas. Por ejemplo, la representacion de la senal de entrada 130 puede incluir la senal representativa 422 de las FIG. 4-7.
[0135] El procedimiento 800 incluye ademas modular una senal de ruido blanco basandose en la cantidad controlada de la envolvente, en 806. Por ejemplo, el modulador 164 de la FIG. 1 puede modular el ruido blanco 156 basandose en la envolvente de senal 182. La envolvente de senal 182 puede corresponder a la cantidad controlada de la envolvente. Para ilustrar, el modulador 164 puede modular el ruido blanco 156 en un dominio de tiempo, tal como en las FIG. 4 y 6-7. De forma alternativa, el modulador 164 puede modular el ruido blanco 156 representado en un dominio de transformada, tal como en las FIG. 4-7.
[0136] El procedimiento 800 tambien incluye generar una senal de excitacion de banda alta basandose en la senal de ruido blanco modulada, en 808. Por ejemplo, el circuito de salida 166 de la FIG. 1 puede generar la senal de excitacion de banda alta 186 basandose en el ruido blanco modulado 184, como se describe con referencia a la FIG. 1.
[0137] El procedimiento 800 de la FIG. 8 puede permitir por tanto la generacion de una senal de excitacion de banda alta basandose en una cantidad controlada de una envolvente de una senal de entrada, donde la cantidad de la envolvente se controla basandose en una clasificacion de sonoridad.
[0138] En modos de realizacion particulares, el procedimiento 800 de la FIG. 8 puede implementarse mediante hardware (por ejemplo, un dispositivo de matriz de puertas programables por campo (FPGA), un circuito integrado especffico de la aplicacion (ASIC), etc.) de una unidad de procesamiento, tal como una unidad de procesamiento central (CPU), un procesador de senales digitales (DSP), o un controlador, mediante un dispositivo de firmware, o cualquier combinacion de los mismos. Como un ejemplo, el procedimiento 800 de la FIG. 8 puede realizarse mediante un procesador que ejecuta instrucciones, como se describe con respecto a la FIG. 9.
[0139] Aunque los modos de realizacion de las FIG. 1-8 describen la generacion de una senal de excitacion de banda alta basandose en una senal de banda baja, en otros modos de realizacion la senal de entrada 130 se puede filtrar para producir senales de multiples bandas. Por ejemplo, las senales de multiples bandas pueden incluir una senal de banda inferior, una senal de banda media, una senal de banda superior, una o mas senales de bandas adicionales, o una combinacion de las mismas. La senal de banda media puede corresponder a un intervalo de frecuencia mas alto que la senal de banda inferior y la senal de banda superior puede corresponder a un intervalo de frecuencia mas alto que la senal de banda media. La senal de banda inferior y la senal de banda media pueden corresponder a intervalos de frecuencia superpuestos o no superpuestos. La senal de banda media y la senal de banda superior pueden corresponder a intervalos de frecuencia superpuestos o no superpuestos.
[0140] El modulo de generacion de senal de excitacion 122 puede usar una senal de primera banda (por ejemplo, la senal de banda inferior o la senal de banda media) para generar una senal de excitacion correspondiente a una senal de segunda banda (por ejemplo, la senal de banda media o la senal de banda superior), donde la senal de primera banda corresponde a un intervalo de frecuencia mas bajo que la senal de segunda banda.
[0141] En un modo de realizacion particular, el modulo de generacion de senal de excitacion 122 puede usar una senal de primera banda para generar multiples senales de excitacion correspondientes a senales de multiples bandas. Por ejemplo, el modulo de generacion de senal de excitacion 122 puede usar la senal de banda inferior para generar una senal de excitacion de banda media correspondiente a la senal de banda media, una senal de excitacion de banda superior correspondiente a la senal de banda superior, una o mas senales de excitacion de bandas adicionales, o una combinacion de las mismas.
[0142] Con referenda a la FIG. 9, se representa un diagrama de bloques de un modo de realizacion ilustrativo particular de un dispositivo (por ejemplo, un dispositivo de comunicacion inalambrica) y, en general, se designa 900. En diversos modos de realizacion, el dispositivo 900 puede tener menos o mas componentes de los que se ilustran en la FIG. 9. En un modo de realizacion ilustrativo, el dispositivo 900 puede corresponder al dispositivo movil 104 o al primer dispositivo 102 de la FIG. 1. En un modo de realizacion ilustrativo, el dispositivo 900 puede operar de acuerdo con uno o mas de los procedimientos 400-800 de las FIG. 4-8.
[0143] En un modo de realizacion particular, el dispositivo 900 incluye un procesador 906 (por ejemplo, una unidad de procesamiento central (CPU)). El dispositivo 900 puede incluir uno o mas procesadores 910 adicionales (por ejemplo, uno o mas procesadores de senales digitales (DSP)). El procesador 910 puede incluir un codificadordescodificador (CODEC) de voz y musica 908, y un cancelador de eco 912. El CODEC de voz y musica 908 puede incluir el modulo de generacion de senal de excitacion 122 de la FIG. 1, el generador de senal de excitacion 222, el generador de factor de sonoridad 208 de la FIG. 2, un codificador de vocoder 936, un descodificador de vocoder 938, o ambos. En un modo de realizacion particular, el codificador de vocoder 936 puede incluir el codificador de banda alta 172 de la FIG. 1, el codificador de banda baja 304 de la FIG. 3, o ambos. En un modo de realizacion particular, el descodificador de vocoder 938 puede incluir el sintetizador de banda alta 168 de la FIG. 1, el sintetizador de banda baja 204 de la FIG. 2, o ambos.
[0144] Como se ilustra, el modulo de generacion de senal de excitacion 122, el generador de factor de sonoridad 208 y el generador de senal de excitacion 222 pueden ser componentes compartidos que son accesibles mediante el codificador de vocoder 936 y el descodificador de vocoder 938. En otros modos de realizacion, uno o mas del modulo de generacion de senal de excitacion 122, el generador de factor de sonoridad 208 y/o el generador de senal de excitacion 222 se pueden incluir en el codificador de vocoder 936 y el descodificador de vocoder 938.
[0145] Aunque el codec de voz y musica 908 se ilustra como un componente de los procesadores 910 (por ejemplo, circuitos dedicados y/o codigo de programacion ejecutable), en otros modos de realizacion uno o mas componentes del codec de voz y musica 908, tal como el modulo de generacion de senal de excitacion 122, se pueden incluir en el procesador 906, el codec 934, otro componente de procesamiento, o una combinacion de los mismos.
[0146] El dispositivo 900 puede incluir una memoria 932 y un CODEC 934. El dispositivo 900 puede incluir un controlador inalambrico 940 acoplado a una antena 942 a traves de un transceptor 950. El dispositivo 900 puede incluir una pantalla 928 acoplada a un controlador de pantalla 926. Se puede acoplar un altavoz 948, un microfono 946 o ambos al CODEC 934. En un modo de realizacion particular, el altavoz 948 puede corresponder al altavoz 142 de la FIG. 1. En un modo de realizacion particular, el microfono 946 puede corresponder al microfono 146 de la FIG. 1. El CODEC 934 puede incluir un convertidor de digital a analogico (DAC) 902 y un convertidor de analogico a digital (ADC) 904.
[0147] En un modo de realizacion particular, el CODEC 934 puede recibir senales analogicas desde el microfono 946, convertir las senales analogicas a senales digitales usando el convertidor de analogico a digital 904 y proporcionar las senales digitales al codec de voz y musica 908, tal como en un formato de modulacion por codificacion de impulsos (PCM). El codec de voz y musica 908 puede procesar las senales digitales. En un modo de realizacion particular, el codec de voz y musica 908 puede proporcionar senales digitales al CODEC 934. El CODEC 934 puede convertir las senales digitales en senales analogicas usando el convertidor de digital a analogico 902 y puede proporcionar las senales analogicas al altavoz 948.
[0148] La memoria 932 puede incluir instrucciones 956 ejecutables mediante el procesador 906, los procesadores 910, el CODEC 934, otra unidad de procesamiento del dispositivo 900 o una combinacion de los mismos, para realizar procedimientos y procesos divulgados en el presente documento, tal como uno o mas de los procedimientos 400-800 de las FIG. 4-8.
[0149] Uno o mas componentes de los sistemas 100-300 pueden implementarse mediante hardware dedicado (por ejemplo, circuitos), mediante un procesador que ejecuta instrucciones para realizar una o mas tareas, o una combinacion de los mismos. Como un ejemplo, la memoria 932 o uno o mas componentes del procesador 906, los procesadores 910 y/o el CODEC 934 puede(n) ser un dispositivo de memoria, tal como una memoria de acceso aleatorio (RAM), una memoria de acceso aleatorio magnetorresistiva (MRAM), una MRAM de transferencia de par de giro (STT-MRAM), una memoria flash, una memoria de solo lectura (ROM), una memoria de solo lectura programable (PROM), una memoria de solo lectura programable y borrable (EPROM), una memoria de solo lectura programable y borrable electricamente (EEPROM), registros, un disco duro, un disco extrafble o una memoria de solo lectura de disco compacto (CD-ROM). El dispositivo de memoria puede incluir instrucciones (por ejemplo, las instrucciones 956) que, cuando se ejecutan mediante un ordenador (por ejemplo, un procesador en el CODEC 934, el procesador 906 y/o los procesadores 910), pueden hacer que el ordenador realice al menos una porcion de uno o mas de los procedimientos 400-800 de las FIG. 4-8. Como un ejemplo, la memoria 932 o el uno o mas componentes del procesador 906, los procesadores 910, el CODEC 934 pueden ser un medio legible por ordenador no transitorio que incluye instrucciones (por ejemplo, las instrucciones 956) que, cuando se ejecutan mediante un ordenador (por ejemplo, un procesador en el CODEC 934, el procesador 906 y/o los procesadores 910), hacen que el ordenador realice al menos una porcion de uno o mas de los procedimientos 400-800 de las FIGS.4-8.
[0150] En un modo de realizacion particular, el dispositivo 900 puede estar incluido en un dispositivo de sistema en paquete o de sistema en chip (por ejemplo, un modem de estacion movil (MSM)) 922. En un modo de realizacion particular, el procesador 906, los procesadores 910, el controlador de pantalla 926, la memoria 932, el CODEC 934, el controlador inalambrico 940 y el transceptor 950 estan incluidos en un dispositivo de sistema en paquete o de sistema en chip 922. En un modo de realizacion particular, un dispositivo de entrada 930, tal como una pantalla tactil y/o un teclado, y una fuente de alimentacion 944, estan acoplados al dispositivo de sistema en chip 922. Ademas, en un modo de realizacion particular, como se ilustra en la FlG. 9, la pantalla 928, el dispositivo de entrada 930, el altavoz 948, el microfono 946, la antena 942 y la fuente de alimentacion 944 son externos con respecto al dispositivo de sistema en chip 922. Sin embargo, cada uno de la pantalla 928, el dispositivo de entrada 930, el altavoz 948, el microfono 946, la antena 942 y la fuente de alimentacion 944 se pueden acoplar a un componente del dispositivo de sistema en chip 922, tal como una interfaz o un controlador.
[0151] El dispositivo 900 puede incluir un dispositivo de comunicacion movil, un telefono inteligente, un telefono celular, un ordenador portatil, un ordenador, una tableta, un asistente digital personal, un dispositivo de visualizacion, un televisor, una consola de juegos, un reproductor de musica, una radio, un reproductor de video digital, un reproductor de disco de video digital (DVD), un sintonizador, una camara, un dispositivo de navegacion, un sistema descodificador, un sistema codificador, o cualquier combinacion de los mismos.
[0152] En un modo de realizacion ilustrativo, los procesadores 910 se pueden operar para realizar todos o una porcion de los procedimientos u operaciones descritos con referencia a las FIG. 1-8. Por ejemplo, el microfono 946 puede capturar una senal de audio (por ejemplo, la senal de entrada 130 de la FIG. 1). El ADC 904 puede convertir la senal de audio capturada de una forma de onda analogica en una forma de onda digital que comprende muestras de audio digital. Los procesadores 910 pueden procesar las muestras de audio digital. Un ajustador de ganancia puede ajustar las muestras de audio digital. El cancelador de eco 912 puede reducir un eco que se puede haber creado mediante una salida del altavoz 948 que entra al microfono 946.
[0153] El codificador de vocoder 936 puede comprimir muestras de audio digital correspondientes a la senal de voz procesada y puede formar un paquete de transmision (por ejemplo, una representacion de los bits comprimidos de las muestras de audio digital). Por ejemplo, el paquete de transmision puede corresponder a al menos una porcion del flujo de bits 132 de la FIG. 1. El paquete de transmision puede almacenarse en la memoria 932. El transceptor 950 puede modular alguna forma del paquete de transmision (por ejemplo, se puede anadir otra informacion al paquete de transmision) y puede transmitir los datos modulados a traves de la antena 942.
[0154] Como otro ejemplo mas, la antena 942 puede recibir paquetes entrantes que incluyen un paquete de recepcion. El paquete de recepcion se puede enviar mediante otro dispositivo a traves de una red. Por ejemplo, el paquete de recepcion puede corresponder a al menos una porcion del flujo de bits 132 de la FIG. 1. El descodificador de vocoder 938 puede descomprimir el paquete de recepcion. La forma de onda sin comprimir puede denominarse muestras de audio reconstruidas. El cancelador de eco 912 puede eliminar el eco de las muestras de audio reconstruidas.
[0155] Los procesadores 910 que ejecutan el codec de voz y musica 908 pueden generar la senal de excitacion de banda alta 186, como se describe con referencia a las FIG. 1-8. Los procesadores 910 pueden generar la senal de salida 116 de la FIG. 1 basandose en la senal de excitacion de banda alta 186. Un ajustador de ganancia puede amplificar o reducir la senal de salida 116. El DAC 902 puede convertir la senal de salida 116 de una forma de onda digital en una forma de onda analogica y puede proporcionar la senal convertida al altavoz 948.
[0156] En conjunto con los modos de realizacion descritos, se divulga un aparato que incluye medios para determinar una clasificacion de sonoridad de una senal de entrada. La senal de entrada puede corresponder a una senal de audio. Por ejemplo, los medios para determinar una clasificacion de sonoridad pueden incluir el clasificador de sonoridad 160 de la FIG. 1, uno o mas dispositivos configurados para determinar la clasificacion de sonoridad de una senal de entrada (por ejemplo, un procesador que ejecuta instrucciones en un medio de almacenamiento legible por ordenador no transitorio), o cualquier combinacion de los mismos.
[0157] Por ejemplo, el clasificador de sonoridad 160 puede determinar los parametros 242 que incluyen una tasa de cruces por cero de una senal de banda baja de la senal de entrada 130, un primer coeficiente de reflexion, una relacion de energfa de una contribucion de libro de codigos adaptativo en la excitacion de la banda baja a energfa de una suma de contribuciones de libro de codigos adaptativo y libro de codigos fijo en la excitacion de banda baja, una ganancia de tono de la senal de banda baja de la senal de entrada 130, o una combinacion de los mismos. En un modo de realizacion particular, el clasificador de sonoridad 160 puede determinar los parametros 242 basandose en la senal de banda baja 334 de la FIG. 3. En un modo de realizacion alternativo, el clasificador de sonoridad 160 puede extraer los parametros 242 de la porcion de banda baja del flujo de bits 232 de la FIG. 2.
[0158] El clasificador de sonoridad 160 puede determinar la clasificacion de sonoridad 180 (por ejemplo, el factor de sonoridad 236) basandose en una ecuacion. Por ejemplo, el clasificador de sonoridad 160 puede determinar la clasificacion de sonoridad 180 basandose en la Ecuacion 1 y los parametros 242. Para ilustrar, el clasificador de sonoridad 160 puede determinar la clasificacion de sonoridad 180 calculando una suma ponderada de la tasa de cruces por cero, el primer coeficiente de reflexion, la relacion de energfa, la ganancia de tono, la decision de sonoridad anterior, un valor constante, o una combinacion de los mismos, como se describe con referencia a la FIG. 4.
[0159] El aparato tambien incluye medios para controlar una cantidad de una envolvente de una representacion de la senal de entrada basandose en la clasificacion de sonoridad. Por ejemplo, los medios para controlar la cantidad de la envolvente pueden incluir el ajustador de envolvente 162 de la FIG. 1, uno o mas dispositivos configurados para controlar la cantidad de la envolvente de la representacion de la senal de entrada basandose en la clasificacion de sonoridad (por ejemplo, un procesador que ejecuta instrucciones en un medio de almacenamiento legible por ordenador no transitorio), o cualquier combinacion de los mismos.
[0160] Por ejemplo, el ajustador de envolvente 162 puede generar una clasificacion de sonoridad de frecuencia multiplicando la clasificacion de sonoridad 180 de la FlG. 1 (por ejemplo, el factor de sonoridad 236 de la FIG. 2) por un factor de escalado de frecuencia de corte. El factor de escalado de frecuencia de corte puede ser un valor predeterminado. La frecuencia de corte de LPF 426 puede corresponder a una frecuencia de corte predeterminada. El ajustador de envolvente 162 puede controlar una cantidad de la envolvente de senal 182 ajustando la frecuencia de corte de LPF 426, como se describe con referencia a la FIG. 4. Por ejemplo, el ajustador de envolvente 162 puede ajustar la frecuencia de corte de LPF 426 sumando la clasificacion de sonoridad de frecuencia a la frecuencia de corte de LPF 426.
[0161] Como otro ejemplo, el ajustador de envolvente 162 puede generar el factor de expansion de ancho de banda 526 multiplicando la clasificacion de sonoridad 180 de la FIG. 1 (por ejemplo, el factor de sonoridad 236 de la FIG. 2) por un factor de escalado de ancho de banda. El ajustador de envolvente 162 puede determinar los polos de LPC de banda alta asociados con la senal representativa 422. El ajustador de envolvente 162 puede determinar un factor de ajuste de polo multiplicando el factor de expansion de ancho de banda 526 por un factor de escalado de polo. El factor de escalado de polo puede ser un valor predeterminado. El ajustador de envolvente 162 puede controlar la cantidad de la envolvente de senal 182 ajustando los polos de LPC de banda alta, como se describe con referencia a la FIG. 5. Por ejemplo, el ajustador de envolvente 162 puede ajustar los polos de LPC de banda alta hacia el origen mediante el factor de ajuste de polo.
[0162] Como otro ejemplo, el ajustador de envolvente 162 puede determinar los coeficientes de un filtro. Los coeficientes del filtro pueden ser valores predeterminados. El ajustador de envolvente 162 puede determinar un factor de ajuste de filtro multiplicando el factor de expansion de ancho de banda 526 por un factor de escalado de filtro. El factor de escalado de filtro puede ser un valor predeterminado. El ajustador de envolvente 162 puede controlar la cantidad de la envolvente de senal 182 ajustando los coeficientes del filtro, como se describe con referencia a la FIG. 6. Por ejemplo, el ajustador de envolvente 162 puede multiplicar cada uno de los coeficientes del filtro por el factor de ajuste de filtro.
[0163] El aparato incluye ademas medios para modular una senal de ruido blanco basandose en la cantidad controlada de la envolvente. Por ejemplo, los medios para modular la senal de ruido blando pueden incluir el modulador 164 de la FIG. 1, uno o mas dispositivos configurados para modular la senal de ruido blanco basandose en la cantidad controlada de la envolvente (por ejemplo, un procesador que ejecuta instrucciones en un medio de almacenamiento legible por ordenador no transitorio), o cualquier combinacion de los mismos. Por ejemplo, el modulador 164 puede determinar si el ruido blanco 156 y la envolvente de senal 182 estan en el mismo dominio. Si el ruido blanco 156 esta en un dominio diferente al de la envolvente de senal 182, el modulador 164 puede convertir el ruido blanco 156 para estar en el mismo dominio que la envolvente de senal 182 o puede convertir la envolvente de senal 182 para estar en el mismo dominio que el ruido blanco 156. El modulador 164 puede modular el ruido blanco 156 basandose en la envolvente de senal 182, como se describe con referencia a la FIG. 4. Por ejemplo, el modulador 164 puede multiplicar el ruido blanco 156 por la envolvente de senal 182 en un dominio de tiempo. Como otro ejemplo, el modulador 164 puede convolucionar el ruido blanco 156 y la envolvente de senal 182 en un dominio de frecuencia.
[0164] El aparato tambien incluye medios para generar una senal de excitacion de banda alta basandose en la senal de ruido blanco modulada. Por ejemplo, los medios para generar la senal de excitacion de banda alta pueden incluir el circuito de salida 166 de la FIG. 1, uno o mas dispositivos configurados para generar la senal de excitacion de banda alta basandose en la senal de ruido blanco modulada (por ejemplo, un procesador que ejecuta instrucciones en un medio de almacenamiento legible por ordenador no transitorio), o cualquier combinacion de los mismos.
[0165] En un modo de realizacion particular, el circuito de salida 166 puede generar la senal de excitacion de banda alta 186 basandose en el ruido blanco modulado 184, como se describe con referencia a las FIG. 4-7. Por ejemplo, el circuito de salida 166 puede multiplicar el ruido blanco modulado 184 por la ganancia de ruido 434 para generar el ruido blanco modulado escalado 438, como se describe con referencia a las FIG. 4-6. El circuito de salida 166 puede combinar el ruido blanco modulado escalado 438 y otra senal (por ejemplo, la senal representativa escalada 440 de la FIG. 4, la senal filtrada escalada 540 de la FIG. 5, o la senal de banda alta sintetizada escalada 640 de la FIG. 6 ) para generar la senal de excitacion de banda alta 186.
[0166] Como otro ejemplo, el circuito de salida 166 puede multiplicar el ruido blanco modulado 184 por la ganancia de ruido modulado 732 de la FIG. 7 para generar el ruido blanco modulado escalado 740, como se describe con referencia a la FIG. 7. El circuito de salida 166 puede combinar (por ejemplo, sumar) el ruido blanco modulado escalado 740 y el ruido blanco sin modular escalado 742 para generar el ruido blanco escalado 744. El circuito de salida 166 puede combinar la senal representativa escalada 440 y el ruido blanco escalado 744 para generar la senal de excitacion de banda alta 186.
[0167] Los expertos en la tecnica apreciarfan ademas que los diversos bloques logicos, configuraciones, modulos, circuitos y etapas de algoritmo ilustrativos descritos en relacion con los modos de realizacion divulgados en el presente documento se pueden implementar como hardware electronico, software informatico ejecutado mediante un dispositivo de procesamiento tal como un procesador de hardware, o combinaciones de los mismos. Hasta aquf se han descrito diversos componentes, bloques, configuraciones, modulos, circuitos y etapas ilustrativos, en general, en lo que respecta a su funcionalidad. Que dicha funcionalidad se implemente como hardware o software ejecutable depende de la aplicacion particular y de las restricciones de diseno impuestas al sistema global. Los expertos en la materia pueden implementar la funcionalidad descrita de distintas maneras para cada aplicacion particular, pero no se deberfa interpretar que dichas decisiones de implementacion suponen apartarse del alcance de la presente divulgacion.
[0168] Las etapas de un procedimiento o algoritmo descrito en relacion con los modos de realizacion divulgados en el presente documento se pueden realizar directamente en hardware, en un modulo de software ejecutado mediante un procesador o en una combinacion de los dos. Un modulo de software puede residir en un dispositivo de memoria, tal como una memoria de acceso aleatorio (RAM), una memoria de acceso aleatorio magnetorresistiva (MRAM), una MRAM de transferencia de par de giro (STT-MRAM), una memoria flash, una memoria de solo lectura (ROM), una memoria de solo lectura programable (PROM), una memoria de solo lectura programable y borrable (EPROM), una memoria de lectura programable y borrable electricamente (EEPROM), registros, un disco duro, un disco extrafble o una memoria de solo lectura de disco compacto (CD-ROM). Un dispositivo de memoria a modo de ejemplo esta acoplado al procesador de tal manera que el procesador puede leer informacion de, y escribir informacion en, el dispositivo de memoria. Como alternativa, el dispositivo de memoria puede estar integrado en el procesador. El procesador y el medio de almacenamiento pueden residir en un circuito integrado especffico de la aplicacion (ASIC). El ASIC puede residir en un dispositivo informatico o en un terminal de usuario. Como alternativa, el procesador y el medio de almacenamiento pueden residir como componentes discretos en un dispositivo informatico o en un terminal de usuario.
[0169] La descripcion anterior de los modos de realizacion divulgados se proporciona para permitir a un experto en la materia crear o usar los modos de realizacion divulgados. Varias modificaciones a estos modos de realizacion seran facilmente evidentes para los expertos en la tecnica.

Claims (15)

REIVINDICACIONES
1. Un procedimiento para generacion de senal de excitacion de banda alta que comprende:
determinar, en un dispositivo, una clasificacion de sonoridad de una senal de entrada, en el que la senal de entrada corresponde a una senal de audio;
controlar una envolvente de una senal de excitacion de la senal de entrada basandose en la clasificacion de sonoridad, en el que el intervalo de frecuencia de la envolvente se controla basandose en una frecuencia de corte de un filtro de paso bajo aplicado a la senal de excitacion de la senal de entrada; modular una senal de ruido blanco basandose en la envolvente controlada; y
generar una senal de excitacion de banda alta basandose en la senal de ruido blanco modulada.
2. El procedimiento segun la reivindicacion 1, en el que controlar la envolvente incluye ademas controlar una caracterfstica de la envolvente y la caracterfstica de la envolvente incluye al menos una de una forma de la envolvente, una magnitud de la envolvente, una ganancia de la envolvente.
3. El procedimiento segun la reivindicacion 1, en el que un grado de variacion de la forma de la envolvente es mayor cuando la clasificacion de sonoridad corresponde a fuertemente sonora que cuando la clasificacion de sonoridad corresponde a fuertemente sorda.
4. El procedimiento segun la reivindicacion 1, que comprende ademas determinar la frecuencia de corte basandose en la clasificacion de sonoridad.
5. El procedimiento segun la reivindicacion 4, en el que la frecuencia de corte es mayor cuando la clasificacion de sonoridad corresponde a fuertemente sonora que cuando la clasificacion de sonoridad corresponde a fuertemente sorda.
6. El procedimiento segun la reivindicacion 1, en el que el dispositivo es un descodificador o un codificador.
7. El procedimiento segun la reivindicacion 1, en el que la envolvente es una envolvente que varfa en el tiempo.
8. El procedimiento segun la reivindicacion 1, en el que la senal de excitacion de la senal de entrada incluye una senal de excitacion de banda baja de una version codificada de la senal de audio o una senal de excitacion de banda alta de la version codificada de la senal de audio.
9. El procedimiento segun la reivindicacion 1, en el que la senal de excitacion de la senal de entrada incluye una senal de excitacion extendida armonicamente y en el que la senal de excitacion extendida armonicamente se genera a partir de una senal de excitacion de banda baja de una version codificada de la senal de audio.
10. El procedimiento segun la reivindicacion 1, que comprende ademas generar una senal de ruido blanco escalada combinando una primera relacion de una senal de ruido blanco sin modular con una segunda relacion de la senal de ruido blanco modulada, en el que la primera relacion y la segunda relacion se determinan basandose en la clasificacion de sonoridad y en el que la senal de excitacion de banda alta se basa en la senal de ruido blanco escalada.
11. Un aparato para generacion de senal de excitacion de banda alta que comprende:
un clasificador de sonoridad configurado para determinar una clasificacion de sonoridad de una senal de entrada, en el que la senal de entrada corresponde a una senal de audio;
un ajustador de envolvente configurado para controlar una envolvente de una senal de excitacion de la senal de entrada basandose en la clasificacion de sonoridad, en el que el intervalo de frecuencia de la envolvente se controla basandose en una frecuencia de corte de un filtro de paso bajo aplicado a la senal de excitacion de la senal de entrada;
un modulador configurado para modular una senal de ruido blanco basandose en la envolvente controlada; y
un circuito de salida configurado para generar una senal de excitacion de banda alta basandose en la senal de ruido blanco modulada.
12. El aparato segun la reivindicacion 11, en el que el ajustador de envolvente se configura ademas para controlar, basandose en la clasificacion de sonoridad, al menos una de una forma de la envolvente, una magnitud de la envolvente, o una ganancia de la envolvente.
13. El aparato segun la reivindicacion 12, en el que al menos una de la forma de la envolvente, la magnitud de la envolvente y la ganancia de la envolvente se controlan ajustando uno o mas polos de coeficientes de codificacion predictiva lineal (LPC) basandose en la clasificacion de sonoridad.
14. El aparato segun la reivindicacion 12, en el que al menos una de la forma de la envolvente, la magnitud de la envolvente y la ganancia de la envolvente se controlan ajustando los coeficientes de un filtro basandose en la clasificacion de sonoridad y en el que el filtro se aplica mediante el modulador a la senal de ruido blanco para generar la senal de ruido blanco modulada.
15. Un dispositivo de almacenamiento legible por ordenador que almacena instrucciones que, cuando se ejecutan mediante al menos un procesador, hacen que el al menos un procesador realice el procedimiento de cualquiera de las reivindicaciones 1 a 10.
ES15716340T 2014-04-30 2015-03-31 Generación de señal de excitación de banda alta Active ES2711524T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US14/265,693 US9697843B2 (en) 2014-04-30 2014-04-30 High band excitation signal generation
PCT/US2015/023483 WO2015167732A1 (en) 2014-04-30 2015-03-31 High band excitation signal generation

Publications (1)

Publication Number Publication Date
ES2711524T3 true ES2711524T3 (es) 2019-05-06

Family

ID=52829451

Family Applications (1)

Application Number Title Priority Date Filing Date
ES15716340T Active ES2711524T3 (es) 2014-04-30 2015-03-31 Generación de señal de excitación de banda alta

Country Status (28)

Country Link
US (2) US9697843B2 (es)
EP (1) EP3138096B1 (es)
JP (1) JP6599362B2 (es)
KR (2) KR102433713B1 (es)
CN (2) CN110827842B (es)
AR (1) AR099952A1 (es)
AU (1) AU2015253721B2 (es)
BR (1) BR112016024971B1 (es)
CA (1) CA2944874C (es)
CL (1) CL2016002709A1 (es)
DK (1) DK3138096T3 (es)
ES (1) ES2711524T3 (es)
HU (1) HUE041343T2 (es)
IL (1) IL248562B (es)
MX (1) MX361046B (es)
MY (1) MY192071A (es)
NZ (1) NZ724656A (es)
PH (1) PH12016502137A1 (es)
PL (1) PL3138096T3 (es)
PT (1) PT3138096T (es)
RU (1) RU2683632C2 (es)
SA (1) SA516380088B1 (es)
SG (1) SG11201607703PA (es)
SI (1) SI3138096T1 (es)
TR (1) TR201901357T4 (es)
TW (1) TWI643186B (es)
WO (1) WO2015167732A1 (es)
ZA (1) ZA201607459B (es)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102138320B1 (ko) * 2011-10-28 2020-08-11 한국전자통신연구원 통신 시스템에서 신호 코덱 장치 및 방법
CN103516440B (zh) 2012-06-29 2015-07-08 华为技术有限公司 语音频信号处理方法和编码装置
CN105976830B (zh) * 2013-01-11 2019-09-20 华为技术有限公司 音频信号编码和解码方法、音频信号编码和解码装置
FR3008533A1 (fr) 2013-07-12 2015-01-16 Orange Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences
CN108364657B (zh) 2013-07-16 2020-10-30 超清编解码有限公司 处理丢失帧的方法和解码器
CN105096958B (zh) 2014-04-29 2017-04-12 华为技术有限公司 音频编码方法及相关装置
US9697843B2 (en) 2014-04-30 2017-07-04 Qualcomm Incorporated High band excitation signal generation
FR3020732A1 (fr) * 2014-04-30 2015-11-06 Orange Correction de perte de trame perfectionnee avec information de voisement
KR101860143B1 (ko) 2014-05-01 2018-05-23 니폰 덴신 덴와 가부시끼가이샤 주기성 통합 포락 계열 생성 장치, 주기성 통합 포락 계열 생성 방법, 주기성 통합 포락 계열 생성 프로그램, 기록매체
CN105225666B (zh) 2014-06-25 2016-12-28 华为技术有限公司 处理丢失帧的方法和装置
US9984699B2 (en) * 2014-06-26 2018-05-29 Qualcomm Incorporated High-band signal coding using mismatched frequency ranges
CN109686378B (zh) * 2017-10-13 2021-06-08 华为技术有限公司 语音处理方法和终端
CN108198571B (zh) * 2017-12-21 2021-07-30 中国科学院声学研究所 一种基于自适应带宽判断的带宽扩展方法及系统
WO2020157888A1 (ja) * 2019-01-31 2020-08-06 三菱電機株式会社 周波数帯域拡張装置、周波数帯域拡張方法、及び周波数帯域拡張プログラム
US11682406B2 (en) * 2021-01-28 2023-06-20 Sony Interactive Entertainment LLC Level-of-detail audio codec

Family Cites Families (65)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4764966A (en) * 1985-10-11 1988-08-16 International Business Machines Corporation Method and apparatus for voice detection having adaptive sensitivity
JP3343965B2 (ja) 1992-10-31 2002-11-11 ソニー株式会社 音声符号化方法及び復号化方法
ZA946674B (en) * 1993-09-08 1995-05-02 Qualcomm Inc Method and apparatus for determining the transmission data rate in a multi-user communication system
JP3707116B2 (ja) * 1995-10-26 2005-10-19 ソニー株式会社 音声復号化方法及び装置
EP0878790A1 (en) 1997-05-15 1998-11-18 Hewlett-Packard Company Voice coding system and method
EP0945852A1 (en) * 1998-03-25 1999-09-29 BRITISH TELECOMMUNICATIONS public limited company Speech synthesis
US6078880A (en) * 1998-07-13 2000-06-20 Lockheed Martin Corporation Speech coding system and method including voicing cut off frequency analyzer
CA2252170A1 (en) * 1998-10-27 2000-04-27 Bruno Bessette A method and device for high quality coding of wideband speech and audio signals
US6556967B1 (en) * 1999-03-12 2003-04-29 The United States Of America As Represented By The National Security Agency Voice activity detector
US6665403B1 (en) * 1999-05-11 2003-12-16 Agere Systems Inc. Digital gyrator
US7092881B1 (en) * 1999-07-26 2006-08-15 Lucent Technologies Inc. Parametric speech codec for representing synthetic speech in the presence of background noise
US7222070B1 (en) * 1999-09-22 2007-05-22 Texas Instruments Incorporated Hybrid speech coding and system
ATE416791T1 (de) * 2000-05-02 2008-12-15 Theravance Inc Zusammensetzung die eine zyklodextrin und ein glykopeptid-antibiotikum enthält
US7330814B2 (en) * 2000-05-22 2008-02-12 Texas Instruments Incorporated Wideband speech coding with modulated noise highband excitation system and method
US7363219B2 (en) * 2000-09-22 2008-04-22 Texas Instruments Incorporated Hybrid speech coding and system
GB2370435A (en) * 2000-12-22 2002-06-26 Nokia Mobile Phones Ltd A polar loop transmitter for a mobile phone
EP1256937B1 (en) * 2001-05-11 2006-11-02 Sony France S.A. Emotion recognition method and device
US20020184009A1 (en) * 2001-05-31 2002-12-05 Heikkinen Ari P. Method and apparatus for improved voicing determination in speech signals containing high levels of jitter
US6956914B2 (en) * 2001-09-19 2005-10-18 Gennum Corporation Transmit amplitude independent adaptive equalizer
US6985857B2 (en) * 2001-09-27 2006-01-10 Motorola, Inc. Method and apparatus for speech coding using training and quantizing
US6937978B2 (en) * 2001-10-30 2005-08-30 Chungwa Telecom Co., Ltd. Suppression system of background noise of speech signals and the method thereof
US7155385B2 (en) * 2002-05-16 2006-12-26 Comerica Bank, As Administrative Agent Automatic gain control for adjusting gain during non-speech portions
CA2388439A1 (en) * 2002-05-31 2003-11-30 Voiceage Corporation A method and device for efficient frame erasure concealment in linear predictive based speech codecs
JP3918734B2 (ja) * 2002-12-27 2007-05-23 ヤマハ株式会社 楽音発生装置
US7155386B2 (en) 2003-03-15 2006-12-26 Mindspeed Technologies, Inc. Adaptive correlation window for open-loop pitch
CN100508030C (zh) * 2003-06-30 2009-07-01 皇家飞利浦电子股份有限公司 一种编码/解码音频信号的方法及相应设备
US20050004793A1 (en) * 2003-07-03 2005-01-06 Pasi Ojala Signal adaptation for higher band coding in a codec utilizing band split coding
MX2007012187A (es) 2005-04-01 2007-12-11 Qualcomm Inc Sistemas, metodos y aparatos para deformacion en tiempo de banda alta.
KR101118217B1 (ko) * 2005-04-19 2012-03-16 삼성전자주식회사 오디오 데이터 처리 장치 및 방법
TWI324336B (en) * 2005-04-22 2010-05-01 Qualcomm Inc Method of signal processing and apparatus for gain factor smoothing
KR100744352B1 (ko) * 2005-08-01 2007-07-30 삼성전자주식회사 음성 신호의 하모닉 성분을 이용한 유/무성음 분리 정보를추출하는 방법 및 그 장치
US8135047B2 (en) * 2006-07-31 2012-03-13 Qualcomm Incorporated Systems and methods for including an identifier with a packet associated with a speech signal
US8260609B2 (en) * 2006-07-31 2012-09-04 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of inactive frames
CN101197130B (zh) * 2006-12-07 2011-05-18 华为技术有限公司 声音活动检测方法和声音活动检测器
US8457953B2 (en) * 2007-03-05 2013-06-04 Telefonaktiebolaget Lm Ericsson (Publ) Method and arrangement for smoothing of stationary background noise
GB0705328D0 (en) * 2007-03-20 2007-04-25 Skype Ltd Method of transmitting data in a communication system
US8600740B2 (en) * 2008-01-28 2013-12-03 Qualcomm Incorporated Systems, methods and apparatus for context descriptor transmission
KR101413968B1 (ko) * 2008-01-29 2014-07-01 삼성전자주식회사 오디오 신호의 부호화, 복호화 방법 및 장치
KR101413967B1 (ko) * 2008-01-29 2014-07-01 삼성전자주식회사 오디오 신호의 부호화 방법 및 복호화 방법, 및 그에 대한 기록 매체, 오디오 신호의 부호화 장치 및 복호화 장치
WO2010035438A1 (ja) * 2008-09-26 2010-04-01 パナソニック株式会社 音声分析装置および音声分析方法
CN101770776B (zh) * 2008-12-29 2011-06-08 华为技术有限公司 瞬态信号的编码方法和装置、解码方法和装置及处理系统
RU2394284C1 (ru) * 2009-03-24 2010-07-10 Государственное образовательное учреждение высшего профессионального образования Академия Федеральной службы охраны Российской Федерации (Академия ФСО России) Способ сжатия и восстановления речевых сигналов для систем кодирования с переменной скоростью передачи
US8484020B2 (en) 2009-10-23 2013-07-09 Qualcomm Incorporated Determining an upperband signal from a narrowband signal
EP2362375A1 (en) * 2010-02-26 2011-08-31 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for modifying an audio signal using harmonic locking
US8600737B2 (en) * 2010-06-01 2013-12-03 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for wideband speech coding
US9047875B2 (en) * 2010-07-19 2015-06-02 Futurewei Technologies, Inc. Spectrum flatness control for bandwidth extension
KR101826331B1 (ko) 2010-09-15 2018-03-22 삼성전자주식회사 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법
US8311817B2 (en) * 2010-11-04 2012-11-13 Audience, Inc. Systems and methods for enhancing voice quality in mobile device
JP5649488B2 (ja) * 2011-03-11 2015-01-07 株式会社東芝 音声判別装置、音声判別方法および音声判別プログラム
CN102201240B (zh) * 2011-05-27 2012-10-03 中国科学院自动化研究所 基于逆滤波的谐波噪声激励模型声码器
US8972251B2 (en) * 2011-06-07 2015-03-03 Qualcomm Incorporated Generating a masking signal on an electronic device
US9264094B2 (en) * 2011-06-09 2016-02-16 Panasonic Intellectual Property Corporation Of America Voice coding device, voice decoding device, voice coding method and voice decoding method
EP2791937B1 (en) * 2011-11-02 2016-06-08 Telefonaktiebolaget LM Ericsson (publ) Generation of a high band extension of a bandwidth extended audio signal
WO2013066244A1 (en) * 2011-11-03 2013-05-10 Telefonaktiebolaget L M Ericsson (Publ) Bandwidth extension of audio signals
KR101897455B1 (ko) * 2012-04-16 2018-10-04 삼성전자주식회사 음질 향상 장치 및 방법
US9711156B2 (en) * 2013-02-08 2017-07-18 Qualcomm Incorporated Systems and methods of performing filtering for gain determination
US9741350B2 (en) * 2013-02-08 2017-08-22 Qualcomm Incorporated Systems and methods of performing gain control
EP2972567A4 (en) * 2013-03-11 2016-12-07 Ohio State Innovation Foundation MULTI-CARRIER PROCESSING SYSTEMS AND METHODS IN HEARING AID PROSTHETIC DEVICES
CN105264600B (zh) * 2013-04-05 2019-06-07 Dts有限责任公司 分层音频编码和传输
JP6407150B2 (ja) * 2013-06-11 2018-10-17 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 音響信号の帯域幅拡張を行う装置及び方法
US9384746B2 (en) * 2013-10-14 2016-07-05 Qualcomm Incorporated Systems and methods of energy-scaled signal processing
US20150149157A1 (en) * 2013-11-22 2015-05-28 Qualcomm Incorporated Frequency domain gain shape estimation
US9542955B2 (en) * 2014-03-31 2017-01-10 Qualcomm Incorporated High-band signal coding using multiple sub-bands
GB201406574D0 (en) * 2014-04-11 2014-05-28 Microsoft Corp Audio Signal Processing
US9697843B2 (en) 2014-04-30 2017-07-04 Qualcomm Incorporated High band excitation signal generation

Also Published As

Publication number Publication date
SA516380088B1 (ar) 2021-01-28
CN110827842A (zh) 2020-02-21
BR112016024971A8 (pt) 2021-07-13
CN106256000B (zh) 2019-12-24
SG11201607703PA (en) 2016-11-29
SI3138096T1 (sl) 2019-03-29
TWI643186B (zh) 2018-12-01
US9697843B2 (en) 2017-07-04
RU2683632C2 (ru) 2019-03-29
AU2015253721A1 (en) 2016-10-13
PL3138096T3 (pl) 2019-05-31
US20150317994A1 (en) 2015-11-05
KR102433713B1 (ko) 2022-08-17
KR20220117347A (ko) 2022-08-23
CL2016002709A1 (es) 2017-02-17
BR112016024971B1 (pt) 2022-10-04
CA2944874C (en) 2022-09-20
EP3138096B1 (en) 2018-11-14
DK3138096T3 (en) 2019-02-25
PT3138096T (pt) 2019-02-25
TR201901357T4 (tr) 2019-02-21
CN110827842B (zh) 2024-04-02
RU2016142184A (ru) 2018-05-30
MY192071A (en) 2022-07-25
KR102610946B1 (ko) 2023-12-06
CN106256000A (zh) 2016-12-21
MX361046B (es) 2018-11-26
HUE041343T2 (hu) 2019-05-28
US20170270942A1 (en) 2017-09-21
ZA201607459B (en) 2018-11-28
JP2017517029A (ja) 2017-06-22
AR099952A1 (es) 2016-08-31
WO2015167732A1 (en) 2015-11-05
MX2016013941A (es) 2017-01-09
NZ724656A (en) 2021-12-24
EP3138096A1 (en) 2017-03-08
JP6599362B2 (ja) 2019-10-30
RU2016142184A3 (es) 2018-11-09
US10297263B2 (en) 2019-05-21
PH12016502137A1 (en) 2017-02-06
TW201606757A (zh) 2016-02-16
CA2944874A1 (en) 2015-11-05
KR20170003592A (ko) 2017-01-09
IL248562A0 (en) 2016-12-29
BR112016024971A2 (pt) 2017-08-15
IL248562B (en) 2020-01-30
AU2015253721B2 (en) 2020-05-28

Similar Documents

Publication Publication Date Title
ES2711524T3 (es) Generación de señal de excitación de banda alta
ES2690252T3 (es) Ajuste de ganancia temporal basado en la característica de señal de banda alta
ES2690096T3 (es) Codificación de señal de banda alta usando intervalos de frecuencias no coincidentes
ES2755364T3 (es) Codificación de señal de banda alta que utiliza múltiples subbandas
ES2688037T3 (es) Aparato y procedimientos de conmutación de tecnologías de codificación en un dispositivo
BR112016030381B1 (pt) Método e aparelho para codificar um sinal de áudio e memória legível por computador