ES2618258T3

ES2618258T3 - Sistemas y procedimientos para realizar el control de ganancia

Info

Publication number: ES2618258T3
Application number: ES13753223.0T
Authority: ES
Inventors: Venkatraman Srinivasa ATTI; Venkatesh Krishnan
Original assignee: Qualcomm Inc
Current assignee: Qualcomm Inc
Priority date: 2013-02-08
Filing date: 2013-08-06
Publication date: 2017-06-21
Anticipated expiration: 2033-08-06
Also published as: HRP20170232T1; SMT201700172T1; IL239718A; JP6185085B2; PT2954524T; AU2013377884A1; DK2954524T3; US9741350B2; JP2016507087A; KR101783114B1; CA2896811A1; PH12015501694A1; RU2643454C2; EP2954524B1; KR20150116880A; CN104956437A; SG11201505066SA; RU2015138122A; HUE031736T2; CN104956437B

Abstract

Un procedimiento que comprende: la determinación (304), en base a una distancia entre un par de líneas espectrales, LSP, asociada con una trama de una señal de audio, de que la señal de audio incluye un componente correspondiente a una condición generadora de distorsiones; y en respuesta a la determinación de que la señal de audio incluye el componente, el ajuste de un parámetro de ganancia correspondiente a la señal de audio, en el que la distancia entre LSP es la más pequeña entre una pluralidad de espacios entre LSP, correspondientes a una pluralidad de LSP de una parte de banda alta de la trama de la señal de audio.

Description

5

10

15

20

25

30

35

40

45

50

55

60

65

DESCRIPCION

Sistemas y procedimientos para realizar el control de ganancia REFERENCIA CRUZADA A SOLICITUDES RELACIONADAS

La presente solicitud reivindica la prioridad de la solicitud de patente provisional estadounidense en copropiedad n° 61/762.803, presentada el 8 de febrero de 2013 y la solicitud de patente no provisional estadounidense n° 13/959.090, presentada el 5 de agosto de 2013.

CAMPO

La presente divulgacion se refiere, en general, al procesamiento de senales. DESCRIPCION DE LA TECNICA RELACIONADA

Los avances en la tecnologia han dado como resultado dispositivos informaticos mas pequenos y mas potentes. Por ejemplo, actualmente existe una variedad de dispositivos informaticos portatiles personales, incluidos los dispositivos informaticos inalambricos, tales como los telefonos portatiles inalambricos, los asistentes digitales personales (PDA) y los dispositivos de localizacion, que son pequenos, de peso ligero y facilmente portables por los usuarios. Mas concretamente, los telefonos inalambricos portatiles, tales como los telefonos moviles y los telefonos sobre el protocolo de internet (IP), pueden comunicar voz y paquetes de datos por redes inalambricas. Ademas, muchos de dichos telefonos inalambricos incluyen otros tipos de dispositivos que se incorporan en los mismos. Por ejemplo, un telefono inalambrico tambien puede incluir una camara de fotos digital, una camara de video digital, una grabadora digital y un reproductor de ficheros de audio.

En los sistemas telefonicos tradicionales (por ejemplo, redes telefonicas publicas conmutadas (RTC)), el ancho de banda de la senal se limita al intervalo de frecuencias de 300 hercios (Hz) a 3,4 kilohercios (kHz). En aplicaciones de banda ancha (WB), tales como telefonia movil y voz sobre el protocolo de internet (VoIP), el ancho de banda de la senal puede abarcar el intervalo de frecuencias de 50 Hz a 7 kHz. Las tecnicas de codificacion de banda super- ancha (SWB) prestan soporte a un ancho de banda que se extiende hasta alrededor de 16 kHz. El hecho de extender el ancho de banda de la senal de telefonia de banda estrecha de 3,4 kHz a la telefonia de banda super- ancha de 16 kHz puede mejorar la calidad de la reconstruccion de la senal, la inteligibilidad y la naturalidad.

Las tecnicas de codificacion de banda super-ancha implican tipicamente codificar y transmitir la parte de menor frecuencia de la senal (por ejemplo, de 50 Hz a 7 kHz, tambien llamada la "banda baja"). Por ejemplo, la banda baja se puede representar utilizando parametros de filtro y/o una senal de excitacion de banda baja. Sin embargo, con el fin de mejorar la eficacia de la codificacion, la parte de mayor frecuencia de la senal (por ejemplo, de 7 kHz a 16 kHz, tambien llamada la "banda alta") puede no ser totalmente codificada y transmitida. En su lugar, un receptor puede utilizar el modelado de senales para predecir la banda alta. En algunas implementaciones, los datos asociados con la banda alta se pueden proporcionar al receptor para ayudar en la prediccion. Dichos datos pueden ser referidos como "informacion lateral" y pueden incluir informacion de ganancia, frecuencias de lineas espectrales (LSF, tambien mencionadas como pares de lineas espectrales (LSP)), etc. La prediccion de la banda alta utilizando un modelo de senal puede tener una precision aceptable cuando la senal de banda baja esta suficientemente correlacionada con la senal de banda alta. Sin embargo, en presencia de ruido, la correlacion entre la banda baja y la banda alta puede ser debil y el modelo de senal puede que no sea capaz de representar con precision la banda alta. Esto puede provocar distorsiones (por ejemplo, voz distorsionada) en el receptor.

El documento estadounidense 2011/099004 describe un procedimiento para determinar una senal de voz de banda superior a partir de una senal de voz de banda estrecha.

RESUMEN

Se divulgan sistemas y procedimientos para realizar el control de ganancia Las tecnicas descritas incluyen la determinacion de si una senal de audio a codificar para su transmision incluye un componente (por ejemplo, ruido) que pueda producir distorsiones audibles en la reconstruccion de la senal de audio. Por ejemplo, el modelo de senal puede interpretar el ruido como datos de voz, lo que puede dar lugar a que se utilice informacion de ganancia erronea para representar la senal de audio. De acuerdo con las tecnicas descritas, en presencia de condiciones de ruido, se puede realizar la atenuacion de ganancia y/o el allanamiento de ganancia para ajustar los parametros de ganancia utilizados para representar la senal a transmitir. Dichos ajustes pueden conducir a una reconstruccion mas exacta de la senal en un receptor, reduciendo de este modo las distorsiones audibles.

En un modo de realizacion particular, un procedimiento incluye determinar, en base a la distancia entre un par de lineas espectrales (LSP), correspondiente a una parte de banda alta de una senal de audio, que la senal de audio incluye un componente correspondiente a una condicion generadora de distorsiones. El procedimiento incluye tambien, en respuesta a la determinacion de que la senal de audio incluye el componente, el ajuste de un parametro

5

10

15

20

25

30

35

40

45

50

55

60

65

de ganancia correspondiente a la senal de audio.

En otro modo de realizacion particular, el procedimiento incluye la comparacion de una distancia entre un par de lineas espectrales (LSP), asociada con una trama de una parte de banda alta de una senal de audio, con al menos un umbral. El procedimiento tambien incluye el ajuste de un parametro de ganancia de codificacion de voz, correspondiente a la senal de audio (por ejemplo, un parametro de ganancia de un codec para una ganancia digital que se utiliza en un sistema de codificacion de voz), basado, al menos parcialmente, en un resultado de la comparacion.

En otro modo de realizacion particular, un aparato incluye un circuito de deteccion de ruido configurado para determinar, en base a la distancia entre un par de lineas espectrales (LSP), correspondiente a una parte de banda alta de una senal de audio, que la senal de audio incluye un componente correspondiente a una condicion generadora de distorsiones. El aparato incluye tambien un circuito de atenuacion y allanamiento de la ganancia, sensible al circuito de deteccion de ruido y configurado para ajustar, en respuesta a la determinacion de que la senal de audio incluye el componente, un parametro de ganancia correspondiente a la senal de audio.

En otro modo de realizacion particular, un aparato incluye medios para determinar, a partir de una distancia entre un par de lineas espectrales (LSP), correspondiente a una parte de banda alta de una senal de audio, que la senal de audio incluye un componente correspondiente a una condicion generadora de distorsiones. El aparato tambien incluye medios para ajustar un parametro de ganancia correspondiente a la senal de audio en respuesta a la determinacion de que la senal de audio incluye el componente.

En otro modo de realizacion particular, un medio legible por ordenador, no transitorio, incluye instrucciones que, cuando son ejecutadas por un ordenador, hacen que el ordenador determine, a partir de una distancia entre un par de lineas espectrales (LSP), correspondiente a una parte de banda alta de una senal de audio, que la senal de audio incluye un componente correspondiente a una condicion generadora de distorsiones. Las instrucciones tambien son ejecutables para hacer que el ordenador ajuste un parametro de ganancia correspondiente a la senal de audio en respuesta a la determinacion de que la senal de audio incluye el componente.

Las ventajas particulares proporcionadas por al menos uno de los modos de realizacion divulgados incluyen una capacidad para detectar componentes inductores de distorsiones (por ejemplo, ruido) y para realizar selectivamente un control de ganancia (por ejemplo, atenuacion de ganancia y/o allanamiento de ganancia) en respuesta a la deteccion de dichos componentes inductores de distorsiones, lo que puede dar como resultado una reconstruccion de la senal mas precisa en un receptor y menos distorsiones audibles. Otros aspectos, ventajas y caracteristicas de la presente divulgacion se haran evidentes despues de revisar toda la solicitud, incluidas las secciones siguientes: Breve descripcion de los dibujos, descripcion detallada y las reivindicaciones.

BREVE DESCRIPCION DE LOS DIBUJOS

La Figura 1 es un diagrama para ilustrar un modo de realizacion particular de un sistema que es operable para realizar un control de ganancia;

la Figura 2 es un diagrama para ilustrar ejemplos de un componente inductor de distorsiones, una senal reconstruida correspondiente que incluye distorsiones y una senal reconstruida correspondiente que no incluye las distorsiones;

la Figura 3 es un diagrama de flujo para ilustrar un modo de realizacion particular de un procedimiento de realizacion de un control de ganancia;

la Figura 4 es un diagrama de flujo para ilustrar otro modo de realizacion particular de un procedimiento de realizacion de un control de ganancia;

la Figura 5 es un diagrama de flujo para ilustrar otro modo de realizacion particular de un procedimiento de realizacion de un control de ganancia; y

la Figura 6 es un diagrama de bloques de un dispositivo inalambrico operable para realizar operaciones de procesamiento de senales de acuerdo con los sistemas y procedimientos de las Figuras 1 a 5.

DESCRIPCION DETALLADA

Con referencia a la Figura 1, se muestra un modo de realizacion particular de un sistema que es operable para realizar un control de ganancia y se designa, en general, 100. En un modo de realizacion particular, el sistema 100 puede estar integrado en un sistema o aparato de codificacion (por ejemplo, en un telefono inalambrico o codificador/decodificador (CODEC)).

Deberia tenerse en cuenta que, en la siguiente descripcion, las diversas funciones realizadas por el sistema 100 de

5

10

15

20

25

30

35

40

45

50

55

60

65

la Figura 1 se describen como realizadas por ciertos componentes o modulos. Sin embargo, esta division de componentes y modulos es solo a tftulo ilustrativo. En un modo de realizacion alternativo, una funcion realizada por un componente o modulo en particular, en cambio, se puede dividir entre varios componentes o modulos. Ademas, en un modo de realizacion alternativo, dos o mas componentes o modulos de la Figura 1 pueden estar integrados en un solo componente o modulo. Cada componente o modulo ilustrado en la Figura 1 se puede implementar usando hardware (por ejemplo, un dispositivo con una matriz de bloques programables (FPGA), un circuito integrado especffico de la aplicacion (ASIC), un procesador de senales digitales (DSP), un controlador, etc.), software (por ejemplo, instrucciones ejecutables por un procesador) o cualquier combinacion de los mismos.

El sistema 100 incluye un banco de filtros de analisis 110 que esta configurado para recibir una senal de audio de entrada 102. Por ejemplo, la senal de audio de entrada 102 puede ser proporcionada por un microfono u otro dispositivo de entrada. En un modo de realizacion particular, la senal de audio de entrada 102 puede incluir voz. La senal de audio de entrada puede ser una senal de banda super-ancha (SWB) que incluye datos en el intervalo de frecuencias desde aproximadamente 50 hercios (Hz) hasta aproximadamente 16 kilohercios (kHz). El banco de filtros de analisis 110 puede filtrar la senal de audio de entrada 102 en multiples partes en base a la frecuencia. Por ejemplo, el banco de filtros de analisis 110 puede generar una senal de banda baja 122 y una senal de banda alta 124. La senal de banda baja 122 y la senal de banda alta 124 pueden tener anchos de banda iguales o desiguales y pueden estar superpuestas o no superpuestas. En un modo de realizacion alternativa, el banco de filtros de analisis 110 puede generar mas de dos salidas.

En el ejemplo de la Figura 1, la senal de banda baja 122 y la senal de banda alta 124 ocupan bandas de frecuencia que no se superponen. Por ejemplo, la senal de banda baja 122 y la senal de banda alta 124 pueden ocupar bandas de frecuencia que no se superponen de 50 Hz a 7 kHz y de 7 kHz a 16 kHz. En un modo de realizacion alternativa, la senal de banda baja 122 y la senal de banda alta 124 pueden ocupar bandas de frecuencia que no se superponen de 50 Hz a 8 kHz y de 8 kHz a 16 kHz. En otro modo mas de realizacion alternativo, la senal de banda baja 122 y la senal de banda alta 124 pueden superponerse (por ejemplo, de 50 Hz a 8 kHz y de 7 kHz a 16 kHz), lo cual puede permitir que un filtro de paso bajo y un filtro de paso alto del banco de filtros de analisis 110 puedan tener una atenuacion progresiva suave, lo cual puede simplificar el diseno y reducir el coste del filtro de paso bajo y del filtro de paso alto. La superposicion de la senal de banda baja 122 y la senal de banda alta 124 tambien puede permitir una mezcla atenuada de las senales de banda baja y de banda alta en un receptor, lo cual puede dar como resultado menos distorsiones audibles.

Cabe senalar que, aunque el ejemplo de la Figura 1 ilustra el procesamiento de una senal de SWB, esto es solo a tftulo ilustrativo. En un modo de realizacion alternativo, la senal de audio de entrada 102 puede ser una senal de banda ancha (WB) con un intervalo de frecuencias de aproximadamente 50 Hz hasta aproximadamente 8 kHz. En dicho modo de realizacion, la senal de banda baja 122 puede corresponder a un intervalo de frecuencias de aproximadamente 50 Hz hasta aproximadamente 6,4 kHz y la senal de banda alta 124 puede corresponder a un intervalo de frecuencias de aproximadamente 6,4 kHz hasta aproximadamente 8 kHz. Tambien habrfa que senalar que en el presente documento se describen los diversos sistemas y procedimientos como la deteccion de ruido de banda alta y la realizacion de diversas operaciones en respuesta al ruido de banda alta. Sin embargo, esto es solo a modo de ejemplo. Las tecnicas ilustradas con referencia a las Figuras 1 a 6 tambien se pueden realizar en el contexto de ruido de banda baja.

El sistema 100 puede incluir un modulo de analisis de banda baja 130 configurado para recibir la senal de banda baja 122. En un modo de realizacion particular, el modulo de analisis de banda baja 130 puede representar un modo de realizacion de un codificador de prediccion lineal con excitacion por codigo (CELP). El modulo de analisis de banda baja 130 puede incluir un modulo de analisis y codificacion de prediccion lineal (LP) 132, un modulo de transformacion de coeficiente de prediccion lineal (LPC) en el modulo de transformacion 134 de pares de lfneas espectrales (LSP) y un cuantizador 136. Los LSP tambien se pueden denominar frecuencias de lfneas espectrales (LSF) y los dos terminos se pueden usar indistintamente en el presente documento. El modulo de analisis y codificacion de LP 132 puede codificar una envolvente espectral de la senal de banda baja 122 como un conjunto de LPC. Los LPC se pueden generar para cada trama de audio (por ejemplo, 20 milisegundos (ms) de audio, que corresponden a 320 muestras a una velocidad de muestreo de 16 kHz), cada subtrama de audio (por ejemplo, 5 ms de audio) o cualquier combinacion de los mismos. El numero de LPC generados para cada trama o subtrama puede ser determinado por el "orden" del analisis de LP realizado. En un modo de realizacion particular, el modulo de analisis y codificacion de LP 132 puede generar un conjunto de once LPC correspondientes a un analisis de LP de decimo orden.

El modulo de transformacion de LPC a LSP 134 puede transformar el conjunto de LPC generados por el modulo de analisis y codificacion de LP 132 en un conjunto correspondiente de LSP (por ejemplo, usando una transformacion de uno en uno). De forma alternativa, el conjunto de LPC puede ser transformado, uno a uno, en un conjunto correspondiente de coeficientes de PARCOR, valores LAR, pares espectrales de inmitancia (ISP) o frecuencias espectrales de inmitancia (ISF). La transformacion entre el conjunto de LPC y el conjunto de LSP puede ser reversible sin error.

El cuantizador 136 puede cuantizar el conjunto de LSP generados por el modulo de modulo de transformacion 134.

5

10

15

20

25

30

35

40

45

50

55

60

65

Por ejemplo, el cuantizador 136 puede incluir o estar acoplado a multiples libros de codigos que incluyen multiples entradas (por ejemplo, vectores). Para cuantizar el conjunto de LSP, el cuantizador 136 puede identificar entradas de libros de codigos que sean "las mas proximas a" (por ejemplo, en base a una medida de distorsion tal como minimos cuadrados o error cuadratico medio) el conjunto de LSP. El cuantizador 136 puede emitir un valor de indice o una serie de valores de indice que se corresponden con la ubicacion de las entradas identificadas en los libros de codigos. La salida del cuantizador 136 puede asi representar parametros de filtro de banda baja que se incluyen en un flujo de bits de banda baja 142.

El modulo de analisis de banda baja 130 tambien puede generar una senal de excitacion de banda baja 144. Por ejemplo, la senal de excitacion de banda baja 144 puede ser una senal codificada que se genera mediante la cuantizacion de una senal residual de LP que se genera durante el procedimiento de LP realizado por el modulo de analisis de banda baja 130. La senal residual de LP puede representar el error de prediccion.

El sistema 100 puede incluir ademas un modulo de analisis de banda alta 150, configurado para recibir la senal de banda alta 124 desde el banco de filtros de analisis 110 y la senal de excitacion de banda baja 144 desde el modulo de analisis de banda baja 130. El modulo de analisis de banda alta 150 puede generar informacion lateral de banda alta 172 en base a la senal de banda alta 124 y la senal de excitacion de banda baja 144. Por ejemplo, la informacion lateral de banda alta 172 puede incluir LSP de banda alta y/o informacion de ganancia (por ejemplo, en base al menos a una proporcion entre la energia de banda alta y la energia de banda baja), como se describe mas adelante en este documento.

El modulo de analisis de banda alta 150 puede incluir un generador de excitacion de banda alta 160. El generador de excitacion de banda alta 160 puede generar una senal de excitacion de banda alta mediante la ampliacion de un espectro de la senal de excitacion de banda baja 144 hacia el intervalo de frecuencias de banda alta (por ejemplo, de 7 kHz a 16 kHz). Con objeto de ilustrar, el generador de excitacion de banda alta 160 puede aplicar una transformacion a la senal de excitacion de banda baja (por ejemplo, una transformacion no lineal tal como una operacion de valor absoluto o de cuadrado) y puede mezclar la senal de excitacion de banda baja transformada con una senal de ruido (por ejemplo, ruido blanco modulado de acuerdo con una envolvente que se corresponde con la senal de excitacion de banda baja 144) para generar la senal de excitacion de banda alta. La senal de excitacion de banda alta puede ser utilizada para determinar uno o mas parametros de ganancia de banda alta que se incluyen en la informacion lateral de banda alta 172.

El modulo de analisis de banda alta 150 tambien puede incluir un modulo de analisis y codificacion de LP 152, un modulo de transformacion de LPC a LSP 154 y un cuantizador 156. Cada uno entre el modulo de analisis y codificacion de LP 152, el modulo de transformacion 154 y el cuantizador 156 puede funcionar tal como se ha descrito anteriormente con referencia a los componentes correspondientes del modulo de analisis de banda baja 130, pero con una resolucion relativamente reducida (por ejemplo, usando menos bits para cada coeficiente, LSP, etc.). En otro modo de realizacion ejemplar, el cuantizador de LSP de banda alta 156 puede utilizar la cuantizacion escalar en los casos en que un subconjunto de coeficientes de LSP se cuantizan individualmente utilizando un numero predefinido de bits. Por ejemplo, el modulo de analisis y codificacion de LP 152, el modulo de transformacion 154 y el cuantizador 156 pueden utilizar la senal de banda alta 124 para determinar la informacion de filtro de banda alta (por ejemplo, LSP de banda alta) que se incluye en la informacion lateral de banda alta 172. En un modo de realizacion particular, la informacion lateral de banda alta 172 puede incluir LSP de banda alta, asi como parametros de ganancia de banda alta. En presencia de ciertos tipos de ruido, los parametros de ganancia de banda alta pueden ser generados como resultado de la atenuacion de ganancia y/o el allanamiento de ganancia realizado por un modulo de atenuacion y allanamiento de ganancia 162, tal como se describe mas adelante en este documento.

El flujo de bits de banda baja 142 y la informacion lateral de banda alta 172 pueden ser multiplexados por un multiplexor (MUX) 180 para generar un flujo de bits de salida 192. El flujo de bits de salida 192 puede representar una senal de audio codificada correspondiente a la senal de audio de entrada 102. Por ejemplo, el flujo de bits de salida 192 puede ser transmitido (por ejemplo, por un canal cableado, inalambrico u optico) y/o almacenado. En un receptor, las operaciones inversas pueden ser realizadas por un demultiplexor (DEMUX), un decodificador de banda baja, un decodificador de banda alta y un banco de filtros, para generar una senal de audio (por ejemplo, una version reconstruida de la senal de audio de entrada 102 que se proporciona a un altavoz o a otro dispositivo de salida). El numero de bits utilizados para representar el flujo de bits de banda baja 142 puede ser significativamente mayor que el numero de bits utilizados para representar la informacion lateral de banda alta 172. Asi, la mayoria de los bits en el flujo de bits de salida 192 representan los datos de banda baja. La informacion lateral de banda alta 172 se puede utilizar en un receptor para regenerar la senal de banda alta a partir de los datos de banda baja, de acuerdo con un modelo de senal. Por ejemplo, el modelo de senal puede representar un conjunto esperado de relaciones o correlaciones entre datos de banda baja (por ejemplo, la senal de banda baja 122) y datos de banda alta (por ejemplo, la senal de banda alta 124). Por lo tanto, los diferentes modelos de senal se pueden utilizar para diferentes tipos de datos de audio (por ejemplo, voz, musica, etc.), y el modelo de la senal particular que esta en uso puede ser negociado por un transmisor y un receptor (o definido por un estandar de la industria) antes de la comunicacion de los datos de audio codificados. Usando el modelo de senal, el modulo de analisis de banda alta 150 en un transmisor puede ser capaz de generar la informacion lateral de banda alta 172 de manera que un modulo de analisis de banda alta correspondiente en un receptor sea capaz de utilizar el modelo de la senal para reconstruir la

5

10

15

20

25

30

35

40

45

50

55

60

65

senal de banda alta 124 a partir del flujo de bits de salida 192.

En presencia de ruido de fondo, sin embargo, la smtesis de banda alta en el receptor puede llevar a distorsiones perceptibles, porque una correlacion insuficiente entre la banda baja y la banda alta puede provocar que el modelo de la senal subyacente realice una reconstruccion fiable de la senal de manera sub-optima. Por ejemplo, el modelo de la senal puede interpretar incorrectamente los componentes de ruido en la banda alta como voz y, por lo tanto, puede causar la generacion de parametros de ganancia que intentan replicar el ruido de forma inexacta en un receptor, produciendo las distorsiones perceptibles. Los ejemplos de dichas condiciones generadoras de distorsiones incluyen, pero no se limitan a, ruidos de alta frecuencia tales como bocinas de automoviles y frenos chirriantes. Con objeto de ilustrar, un primer espectrograma 210 en la Figura 2 ilustra una senal de audio que tiene dos componentes que corresponden a las condiciones generadoras de distorsiones, ilustradas como un ruido de banda alta con una energfa de senal relativamente grande. Un segundo espectrograma 220 ilustra las distorsiones resultantes en la senal reconstruida debido a la sobre-estimacion de los parametros de ganancia de banda alta.

Para reducir dichas distorsiones, el modulo de analisis de banda alta 150 puede realizar el control de ganancia de banda alta. Por ejemplo, el modulo de analisis de banda alta 150 puede incluir un modulo de deteccion de componentes inductores de distorsiones 158, que esta configurado para detectar componentes de la senal (por ejemplo, las condiciones generadoras de distorsiones que se muestran en el primer espectrograma 210 de la Figura 2) que es probable que den lugar a distorsiones audibles en la reproduccion. En presencia de dichos componentes, el modulo de analisis de banda alta 150 puede provocar la generacion de una senal codificada que reduce, al menos parcialmente, un efecto audible de dichas distorsiones. Por ejemplo, el modulo de atenuacion y allanamiento de la ganancia 162 puede realizar una atenuacion de la ganancia y/o un allanamiento de la ganancia para modificar la informacion o los parametros de ganancia incluidos en la informacion lateral de banda alta 172.

La atenuacion de la ganancia puede incluir la reduccion de un valor de ganancia modelado mediante la aplicacion de una operacion exponencial o lineal, como ejemplos ilustrativos. El allanamiento de la ganancia puede incluir el calculo de una suma ponderada de las ganancias modeladas de una trama/ subtrama actual y una o mas tramas/subtramas anteriores. La informacion de la ganancia modificada puede dar como resultado una senal reconstruida de acuerdo con un tercer espectrograma 230 de la Figura 2, que esta libre de (o tiene un nivel reducido de) las distorsiones que se muestran en el segundo espectrograma 220 de la Figura 2.

Se pueden realizar una o mas pruebas para evaluar si una senal de audio incluye una condicion generadora de distorsiones. Por ejemplo, una primera prueba puede incluir la comparacion de una distancia entre LSP mmima, que se detecta en un conjunto de LSP (por ejemplo, LSP de una trama particular de la senal de audio), con un primer umbral. Una pequena distancia entre LSP se corresponde con una senal relativamente fuerte en un intervalo de frecuencias relativamente estrecho. En un modo de realizacion particular, cuando se determina que la senal de banda alta 124 da como resultado una trama con una distancia mmima entre LSP que es inferior al primer umbral, se determina la presencia de una condicion generadora de distorsiones en la senal de audio, y se puede habilitar la atenuacion de ganancia para la trama.

Como otro ejemplo, una segunda prueba puede incluir la comparacion de una distancia mmima media entre LSP, para multiples tramas consecutivas, con un segundo umbral. Por ejemplo, cuando una trama particular de una senal de audio tiene una distancia mmima LSP que es mayor que el primer umbral pero inferior a un segundo umbral, todavfa se puede determinar la presencia de una condicion generadora de distorsiones si una distancia mmima media entre LSP, para varias tramas (por ejemplo, un promedio ponderado de la distancia mmima entre LSP para las cuatro tramas mas recientes, incluida la trama particular), es menor que un tercer umbral. Como resultado, se puede habilitar la atenuacion de la ganancia para la trama particular.

Como otro ejemplo, una tercera prueba puede incluir la determinacion de si una trama particular sigue a una trama con ganancia atenuada de la senal de audio. Si la trama particular sigue a una trama con ganancia atenuada, la atenuacion de la ganancia se puede habilitar para la trama particular, sobre la base de que la distancia mmima entre LSP de la trama particular sea menor que el segundo umbral.

Las tres pruebas se describen con fines ilustrativos. La atenuacion de la ganancia para una trama se puede habilitar en respuesta a una o mas cualesquiera de las pruebas (o combinaciones de las pruebas) que se satisfagan, o en respuesta a otras una o mas pruebas o condiciones que se satisfagan. Por ejemplo, un modo de realizacion particular puede incluir la determinacion de si se habilita o no la atenuacion de la ganancia en base a una sola prueba, tal como la primera prueba descrita anteriormente, sin aplicar cualquiera entre la segunda prueba y la tercera prueba. Los modos de realizacion alternativos pueden incluir la determinacion de si se habilita o no la atenuacion de la ganancia en base a la segunda prueba, sin aplicar ni la primera prueba ni la tercera prueba, o en base a la tercera prueba, sin aplicar ni la primera prueba ni la segunda prueba. Como otro ejemplo, un modo de realizacion particular puede incluir la determinacion de si se habilita o no la atenuacion de la ganancia en base a dos pruebas, tales como la primera prueba y la segunda prueba, sin aplicar la tercera prueba. Los modos de realizacion alternativos pueden incluir la determinacion de si se habilita o no la atenuacion de la ganancia en base a la primera prueba y la tercera prueba, sin aplicar la segunda prueba, o en base a la segunda prueba y la tercera prueba, sin aplicar la primera prueba.

5

10

15

20

25

30

35

40

45

50

55

60

65

Cuando la atenuacion de la ganancia se ha habilitado para una trama particular, el allanamiento de la ganancia tambien se puede habilitar para la trama particular. Por ejemplo, el allanamiento de ganancia se puede realizar mediante la determinacion de un promedio (por ejemplo, una media ponderada) de un valor de ganancia para la trama particular y un valor de ganancia para una trama anterior de la senal de audio. El promedio determinado puede ser usado como el valor de ganancia para la trama particular, reduciendo una magnitud de cambio en los valores de ganancia entre tramas secuenciales de la senal de audio.

El allanamiento de la ganancia puede ser habilitado para una trama particular en respuesta a la determinacion de que los valores de LSP para la trama particular se desvian de una estimacion de la evolucion "lenta" de los valores de LSP, en menos de un cuarto umbral, y se desvian de una estimacion de la evolucion "rapida" de los valores de LSP, en menos de un quinto umbral. Una magnitud de desviacion desde la estimacion de la evolucion lenta se puede denominar una velocidad lenta de evolucion de LSP. Una magnitud de desviacion desde la estimacion de la evolucion rapida se puede denominar una velocidad rapida de evolucion de LSP, y puede corresponder a una velocidad de adaptacion mas rapida que la velocidad lenta de evolucion de LSP.

La velocidad lenta de evolucion de LSP puede basarse en la desviacion desde una media ponderada de valores de LSP para multiples tramas secuenciales, que pondera los valores de LSP de una o mas tramas anteriores con mas peso que los valores de LSP de una trama actual. La velocidad lenta de evolucion de LSP con un valor relativamente alto indica que los valores de LSP estan cambiando a una velocidad que no es indicativa de una condicion generadora de distorsiones. Sin embargo, la velocidad lenta de evolucion de LSP con un valor relativamente bajo (por ejemplo, menos que el cuarto umbral) corresponde a un movimiento lento de LSP en multiples tramas, lo que puede ser indicativo de una condicion generadora de distorsiones en curso.

La velocidad rapida de evolucion de LSP puede basarse en la desviacion desde una media ponderada de valores de LSP para multiples tramas secuenciales que da mas peso a los valores de LSP de una trama actual que a la media ponderada de la velocidad lenta de evolucion de LSP. La velocidad rapida de evolucion de LSP con un valor relativamente alto puede indicar que los valores de LSP estan cambiando a una velocidad que no es indicativa de una condicion generadora de distorsiones, y la velocidad rapida de evolucion de LSP con un valor relativamente bajo (por ejemplo, inferior al quinto umbral) puede corresponder a un cambio relativamente pequeno de LSP en multiples tramas, lo cual puede ser indicativo de una condicion generadora de distorsiones.

Aunque la velocidad lenta de evolucion de LSP puede ser utilizada para indicar cuando ha comenzado una condicion generadora de distorsiones en multiples tramas, la velocidad lenta de evolucion de LSP puede causar un retraso en la deteccion de cuando la condicion generadora de distorsiones en multiples tramas ha terminado. De manera similar, aunque la velocidad rapida de evolucion de LSP puede ser menos fiable que la velocidad lenta de evolucion de LSP para detectar cuando una condicion generadora de distorsiones en multiples tramas ha comenzado, la velocidad rapida de evolucion de LSP puede ser utilizada para detectar con mas precision cuando una condicion generadora de distorsiones en multiples tramas ha terminado. Se puede determinar que hay en curso un suceso generador de distorsiones en multiples tramas mientras la velocidad lenta de evolucion de LSP es menor que el cuarto umbral y la velocidad rapida de evolucion de LSP es menor que el quinto umbral. Como resultado, se puede habilitar el allanamiento de la ganancia para evitar aumentos repentinos o espurios en los valores de ganancia de la trama mientras el suceso generador de distorsiones esta en curso.

En un modo de realizacion particular, el modulo de deteccion de componentes generadores de distorsiones 158

puede determinar cuatro parametros de la senal de audio para determinar si una senal de audio incluye un

componente que dara como resultado distorsiones audibles: distancia minima entre LSP, una velocidad lenta de

evolucion de LSP, una velocidad rapida de evolucion de LSP y una distancia minima media entre LSP. Por ejemplo,

un procedimiento de LP de decimo orden puede generar un conjunto de once LPC que se transforman en diez LSP.

El modulo de deteccion de componentes generadores de distorsiones 158 puede determinar, para una trama

particular de audio, una distancia minima (por ejemplo, la mas pequena) entre dos cualesquiera de los diez LSP. Por

lo general, los ruidos agudos y repentinos, tales como bocinas de coches y frenos chirriantes, dan como resultado

unos LSP muy proximos entre si (por ejemplo, el componente de ruido "fuerte" de 13 kHz en el primer

espectrograma 210 puede estar estrechamente rodeado de LSP a 12,95 kHz y 13,05 kHz). El modulo de deteccion

de componentes generadores de distorsiones 158 tambien puede determinar una velocidad lenta de evolucion de

LSP y una velocidad rapida de evolucion, tal como se muestra en el siguiente pseudocodigo de estilo C++ que

puede ser ejecutado o implementado por el modulo de deteccion de componentes generadores de distorsiones 158.

Isp_spacing = 0,5; // Distancia minima LSP por omision

gamma1 = 0,7; // Factor de allanamiento para una velocidad lenta de evolucion

gamma2 = 0,3; // Factor de allanamiento para una velocidad rapida de evolucion

LPC_ORDER = 10; // orden de la codificacion predictiva lineal que se esta realizando

lsp_slow_evol_rate = 0;

lsp_fast_evol_rate = 0;

para ( i = 0; i < LPC_ORDER; i++)

{ /* Estimar la distancia entre LSP, es decir, distancia de LSP

5

10

15

20

25

30

35

40

45

50

55

60

65

entre el coeficiente i y el coeficiente de LSP (i-1) como se muestra a continuacion */

lsp_spacing = min(lsp spacing, (i = = 0 ? lsp_shb[0] : (lsp_shb[i] - lsp_shb[i -1])));

/* Estimar el error en los LSP desde la trama actual a las tramas anteriores */ lsp_slow_evol_rate = lsp_slow_evol_rate +

(lsp shb[i] -

lsp_shb_slow_interpl[i])A2; lsp_fast_evol_rate = lsp_fast_evol_rate +

(lsp shb[i] - lsp_shb_fast_interpl[i])A2;

/* Actualizar las velocidades de evolucion de los LSP, (interpolacion rapida/lenta de los LSP para la trama siguiente)

*/

Isp_shb_slow_interpl[i] = gammal * lsp_shb_slow_interpl[i] +

(1-gammal) * lsp shb[i]; lsp_shb_fast_interpl[i] = gamma2 *lsp_shb_fast_interpl[i] +

(1-gamma2) * lsp shb[i];

}

El modulo de deteccion de componentes generadores de distorsiones 158 puede determinar, ademas, una distancia minima media ponderada entre LSP, de acuerdo con el siguiente pseudo-codigo. El siguiente pseudocodigo tambien incluye reiniciar la distancia entre LSP en respuesta a una transicion de modalidad. Dichas transiciones de modalidad pueden ocurrir en dispositivos que dan soporte a multiples modalidades de codificacion de musica y/o voz. Por ejemplo, el dispositivo puede utilizar una modalidad CELT algebraica (ACELP) para la voz y una modalidad de codificacion de audio, es decir, una codificacion de senal generica (GSC) para las senales de tipo musical. Como alternativa, en ciertos escenarios de baja velocidad, el dispositivo puede determinar, en base a parametros caracteristicos (por ejemplo, tonalidad, deriva del tono, vocalizacion, etc.), que se puede utilizar una modalidad de trasformacion de coseno discreta modificada (MDCT) /ACELP/GSC.

/* Reiniciar distancia de LSP durante las transiciones de modo,

por ejemplo, cuando el modo de codificacion de la ultima trama es diferente del modo de codificacion de la trama actual */

THR1 = 0.008;

if(last mode != current mode && lsp spacing <

THR1)

{

lsp_shb_spacing[0] = lsp spacing; lsp_shb_spacing[1] = lsp spacing; lsp_shb_spacing[2] = lsp spacing; prevGainAttenuate = tRuE;

}

/* Calcular la media ponderada de las distancias LSP en la trama actual y tres tramas anteriores */

WGHT1 = 0.1; WGHT2 = 0.2; WGHT3 = 0.3; WGHT4 = 0.4;

Average_lsp_shb_spacing = WGHT1 * lsp_shb_spacing[0] +

WGHT2 * lsp_shb_spacing[1] +

WGHT3 * lsp_shb_spacing[2] +

WGHT4 * lsp spacing;

/* Actualizar bufer distancia lsp anterior */ lsp_shb_spacing[0]

= lsp_shb_spacing[1]; lsp_shb_spacing[1]

= lsp_shb_spacing[2]; lsp_shb_spacing[2]

= lsp_spacing;

Despues de determinar la distancia minima entre LSP, las velocidades de evolucion de LSP y la distancia minima media entre LSP, el modulo de deteccion de componentes inductores de distorsiones 158 puede comparar los valores determinados con uno o mas umbrales, de acuerdo con el siguiente pseudocodigo, para determinar si existe ruido inductor de distorsiones en la trama de audio. Si existe ruido inductor de distorsiones, el modulo de deteccion de componentes inductores de distorsiones 158 puede permitir que el modulo de atenuacion y allanamiento de la

5

10

15

20

25

30

35

40

45

50

55

60

65

ganancia 162 realice una atenuacion de la ganancia y/o un allanamiento de la ganancia, segun sea el caso.

THR1 = 0,008,

THR2 = 0,0032,

THR3 = 0,005,

THR4 = 0,001,

THR5 = 0,001,

GainAttenuate = FALSE,

GainSmooth = FALSE

/* Comprobar las condiciones a continuacion y habilitar los parametros de atenuacion/suavizado de ganancia.

Si la distancia de LSP es muy pequena, entonces hay mucha seguridad de que el ruido inductor de artefactos existe.

*/

if (lsp_spacing <= THR2 ||

(lsp_spacing < THR1 &&

(Average_lsp_shb_spacing < THR3 || prevGainAttenuate = TRUE)) )

{

GainAttenuate = TRUE;

/* Habilitar el suavizado de ganancia segun las velocidades de evolucion */ if(lsp_slow_evol_rate < THR4 && lsp_fast_evol_rate < THR5) {

GainSmooth = TRUE;

}

/* Actualizar atenuacion de la ganancia de la trama anterior para usar en la trama siguiente */ prevGainAttenuate = GainAttenuate;

En un modo de realizacion particular, el modulo de atenuacion y allanamiento de la ganancia 162 pueden realizar selectivamente la atenuacion y / o el allanamiento de la ganancia de acuerdo con el siguiente pseudocodigo.

/* Realizar suavizado de ganancia si se cumplen las condiciones siguientes*/ gamma3 = 0.5;

if(GainSmooth = = TRUE && prevframe_gain_SHB < currentframe gain SHB)

{

Gain_SHB = gamma3 * prevframe_gain_SHB +

(1-gamma3) * currentframe gain SHB;

}

/* Realizar atenuacion de ganancia si se cumplen las condiciones siguientes*/

THR6 = 0.0024 K1 = 3; alpha 1 = 0.8;

if(GainAttenuate = TRUE &&

Average lsp_shb_spacing <= THR6)

{

/* si la distancia de LSP media es menor que THR6, que es muy poco, la trama contiene un componente de ruido muy significativo, por tanto usar ponderado exponencial */

Gain SHB = currentframe gain SHBAalphal;

}

else if (prevGainAttenuate == TRUE && currentframe gain SHB >

K1 * prevframe_gain_SHB)

{

Gain_SHB = currentframe_gain_SHB * ALPHA1;

}

/* Actualizar ganancia de trama anterior para utilizar en trama siguiente */ prevframe_gain_SHB = Gain_SHB;

El sistema 100 de la Figura 1 puede por lo tanto realizar un control de ganancia (por ejemplo, atenuacion de la ganancia y/o allanamiento de la ganancia) para reducir o evitar distorsiones audibles debidas al ruido en una senal de entrada. El sistema 100 de la Figura 1 puede por lo tanto permitir una reproduccion mas precisa de una senal de audio (por ejemplo, una senal de voz) en presencia de un ruido que no se registra en los modelos de senal de codificacion de voz.

5

10

15

20

25

30

35

40

45

50

55

60

65

En relacion con la Figura 3, se muestra un diagrama de flujo de un modo de realizacion particular de un procedimiento de realizacion de un control de ganancia, y se designa en general 300. En un modo de realizacion ilustrativo, el procedimiento 300 se puede realizar en el sistema 100 de la Figura 1.

El procedimiento 300 puede incluir la recepcion de una senal de audio que va a codificarse (por ejemplo, mediante un modelo de senal de codificacion de voz) en 302. En un modo de realizacion particular, la senal de audio puede tener un ancho de banda desde aproximadamente 50 Hz a aproximadamente 16 kHz, y puede incluir voz. Por ejemplo, en la Figura 1, el banco de filtros de analisis 110 puede recibir la senal de audio de entrada 102 que esta codificada para ser reproducida en un receptor.

El procedimiento 300 tambien puede incluir determinar, a partir de informacion espectral (por ejemplo, distancia entre LSP, velocidad de evolucion de LSP) correspondiente a la senal de audio, que la senal de audio incluye un componente que se corresponde con una condicion generadora de distorsiones en 304. En un modo de realizacion particular, el componente inductor de distorsiones puede ser un ruido, tal como el ruido de alta frecuencia que se muestra en el primer espectrograma 210 de la Figura 2. Por ejemplo, en la Figura 1, el modulo de deteccion de componentes generadores de distorsiones 158 puede determinar, a partir de informacion espectral, que la parte de banda alta de la senal de audio 102 incluye dicho ruido.

La determinacion de que la senal de audio incluye el componente puede incluir la determinacion de una distancia entre LSP, asociada con una trama de la senal de audio. La distancia entre LSP puede ser la mas pequena entre una pluralidad de distancias entre LSP, correspondientes a una pluralidad de LSP generados durante la codificacion predictiva lineal (LPC) de una parte de banda alta de la trama de la senal de audio. Por ejemplo, se puede determinar que la senal de audio incluye el componente en respuesta a ser la distancia entre LSP menor que un primer umbral. Para mencionar otro ejemplo, se puede determinar que la senal de audio incluye el componente en respuesta a ser la distancia entre LSP menor que un segundo umbral, y ser una distancia media entre LSP de multiples tramas menor que un tercer umbral. Como se describe mas en detalle con respecto a la Figura 5, se puede determinar que la senal de audio incluye el componente en respuesta a (1) ser la distancia entre LSP menor que un segundo umbral y (2) al menos una de las condiciones siguientes: ser una distancia media entre LSP menor que un tercer umbral, o estar habilitada una atenuacion de la ganancia correspondiente a otra trama de la senal de audio, precediendo la otra trama a la trama de la senal de audio. Aunque las condiciones para determinar si la senal de audio incluye el componente se etiquetan como (1) y (2), dichas etiquetas son solo a modo de referencia y no imponen un orden secuencial de operacion. En lugar de ello, las condiciones (1) y (2) se pueden determinar en cualquier orden de relacion una con otra, o simultaneamente (al menos parcialmente superpuestas en el tiempo).

El procedimiento 300 puede incluir tambien, en respuesta a la determinacion de que la senal de audio incluye el componente, el ajuste de un parametro de ganancia correspondiente a la senal de audio, en 306. Por ejemplo, en la Figura 1, el modulo de atenuacion y allanamiento de la ganancia 162 puede modificar la informacion de ganancia a ser incluida en la informacion lateral de banda alta 172, lo que da como resultado que el flujo de bits de salida codificado 192 se desvie del modelo de senal. El procedimiento 300 puede terminar en 308.

El ajuste del parametro de ganancia puede incluir la habilitacion de un allanamiento de la ganancia para reducir un valor de ganancia correspondiente a una trama de la senal de audio. En un modo de realizacion particular, el allanamiento de la ganancia incluye la determinacion de una media ponderada de los valores de ganancia que incluye el valor de ganancia y otro valor de ganancia correspondiente a otra trama de la senal de audio. El allanamiento de la ganancia puede ser habilitado en respuesta a una primera velocidad de evolucion de un par de lineas espectrales (LSP), asociada con la trama, que es menor que un cuarto umbral, y una segunda velocidad de evolucion de LSP, asociada con la trama, que es menor que un quinto umbral. La primera velocidad de evolucion de LSP (por ejemplo, una velocidad de evolucion de LSP "lenta") puede corresponder a una velocidad de adaptacion mas lenta que la segunda velocidad de evolucion de LSP (por ejemplo, una velocidad de evolucion de LSP "rapida").

El ajuste del parametro de ganancia puede incluir la habilitacion de una atenuacion de la ganancia para reducir un valor de ganancia correspondiente a una trama de la senal de audio. En un modo de realizacion particular, la atenuacion de la ganancia incluye la aplicacion de una operacion exponencial al valor de ganancia o la aplicacion de una operacion lineal al valor de ganancia. Por ejemplo, en respuesta al cumplimiento de una primera condicion de ganancia (por ejemplo, la trama incluye una distancia media entre LSP que es menor que un sexto umbral), se puede aplicar una operacion exponencial al valor de ganancia. En respuesta al cumplimiento de una segunda condicion de ganancia (por ejemplo, se ha habilitado una atenuacion de la ganancia correspondiente a otra trama de la senal de audio, precediendo la otra trama a la trama de la senal de audio), se puede aplicar una operacion lineal al valor de ganancia. En modos de realizacion particulares, el procedimiento 300 de la Figura 3 se puede implementar mediante hardware (por ejemplo, un dispositivo con una matriz de bloques programables (FPGA), un circuito integrado especifico de la aplicacion (ASIC), etc.) de una unidad de procesamiento tal como una unidad central de procesamiento, un procesador de senales digitales (DSP), o un controlador, mediante un dispositivo de firmware, o cualquier combinacion de los mismos. Como un ejemplo, el procedimiento 300 de la Figura 3 se puede realizar mediante un procesador que ejecuta instrucciones, tal como se describe con respecto a la Figura 6.

5

10

15

20

25

30

35

40

45

50

55

60

65

Con referenda a la Figura 4, se muestra un diagrama de flujo de un modo de realizacion particular de un procedimiento de realizacion de un control de ganancia, y que se designa en general 400. En un modo de realizacion ilustrativo, el procedimiento 400 se puede realizar en el sistema 100 de la Figura 1.

Una distancia entre un par de lineas espectrales (LSP), asociada con una trama de una senal de audio, se compara con al menos un umbral, en 402, y se ajusta un parametro de ganancia correspondiente a la senal de audio basandose, al menos parcialmente, en un resultado de la comparacion, en 404. Aunque la comparacion de la distancia entre LSP con al menos un umbral puede indicar la presencia de un componente generador de distorsiones en la senal de audio, la comparacion no necesariamente indica la presencia real de un componente generador de distorsiones. Por ejemplo, uno o mas de los umbrales utilizados en la comparacion se pueden fijar para proporcionar una mayor probabilidad de que el control de ganancia se realice cuando esta presente un componente generador de distorsiones en la senal de audio, proporcionando al mismo tiempo una mayor probabilidad de que el control de ganancia se realice sin un componente generador de distorsiones presente en la senal de audio (por ejemplo, un "falso positivo"). Por lo tanto, el procedimiento 400 puede realizar el control de ganancia sin determinar si un componente generador de distorsiones esta presente en la senal de audio.

En un modo de realizacion particular, la distancia entre LSP es la mas pequena entre una pluralidad de distancias entre LSP correspondientes a una pluralidad de LSP de una parte de banda alta de la trama de la senal de audio. El ajuste del parametro de ganancia puede incluir la habilitacion de una atenuacion de la ganancia en respuesta a ser la distancia entre LSP menor que un primer umbral. Como alternativa, o ademas, el ajuste del parametro de ganancia incluye la habilitacion de una atenuacion de la ganancia en respuesta a ser la distancia entre LSP menor que un segundo umbral y a ser una distancia media entre LSP menor que un tercer umbral, donde la distancia media entre LSP se basa en la distancia entre LSP asociada con la trama y al menos otra distancia entre LSP asociada con al menos otra trama de la senal de audio.

Cuando se habilita la atenuacion de la ganancia, el ajuste del parametro de ganancia puede incluir la aplicacion de una operacion exponencial a un valor del parametro de ganancia, en respuesta al cumplimiento de una primera condicion de ganancia, y la aplicacion de una operacion lineal al valor del parametro de ganancia, en respuesta al cumplimiento de una segunda condicion de ganancia.

El ajuste del parametro de ganancia puede incluir la habilitacion de un allanamiento de la ganancia para reducir un valor de ganancia correspondiente a una trama de la senal de audio. El allanamiento de la ganancia puede incluir la determinacion de una media ponderada de los valores de ganancia, que incluyen el valor de ganancia asociado con la trama y otro valor de ganancia correspondiente a otra trama de la senal de audio. El allanamiento de la ganancia puede ser habilitado en respuesta a ser una primera velocidad de evolucion de un par de lineas espectrales (LSP), asociada con la trama, menor que un cuarto umbral, y a ser una segunda velocidad de evolucion de LSP, asociada con la trama, menor que un quinto umbral. La primera velocidad de evolucion de LSP corresponde a una velocidad de adaptacion mas lenta que la segunda velocidad de evolucion de LSP.

En modos de realizacion particulares, el procedimiento 400 de la Figura 4 se puede implementar mediante hardware (por ejemplo, un dispositivo con una matriz de bloques programables (FPGA), un circuito integrado especifico de la aplicacion (ASIC), etc.) de una unidad de procesamiento, tal como una unidad central de procesamiento (CPU), un procesador de senales digitales (DSP) o un controlador, mediante un dispositivo de firmware, o cualquier combinacion de los mismos. Como un ejemplo, el procedimiento 400 de la Figura 4 se puede realizar mediante un procesador que ejecuta instrucciones, tal como se describe con respecto a la Figura 6.

Con referencia a la Figura 5, se muestra un diagrama de flujo de otro modo de realizacion particular de un procedimiento de realizacion de un control de ganancia, y se designa en general 500. En un modo de realizacion ilustrativo, el procedimiento 500 se puede realizar en el sistema 100 de la Figura 1.

El procedimiento 500 puede incluir la determinacion de una distancia entre LSP asociada con una trama de una senal de audio, en 502. La distancia entre LSP puede ser la mas pequena entre una pluralidad de distancias entre LSP, correspondientes a una pluralidad de LSP, generados durante una codificacion predictiva lineal de la trama. Por ejemplo, la distancia entre LSP se puede determinar tal como se ilustra con referencia a la variable "lsp_spacing" en el pseudo-codigo correspondiente a la Figura 1.

El procedimiento 500 puede incluir tambien la determinacion de una primera velocidad (por ejemplo, lenta) de evolucion de LSP, asociada con la trama, en 504, y la determinacion de una segunda velocidad (por ejemplo, rapida) de evolucion de LSP, asociada con la trama, en 506. Por ejemplo, las velocidades de evolucion de LSP pueden ser determinadas como se ilustra con referencia a las variables "lsp_fast_evol_rate" en el pseudo-codigo correspondiente a la Figura 1.

El procedimiento 500 puede incluir ademas la determinacion de una distancia media entre LSP sobre la base de la distancia entre LSP, asociada con la trama, y al menos otra distancia entre LSP, asociada con al menos otra trama de la senal de audio, en 508. Por ejemplo, la distancia media entre LSP se puede determinar tal como se ilustra con referencia a la variable "Average_lsp_shb_spacing" en el pseudo-codigo correspondiente a la Figura 1.

5

10

15

20

25

30

35

40

45

50

55

60

65

El procedimiento 500 puede incluir la determinacion de si la distancia entre LSP es menor que un primer umbral, en 510. Por ejemplo, en el pseudo-codigo de la Figura 1, el primer umbral puede ser "THR2" = 0,0032. Si la distancia entre LSP es menor que el primer umbral, el procedimiento 500 puede incluir la habilitacion de una atenuacion de la ganancia, en 514.

Cuando la distancia entre LSP no es menor que el primer umbral, el procedimiento 500 puede incluir la determinacion de si la distancia entre LSP es menor que un segundo umbral, en 512. Por ejemplo, en el pseudo- codigo de la Figura 1, el primer umbral puede ser "THR1" = 0,008. Cuando la distancia entre LSP no es menor que el segundo umbral, el procedimiento 500 puede terminar, en 522. Cuando la distancia entre LSP es menor que el segundo umbral, el procedimiento 500 puede incluir determinar si la distancia media entre LSP es menor que un tercer umbral, si la trama representa (o esta relacionada de otro modo con) una transicion de modalidad y/o si estaba habilitada la atenuacion de la ganancia en la trama anterior, en 516. Por ejemplo, en el pseudo-codigo de la Figura 1, el tercer umbral puede ser "THR3" = 0,005. Cuando la distancia media entre LSP es menor que el tercer umbral o la trama representa una transicion de modalidad, o si la variable prevGainAttenuate = TRUE, el procedimiento 500 puede incluir habilitar la atenuacion de la ganancia, en 514. Cuando la distancia media entre LSP no es menor que el tercer umbral y la trama no representa una transicion de modalidad y la variable prevGainAttenuate = FALSE, el procedimiento 500 puede terminar, en 522.

Cuando la atenuacion de la ganancia se habilita en 514, el procedimiento 500 puede avanzar a 518 y determinar si la primera velocidad de evolucion es menor que un cuarto umbral y si la segunda velocidad de evolucion es menor que un quinto umbral, en 518. Por ejemplo, en el pseudo-codigo de la Figura 1, el cuarto umbral puede ser "THR4" = 0,001 y el quinto umbral puede ser "THR5" = 0,001. Cuando la primera velocidad de evolucion es menor que el cuarto umbral y la segunda velocidad de evolucion es menor que el quinto umbral, el procedimiento 500 puede incluir la habilitacion de un allanamiento de la ganancia, en 520, despues de lo cual el procedimiento 500 puede terminar, en 522. Cuando la primera velocidad de evolucion no es menor que el cuarto umbral o la segunda velocidad de evolucion no es menor que el quinto umbral, el procedimiento 500 puede terminar, en 522.

En modos de realizacion particulares, el procedimiento 500 de la Figura 5 se puede implementar mediante hardware (por ejemplo, un dispositivo con una matriz de bloques programables (FPGA), un circuito integrado especifico de la aplicacion (ASIC), etc.) de una unidad de procesamiento tal como una unidad central de procesamiento (CPU), un procesador de senales digitales (DSP) o un controlador, mediante un dispositivo de firmware, o cualquier combinacion de los mismos. Como un ejemplo, el procedimiento 500 de la Figura 5 se puede realizar mediante un procesador que ejecuta instrucciones, como se describe con respecto a la Figura 6.

Las Figuras 1 a 5 ilustran por tanto los sistemas y procedimientos para determinar si se realiza el control de ganancia (por ejemplo, en el modulo de allanamiento y atenuacion de la ganancia 162 de la Figura 1) para reducir las distorsiones debidas al ruido.

Con referencia a la Figura 6, se describe un diagrama de bloques de un modo de realizacion ilustrativo particular de un dispositivo de comunicacion inalambrica, y se designa, en general, 600. El dispositivo 600 incluye un procesador 610 (por ejemplo, una unidad central de procesamiento (CPU), un procesador de senales digitales (DSP), etc.) acoplado a una memoria 632. La memoria 632 puede incluir instrucciones 660 ejecutables por el procesador 610 y/o un codificador/decodificador (CODEC) 634 para realizar los procedimientos y procesos divulgados en el presente documento, tales como los procedimientos de las Figuras 3 a 5.

El CODEC 634 puede incluir un sistema de control de ganancia 672. En un modo de realizacion particular, el sistema de control de ganancia 672 puede incluir uno o mas componentes del sistema 100 de la Figura 1. El sistema de control de ganancia 672 puede implementarse mediante hardware dedicado (por ejemplo, circuitos), por un procesador que ejecuta las instrucciones para realizar una o mas tareas, o una combinacion de los mismos. Como un ejemplo, la memoria 632, o una memoria en el CODEC 634, puede ser un dispositivo de memoria, tal como una memoria de acceso aleatorio (RAM), memoria de acceso aleatorio magneto-resistiva (MRAM), MRAM de transferencia de giro del par de torsion (STT-MRAM), memoria flash, memoria de solo lectura (ROM), memoria de solo lectura programable (PROM), memoria de solo lectura programable y borrable (EPROM), memoria de solo lectura programable y borrable electricamente (EEPROM), registros, un disco duro, un disco extraible o un disco compacto con memoria de solo lectura (CD-ROM). El dispositivo de memoria puede incluir instrucciones (por ejemplo, las instrucciones 660) que, cuando son ejecutadas por un ordenador (por ejemplo, un procesador en el CODEC 634 y/o el procesador 610), pueden hacer que el ordenador determine, en base a informacion espectral correspondiente a una senal de audio, que la senal de audio incluye un componente correspondiente a una condicion generadora de distorsiones, y que ajuste un parametro de ganancia correspondiente a la senal de audio en respuesta a la determinacion de que la senal de audio incluye el componente. Como un ejemplo, la memoria 632, o una memoria en el CODEC 634, puede ser un medio no transitorio legible por ordenador que incluye instrucciones (por ejemplo, las instrucciones 660) que, cuando son ejecutadas por un ordenador (por ejemplo, un procesador en el CODEC 634 y/o el procesador 610), pueden hacer que el ordenador compare una distancia entre un par de lineas espectrales (LSP), asociada con una trama de una senal de audio, con al menos un umbral, y que ajuste un parametro de ganancia de codificacion de audio, correspondiente a la senal de audio, basado, al menos

5

10

15

20

25

30

35

40

45

50

55

60

65

parcialmente, en un resultado de la comparacion.

La Figura 6 muestra tambien un controlador de pantalla 626 que esta acoplado al procesador 610 y a una pantalla 628. Como se muestra, el CODEC 634 puede estar acoplado al procesador 610. Un altavoz 636 y un microfono 638 pueden estar acoplados al CODEC 634. Por ejemplo, el microfono 638 puede generar la senal de audio de entrada 102 de la Figura 1, y el CODEC 634 puede generar el flujo de bits de salida 192 para su transmision a un receptor, en base a la senal de audio de entrada 102. Para mencionar otro ejemplo, el altavoz 636 se puede usar para emitir una senal reconstruida por el CODEC 634 a partir del flujo de bits de salida 192 de la Figura 1, donde el flujo de bits de salida 192 se recibe desde un transmisor. La Figura 6 tambien indica que un controlador inalambrico 640 puede estar acoplado al procesador 610 y a una antena inalambrica 642.

En un modo de realizacion particular, el procesador 610, el controlador de pantalla 626, la memoria 632, el CODEC 634 y el controlador inalambrico 640 se incluyen en un dispositivo de sistema en un paquete o de sistema en un chip (por ejemplo, un modem de estacion movil (MSM)) 622. En un modo de realizacion particular, un dispositivo de entrada 630, tal como una pantalla tactil y/o panel de teclas, y una fuente de alimentacion 644, estan acoplados al dispositivo de sistema en un chip 622. Ademas, en un modo de realizacion particular, como se ilustra en la Figura 6, la pantalla 628, el dispositivo de entrada 630, el altavoz 636, el microfono 638, la antena inalambrica 642 y la fuente de alimentacion 644 son externos al dispositivo de sistema en un chip 622. Sin embargo, cada uno entre la pantalla 628, el dispositivo de entrada 630, el altavoz 636, el microfono 638, la antena inalambrica 642 y la fuente de alimentacion 644 se puede acoplar a un componente del dispositivo de sistema en un chip 622, tal como una interfaz o un controlador.

Conjuntamente con los modos de realizacion descritos, se divulga un aparato que incluye medios para determinar, a partir de informacion espectral correspondiente a una senal de audio, que la senal de audio incluye un componente correspondiente a una condicion generadora de distorsiones. Por ejemplo, los medios para determinar pueden incluir el modulo de deteccion de componentes inductores de distorsiones 158 de la Figura 1, el sistema de control de ganancia 672 de la Figura 6 o un componente del mismo, uno o mas dispositivos configurados para determinar que una senal de audio incluye un componente de este tipo (por ejemplo, un procesador que ejecuta instrucciones en un medio de almacenamiento no transitorio legible por ordenador), o cualquier combinacion de los mismos.

El aparato tambien puede incluye medios para ajustar un parametro de ganancia correspondiente a la senal de audio en respuesta a la determinacion de que la senal de audio incluye el componente. Por ejemplo, los medios para ajustar pueden incluir el modulo de atenuacion y allanamiento de ganancia 162 de la Figura 1, el sistema de control de ganancia 672 de la Figura 6 o un componente del mismo, uno o mas dispositivos configurados para generar una senal codificada (por ejemplo, un procesador que ejecuta instrucciones en un medio de almacenamiento no transitorio legible por ordenador), o cualquier combinacion de los mismos.

Los expertos apreciaran ademas que los diversos bloques logicos, configuraciones, modulos, circuitos y etapas de algoritmo ilustrativos, descritos en relacion con los modos de realizacion divulgados en el presente documento, se pueden implementar como hardware electronico, software informatico ejecutado por un dispositivo de procesamiento tal como un procesador de hardware, o combinaciones de ambos. Diversos componentes, bloques, configuraciones, modulos, circuitos y etapas ilustrativos se han descrito anteriormente, en general, en cuanto a su funcionalidad. Si dicha funcionalidad se implementa como hardware o software ejecutable depende de la aplicacion particular y de las limitaciones de diseno impuestas sobre todo el sistema. Los expertos pueden implementar la funcionalidad descrita de diferentes maneras para cada aplicacion particular, pero no debe interpretarse que dichas decisiones de implementacion suponen una desviacion del alcance de la presente divulgacion.

Las etapas de un procedimiento o algoritmo descrito en relacion con los modos de realizacion divulgados en el presente documento se pueden realizar directamente en hardware, en un modulo de software ejecutado por un procesador, o en una combinacion de los dos. Un modulo de software puede residir en un dispositivo de memoria, tal como una memoria de acceso aleatorio (RAM), memoria de acceso aleatorio magneto-resistiva (MRAM), MRAM de transferencia de giro del par de torsion (STT-MRAM), memoria flash, memoria de solo lectura (ROM), memoria de solo lectura programable (PROM), memoria de solo lectura programable y borrable (EPROM), memoria de solo lectura programable y borrable electricamente (EEPROM), registros, un disco duro, un disco extraible o un disco compacto con memoria de solo lectura (CD-ROM). A modo de ejemplo, un dispositivo de memoria esta acoplado al procesador de manera que el procesador pueda leer informacion de, y escribir informacion en, el dispositivo de memoria. Como alternativa, el dispositivo de memoria puede estar integrado en el procesador. El procesador y el medio de almacenamiento pueden residir en un circuito integrado especifico de la aplicacion (ASIC). El ASIC puede residir en un dispositivo informatico o un terminal de usuario. Como alternativa, el procesador y el medio de almacenamiento pueden residir como componentes discretos en un dispositivo informatico o un terminal de usuario.

La anterior descripcion de los modos de realizacion divulgados se proporciona para permitir que un experto en la materia realice o utilice los modos de realizacion divulgados. Diversas modificaciones de estos modos de realizacion resultaran inmediatamente evidentes para los expertos en la materia, y los principios definidos en el presente documento pueden aplicarse a otros modos de realizacion sin apartarse del alcance de la divulgacion. Por tanto, la presente divulgacion no pretende limitarse a los modos de realizacion mostrados en el presente documento, sino

que se le concede el alcance mas amplio posible, coherente con los principios y caracteristicas novedosas segun lo definido por las siguientes reivindicaciones.

Claims

REIVINDICACIONES

1.

5

10
2.

15

20

25
3.

30
4.

35

40 5.
6.

45
7.

50
8.

55
9.

60

65 10.

Un procedimiento que comprende:

la determinacion (304), en base a una distancia entre un par de lineas espectrales, LSP, asociada con una trama de una senal de audio, de que la senal de audio incluye un componente correspondiente a una condicion generadora de distorsiones; y

en respuesta a la determinacion de que la senal de audio incluye el componente, el ajuste de un parametro de ganancia correspondiente a la senal de audio, en el que la distancia entre LSP es la mas pequena entre una pluralidad de espacios entre LSP, correspondientes a una pluralidad de LSP de una parte de banda alta de la trama de la senal de audio.

El procedimiento de la reivindicacion 1, en el que se determina que la senal de audio incluye el componente en respuesta a ser la distancia entre LSP menor que un primer umbral, o en el que se determina que la senal de audio incluye el componente en respuesta a ser la distancia entre LSP menor que un segundo umbral y a ser una distancia media entre LSP menor que un tercer umbral, en el que la distancia media entre LSP se basa en la distancia entre LSP asociada con la trama y en al menos otra distancia entre LSP asociada con al menos otra trama de la senal de audio, o en el que se determina que la senal de audio incluye el componente en respuesta a:

1) ser la distancia entre LSP menor que un segundo umbral; y

2) al menos una de las situaciones siguientes:

ser una distancia media entre LSP menor que un tercer umbral; o

estar habilitada una atenuacion de la ganancia correspondiente a otra trama de la senal de audio, precediendo la otra trama a la trama de la senal de audio, o en el que la condicion generadora de distorsiones corresponde al ruido de banda alta.

El procedimiento de la reivindicacion 1 en el que el ajuste del parametro de ganancia incluye la habilitacion del allanamiento de la ganancia para reducir las variaciones mas rapidas del valor de ganancia correspondientes a una trama de la senal de audio.

El procedimiento de la reivindicacion 3, en el que el allanamiento de la ganancia incluye la determinacion de una media ponderada de los valores de ganancia que incluyen el valor de ganancia asociado con la trama y otro valor de ganancia correspondiente a otra trama de la senal de audio, o en el que se ha habilitado el allanamiento de la ganancia en respuesta a ser una primera velocidad de evolucion de pares espectrales de lineas, LSP, asociada con la trama, menor que un cuarto umbral, y a ser una segunda velocidad de evolucion de LSP, asociada con la trama, menor que un quinto umbral.

El procedimiento de la reivindicacion 4, en el que la primera velocidad de evolucion de LSP corresponde a una velocidad de adaptacion mas lenta que la segunda velocidad de evolucion de LSP.

El procedimiento de la reivindicacion 1, en el que el ajuste del parametro de ganancia incluye la habilitacion de una atenuacion de la ganancia para reducir un valor de ganancia correspondiente a una trama de la senal de audio.

El procedimiento de la reivindicacion 6, en el que la atenuacion de la ganancia incluye la aplicacion de una operacion exponencial al valor de ganancia, o en el que la atenuacion de la ganancia incluye la aplicacion de una operacion lineal al valor de ganancia.

El procedimiento de la reivindicacion 6, en el que la atenuacion de la ganancia incluye:

en respuesta al cumplimiento de una primera condicion de ganancia, la aplicacion de una operacion exponencial al valor de ganancia; y

en respuesta al cumplimiento de una segunda condicion de ganancia, la aplicacion de una operacion lineal al valor de ganancia.

El procedimiento de la reivindicacion 8, en el que la primera condicion de ganancia incluye ser una distancia media entre LSP menor que un sexto umbral, en el que la distancia media entre LSP se basa en la distancia entre LSP asociada con la trama y al menos otra distancia entre LSP asociada con al menos otra trama de la senal de audio, o en el que la segunda condicion de ganancia incluye estar habilitada una atenuacion de la ganancia correspondiente a otra trama de la senal de audio, precediendo la otra trama a la trama de la senal de audio.

Un procedimiento que comprende:

10

15

20

25

30

35

40

la comparacion (402) de una distancia entre un par de lineas espectrales (LSP), asociada con una trama de una senal de audio, con al menos un umbral; y

el ajuste (404) de un parametro de ganancia de codificacion de audio correspondiente a la senal de audio, en base, al menos parcialmente, a un resultado de la comparacion, en el que la distancia entre LSP es la mas pequena entre una pluralidad de separaciones entre LSP, correspondientes a una pluralidad de LSP de una parte de banda alta de la trama de la senal de audio.
11. El procedimiento de la reivindicacion 10, en el que el ajuste del parametro de ganancia incluye la habilitacion de una atenuacion de la ganancia en respuesta a ser la distancia entre LSP menor que un primer umbral, o en el que el ajuste del parametro de ganancia incluye la habilitacion de una atenuacion de la ganancia en respuesta a ser la distancia entre LSP menor que un segundo umbral, y a ser una distancia media entre LSP menor que un tercer umbral, en el que la distancia media entre LSP se basa en la distancia entre LSP asociada con la trama y en al menos otra distancia entre LSP asociada con al menos otra trama de la senal de audio, o en el que el ajuste del parametro de ganancia incluye, cuando se ha habilitado una atenuacion de la ganancia:

en respuesta al cumplimiento de una primera condicion de ganancia, la aplicacion de una operacion exponencial a un valor del parametro de ganancia; y

en respuesta al cumplimiento de una segunda condicion de ganancia, la aplicacion de una operacion lineal al valor del parametro de ganancia, o en el que el ajuste del parametro de ganancia incluye la habilitacion de un allanamiento de la ganancia para reducir las variaciones mas rapidas del valor de ganancia correspondiente a una trama de la senal de audio.
12. El procedimiento de la reivindicacion 11 en el que el allanamiento de la ganancia incluye la determinacion de una media ponderada de los valores de ganancia que incluye el valor de ganancia asociado con la trama y otro valor de ganancia correspondiente a otra trama de la senal de audio.
13. El procedimiento de la reivindicacion 12, en el que se habilita el allanamiento de la ganancia en respuesta a ser una primera velocidad de evolucion de un par de lineas espectrales (LSP), asociada con la trama, menor que un cuarto umbral, y a ser una segunda velocidad de evolucion de LSP, asociada con la trama, menor que un quinto umbral, y en el que la primera velocidad de evolucion de LSP corresponde a una velocidad de adaptacion mas lenta que la segunda velocidad de evolucion de LSP.
14. Un aparato que comprende:

medios dispuestos para realizar las etapas de una cualquiera de las reivindicaciones 1 a 13.
15. Un medio no transitorio legible por ordenador que comprende instrucciones que, cuando son ejecutadas por un ordenador, hacen que el ordenador realice las etapas de una cualquiera de las reivindicaciones 1 a 13.

5