codificación para codificar las señales de audio de la banda de frecuencia superior, y un selector de modos para seleccionar el modo de operación para el codificador entre por lo menos un primer modo y un segundo modo, en el primer modo señales solamente en la banda de frecuencia inferior son codificadas, y en el segundo modo señales tanto en la banda de frecuencia inferior como en la banda de frecuencia superior son codificadas. Igualmente la invención se refiere a un sistema que comprende un codificador que comprende una entrada para introducir tramas de una señal de audio en una banda de frecuencias, por lo menos un primer bloque de excitación para realizar una primera excitación para una señal de audio similar a la voz, y un segundo bloque de excitación para realizar una segunda excitación para una señal de audio distinta de la voz . La invención se refiere también a un método para comprimir señales de audio en una banda de frecuencias, la banda de frecuencias se divide en por lo menos una banda de frecuencia inferior y una banda de frecuencia superior, las señales de audio de la banda de frecuencia inferior son codificadas por un primer bloque de codificación, las señales de audio de la banda de frecuencia superior son codificadas por un segundo bloque de codificación, y un modo es seleccionado para la codificación entre por lo menos un primer modo y un segundo modo, en el primer modo señales solamente en la banda -de frecuencia inferior son -codificadas, y en el segundo modo señales tanto en la banda de frecuencia inferior como en la banda de frecuencia superior son codificadas. La invención se refiere a un módulo para codificar tramas de una señal de audio en una banda de frecuencias que se divide en por lo menos una banda de frecuencia inferior y una banda de frecuencia superior, el módulo comprende un primer bloque de codificación para codificar las señales de audio de la banda de frecuencia inferior, un segundo bloque de codificación para codificar las señales de audio de la banda de frecuencia superior, y un selector de modos para seleccionar el modo de operación para el módulo entre al menos un primer modo y un segundo modo, en el primer modo señales solamente en la banda de frecuencia inferior son codificadas, y en el segundo modo señales tanto en la banda de frecuencia inferior como en la banda dé frecuencia superior son codificadas. La invención se refiere a un producto de programa de computadora que comprende pasos ejecutables por máquina para comprimir señales de audio en una banda de frecuencia dividida en al menos una banda de frecuencia inferior y una banda de frecuencia superior, para codificar las señales de audio de la banda de frecuencia inferior por medio de un primer bloque de codificación, para codificar las señales de audio de la banda de frecuencia superior por medio de un segundo bloque de codificación, y para seleccionar un modo para la codificación entre por lo menos un primer modo y un segundo modo, en el primer modo señales solamente en la banda de frecuencia inferior son codificadas, y en el segundo modo señales tanto en la banda de frecuencia inferior como en la banda de frecuencia superior son codificadas. La invención se refiere a una señal que comprende un flujo de bits que incluye parámetros para que un decodificador decodifique el flujo de bits, el flujo de bits es codificado a partir de tramas de una señal <3 audio en una banda de frecuencias, la cual se divide en por lo menos una banda de frecuencia inferior y una banda de frecuencia superior, y por lo menos un primer modo y un segundo modo se definen para la señal, en el primer modo señales solamente en la banda de frecuencia inferior son codificadas, y en el segundo modo señales tanto en la banda de frecuencia inferior como en la banda de frecuencia superior son codificadas. ANTECEDENTES DE LA INVENCIÓN En muchas aplicaciones de procesamiento de señales de audio las señales de audio son comprimidas para reducir los requerimientos de energía de procesamiento al procesar la señal de audio. Por ejemplo, en sistemas de comunicación digital la señal de audio es típicamente capturada como una señal analógica, .digitalizada en un convertidor de analógico a digital (A/D) y después codificada antes -de transmisión sobre una interfase aérea inalámbrica entre un equipo de usuario,; tal como una estación móvil, y una estación base. El propósito de la codificación es comprimir la señal digitalizada y transmitirla sobre la interfase aérea con la mínima cantidad de datos mientras mantiene un nivel de calidad de señal aceptable. Esto es particularmente importante ya -que la capacidad de canal de radio sobre la interfase aérea inalámbrica es limitada en una red de comunicaciones celulares. Existen también aplicaciones en las cuales la señal de audio digitalizada es alma-cenada a un medio de almacenamiento para reproducción posterior de la señal de audio . La compresión puede tener pérdidas o puede no tener pérdidas. En la compresión con pérdidas parte de la, información se pierde durante la compresión en donde no es posible reconstruir por completo la señal original a partir de la señal comprimida. En la compresión sin pérdidas normalmente no se pierde información. Por consiguiente, la señal original usualmente puede ser reconstruida por completo a partir de la señal comprimida. En servicios de telefonía la voz está con frecuencia limitada en banda a entre aproximadamente 20? Hz y 3400 Hz. La velocidad de muestreo típica usada por un convertidor A/D para convertir una señal de voz analógica en una señal digital -es 8 kHz o 16 kHz. Las señales de música o señales distintas de la voz pueden contener componentes de frecuencia muy por arriba del ancho de banda de voz normal. En algunas aplicaciones «1 sistema de audio debe ser capaz de mane ar una banda de frecuencias entre aproximadamente 20 Hz y 20 , 000 kHz. La velocidad de muestreo para ese tipo de señales debe ser por lo menos 40 , 000 kHz para evitar solapamiento . Cabe mencionar aguí que los valores antes mencionados son sólo ejemplos no limitantes. Por ejemplo, en algunos sistemas el límite superior para señales de músi-ca puede ser muy por abajo de los 20 , 000 kHz. La señal digital muestreada es luego codificada, usualmente sobre una base ele trama por trama, lo cual da por resultado un flujo de datos digitales con una velocidad de bits que es determinada por un codee usado para codificación. Mientras más alta la velocidad de bits, más datos so codificados, lo cual da por resultado una representación más precisa de la trama introducida. La señal de audio codificada puede entonces ser decodificada y pasada a través de un convertidor de digital a analógico (D/A) para reconstruir una señal que está tan cerca de la señal original como es posible. Un codee ideal codificará la señal de audio con tan pocos bits como sea posible y optimizará así la capacidad de canal, mientras produce una señal de audio decodificada que suena tan cercano a la señal de audio original como es posible. En la práctica usualmente existe un intercambio entre la velocidad de bits óel codee y la calidad del audio decodificaclo .
En la actualidad existen muchas codees diferentes, tales como el codee de velocidad múltiple adaptativo (AMR) , el codee de banda ancha de velocidad múltiple adaptativo (AMR-WB) y el codee de banda ancha de velocidad múltiple adaptativo extendido (AMR- B+) , los cuales son desarrollados para comprimir y codificar señales de audio. El AMR fue desarrollado por el Proyecto de Asociación de Tercera Generación (3GPP) para redes de comunicación GSM/EDGE y WCDMA. Además, se ha previsto que AMR se usará en redes -de conmutación de paquetes. AMR está basado en codificación de Predicción Lineal Excitada por Código Algebraico (ACELP) . Los codees AMR, AMR WB y AMR B+ consisten de 8, 9 y 12 velocidades de bits activas respectivamente e incluyen también detección de actividad de voz (VAD) y funcionalidad de transmisión discontinua (DTX) . Actualmente, la velocidad de muestreo en el codee AMR es 8 kHz y en el codee AMR-WB la velocidad de muestreo es 16 kHz. Es obvio que los codees, modos de códec y velocidades de muestreo antes mencionados son sólo ejemplos no limitantes. Los algoritmos de extensión de ancho de banda de códec de audio típicamente aplican las funciones de codificación así como parámetros de codificación del códec central. Esto es, el ancho de banda de audio codificado sé divide en dos, de los cuales la banda inferior es procesada por .el códec central y la banda superior es luego codificada con el uso de conocimiento sobre los . parámetros de codificación y señales de la banda central (es decir, banda inferior) . Debido a que en la mayoría de los casos las bandas de audio baja y alta se correlacionan entre sí, los parámetros de banda baja pueden ser también explotados en la banda alta a cierto grado. El usar parámetros del codificador de banda baja para ayudar a la codificación de banda alta reduce la velocidad de bits de la codificación de banda alta de manera significativa. Un ejemplo del algoritmo de codificación de banda dividida es el códec AMR-WB extendido (AR- B+) . El codificador central contiene algoritmos de codificación de señal fuente compl-eta mientras que la señal de excitación LPC del codificador de banda alta es copiada del codificador central o es una señal aleatoria generada localmente. La codificación ele banda baja utiliza algoritmos tipo predicción lineal de excitación por código algebraico (ACELP) o algoritmos basados en transformación. La selección entre los algoritmos se realiza con base en las características de la señal de entrada. El algoritmo ACELP se utiliza usualmente para señales de voz y para transitorios, mientras que las señales ole música y señales tipo tono son usualmente codificadas con el uso de -codificación por transformación para manejar mejor la resolución de frecuencia. La codificación Ee banda alta utiliza codificación de predicción lineal para modelar el envolvente espectral de la señal de banda alta. Para ahorrar velocidad de bits, la señal de excitación es generada al sobremúestrear la excitación de banda baja a banda alta. Esto es, le excitación de banda baja se vuelve a usar en la banda alta al transponerla a la banda alta. Otro método es generar una señal de excitación aleatoria para la banda alta. La señal de banda alta sintetizada es reconstruida al filtrar la señal dé excitación escalada a través del modelo LPC de banda alta. El códec AMR-WB extendido (AMR-WB+) aplica una estructura de banda dividida en la cual el ancho de banda de audio se divide en dos partes antes del proceso de codificación. Ambas bandas son codificadas de manera independiente. No obstante, para reducir al mínimo la velocidad de bits, la banda superior es codificada con el uso de las técnicas de extensión de ancho de banda antes mencionadas, allí parte de la codificación de banda alta depende de la codificación de banda baja. En este caso, la señal de excitación de banda alta para una síntesis de codificación de predicción lineal (LPC) es copiada del codificador de banda baja. En el códec AM -WB+ el rango de banda baja es de 0 a 6.4 kHz, mientras que la banda alta es de 6.4 a 8 kHz para una frecuencia de muestreo de 16 kHz, y de 6.4 a 12 kHz para una frecuencia de muestreo de 24 kHz. El códec AMR-WB+ es capaz de conmutar entre modos también durante un flujo de audio, siempre que la frecuencia de muestreo no cambie. Por consiguiente, es posible conmutar entre modos AMR-WB y los modos de extensión con el empleo de una frecuencia de muestreo de 1-6 kHz. Esta funcionalidad se puede usar, por ejemplo, cuando las condiciones de transmisión requieren cambiar de un modo de velocidad de bits superior (un modo de extensión) a un modo de velocidad de bits inferior (modo AMR-WB) para reducir la cogestión en la red. De manera similar, si un cambio en las condiciones de red permite un cambio de modo de velocidad de bits inferior a uno superior para permitir una mejor calidad de audio, AMR-WB+ puede cambiar de un modo AMR-WB a uno de los modos de extensión. El cambio de un modo de codificación que usa codificación de extensión de banda alta a un modo que usa solamente codificación de banda central se puede obtener simplemente al apagar la extensión de banda alta inmediatamente cuando ocurre ese cambio de modo. De manera similar, al cambiar de un modo de sólo banda central a un modo que usa la extensión de banda alta, la banda alta es introducida inmediatamente con volumen completo al encender la extensión de banda alta. Debido a la codificación de extensión de ancho de banda el ancho de banda de audio provisto por los modos de extensión AMR-WB+ es más ancho que aquél de los modos AMR-WB, lo cual -es probable que cause efecto audible molesto si la conmutación ocurre demasiado rápido. Un usuario pudiera considerar este cambio -en ii
ancho de banda de audio audible especialmente molesto al cambiar de banda de audio más ancha a una más estrecha, es decir, cambiar de un modo de extensión a un modo AMR-WB. BREVE DESCRIPCIÓN DE LA INVENCIÓN · Un objetivo de la presente invención es proveer un método mejorado para codificar señales de audio en un codificador para reducir efectos audibles molestos al conmutar entre los modos que tienen diferentes anchos de banda. La invención se basa en la idea de que cuando el cambio ocurre de modo de banda estrecha (modo AMR-WB) a modo de banda ancha (AR-WB+) la extensión de banda alta no es encendida inmediatamente sino la amplitud -es solamente incrementada de manera gradual- al volumen final para evitar un cambio demasiado rápido. De manera similar, al conmutar de modo de banda ancha a modo de banda estrecha, la contribución de extensión de banda alta no es apagada inmediatamente sino es reducida de manera gradual para evitar efectos molestos. De acuerdo -con la invención, tal introducción gradual de la señal de -extensión de banda alta se realiza a nivel de parámetro al multiplicar las ganancias de excitación usadas para la síntesis de banda alta con un factor de escala que es incrementado en pequeños pasos de cero a uno dentro de la ventana de tiempo seleccionado. En, por ejemplo, el códec AMR-WB+ se puede esperar que una duración de v-entana de 320 ms (4 tramas AMR-WB+ de 80 ms) provea un período de inicialización lo suficientemente lento de la contribución de audio de banda alta. De la misma manera que en el periodo de inicialización de la contribución de audio de banda alta, también la terminación gradual de la señal de banda alta se puede realizar a nivel de parámetro, en este caso al multiplicar las ganancias de excitación usadas para síntesis de banda alta con un factor de escala que es reducido en pequeños pasos de uno a cero durante el período de tiempo seleccionado. Sin embargo, en este caso no se tienen parámetros actualizados para -la extensión de banda alta disponible una vez que la conmutación real a un modo de sólo banda central ha ocurrido. No obstante, la síntesis de banda alta se puede realizar al usar los parámetros de extensión de banda alta recibidos para la última trama antes de conmutar al modo de sólo núcleo y la señal de excitación derivada de las tramas recibidas en el modo de sólo núcleo. Una versión ligeramente modificada de este método sería modificar los parámetros LPC usados para la síntesis de banda alta después de la conmutación en un modo tal que la respuesta de frecuencia del filtro LPC sea forzada de manera gradual hacia un espectro más plano. Esto se puede realizar, por ejemplo, al calcular una media ponderada del filtro LPC realmente recibido y un filtro LPC que provee un espectro plano en el dominio ISP. Este enfoque pudiera proveer una calidad de audio mejorada en casos donde resultó que la última trama con parámetros de extensión de banda alta incluyó picos espectrales claros . El método de acuerdo con la presente invención provee un efecto similar que el escalamiento directo en el dominio del tiempo, pero realizar el escalamiento a nivel de parámetro es desde el punto de vista computacional una solución más eficiente. El codificador de acuerdo con la presente invención se caracteriza principalmente porque el codificador comprende además un escalador para controlar el segundo bloque dé codificación para cambiar de manera gradual las propiedades de codificación del bloque de codificación en relación con un cambio en el modo de operación del codificador. El dispositivo de acuerdo con la presente invención se caracteriza principalmente porque el codificador comprende además un escalador para controlar el segundo bloque de codificación para cambiar de manera gradual las propiedades de codificación del bloque de codificación en relación con un cambio en el modo de operación del codificador. El sistema de acuerdo con la presente invención se caracteriza principalmente porque el sistema comprende además un escalador para controlar el segundo bloque de -codificación para cambiar de manera gradual las propiedades de codificación del segundo bloque de codificación en relación con un cambio en el modo de operación del codificador.
El método de acuerdo con la presente invención se caracteriza principalmente porque las propiedades de codificación del segundo bloque de codificación son cambiadas de manera gradual en relación con un cambio en el modo de operación. El módulo de acuerdo con la presente invención se caracteriza principalmente porque el módulo comprende además un escalador para controlar el segundo bloque -de codificación para cambiar de manera gradual las propiedades de codificación del segundo bloque de codificación en relación con un cambio en el modo de operación del módulo. El producto de programa de computadora de acuerdo con la presente invención se caracteriza principalmente porque el producto de programa de computadora comprende además pasos ejecutables por máquina para cambiar de manera gradual las propiedades de codificación del segundo bloque de codificación en relación con un cambio en el modo de operación. La señal de acuerdo con la presente invención se caracteriza principalmente porque en un cambio de modo entre el primer modo y el segundo modo al menos uno de los parámetros de la señal referente a la banda -de frecuencia superior es cambiado de manera gradual . En comparación con el enfoque de la técnica anterior antes presentado, la invención provee una solución para reducir los posibles efectos audibles debido a la conmutación entre diferentes modos de ancho de banda. Por ende, la calidad de la señal de audio se puede mejorar. La presente invención provee una funcionalidad similar al escalamiento directo en el dominio de del tiempo, pero realizar el escalamiento a nivel de parámetro es desde el punto de vista computacional una solución más eficiente. BREVE DESCRIPCIÓN DE LAS FIGURAS La figura 1 presenta un diagrama simplificado acerca del concepto de codificación y decodificación de banda dividida de acuerdo con la presente invención con el uso de bancos de filtro de dos bandas y bloques de codificación y decodificación separados para cada banda de audio, la figura 2 presenta una modalidad de ejemplo de un dispositivo de codificación de acuerdo con la invención, la figura 3 presenta una modalidad de ejemplo de un dispositivo de decodificación de acuerdo con la invención, la figura 4a presenta el espectrograma de conmutación de bandas de banda estrecha a banda ancha en un codificador de la técnica anterior, la figura 4b presenta el espectrograma de conmutación de bandas de banda estrecha a banda ancha en un codificador de una modalidad de la presente invención, la figura 4c presenta la energía de la señal de banda alta codificada a lo largo del eje de tiempo, cuando la banda es conmutada -de banda estrecha a banda ancha en un codificador de la técnica anterior y en un codificador de una modalidad de la presente invención, la figura 5a presenta el espectrograma de conmutación de bandas de banda ancha a banda estrecha en un codificador de la técnica anterior, la figura 5b presenta el espectrograma de conmutación de bandas de banda ancha a banda estrecha en un codificador de una modalidad de la presente invención, la figura 5c presenta la energía de la señal de banda alta codificada a lo largo del eje de tiempo, cuando la banda es conmutada de banda ancha a banda estrecha en un codificador de la técnica anterior y en un codificador de una modalidad de la presente invención, y la figura 6 muestra un ejemplo de un sistema de acuerdo con la presente invención. DESCRIPCIÓN DETALLADA DE LA INVENCIÓN La figura 1 presenta el concepto de codificación y decodificación de banda dividida de acuerdo con una modalidad de. ejemplo de la presente invención con el uso de bancos de filtro de dos bandas y bloques de codificación y decodificación separados para cada banda de audio. Una señal de entrada de una fuente de señal 1.2 es -primero procesada a través de un filtro de análisis 1.3 en el cual la banda de audio es dividida en por lo menos dos bandas de audio, es decir, en una banda de audio de frecuencia inferior y una banda de audio de frecuencia superior, y submuestreada en forma crítica. La banda de audio de frecuencia inferior es luego codificada en un primer bloque de codificación 1.4.1 y la banda de audio de frecuencia superior es codificada en un segundo bloque de codificación 1.4.2, respectivamente. Las bandas de audio son codificadas sustancialmente de manera independiente una de la otra. El flujo de bits multiplexado es transmitido del dispositivo de transmisión 1 a través de un canal de comunicación 2 a un dispositivo receptor 3 en el cual las bandas baja y alta son decodificadas de manera independiente en un primer bloque de decodificación 3.3.1 y en1 un segundo bloque de decodificación 3.3.2, respectivamente/ Las señales decodificadas son sobremuestreacias a la frecuencia de muestreo original después de lo cual un banco de filtro de síntesis 3.4 combina las señales de audio decodificadas para formar la señal de audio sintetizada 3.5. En el caso de que AMR-WB+ opere en una señal de audio muestreada de 16 kHz, la banda de audio de 8 kHz se divide en bandas de 0-6.4 y 6.4-8 "kHz. Después del filtro úe análisis 1.3 se utiliza el submuestreo crítico. Esto es, la banda baja es submuestreada a 12.8 kHz (=2*(?-6.4)) y la banda alta es remuestreada a 3.2 kHz (=2* (8-6. ) ) . El primer bloque -de -codifi-cación 1.4.1 (codificador de banda baja) y el primer bloque de .decodificación 3.3.1 (decodificador de banda baja) pueden ser, por ejemplo, el codificador y decodificador estándar AMR-WB mientras que el segundo bloque de codificación 1.4.2 (-codificador de banda alta) y el segundo bloque de decodificación 3.3.2 (decodificador de banda alta) se pueden implementar como un algoritmo de codificación independiente, como un algoritmo de extensión de ancho de banda o como una combinación de los mismos . A continuación un dispositivo de codifi-cación 1 de acuerdo con una modalidad de ejemplo de la presente invención se describirá en más detalle con referencia a la figura 2. El dispositivo de codificación 1 comprende un bloque de entrada 1.2 para digitalizar, filtrar y entramar la señal de entrada cuando es necesario. La digitalizacion de la señal de entrada se realiza mediante un muestreador de entrada 1.2.1 a una frecuencia de muestreo de entrada. La frecuencia de muestreador de entrada es en una modalidad de ejemplo 16 kHz o 24 kHz pero es obvio que se pueden usar también otras frecuencias de muestreo. Cabe mencionar aquí que la señal de entrada puede estar ya en una forma adecuada para el proceso de codificación. Por ejemplo, la señal -de entrada puede haber sido digitalizada en una etapa anterior y almacenada a un medio de memoria ino se muestra) . Las tramas de la señal de entrada son introducidas al filtro de análisis 1.3. El filtro de análisis 1.3 comprende un banco *de filtro en el -cual la banda de audio es dividida en dos o más bandas -de audio. En esta modalidad el banco de filtro comprende u primer filtro 1.3.1 y un segundo filtro 1.3.2. El primer filtro 1.3.1 es, por ejemplo, un filtro paso bajo que tiene una frecuencia de corte en el límite superior de la banda de audio inferior. La frecuencia de corte es, por ejemplo, aproximadamente 6.4 kHz. El segundo filtro 1.3.2 es, por ejemplo, un filtro paso banda que tiene un ancho de banda de la frecuencia de corte del. primer filtro 1.3.1 hasta el límite superior de la banda de audio. El ancho de banda es, por ejemplo, 6.4 kHz - 8 kHz para una frecuencia de muestreo de 16 kHz y € .4 kHz - 12 kHz para una frecuencia de muestreo de 24 kHz. También es posible que el segundo filtro 1.3.2 sea un filtro paso alto, si la banda de frecuencias de la señal de audio en la entrada del codificador 1.4 es sobrelimitada a menos de o igual a la mitad de la frecuencia de muestreo, es decir, solamente las frecuencias por debajo del límite superior son pasadas al filtro de análisis 1.3. También es posible que la banda de audio se divida en más de dos bandas de audio en donde el filtro de análisis puede comprender un filtro para cada banda de audio. Sin embargo, en lo siguiente se supone que se usan solamente dos bandas de audio. Las salidas del banco de filtro son submuestreadas de manera crítica para reducir la velocidad -de bits necesaria para transmisión de la señal de audio. La salida del primer filtro 1.3.1 es submuestreada en un primer muestreador 1.3.3 y la salida del segundo filtro 1.3.2 es submuestreada en un segundo muestreador 1.3.4. La frecuencia de muestreo del primer muestreador 1.3.3 es, por ejemplo, la mitad del anchó de banda del primer filtro 1.3.1. La frecuencia de muestreo del segundo muestreador 1.3.4 es, por ejemplo, la mitad del ancho de banda del segundo filtro 1.3.2, respectivamente. En esta modalidad de ejemplo la frecuencia de muestreo del primer muestreador 1.3.3 es 12.8 kHz y la frecuencia de muestreo del segundo muestreador 1.3.4 es 6.4 kHz para una frecuencia de muestreo de 16 kHz de la señal de audio de entrada y 11.2 kHz para una frecuencia de muestreo de 24 kHz de la señal de audio de entrada. Las muestras del primer muestreador 1.3.3 son introducidas al primer bloque de codificación 1.4.1 para codificación. Las muestras del segundo muestreador 1.3.4 son introducidas al segundo bloque de codificación 1.4.2 para codificación, respectivamente. El primer bloque de codificación 1.4.1 analiza las muestras para determinar qué método de excitación es el más apropiado para codificar la señal de entrada. Puede haber dos o más métodos de excitación de los cuales seleccionar. Por ejemplo, un primer método de excitación se selecciona para señales no -de voz (o distintas de la voz) (por ejemplo, música) un segundo método de excitación se selecciona para señales de voz (o similares a la voz) . El primer método de excitación produce, por ejemplo, una señal de excitación TCX y el segundo método de excitación produce, por ejemplo, una señal de excitación ACELP. Después de seleccionar el método de excitación se lleva a cabo un análisis LPC en el primer bloque de codificación 1.4.1 en las muestras sobre una base de trama por trama para encontrar la serie de parámetros que corresponda mejor con la señal de entrada. Existen algunos métodos alternativos para hacer esto y son conocidos por el experto en la técnica en donde no es necesario describir los detalles del análisis LPC en esta solicitud. Información sobre el método de excitación seleccionado y parámetros LPC son transferidos al segundo bloque de codificación 1.4.2. En el segundo bloque de codificación 1.4.2 usa la misma excitación que se produjo en el primer bloque de codificación 1.4.1. En esta modalidad de ejemplo, la señal de excitación para el segundo bloque de codificación 1.4.2 es generada al sobremuestrear la excitación dé banda de audio de frecuencia inferior a la banda de audio de frecuencia superior. Esto es, la -excitación de banda baja se vuelve a usar en la banda alta al transponerla a la banda de audio de frecuencia superior. Los parámetros usados para describir la señal de audio de frecuencia superior en un codee AMR-WB+ son filtro -de síntesis LPC que define las características espectrales de la señal sintetizada, y una serie de parámetros de ganancia para la s-eñal de excitación que controlan la amplitud del audio sintetizado. Los parámetros LPC y parámetros de excitación generados por el primer bloque de codificación 1.4.1 y el segundo bloque de codificación 1.4.2 son, por ejemplo, cuantificados y sometidos a codificación de canal en un bloque de cuantificación y codificación de canal 1.5 y combinados (multiplexados) en un mismo flujo -de transmisión por un bloque generador de flujo 1.6 antes de transmisión, por ejemplo, a un canal de transmisión, tal como una red de comunicación 604 (figura 6) . No obstante, no es necesario transmitir los parámetros pero pueden, por ejemplo, ser almacenados en un medio de almacenamiento y en una etapa posterior recuperados para transmisión y/o decodificación. En lo siguiente, un método de acuerdo con una modalidad de ejemplo de la presente invención se describirá en más detalle cuando se lleva a cabo una conmutación entre un primer modo de codificación y un segundo modo de codificación. El primer modo de codificación es, por ejemplo, un modo de codificación de banda estrecha y el segundo modo de codificación es, por ejemplo, un modo de codificación de banda ancha. Se define un parámetro de tiempo T que indica el período de tiempo -que dura el cambio de modo. El parámetro de tiempo T se usa para cambiar el modo de -codificación de manera gradual. El valor para el parámetro de tiempo es, por ejemplo, 320 ms, que es igual a cuatro veces la duración de trama F (80 ms en el codificador AMR-WB+) . Es obvio que también se pueden usar otros valores para el parámetro de tiempo T. Un multiplicador M y un valor de paso S se definen también para ser usados por el segundo bloque de codificación durante el cambio de modo. El valor de paso se define de modo tal que indique el tamaño de los pasos que se usan en el cambio de modo. Por ejemplo, si el parámetro de tiempo T es igual a cuatro tramas (4*FL) , el valor de paso es igual a 0.25 (=1/4), es decir, el valor de paso se puede calcular al dividir la duración de la trama entre el parámetro de tiempo (=F/T) . Primero, se supone que el codificador 1 usa el primer modo de codificación y un cambio al segundo modo de codificación se va a realizar. La codificación de la señal de audio de frecuencia inferior se continúa en el primer bloque de codificación 1.4.1 como se describe anteriormente. Un indicador de modo (no se muestra) se ajusta a un estado que indica que el segundo modo de codificación es seleccionado. Además de eso, la información del modo de codificación y parámetros LPC y, si es necesario, otros parámetros del primer bloque de codificación 1.4.1 son transferidos al segundo bloque de codificación 1.4.2. En el segundo bloque de codificación 1.4.2 los parámetros LPC recibidos no son tomados en uso como tales pero se -realiza una modificación al menos a algunos de los parámetros. El multiplicador M se ajusta a cero. Después de eso una serie de parámetros de ganancia LPC es modificada al multiplicar la serie de parámetros de ganancia LPC por el multiplicador M. Los parámetros LPC modificados son usados por el segundo bloque de codificación 1.4.2 en el proceso de codificación de la trama actual (serie de muestras) . Luego, para la siguiente trama, el multiplicador M es agregado por el valor de paso S y la serie de parámetros de ganancia LPC es modificada como se mencionó anteriormente. El procedimiento anterior es repetido para cada trama consecutiva hasta que el multiplicador M alcanza el valor 1, a partir de lo cual el valor 1 se usa y el segundo modo de codificación (el modo de banda ancha) de operación del codificador 1 se continúa. A continuación, se supone que el codificador 1 usa el segundo modo de codificación y se va a realizar un cambio al primer modo de codificación. La codificación de la señal de audio de frecuencia inferior se continúa en el primer bloque de codificación 1.4.1 como se describe anteriormente. Un indicador de modo se ajusta a un estado que indi-ca que el primer modo de codificación es seleccionado. En esta etapa, la información del modo de codificación y parámetros LPC no son transferidos normalmente del primer bloque de codifi-cación 1.4.1 al segundo bloque de codificación 1.4.2. Por lo tanto, para que el cambio gradual en el modo de codificación opere, son necesarias algunas disposiciones . En una primera alternativa el segundo bloque de codificación 1.4.2 ha almacenado los parámetros LPC usados al codificar la última trama antes del cambio de modo. Luego, el multiplicador M se ajusta a uno y la serie de parámetros de ganancia LPC se multiplica por el multiplicador M y la serie modificada de parámetros de ganancia LPC se usa al codificar la primera trama después del cambio de modo. Para la siguiente trama el valor del multiplicador M es reducido por el. valor de paso S, la serie de parámetros LPC es multiplicada por el multiplicador M y la codificación se realiza para esa trama. Los pasos anteriores (cambiar el valor del multiplicador, modificar la serie de parámetros LPC y realizar la codifi-cación para la trama) son repetidos hasta que el multiplicador alcance el valor cero. Después de eso solamente el primer bloque de codificación 1.4.1 continúa el proceso de codificación. Como un ejemplo, el vector usado para aumento y reducción puede ser como sigue. El vector contiene €4 elementos lo que significa que un elemento se usa para una subtrama de 5 ms . Esto significa que el aumento/reducción se hace durante 320 ms.
ga in_hf _ram { 6 ] = {0.01538461536462, 0.03076923076923, 0.0461538461536S, 0.06153646153846, 0.07692307-6923O8 0.09230769230769, 0.10769230769231 0.12307692307692, 0.13846153846154 0.15384615384615, 0.1 923076923077 0.18461538461538, 0.20000000000000 0.21538461538462, 0.23076923076923 0.24615384615385, 0.2615384615384* 0.276923O7692308, 0.29230769230769 0.30769230769231, 0.32307692307692 0.33846153846154, 0.3538461538461S 0.36923O76923 77, 0.38461538461538 0.40000000000000, 0.415384 15384-62 O.43O76923076923, 0.44615384615385 0.46153S46153846, 0.47692307692308 0.^9230769230769, 0.50769230769231 0.52307692307-692, 0.53846153846154 0.55384615384615, 0. -56923-076 23O77 0.58461538461538, 0. 0000000000000 0.61538461538462, 0.63 76923 76923 0.-64615384615385, 0. -66153846153846 O.676923O7692308, 0.6923 769230769 45.70769230769231, 0.723O7-6923O7-692 0.73846153846154, 0.75384615384615 0.7*92307-6923077, 0.784*61538461538 .80000000000000 , 0.81 384 1538462 0.83076923076923, 0.846153 -615385 -0.86153846 G53846, 0. «7692307692308 0.89230769230769, 0. -907* 9230769231 «.923076923 7-692, 0.9384615384615^ <3.9S38461S3-8 «15, 0.969.2307-6923077 0.98461 38461538}
Al aumentar la banda de frecuencia superior en el segundo bloque de codificación 1.4.2, la ganancia -de excitación del segundo bloque de codificación 1.4.2 es multiplicada por uno de los valores donde el índice apunta en el vector de escalamiento. El valor de índice es el número de subtramas codificadas de 5 ms. Por lo tanto, después de la conmutación -de modo, -en la primera subtrama <5 ms) la ganancia de excitación del segundo bloque de codificación 1.4.2 es multiplicada por el primer elemento del vector de escalamiento. En la segunda subtrama (5 ms) , la ganancia de excitación del segundo bloque de codificación 1.4.2 es multiplicada por el segundo elemento del vector de escalamiento, etc. Al reducir la banda de frecuencia superior en el segundo bloque de codificación 1.4.2, la ganancia de excitación del segundo bloque de codificación 1.4.2 es multiplicada también por uno de los valores donde el índice apunta en el vector de escalamiento. El valor de índice es el número de subtramas codificadas de 5 ms, pero el apuntador de índice es invertido. Por ende, después de la conmutación de modo, en la primera subtrama (5 ms) la ganancia de- excitación del segundo bloque de codificación 1.4.2 es multiplicada por el último elemento del vector de escalamiento. En la segunda subtrama (5 ms) , la ganancia de excitación del segundo bloque de codificación 1.4.2 es multiplicada por el segundo último elemento del vector de escalamiento, etc. Al reducir la banda de frecuencia superior (por ejemplo, conmutar el modo de AMR-WB+ a AMR-WB) , los últimos parámetros de voz codificados (parámetros LPC, excitación y ganancia de excitación) del segundo -bloque de codificación 1.4.2 son usados para generar la banda de frecuencia superior durante los primeros 320 ms cuando se usa el modo -de operación sin el segundo bloque de codificación 1.4.2. Un seudocódigo de ejemplo puede ser como sigue: ExcGain2 = ExcGain2* gain_hf_ramp (ind) Exc__hf (l:n) = ExcGain2* Exc_lf(l:n) Output_hf = synth (LPC_hf, exc_hf, mem) , donde ExcGain2 = Ganancia_de_excitación_en_el_segundo_bloque_ de_codificación gain_hf_ra = El vector de escalamiento mp Exc_lf = Vector de excitación del primer bloque de codificación (ancho de banda 0-6,4 kHz) Exc_hf = Vector de excitación del segundo bloque de codificación <ancho de banda 6,4-8,0 kHz) Output_hf = La señal sintetizada para banda de frecuencia superior Synth = La función que forma la señal sintetizada
LPC = Coeficientes -de filtro LP Mem = la memoria del filtro LP
Una versión ligeramente modificada de este método sería modificar los parámetros LPC usados para la síntesis de banda de audio de frecuencia alta después de la conmutación -en una manera tal que la respuesta de frecuencia del filtro LPC sea forzada en forma gradual hacia un espectro más plano. Esto se puede realizar, por ejemplo, al calcular una media ponderada del filtro LPC recibido realmente y un filtro LPC que provee un espectro plano en el dominio ISP. Este enfoque pudiera proveer una calidad de audio mejorada en casos donde resultó que la última trama con parámetros de extensión de ancho de banda más ancho incluyó picos espectrales claros . El aumento/reducción se puede hacer también de manera adaptativa con base en características de señal de audio basadas en, por ejemplo, parámetros LPC u otros parámetros. En lugar de vector de escalamiento lineal, el vector de escalamiento puede ser también no lineal . El vector de escalamiento puede ser también diferente para aumento y reducción. En lo siguiente, el dispositivo de decod ficación 3 de acuerdo con la presente invención se describirá en más detalle con referencia a la figura 3. La señal de audio codificada es recibida del canal de transmisión 2. El demultiplexor 3.1 demultiplexa la información de parámetro que pertenece a la banda de audio de frecuencia inferior en un primer flujo de bits y la información de parámetro que pertenece a la banda de audio de frecuencia superior en un segundo flujo de bits. Los flujos de bits son luego sometiólos a decodificación de canal y son descuantificados en el bloque de decodificación -de canal y descuantificación 3.2, cuando es necesario.
El primer flujo de bits sometido a decodificación de canal contiene los parámetros LPC y parámetros de excitación generados por el primer bloque de codificación 1.4.1 y, cuando se usó el modo de banda ancha, el segundo flujo de bits sometido a decodificación de canal contiene la serie de parámetros de ganancia LPC y otros parámetros LPC (parámetros que describen las propiedades del filtro LPC) generados por el segundo bloque de codificación 1.4.2. El primer flujo de bits es introducido al primer bloque de decodificación 3.3 el cual realiza el filtrado LPC (filtrado de síntesis LPC de banda baja) de acuerdo con los parámetros de ganancia LPC y otros parámetros recibidos para formar la señal de banda de audio de frecuencia inferior sintetizada. Después del filtro 3.3.1 hay un primer sobremuestreador 3.3.2 para muestrear la señal decodificada y filtrada a la frecuencia de muestreo original . El segundo flujo de bits, cuando está presente en el flujo de bits, es introducido al segundo bloque -de decodificación 3.4 el cual realiza el filtrado LPC (filtrado de síntesis LPC de banda alta) de acuerdo con los parámetros de ganancia LPC y otros parámetros recibidos para formar la señal de banda de audio de frecuencia superior sintetizada.. Los parámetros de excitación del primer flujo de bits son multiplicados con la serie de parámetros de ganancia LPC en el multiplicador 3.4.1. Los parámetros de excitación multiplicados son introducidos al filtro 3.4.2 en el cual otros parámetros LPC del segundo flujo de bits son también introducidos. El filtro 3.4.2 reconstruye la señal de banda de audio de frecuencia superior sobre la base de los parámetros introducidos al filtro 3.4.2. Después del filtro 3.4.2 hay un segundo sobremuestreador 3.4.4 para muestrear la señal decodificada y filtrada a la frecuencia de muestreo original. La salida del primer sobremuestreador 3.3.2 está conectada a un primer filtro 3.5.1 del banco de filtro de síntesis 3.5. Respectivamente, la salida del segundo sobremuestreador 3.4.3 está conectada a un segundo filtro 3.5.2 del banco de filtro de síntesis 3.5. Las salidas del primer filtro 3.5.1 y el segundo filtro 3.5.2 están conectadas como la salida del banco de filtro de síntesis 3.5, en donde la señal de salida es la señal de audio reconstruida, de banda ancha o de banda estrecha dependiendo del modo usado al codificar la señal de audio. Resulta obvio que la señal de audio codificada no es necesariamente recibida del canal de comunicación 2 como -en la figura 1, sino también puede ser un flujo de bits codificado el cual es almacenado previamente en un medio de almacenamiento. Como se describió anteriormente la presente invención provee un método para apagar la contribución de extensión de banda alta de manera gradual al cambiar de un modo de codificación que usa codificación de extensión de banda alta a un modo que usa solamente codificación de banda central . Cambiar la amplitud de la contribución de banda alta paso a paso de volumen completo a cero durante un período d tiempo relativamente corto, por ejemplo, unos pocos de cientos de milisegundos hará el cambio en el ancho de banda de audi más fluido y menos obvio para el usuario, y proveerá una calidad de audio mejorada. De la misma manera cuando el cambio ocurre de un modo de sólo banda central a un modo que emplea la codificación de extensión de banda alta, la contribución de banda alta no es introducida inmediatamente con volumen completo sino su amplitud es escalada de cero a volumen completo en pocos pasos durante una ventana de tiempo relativamente corta para introducir una conmutación uniforme con una calidad de audio mejorada. Aunque la invención se usa principalmente para audio muestreado de 16 kHz, se usó una señal de audio muestreada de 24 kHz para los ejemplos de conmutación en las figuras 4a-5c. Por lo tanto, AMR-WB+ opera a una señal de audio muestreada de 24 kHz. La banda de audio de 12 kHz se divide en bandas de 0-6.4 y 6.4-12 kHz. El submuestreo crítico se utiliza después del banco de filtro. Esto es, la banda baja es submuestreada a 12.8 kHz y la banda alta es remuestreada a 11.2 kHz (=2* (12-€.4) ) . La figura 4a demuestra el caso donde se realiza la conmutación de banda estrecha a banda ancha de la técnica anterior y la figura 4b demuestra el caso donde se realiza la conmutación de acuerdo con la presente invención, respectivamente. La figura 4c presenta la energía total de la señal de banda alta codificada en los casos de la técnica anterior y la conmutación de acuerdo con la presente invención. La figura 5a demuestra el caso donde se realiza la conmutación de banda ancha a banda estrecha de la técnica anterior y la figura 5b demuestra el caso donde se realiza la conmutación de acuerdo con la presente invención, respectivamente. La figura 5c presenta la energía total -de la señal de banda alta codificada en los casos de la técnica anterior y la conmutación de acuerdo con la presente invención. La figura 6 ilustra un ejemplo de un sistema de acuerdo con la invención en el cual se puede aplicar el proceso de codificación y decodificación de banda dividida. El sistema comprende una o más fuentes de audio 601 que producen señales de audio similares a la voz y/o distintas de la voz. Las señales de audio son convertidas en señal-es digitales por un convertidor A/D 602 cuando ¿es necesario. Las señales digitalizadas son introducidas a un codificador 603 de un dispositivo de transmisión 600 en el cual la codificación se lleva a cabo de acuerdo con la presente invención. Las señales codificadas son también cuantificadas y codificadas para transmisión en el codificador 603 cuando es necesario. Un transmisor 604 , por ejemplo, un transmisor de un dispositivo de comunicaciones móviles 600 , transmite las señales comprimidas y codificadas a una red de comunicación 605 . Las señales son recibidas de la red de comunicación 605 por un receptor 607 de un dispositivo receptor 606 . Las señales recibidas son transferidas del receptor 607 a un decodificador 608 para decodificación, descuantificación y descompresión. El decodificador 608 realiza la descompresión de los flujos de bits recibidos para formar señales de audio sintetizadas. Las señales de audio sintetizadas pueden entonces ser transformadas en audio, por ejemplo, en un altavoz 609 . La presente invención puede ser implementada en diferentes tipos de sistemas, en especial en transmisión de baja velocidad para obtener una compresión más eficiente que en los sistemas de la técnica anterior. El codificador 1 dé acuerdo con la presente invención puede ser implementado en diferentes partes de sistemas de comunicación. -Por ejemplo, el codificador 1 puede ser implementado en un dispositivo de comunicaciones móviles que puede tener capacidades de procesamiento de señales limitadas . La invención puede ser impl-ementada al menos en parte como un producto de programa de computadora que comprende pasos ejecutables por máquina para realizar al menos algunas partes del método de la invención. El dispositivo de codificación 1 y el dispositivo de decodificación 3 comprenden un bloque de control, por ejemplo, un procesador de señales digitales y/o un microprocesador, en los cuales se puede utilizar el programa de computadora. Resulta obvio que la presente invención no está limitada únicamente a las modalidades antes descritas sino que se puede modificar dentro del alcance de las reivindicaciones adjuntas . Se hace constar que con relación a esta fecha, el mejor método conocido por la solicitante para llevar a la práctica la citada invención, es el que resulta claro de la presente descripción de la invención.