ES2825032T3

ES2825032T3 - Cancelación de solapamiento de dominio de tiempo directo con aplicación en dominio de señal original o ponderado

Info

Publication number: ES2825032T3
Application number: ES18160922T
Authority: ES
Inventors: Bruno Bessette
Original assignee: VoiceAge Corp
Current assignee: VoiceAge Corp
Priority date: 2009-06-23
Filing date: 2010-06-23
Publication date: 2021-05-14
Anticipated expiration: 2030-06-23
Also published as: EP3352168A1; PL3352168T3; RU2012102049A; CA2763793A1; WO2010148516A1; US20110153333A1; CA2763793C; EP2446539A1; RU2557455C2; ES2673637T3; EP2446539A4; HK1258874A1; EP3764356A1; JP5699141B2; EP3352168B1; EP2446539B1; JP2012530946A; US8725503B2

Abstract

Un método para cancelar el solapamiento directo en el dominio del tiempo en una señal codificada recibida en un flujo de bits en un decodificador, que comprende: recibir en el flujo de bits en el decodificador, desde un codificador, información adicional relacionada con la corrección del solapamiento en el dominio del tiempo en la señal codificada, siendo la información adicional representativa de una cancelación de solapamiento directo, FAC, señal de corrección; y en el decodificador, cancelar el solapamiento en el dominio del tiempo en la señal codificada en respuesta a la información adicional; caracterizado porque cancelar el solapamiento en el dominio del tiempo comprende un recálculo de corrección FAC que incluye (a) decodificar la señal de corrección FAC recibida en el flujo de bits y (b) agregar a la señal de corrección FAC decodificada (i) una señal de síntesis de una Predicción Lineal Excitado de Código Algebraico, ACELP, trama en una primera mitad de una ventana FAC aplicada a la señal de síntesis al final de la trama ACELP y (ii) una respuesta de entrada cero de un filtro de síntesis en una segunda mitad de la ventana FAC aplicada a la respuesta de entrada cero al comienzo de una eXcitación Codificada por Transformada, TCX, trama que sigue a la trama ACELP, cuando la corrección FAC es para una transición de la trama ACELP a la trama TCX.

Description

DESCRIPCIÓN

Cancelación de solapamiento de dominio de tiempo directo con aplicación en dominio de señal original o ponderado

Campo técnico

La presente invención se refiere al campo de la codificación y decodificación de señales de audio. Más específicamente, la presente invención se refiere a un dispositivo y método para la cancelación de solapamiento de dominio de tiempo utilizando la transmisión de información adicional.

Antecedentes

La codificación de audio de la técnica anterior utiliza la descomposición de tiempo-frecuencia para representar la señal de una manera significativa para la reducción de datos. Específicamente, los codificadores de audio utilizan transformadas para realizar un mapeo de las muestras en el tiempo de dominio en coeficientes en el dominio de frecuencia. Las transformadas de tiempo discreto que se utilizan para este mapeo de tiempo a frecuencia se basan típicamente en núcleos de funciones sinusoidales, como la Transformada de Fourier Discreta (DFT) y la Transformada de coseno discreta (DCT). Se puede demostrar que dichas transformadas logran una “compactación de energía” de la señal de audio. Esto significa que, en el dominio de transformada (o frecuencia), la distribución de energía se localiza en menos coeficientes significativos que en las muestras del dominio del tiempo. Las ganancias de codificación se pueden lograr aplicando una asignación de bits adaptativa y una cuantificación adecuada a los coeficientes de dominio de frecuencia. En el receptor, los bits que representan los parámetros cuantificados y codificados (por ejemplo, los coeficientes en el dominio de la frecuencia) se utilizan para recuperar los coeficientes en el dominio de la frecuencia cuantificados (u otros datos cuantificados como las ganancias), y la transformada inversa genera señal de audio de dominio en el tiempo. Estos esquemas de codificación se denominan en general codificación por transformada.

Por definición, la codificación de transformada opera en bloques consecutivos de muestras de la señal de audio de entrada. Dado que la cuantificación introduce algo de distorsión en cada bloque sintetizado de señal de audio, el uso de bloques que no se superponen puede introducir discontinuidades en los límites del bloque, lo que puede degradar la calidad de la señal de audio. Por tanto, en la codificación de transformada, para evitar discontinuidades, los bloques codificados de señal de audio se superponen antes de aplicar la transformada discreta y se colocan en ventanas de manera apropiada en el segmento superpuesto para permitir una transición suave de un bloque decodificado al siguiente. Usar una transformada “estándar” como la DFT (o su equivalente rápido, la FFT) o la DCT y aplicarla a bloques superpuestos desafortunadamente da como resultado lo que se llama “muestreo no crítico”. Por ejemplo, tomando una condición típica de superposición del 50 %, codificar un bloque de N muestras consecutivas en el dominio del tiempo en realidad requiere tomar una transformada en 2N muestras consecutivas (N muestras del bloque actual y N muestras de la parte superpuesta del siguiente bloque). Por tanto, para cada bloque de N muestras en el dominio del tiempo, se codifican 2N coeficientes del dominio de la frecuencia. El muestreo crítico en el dominio de la frecuencia implica que N muestras de entrada en el dominio del tiempo producen sólo N coeficientes en el dominio de la frecuencia para ser cuantificados y codificados.

Se han diseñado transformadas especializadas para permitir el uso de ventanas superpuestas y todavía mantener el muestreo crítico en el dominio de la transformada - 2N muestras de dominio de tiempo a la entrada del resultado de la transformada en N coeficientes de dominio de frecuencia en la salida de la transformada. Para lograr esto, el bloque de 2N muestras en el dominio del tiempo se reduce primero a un bloque de N muestras en el dominio del tiempo mediante una inversión de tiempo especial y la suma de partes específicas de la señal mostrada en ventana larga de 2N muestras. Esta suma e inversión de tiempo especial introduce lo que se denomina “solapamiento en el dominio del tiempo” o TDA. Una vez que este solapamiento se introduce en el bloque de señal, no se puede eliminar utilizando solo ese bloque. Es esta señal con solapamiento en el dominio del tiempo la entrada de una transformada de tamaño N (y no 2N), que produce los N coeficientes en el dominio de la frecuencia de la transformada. Para recuperar N muestras en el dominio del tiempo, la transformada inversa en realidad tiene que usar los coeficientes de transformada de dos tramas consecutivas y superpuestas para cancelar el TDA, en un proceso llamado cancelación de solapamiento en el dominio del tiempo, o TDAC.

Un ejemplo de dicha una aplicación de transformada TDAC, que se utiliza ampliamente en la codificación de audio, es la transformada de coseno discreta modificada (o MDCT). En realidad, la MDCT realiza el TDA mencionado anteriormente sin plegamiento explícito en el dominio del tiempo. Más bien, el solapamiento en el dominio del tiempo se introduce cuando se considera la MDCT directa e inversa (IMDCT) de un solo bloque. Esto proviene de la construcción matemática de la MDCT y es bien conocido por los expertos en la técnica. Pero también se sabe que este solapamiento en el dominio del tiempo implícito puede verse como equivalente a invertir primero partes de las muestras en el dominio del tiempo y sumar (o restar) estas partes invertidas a otras partes de la señal. Esto se conoce como “plegado”.

Un problema surge cuando un codificador de audio conmuta entre dos modelos de codificación, uno utilizando TDAC y la otra no. Supongamos, por ejemplo, que un códec cambia de un modelo de codificación TDAC a un modelo de codificación no TDAC. El lado del bloque de muestras codificado que utiliza el modelo de codificación TDAC, y que es común al bloque codificado sin usar TDAC, contiene solapamiento que no se puede cancelar usando el bloque de muestras codificado usando el modelo de codificación no TDAC.

Una primera solución es descartar las muestras que contienen solapamiento que no puede ser anulado.

Esta solución da como resultado un uso ineficiente del ancho de banda de transmisión debido a que el bloque de muestras para las que el TDA no se puede cancelar se codifica dos veces, una vez por el códec basado en TDAC y una segunda vez por el códec no basado en TDAC.

Una segunda solución es el uso de ventanas especialmente diseñado que no introducen TDA en al menos una parte de la ventana cuando se aplica el proceso de inversión de tiempo y suma. La figura 1 es un diagrama de una ventana ejemplar que presenta TDA en su lado izquierdo, pero no en su lado derecho. Más específicamente, en la Figura 1, una ventana 100 de 2N muestras introduce TDA 110 en su lado izquierdo. La ventana 100 de la Figura 1 es útil para las transiciones de un códec basado en TDAC a un códec no basado en TDAC. La primera mitad de esta ventana tiene una forma que introduce TDA 110, que se puede cancelar si la ventana anterior también usa TDA con superposición. Sin embargo, el lado derecho de la ventana de la Figura 1 tiene una muestra 120 de valor cero después del punto de plegado en la posición 3N/2. Por lo tanto, esta parte de la ventana 100 no introduce ningún TDA cuando el proceso de inversión y suma (o plegado) del tiempo se realiza alrededor del punto de plegado en la posición 3N/2. Además, el lado izquierdo de la ventana 100 contiene una región 130 plana precedida por una región 140 ahusada. El propósito de la región 140 ahusada es proporcionar una buena resolución espectral cuando la transformada se calcula y para suavizar la transición durante las operaciones de solapamiento y adición entre bloques adyacentes. El aumento de la duración de la región 130 plana de la ventana reduce el ancho de banda de información y disminuye el rendimiento espectral de la ventana porque una parte de la ventana se envía sin ninguna información.

En el modo múltiple Grupo de Expertos de Imágenes en Movimiento (MPEG) y Códec de Habla y Audio Unificado (USAC), varias ventanas especiales, tales como el descrito en la Figura 1 se utilizan para gestionar las diferentes transiciones desde tramas que utilizan ventanas no superpuestas rectangulares, hasta tramas que utilizan ventanas superpuestas no rectangulares. Estas ventanas especiales fueron diseñadas para lograr diferentes compromisos entre la resolución espectral, la reducción de la sobrecarga de datos y la suavidad de la transición entre estos diferentes tipos de tramas. Se puede encontrar información adicional sobre los tipos de ventanas que se utilizan en la USAC en “Universal Speech/Audio Coding Using Hybrid ACELP/TCX Techniques”, por BESSETTE B ET AL, 2005 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING-18-23 marzo 2005 -Filadelfia, PA, EE.UU. IEEE, PISCATAWAY, NJ, vol. 3, 18 marzo 2005 (2005-03-18), páginas 301-304.

Resumen

Por lo tanto, subsiste la necesidad de una técnica de cancelación de solapamiento para soportar la conmutación entre los modos de codificación, en el que la técnica compensa para los efectos de solapamiento en un punto de conmutación entre estos modos.

Por lo tanto, de acuerdo con la presente invención, se proporciona un método para cancelación directa de solapamiento de dominio de tiempo en una señal codificada recibida en un flujo de bits en un decodificador de acuerdo con la reivindicación 1.

La presente invención se refiere además a un dispositivo para la cancelación de solapamiento en dominio de tiempo directo en una señal codificada recibida en un flujo de bits de acuerdo con la reivindicación 6.

Las anteriores y otras características se harán más evidentes tras la lectura de la siguiente descripción no restrictiva de realizaciones ilustrativas de la misma, dada a modo de ejemplo solamente con referencia a los dibujos adjuntos. Breve descripción de los dibujos

Las realizaciones de la invención se describirán a modo de ejemplo únicamente con referencia a los dibujos adjuntos, en los que:

La figura 1 es un diagrama de un ejemplo de ventana que introduce TDA en su lado izquierdo, pero no en su lado derecho;

La figura 2 es un diagrama de un ejemplo de transición de un bloque que usa una ventana rectangular no superpuesta a un bloque que usa una ventana superpuesta;

La figura 3 es un diagrama que muestra el plegado y el TDA aplicado al diagrama de la figura 2;

La figura 4 es un diagrama que muestra la corrección de solapamiento directo aplicada al diagrama de la figura 2; La figura 5 es un diagrama que muestra una corrección FAC no plegada (izquierda) y una corrección FAC plegada (derecha);

La figura 6 es una ilustración de una primera aplicación de un método de corrección de FAC que utiliza MDCT; La figura 7 es un diagrama de una corrección de FAC utilizando información del modo ACELP;

La figura 8 es un diagrama de una corrección de FAC aplicada durante la transición de un bloque que utiliza una ventana superpuesta a un bloque que utiliza una ventana rectangular no superpuesta;

La figura 9 es un diagrama de una corrección FAC no plegada (izquierda) y una corrección FAC plegada (derecha); La figura 10 es una ilustración de una segunda aplicación del método de corrección FAC que utiliza MDCT;

La figura 11 es un diagrama de bloques de cuantificación FAC que incluye corrección de errores TCX;

La figura 12 es un diagrama de varios casos de uso de la corrección FAC en un sistema de codificación multimodo; La figura 13 es un diagrama de otro caso de uso de la corrección FAC en un sistema de codificación multimodo; La figura 14 es un diagrama de un primer caso de uso de la corrección FAC al cambiar entre tramas cortas basadas en transformadas y tramas ACELP;

La figura 15 es un diagrama de un segundo caso de uso de la corrección FAC al conmutar entre tramas cortas basadas en transformadas y tramas ACELP;

La figura 16 es un diagrama de bloques de un dispositivo ejemplar para cancelación directa del solapamiento en el dominio del tiempo en una señal codificada recibida en un flujo de bits; y

La Figura 17 es un diagrama de bloques de un dispositivo ejemplar para la cancelación directa de solapamiento en el dominio del tiempo en una señal codificada para su transmisión a un decodificador.

Descripción detallada

La siguiente divulgación aborda el problema de la cancelación de los efectos de solapamiento de dominio de tiempo y de ventanas no rectangulares cuando una señal de audio se codifica utilizando las ventanas de superposición y no superposición en tramas contiguas. Utilizando la tecnología descrita en el presente documento, se puede evitar el uso de ventanas especiales no óptimas y, al mismo tiempo, permitir una gestión adecuada de las transiciones de la trama en un modelo que utilice tanto ventanas rectangulares que no se superponen como ventanas no rectangulares superpuestas.

Un ejemplo de una trama que utiliza presentación en ventanas rectangulares que no se solapan, es codificación predictiva lineal (LP) y, en particular codificación ACELP. Alternativamente, un ejemplo de presentación en ventanas no rectangulares superpuestas es la codificación Transform Coded eXcitation (TCX) aplicada en el Códec de Habla y Audio Unificado (USAC), donde las tramas TCX utilizan ventanas superpuestas y la Transformada de Coseno Discreta Modificada (MDCT), que introduce Solapamiento de Dominio de Tiempo (TDA). USAC también es un ejemplo típico en el que las tramas contiguas se pueden codificar utilizando ventanas rectangulares que no se superponen, como en las tramas ACELP, o ventanas superpuestas no rectangulares, como en las tramas TCX y en las tramas de codificación de audio avanzada (AAC). Sin pérdida de generalidad, la presente divulgación considera el ejemplo específico de USAC para ilustrar los beneficios del sistema y método propuestos.

Se abordan dos casos distintos. El primer caso ocurre cuando la transición es de una trama que usa una ventana rectangular que no se superpone a una trama que usa una ventana no rectangular que se superpone. El segundo caso ocurre cuando la transición es de una trama que usa una ventana superpuesta no rectangular a una trama que usa una ventana rectangular que no se superpone. Con el propósito de ilustrar y sin sugerir limitación, las tramas que usan una ventana rectangular que no se superpone pueden codificarse utilizando el modelo ACELP, y las tramas que usan una ventana no rectangular que se superponen pueden codificarse usando el modelo TCX. Además, se utilizan duraciones específicas para algunas tramas, por ejemplo, 20 milisegundos para una trama TCX, señaló TCX20. Sin embargo, debe tenerse en cuenta que estos ejemplos específicos se usan solo con fines ilustrativos, pero que se pueden contemplar otras longitudes de trama y tipos de codificación, distintos de ACELP y TCX.

El caso de una transición de una trama con una ventana rectangular que no se solapan, a una trama con una ventana no rectangular de superposición, será abordado con relación a la siguiente descripción tomada en conjunto con la Figura 2, que es un diagrama de un ejemplo de transición de un bloque que utiliza una ventana rectangular no superpuesta a un bloque que utiliza una ventana superpuesta.

Haciendo referencia a la Figura 2, una ventana rectangular que no se solapa ejemplar, comprende una trama de ACELP 202 y un ejemplo de una ventana 204 no-rectangular, de superposición comprende una trama 206 TCX20. TCX20 se refiere a las tramas de corto TCX en USAC, que nominalmente tienen 20 ms de duración, al igual que las tramas ACELP en muchas aplicaciones. La Figura 2 muestra qué muestras se utilizan en cada trama y cómo se abren en una ventana en un codificador. La misma ventana 204 se aplica en un decodificador, de manera que el efecto combinado que se ve en el decodificador es el cuadrado de la forma de la ventana que se muestra en la Figura 2. Por supuesto, esta doble ventana, una vez en el codificador y una segunda vez en el decodificador, es típico en la codificación de transformada. Cuando no se dibuja ninguna ventana, como en la trama 202 de ACELP, esto realmente significa que se utiliza una ventana rectangular para ese marco. La ventana 204 no rectangular para la trama 206 TCX20 que se muestra en la Figura 2 se elige de modo que, si las tramas anterior y siguiente también usan ventanas superpuestas y no rectangulares, entonces las porciones 204a y 204b superpuestas de las ventanas están, después de la segunda ventana en el decodificador, complementaria y permite recuperar la señal “sin ventana” en la región de superposición de las ventanas.

Para codificar la trama 206 TCX20 de la Figura 2 de una manera eficiente, el solapamiento de dominio del tiempo (TDA) se aplica típicamente a las muestras de ventana para esa trama 206 TCX20. Específicamente, las porciones 204a izquierda y 204d derecha de la ventana 204 están plegadas y combinadas. La figura 3 es un diagrama que muestra el plegado y el TDA aplicado al diagrama de la figura 2. La ventana 204 no rectangular introducida en la descripción de la figura 2 se muestra en cuatro cuartos. El 1° y 4° cuartos, 204a y 204d de la ventana 204 se muestran en la línea de puntos, ya que se combinan con el 2° y 3° cuartos 204b, 204c, que se muestran en línea continua. La combinación de la 1° y 4° cuartos 204a, 204d, a los 2° y 3° cuartos 204b, 204c, que se hace, en un proceso similar al utilizado en codificación MDCT, como sigue. El 1° cuarto 204a se invierte en el tiempo, a continuación, se alinea, muestra por muestra, al 2° cuarto 204b de la ventana, y finalmente el cuarto 204e de tiempo invertido y desplazado 1° se resta del 2° cuarto 204b de la ventana. Del mismo modo, el 4° cuarto 204d de la ventana tiene tiempo invertido y es desplazado (204f) para ser alineado con el 3° cuarto 204c de la ventana, y finalmente se añadió al 3° cuarto 204c de la ventana. Si la ventana 204 del TCX20 que se muestra en la Figura 2 tiene 2N muestras, entonces al final de este proceso obtenemos N muestras que se extienden exactamente desde el principio hasta el final de la trama 206 del TCX20 de la Figura 3. Entonces estas N muestras forman la entrada de una transformada apropiada para una codificación eficiente en el dominio de transformada. Utilizando el solapamiento específico en el tiempo de dominio descrito en la Figura 3, la MDCT puede ser la transformada utilizada para este propósito.

Después de la combinación de porciones de tiempo invertidas y desplazadas de la ventana descrito en la figura 3, ya no es posible recuperar las muestras de dominio de tiempo originales en la trama TCX20 porque se mezclan con versiones de tiempo invertido de muestras fuera de la trama TCX20. En un codificador de audio basado en MDCT como MPEG AAC, donde todas las tramas se codifican utilizando las mismas ventanas superpuestas y de transformada, este solapamiento de dominio del tiempo se puede cancelar y las muestras de audio se pueden recuperar al utilizar dos tramas superpuestas consecutivas. Sin embargo, cuando las tramas contiguas no utilizan el mismo proceso de ventana y superposición, como en la Figura 2, donde la trama TCX20 está precedida por una trama ACELP, el efecto de la ventana no rectangular y el solapamiento del dominio de tiempo no se puede eliminar utilizando solo la información de la trama ACELP anterior y trama TCX20 siguiente.

Las técnicas para gestionar este tipo de transición se presentaron anteriormente. La presente divulgación propone un enfoque alternativo para gestionar estas transiciones. Este enfoque no utiliza ventanas asimétricas y no óptimas en las tramas en los que se utiliza la codificación de dominio de transformada basada en MDCT. En cambio, los métodos y dispositivos introducidos en este documento permiten el uso de ventanas simétricas, centradas en el medio de la trama codificado, como por ejemplo la trama TCX20 de la Figura 3, y con una superposición del 50 % con tramas codificadas por MDCT que también utilizan ventanas no rectangulares. Los métodos y dispositivos aquí presentados proponen enviar desde el codificador hasta el decodificador, como información adicional en el flujo de bits, la corrección para cancelar el efecto de ventana y el solapamiento en el dominio del tiempo cuando se cambian las tramas codificadas con una ventana rectangular no superpuesta y tramas codificadas con una ventana superpuesta no rectangular y viceversa. Son posibles varios casos en estas transiciones.

En la Figura 2, se muestran ventanas rectangulares, que no se superponen para la trama de ACELP, y se muestra, la superposición no rectangular de ventanas para la trama TCX20. Utilizando el TDA introducido en la Figura 3, un decodificador que recibe al principio los bits de la trama ACELP tiene suficiente información para decodificar completamente esta trama ACELP hasta su última muestra. Pero luego, al recibir los bits de la trama TCX20, la decodificación adecuada de todas las muestras en la trama TCX20 se ve afectada por el efecto de solapamiento causado por la presencia de la trama ACELP anterior. Si una trama siguiente también usa una ventana superpuesta, entonces la ventana no rectangular y el TDA introducidos en el codificador se pueden cancelar en la segunda mitad de la trama TCX20 mostrada y estas muestras se pueden decodificar correctamente. Por lo tanto, es en la primera mitad de la trama TCX20, donde el cuarto 204e de tiempo invertido y desplazado 1° se resta de 204b en la Figura 3, que el efecto de la ventana no rectangular y el TDA introducido en el codificador no se puede cancelar, ya que la trama ACELP anterior usa una ventana que no se superpone. Por lo tanto, los métodos y dispositivos introducidos en este documento proponen transmitir la información, Cancelación de Solapamiento de dominio del tiempo Directo (FAC), para cancelar estos efectos y recuperar adecuadamente la primera mitad de la trama TCX20.

La Figura 4 es un diagrama que muestra la corrección de solapamiento directo (FAC) aplicada al diagrama de la Figura 2. La Figura 4 ilustra la situación en el decodificador, donde la ventana, por ejemplo, una ventana de coseno aplicada por MDCT, ya se ha aplicado una segunda vez después de la transformada inversa. Solo se considera la transición de ACELP a TCX20, independientemente de la trama que sigue al marco TCX20. Por lo tanto, en la Figura 4, las muestras donde se aplica la corrección FAC corresponden a la primera mitad de la trama TCX20. Esto es lo que se conoce como el área 402 FAC. Hay dos efectos que son compensados por el FAC en este ejemplo. El primer efecto es el efecto de ventanas, referido como x_w 404 en la Figura 4. Esto corresponde al producto de las muestras en la primera mitad de la trama 206 TCX20 por el 2° cuarto 204b de la ventana no rectangular en la Figura 3. Por lo tanto, la primera parte de la corrección FAC comprende agregar el complemento de estas muestras de ventana, que corresponde a la corrección para el segmento x_w 406 en la Figura 4. Por ejemplo, si una muestra de entrada dada x[n] se multiplica por la muestra de ventana w[n] en el codificador, entonces el complemento de esta muestra en ventana es simplemente ((1-w[n]) por x[n]). La suma de x_w 404 y la corrección de x_w 406 es 1 para todas las muestras de este segmento. La segunda parte de la corrección FAC corresponde al componente de solapamiento en el dominio del tiempo que se agregó en el codificador en la trama TCX20. Para eliminar este componente de solapamiento, denominado parte 408 de solapamiento x_a en la Figura 4, la corrección para x_a 406 en la Figura 4 se invierte en el tiempo, se alinea con la primera mitad de la trama TCX20 y se agrega a esta primera mitad del segmento, que se muestra como un x_a parte de solapamiento 408. La razón por la que se suma, y no se resta, es que en la Figura 3, la parte izquierda del plegado que conduce al solapamiento en el dominio del tiempo implicó restar este componente, por lo que para eliminarlo ahora se vuelve a agregar. La suma de estas dos partes, la compensación de ventana x_w 404 y la compensación x_a 408 de solapamiento, que forma la corrección FAC completa en el área 402 de FAC.

Hay varias opciones para la codificación de la corrección FAC. La figura 5 es un diagrama que muestra una corrección FAC desplegada (izquierda) y una corrección FAC plegada (derecha). Una opción puede ser codificar directamente la señal de ventana fAc , como se muestra en el lado izquierdo de la Figura 5. Esta señal, denominada ventana 502 FAC en la Figura 5, cubre el doble de la longitud del área FAC. En el decodificador, la señal de ventana FAC decodificada se puede plegar (invirtiendo en el tiempo la mitad izquierda y agregarla a la mitad derecha) y luego esta señal plegada se puede agregar, como una corrección 504, en el área 402 FAC, como se muestra. en el lado derecho de la Figura 5. En este enfoque, se codifican el doble de las muestras en el dominio del tiempo en comparación con la duración de la corrección.

Otro enfoque para la codificación de la señal de corrección FAC mostrado a la izquierda de la figura 5 es para llevar a cabo el plegado en el codificador antes de la codificación de esta señal. Esto da como resultado la señal plegada a la derecha de la Figura 5, donde la mitad izquierda de la señal con ventana FAC se invierte en el tiempo y se agrega a la mitad derecha de la señal con ventana FAC. Entonces, la codificación de transformada, usando por ejemplo DCT, se puede aplicar a esta señal plegada. En el decodificador, la señal de plegado decodificada se puede agregar simplemente en el área FAC, ya que el plegado ya se ha aplicado en el codificador. Este enfoque permite codificar el mismo número de muestras en el dominio del tiempo que la longitud del área FAC, lo que da como resultado una codificación de transformada muestreada críticamente.

Sin embargo, otro enfoque para codificar la señal de corrección FAC mostrado a la izquierda de la figura 5 es utilizar el plegado implícito de la MDCT. La figura 6 es una ilustración de una primera aplicación de un método de corrección FAC usando MDCT. En el cuadrante superior izquierdo, se muestra un contenido de la ventana 502 FAC, con una ligera modificación. Específicamente, el último cuarto de la ventana 502a FAC se desplaza a la izquierda de la ventana 502 FAC y se invierte en signo (502b). En otras palabras, la ventana FAC de la Figura 5 se gira cíclicamente hacia la derecha en % de su longitud total, y luego el signo del primer % se invierte de las muestras. A continuación, se aplica una MDCT a esta señal en ventana. La MDCT aplica, implícitamente por su construcción matemática, una operación de plegado, que da como resultado la señal 602 plegada que se muestra en el cuadrante superior derecho de la Figura 6. Este plegado en la MDCT aplica una inversión de signo en la parte 502b izquierda, pero no en la parte 502c derecha, donde se agrega el segmento doblado. Comparando la señal 602 plegada resultante con la corrección 504 FAC completa de la Figura 5, se puede ver que es equivalente a la corrección 504 FAC excepto por la inversión de tiempo. Por lo tanto, en el decodificador, después de MDCT inversa (IMDCT), esta señal 602, que es una señal de corrección de FAC invertida, se invierte en el tiempo (o se invierte) y se convierte en una señal 604 FAC de corrección como se muestra en el cuadrante inferior derecho de la Figura 6 Como anteriormente, esta corrección 604 FAC se puede agregar a la señal en el área FAC de la Figura 4.

En el caso específico de una transición de una trama de ACELP a una trama TCX, aún más la eficiencia se puede lograr mediante el aprovechamiento de la información ya disponible en el decodificador. La figura 7 es un diagrama de una corrección FAC usando información del modo ACELP. Una señal 702 de síntesis ACELP hasta el final de la trama 202 ACELP se conoce en el decodificador. Además, una respuesta 704 de entrada cero (ZIR) de un filtro de síntesis tiene una buena correlación con la señal al comienzo de la trama 206 TCX20. Esta particularidad ya se utiliza en el estándar 3GPP AMRWB para gestionar las transiciones de tramas ACELP a TCX. Aquí, esta información se utiliza para dos propósitos: 1) reducir la amplitud de la señal a codificar como la corrección FAC y 2) asegurar la continuidad en la señal de error a fin de mejorar la eficiencia de la codificación MDCT de esta señal de error. Observar en la Figura 7, una señal 706 de corrección a codificar para la transmisión de la corrección FAC se calcula como sigue. La primera mitad de esta señal 706 de corrección, que está hasta el final de la trama 202 ACELP, se toma como la diferencia 708 entre la señal 710 ponderada en el dominio original no codificado y la señal 702 de síntesis ponderada en la trama 202 ACELP. Dado que el módulo de codificación ACELP tiene un rendimiento suficiente, esta primera mitad de la señal 706 de corrección tiene energía y amplitud reducidas en comparación con la señal original. Luego, para una segunda mitad de dicha señal 706 de corrección, se toma la diferencia 708 entre la señal 712 ponderada en el dominio original no codificado al comienzo de la trama 206 TCX20 y la respuesta 704 de entrada cero del filtro de síntesis ponderado ACELP. Dado que la respuesta 704 de entrada cero está correlacionada con la señal 712 ponderada, al menos hasta cierto punto especialmente al comienzo de la trama TCX20, esta diferencia tiene menor amplitud y energía en comparación con la señal 712 ponderada al comienzo de la trama TCX20. Esta eficiencia de la respuesta 704 de entrada cero al modelar la señal original es típicamente mayor al comienzo de la trama. Añadiendo el efecto de la ventana 502 FAC, que tiene una amplitud decreciente para esta segunda mitad de la ventana FAC, la forma de la segunda mitad de la señal 706 de corrección en la Figura 7 debe tender hacia cero al principio y al final, posiblemente con más energía concentrada en el medio de la segunda mitad de la ventana 502 FAC, dependiendo de la precisión de ajuste del ZIR a la señal ponderada. Después de realizar estas operaciones de ventana y diferencia como se describe en relación con la Figura 7, la señal 706 de corrección resultante se puede codificar como se describe en las Figuras 5 o 6, o mediante cualquier método seleccionado para codificar la señal FAC. En el decodificador, la señal de corrección FAC real se vuelve a calcular decodificando primero la señal 706 de corrección transmitida descrita anteriormente, y luego volviendo a agregar la señal 702 de síntesis ACELP a la señal 706, en la primera mitad de la ventana 502 fAc y agregar el ZIR 704 a la misma señal 706, en la segunda mitad de la ventana 502 FAC.

Hasta este punto, la presente divulgación ha descrito transiciones desde una trama que utiliza una ventana rectangular que no se superpone, hasta una trama que utiliza una ventana mediante no rectangular, de superposición, que utiliza como ejemplo el caso de una transición desde una trama de ACELP hasta una trama TCX. Se entiende que puede surgir la situación opuesta, a saber, una transición de una trama TCX a una trama ACELP. La figura 8 es un diagrama de una corrección de FAC aplicada en la transición de una trama usando una ventana no rectangular superpuesta a una trama que usa una ventana rectangular no superpuesta. La figura 8 muestra una trama 802 TCX20 seguida de una trama 804 ACELP, con una ventana 806 TCX20 plegada, como se ve en el decodificador, en la trama TCX. La figura 8 también muestra un área 810 FAC donde se aplica una corrección FAC para cancelar el efecto de ventana y el solapamiento en el dominio del tiempo al final de la trama 802 TCX20. Cabe señalar que la trama 804 ACELP no lleva la información para cancelar estos efectos. Una ventana 812 FAC es simétrica de la ventana 502 FAC de la Figura 5.

El plegado de las dos partes 812 a la izquierda y 812 a la derecha de la ventana 812 FAC se muestra así en el caso de una transición de una trama TCX a una trama ACELP. En comparación con la Figura 5, las diferencias son las siguientes: la ventana 812 FAC ahora está invertida en el tiempo y el plegado de la parte de solapamiento aplica una operación de resta, en lugar de una suma, como se ilustra en la Figura 5, para ser coherente con el signo de plegado de la MDCT en esa parte de la ventana.

La Figura 9 es un diagrama de una corrección FAC desplegada (izquierda) y una corrección FAC plegada (derecha). La ventana 812 de FAC se reproduce en el lado izquierdo de la Figura 9. La señal 902 de corrección de FAC plegada puede codificarse usando un DCT o algún otro método aplicable. Suponiendo una ventana de Hanning en la transformada, como se usa por ejemplo en MDCT, las ecuaciones 904 y 906 de la Figura 9 describen la ventana 812 FAC en el caso de la Figura 9. Por supuesto, cuando se usan otras formas de ventana, otras ecuaciones coherentes con las formas de ventana se utilizan para describir la ventana FAC. Además, el uso de una ventana de tipo Hanning en la MDCT significa que se usa una ventana de coseno en el codificador, antes de la MDCT y, nuevamente, se usa una ventana de coseno en el decodificador, después de la IMDCT. Es la combinación muestra por muestra de estas dos ventanas de coseno lo que da como resultado la forma de ventana de Hanning deseada que tiene la forma complementaria apropiada para superponer y agregar en la porción de superposición del 50 % de la ventana.

Una vez más, un enfoque MDCT también se puede utilizar para codificar la ventana FAC, como se describe en la Figura 6. La Figura 10 es una ilustración de una segunda aplicación del método de corrección FAC utilizando MDCT. En el cuadrante superior izquierdo de la Figura 10, se muestra la ventana 812 FAC de la Figura 8. El primer cuarto 812a de la ventana 812 FAC se desplaza a la derecha de la ventana FAC y se invierte en el signo (812b). En otras palabras, la ventana 812 FAC se gira cíclicamente a la izquierda en % de su longitud total, y luego se invierte el signo del último % de las muestras. En el cuadrante superior derecho de la Figura 10, se aplica una MDCT a esta señal de ventana. La MDCT aplica, internamente, una operación de plegado, que da como resultado la señal 1002 plegada que se muestra en el cuadrante superior derecho de la Figura 10. Este plegado en la MDCT aplica una inversión de signo en la parte 812c izquierda, y no en la parte 812b derecha. donde se agrega el segmento plegado. Comparando la señal 1002 plegada resultante con la señal de corrección FAC 902 en el lado derecho de la Figura 9, se puede ver que es equivalente excepto por la inversión de tiempo (volteo) y la inversión de signo. Por lo tanto, en el decodificador, después de IMDCT, esta señal 1002, que es una corrección FAC invertida, se invierte en el tiempo (o se voltea) y se invierte en signo y se convierte en una corrección 1004 FAC como se muestra en el cuadrante inferior derecho de la Figura 10. Como arriba, esta corrección 1004 FAC puede agregarse a la señal en el área FAC de la Figura 8.

La cuantificación de la señal correspondiente a la corrección FAC implica un cuidado adecuado. De hecho, la corrección FAC es parte de la señal codificada en el dominio de transformada, que incluye, por ejemplo, las tramas TCX20 utilizadas en los ejemplos de las Figuras 2 a 10, ya que se añade a la trama para compensar los efectos de ventana y solapamiento. Dado que la cuantificación de esta corrección FAC introduce distorsión, esta distorsión se controla de tal manera que se mezcla correctamente o coincide con la distorsión de la trama codificada de dominio de transformada y no introduce artefactos audibles en esta transición correspondiente al área FAC. Si el nivel de ruido debido a la cuantificación, así como la forma del ruido de cuantificación en el dominio del tiempo y la frecuencia, se mantienen aproximadamente iguales en la señal de corrección FAC que en la trama codificada basada en transformada donde se aplica la corrección FAC, entonces la corrección FAC no introduce distorsión adicional.

Existen varios enfoques posibles para cuantificar la señal de corrección FAC, que incluye, pero no se limita a cuantificación escalar, cuantificación vectorial, libros de códigos estocásticos, libros de códigos algebraicos, y similares. En todos los casos, se puede entender que existe una fuerte correlación en los atributos de los coeficientes de la corrección FAC y los coeficientes de la trama codificada en el dominio de transformada correspondiente, como en la trama TCX 20 ejemplar. De hecho, las muestras en el dominio del tiempo utilizadas en el área FAC deberían ser las mismas muestras en el dominio del tiempo al comienzo de la trama codificada en el dominio de transformada. Por tanto, los factores de escala utilizados en el dispositivo de cuantificación aplicado a la trama codificada en el dominio de transformada son aproximadamente los mismos que los factores de escala utilizados en el dispositivo de cuantificación aplicado a la corrección FAC. Por supuesto, el número de muestras, o coeficientes de dominio de frecuencia, en la corrección FAC no es el mismo que en la trama codificada en el dominio de transformada: la trama codificada en el dominio de transformada tiene más muestras que la corrección FAC, que cubre solo una parte de la trama codificada de dominio de transformada. Lo importante es mantener el mismo nivel de ruido de cuantificación, por coeficiente de dominio de frecuencia, en la señal de corrección FAC que en la trama codificada en el dominio de transformada correspondiente (por ejemplo, una trama TCX 20).

Tomando el ejemplo específico del enfoque de Cuantificación Vectorial Algebraico (AVQ) utilizado en el estándar de codificación audio 3GPP AMR-WB+ para cuantificar los coeficientes espectrales, y su aplicación a la cuantización de la corrección FAC, se pueden extraer la siguiente observación. La ganancia global del AVQ calculada en la cuantificación de la trama codificada en el dominio de transformada, por ejemplo, una trama TCX20, esta ganancia global se utiliza para escalar las amplitudes de los coeficientes del dominio de la frecuencia para mantener el consumo de bits por debajo de un presupuesto de bits específico, puede ser una ganancia de referencia para la utilizada en la cuantificación de la trama FAC. Esto se aplica también a cualquier otro factor de escala, por ejemplo, los factores de escala utilizados en el Mejorador Adaptativo de Baja Frecuencia (ALFE) como el utilizado en el estándar AMR-WB . Sin embargo, otros ejemplos incluyen los factores de escala en la codificación AAC. Cualquier otro factor de escala que controle el nivel y la forma del ruido en el espectro también se considera en esta categoría.

Dependiendo de la longitud de la trama codificada de dominio de transformada, se aplica una asignación de m-a-1 de estos parámetros de factor de escala entre la trama codificada de dominio de transformada y la corrección FAC. Por ejemplo, en el caso de que se utilicen tres longitudes de trama TCX de 20 ms, 40 ms u 80 ms, como en el códec de audio MPEG USAC, los factores de escala, como por ejemplo los factores de escala utilizados en ALFE, se utilizan para coeficientes de dominio espectral consecutivo m en la trama codificada en el dominio de transformada se pueden usar para 1 coeficiente de dominio espectral en la corrección FAC.

Para que coincida con el nivel de error de cuantificación de la corrección FAC al nivel de error de cuantificación de la trama codificada basada en transformada, es apropiado tener en cuenta, en el codificador, el error de codificación de la trama codificada basada en transformada en ventana. La figura 11 es un diagrama de bloques de la cuantificación FAC que incluye la corrección de errores TCX. Primero, se calcula una diferencia 1102 entre la señal en ventana y plegada en la trama TCX 1104 y la síntesis TCX en ventana y plegada de esa trama 1106. La síntesis 1106 TCX, en este contexto, es simplemente la transformada inversa, incluida la ventana aplicada en el decodificador, de los coeficientes de dominio de transformada cuantificados de esa trama TCX. Entonces, esta señal 1108 de diferencia, o error de codificación TCX, se suma en 1110 a la señal 1112 de corrección FAC, sincronizada con el área FAC. Es entonces esta señal 1114 compuesta, que comprende la señal 1112 de corrección FAC más el error 1108 de codificación de la trama TCX, que es cuantificada por un cuantificador 1116 para su transmisión al decodificador. Como tal, esta señal 1118 de corrección de FAC cuantificada, según la Figura 11, corrige, en el decodificador, el efecto de ventana y el efecto de solapamiento, así como el error de codificación TCX en el área de FAC. El uso de los factores de escala TCX 1120, como se muestra en la Figura 11, permite hacer coincidir la distorsión de la corrección FAC con la distorsión en la trama TCX.

La figura 12 es un diagrama de un caso de uso de la corrección FAC en un sistema de codificación multimodo. Se proporcionan ejemplos que muestran la conmutación entre ventanas de forma regular con un 50 % o más de superposición y ventanas de forma variable, incluidas las ventanas FAC. En la Figura 12, la parte inferior puede verse como una continuación de la parte superior en el eje del tiempo. En la Figura 12 se supone que todas las tramas se codifican después de preprocesar la señal de audio de entrada a través de un proceso de filtrado variable en el tiempo, que puede ser, por ejemplo, un filtro de ponderación derivado de un análisis LPC en la señal de entrada, o algún otro, procesamiento con el objetivo de ponderar la señal de entrada. En este ejemplo, la señal de entrada se codifica, hasta el “punto de conmutación A”, utilizando un enfoque de la familia de codificación de audio del estado de la técnica, como AAC, donde las ventanas de análisis se optimizan para la codificación en el dominio de frecuencia. Normalmente, esto significa usar ventanas con un 50 % de superposición y forma regular como en la ventana de coseno utilizada en la codificación MDCT, aunque se pueden usar otras formas de ventana para este propósito. Luego, entre el “punto de conmutación A” y el “punto de conmutación B”, la señal de entrada se codifica utilizando ventanas de longitud y forma variables, no necesariamente optimizadas para la codificación de dominio de transformada, sino más bien diseñadas para lograr un compromiso entre la resolución de tiempo y frecuencia para los modos de codificación utilizados en este segmento. La Figura 12 muestra el ejemplo específico de los modos de codificación ACELP y TCX usados en este segmento. Puede verse que las formas de las ventanas, para estos modos de codificación, son significativamente heterogéneas y varían en forma y longitud. La ventana de ACELP es rectangular y no se superpone, mientras que la ventana de TCX no es rectangular y se superpone. Aquí es donde se usa la ventana FAC para cancelar el solapamiento en el dominio del tiempo, como se describió anteriormente en el presente documento. La propia ventana FAC, que se muestra en negrita en la Figura 12, con su forma y longitud específicas, es una de las ventanas de forma variable encerradas en el segmento entre “Punto de conmutación A” y “Punto de conmutación B”.

La figura 13 es un diagrama de otro caso de uso de la corrección FAC en un sistema de codificación multimodo. La Figura 13 muestra cómo se puede usar la ventana FAC en un contexto donde un codificador conmuta localmente de ventanas de forma regular a ventanas de forma variable para codificar una señal transitoria. Esto es similar al contexto de la codificación AAC donde se usa una ventana de inicio y parada para usar localmente ventanas con menor tiempo de soporte para codificar transitorios. Aquí, en cambio, en la Figura 13, la señal entre “Punto de conmutación A” y “Punto de conmutación B”, que se supone que es un transitorio, se codifica utilizando codificación multimodo, que involucra ACELP y TCX en el ejemplo presentado, que requiere el uso de la ventana FAC para gestionar correctamente la transición con el modo de codificación ACELP.

Las figuras 14 y 15 son diagramas de los casos primero y segundo uso de la corrección FAC a la conmutación entre tramas cortas basadas en transformadas y tramas de ACELP. Estos son casos en los que la conmutación se realiza entre tramas cortas basadas en transformadas en el dominio LPC, por ejemplo, tramas TCX cortas y tramas ACELP. El ejemplo de las Figuras 14 y 15 puede verse como una situación local en una señal más larga que también puede usar otros modos de codificación en otras tramas (no mostradas). Cabe señalar que la ventana para las tramas TCX cortas en las Figuras 14 y 15 puede tener más del 50 % de superposición. Por ejemplo, este puede ser el caso del códec AAC de retardo bajo, que utiliza una ventana asimétrica larga. En ese caso, algunas ventanas de inicio y parada específicas están diseñadas para permitir la conmutación adecuada entre estas ventanas asimétricas largas y las ventanas TCX cortas de las Figuras 14 y 15.

La Figura 16 es un diagrama de bloques de un ejemplo no limitativo del dispositivo 1600 para cancelación directa del solapamiento en el dominio del tiempo en una señal codificada recibida en un flujo 1601 de bits. El dispositivo 1600 se proporciona, con el propósito de ilustración, con referencia a la corrección FAC de la Figura 7 usando información del modo ACELP. Los expertos en la técnica apreciarán que se puede implementar un dispositivo 1600 correspondiente en relación con cualquier otro ejemplo de corrección de FAC proporcionado en la presente descripción.

El dispositivo 1600 comprende un receptor 1610 para recibir el flujo 1601 de bits representativo de una señal de audio codificada que incluye la corrección FAC.

Se suministran tramas ACELP desde el flujo 1601 de bits a un Decodificador 1611 ACELP que incluyen un filtro una ACELP síntesis. El decodificador 1611 ACELP produce una respuesta de entrada cero (ZIR) 704 del filtro de síntesis ACELP. Además, el decodificador 1611 ACELP de síntesis produce una señal 702 de síntesis ACELP. La señal 702 de síntesis ACELP y el ZIR 704 se concatenan para formar una señal de síntesis ACELP seguida por el ZIR. La ventana 502 FAC desplegada luego se aplican a las señales concatenadas 702 y 704, y luego se dobla y se agrega en el procesador 1605, y luego se aplica a una entrada positiva de un sumador 1620 para proporcionar una primera parte (opcional) de la señal de audio en tramas TCX.

Los parámetros (prm) para tramas TCX 20 del flujo 1601 de bits se suministran a un decodificador TCX 1606, seguido de una transformada IMDCT y una ventana 1613 para IMDCT, para producir una señal 1602 de síntesis TCX 20 aplicada a una entrada positiva del sumador 1616 para proporcionar una segunda parte de la señal de audio en tramas TCX 20.

Sin embargo, tras una transición entre los modos de codificación (por ejemplo, de una trama de ACELP a una trama TCX 20), una parte de la señal de audio podría no ser decodificados correctamente sin el uso de un cancelador 1615 de FAC. En el ejemplo de la figura 16, el cancelador FAC 1615 comprende un decodificador 1617 FAC para decodificar del flujo 1601 de bits recibido la señal 504 de corrección (Figura 5) que corresponde a la señal 706 de corrección (Figura 7) después del plegado como en la Figura 5, y una DCT inversa (IDCT). La salida del IDCT 1618 se suministra a una entrada positiva del sumador 1620. La salida del sumador 1620 se suministra a una entrada positiva del sumador 1616.

La producción mundial del sumador 1616 representa la señal de síntesis FAC cancelada para una trama TCX siguiente una trama de ACELP.

La figura 17 es un diagrama de bloques de un ejemplo no limitativo del dispositivo 1700 para la cancelación de solapamiento en el dominio del tiempo directo en una señal codificada para su transmisión a un decodificador. El dispositivo 1700 se proporciona, con fines ilustrativos, con referencia a la corrección FAC de la Figura 7 utilizando información del modo ACELP. Los expertos en la técnica apreciarán que se puede implementar un dispositivo 1700 correspondiente en relación con cualquier otro ejemplo de corrección de FAC proporcionado en la presente divulgación.

Una señal 1701 de audio para ser codificada se aplica al dispositivo 1700. Una lógica (no mostrada) aplica tramas ACELP de la señal 1701 de audio a un codificador 1710 ACELP. Una salida del codificador 1710, los parámetros 1702 de codificación ACELP, se aplica a una primera entrada de un multiplexor (MUX) 1711. Otra salida del codificador ACELP es una señal 1760 de síntesis ACELP seguida de la respuesta 1761 de entrada cero (ZIR) de un filtro de síntesis ACELP del codificador 1710. A La ventana 502 FAC se aplica la concatenación de señales 1760 y 1761. La salida del procesador 502 de ventana FAC se aplica en una entrada negativa de un sumador 1751.

La lógica (no mostrada) también aplica tramas TCX 20 de la señal 1701 de audio a un módulo 1712 de codificación MDCT para producir los parámetros 1703 codificados TCX 20 aplicados a una segunda entrada del multiplexor 1711. El módulo 1712 de codificación MDCT comprende una ventana 1731 MDCT, una transformada 1732 MDCT y el cuantificador 1733. La entrada en ventana al módulo 1732 MDCT se suministra a una entrada positiva de un sumador 1750. Los coeficientes 1704 MDCT cuantificados se aplican a una MDCT 1733 inversa (IMDCT), y la salida de IMDCT 1733 se suministra a una entrada negativa del sumador 1750. La salida del sumador 1750 forma un error de cuantificación TCX, que se muestra en el procesador 1736. La salida del procesador 1736 se suministra a una entrada positiva de un sumador 1751. Como se indica en la Figura 17, la salida del procesador 1736 puede usarse opcionalmente en el dispositivo.

Tras una transición entre los modos de codificación (por ejemplo, de una trama de ACELP a una trama TCX 20), algunas de las tramas de audio codificadas por el módulo 1712 de MDCT puede no ser decodificado correctamente sin información adicional. Una calculadora 1713 proporciona esta información adicional, más específicamente la señal 706 de corrección (Figura 7). Todos los componentes de la calculadora 1713 pueden verse como un productor de una señal de corrección FAC. El productor de una señal de corrección FAC comprende aplicar una ventana 502 FAC a la señal 1701 de audio, proporcionar la salida de la ventana 502 FAC a una entrada positiva del sumador 1751, proporcionar la salida del sumador 1751 al MDCT 1734 y cuantificar la salida del MDCT 1734 en el cuantificador 1737 para producir los parámetros FAC 706 que se aplican a una entrada del multiplexor 1711.

La señal en la salida del multiplexor 1711 representa la señal 1755 de audio codificada a transmitir a un decodificador (no mostrado) a través de un transmisor 1756 en un flujo 1757 de bits codificado.

Aquellos de experiencia ordinaria en la técnica se darán cuenta que la descripción de los dispositivos y métodos para cancelar adelante solapamiento de dominio de tiempo en una señal codificada son sólo ilustrativos y no tienen la intención de ser de ninguna manera limitantes. Otras realizaciones se les sugerirán fácilmente a aquellas personas con conocimientos ordinarios en la técnica que se beneficien de esta divulgación. Además, los sistemas descritos se pueden personalizar para ofrecer soluciones valiosas a las necesidades y problemas existentes de cancelar el solapamiento en el dominio del tiempo en una señal codificada.

Los expertos en la técnica apreciarán también que numerosos tipos de terminales o de otros aparatos pueden incorporar ambos aspectos de la codificación para la transmisión de audio codificada, y los aspectos de la decodificación después de la recepción de audio codificado, en un mismo dispositivo.

En aras de claridad, no todas las características rutinarias de las implementaciones de cancelación hacia adelante de solapamiento de dominio de tiempo en una señal codificada se muestran y describen. Por supuesto, se apreciará que, en el desarrollo de cualquier implementación real de la codificación de audio, se deben tomar numerosas decisiones específicas de implementación para lograr los objetivos específicos del desarrollador, como el cumplimiento de la aplicación, el sistema, la red. - y limitaciones relacionadas con el negocio, y que estos objetivos específicos variarán de una implementación a otra y de un desarrollador a otro. Además, se apreciará que un esfuerzo de desarrollo puede ser complejo y llevar mucho tiempo, pero sin embargo sería una tarea rutinaria de ingeniería para los expertos en el campo de los sistemas de codificación de audio que se benefician de esta divulgación.

De acuerdo con esta divulgación, los componentes, etapas de proceso, y/o estructuras de datos descritas en el presente documento pueden implementarse utilizando diversos tipos de sistemas operativos, plataformas informáticas, dispositivos de red, programas de ordenador, y/o máquinas de propósito general. Además, los expertos en la técnica reconocerán que los dispositivos de naturaleza menos general, como los dispositivos cableados, las matrices de puertas programables en campo (FP-GA), los circuitos integrados específicos de la aplicación (ASIC), o similares, también se pueden utilizar. Cuando un método que comprende una serie de etapas de proceso es implementado por un ordenador o una máquina y esas etapas de proceso pueden almacenarse como una serie de instrucciones legibles por máquina, pueden almacenarse en un medio tangible.

Los sistemas y módulos descritos en este documento pueden comprender software, firmware, hardware o cualquier combinación de software, firmware o hardware adecuado para los fines descritos en este documento. El software y otros módulos pueden residir en servidores, estaciones de trabajo, ordenadores personales, tabletas informáticas, PDA y otros dispositivos adecuados para los fines descritos en este documento. El software y otros módulos pueden ser accesibles a través de la memoria local, a través de una red, a través de un navegador u otra aplicación en un contexto ASP o mediante otros medios adecuados para los fines descritos en este documento. Las estructuras de datos descritas en este documento pueden comprender archivos informáticos, variables, matrices de programación, estructuras de programación o cualquier esquema o método de almacenamiento de información electrónica, o cualquier combinación de los mismos, adecuados para los fines descritos en este documento.

Aunque la presente invención se ha descrito anteriormente en este documento a modo de realizaciones ilustrativas no restrictivas de la misma, estas realizaciones se pueden modificar a voluntad dentro del alcance de las reivindicaciones adjuntas.

Claims

REIVINDICACIONES

1. Un método para cancelar el solapamiento directo en el dominio del tiempo en una señal codificada recibida en un flujo de bits en un decodificador, que comprende:

recibir en el flujo de bits en el decodificador, desde un codificador, información adicional relacionada con la corrección del solapamiento en el dominio del tiempo en la señal codificada, siendo la información adicional representativa de una cancelación de solapamiento directo, FAC, señal de corrección; y

en el decodificador, cancelar el solapamiento en el dominio del tiempo en la señal codificada en respuesta a la información adicional;

caracterizado porque cancelar el solapamiento en el dominio del tiempo comprende un recálculo de corrección FAC que incluye (a) decodificar la señal de corrección FAC recibida en el flujo de bits y (b) agregar a la señal de corrección FAC decodificada (i) una señal de síntesis de una Predicción Lineal Excitado de Código Algebraico, ACELP, trama en una primera mitad de una ventana FAC aplicada a la señal de síntesis al final de la trama ACELP y (ii) una respuesta de entrada cero de un filtro de síntesis en una segunda mitad de la ventana FAC aplicada a la respuesta de entrada cero al comienzo de una eXcitación Codificada por Transformada, TCX, trama que sigue a la trama ACELP, cuando la corrección FAC es para una transición de la trama ACELP a la trama TCX.

2. El método de la reivindicación 1, en el que la trama ACELP es una trama que usa una ventana rectangular que no se solapa y la trama TCX es una trama que usa una ventana que no se solapa y que no es rectangular.

3. El método de la reivindicación 1, en el que la señal de corrección de FAC es una señal de corrección en ventana o en ventana FAC en ventana y plegada.

4. El método de la reivindicación 1, en el que la señal de corrección FAC se codifica por transformada usando una transformada para codificar una trama usando una ventana superpuesta no rectangular.

5. El método de la reivindicación 1, en el que la señal de corrección FAC se cuantifica usando factores de escala usados en ventanas superpuestas no rectangulares.

6. Un dispositivo para cancelar el solapamiento directo en el dominio del tiempo en una señal codificada recibida en un flujo de bits, que comprende:

un receptor, de un flujo de bits de un codificador, de información adicional relacionada con la corrección del solapamiento en el dominio del tiempo en la señal codificada, la información adicional comprende una cancelación directa de solapamiento, FAC, señal de corrección; y

un cancelador del solapamiento en el dominio del tiempo en la señal codificada en respuesta a la información adicional; caracterizado porque el cancelador comprende, para realizar un recálculo de corrección FAC, (a) un decodificador de la señal de corrección FAC recibida en el flujo de bits y (b) un sumador a la señal de corrección FAC decodificada de (i) una señal de síntesis de una Predicción Lineal Excitado por Código Algebraico, ACELP, trama en la primera mitad de una ventana FAC aplicada a la señal de síntesis al final de la trama ACELP y de (ii) una respuesta de entrada cero de un filtro de síntesis en una segunda mitad de la Ventana FAC aplicada a la respuesta de entrada cero al comienzo de una excitación codificada por transformada, TCX, después de la trama ACELP, cuando la señal de corrección FAC es para una transición desde la trama ACELP hasta la trama TCX.

7. El dispositivo de la reivindicación 6, en el que la trama ACELP es una trama que usa una ventana rectangular no superpuesta y la trama TCX es una trama que usa una ventana superpuesta no rectangular.

8. Dispositivo de acuerdo con la reivindicación 6, en el que la señal de corrección de FAC es una señal de corrección de FAC con ventana o con ventana y plegada.

9. El dispositivo de la reivindicación 6, en el que la señal de corrección FAC se codifica por transformada usando una transformada para codificar una trama usando una ventana superpuesta no rectangular.

10. El dispositivo de la reivindicación 6, en el que la señal de corrección de FAC se cuantifica usando factores de escala usados en ventanas superpuestas no rectangulares.