ES2990986T3

ES2990986T3 - Reducción de solapamiento en dominio de tiempo para bancos de filtros no uniformes que usan análisis espectral seguido por síntesis parcial

Info

Publication number: ES2990986T3
Application number: ES20153965T
Authority: ES
Inventors: Nils Werner; Bernd Edler
Original assignee: Fraunhofer Gesellschaft zur Foerderung der Angewandten Forschung eV
Current assignee: Fraunhofer Gesellschaft zur Foerderung der Angewandten Forschung eV
Priority date: 2016-07-29
Filing date: 2017-07-26
Publication date: 2024-12-02
Anticipated expiration: 2037-07-26
Also published as: US20190172471A1; WO2018019909A1; EP3491643B1; EP3491643A1; KR102218371B1; BR112019001741A2; CA3139439A1; ES2807564T3; CA3031553A1; RU2719285C1; MX2019001023A; CA3031553C; KR20190034314A; MX387453B; JP2019526074A; JP6768141B2; EP3664090A1; CN109863555A; US10978082B2; EP3664090C0

Abstract

Las realizaciones proporcionan un procesador de audio para procesar una señal de audio para obtener una representación de subbanda de la señal de audio. El procesador de audio comprende una etapa de transformación de muestreo crítico superpuesto en cascada y una etapa de reducción de aliasing en el dominio del tiempo. La etapa de transformación de muestreo crítico superpuesto en cascada está configurada para realizar una transformación de muestreo crítico superpuesto en cascada en al menos dos bloques parcialmente superpuestos de muestras de la señal de audio, para obtener un conjunto de muestras de subbanda sobre la base de un primer bloque de muestras de la señal de audio, y para obtener un conjunto correspondiente de muestras de subbanda sobre la base de un segundo bloque de muestras de la señal de audio. La etapa de reducción de aliasing en el dominio del tiempo está configurada para realizar una combinación ponderada de dos conjuntos correspondientes de muestras de subbanda, uno obtenido sobre la base del primer bloque de muestras de la señal de audio y uno obtenido sobre la base del segundo bloque de muestras de la señal de audio, para obtener una representación de subbanda reducida por aliasing de la señal de audio. (Traducción automática con Google Translate, sin valor legal)

Description

d e s c r ip c ió n

Reducción de solapamiento en dominio de tiempo para bancos de filtros no uniformes que usan análisis espectral seguido por síntesis parcial

[0001] Las realizaciones se refieren a un procesador de audio/procedimiento para procesar una representación de subbanda de una señal de audio para obtener la señal de audio. La MDCT se utiliza ampliamente en aplicaciones de codificación de audio debido a sus propiedades como buena compactación de energía y ortogonalidad cuando se utiliza de una forma traslapada. Sin embargo, la MDCT exhibe una resolución de tiempo-frecuencia uniforme [J. Princen, A. Johnson, and A. Bradley, “Subband/transform coding using filter bank designs based on time domain aliasing eaneellation,” Acústica, procesamiento de voz y señal, Conferencia Internacional de la IEEE en ICASSP 1987, abril de 1987, voI. 12, pp. 2161-2164]. Cuando se hace procesamiento de audio motivado de forma perceptual, sin embargo, una resolución de tiempo-frecuencia no uniforme puede ser una representación más deseable.

[0002] Una forma de diseñar una transformada no uniforme es la aplicación repetida de una de varias transformadas uniformes.

[0003] Para combinación de subbandas se aplica primero una transformada larga, que transforma la señal del dominio temporal al dominio espectral. El resultado es un espectro con alta resolución espectral pero baja resolución temporal. Después de eso se transforman varios periodos espectrales de nuevo al dominio temporal. Esto incrementa la resolución temporal mientras se sacrifica la resolución espectral en esa subbanda seleccionada.

[0004] La separación de subbandas es la operación complementaria: primero se aplica una transformada corta. El resultado es un espectro con baja resolución espectral pero alta resolución temporal. Después de eso, se transforman de nuevo Ios periodos espectrales de dos o más tramas de transformadas adyacentes, incrementando su resolución espectral al coste de resolución temporal.

[0005] Estas etapas se pueden mezclar y repetir a voluntad. La elección de transformada puede ser arbitraria, sin embargo, por lo general se eligen las mismas<o>transformadas similares para cada etapa.

[0006] Existen varias formas de facilitar transformadas de tiempo-frecuencia no uniformes:

Utilizando dos transformadas rápidas de Fourier consecutivas, existe la transformada ERBE, una transformada de combinación de subbandas con una escala de frecuencia ERB [T. Necciari, P. Balazs, N. Holighaus, y P.L. Sondergaard, “The erblet transform: An auditory-based time-frequency representation with perfect reconstruction,” Acoustics, Speech and Signal Processing (ICASSP), 2013 Conferencia Internacional de la IEEE, mayo de 2013, pp.

498-502]. Recientemente, I<os>mismos autores expandieron<su>estrategia a un espectro de transformada discreta de coseno tipo 4 (CDT4) y una transformada de combinaciones de subbandas MDCT [Olivier Derrien, Thibaud Necciari, and Peter Balazs, “A quasi-orthogonal, invertible, and perceptually relevant time-frequency transform for audio coding,” EUSIPCO, Nice, Francia, agosto 2015].

[0007] Sin embargo, ambas estrategias se diseñaron para requerir ventanas de transformadas superpuestas, muy largas con muestreo no crítico<o>incluso que transforman la señal completa en una etapa. Estas ventanas de transformadas largas y muestreo no crítico prohíben la localización de tiempo precisa en el dominio de transformada y las hacen inadecuadas para aplicaciones de codificación debido a una previsión amplia y a la alta redundancia.

[0008] Se introdujeron una técnica de combinación de subbandas que utiliza MDCT y elementos de mariposa para combinar coeficientes seleccionados de una trama MDCT en [J. Mau, J. Valot, y D. Minaud, “Time-varying orthogonal filter banks without transient filters,” Actas de la Conferencia Internacional sobre Acústica, procesamiento de<voz>y señal, 1995. Conferencia Internacional-Volumen 02, Washington, DC, EUA, 1995, ICASSP 1995, pp. 1328 1331, IEEE Computer Society] y generalizado a matrices de Hadamard en [O.A. Niamut y R. Heusdens, “Flexible frequency decompositions for cosine-modulated filter banks,” Actas de Acústica, procesamiento de voz y señal, 2003 (IcAs SP 2003). 2003 Conferencia Internacional de la IEEE, abril de 2003, voI.5, pp. V-449-52 voI. 5]. La operación de división de subbanda complementaria se introdujo en [Jean-Marc Valin, Gregory Maxwell, Timothy B. Terriberry y Koen Vos, “High-quality, low-delay music coding in the opus codee,” Convención de la Audio Engineering Society i 35, octubre de 2013].

[0009] Mientras que permiten la integración directa en flujos funcionales de transformada MDCT traslapados, comunes, estas implementaeiones basadas en mariposa y Hadamard solo permiten diseños de escala de frecuencia muy limitados con, por ejemplo, tamaños limitados ak = 2ncon n e N Además, la matriz de Hadamard solo se aproxima muy a groso modo a la DCT y, por lo tanto, permite resolución temporal-espectral muy limitada, como se describirá más detalladamente más adelante.

[0010] Además, mientras que algunos de estos procedimientos utilizan MDCT no intentan reducir el solapamiento resultante en las subbandas, produciendo compactaclón temporal esparcida del Impulso del banco de filtros resultante.

[0011]El documento US 7.548.853 B2 describe un procedimiento para comprimir señales de entrada de audio para formar un flujo de bits maestro que puede escalarse para formar un flujo de bits escalado que tiene una velocidad de datos prescrita arbitrariamente. Un banco de filtros jerárquico descompone la señal de entrada en una representación de tiempo/frecuencia de resolución múltiple desde la cual el codificador puede extraer de manera eficiente ambos componentes tonales y residuales. Los componentes se clasifican y, a continuación, se cuantifican con referencia a la misma función de enmascaramiento<o>diferentes criterios psicoacústicos. Los componentes tonales seleccionados se codifican adecuadamente mediante el uso de codificación diferencial extendida a audio multicanal. Los componentes de la muestra de tiempo y el factor de escala que conforman los componentes residuales se codifican mediante el uso de la codificación de canal conjunto (JCC) extendida al audio multicanal.

[0012]En el artículo [SEYMOUR SHLIEN: "The Modulated Lapped Transforms, Its Time-Varying Forms, and Its Applications to Audio Coding Standards", actas de IEEE sobre procesamiento de voz y audio, centro de servicio IEEE, Nueva York, NY, EE.UU., V<o>I. 5, n. 04, 1 de julio de 1997 (1997-07-01), XP011054261] se describen las propiedades de la transformada traslapada modulada (MLT) y cómo se puede utilizar la transformada traslapada modulada para generar un banco de filtros que varía en el tiempo.

[0013]El documento US 2002/0176353 A l describe un procedimiento y un sistema para codificar y decodificar una señal de entrada en relación con los aspectos más perceptualmente relevantes de la señal de entrada. Se aplica una transformada bidimensional (2D) a la señal de entrada para producir una matriz de magnitud y una matriz de fase que puede ser cuantificada inversamente por un decodificador. Una primera columna de coeficientes de la matriz de magnitud representa una función de densidad espectral promedio (MSD) de la señal de entrada. Los aspectos relevantes de la función MSD se codifican al comienzo de un paquete de datos. La función MSD se procesa también a través de un modelo de percepción central para determinar la asignación de bits. Las matrices se cuantifican y se ordenan prioritariamente a continuación en un paquete de datos, con la información menos relevante perceptualmente al final del paquete para que pueda ignorarse o truncarse para la escalabilidad a la capacidad de velocidad de datos del canal.

[0014]En el artículo [SMART G Y COL.: "Filter Bank Design Based on the Time Domain Cancellation with nonidentical Windows", Actas de la Conferencia Internacional sobre Acústica, procesamiento de<voz>y señal (ICASSP), Adelaide, del 19 al 22 de abril, 1994, páginas IN-185, XP000529912] se describe un procedimiento para diseñar bancos de filtros de reconstrucción perfectos mediante el uso de ventanas de análisis y síntesis que no son idénticas. El procedimiento de diseño del banco de filtros se basa en la cancelación de solapamiento de dominio de tiempo (TDAC).

[0015]Por lo tanto, es el objeto de la presente invención proporcionar un concepto que proporciona al menos una de una compactación temporal mejorada de la respuesta de impulso, procesamiento de escalas de frecuencia arbitrarias, y redundancia y retardos reducidos.

[0016]Este objeto se resuelve por las reivindicaciones independientes.

[0017]Las realizaciones proporcionan un procesador de audio para procesar una señal de audio para obtener una representación de subbanda de la señal de audio. El procesador de audio comprende una etapa de reducción de solapamiento en dominio de tiempo y una etapa de transformada críticamente muestreada traslapada en cascada. La etapa de reducción inversa de solapamiento en dominio de tiempo se configura para llevar a cabo una combinación ponderada (y desplazada) de dos representaciones de subbanda de solapamiento reducido correspondientes (de diferentes bloques de muestras parcialmente superpuestas) de la señal de audio, para obtener una representación de subbanda solapada, donde la representación de subbanda solapada es un conjunto de muestras de subbanda. La etapa de transformada inversa críticamente muestreada traslapada en cascada se configura para llevar a cabo una transformada inversa críticamente muestreada traslapada en cascada en el conjunto de muestras de subbanda, para obtener un conjunto de muestras asociadas con un bloque de muestras de la señal de audio.

[0018]Según el concepto de la presente invención, se añade una etapa de post-procesamiento adicional al flujo funcional de transformada críticamente muestreada traslapada (por ejemplo, MDCT), la etapa de post procesamiento adicional que comprende otra transformada críticamente muestreada traslapada (por ejemplo,<m>D<c>T) a lo largo del eje de frecuencia y una reducción de solapamiento en dominio de tiempo a lo largo de cada eje de tiempo de subbanda. Esto permite extraer escalas de frecuencia arbitrarias del espectograma de transformada críticamente muestreada traslapada (por ejemplo, MDCT) con una compactación temporal mejorada de la respuesta de impulso, mientras que no introduce ninguna redundancia adicional y un retardo reducido de trama de transformada críticamente muestreada traslapada.

[0019]Las realizaciones adicionales proporcionan un procedimiento para procesar una representación de subbanda de una señal de audio para obtener la señal de audio. El procedimiento comprende:

- llevar a cabo una combinación ponderada (y desplazada) de dos representaciones de subbanda de solapamlento reducido correspondientes (de diferentes bloques de muestras parcialmente superpuestas) de la señal de audio, para obtener una representación de subbanda solapada, donde la representación de subbanda solapada es un conjunto de muestras de subbanda; y

- llevar a cabo una transformada inversa críticamente muestreada traslapada en cascada en el conjunto de muestras de subbanda, para obtener un conjunto de muestras asociadas con un bloque de muestras de la señal de audio.

[0020]Se abordan implementaciones ventajosas en las reivindicaciones dependientes.

[0021]Posteriormente, se describen implementaciones ventajosas del procesador de audio para procesar una señal de audio para obtener una representación de subbanda de la señal de audio.

[0022]En las realizaciones, la etapa de transformada inversa críticamente muestreada traslapada en cascada puede ser una etapa MDCT en cascada (MDCT = transformada discreta de coseno modificada), MDST (MDST = transformada discreta de seno modificada) o MLT (MLT = transformada solapada modulada).

[0023]En las realizaciones, la etapa de transformada críticamente muestreada traslapada en cascada puede comprender una primera etapa de transformada críticamente muestreada traslapada configurada para llevar a cabo una transformada inversa críticamente muestreada traslapada en el conjunto de muestras de subbanda, para obtener un conjunto de periodos asociados con una subbanda dada de la señal de audio.

[0024]La primera etapa de transformada inversa críticamente muestreada traslapada puede ser una primera etapa inversa MDCT, MDST o MLT.

[0025]En las realizaciones, la etapa de transformada inversa críticamente muestreada traslapada en cascada puede comprender una primera etapa de superposición y adición configurada para llevar a cabo una concatenación de un conjunto de periodos asociados con una pluralidad de subbandas de la señal de audio, que comprende una combinación ponderada del conjunto de periodos asociados con la subbanda dada de la señal de audio con un conjunto de periodos asociados con otra subbanda de la señal de audio, para obtener un conjunto de periodos asociados con un bloque de muestras de la señal de audio.

[0026]En las realizaciones, la etapa de transformada inversa críticamente muestreada traslapada en cascada puede comprender una segunda etapa de transformada inversa críticamente muestreada traslapada configurada para llevar a cabo una transformada inversa críticamente muestreada traslapada en el conjunto de periodos asociados con el bloque de muestras de la señal de audio, para obtener un conjunto de muestras asociadas con el bloque de muestras de la señal de audio.

[0027]La segunda etapa de transformada inversa críticamente muestreada traslapada puede ser una segunda etapa inversa MDCT, MDST o MLT.

[0028]Por lo tanto, la primera y segunda etapa inversa de transformada críticamente muestreada traslapada pueden ser del mismo tipo, es decir una de las etapas MDCT, MDST o MLT.

[0029]En las realizaciones, la etapa de transformada inversa críticamente muestreada traslapada en cascada puede comprender una segunda etapa de superposición y adición configurada para superponer y añadir el conjunto de muestras asociadas con el bloque de muestras de la señal de audio y otro conjunto de muestras asociadas con otro bloque de muestras de la señal de audio, superponiéndose el bloque de muestras y el otro bloque de muestras de la señal de audio parcialmente, para obtener la señal de audio. Las realizaciones de la presente invención se describen esta invención haciendo referencia a los dibujos anexos.

La figura 1 muestra un diagrama de bloques esquemático de un procesador de audio configurado para procesar una señal de audio para obtener una representación de subbanda de la señal de audio, que no forma parte de la invención;

La figura 2 muestra un diagrama de bloques esquemático de un procesador de audio configurado para procesar una señal de audio para obtener una representación de subbanda de la señal de audio, que no forma parte de la invención;

La figura 3 muestra un diagrama de bloques esquemático de un procesador de audio configurado para procesar una señal de audio para obtener una representación de subbanda de la señal de audio, que no forma parte de la invención;

La figura 4 muestra un diagrama de bloques esquemático de un procesador de audio para procesar una representación de subbanda de una señal de audio para obtener la señal de audio, según una realización;

La figura 5 muestra un diagrama de bloques esquemático de un procesador de audio para procesar una representación de subbanda de una señal de audio para obtener la señal de audio, según una realización adicional; La figura 6 muestra un diagrama de bloques esquemático de un procesador de audio para procesar una representación de subbanda de una señal de audio para obtener la señal de audio, según una realización adicional; La figura 7 muestra en diagramas un ejemplo de muestras de subbanda (gráfico superior) y la propagación de sus muestras a través del tiempo y frecuencia (gráfico inferior);

La figura 8 muestra en un diagrama la incertidumbre espectral y temporal obtenida por varias transformadas diferentes;

La figura 9 muestra en diagramas una comparación de dos respuestas de impulso de ejemplo generadas por combinación de subbandas con y sin TDAR, bloques cortos MDCT simples y combinación de subbandas de matriz de Hadamard;

La figura 10 muestra un diagrama de flujo de un procedimiento para procesar una señal de audio para obtener una representación de subbanda de la señal de audio, según una realización;

La figura 11 muestra un diagrama de flujo de un procedimiento para procesar una representación de subbanda de una señal de audio para obtener la señal de audio, según una realización;

La figura 12 muestra un diagrama de bloques esquemático de un codificador de audio, que no forma parte de la invención;

La figura 13 muestra un diagrama de bloques esquemático de un decodificador de audio, según una realización; y La figura 14 muestra un diagrama de bloques esquemático de un analizador de audio, que no forma parte de la invención.

[0030] Elementos equivalentes o iguales o elementos con funcionalidad igual o equivalente se indican en la siguiente descripción por números de referencia iguales o equivalentes.

[0031] En la siguiente descripción, se exponen una pluralidad de detalles para proporcionar una explicación más completa de las realizaciones de la presente invención. Sin embargo, será evidente para un experto en la materia que las realizaciones de la presente invención se pueden practicar sin estos detalles específicos. En otros casos, se muestran dispositivos y estructuras bien conocidas en forma de diagrama de bloques en lugar de en detalle a fin de evitar complicar las realizaciones de la presente invención. Además, las características de las diferentes realizaciones en lo sucesivo se pueden combinar entre sí, a menos que se señale específicamente de otra forma.

[0032] La figura 1 muestra un diagrama de bloques esquemático de un procesador de audio 100 configurado para procesar una señal de audio 102 para obtener una representación de subbanda de la señal de audio, según una realización. El procesador de audio 100 comprende una etapa de transformada críticamente muestreada traslapada en cascada (lCsT) 104 y una etapa de reducción de solapamiento en dominio de tiempo (TDAR) 106.

[0033] La etapa de transformada críticamente muestreada traslapada en cascada 104 se configura para llevar a cabo una transformada críticamente muestreada traslapada en cascada en al menos dos bloques parcialmente superpuestos 108_1 y 108_2 de muestras de la señal de audio 102, para obtener un conjunto 110_1, 1 de muestras de subbanda con base en un primer bloque 108_1 de muestras (de los al menos dos bloques superpuestos 108_1 y 108_2 de muestras) de la señal de audio 102, y para obtener un conjunto correspondiente 110_2,1 de muestras de subbanda con base en un segundo bloque 108_2 de muestras (de al menos dos bloques superpuestos 108_1 y 108_2 de muestras) de la señal de audio 102.

[0034] La etapa de reducción de solapamiento en dominio de tiempo 104 se configura para llevar a cabo una combinación ponderada de dos conjuntos correspondientes 110_1,1 y 110_2,1 de muestras de subbanda (es decir, muestras de subbanda que corresponden a la misma subbanda), uno obtenido con base en el primer bloque 108_1 de muestras de la señal de audio 102 y uno obtenido con base en el segundo bloque 108_2 de muestras de la señal de audio, para obtener una representación de subbanda de solapamiento reducido 112_1 de la señal de audio 102.

[0035] La etapa de transformada críticamente muestreada traslapada en cascada 104 puede comprender al menos dos etapas de transformada críticamente muestreada traslapada en cascada, o en otras palabras, dos etapas de transformada críticamente muestreadas traslapadas conectadas de una forma en cascada.

[0036] La etapa de transformada críticamente muestreada traslapada en cascada puede ser una etapa MDCT en cascada (MDCT = transformada discreta de coseno modificada). La etapa MDCT en cascada puede comprender al menos dos etapas MDCT.

[0037] Naturalmente, la etapa de transformada críticamente muestreada traslapada en cascada puede ser también una etapa MDST (MDST = transformada discreta de seno modificada) o MLT (MLT = transformada traslapada modulada) en cascada, que comprende al menos dos etapas MDST<o>MLT, respectivamente.

[0038] Los dos conjuntos correspondientes de muestras de subbanda 110_1,1 y 110_2,1 pueden ser muestras de subbanda que corresponden a la misma subbanda (es decir, banda de frecuencia).

[0039]La figura 2 muestra un diagrama de bloques esquemático de un procesador de audio 100 configurado para procesar una señal de audio 102 para obtener una representación de subbanda de la señal de audio según una realización adicional.

[0040]Como se muestra en la figura 2, la etapa de transformada críticamente muestreada traslapada en cascada 104 puede comprender una primera etapa de transformada críticamente muestreada traslapada 120 configurada para llevar a cabo transformadas críticamente muestreadas traslapadas en un primer bloque 108_1 de (2M) muestras (Xi-i(n), 0<n<2M-1) y un segundo bloque 108_2 de (2M) muestras (Xi(n), 0<n<2M-1) de los al menos dos bloques parcialmente superpuestos 108_1 y 108_2 de muestras de la señal de audio 102, para obtener un primer conjunto 124_1 de (M) periodos (coeficientes LCST) (Xi-i(k), 0<k<M-1) para el primer bloque<i>08_1 de muestras y un segundo conjunto 124_2 de (M) periodos (coeficientes<l>C<s>T) (Xi(k), 0<k<M-1) para el segundo bloque 108_2 de muestras.

[0041]La etapa de transformada críticamente muestreada traslapada en cascada 104 puede comprender una segunda etapa de transformada críticamente muestreada traslapada 126 configurada para llevar a cabo una transformada críticamente muestreada traslapada en un segmento 128_1,1 (subconjunto apropiado) (Xv,i-i(k)) del primer conjunto 124_1 de periodos y para llevar a cabo una transformada críticamente muestreada traslapada en un segmento 128_2,1 (subconjunto apropiado) (Xv,i(k)) del segundo subconjunto 124_2 de periodos, estando cada segmento asociado con una subbanda de la señal de audio 102, para obtener un conjunto 110_1, i de muestras de subbanda [yv,i-i(m)] para el primer conjunto 124_1 de periodos y un conjunto 110_2,1 de muestras de subbanda (yv,i(m)) del segundo conjunto 124_2 de periodos.

[0042]La figura 3 muestra un diagrama de bloques esquemático de un procesador de audio 100 configurado para procesar una señal de audio 102 para obtener una representación de subbanda de la señal de audio, según una realización adicional. En otras palabras, la figura 3 muestra un diagrama del banco de filtro de análisis. Por lo tanto, se asumen funciones de ventana apropiadas. Debe observarse que por razones de simplicidad en la figura 3 (solamente) se indica el procesamiento de una primera mitad de una trama de subbanda (y[m], 0 <= m < N/2) (es decir, solo la primera línea de la ecuación (6)).

[0043]Como se muestra en la figura 3, la primera etapa de transformada críticamente muestreada traslapada 120 se puede configurar para llevar a cabo una primera transformada críticamente muestreada traslapada 122_1 (por ejemplo, MDCT i-i) en el primer bloque 108_1 de (2M) muestras (Xi-i(n), 0<n<2M-1), para obtener el primer conjunto 124_1 de (M) periodos (coeficientes LCST) (Xi-i(k), 0<k<M-1) para el primer bloque i 08_1 de muestras, y para llevar a cabo una segunda transformada críticamente muestreada traslapada 122_2 (por ejemplo, MDCT i) en el segundo bloque 108_2 de (2M) muestras (Xi(n), 0<n<2M-1), para obtener un segundo conjunto 124_2 de (M) periodos (coeficientes LCST) (Xi(k), 0<k<M-1) para el segundo bloque 108_2 de muestras.

[0044]En detalle, la segunda etapa de transformada críticamente muestreada traslapada 126 se puede configurar para llevar a cabo transformadas críticamente muestreadas traslapadas en al menos dos segmentos parcialmente superpuestos 128_1,1 y 128_1,2 (subconjuntos apropiados) (Xv,i-i(k)) del primer conjunto 124_1 de periodos y para llevar a cabo transformadas críticamente muestreadas traslapadas en al menos dos segmentos parcialmente superpuestos 128_2,1, y 128_2,2 (subconjuntos apropiados) (Xvi(k)) del segundo conjunto de periodos, estando cada segmento asociado con una subbanda de la señal de audio, para obtener al menos dos conjuntos 110_1,1 y 110_1 2 de muestras de subbanda (yv,i-i(m)) para el primer conjunto 124_1 de periodos y al menos dos conjuntos 110_2,1 y 110_2,2 de muestras de subbanda (yv,i(m)) para el segundo conjunto i 24_2 de periodos.

[0045]Por ejemplo, el primer conjunto 110_1,1 de muestras de subbanda puede ser un resultado de una primera transformada críticamente muestreada traslapada 132_1,1 con base en el primer segmento 132_1,1 del primer conjunto 124_1 de periodos, donde el segundo conjunto 110_1,2 de muestras de subbanda puede ser un resultado de una segunda transformada críticamente muestreada traslapada 132_1,2 con base en el segundo segmento 128_1,2 del primer conjunto 124_1 de periodos, donde el tercer conjunto 110_2,1 de muestras de subbanda puede ser un resultado de una tercera transformada críticamente muestreada traslapada 132_2,1 con base en el primer segmento 128_2,1 del segundo conjunto 124_2 de periodos, donde el cuarto conjunto 110_2,2 de muestras de subbanda puede ser un resultado de una cuarta transformada críticamente muestreada traslapada 132_2,2 con base en el segundo segmento 128_2,2 del segundo conjunto 124_2 de periodos.

[0046]Por lo tanto, la etapa de reducción de solapamiento en dominio de tiempo 106 se puede configurar para llevar a cabo una combinación ponderada del primer conjunto 110_1,1 de muestras de subbanda y el tercer conjunto 110_2,1 de muestras de subbanda, para obtener una primera representación de subbanda de solapamiento reducido 112_i (yi,i[mi]) de la señal de audio, donde la etapa de reducción de solapamiento en dominio de tiempo 106 puede configurase para llevar a cabo una combinación ponderada del segundo conjunto 110_1,2 de muestras de subbanda y el cuarto conjunto 110_2,2 de muestras de subbanda, para obtener una segunda representación de subbanda de<solapamiento reducido 112_2 (y>2<,i[m>2<]) de la señal de audio.>

[0047]La figura 4 muestra un diagrama de bloques esquemático de un procesador de audio 200 para procesar una representación de subbanda de una señal de audio para obtener la señal de audio 102, según una realización. El procesador de audio 200 comprende una etapa de reducción inversa de solapamiento en dominio de tiempo (TDAR) 202 y una etapa de transformada inversa críticamente muestreada traslapada en cascada (LCST) 204.

[0048]La etapa de reducción inversa de solapamiento en dominio de tiempo 202 se configura para llevar a cabo una combinación ponderada (y desplazada) de dos representaciones de subbanda de solapamiento reducido correspondientes 112_1 y 112_2 (yv,i(m), yv,i-i(m)) de la señal de audio 102, para obtener una representación de subbanda solapada 110_1 (yv,¡(m)), donde la representación de subbanda solapada es un conjunto 110_1 de muestras de subbanda.

[0049]La etapa de transformada inversa críticamente muestreada traslapada en cascada 204 se configura para llevar a cabo una transformada inversa críticamente muestreada traslapada en cascada en el conjunto 110_1 de muestras de subbanda, para obtener un conjunto de muestras asociadas con un bloque 108_1 de muestras de la señal de audio 102.

[0050]La figura 5 muestra un diagrama de bloques esquemático de un procesador de audio 200 para procesar una representación de subbanda de una señal de audio para obtener la señal de audio 102, según una realización adicional. La etapa de transformada inversa críticamente muestreada traslapada en cascada 204 puede comprender una primera etapa de transformada inversa críticamente muestreada traslapada (LCST) 208 y una primera etapa de superposición y adición 210.

[0051]La primera etapa de transformada inversa críticamente muestreada traslapada 208 se puede configurar para llevar a cabo una transformada inversa críticamente muestreada traslapada en el conjunto 110_1,1 de muestras de subbanda, para obtener un conjunto 128_1,1 de periodos asociados con una subbanda dada de la señal de audio 0Ei(k».

[0052]La primera etapa de superposición y adición 210 se puede configurar para llevar a cabo una concatenación de conjuntos de periodos asociados con una pluralidad de subbandas de la señal de audio, que comprende una combinación ponderada del conjunto 128_1,1 de periodos (^¡(k)) asociados con la subbanda dada (<v>) de la señal de audio 102 con un conjunto 128_1,2 de periodos (?v,¡(k)) asociados con otra subbanda (<v>-1) de la señal de audio 102, para obtener un conjunto 124_1 de periodos asociados con un bloque 108_1 de muestras de la señal de audio 102.

[0053]Como se muestra en la figura 5, la etapa de transformada inversa críticamente muestreada traslapada en cascada 204 puede comprender una segunda etapa de transformada inversa críticamente muestreada traslapada (LCST) 212 configurada para llevar a cabo una transformada inversa críticamente muestreada traslapada en el conjunto 124_1 de periodos asociados con el bloque 108_1 de muestras de la señal de audio 102, para obtener un conjunto 206_1,1 de muestras asociadas con el bloque 108_1 de muestras de la señal de audio 102.

[0054]Además, la etapa de transformada inversa críticamente muestreada traslapada en cascada 204 puede comprender una segunda etapa de superposición y adición 214 configurada para superponer y añadir el conjunto<206_1,1 de muestras asociadas con el bloque 108_1 de muestras de la señal de audio 102 y otro conjunto>206<_>2,1<de muestras asociadas con otro bloque>108_2<de muestras de la señal de audio, superponiéndose el bloque 108_1>de muestra y el otro bloque 108_2 de muestras de la señal de audio 102 parcialmente, para obtener la señal de audio 102.

[0055]La figura 6 muestra un diagrama de bloques esquemático de un procesador de audio 200 para procesar una representación de subbanda de una señal de audio para obtener la señal de audio 102, según una realización adicional. En otras palabras, la figura 6 muestra un diagrama del banco de filtros de síntesis. Por lo tanto, se asumen funciones de ventana apropiadas. Se debe observar que por razones de simplicidad en la figura 6 (solamente) se indica el procesamiento de una primera mitad de una trama de subbanda (y[m], 0 <= m < N/2) (es decir, solo la primera línea de la ecuación (6)).

[0056]Como se describe anteriormente, el procesador de audio 200 comprende una etapa de reducción inversa de solapamiento en dominio de tiempo 202 y una etapa de transformada inversa críticamente muestreada traslapada en cascada 204 que comprende una primera etapa de transformada inversa críticamente muestreada traslapada 208 y una segunda etapa de transformada inversa críticamente muestreada traslapada 212.

[0057]La etapa de reducción inversa de solapamiento en dominio de tiempo 204 se configura para llevar a cabo una primera combinación ponderada y desplazada 220_1 de una primera y segunda representación de subbanda<de solapamiento reducido y>1,¡-1<[m>1<] y Y>1<,¡[m>1<] para obtener una primera representación de subbanda solapada 110_1,1 y>1<¡[m>1<], donde la representación de subbanda solapada es un conjunto de muestras de subbanda, y para llevar a cabo>una segunda combinación ponderada y desplazada 220_2 de una tercera y cuarta representación de subbanda de<solapamiento reducido y>2<,¡-i[mi] y y>2<,¡[m-i] para obtener una segunda representación de subbanda solapada 110_2,1 Y>2<,í[ith], donde la representación de subbanda solapada es un conjunto de muestras de subbanda.>

[0058]La primera etapa de transformada inversa críticamente muestreada traslapada 208 se configura para llevar a cabo una primera transformada inversa críticamente muestreada traslapada 222_1 en el primer conjunto de<muestras de subbanda 110_1,1 yu[m>1<] para obtener un conjunto 128>_<1,1 de periodos asociados con una subbanda dada de la señal de audio (?>1<,-i(k)), y para llevar a cabo una segunda transformada inversa críticamente muestreada traslapada 222_2 en el segundo conjunto de muestras de subbanda 110_2,1 y>2<,¡[m-i] para obtener un conjunto 128_2,1 de periodos asociados con una subbanda dada de la señal de audio (X>2<,>1<(k)).>

[0059]La segunda etapa de transformada inversa críticamente muestreada traslapada 212 se configura para llevar a cabo una transformada inversa críticamente muestreada traslapada en un conjunto superpuesto y añadido de<periodos obtenidos al traslapar y añadir los conjuntos de periodos>128<_>1 ,1<y 128_2,1 proporcionados por la primera>etapa de transformada inversa críticamente muestreada traslapada 208, para obtener el bloque de muestras 108_2.

[0060]Posteriormente, se describen las realizaciones de los procesadores de audio mostradas en las figuras 1 a 6, donde se asume de forma ejemplar que la etapa de transformada críticamente muestreada traslapada en cascada 104 es una etapa MDCT, es decir, la primera y segunda etapa de transformada críticamente muestreada traslapada 120 y 126 son etapas MDCT, y la etapa de transformada inversa críticamente muestreada traslapada en cascada 204 es una etapa m DcT en cascada inversa, es decir la primera y segunda etapas de transformada inversa críticamente muestreada traslapada 120 y 126 son etapas MDCT inversas. Naturalmente, la siguiente descripción es aplicable también a otras realizaciones de la etapa de transformada críticamente muestreada traslapada en cascada 104 y etapa de transformada inversa críticamente muestreada traslapada 204, tal como a una etapa MDST<o>MLT en cascada<o>una etapa MDST<o>MLT en cascada inversa.

[0061]Por lo tanto, las realizaciones descritas pueden funcionar en una secuencia de espectros MDCT de longitud limitada y utilizar MDCT y reducción de solapamiento en dominio de tiempo (TDAR) como la operación de combinación de subbandas. El banco de filtros no uniforme resultante se traslapa, es ortogonal y permite anchos de subbanda k=2n con neN. Debido a TDAR, se puede lograr una respuesta de impulso de subbanda tanto temporalmente como espectralmente más compacta.

[0062]Posteriormente, se describen realizaciones del banco de filtros.

[0063]La implementación de banco de filtros se basa directamente en esquemas comunes de transformada MD<c>T traslapada: la transformada original con superposición y formación de ventana permanece sin cambios.

[0064]Sin pérdida de generalidad la siguiente notación asume transformadas MDCT ortogonales, por ejemplo, donde las ventanas de análisis y síntesis son idénticas.

x¿(n)=x(n iM) 0 < n < 2M(1)

dondek(k,n,M)es la parte central de transformada MDCT yh(n)una ventana de análisis adecuada

K(k,n,M) = eos

[0065]La salida de esta transformadaX¿(k) se segmenta a continuación envsubbandas de anchos individualesNvy se transforma de nuevo utilizando MDCT. Esto resulta en un banco de filtros con superposición tanto en la dirección temporal como espectral.

[0066]Para notación más simple en esta invención se utiliza un factor de combinación común N para todas las subbandas, sin embargo, se puede utilizar cualquier conmutación/secuenciación válida de ventanas MDCT para implementar la resolución de tiempo-frecuencia deseada. Más acerca del diseño de resolución más adelante.

Xvi(k)=Xi(k vN) 0 < k < 2N(4)

donde w(k) es una ventana de análisis adecuada y generalmente difiere deh(n)en tamaño y puede diferir en tipo de ventana. Dado que algunas realizaciones aplican la ventana en el dominio de frecuencia, es digno de mención aunque se intercambian la selectividad de tiempo y frecuencia de la ventana.

[0067] Para la gestión apropiada de límites, se puede introducir un desplazamiento adicional de N/2 en la ecuación (4), combinado con mitades de ventana de inicio/detención rectangulares en los límites. De nuevo en aras de una notación más simple este desplazamiento no se ha tomado en cuenta en esta invención.

[0068] La salidayvi (m)es una lista devlongitudes individualesNvde coeficientes con anchos de banda correspondientesn —y una resolución temporal proporcional a ese ancho de banda.

[0069]Estos vectores, sin embargo, contienen solapamiento de la transformada MDCT original y en consecuencia muestran compactación inferior temporal. Para compensar este solapamiento se puede facilitar t Da R.

[0070]Las muestras utilizadas para TDAR se toman de los dos bloques de muestra de subbanda adyacentesven la trama MDCT actual y anterioriyi — 1.El resultado es solapamiento reducido en la segunda mitad de la trama anterior y la primera mitad de la segunda trama.

para0 < m < n /2con

[0071]L<os>coeficientes TDARav(m), bv(m), cv(m)ydv(m)se pueden diseñar para minimizar el solapamiento residual. Un procedimiento de estimación simple con base en la ventana de síntesis g(n) se introducirá más adelante.

[0072]También se señala que siAno es singular las operaciones (6) y (8) corresponden a un sistema biortogonal. Además, sig(n)=h(n)yv(k) =w(k),por ejemplo ambas MDCT son ortogonales, y la matrizAes ortogonal el flujo funcional total constituye una transformada ortogonal.

[0073]Para calcular la transformada inversa, se lleva a cabo la primera TDAR inversa.

seguida por la MDCT inversa y la cancelación de solapamiento en dominio de tiempo (TDAC, aunque la cancelación de solapamiento se hace a lo largo del eje de frecuencia aquí) se debe llevar a cabo para cancelar el solapamiento producido en la Ecuación 5.

X i (k v N ) = X l/,i (k)

[0074]Finalmente, la MDCT inicial en la Ecuación 2 se invierte y se lleva a cabo de nuevo TDAC.

Xi(n) = g(n+ M )£ ¿ _ i (nM )+g(n)xi (n)

(13)

x ( n+i M ) — X i ( n )(14)

[0075]Posteriormente, se describen limitaciones de diseño de resolución de tiempo-frecuencia. Aunque es posible cualquier resolución de tiempo-frecuencia deseada, algunas limitaciones para diseñar las funciones de ventana resultantes se deben adherir para asegurar la invertibilidad. En particular, las pendientes de dos subbandas adyacentes pueden ser simétricas de tal forma que la Ecuación (6) cumpla la condición de Princen Bradley [J. Princen, A. Johnson, y A. Bradley, “Subband/transform coding using filter bank designs based on time domain aliasing cancellation,” Actas de la Conferencia Internacional sobre Acústica, procesamiento de voz y señal (ICASSP) 1987, abril de 1987, voI. 12, pp. 2161-2164]. Se puede aplicar aquí el esquema de conmutación de ventanas como se introduce en [B. Edler, “Codierung von Audiosignalen mit überlappender Transformation und adaptiven Fensterfunktionen,” Frequenz, voI. 43, pp. 252-256, septiembre de 1989], originalmente diseñado para combatir efectos de pre-eco. Véase [Olivier Derrien, Thibaud Necciari, y Peter Balazs, “A quasi-orthogonal, invertible, and perceptually relevant time-frequency transform for audio coding,”, EUSIPCO, Nice, Francia, agosto de 2015].

[0076]En segundo lugar, la suma de todas las segundas longitudes de transformada MDCT debe sumar la longitud total de Ios coeficientes MDCT proporcionados. Las bandas se pueden elegir para no transformarse utilizando una ventana de etapa unitaria con ceros en Ios coeficientes deseados. Sin embargo, se deben cuidar las propiedades de simetría de las ventanas vecinas [B. Edler, “Codierung von Audiosignalen mit überlappender Transformation und adaptiven Fensterfunktionen,” Frequenz, voI. 43, pp. 252-256, septiembre de 1989]. La transformada resultante producirá ceros en estas bandas por lo que I<os>coeficientes originales se pueden utilizar directamente.

[0077]Como un factor de escala de resolución de tiempo-frecuencia posible se pueden utilizar directamente bandas de la mayoría de I<os>codificadores de audio modernos.

[0078]Posteriormente, se describe el cálculo de coeficientes de reducción de solapamiento en dominio de tiempo (TDAR).

[0079]Después de la resolución temporal anteriormente mencionada, cada muestra de subbanda corresponde aM/Nvmuestras originales,<o>un intervaloNvveces el tamaño del de una muestra original.

[0080]Además, la cantidad de solapamiento en cada muestra de subbanda depende de la cantidad de solapamiento en el intervalo que representa. A medida que se pondera el solapamiento con la ventana de análisish(n) utilizando un valor aproximado de la ventana de síntesis en cada intervalo de muestra de subbanda se asume que es una primera estimación buena para un coeficiente TDAR.

[0081]Experimentos han demostrado que dos esquemas de cálculo de coeficientes muy simples permiten buenos valores iniciales con compactación espectral y temporal mejorada. Ambos procedimientos se basan en una ventana de síntesis hipotéticagv(m)de longitud2Nv.

1) Para ventanas paramétricas como derivadas de Kaiser Bessel o seno se puede definir una ventana simple, más corta del mismo tipo.

2) Para ambas ventanas paramétricas y tabuladas sin ninguna representación cerrada la ventana se puede cortar simplemente en2Nvsecciones de igual tamaño, que permite que se obtengan coeficientes utilizando el valor medio de cada sección:

[0082] Teniendo en cuenta las condiciones límite MDCT y el reflejo de solapamiento esto produce entonces coeficientes TDAR.

av(m) = gv(N/2 m)(16)bv(m) = - g v(N/2 - 1 - m)(17)cv(m) =gv(3N/2 m)(18)dv(m) = gv(3N/2 - 1 - m)(19)

<o>en caso de una transformada ortogonal

av(m) = dv(m) = gv(N/2 m)(20)—bv(m) = cv(m) = ^1 - av(m)2(21)

[0083]Se preserva cualquier solución de aproximación por coeficientes que se elija, siempre y cuando A sea la reconstrucción perfecta no singular del banco de filtros completo. Una selección de coeficiente de otra forma subóptima solo afectará a la cantidad de solapamiento residual en la subbandayVi¡(m),sin embargo, no en la señalx(n) sintetizada por el banco de filtros inverso.

[0084]La figura 7 muestra en diagramas un ejemplo de muestras de subbanda (gráfico superior) y la dispersión de sus muestras a través del tiempo y frecuencia (gráfico inferior). La muestra anotada tiene ancho de banda más ancho pero una dispersión de tiempo más corta que las muestras inferiores. Las ventanas de análisis (gráfico inferior) tienen una resolución completa de un coeficiente por muestra de tiempo original. L<os>coeficientes TDAR por lo tanto se deben aproximar (anotar por un punto) para la región de tiempo de cada muestra de subbanda (m = 256 ::: 384).

[0085]Posteriormente, se describen resultados (simulación).

[0086]La figura 8 muestra la incertidumbre espectral y temporal obtenidas por varias transformadas diferentes, como se muestra en [Frederic Bimbot, Ewen Camberlein y Pierrick Philippe, “Adaptive filter banks using fixed size mdct and subband merging for audio coding-comparison with the mpeg aac filter banks,” Convención de la Audio Engineering Society 121, octubre de 2006].

[0087]Se puede ver que las transformadas basadas en matriz de Hadamard ofrecen capacidades de compensación de tiempo-frecuencia muy limitadas. Para hacer crecer los tamaños de combinación, la resolución temporal adicional tiene un coste desproporcionalmente alto en la incertidumbre espectral.

[0088]En otras palabras, la figura 8 muestra una comparación de compactación de energía espectral y temporal de diferentes transformadas. Las etiquetas en línea indican longitudes de trama para MDCT, factores de división para división de Heisenberg y factores de combinación para todos los demás.

[0089]La combinación de subbandas con TDAR tiene sin embargo una compensación lineal entre incertidumbre temporal y espectral, paralela a una MDCT simple, uniforme. El producto de dos es constante, aunque un poco más alto que la MDCT simple, uniforme. Para este análisis una ventana de análisis de seno y una ventana de combinación de subbandas derivada de Kaiser-Bessel mostraron los resultados más compactos y, por lo tanto, se eligieron.

[0090]Sin embargo, al utilizar TDAR para un factor de combinaciónNv = 2parece que disminuye tanto la compactación temporal como espectral. Se atribuye esto al esquema de cálculo de coeficientes introducido en la sección ll-B que es demasiado simplista y que no aproxima apropiadamente los valores para pendientes de función de ventana inclinadas. Se presentará un esquema de optimización numérico en una publicación siguiente.

[0091]Estos valores de compactación se calcularon utilizando el centro de gravedad cog y la longitud efectiva al cuadradoi fde la respuesta de impulsox[n],definida como [Athanasios Papoulis, Signal analysis, Eléctrica! and electronic engineering series. McGraw-Hill, Nueva York, San Francisco, Paris, 1977].

co g .-r =Eñ=i l*MlV;En=i l*MI2(22)

[0092]Se muestran Ios valores promedio de todas las respuestas de Impulso de cada banco de filtros Individual.

[0093]La figura 9 muestra una comparación de dos respuestas de impulso de ejemplo generadas por combinación de subbandas con y sin TDAR, bloques cortos MDCT simples y combinación de subbandas de matriz de Hadamard como se propone en [O.A. Niamut y R. Heusdens, “Flexible frequency decompositions for cosine-modulated filter banks,” Actas de la Conferencia Internacional sobre Acústica, procesamiento de<voz>y señal . (ICASSP 2003). Conferencia Internacional de la IEEE 2003, abril de 2003, voI.5, pp. V-449-52 voI.5].

[0094]La compactación inferior temporal de la transformada de combinación de matriz de Hadamard es claramente visible. También se puede ver claramente que la mayoría de las distorsiones de solapamiento en la subbanda se reducen significativamente por TDAR.

[0095]En otras palabras, la figura 9 muestra respuestas de impulso de ejemplo de un filtro de subbanda combinado que comprende 8 de 1024 periodos originales utilizando el procedimiento propuesto aquí sin TDAR, con TDAR, el procedimiento propuesto en [O.A. Niamut y R. Heusdens, “Subband merging in cosine-modulated filter banks,” Signal Processing Letters, IEEE, voI. 10, no. 4, pp. 111—114, abril de 2003] y utilizando una longitud de trama MDCT más corta de 256 muestras.

[0096]La figura 10 muestra un diagrama de flujo de un procedimiento 300 para procesar una señal de audio para obtener una representación de subbanda de la señal de audio. El procedimiento 300 comprende una etapa 302 para llevar a cabo una transformada críticamente muestreada traslapada en cascada en al menos dos bloques parcialmente superpuestos de muestras de la señal de audio, para obtener un conjunto de muestras de subbanda con base en un primer bloque de muestras de la señal de audio, y para obtener un conjunto correspondiente de muestras de subbanda con base en un segundo bloque de muestras de la señal de audio. Además, el procedimiento 300 comprende una etapa 304 para llevar a cabo una combinación ponderada de dos conjuntos correspondientes de muestras de subbanda, uno obtenido con base en el primer bloque de muestras de la señal de audio y uno obtenido con base en el segundo bloque de muestras de la señal de audio, para obtener una representación de subbanda de solapamiento reducido de la señal de audio.

[0097]La figura 11 muestra un diagrama de flujo de un procedimiento 400 para procesar una representación de subbanda de una señal de audio para obtener la señal de audio. El procedimiento 40<o>comprende una etapa 402 para llevar a cabo una combinación ponderada (y desplazada) de dos representaciones de subbanda de solapamiento reducido correspondientes (de diferentes bloques de muestras parcialmente superpuestas) de la señal de audio, para obtener una representación de subbanda solapada, donde la representación de subbanda solapada es un conjunto de muestras de subbanda. Además, el procedimiento 400 comprende una etapa 404 para llevar a cabo una transformada inversa críticamente muestreada traslapada en cascada en el conjunto de muestras de subbanda, para obtener un conjunto de muestras asociadas con un bloque de muestras de la señal de audio.

[0098]La figura 12 muestra un diagrama esquemático de un codificador de audio 150, que no forma parte de la invención. El codificador de audio 150 comprende un procesador de audio (100) como se describe anteriormente, un codificador 152 configurado para codificar la representación de subbanda de solapamiento reducido de la señal de audio, para obtener una representación de subbanda de solapamiento reducido codificada de la señal de audio, y un formador de flujo de bits 154 configurado para formar un flujo de bits 156 de la representación de subbanda de solapamiento reducido codificada de la señal de audio.

[0099]La figura 13 muestra un diagrama de bloques esquemático de un decodificador de audio 250, según una realización. El decodificador de audio 250 comprende un analizador de flujo de bits 252 configurado para analizar el flujo de bits 154, para obtener la representación de subbanda de solapamiento reducido codificada, un decodificador 254 configurado para decodificar la representación de subbanda de solapamiento reducido codificada, para obtener la representación de subbanda de solapamiento reducido de la señal de audio, y un procesador de audio 200 como se describe anteriormente.

[0100]La figura 14 muestra un diagrama de bloques esquemático de un analizador de audio 180, según una realización. El analizador de audio 180 comprende un procesador de audio 100 como se describe anteriormente, un extractor de información 182, configurado para analizar la representación de subbanda de solapamiento reducido, para proporcionar una información que describe la señal de audio.

[0101]Las realizaciones proporcionan reducción de solapamiento en dominio de tiempo (TDAR) en subbandas de bancos de filtros de transformada discreta de coseno modificada (MDCT) ortogonales no uniformes.

[0102]Las realizaciones añaden una etapa de post-procesamiento adicional al flujo funcional de transformada MDCT ampliamente utilizado, comprendiendo la etapa en sí únicamente otra transformada MDCT traslapada a lo largo del eje de frecuencia y reducción de solapamiento en dominio de tiempo (TDAR) a lo largo de cada eje de tiempo de subbanda, que permite extraer escalas de frecuencia arbitrarias del espectrograma MDCT con una compactación temporal mejorada de la respuesta de impulso, al mismo tiempo que no introduce ninguna redundancia adicional y solo un retardo de trama MDCT.

[0103]Aunque se han descrito algunos aspectos en el contexto de un aparato, es claro que estos aspectos representan también una descripción del procedimiento correspondiente, donde un bloque<o>dispositivo corresponde a una etapa de procedimiento o una característica de una etapa de procedimiento. De forma análoga, los aspectos descritos en el contexto de una etapa del procedimiento representan también una descripción de un bloque<o>elemento o característica correspondiente de un aparato correspondiente. Algunas o todas las etapas de procedimiento se pueden ejecutar por (o utilizando) un aparato de hardware, como por ejemplo, un microprocesador, un ordenador programable<o>un circuito electrónico. En algunas realizaciones, una<o>más de las etapas del procedimiento más importante se pueden ejecutar por tal aparato.

[0104]Dependiendo de ciertos requisitos de implementación, las realizaciones de la invención se pueden implementar en hardware o software. La implementación se puede llevar a cabo utilizando un medio de almacenamiento digital, por ejemplo un disco flexible, un DVD, un Blu-Ray, un CD, una ROM, una PROM, una EPROM, una EEPROM o una memoria flash, que tiene señales de control legibles electrónicamente almacenadas en el mismo, que cooperan (o son capaces de cooperar) con un sistema informático programable de tal forma que se lleve a cabo el procedimiento respectivo. Por lo tanto, el medio de almacenamiento digital puede ser legible por ordenador.

[0105]Algunas realizaciones según la invención comprenden un soporte de datos que tiene señales de control legibles electrónicamente, que son capaces de cooperar con un sistema informático programable, de tal forma que se lleve a cabo uno de los procedimientos descritos en esta invención.

[0106]En general, las realizaciones de la presente invención se pueden implementar como un producto de programa informático con un código de programa, siendo el código de programa operativo para llevar a cabo uno de los procedimientos cuando el producto de programa informático se ejecuta en un ordenador. El código de programa se puede almacenar por ejemplo en un soporte legible por máquina.

[0107]Otras realizaciones comprenden el programa informático para llevar a cabo uno de los procedimientos descritos en esta invención, almacenado en un soporte legible por máquina.

[0108]En otras palabras, una realización del procedimiento inventivo es, por lo tanto, un programa informático que tiene un código de programa para llevar a cabo uno de los procedimientos descritos en esta invención, cuando el programa informático se ejecuta en un ordenador.

[0109]Una realización adicional de los procedimientos inventivos es, por lo tanto, un soporte de datos (<o>medio de almacenamiento digital,<o>un medio legible por ordenador) que comprende, grabado en el mismo, el programa informático para llevar a cabo uno de los procedimientos descritos en esta invención. El soporte de datos, el medio de almacenamiento digital<o>el medio grabado son convencionalmente tangibles y/o no transitorios.

[0110]Una realización adicional del procedimiento inventivo es, por lo tanto, un flujo de datos<o>una secuencia de señales que representan el programa informático para llevar a cabo uno de los procedimientos descritos en esta invención. El flujo de datos<o>la secuencia de señales se pueden configurar por ejemplo para transferirse a través de una conexión de comunicación de datos, por ejemplo, a través de Internet.

[0111]Una realización adicional comprende un medio de procesamiento, por ejemplo un ordenador, o un dispositivo lógico programable, configurado o adaptado para llevar a cabo uno de los procedimientos descritos en esta invención.

[0112]Una realización adicional comprende un ordenador que tiene instalado en el mismo el programa informático para llevar a cabo uno de los procedimientos descritos en esta invención.

[0113]En algunas realizaciones, un dispositivo lógico programable (por ejemplo, una matriz de puertas programable en el campo) se puede utilizar para llevar algunas<o>todas las funcionalidades de los procedimientos descritos en esta invención. En algunas realizaciones, una matriz de puertas programable en el campo puede cooperar con un microprocesador a fin de llevar a cabo uno de los procedimientos descritos en esta invención. En general, los procedimientos se llevan a cabo de manera preferente por cualquier aparato de hardware.

[0114]El aparato descrito en esta invención se puede implementar utilizando un aparato de hardware, o utilizando un ordenador,<o>utilizando una combinación de un aparato de hardware y un ordenador.

[0115]El aparato descrito en esta invención, o cualquier componente del aparato descrito en esta invención, se puede implementar al menos parcialmente en hardware y/o en software.

[0116]Los procedimientos descritos en esta invención se pueden llevar a cabo utilizando un aparato de hardware, o utilizando un ordenador, o utilizando una combinación de un aparato de hardware y un ordenador.

[0117]Los procedimientos descritos en esta invención, o cualquier componente del aparato descrito en esta invención, se pueden llevar a cabo al menos parcialmente por hardware y/o por software.

[0118]Las realizaciones descritas anteriormente son simplemente ilustrativas para los principios de la presente invención. Se entiende que serán evidentes modificaciones y variaciones de las disposiciones y los detalles descritos en esta invención para otros expertos en la materia. Por lo tanto, se propone que se limiten solo por el alcance de las reivindicaciones de patente inminentes y no por los detalles específicos presentados a modo de descripción y explicación de las realizaciones de esta invención.

Claims

r e iv in d ic a c io n e s 1. Un procesador de audio (200) para procesar una representación de subbanda de una señal de audio para obtener la señal de audio (102), comprendiendo el procesador de audio (200): una etapa de reducción inversa de solapamiento en dominio de tiempo (202) configurada para llevar a cabo una combinación ponderada de una primera representación de subbanda de solapamiento reducido de la señal de audio (102) y una segunda representación de subbanda de solapamiento reducido de la señal de audio (102), para obtener una representación de subbanda solapada, donde la representación de subbanda solapada es un conjunto (110_1,1) de muestras de subbanda; y una etapa de transformada inversa críticamente muestreada traslapada en cascada (204) configurada para llevar a cabo una transformada inversa críticamente muestreada traslapada en cascada en el conjunto (110_1,1) de muestras de subbanda, para obtener un conjunto de muestras asociadas con un bloque de muestras de la señal de audio (102); donde la etapa de transformada inversa críticamente muestreada traslapada en cascada (204) comprende una primera etapa de transformada inversa críticamente muestreada traslapada (208) configurada para llevar a cabo una transformada inversa críticamente muestreada traslapada en el conjunto (110_1,1) de muestras de subbanda, para obtener un conjunto de periodos (128_1,1) asociados con una subbanda dada de la señal de audio; y una primera etapa de superposición y adición (210) configurada para llevar a cabo una concatenación de conjuntos de periodos asociados con una pluralidad de subbandas de la señal de audio, que comprende una combinación ponderada del conjunto (128_1,1) de periodos asociados con la subbanda dada de la señal de audio (102) con un conjunto (128_1,2) de periodos asociados con otra subbanda de la señal de audio (102), para obtener un conjunto (124_1) de periodos asociados con un bloque de muestras de la señal de audio (102).
2. El procesador de audio (200) según la reivindicación 1, donde la etapa de transformada inversa críticamente muestreada traslapada en cascada (204) comprende una segunda etapa de transformada inversa críticamente muestreada traslapada (212) configurada para llevar a cabo una transformada inversa críticamente muestreada traslapada en el conjunto (124_1) de periodos asociados con el bloque de muestras de la señal de audio (102), para obtener un conjunto de muestras asociadas con el bloque de muestras de la señal de audio (102).
3. El procesador de audio (200) según la reivindicación 2, donde la etapa de transformada inversa críticamente muestreada traslapada en cascada (204) comprende una segunda etapa de superposición y adición (214) configurada para superponer y añadir el conjunto de muestras asociadas con el bloque de muestras de la señal de audio (102) y otro conjunto de muestras asociadas con otro bloque de muestras de la señal de audio (102), superponiéndose el bloque de muestras y el otro bloque de muestras de la señal de audio (102) parcialmente, para obtener la señal de audio (102).
4. El procesador de audio (200) según cualquiera de las reivindicaciones 1 a 3, donde la etapa de reducción inversa de solapamiento en dominio de tiempo (202) se configura para llevar a cabo la combinación ponderada de la primera representación de subbanda de solapamiento reducido de la señal de audio (102) y la segunda representación de subbanda de solapamiento reducido de la señal de audio (102) con base en la siguiente ecuación

para0 < m < N / 2con K( m) d v ( m ) _ para obtener la representación de subbanda solapada, donde yv,i(m) es la primera representación de subbanda de solapamiento reducido de la señal de audio, yv,i-i(N-1-m) es la segunda representación de subbanda de solapamiento reducido de la señal de audio, yv,i(m) es un conjunto de muestras de subbanda con base en el segundo bloque de muestras de la señal de audio, yv,i-i(N-1-m) es un conjunto de muestras de subbanda con base en el primer bloque de muestras de la señal de audio, y av(m), bv(m), Cv(m) y dv(m) son coeficientes de reducción de solapamiento en dominios de tiempo.
5. Un decodificador de audio, que comprende: un analizador de flujo de bits configurado para analizar el flujo de bits, para obtener la representación de subbanda de solapamiento reducido codificada; un decodificador configurado para decodificar la representación de subbanda de solapamiento reducido codificada, para obtener la representación de subbanda de solapamiento reducido de la señal de audio; y un procesador de audio (200) según cualquiera de las reivindicaciones 1 a 4.
6. Un procedimiento implementado por ordenador (400) para procesar una representación de subbanda de una señal de audio, para obtener la señal de audio, comprendiendo el procedimiento: la realización (402) de una combinación ponderada de una primera representación de subbanda de solapamiento reducido de la señal de audio y una segunda representación de subbanda de solapamiento reducido de la señal de audio, para obtener una representación de subbanda solapada, donde la representación de subbanda solapada es un conjunto de muestras de subbanda; y la realización (404) de una transformada inversa críticamente muestreada traslapada en cascada en el conjunto de muestras de subbanda, para obtener un conjunto de muestras asociadas con un bloque de muestras de la señal de audio; donde la realización (404) de la transformada inversa críticamente muestreada traslapada en cascada comprende llevar a cabo una transformada inversa críticamente muestreada traslapada en el conjunto (110_1,1) de muestras de subbanda, para obtener un conjunto de periodos (128_1,1) asociados con una subbanda dada de la señal de audio; y donde la realización (404) de la transformada inversa críticamente muestreada traslapada en cascada comprende llevar a cabo una concatenación de conjuntos de periodos asociados con una pluralidad de subbandas de la señal de audio, que comprende una combinación ponderada del conjunto (128_1,1) de periodos asociados con la subbanda dada de la señal de audio (102) con un conjunto (128_1,2) de periodos asociados con otra subbanda de la señal de audio (102), para obtener un conjunto (124_1) de periodos asociados con un bloque de muestras de la señal de audio (102).
7. Un programa informático que comprende instrucciones que, cuando el programa es ejecutado por un ordenador, ejecutan las etapas de un procedimiento según la reivindicación 6.