MXPA06008474A - Tecnicas de codificacion mejoradas que utilizan magnitud y fase espectrales estimadas derivadas a partir de coeficientes de mdct - Google Patents

Tecnicas de codificacion mejoradas que utilizan magnitud y fase espectrales estimadas derivadas a partir de coeficientes de mdct

Info

Publication number
MXPA06008474A
MXPA06008474A MXPA/A/2006/008474A MXPA06008474A MXPA06008474A MX PA06008474 A MXPA06008474 A MX PA06008474A MX PA06008474 A MXPA06008474 A MX PA06008474A MX PA06008474 A MXPA06008474 A MX PA06008474A
Authority
MX
Mexico
Prior art keywords
spectral components
spectral
components
source signal
transform coefficients
Prior art date
Application number
MXPA/A/2006/008474A
Other languages
English (en)
Inventor
Michael J Smithers
Corey I Cheng
David N Lathrop
Original Assignee
Dolby Laboratories Licensing Corporation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby Laboratories Licensing Corporation filed Critical Dolby Laboratories Licensing Corporation
Publication of MXPA06008474A publication Critical patent/MXPA06008474A/es

Links

Abstract

Las estimaciones de magnitud y fase espectral se obtienen por medio de un proceso de estimación que utiliza información espectral de bancos de filtros de análisis tal como la Transformada Discreta de Coseno Modificada. El proceso de estimación puede implementarse por medio de operaciones similares a una convolución con respuestas a impulsos. Las porciones de las respuestas a impulsos pueden seleccionarse para el uso en las operaciones similares a una convolución para el intercambio entre la complejidad computacional y la precisión de la estimación. Se describen derivaciones matemáticas de expresiones analíticas para estructuras de filtros y respuestas a impulsos. La figura más representativa de la invención es la número 3.

Description

FR, GB, GR, HU, IE, IS, IT, LT, LU, MC, NL, PL, PT, RO, For two-letter codes and other abbrevialiotis, refer to the "Guid- SE, SI, SK, TR), OAPI (BF, BJ, CF, CG, Cl, CM, GA, GN, anee Notes GQ, GW, ML, MR, NE, SN, TD, TG). nmg ofeach regular issue ofthe PCT Gazette. Published: TÉCNICAS DE CODIFICACIÓN MEJORADAS QUE UTILIZAN MAGNITUD Y FASE ESPECTRALES ESTIMADAS DERIVADAS ,A PARTIR DE COEFICIENTES DE MDCT CAMPO TÉCNICO La presente invención proporciona un proceso eficiente para estimar de manera precisa la magnitud y fase espectrales de información espectral obtenida de varios tipos de bancos de filtros de análisis que incluyen aquellos implementados por las Transformadas Discretas de Coseno Modificadas y las Transformadas .Discretas de Seno Modificadas. Estas estimaciones precisas se pueden utilizar en varias aplicaciones de procesamiento de señales tales como la codificación de audio y la codificación de video. En la siguiente descripción se hace mención más particular de aplicaciones para la codificación de audio que utilizan bancos de filtros implementados por una Transformada Discreta de Coseno Modificada particular; sin embargo, la presente invención también es aplicable a otras aplicaciones y otras implementaciones de bancos de filtros .
TÉCNICA ANTERIOR Muchas aplicaciones de codificación intentan reducir la cantidad de información requerida para representar de manera adecuada una señal fuente . Al reducir los requerimientos de capacidad de información, una representación de señal puede ser transmitida sobre canales que tienen un ancho de banda inferior o puede ser almacenada en medios que utilizan menos espacio. La codificación puede reducir los requerimientos de capacidad de información de una señal fuente al eliminar ya sea los componentes redundantes o los componentes irrelevantes en la señal. De esta manera, los llamados métodos y sistemas de codificación perceptual utilizan frecuentemente bancos de filtros para reducir la redundancia al decorrelacionar una señal fuente utilizando un conjunto base de componentes espectrales y reducir la irrelevancia por medio de la cuantificación adaptable de los componentes espectrales de acuerdo con criterios psico-perceptuales . Un proceso de codificación que adapta la resolución de cuantificación más ordinariamente puede reducir los requerimientos de información a un grado mayor pero también introduce niveles más altos de error de cuantificación o "ruido de cuantificación" en la señal. Los sistemas de codificación perceptual intentan controlar el nivel de ruido de cuantificación de manera que el ruido es "enmascarado" o se vuelve imperceptible por otro contenido espectral de la señal. Estos sistemas utilizan típicamente modelos perceptuales para predecir los niveles de ruido de cuantificación que puede ser enmascarado por una señal dada.
En los sistemas de codificación de audio perceptual, por ejemplo, el ruido de cuantificación es controlado frecuentemente al adaptar las resoluciones de cuantificación de acuerdo con predicciones de audibilidad obtenidas de modelos perceptuales basados en estudios psicoacústicos tal como aquel descrito en E. Zwic er, Psychoacoustics , 1981. Un ejemplo de un modelo perceptual que predice la audibilidad de componentes espectrales en una señal se describe en M. Schroedér y colaboradores; "Optimizing Digital Speech Coders by Exploiting Masking Properties of the Human Ear", J. Acoust. Soc. Am. , Diciembre de 1979, páginas 1647-1652. Los componentes espectrales que se considera que son irrelevantes debido a que se predice que son imperceptibles no necesitan incluirse en la señal codificada. Otros componentes espectrales que se considera que son relevantes pueden ser cuantificados utilizando una resolución de cuantificación que está adaptada para ser suficientemente fina para asegurar que el ruido de cuantificación se vuelva solo imperceptible por otros componentes espectrales en la señal fuente . Las predicciones precisas de perceptibilidad por un modelo perceptual permiten que un sistema de codificación perceptual adapte más óptimamente ía- resolución de cuantificación, dando por resultado menos artefactos audibles . Un sistema de codificación que utiliza modelos conocidos para proporcionar predicciones imprecisas de perceptibilidad no pueden asegurar de manera confiable que el ruido de cuantificación se vuelva imperceptible a menos que se utilice una resolución de cuantificación más fina que sería requerida de otra manera si estuviera disponible una predicción más precisa. Muchos modelos perceptuales tal como aquel descrito por Schroeder y colaboradores, se basan en la magnitud de componentes espectrales; por lo tanto, las predicciones precisas por estos modelos dependen de medidas precisas de la magnitud de componentes espectrales. Las medidas precisas de la magnitud de componentes espectrales también influyen en el desempeño de otros tipos de procesos de codificación además de la cuantificación. En dos tipos de procesos de codificación conocidos 'como regeneración espectral y acoplamiento, un codificador reduce los requerimientos de información de señales fuente al excluir los componentes espectrales, seleccionados de una representación codificada de las señales fuente y un decodificador sintetiza substitutos para los componentes espectrales faltantes. En la regeneración espectral, el codificador genera una representación de una porción de banda base de una señal fuente que excluye otras porciones del espectro. El decodificador sintetiza las porciones faltantes del espectro utilizando la porción de banda base y la información secundaria que lleva alguna medida de nivel espectral para las porciones faltantes y combina las dos porciones para obtener una repetición imperfecta de la señal fuente original. Un ejemplo de un sistema de codificación de audio que utiliza la regeneración espectral se describe en la Solicitud de Patente Internacional No. PCT/US03/08895 presentada el 21 de Marzo de 2003, número de publicación WO 03/083034 publicada el 9 de Octubre de 2003. En el acoplamiento, el codificador genera una representación compuesta de componentes espectrales para múltiples canales de señales fuente y el decodificador sintetiza los componentes espectrales para múltiples canales utilizando la representación compuesta y la información secundaria que lleva alguna medida del nivel espectral para cada canal de señal fuente. Un ejemplo de un sistema de codificación de audio que utiliza el acoplamiento se describe en el documento Advanced Televisión Systems Committee (ATSC) A/52A titulado "Revisión A to Digital Audio Compression (AC-3) Standard" publicada el 20 de Agosto de 2001. El desempeño de estos sistemas de codificación puede mejorarse si el decodificador es capaz de sintetizar los componentes espectrales que conservan las magnitudes de los componentes espectrales correspondientes en las señales fuente originales. El desempeño del acoplamiento también puede mejorarse si están disponibles las medidas precisas de fase de manera que las distorsiones causadas por el acoplamiento ' de las señales fuera de fase puedan ser evitadas o compensadas . Desafortunadamente, algunos sistemas de codificación utilizan tipos particulares de bancos de filtros para derivar una expresión de componentes espectrales que hacen difícil obtener medidas precisas de la magnitud o fase de componentes espectrales . Dos tipos comunes de sistemas de codificación son referidos como codificación de sub-bandas y codificación de transformada. Los bancos de filtros en los sistemas de codificación tanto de sub-bandas como de transformadas pueden ser implementados por una variedad de técnicas de procesamiento de señales que incluyen varias transformadas de dominio temporal a dominio frecuencial. Véase J. Tribolet y colaboradores, "Frequency Domain Coding of Speech", IEEE Trans. Acoust., Speech, and Signal Proc., ASSP-27, Octubre de 1979, páginas 512-530. Algunas transformadas tales como la Transformada Discreta de Fourier (DFT, por sus siglas en inglés) o su implementación eficiente, la Transformada de Fourier Rápida (FFT, por sus siglas en inglés) , proporcionan un conjunto de componentes espectrales o coeficientes de transformada a partir de los cuales se pueden calcular fácilmente la magnitud y fase de componentes espectrales. Los componentes espectrales de la DFT, por ejemplo, son representaciones multidimensionales de una señal fuente. Específicamente, la DFT, la cual puede utilizarse en aplicaciones de codificación de audio y de codificación de video, proporciona un conjunto de coeficientes de valor complejo cuyas partes reales e imaginarias pueden ser expresadas como coordenadas en un espacio bidimensional. La magnitud de cada componente espectral proporcionada por esta transformada puede obtenerse fácilmente a partir de cada coordenada de componente en el espacio multidimensional utilizando cálculos bien conocidos. Sin embargo, algunas transformadas tal como la Transformada Discreta de Coseno proporcionan componentes espectrales que hacen difícil obtener una medida precisa de la magnitud o fase de componentes espectrales . Los componentes espectrales de la DCT, por ejemplo, representan el componente espectral de una señal fuente en únicamente un sub-espacio del espacio multidimensional requerido para llevar de manera precisa la magnitud y fase espectral. En las aplicaciones típicas de codificación de audio y de codificación de video, por ejemplo, una DCT proporciona un conjunto de componentes espectrales de valor real o coeficientes de transformada que son expresados en un sub- espacio dimensional del espacio real/imaginario bidimensional que se mencionó anteriormente . La magnitud de cada componente espectral proporcionado por transformadas como la DCT no puede obtenerse fácilmente a partir de cada coordenada de componente en el sub-espacio relevante. Esta característica de la DCT es compartida por una Transformada Discreta de Coseno Modificada particular (MDCT, por sus siglas en inglés) , la cual es descrita en J. Princen y colaboradores, "Subband/Transform Coding Using Filter Bank Designs Based on Time Domain Aliasing Cancellation" , ICASSP 1987 Conf . Proc., Mayo de 1987, páginas 2161-64. La MDCT y. su Transformada Discreta de Coseno Modificada Inversa Complementaria (IMDCT, por sus siglas en inglés) se han utilizado ampliamente en muchos sistemas de codificación debido a que permiten la implementación de un sistema de bancos de filtros de análisis/síntesis críticamente muestreado que proporciona una reconstrucción perfecta de segmentos traslapados de una señal fuente. La reconstrucción perfecta se refiere a la propiedad de un par de bancos de filtros de análisis/síntesis para reconstruir perfectamente una señal fuente en ausencia de errores causados por la aritmética de precisión finita. El muestreo crítico se refiere a la propiedad de un banco de filtros de análisis para generar una variedad de componentes espectrales que no son más grandes que el número de muestras utilizadas para llevar la señal fuente . Estas propiedades son muy atractivas en muchas aplicaciones de codificación debido a que el muestreo crítico reduce el número de componentes espectrales que deben codificarse y deben ser llevados en una señal codificada. El concepto de muestreo crítico merece algún comentario. Aunque la DFT o la DCT, por ejemplo, generan un componente espectral para cada muestra en un segmento de señal fuente, los sistemas para el análisis/síntesis de DFT y DCT en muchas aplicaciones de codificación no proporcionan un muestreo crítico debido a que la transformada de análisis se aplica a una secuencia de segmentos de señal traslapados . El traslapo permite el uso de funciones de ventana en forma no rectangular que mejoran las características de respuesta frecuencial de bancos de filtros de análisis y elimina los artefactos de bloqueo; sin embargo, el traslapo también impide la reconstrucción perfecta con el muestreo crítico debido a que el banco de filtros de análisis debe generar más valores de coeficiente que el número de muestras de señal fuente . Esta pérdida de muestreo crítico incrementa los requerimientos de información de la señal codificada. Como se mencionó anteriormente, los bancos de filtros implementados por la MDCT y la IMDCT son atractivos en muchos sistemas de codificación debido a que proporcionan la reconstrucción .perfecta de segmentos traslapados de una señal fuente con muestreo crítico. Desafortunadamente, estos bancos de filtros son similares a la DCT ' debido a - que los componentes espectrales de la MDCT representan el componente espectral de una señal fuente en solo un sub-espacio del espacio multidimensional requerido para llevar de manera precisa la magnitud y fase espectral. Las medidas precisas de la magnitud o fase espectral no pueden obtenerse fácilmente a partir de componentes espectrales o coeficientes de transformada generados por la MDCT; por lo tanto, el desempeño de codificación de muchos sistemas que utilizan el banco de filtros de MDCT es sub-óptimo debido a que la "precisión de predicción de los modelos perceptuales es degradada y la conservación de magnitudes de componentes espectrales por medio de los procesos de sintetización se degrada. Los intentos anteriores por evitar esta deficiencia de varios bancos de filtros como los bancos de filtros de MDCT y DCT no han sido satisfactorios por una variedad de razones. Una técnica se describe en "ISO/IEC 11172-3: 1993 (E) Coding of Moving Pictures and Associated Audio for Digital Storage Media at Up to About 1.5 Mbit/s, "ISO/IEC JTC1/SC29/WG11, Part III Audio. De acuerdo con esta técnica, un conjunto de bancos de filtros que incluyen varios bancos de filtros basados en MDCT se utiliza para generar componentes espectrales para la codificación y un banco de filtros basado en FFT adicional se utiliza para derivar medidas precisas de la magnitud de componentes espectrales . Esta técnica no es atractiva por al menos dos razones: , (1) se requieren recursos computacionales considerables en el codificador para implementar el banco de filtros de FFT adicional que es necesario para derivar las medidas de magnitud, y (2) el procesamiento para obtener medidas precisas . de magnitud se realiza en el codificador; por lo tanto, un ancho de banda adicional es requerido por la señal codificada para llevar estas medidas de magnitud de componentes espectrales al decodificador. Otra técnica evita incurrir en cualquier ancho de banda adicional requerido para llevar medidas de magnitud de componentes espectrales al calcular estas medidas en el decodificador. Esto se realiza al aplicar un banco de filtros de síntesis a los componentes espectrales decodificados para- recuperar una repetición de la señal fuente, al aplicar un banco de filtros de análisis a la señal recuperada para obtener un segundo conjunto de componentes espectrales por cuadruplicado con los componentes espectrales decodificados y al calcular la magnitud de componentes espectrales de los dos conjuntos de componentes espectrales. Esta técnica tampoco es atractiva debido a que se requieren recursos computacionales considerables en el decodificador para implementar el banco de filtros de análisis que es necesario para obtener el segundo conjunto de componentes espectrales. Todavía otra técnica descrita en S. Merdjani y colaboradores, "Direct Estimation of Frequency From MCT-Encoded Files", ' Proc. of the 6th Int. Conf . on Digital Audio Effects (DAFx-03) , Londres, Septiembre de 2003, estima la frecuencia, magnitud y fase de una señal fuente sinusoidal de un "espectro regularizado" derivado de coeficientes de MDCT. Esta técnica supera las desventajas mencionadas anteriormente pero tampoco es satisfactoria para aplicaciones de codificación típicas debido a que es aplicable únicamente para una señal fuente muy simple que tiene solo un sinusoide. Otra técnica, la cual es descrita en la Solicitud de Patente Norteamericana No. 09/948,053, número de publicación US 2003/0093282 Al publicada el 15 de Mayo de 2003, es capaz de derivar coeficientes de DFT a partir de coeficientes de MDCT; sin embargo, la técnica descrita no obtiene medidas de magnitud o fase para componentes espectrales representados por los coeficientes de MDCT mismos. Además, la técnica descrita no utiliza medidas de magnitud o fase para adaptar procesos para la codificación o decodificación de información que represente los coeficientes de MDCT. Lo que se necesita es una técnica que proporcione estimaciones precisas de la magnitud o fase de componentes espectrales generados por medio de bancos de filtros- de análisis tal como • la MDCT que también evite o supere deficiencias de técnicas conocidas.
DESCRIPCIÓN DE LA INVENCIÓN La presente invención supera las deficiencias de la técnica anterior al recibir los primeros componentes espectrales que fueron generados por la aplicación de un banco de filtros de análisis a una señal fuente que lleva contenido destinado para la percepción humana, derivar uno o más de los primeros componentes intermedios a partir de al menos algunos de los primeros componentes espectrales, formar una combinación de uno o más de los primeros componentes intermedios de acuerdo con al menos una porción de una o más respuestas a impulsos para obtener uno o más de los segundos componentes intermedios, derivar los segundos componentes espectrales de uno o más de los segundos componentes intermedios, obtener medidas estimadas de magnitud o fase utilizando los primeros componentes espectrales y los segundos componentes espectrales y aplicar un proceso adaptable a los primeros componentes espectrales para generar la información procesada. El proceso adaptable se adapta en respuesta a las medidas estimadas de magnitud o fase. Las diversas características de la presente invención y sus modalidades preferidas pueden entenderse mejor por referencia a la siguiente descripción y los dibujos anexos en los cuales los números de referencia iguales se refieren a elementos iguales en las diversas figuras. Los contenidos de la siguiente descripción y los dibujos se exponen como ejemplos únicamente y no debe entenderse que representan limitaciones al alcance de la presente invención.
BREVE DESCRIPCIÓN DE LOS DIBUJOS La Figura 1 es un diagrama de bloques esquemático de un transmisor utilizado en un sistema de codificación. La Figura 2 es un diagrama de bloques esquemático de un receptor utilizado en un sistema de codificación. La Figura 3 es un diagrama de bloques esquemático de un dispositivo que obtiene medidas de magnitud" o fase de componentes espectrales de acuerdo con varios aspectos de la presente invención. La Figura 4 es un diagrama de bloques esquemático de un transmisor que incorpora varios aspectos de la presente invención.
La Figura 5 es un diagrama de bloques esquemático de un receptor que incorpora varios aspectos de la presente invención. Las •. Figuras 6-8 son ilustraciones gráficas de respuestas a impulsos que pueden utilizarse con las implementaciones ejemplares de la presente invención. La Figura 9 es un diagrama de bloques esquemático de un dispositivo que puede utilizarse para mejorar varios aspectos de la presente invención.
MODOS PARA LLEVAR A CABO LA INVENCIÓN A. Introducción La presente invención permite la obtención de medidas precisas de magnitud o fase a partir de componentes espectrales generados por medio de bancos de filtros de análisis tal como la Transformada Discreta de - Coseno Modificada (MDCT) mencionada anteriormente. Varios aspectos de la presente invención pueden utilizarse en una variedad de aplicaciones que incluyen la codificación de audio y video. Las Figuras 1 y 2 ilustran diagramas de bloques esquemáticos de un transmisor y un receptor, respectivamente, en un sistema de codificación que puede incorporar varios aspectos de la presente invención. Las características del transmisor y receptor ilustrados se describen brevemente en las siguientes secciones. Después de esta descripción, se describen las características de algunos bancos de filtros de análisis y síntesis que son pertinentes para calcular medidas de magnitud o fase. 1. Transmisor El transmisor ilustrado en la Figura 1 aplica el banco de filtros de análisis 3 a una señal fuente recibida de la trayectoria 1 para generar componentes espectrales que representan el contenido espectral de la señal fuente, aplica el codificador 5 a los componentes espectrales para generar información codificada y aplica el formateador 8 a la información codificada para generar una señal de salida que es adecuada para la transmisión a lo largo de la trayectoria 9. La señal de salida puede suministrarse inmediatamente a un receptor anexo o puede grabarse para el suministro subsecuente. El banco de filtros de análisis 3 puede ser implementado de una variedad de formas que incluyen filtros de respuesta a impulsos infinitos (IIR, por sus siglas en inglés) , filtros de respuesta a impulsos finitos (FIR, por sus siglas en inglés) , filtros reticulares y transformadas de ondas pequeñas. Los aspectos de la presente invención se describen a continuación con referencia a implementaciones relacionadas estrechamente con la MDCT, sin embargo, la presente invención no está limitada a esas implementaciones particulares.
En esta descripción, los términos como "codificador" y "codificación" no se proponen para sugerir algún tipo particular de procesamiento de información. Por ejemplo, la codificación se utiliza frecuentemente para reducir los requerimientos de capacidad de información; sin embargo, estos términos en la descripción no se refieren necesariamente a este tipo de procesamiento. El codificador 5 puede realizar esencialmente cualquier tipo de procesamiento que se desee. En una implementación, la información codificada se genera al cuantificar los componentes espectrales de acuerdo con un modelo perceptual. En otra implementación, el codificador 5 aplica un proceso de acoplamiento a múltiples canales de componentes espectrales para generar una representación compuesta. En todavía otra implementación, los componentes espectrales para una porción de un ancho de banda de señal son descartados y una estimación de la envoltura espectral de la porción descartada se incluye en la información codificada. El tipo particular de codificación no es importante para la presente invención. 2. Receptor El receptor ilustrado en - la Figura 2 aplica el desformateador 23 a una señal de entrada recibida de la trayectoria 21 para obtener información codificada, aplica el decodificador 25 a la información codificada para obtener componentes espectrales que representan el contenido espectral de una señal fuente y aplica el banco de filtros de síntesis 27 a los componentes espectrales para generar una señal de salida que es una repetición de la señal fuente pero que no puede ser una repetición exacta. El banco de filtros de síntesis 27 puede implementarse en una variedad de formas que son complementarias para la implementación del banco de filtros de análisis 3. En esta descripción, los términos como "decodificador" y "decodificación" no se proponen para sugerir algún tipo particular de procesamiento de información. El decodificador 25 puede realizar esencialmente cualquier tipo de procesamiento que sea necesario o que se desee. En una implementación que es inversa a un proceso de codificación descrito anteriormente, los componentes espectrales cuantificados son decodificados en componentes espectrales descuantificados . En otra implementación, los múltiples canales de componentes espectrales son sintetizados de una representación compuesta de componentes espectrales . En todavía otra implementación, el decodificador 25 sintetiza las porciones faltantes de un ancho de banda de señal de la información de envoltura espectral . El tipo particular de decodificación no es importante para la presente invención. 3. Medidas de Magnitud y Fase En una implementación por una Transformada Discreta de Fourier Impar (ODFT, por sus siglas en inglés) , el banco de filtros de análisis 3 genera coeficientes de valor complejo o "componentes espectrales" con partes reales e imaginarias que pueden expresarse en un espacio bidimensional . Esta transformada puede expresarse como : la cual puede separarse, en partes reales e imaginarias X?DFr(k) = XODFt(k)]+ j • XODFt(k)] (2) y puede reescribirse como X?DFt(k) donde X0DFt (k) = coeficiente de ODFT para el componente espectral k; x (n) = amplitud de señal fuente en tiempo n; Re [X] = parte real de X; e Im [X] = parte imaginaria de X. La magnitud y fase de cada componente espectral k puede calcularse .como sigue: Mag[XODFr(k)] = jMXoDFt(k)Y + hfc8PT(k)T (4) l [X0DFT(k)] F s[XODFT (k)] = arctan (5) MxoDFt(k)] donde Mag [X] = magnitud de X; y Phs [X] = fase de X. Muchas aplicaciones de codificación implementan el banco de filtros de análisis 3 al aplicar la Transformada Discreta de Coseno Modificada (MDCT) descrita anteriormente para traslapar segmentos de la señal fuente que son modulados por una función de ventana para el análisis. Esta transformada puede ser expresada como: (6) donde Xmct (k) = coeficiente de MDCT para el componente espectral k. Se puede observar que los componentes espectrales que son generados por la MDCT son equivalentes a la parte real de los coeficientes de ODFT.
MX?DFt(k)] (7) Una Transformada Discreta de Seno Modificada particular (MDST) que genera coeficientes que representan componentes espectrales por cuadruplicado con los componentes espectrales representados por los coeficientes de la MDCT puede expresarse como : N-l ^?/osr(^)=??(«)-sin — k + — («+«„) (8) n=0 N 2)V 0 J donde XMost ( ) = coeficiente de MDST para el componente espectral J. Se puede observar que los componentes espectrales que son generados por la MDST son equivalentes a la parte imaginaria negativa de los coeficientes de ODFT.
Las medidas precisas de magnitud y fase no pueden calcularse directamente a partir de los coeficientes de MDCT pero pueden calcularse directamente a "partir de una combinación de coeficientes de MDCT y MDST, los cuales pueden observarse al sustituir las ecuaciones 7 y 9 en las ecuaciones 4 y 5: Mag[X0DFT(k)] = t¡XlDCT(k)+ XM2DSr(k) (10) Ths[X0DFT(k)]= arct ~ "ff (11) L -X- MDCG ?-) . El documento de Princen mencionado anteriormente indica que un uso correcto de la MDCT requiere la aplicación de una función de ventana para el análisis que satisfaga ciertos criterios de diseño. Las expresiones de ecuaciones de transformada en esta sección de la descripción omiten una referencia explícita a cualquier función de ventana para el análisis, lo cual implica una función de ventana para el análisis rectangular que no satisface estos criterios. Esto no afecta la validez de las expresiones 10 y 11. Las implementaciones de la presente invención descritas a continuación obtienen medidas de magnitud y fase de componentes espectrales a partir de los coeficientes de MDCT y a partir de los coeficientes de MDST derivados de los coeficientes de MDCT. Estas implementaciones se describen a continuación después de una descripción de la base matemática fundamental . B. Derivación de la Estructura Matemática Esta sección describe la derivación de una expresión analítica para calcular los coeficientes de MDST exactos a partir de los coeficientes de MDCT . Esta expresión se muestra a continuación en las ecuaciones 41a y 41b. También se describen las derivaciones de expresiones analíticas más simples para dos funciones de ventana específicas. Las consideraciones para implementaciones prácticas se presentan después de una descripción de las derivaciones . Una implementación de la presente invención descrita posteriormente es derivada a partir de un proceso para calcular los coeficientes MDST exactos a partir de los coeficientes de MDCT. Este proceso es equivalente a otro proceso que aplica un banco de filtros de síntesis de Transformada Discreta de Coseno Modificada Inversa (IMDCT) a bloques de coeficientes de MDCT para generar segmentos en forma de ventana de muestras de dominio temporal, agrega traslapo a los segmentos en forma de ventana de muestras para reconstruir una repetición de la señal fuente original y aplica un banco de filtros de análisis de MDST a un segmento de la señal " recuperada para generar los coeficientes de MDST. 1. Función de Ventana Arbitraria ' 5 Los coeficientes de MDST exactos no pueden calcularse a partir de un segmento individual de muestras en forma de ventana que es recuperado al aplicar el banco de filtros de síntesis de IMDCT a un bloque individual de coeficientes de MDCT debido a que el segmento es modulado por una función de ventana para el análisis y debido a que las muestras recuperadas contienen una distorsión de dominio temporal . Los coeficientes de MDST exactos pueden calcularse únicamente con el conocimiento adicional de los coeficientes de MDCT para los segmentos anteriores y subsecuentes. Por ejemplo, en el caso donde los segmentos son traslapados entre sí por la mitad de la longitud de los segmentos, los efectos de ventana y la distorsión de dominio temporal para un segmento dado II pueden cancelarse al aplicar el banco de filtros de síntesis y la función de ventana para la síntesis asociada a tres bloques de coeficientes de MDCT que representan tres segmentos traslapados, consecutivos de la señal fuente, representados como segmento I, segmento II y segmento III. Cada segmento traslapa un segmento adyacente por una cantidad igual a la mitad de la longitud del segmento. Los efectos de ventana y distorsión de dominio temporal en la primera mitad del segmento II son cancelados por una adición de traslapo con la segunda mitad del segmento I y estos efectos en la segunda mitad del segmento II son cancelados por una adición de traslapo con la primera mitad del segmento III. La expresión que calcula los coeficientes de MDST a partir de los coeficientes de MDCT depende de una variedad de segmentos de la señal fuente, la estructura y longitud de traslapo de estos segmentos y la selección de las funciones de ventana para el análisis y síntesis. Ninguna de estas características es importante en principio para la presente invención. Sin embargo, con el propósito de facilitar la ilustración se da por hecho en los ejemplos descritos posteriormente que los tres segmentos tienen la misma longitud N, la cual es uniforme, y se traslapan entre sí en una cantidad igual a la mitad de la longitud del segmento, que las funciones de ventana para el análisis y síntesis son idénticas entre sí, que las mismas funciones de ventana se aplican a todos los segmentos de la señal fuente y que las funciones de ventana son tales que sus propiedades de adición de traslapo satisfacen el siguiente criterio, el cual es requerido para la reconstrucción perfecta de la señal fuente como se explica en el documento de Princen. ww((rr?)2 ++ ww((rr ++—)2 =1 para r e 2 af-, donde w(r) = función de ventana para el análisis y síntesis; y N = longitud de cada segmento de señal fuente . Los coeficientes de MDCT Xi para la señal fuente x(n) en cada uno de los segmentos i pueden expresarse como: XiíP) = ?, (n tn) s( k~N (p+ -)(n + n0)) (12) p=0 N-l Xp(p) = ? nWn+ ?)8 {p+ l)(n + no)) ^ N-l Xn?{p) = ^ «(nJ + JVjcoBétp+ ifn + o))' 04) ??=0 Las muestras de dominio temporal en forma de ventana j que se obtienen a partir de una aplicación del banco de filtros de síntesis de IMDCT a cada bloque de coeficientes de MDCT pueden expresarse como : Las muestras s (r) de la señal fuente para el segmento II son reconstruidas al traslapar y agregar los tres segmentos en forma de ventana como se describió anteriormente, retirando con lo cual la distorsión de dominio temporal de la señal fuente x. Esto puede expresarse como : s{r) + )+írj(r) para re[0,f- 1lJ] (18) x/7((rr)' - + £ (r-f) para •re[f,N-i] Un bloque de coeficientes de MDST S (k) puede calcularse para el segmento II al aplicar un banco de filtros dé análisis de MDST a las muestras de dominio temporal en el segmento reconstruido II, lo cual puede expresarse comp: S(k) = (r+na)) (19) Utilizando la expresión 18 para sustituir s (r) , la expresión 19 puede reescribirse como: _a S = "„fr)[í/(r-|- ) + íí/(r)]Sin (& + i)(r + nD)) ;-=D N-l N„ . , *\. . l . „ (20) r=-E.
Esta ecuación puede reescribirse en términos de los coeficientes de MDCT al utilizar las expresiones 15-17 para sustituir las muestras de dominio temporal: El resto de esta sección de la descripción muestra como esta ecuación puede ser simplificada como se muestra a continuación en las ecuaciones 41a y 41b. Utilizando la identidad trigonométrica sen - cos ß = 1 [sen(a+ß) + sen(a-ß)] para reunir los términos y cambiando el orden de la suma, la expresión 21 puede reescribirse como 1 N "-—l •*• * =-l ?T p=Q r=D sin (fc+-)(r + nQ) + ¥(p-(--)(r-(-.pQ) + -(p+-)(-) _ 2n.(fc + - 1 2ÍG p+_ 1 s )(r + „Q)__.(p + - 1)(r + no)__ 2tr(, .(._Ní' iD) N-l N-l '2ff + -^ ? X??[p) ? u>(r)? )sh —(k+p + í)r + n0) p=0 1.— ~ H a. sm 2 N'(*+5)(r + «B) + ? N( + J)(r + no)-^ Nt* +s 2)(t2) Esta expresión puede ser simplificada al combinar pares de términos que son iguales entre sí. El primer término y el segundo término son iguales entre sí . El tercer término y el cuarto término son iguales entre sí . El quinto término y el sexto término son iguales entre sí y el séptimo término y el octavo término son iguales entre sí. La paridad entre el tercer término y el cuarto término, por ejemplo, se puede mostrar al comprobar el siguiente lema: + p- l)(r + pD) N-l '—1 ñ ? IIÍP) ? ui(r)i?f(r)srin. ~(k-p)(r-\-n0) N (23) >'=0 Este lema puede comprobarse al reescribir el lado izquierdo y el lado derecho de la ecuación 23 como funciones de p como sigue : donde G(p) = Xp(p)? (rMr)sm -~{k-pXr + n0) (25b) La expresión de G como una función de (p) puede reescribirse como una función de (N - l - p) como sigue : G{N -1-p) = X?(N - {N-l-p)){r + no) (26) Se sabe que los coeficientes de MDCT son simétricos, impares; por lo tanto, X?¡(N-l-p) = -Xn(p) para pe o,f, Al reescribir (k- (N-l-p) ) como (k+l+p) -N, puede observase que (k- (N-l-p) ) • (r+n0) (Jc+l+pj • (r+n0) -N- (r+n0) . Estas dos paridades permiten que la expresión 26 sea reescrita como: Con referencia al documento de Princen, el valor para n0 es (N/2 + 1) , el cual es la posición intermedia entre dos números enteros . Debido a que r es un número entero, se puede observar que el término final -2p(r + n0) en el sumando de la expresión 27 es igual a un múltiple entero impar de p; por lo tanto, la expresión 27 puede reescribirse como 2tr G(N - l -p) = +XII(p) ? w[r w(r) n (k +p+ l){r +n0)) (28) r=Q N = F(p) lo cual comprueba el lema mostrado en la ecuación 23. La paridad entre los otros pares de términos en la ecuación 22 se puede mostrar de manera similar. Al omitir el primero, tercero, quinto y séptimo términos en la expresión 22 y al duplicar el segundo, cuarto, sexto y octavo términos, la ecuación 22 puede reescribírse como sigue después de simplificar el segundo término y el octavo término : S(k) N-l N-l 2?r + M S "ÍP) S 1ü(r)l£'(r)?l — [k-p){r + no) p=0 + ? (?) (29) JV p=Q Utilizando las siguientes identidades sin(a ± pp) = (— l)p sin a ffln(aí -I- -) = + cos a (30) ir, ' sin(a— — ) = —cosa Á la expresión 29 puede reescribirse como: 2 "— A s ~ TV SW = ñ?(- +1Xl(p)?v;(r)w(r + t)coS -jj-{k-p)(r + n0) p=0 Las sumas interiores del tercer término y el cuarto término son cambiadas de manera que sus límites de suma son de r = 0 a r = (N/2 - 1) al hacer las siguientes sustituciones: i (~(k-p)(r + no + ^ = (-l^sin £(fc -p)(r + nD) Esto permite que la ecuación 31 sea reescrita como 2p S{h) = ? 2T ? (-1)P+1^/(P) ? ^r) ,.(r + |)C0S (fc-p)(r + nD) p=0 r=0 N N-l -* 2tr + — ? Xp{p) ? .'(r)u;(r)sin (fc-Jj)(r + nD) N p=0 G=0 2tr + ?(-l)P(-l)(fc-p) ) ? ?u(r + Mr)cQB (fc-p)(r + nD) . (32) N p=0 r=0 La ecuación 32 puede simplificarse al utilizar la restricción impuesta sobre la función de ventana mencionada anteriormente que es requerida para la reconstrucción perfecta de la señal fuente. Esta restricción- es w(r) +w(r + — N ) 2 =1. Con esta restricción, la ecuación 31 puede simplificarse a i- N-l r SW = ? )P+1A (P) + yi)kX?u(p) p=D (33) Reuniendo los términos , la ecuación 33 puede reescribirse como h-1 JV\ 2tr ? IO(G)IH(G + — ) coß (fc -p)(r + nD) v=0 N La ecuación 34 puede simplificarse al reconocer que la suma interior del tercer término es igual a cero . Esto puede mostrarse - al comprobar dos lemas . Un lema postula la siguiente paridad : Esta paridad puede comprobarse al reescribir el sumando en forma exponencial, reordenando, simplificando y combinando los términos como sigue: £-- 1 - 1expf .-j? .—2pqa. ) V- ex-p ,l-j ,—2pqr.) . ' 2pg . exp{- 'exp[+j?)-expi- ß*p(- -*¥> N Jexp(- -j ) exp{+j?)-exp{~j ) Esto puede comprobarse al sustituir n0 por a en la expresión 35 para obtener lo siguiente: pg 5111 = ain(ttg)- -„ =Q para q, un número entero. sin (37) N Al sustituir (k - p) por g en la expresión 35 y utilizando los dos lemas anteriores, la suma interior del tercer término en la ecuación 34 puede mostrarse que es igual a cero como sigue : Utilizando esta paridad, la ecuación 34 puede simplificarse a lo siguiente : N-l s(k) = if ? (-rt W + (-? (p) p=0 cos -~(fc -p)(r + n0) N—l ——i 2s + - S M1 ~ (-1)(£"P)]^(P) ? ^(t)sin na) (38) p=D r=D N (k — p)[r + Los coeficientes de MDST S (k) de una señal de valor real son simétricos de acuerdo con' la expresión S (k) = S (N - 1 - k) , por k e[0, N - 1] . Utilizando esta propiedad, todos los coeficientes de números pares pueden expresarse como S(2v) = S (N - 1 - 2v) = S (N - 2 (v+1) + 1), para v e *fDeb'ido a que N y 2 (v+1) son ambos números pares, la cantidad (N - 2 (v+1) + 1) es un número impar. A partir de esto, se puede observar' que los coeficientes de números pares pueden ser expresados en términos de coeficientes de números impares. Utilizando esta propiedad de los coeficientes, la ecuación 38 puede reescribirse como sigue: N-l S(2 ) = -^ ? K-i?+KXrW + Xjjjip)] P=a N\ ? iB(r)ní(r+ y)coB •p)(r + «o) r=0 N ^ N-i , *- 1 2p + # S (l - (-l)-»)A7?(p) ? «3(r) sin {2v -p){r + n0) p=D u r=a N donde fc = 2y, i e o-?- (39) El segundo término en esta ecuación es igual a cero para todos los valores pares de p. El segundo término necesita evaluarse únicamente para los valores impares de p, o para p = 21 + 1 para 1 e o,f-> 2p ? u;(r)??/(r+~w.)coß (2u -p) {r + n0) r=Q N + «»(r)ria (2l + l))(r+n„) donde v & ?o, N- -?, (40) La ecuación 40 puede reescribirse como una suma de dos operaciones de convoluciones modificadas de dos funciones hI? XII y hIX con dos conjuntos de componentes espectrales intermedios ?i?,??? y mu que se derivan de los coeficientes de MDCT XXl Xt? y X?tt para tres segmentos de la señal fuente como sigue : N-l S{2v) ? m? ??{p)h?,???{2v - p) N p=D *-l + Ñ ? m ^21 + 2) 21' - (2¿ 4- 1)) , donde (41a) l-o muir) =Xp{t) h?,p?{t) = + no) £ z—1 -1 "2tr ftt?(t") = wz{r)sh? (T)(G-1-?D) r=0 N S(2v + 1) == -2(l + ? ) (41b) Los resultados de las operaciones de convoluciones, modificadas dependen de las propiedades de las funciones hIfIII y hn, las cuales son. respuestas a impulsos de filtros hipotéticos que están relacionados con los efectos combinados del banco de filtros de síntesis de IMDCT, el banco de filtros de análisis de MDST subsecuente y las funciones de ventana para el análisis y síntesis. Las convoluciones modificadas necesitan ser evaluadas únicamente por números enteros pares . Cada una de las respuestas a impulsos es simétrica. Se puede observar a partir de la inspección que h?,???(t) (-t) y h??(-t) {t) . Estas propiedades de simetría pueden explotarse en las implementaciones digitales prácticas para reducir la cantidad de memoria necesaria para almacenar una representación de cada respuesta a impulsos. Un entendimiento de cómo las propiedades de simetría de las respuestas a impulsos interactúan con las propiedades de simetría de los componentes espectrales intermedios mX/jj y mu también pueden explotarse en implementaciones prácticas para reducir la complejidad computacional. Las respuestas a impulsos h?r??? ( t) y hIX ( t) pueden calcularse a partir de las sumas mostradas anteriormente; sin embargo, puede ser posible simplificar estos cálculos al derivar expresiones analíticas más simples para las respuestas a impulsos. Debido a que las respuestas a impulsos dependen de la función de ventana w(r) , la derivación de expresiones analíticas más simples requiere especificaciones adicionales para la función de ventana. Un ejemplo de derivaciones de expresiones analíticas más simples para las respuestas a impulsos para dos funciones de ventana específicas, las funciones de ventana rectangular y seno, se describen a continuación. 2. Función de Ventana Rectangular La función de ventana rectangular no se utiliza frecuentemente en las aplicaciones de codificación debido a que tiene propiedades de selectividad de frecuencia relativamente pobres; sin embargo, su simplicidad reduce la complejidad del análisis necesario para derivar una implementación específica. Para esta derivación, se utiliza la función de ventana por r- e[0,N-l]. Para esta función de ventana particular, el segundo término de la ecuación 41a es igual a cero. El cálculo de los coeficientes - de MDST no depende de los coeficientes de MDCT para el segundo segmento. Como resultado, la ecuación 41a puede reescribirse como ?G-I 5(2,/) Tv ?m l[p) ? n{2v-p) (42) N P=D •m? p{t) = [(-l)'r+1A7(t) + X?n(r)) ?tjj?{r) v e .!-, Si N es restringido a tener un valor que es un múltiplo de cuatro, esta ecuación puede simplificarse adicionalmente al utilizar otro lema que postule la siguiente paridad: q no es múltiplo de ?_ ua múltiplo de N (43) donde ?Q = + 1 Esto puede comprobarse como sigue: "-i - E*[ -2JGW, (r+. + ?( rl g??lI- (44) Al utilizar el lema mostrado en la ecuación 35 con a = nn + — la expresión 44 puede reescribirse como . ? {2' w 'q^(n"Q0T+? g)j | ppqq ppi?gq^\ ssi?nn?- la cual puede ser simplificada para obtener la siguiente expresión : sin^ Si ,q es un múltiplo entero de N de tal manera que q = mN, entonces el numerador y el denominador del cociente en la expresión 46 son ambos iguales a cero, causando que el valor de cociente sea indeterminado. La regla de L'Hospital puede utilizarse para simplificar adicionalmente la expresión. La diferenciación del numerador y el denominador con respecto a g y la sustitución g = mN producen la expresión Debido a que N es un múltiplo entero de cuatro, el numerador siempre es igual a N y el denominador es igual a 2- (-l)m=2- (-1) q N. Esto completa la comprobación del lema expresado por la ecuación 43. Esta paridad puede utilizarse para obtener expresiones para la respuesta a impulsos hIt ??. Se consideran diferentes casos para evaluar la respuesta . hIfJII { t) .Si t es un múltiplo entero de N de tal manera que t = N entonces h???II { t) = ( -l) m • N/A . La respuesta es igual a cero para los valores pares de t diferentes de un múltiplo entero de N debido a que el numerador del cociente en la ecuación 46 es igual a cero. El valor de la respuesta a impulsos j,jjj para los valores impares de t puede observarse a partir de la inspección. La respuesta a impulsos puede expresarse como sigue: |\ZÜ i (-i)' a hl>IIl{r) = liSTf (48) La respuesta a impulsos t ? para una función de ventana rectangular y N=128 se ilustra en la Figura 6. Al sustituir estas expresiones en la ecuación 42, las ecuaciones 41a y 41b pueden reescribirse como : 5í2z) = (49a) S(2v + 1) = S[N - 2(1 + v)) (49b) Utilizando las ecuaciones 49a y 49b, los coeficientes de MDST para el segmento II pueden calcularse a partir de los coeficientes de MDCT de los segmentos I y III asumiendo el uso de una función de ventana rectangular. La complejidad computacional de esta ecuación puede reducirse al explotar el hecho que la respuesta a impulsos hItn? ( t) es igual a cero para muchos valores impares de t. 3. Función de Ventana Seno La función de ventana seno tiene mejores propiedades de selectividad de frecuencia que la función de ventana rectangular y se utiliza en algunos sistemas de codificación prácticos. La siguiente derivación utiliza una función de ventana seno definida por la expresión {r) = sin[^{r + -)) (50) Una expresión simplificada para la respuesta a impulsos h.t¡??? puede derivarse al utilizar un lema que postula lo siguiente: §-* N, 2p Jfr) = S i Mr+ yJcos (r)(r + nQ) N Este lema puede comprobarse al simplificar primero la expresión para w(r) w{r + N/2 ) como sigue: (52) La substitución de esta expresión simplificada en la ecuación 51 obtiene lo siguiente: Utilizando la siguiente identidad trigonométrica si u cos ? = -[sin(u + v) - sm(u — •«)] (54) la ecuación 53 puede reescribirse como sigue La ecuación 55 puede simplificarse por la sustitución en ambos términos de I ( t) de acuerdo con la rny-1 ecuación 35, estableciendo q = (r + 1) y a en el primer término y estableciendo g = (-T + 1) y m0 — a en el segundo término. Esto produce lo siguiente: (-r+1) 1 . 2tt. , 1. . ir, , ... JG . . ? s f (r + 1) I(t) = 1 . (2pi , 1 , f, . , p, , .? sinf(-r + l) anl N(-rno+2)+2(-r + 1)-N(-r + 1))Si (-. - l) I(t) ^N -•» * i ..i », ?sinf(-r + l) -sin -r)(i + l) + (-t + l)--(-r)í 3 4 Nl N' si rf-r + l) (~l)r coBf(r) (-I)-»" cosf(-t) 4 'sü? (r + l)+ 4 ' sin § (-r + 1) (yy- .. - — — cos — 4 2 ?? (r + l) + sin § (-r + 1) I(t) La ecuación 58 es valida a menos que el denominador para cualquier cociente sea igual a cero . Estos casos especiales pueden analizarse al inspeccionar la ecuación 57 para identificar las condiciones bajo las cuales cualquier denominador es cero . Se puede observar a partir de la ecuación 57 que las singularidades ocurren para t = mN + 1 y t = mN - 1, donde m es un número entero. Lo siguiente asume que N es un múltiplo entero de cuatro. Para t = mN + 1 la ecuación 57 puede reescribirse como: 4 2 sn? ^-(mN + l) = si ^s El valor del cociente es indeterminado debido a que el numerador y el denominador son arabos iguales a cero . La regla de L'Hospital puede utilizarse para determinar su valor. La diferenciación del numerador y el denominador con respecto a m produce lo siguiente : 1 ^ roa -mN* I(mN + l) = - 2 4 —JGcos— mp Para t = mN - 1 la ecuación 57 puede reescribirse como : J(miV- l) ír. si irmJV I(miV - l) = ^(p N - -)— ^ + 0 (61) El valor del cociente en esta ecuación es indeterminado debido a que el numerador y el denominador son ambos iguales a cero. La regla de L'Hospital -puede utilizarse para determinar su valor. La diferenciación del numerador y el denominador con respecto a produce lo siguiente : (62) El lema expresado por la ecuación 51 es comprobado al combinar las ecuaciones 58, 60 y 62. Una expresión simplificada para la respuesta a impulsos h ? puede derivarse al utilizar un lema que postula lo siguiente : 0,r impar, T mN + l, t mN — 1 -f (-l)"\r = N + l = < -f (-l)m+1,t = N -l (63) (-1 ^ — 1 i 1 Bip ^-Cr+l) "1" Bin =r -r+l.) par JG 1 donde m(r) = «?(-(r + -)) La comprobación de este lema- es similar a la comprobación previa. Esta comprobación comienza al simplificar la expresión para w(r) w(r) . Se debe recordar que (2a) , de manera que: Utilizando esta expresión, la ecuación 63 puede reescribirse como : A partir de la ecuación 37 y el lema asociado, se puede observar que el primer término en la ecuación 65 es igual a cero. El segundo término puede simplificarse utilizando la identidad trigonométrica cos u - sin v = %[sen(u+v) - sen(u-v)], la cual obtiene lo siguiente: Con referencia a la ecuación 66 , su primer término es igual al valor negativo del primer término en la ecuación 55 y su segundo término es igual al segundo término de la ecuación 55. La comprobación del lema expresado en la ecuación 63 puede comprobarse de manera similar a aquella utilizada para comprobar el lema expresado en la ecuación 51. La diferencia principal en la comprobación es los análisis de singularidad de la ecuación 59 y la ecuación 61. Para esta comprobación, I [mN - 1) es multiplicado por un factor adicional de -1; por lo tanto, l(mN-l) =—(-l)'"+1. Permitiendo esta diferencia junto con el 8 signo menos precediendo el primer término de la ecuación 55, se comprueba el lema expresado en la ecuación 63. Una expresión exacta para la respuesta a impulsos h?? ( t) es proporcionada por este lema; sin embargo, necesita evaluarse únicamente para los valores impares de t debido a que la convolución modificada de hIX en la ecuación 41a es evaluada únicamente para t = (2 v - (21 +1) ) . De acuerdo con la ecuación 63, h?? ( t) = 0 para los valores impares de t excepto para t = mN + 1 y t = mN - 1. Debido a que h?? (t) no es cero para solo dos valores de t, esta respuesta a impulsos puede expresarse como: Las respuestas a impulsos h?t III ( t) y h?? ( t) para la función de ventana seno y N=128 se ilustran en las Figuras 7 y 8, respectivamente. Utilizando las expresiones analíticas para las respuestas a impulsos hIr III y hIX proporcionadas por las ecuaciones 51 y 67, las ecuaciones 41a y 41b pueden reescribirse como : ?r-1 S[2v) = — ? ?,p?{p)hj u(2v -p) (68a) pr=0 + y + !)&" (2 - (2* + 1)) , . donde Ijp(r) = H-l)t+1X?{t) + X?p{t)] S(2v + 1) = S(N - (1 + )) (68b) Utilizando las ecuaciones 68a y 68b, los coeficientes de MDST para el segmento II pueden calcularse a partir de los coeficientes de MDCT de los segmentos I, II y III asumiendo el uso de una función de ventana seno. La complejidad computacional de esta ecuación puede reducirse adicionalmente al explotar el hecho que la respuesta a impulsos h f I ? t) es igual a cero para muchos valores impares de t. C. Estimación de Componentes Espectrales Las ecuaciones 41a y 41b expresan un cálculo de los coeficientes de MDST exactos a partir de los coeficientes de MDCT para una función de ventana arbitraria. Las ecuaciones 49a, 49b, 68a y 68b expresan cálculos de los coeficientes de MDST exactos a partir de los coeficientes de MDCT utilizando una función de ventana rectangular y una función de ventana seno, respectivamente. Estos cálculos incluyen operaciones que son similares a la convolución de respuestas a impulsos. La complejidad computacional del cálculo de las operaciones similares a una convolución puede reducirse al excluir de los cálculos aquellos valores de las respuestas a impulsos que se sabe que son cero . La complejidad computacional puede reducirse adicionalmente por medio de la exclusión de los cálculos de aquellas porciones de las respuestas completas que son de menor significación; sin embargo, este cálculo resultante proporciona solo una estimación de los coeficientes de MDST debido a- que ya no es posible un cálculo exacto. Al controlar las cantidades de las respuestas a impulsos que son excluidas de los cálculos, se puede lograr un balance apropiado entre la complejidad computacional y la precisión de estimación. Las respuestas a impulsos mismas son dependientes de la forma de la función de ventana que se asume. Como resultado, la selección de la función de ventana afecta las porciones de las respuestas a impulsos que pueden excluirse del cálculo sin reducir la precisión de la estimación de coeficientes abajo de algún nivel deseado. Una inspección de la ecuación 49a para funciones de ventanas rectangulares muestra que la respuesta a impulsos h?t III es simétrica alrededor de t = 0 y decae de manera moderadamente rápida. Un ejemplo de esta respuesta a impulsos para N=128 se muestra en la Figura 6. La respuesta a impulsos hIX es igual a cero para todos los valores de t. Una inspección de la ecuación 68a para la función de ventana seno muestra que la respuesta a impulsos hllt?? es simétrica alrededor de t = 0 y decae más rápidamente que la respuesta correspondiente para la función de ventana rectangular. Para la función de ventana seno, la respuesta a impulsos hXI no es cero para los únicos dos valores de t. Un ejemplo de las respuestas a impulsos h?? XI? y ht? para una función de ventana seno y N=128 se muestra en las Figuras 7 y 8 , respectivamente . Basándose en estas observaciones, una forma modificada de las ecuaciones 41a y 41b que proporciona una estimación de los coeficientes de MDST para cualquier función de ventana para el análisis o síntesis puede expresarse en términos de dos estructuras de filtros como sigue: S. (2v) = estructura defiCtroA(2v) + (69) estructura deJ?Ctro-2(2v) Nr-l estructura d ßftro?(2v) = — ? "?/,/J7( )?JI/J/(2Í — p) (70) p=0 m.?j??(t) = [(-l)t^X1(t) +Xp?(t)] (71) O if T G [Ttruncl, N — Ttruncl] —1 ?/,j//(r) = ?i a* w(rMr + ). (72) cos f 23T ¡ (t)(r + na) , 0.111. Jg— 1 estructura ¿efittro-2 (2v) = — ? /j (2i + l)fcj/ (2?> - (21 + 1)) (73) ¡=o //(r) = Xp(t) (74) S( donde y ntaps oty fruncí ttrunc? se seleccionan para satisfacer a N N tr ici £ [1> y], rír? c2 £.[1, — - ±],ntapsioi = 2ríruncl - 1 + 2tt runc2 (78) Un ejemplo de un dispositivo 30 que estima los coeficientes de MDST de acuerdo con la ecuación 69 es ilustrado por un diagrama de bloques esquemático en la Figura 3. En esta implementación, el generador de componentes intermedio 32 recibe los coeficientes de MDCT de la trayectoria 1 y deriva los primeros componentes intermedios mX/ X?X de los coeficientes de MDCT Xx y XIX de los segmentos I y III, respectivamente, al realizar los cálculos mostrados en la ecuación 71 y deriva los primeros componentes intermedios mu a partir de los coeficientes de MDCT XXI del segmento II al realizar los cálculos mostrados en la ecuación 74. El generador de componentes intermedios 34 deriva los segundos componentes intermedios al formar una combinación de los primeros componentes intermedios mi, ni de acuerdo con una porción de la respuesta a impulsos h?,?xx recibida de las respuestas a impulsos 33 al realizar los cálculos mostrados en la ecuación 70 y deriva los segundos componentes intermedios al formar una combinación de los primeros componentes intermedios mu de acuerdo con una porción de la respuesta a impulsos hn recibida de las respuestas a impulsos 33 al realizar los cálculos mostrados en la ecuación 73. Cualquier porción de las dos respuestas a impulsos puede utilizarse como es expresado por los valores Ttnmci y ttrunc2 inclusive las respuestas completas . El uso de respuestas a impulsos más grandes incrementa la complejidad computacional e incrementa generalmente la precisión de la estimación de coeficientes de MDST. El generador de componentes espectrales 35 obtiene coeficientes de MDST a partir de los segundos componentes intermedios al realizar los cálculos mostrados en las ecuaciones 69 y 76. El estimador de magnitud y fase 36 calcula las medidas de magnitud y fase a partir de los coeficientes de MDST calculados y los coeficientes de MDCT recibidos de la trayectoria 31 y pasa estas medidas a lo largo de las trayectorias 38 y 39. Los coeficientes de MDST también pueden pasarse a través de la trayectoria 37. Las medidas de magnitud y fase espectrales pueden obtenerse al realizar los cálculos mostrados anteriormente en las ecuaciones 10 y 11, por ejemplo. Otros ejemplos de medidas que pueden obtenerse incluyen el flujo espectral, el cual puede obtenerse a partir de la primera derivada de magnitud espectral, y frecuencia instantánea, la cual puede obtenerse a partir de la primera derivada de fase espectral . Con referencia a las respuestas a impulsos mostradas en las Figuras 6-8, por ejemplo, se puede observar que los valores de coeficiente obtenidos por las operaciones de tipo convolución de las dos estructuras de filtro son dominados por las porciones de las respuestas que^ son casi t = 0. Un balance entre la complejidad computacional y la, precisión de estimación se puede lograr para una implementación particular al seleccionar el número total de tomas de filtro ntapstot que se utilizan para implementar las dos estructuras de filtro. El número total de tomas ntapstot puede distribuirse entre la primera estructura de filtro y la segunda estructura de filtro como se describe de acuerdo con los valores de ttruncl y ttrunc2, respectivamente, para adaptar la estimación de coeficientes de MDST a las necesidades de las aplicaciones específicas.
La distribución de tomas entre ' las dos estructuras de filtro puede afectar la precisión de estimación pero no puede afectar la complejidad computacional. El número y selección de tomas para cada estructura de filtro puede seleccionarse utilizando cualquier criterio que se pueda desear. Por ejemplo, una inspección de dos respuestas a impulsos hX/ IXX y hxx revelará las porciones de las respuestas que son más significativas. Las tomas pueden seleccionarse para únicamente las porciones más significativas. Además, la complejidad computacional puede reducirse al obtener únicamente los coeficientes de MDST seleccionados tal como los coeficientes en uno o más intervalos de frecuencia. Una implementación adaptable de la presente invención puede utilizar porciones más grandes de las respuestas a impulsos para estimar los coeficientes de MDST para los componentes espectrales que se juzga que son perceptualmente más significativos por medio de un modelo perceptual. Por ejemplo, una medida de la significación perceptual para un componente espectral podría derivarse de la cantidad mediante la cual el componente espectral excede un umbral de enmascaramiento perceptual que es calculado por un modelo perceptual . Las porciones más cortas de las respuestas a impulsos pueden utilizarse para estimar los coeficientes de MDST para los componentes espectrales perceptualmente menos significativos. Se pueden evitar, los cálculos necesarios para estimar los coeficientes de MDST para los componentes espectrales menos significativos. Una implementación no adaptable puede obtener estimaciones de coeficientes de MDST en varias sub-bandas de frecuencia de una señal utilizando porciones de las respuestas a impulsos cuyas longitudes varían de acuerdo con la significación perceptual de las sub-bandas determinadas previamente por un análisis de señales ejemplares. En muchas aplicaciones de codificación de audio, el contenido espectral en las sub-bandas de frecuencia más bajas tiene generalmente una significación perceptual mayor que el contenido espectral en sub-bandas de frecuencia más altas. En estas aplicaciones, por ejemplo, una implementación no adaptable podría estimar los coeficientes de MDST en sub-bandas utilizando porciones de las respuestas a impulsos cuyas longitudes varían de manera inversa con la frecuencia de las sub-bandas . D. Consideraciones Adicionales La descripción anterior expone ejemplos que describen únicamente algunas implementaciones de la presente invención. Los principios de la presente invención pueden aplicarse e implementarse en una amplia variedad de formas . Las consideraciones adicionales se describen a continuación. 1. Otras Transformadas Las implementaciones ejemplares descritas anteriormente se derivan de la MDCT que es expresada en términos de la ODFT aplicada a segmentos de longitud fija de una señal fuente que se traslapan entre sí por la mitad de la longitud de los segmentos . Una variación de los ejemplos descritos anteriormente así como también una variación de las alternativas descritas posteriormente pueden obtenerse al derivar las implementaciones de la MDST que es expresada en términos de la ODFT. Las implementaciones adicionales de la presente invención pueden derivarse de expresiones de otras transformadas que incluyen la DFT, la FFT y una expresión generalizada del banco de filtros de MDCT descrito en el documento de Princen citado anteriormente. Esta expresión generalizada se describe en la patente norteamericana No. 5,727,119 expedida el 10 de Marzo de 1998. Las implementaciones de la presente invención también se pueden derivar a partir de expresiones de transformadas que se aplican a segmentos de señales de longitud variable y transformadas que se aplican a segmentos que no tienen un traslapo o cantidades de traslapo diferentes de la mitad de la longitud de los segmentos . 2. Estimación Adaptable Algunos resultados empíricos sugieren que una implementación de la presente invención con un nivel específico de complejidad computacional es capaz de derivar frecuentemente medidas de magnitud de , componentes espectrales que es más precisa para los componentes espectrales que representan una banda de energía espectral que para los componentes espectrales que representan un sinusoide individual o algunos sinusoides que están aislados unos de otros en la frecuencia. El proceso que estima la magnitud de componentes espectrales puede adaptarse en al menos dos formas para mejorar la precisión de estimación para señales que tienen componentes espectrales aislados. Una forma para adaptar el proceso es al incrementar de manera adaptable la longitud de las respuestas a impulsos para dos estructuras de filtro mostradas en la ecuación 69 de modo que se puedan realizar cálculos más precisos para un conjunto restringido de coeficientes de MDST que están relacionados con uno o más de los componentes espectrales aislados. Otra forma para adaptar este proceso es al llevar a cabo de manera adaptable un método alternativo para derivar magnitudes de componentes espectrales para componentes espectrales aislados. El método alternativo deriva un conjunto adicional de componentes espectrales de los' coeficientes de MDCT y el conjunto adicional de componentes espectrales se utiliza para obtener medidas de magnitud y/o fase. Esta adaptación se puede realizar al seleccionar el método más apropiado para segmentos de la señal fuente y se puede realizar al utilizar el método más apropiado para porciones del espectro para un segmento particular. Un método que se describe en el documento de Merdjani citado anteriormente es un método alternativo, posible. Si se utiliza, este método se extiende preferiblemente para proporcionar estimaciones de magnitud para más de un sinusoide individual. Esto se puede realizar al ordenar dinámicamente los coeficientes de MDCT en bandas de frecuencia en las cuales cada banda tiene un componente espectral dominante individual y al aplicar el método de Merdjani a cada banda de coeficientes. La presencia de una señal fuente que tiene un componente espectral dominante o algunos componentes espectrales dominantes aislados se puede detectar utilizando una variedad de técnicas. Una técnica detecta la máxima local en los coeficientes de MDCT que tienen magnitudes que exceden las magnitudes de coeficientes adyacentes y cercanos por alguna cantidad de umbral y ya sea contar el número de máxima local o determinar la distancia espectral entre la máxima local . Otra técnica determina la forma espectral de la señal fuente al calcular una Medida de Planidad Espectral aproximada (SFM, por sus siglas en inglés) de la señal fuente. La SFM se describe en N. Jayant y colaboradores, "Digital Coding of aveforms" , Prentice-Hall, 1984, página 57 y se define como la relación del promedio geométrico y el promedio aritmético de muestras de la densidad espectral de potencia de una señal . 3. Implementación La presente invención se puede utilizar de manera ventajosa en una amplia variedad de aplicaciones. Los diagramas de bloques esquemáticos de un transmisor y un receptor que incorporan varios aspectos de la presente invención se muestran en las Figuras 4 y 5, respectivamente. El transmisor mostrado en la Figura 4 es similar al transmisor mostrado en la Figura 1 e incluye el valorador 30, el cual incorpora varios aspectos , de la presente invención para proporcionar medidas de magnitud y fase a lo largo de las trayectorias 38 y 39, respectivamente. El codificador 6 utiliza estas medidas para generar información codificada que representa los componentes espectrales recibidos desde el banco de filtros de análisis 3. Los ejemplos de procesos que se pueden utilizar en el codificador 6, los cuales pueden depender de las medidas de magnitud o fase, incluyen modelos perceptuales utilizados para determinar los niveles de cuantificación adaptables, acoplamiento y estimación de envoltura .espectral para el último uso por medio de procesos de decodificación de regeneración espectral. El receptor mostrado en la Figura 5 es similar al receptor mostrado en la Figura 2 e incluye el estimador 30, el cual incorpora varios aspectos de la presente invención para proporcionar medidas de magnitud y fase a lo largo de las trayectorias 38 y 39, respectivamente. El estimador 30 también puede proporcionar coeficientes de MDST a lo largo de la trayectoria 37. Él decodificador 26 utiliza estas medidas para obtener componentes .espectrales de la información ' codificada recibida del desformateador 23. Los ejemplos de procesos que pueden utilizarse en el decodificador 26, los cuales pueden depender de las medidas de magnitud o- fase', incluyen modelos perceptuales utilizados para determinar niveles de cuantificación adaptables, síntesis de componentes espectrales de representaciones compuestas o acopladas y regeneración de componentes espectrales . Los dispositivos que incorporan varios aspectos de la presente invención se pueden implementar en una variedad de formas que incluyen un programa de cómputo para la ejecución por una computadora o algún otro aparato que incluya componentes más especializados tales como la circuitería de un procesador de señales digitales (DSP, por sus siglas en inglés) acoplada a componentes similares a aquellos encontrados en una computadora común. La Figura 9 es un diagrama de bloques esquemático de un dispositivo 70 que puede utilizarse para implementar aspectos de la presente invención. El DSP 72 proporciona recursos de cómputo. La RAM 73 es una memoria de acceso aleatorio del sistema (RAM, por sus siglas en inglés) utilizada por el DSP 72 para el procesamiento de señales. La ROM 74 representa alguna forma de almacenamiento persistente tal como una memoria de solo lectura (ROM, por sus siglas en inglés) para almacenar programas necesarios para operar el dispositivo 70 y para llevar a cabo varios aspectos de la presente invención. El control I/O 75 representa la circuitería de interfaz para recibir y transmitir señales por vía de los canales - de comunicación 76, 77. Los convertidores de análogo a digital y los convertidores de digital a análogo pueden incluirse en el control I/O 75 como se desee para recibir y/o transmitir señales análogas. En la modalidad mostrada, todos los componentes principales del sistema se conectan con el bus 71, el cual puede representar más de un bus. físico; sin embargo, no se requiere una arquitectura de bus para implementar la presente invención. En las modalidades implementadas en un sistema de computadora . común, se pueden incluir componentes adicionales para la interconexión con dispositivos tales como un teclado o ratón y una pantalla y para controlar un dispositivo de almacenamiento que tiene un medio de almacenamiento tal como una cinta o disco magnético o un medio óptico. El medio de almacenamiento se puede utilizar para grabar programas de instrucciones para operar los sistemas, utilidades y aplicaciones y puede incluir modalidades de programas que implementen varios aspectos de la presente invención. Las funciones requeridas para practicar diversos aspectos de la presente invención pueden ser realizadas por componentes que son implementados en una amplia variedad de formas que incluyen componentes lógicos discretos, circuitos integrados, uno o más ASICs y/o procesadores controlados por programas. La manera en la cual estos componentes son implementados no es importante para la presente invención. Las implementaciones de programas de cómputo de la presente invención pueden ser llevadas por una variedad de medios que pueden ser leídos por máquinas tales como trayectorias de comunicación de banda base o moduladas por todo el espectro que incluye desde las frecuencias supersónicas a ultravioletas o medios de almacenamiento que llevan información utilizando esencialmente cualquier tecnología de grabación que incluye cintas, tarjetas o discos magnéticos, tarjetas o discos ópticos y marcas detectables sobre medios como papel .

Claims (44)

  1. REIVINDICACIONES 1. Un método para procesar información que representa una señal fuente que lleva contenido destinado para la percepción humana, el método está caracterizado porque comprende : recibir los primeros componentes espectrales que fueron generados por la aplicación de un banco de filtros de análisis a la señal fuente, en donde los primeros componentes espectrales representan un contenido espectral de la señal fuente expresada en un primer sub-espacio de un espacio multidimensional; derivar uno o más de los primeros componentes intermedios de al menos alguno de los primeros componentes espectrales, en donde al menos alguno de los primeros componentes intermedios difiere de los primeros componentes espectrales de los cuales se derivan; formar una combinación de uno o más de los primeros componentes intermedios de acuerdo con al menos una porción de una o más respuestas a impulsos para obtener uno o más de los segundos componentes intermedios; derivar uno o más de los segundos componentes espectrales a partir de uno o más de los segundos componentes intermedios, en donde los segundos componentes espectrales representan contenido espectral de la señal fuente expresada en un segundo sub-espacio del espacio multidimensional que incluye una porción del espacio multidimensional no incluido en el primer sub-espacio; obtener las medidas estimadas de magnitud o fase utilizando los primeros componentes espectrales y los segundos componentes espectrales; y aplicar un proceso adaptable a los primeros componentes espectrales para generar información procesada, en donde el proceso adaptable es sensible a las medidas estimadas de magnitud o fase.
  2. 2. El método de conformidad con la reivindicación 1, caracterizado porque: los primeros componentes espectrales son coeficientes de transformada ordenados en uno o más bloques de coeficientes de transformada que se generaron por medio de la aplicación de una o más transformadas a uno o más segmentos de la señal fuente; y las porciones de una o más de las respuestas a impulsos se basan en las' características de respuesta de frecuencia de una o más de las transformadas .
  3. 3. El método de conformidad con la reivindicación 2, caracterizado porque las características de respuesta de frecuencia de una o más de las transformadas son dependientes de características de una o más funciones de ventana para el análisis que se aplicaron con una o más de las transformadas a uno o más de los segmentos de la señal fuente .
  4. 4. El método , de conformidad con la reivindicación 3, caracterizado porque al menos alguna de una o más de las transformadas se implementan en un banco de filtros de análisis que genera los primeros componentes espectrales con distorsión de dominio temporal .
  5. 5. El método de conformidad con la reivindicación 3, caracterizado porque al menos alguna de una o más de las transformadas genera los primeros componentes espectrales que tienen valores reales expresados en el primer sub-espacio y en donde los segundos valores espectrales tienen valores imaginarios expresados en el segundo sub-espacio.
  6. 6. El método de conformidad con la reivindicación 5, caracterizado porque las transformadas que generan los primeros componentes espectrales que tienen valores reales expresados en el primer sub-espacio son Transformadas Discretas de Coseno o Transformadas Discretas de Coseno Modificadas.
  7. 7. El método de conformidad .con la reivindicación 1, caracterizado porque: los primeros componentes espectrales son coeficientes de transformadas ordenados en uno o más bloques de coeficientes de transformadas que se generaron por medio de la aplicación de una o más de las transformadas a uno o más segmentos de la señal fuente, uno o más de los segundos componentes intermedios se obtienen al combinar uno o más de los primeros componentes intermedios de acuerdo con una porción de una o más de las respuestas a impulsos, cada una o más de las respuestas a impulsos comprende un conjunto respectivo de elementos dispuestos en orden, y la porción de cada una o más de las respuestas a impulsos excluye cada elemento diferente en el conjunto respectivo de elementos.
  8. 8. El método de conformidad con la reivindicación 1, caracterizado porque comprende además obtener medidas estimadas de magnitud o fase utilizando uno o más de los terceros componentes espectrales que se derivan de al menos alguno de uno o más de los primeros componentes espectrales.
  9. 9. El método de conformidad con la reivindicación 8, caracterizado porque: los primeros componentes espectrales son coeficientes de transformada ordenados en uno o más bloques de coeficientes de transformada que se generaron por medio de la aplicación de una o más transformadas a uno o más segmentos de la señal fuente; los terceros componentes espectrales se derivan de una combinación de dos o más de los primeros componentes espectrales; y las medidas estimadas de magnitud o fase para un segmento respectivo de la señal fuente se obtienen de manera adaptable utilizando ya sea los terceros componentes espectrales o utilizando los primeros componentes espectrales y los segundos componentes espectrales .
  10. 10. El método de conformidad con la reivindicación 8, caracterizado porque: los primeros componentes espectrales son coeficientes de transformada ordenados en uno o más bloques de coeficientes de transformada que se generaron por medio de la aplicación de una o más transformadas a uno o más segmentos de la señal fuente; los terceros componentes espectrales se derivan de una combinación de dos o más de los primeros componentes espectrales; y las medidas estimadas de magnitud o fase para al menos algún contenido espectral de un segmento respectivo de la señal fuente se obtienen utilizando los terceros componentes espectrales y las medidas estimadas de magnitud o fase para al menos algo del contenido espectral del segmento respectivo de la señal fuente se obtienen utilizando los primeros componentes espectrales y los segundos componentes espectrales.
  11. 11. El método de conformidad con la reivindicación 8 o 10, caracterizado porque comprende obtener medidas de magnitud o fase de manera adaptable utilizando ya sea los terceros componentes espectrales o utilizando los primeros componentes espectrales y los segundos componentes espectrales .
  12. 12. El método de conformidad con la reivindicación 1, caracterizado porque comprende adaptar la porción de una o más de las respuestas a impulsos en respuesta a una medida de significación de componentes espectrales .
  13. 13. El método de conformidad con la reivindicación 12, caracterizado porque la medida de significación de componentes espectrales es proporcionada por un modelo perceptual que evalúa la significación perceptual del contenido espectral de la señal fuente.
  14. 14. El método de conformidad con la reivindicación 12, caracterizado porque la medida de significación de componentes espectrales refleja el aislamiento en la frecuencia de uno o más componentes espectrales .
  15. 15. El método de conformidad con la reivindicación 1, caracterizado porque: los primeros componentes espectrales son los primeros coeficientes de transformada ordenados en uno o más bloques que se generaron por medio de la aplicación de una o más transformadas a uno o más segmentos de la señal fuente, un bloque respectivo que tiene un primer número de primeros coeficientes de transformada; los segundos componentes espectrales son segundos coeficientes de transformada; se deriva un segundo número de segundos coeficientes (de transformada que representan un contenido espectral que también es representado por algunos de los primeros coeficientes de transformada en el bloque respectivo; y el segundo número es menor que el primer número.
  16. 16. El método de conformidad con la reivindicación 1, 2, 9, 10 o 12, caracterizado porque comprende: aplicar el proceso adaptable a los primeros componentes espectrales para generar componentes espectrales sintetizados; derivar uno o más de los terceros componentes intermedios de los primeros componentes espectrales y/o los segundos componentes espectrales y de los componentes espectrales sintetizados; y generar una o más señales de salida que llevan contenido destinado para la percepción humana al aplicar uno o más bancos de filtro para la síntesis a uno o más de los terceros componentes intermedios .
  17. 17. El método de _ conformidad con la reivindicación 16, caracterizado porque al menos algunos de los componentes espectrales sintetizados se generan por medio de la regeneración de componentes espectrales.
  18. 18. El método de conformidad con la reivindicación 16, caracterizado porque al menos algunos de los componentes espectrales sintetizados se generan por medio de la descomposición de los primeros componentes espectrales y/o los segundos componentes espectrales que representan un compuesto de contenido espectral para una pluralidad de señales fuente .
  19. 19. El método de conformidad con la reivindicación 16, caracterizado porque al menos algunos de los componentes espectrales sintetizados se generan al combinar los primeros componentes espectrales y/o los segundos componentes espectrales para proporcionar una representación compuesta de contenido espectral para una pluralidad de señales fuente.
  20. 20. El método de conformidad con la reivindicación 1, 2, 9, 10 o 12, caracterizado porque comprende: generar los primeros componentes espectrales al aplicar el banco de filtros de análisis a la señal fuente; aplicar el proceso adaptable al primer componente espectral para generar información codificada que represente al menos algunos de los primeros componentes espectrales; y generar una señal de salida que lleva la información codificada.
  21. 21. Un medio que lleva un programa de instrucciones que es ejecutable por un dispositivo para llevar a cabo un método para procesar información que representa una señal fuente que lleva contenido destinado para la percepción humana, el método está caracterizado porque comprende : recibir los primeros componentes espectrales que se generaron por medio de la aplicación de un banco de filtros de análisis a la señal fuente, en donde los primeros componentes espectrales representan contenido espectral de la señal fuente expresada en un primer sub-espacio de un espacio multidimensional; derivar uno o más de los primeros componentes intermedios de al menos algunos de los primeros componentes espectrales, en donde al menos algunos de los primeros componentes intermedios' difieren de los primeros componentes espectrales de los cuales se derivan; formar una combinación de uno o más de los primeros componentes intermedios de acuerdo con al menos una porción de una o más respuestas a impulsos para obtener uno o más de los segundos componentes intermedios; derivar uno o más de los segundos componentes espectrales de uno o más de los s gundos componentes intermedios, en donde los segundos componentes espectrales representan contenido espectral de la señal fuente expresada en un segundo sub-espacio del espacio multidimensional que incluye una porción del espacio multidimensional no incluido en el primer sub-espacio; obtener las medidas estimadas de magnitud o fase utilizando los primeros componentes espectrales y los segundos componentes espectrales; y aplicar un proceso adaptable a los primeros componentes espectrales para generar información procesada, en donde el proceso adaptable es sensible a las medidas estimadas de magnitud o fase.
  22. 22. El medio de conformidad con la reivindicación 21, caracterizado porque: los primeros componentes espectrales son coeficientes de transformada ordenados en uno o más bloques de coeficientes de transformada que se generaron por medio de la aplicación de una o más transformadas a uno o más segmentos de la señal fuente; y las porciones de una o más de las respuestas a impulsos se basan en las características de respuesta de frecuencia de una o más .de las transformadas, las cuales son dependientes de las características de una o más funciones de ventana para el análisis que se aplicaron con una o más de las transformadas a uno o más de los segmentos de la señal fuente .
  23. 23. El medio de conformidad con la reivindicación 21, caracterizado porque el método comprende además obtener medidas estimadas" de magnitud o fase utilizando uno o más de los terceros componentes espectrales que se derivan de al menos alguno de uno o más de los primeros componentes espectrales .
  24. 24. El medio de conformidad con la reivindicación 23, caracterizado porque: los primeros componentes espectrales son coeficientes de transformada ordenados en uno o más bloques de coeficientes de transformada que se generaron por medio de la aplicación de una o más transformadas a uno o más segmentos de la señal fuente; los terceros componentes espectrales se derivan de una combinación de dos o más de los primeros componentes espectrales; y las medidas estimadas de magnitud o fase para un segmento respectivo de señal fuente se obtienen de manera adaptable utilizando ya sea los terceros componentes espectrales o utilizando los primeros componentes espectrales y los segundos componentes espectrales.
  25. 25. El medio de conformidad con la reivindicación 23, caracterizado porque: los primeros componentes espectrales son coeficientes de transformada ordenados en uno o más bloques de coeficientes de transformada que se generaron por medio de la aplicación de una o más transformadas a uno o más segmentos de la señal fuente; los terceros componentes espectrales se derivan de una combinación de dos o más de los primeros componentes espectrales; y las medidas estimadas de magnitud o fase para al menos algún contenido espectral de un segmento respectivo de la señal fuente se obtienen utilizando los terceros componentes espectrales y las medidas estimadas de magnitud o fase para al menos algo del contenido espectral del segmento respectivo de la señal fuente se obtienen utilizando los primeros componentes espectrales y los segundos componentes espectrales .
  26. 26. El medio de conformidad con la reivindicación 23, caracterizado porque el método comprende obtener medidas de magnitud o fase de manera adaptable utilizando ya sea los terceros componentes espectrales o utilizando los primeros componentes espectrales y segundos componentes espectrales .
  27. 27. El medio de conformidad con la reivindicación 21, caracterizado porque el método comprende adaptar la porción de una o más de las respuestas a impulsos en respuesta a una medida de la significación de componentes espectrales .
  28. 28. El medio de conformidad con la reivindicación 27, caracterizado porque la medida de significación de componentes espectrales es proporcionada por un modelo perceptual que evalúa la significación perceptual del contenido espectral de la señal fuente .
  29. 29. El medio ' de conformidad con la reivindicación 27, caracterizado porque la medida de significación de componentes espectrales refleja el aislamiento en la frecuencia de uno o más componentes espectrales .
  30. 30. El medio de conformidad con la reivindicación 21, caracterizado porque: los primeros componentes espectrales son primeros coeficientes de transformada ordenados en uno o más bloques que se generaron por medio de la aplicación de una o más transformadas a uno o más segmentos de la señal fuente, un bloque respectivo que tiene un primer número de primeros coeficientes de transformada; los segundos componentes espectrales son segundos coeficientes de transformada; se deriva un segundo número de segundos coeficientes de transformada que representan contenido espectral que también es representado por algunos de los primeros coeficientes de transformada en el bloque respectivo; y el segundo número es menor que el primer número.
  31. 31. El medio de conformidad con la reivindicación 21, • caracterizado porque el método comprende: aplicar el proceso adaptable a los primeros componentes espectrales para generar componentes espectrales sintetizados; derivar uno o más de los terceros componentes intermedios de los primeros componentes espectrales y/o los segundos componentes espectrales y de los componentes espectrales sintetizados; y generar una o • más señales de salida que llevan contenido destinado para la percepción humana al aplicar uno o más bancos de filtros de síntesis a uno o más de los terceros componentes intermedios.
  32. 32. El medio de conformidad con la reivindicación 21, caracterizado porque el método comprende : generar los primeros componentes espectrales al aplicar el banco de filtros de análisis a la señal fuente; aplicar el proceso adaptable al primer componente espectral para generar información codificada que representa al menos algunos de los primeros componentes espectrales; y generar una señal de salida que lleva la información codificada.
  33. 33. Un aparato para procesar información que representa una señal fuente que lleva contenido destinado para la percepción humana, el aparato está caracterizado porque comprende : un medio para recibir los primeros componentes espectrales que' se generaron por medio de la aplicación de un banco de filtros de análisis a la señal fuente, en donde los primeros componentes espectrales representan contenido espectral de la señal fuente expresada en un primer sub-espacio de un espacio multidimensional ; un medio para derivar uno o más de los primeros componentes intermedios de al menos algunos de los primeros componentes espectrales, en donde al menos algunos de los primeros componentes intermedios difieren de los primeros componentes espectrales de los cuales se derivan; un medio para formar una combinación de uno o más de los primeros componentes intermedios de acuerdo con al menos una porción de una o más respuestas a impulsos para obtener uno o más de los segundos componentes intermedios; un medio para derivar uno o más de los segundos componentes espectrales de uno o más de los segundos componentes intermedios, en donde los segundos componentes espectrales representan contenido espectral de la señal fuente expresada en un segundo sub-espacio del espacio multidimensional que incluye una porción del espacio multidimensional no incluida en el primer sub-espacio; un medio para obtener medidas estimadas de magnitud o fase utilizando los primeros componentes espectrales y los segundos componentes espectrales; y un medio para aplicar un proceso adaptable a los primeros componentes espectrales para generar información procesada, en donde el proceso adaptable es sensible a las medidas estimadas de magnitud o fase .
  34. 34. El aparato de conformidad con la reivindicación 33, caracterizado porque: los primeros componentes espectrales son coeficientes de transformada ordenados en uno o más bloques de coeficientes de transformada que se generaron por medio de la aplicación de una o más transformadas a uno o más segmentos de la señal fuente; y las porciones de una o más de las respuestas a impulsos se basan en las características de respuesta de frecuencia de una o más de las transformadas, que son dependientes de las características de una o más de las funciones de ventana para el análisis que se aplicaron con una o más de las transformadas a uno o más de los segmentos de la señal fuente.
  35. 35. El aparato de conformidad con la reivindicación 33, caracterizado porque además comprende un medio para obtener medidas estimadas de magnitud o fase utilizando uno o más de los terceros componentes espectrales que se derivan de al menos alguno de uno o más de los primeros componentes espectrales.
  36. 36. El aparato de conformidad con la reivindicación 35, caracterizado porque: los primeros componentes espectrales son coeficientes de transformada ordenados en uno o más bloques de coeficientes de transformada que se generaron por medio de la aplicación de una o más transformadas a uno o más segmentos de la señal fuente; los terceros componentes espectrales se derivan de una combinación de dos o más de los primeros componentes espectrales; y las medidas estimadas de magnitud o fase para un segmento respectivo de la señal fuente se obtienen de manera adaptable utilizando ya sea los terceros componentes espectrales o utilizando los primeros componentes espectrales y los segundos componentes espectrales.
  37. 37. El aparato de conformidad con la reivindicación 35, caracterizado porque: los primeros componentes espectrales son coeficientes de transformada ordenados en uno o más bloques de coeficientes de transformada que se generaron por medio de la aplicación de una o más transformadas a uno o más segmentos de la señal fuente; los terceros componentes espectrales se derivan de una combinación de dos o más de los primeros componentes espectrales; y las medidas estimadas de magnitud o fase para al menos algún contenido espectral de un segmento respectivo de la señal fuente se obtienen utilizando, los terceros componentes espectrales y las medidas estimadas de magnitud o fase para al menos algo del contenido espectral del segmento respectivo de la señal fuente se obtienen utilizando los primeros componentes espectrales y los segundos componentes espectrales.
  38. 38. El aparato de conformidad con la reivindicación 35, caracterizado porque comprende un medio para obtener medidas de magnitud o fase de manera adaptable utilizando ya sea los terceros componentes espectrales o utilizando los primeros componentes espectrales y los segundos componentes espectrales.
  39. 39. El aparato de conformidad con la reivindicación 33, caracterizado porque comprende un medio para adaptar la porción de una o más de las respuestas a impulsos en respuesta a una medida de significación de componentes espectrales.
  40. 40. El aparato de conformidad con la reivindicación 39, caracterizado porque la medida de significación de componentes espectrales es proporcionada por un modelo perceptual que evalúa la significación perceptual del contenido espectral- de la señal fuente.
  41. 41. El aparato de conformidad con la reivindicación 39, caracterizado porque la medida de significación de componentes espectrales refleja el aislamiento en frecuencia de uno o más de los componentes espectrales.
  42. 42. El aparato de conformidad con la reivindicación 33, caracterizado porque: los primeros componentes espectrales son primeros coeficientes de transformada ordenados en uno o más bloques que se generaron por medio de la aplicación de una o más transformadas a uno o más segmentos de la señal fuente, un bloque respectivo que tiene un primer número de primeros coeficientes de transformada; los segundos componentes espectrales son segundos coeficientes de transformada; se deriva un segundo número de segundos coeficientes de transformada que representan contenido espectral que también es representado por algunos de los primeros coeficientes de transformada en el bloque respectivo; y el segundo número es menor que el primer número .
  43. 43. El aparato de conformidad con la reivindicación 33, caracterizado porque comprende: un medio para aplicar el proceso adaptable a los primeros componentes espectrales para generar componentes espectrales sintetizados; un medio para derivar uno o más de los terceros componentes intermedios de los primeros componentes espectrales y/o los segundos componentes espectrales y de los componentes espectrales sintetizados; y un medio para generar una o más señales de salida que llevan contenido destinado para la percepción humana al aplicar uno o más bancos de filtros de síntesis a uno o más de los terceros componentes intermedios .
  44. 44. El aparato de conformidad con la reivindicación 33, caracterizado porque comprende: un medio para generar los primeros componentes espectrales al aplicar el banco de filtros de análisis a la señal fuente; un medio para aplicar el proceso adaptable al primer componente espectral para generar información codificada que representa al menos algunos de los primeros componentes espectrales; y un medio para generar una señal de salida que lleva- la información codificada.
MXPA/A/2006/008474A 2004-01-27 2006-07-27 Tecnicas de codificacion mejoradas que utilizan magnitud y fase espectrales estimadas derivadas a partir de coeficientes de mdct MXPA06008474A (es)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US10766681 2004-01-27

Publications (1)

Publication Number Publication Date
MXPA06008474A true MXPA06008474A (es) 2006-12-13

Family

ID=

Similar Documents

Publication Publication Date Title
USRE48271E1 (en) Coding techniques using estimated spectral magnitude and phase derived from MDCT coefficients
EP0818037B1 (en) Method and apparatus for efficient implementation of single-sideband filter banks providing accurate measures of spectral magnitude and phase
JP4689625B2 (ja) 信号解析及び合成のための適応型混合変換
US7707030B2 (en) Device and method for generating a complex spectral representation of a discrete-time signal
JP3224130B2 (ja) 高品質オーディオ用符号器・復号器
KR100253136B1 (ko) 저계산 복잡도의 디지탈 필터뱅크
US7512539B2 (en) Method and device for processing time-discrete audio sampled values
Goodwin Multiresolution sinusoidal modeling using adaptive segmentation
MXPA06008474A (es) Tecnicas de codificacion mejoradas que utilizan magnitud y fase espectrales estimadas derivadas a partir de coeficientes de mdct
EP0827647B1 (en) Analysis/synthesis filtering system with efficient oddly-stacked single-sideband filter bank using time-domain aliasing cancellation
AU2012247062B2 (en) Adaptive Hybrid Transform for Signal Analysis and Synthesis