MX2013011131A - Transformada con complejidad reducida para canal de efectos de baja frecuencia. - Google Patents

Transformada con complejidad reducida para canal de efectos de baja frecuencia.

Info

Publication number
MX2013011131A
MX2013011131A MX2013011131A MX2013011131A MX2013011131A MX 2013011131 A MX2013011131 A MX 2013011131A MX 2013011131 A MX2013011131 A MX 2013011131A MX 2013011131 A MX2013011131 A MX 2013011131A MX 2013011131 A MX2013011131 A MX 2013011131A
Authority
MX
Mexico
Prior art keywords
transform
calculations
transform coefficients
samples
coefficients
Prior art date
Application number
MX2013011131A
Other languages
English (en)
Inventor
Matthew C Fellers
Original Assignee
Dolby Lab Licensing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby Lab Licensing Corp filed Critical Dolby Lab Licensing Corp
Publication of MX2013011131A publication Critical patent/MX2013011131A/es

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/14Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
    • G06F17/147Discrete orthonormal transforms, e.g. discrete cosine transform, discrete sine transform, and variations therefrom, e.g. modified discrete cosine transform, integer transforms approximating the discrete cosine transform
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Pure & Applied Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Discrete Mathematics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Complex Calculations (AREA)
  • Stereophonic System (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)

Abstract

Los recursos informáticos que se necesitan para aplicar un banco de filtros basado en transformada a señales de audio de ancho de banda limitado se reducen al realizar un proceso integrado de combinar datos de entrada de valores reales con datos de valores complejos y aplicar una transformada corta a los datos de valores complejos, aplicando un banco de transformadas muy cortas a la salida del proceso de integración, y derivando una secuencia de datos de salida de valores reales de las salidas del banco de transformadas muy cortas.

Description

TRANSFORMADA CON COMPLEJIDAD REDUCIDA PARA CANAL DE EFECTOS DE BAJA FRECUENCIA CAMPO TÉCNICO La presente invención pertenece generalmente al procesamiento de señales digitales y está dirigida más particularmente hacia métodos y aparatos que pueden utilizarse para aplicar bancos de filtro a canales de audio de ancho de banda limitado tales como los así llamados canales de efectos de baja frecuencia (LFE) utilizando menos recursos informáticos.
ANTECEDENTES DE LA TÉCNICA Se han desarrollado diversas normas nacionales, regionales e internacionales para definir los sistemas y métodos que pueden emplearse para implementar sistemas de codificación de audio de canales múltiples. Tres ejemplos de tales normas incluyen ISO/IEC 13818-7, Codificación de Audio Avanzada (AAC), también conocida como "MPEG-2 AAC", e ISO/IEC 14496-3, subparte 4, también conocida como "audio MPEG-4", publicada por la Organización Internacional de Normalización (ISO), y una norma publicada por el Comité de Sistemas de Televisión Avanzada (ATSC), inc. el documento A/52B titulado "Digital Audio Compression Standard (AC-3, E-AC-3)", Revisión B, publicado el 14 de junio de 2005, también conocido como "Dolby Digital" o "AC-3".
Los sistemas de audio que satisfacen normas como las que se mencionaron anteriormente, incluyen por lo general transmisores que aplican un banco de filtros de análisis a cada uno de varios canales de entrada de señales de audio, procesan la salida de los bancos de filtros de análisis en señales codificadas y transmiten o graban las señales codificadas, y receptores que reciben las señales codificadas, las decodifican y aplican bancos de filtros de síntesis a las señales decodificadas para generar canales de señales de audio de salida que son una réplica de las señales de audio de entrada originales. Muchas de las normas especifican la implementacion de los bancos de filtros de análisis y de síntesis mediante una Transformada Discreta Modificada (MDCT) y una Transformada Discreta Modificada Inversa (IMDCT) descriptas por Princen, Johnson y Bradley en "Subband/Transform Coding Using Filter Bank Designs Based on Time Domain Aliasing Cancellation" ICASSP 1987 Conf. Proc, mayo de 1987, pp. 2161-64.
Los bancos de filtros implementados mediante estas transformadas particulares tienen muchas propiedades atractivas pero se requiere procesamiento o recursos informáticos considerables para realizar los cálculos necesarios. Se conocen técnicas que pueden utilizarse para realizar las transformadas más eficazmente, con lo cual se reduce la cantidad de recursos informáticos necesarios. Una característica común de estas técnicas es que su complejidad computacional varía con la así denominada longitud de la transformada. Existen técnicas conocidas que pueden realizar reducciones adicionales en la complejidad informática mediante el uso de longitudes de transformada más cortas para procesar canales de audio de anchos de banda más angostos.
Las normas como las citadas previamente definen secuencias de datos digitales o corrientes de bits digitales que transportan información que representa representaciones codificadas de uno o varios canales de audio. Una configuración de canales a veces denominada "5.1 canales" incluye cinco canales de ancho de banda completo denominados izquierdo (L), derecho (R), central (C), envolvente izquierdo (LS) y envolvente derecho (RS), y un canal de ancho de banda limitado o canal de efectos de baja frecuencia (LFE). Por lo general, los canales de ancho de banda completo tienen un ancho de banda de aproximadamente 20 kHz y generalmente, el canal LFE de ancho de banda limitado tiene un ancho de banda de aproximadamente 100 a 200 Hz. Debido a que el ancho de banda del canal LFE es más angosto, pueden utilizarse técnicas conocidas para implementar la transformada de banco de filtros con mayor eficacia para el canal LFE que la que puede implementarse para uno de los canales de ancho de banda completo.
No obstante, existe la necesidad de desarrollar técnicas que mejoren aun más la eficacia de los bancos de filtros de la transformada que se aplican a canales de ancho de banda limitado como el canal LFE.
DIVULGACIÓN DE LA INVENCIÓN El objeto de la presente invención es proporcionar formas que pueden utilizarse para realizar transformadas que implementen bancos de filtros para señales de canales de ancho de banda limitado más eficazmente de lo que se logra utilizando técnicas conocidas.
De acuerdo con un aspecto de la presente invención, se procesa una señal de ancho de banda limitado al recibir un bloque de K coeficientes de transformada de valores reales de los cuales solamente una cantidad de L coeficientes representa componentes espectrales de una señal de audio de ancho de banda limitado, donde ½ L < M < K, y M es una potencia de dos; se aplica una primera transformada de longitud R a un bloque de coeficientes de valores complejos derivados de M coeficientes de transformada de valores complejos que incluyen los L coeficientes de transformada de valores reales que representan componentes espectrales de la señal de audio de ancho de banda limitado, donde M R =— y P es una potencia de dos; se aplica un banco de segundas transformadas Q de longitud P a las salidas de la primera transformada; y se deriva una secuencia de N muestras de señales de valores reales de las salidas del banco de las segundas transformadas, donde N = 2 K y las muestras de señales de valores reales representan componentes temporales de la señal de audio de ancho de banda limitado.
Las distintas características de la presente invención y sus realizaciones preferidas pueden entenderse mejor haciendo referencia a la siguiente exposición y a los dibujos adjuntos en los que números de referencia similares se refieren a elementos similares en las distintas figuras. El contenido de la siguiente exposición y de los dibujos se brinda a modo de ejemplo únicamente y no deberá entenderse que representan limitaciones al alcance de la presente invención.
BREVE DESCRIPCIÓN DE LOS DIBUJOS La Fig. 1 es un esquema del diagrama de bloque de un sistema de codificación de audio en el que se pueden llevar a cabo varios aspectos de la presente invención.
La Fig. 2 es un esquema del diagrama de bloque de un proceso que se puede utilizar para implementar una transformada de síntesis en el sistema de codificación que se muestra en la Fig. 1.
La Fig. 3 y 4 son esquemas de los diagramas de bloque que ilustran algunas características que pueden utilizarse para realizar una porción del proceso que se muestra en la Fig. 2.
La Fig. 5 es un esquema del diagrama de bloque de un dispositivo que puede utilizarse para implementar diversos aspectos de la presente invención.
FORMAS DE LLEVAR A CABO LA INVENCIÓN A. Introducción La Fig. 1 es una ilustración esquemática de un sistema de codificación de audio de dos canales que incluye un transmisor 100 y un receptor 200. El transmisor 100 recibe de las vías 1 1 , 12 dos canales de señales de entrada de audio. Los bancos de filtros de análisis 111 , 112 se aplican a los canales de entrada de audio para obtener un primer conjunto de señales de sub-banda de frecuencia que representan el contenido espectral de las señales de entrada de audio. Estos bancos de filtros de análisis se implementan mediante transformadas en el dominio del tiempo al dominio de la frecuencia. El codificador 120 aplica un proceso de codificación al primer conjunto de señales de sub-banda de frecuencia para generar información codificada, que pasa por la vía 20. El receptor 200 recibe la información codificada de la vía 20. El decodificador 220 aplica un proceso de decodificación a la información codificada para obtener un segundo conjunto de señales de sub-banda de frecuencia. Los bancos de filtros de síntesis 231 , 232 se aplican al segundo conjunto de señales de sub-banda de frecuencia para generar dos o más canales de señales de salida de audio, que pasan por las vías 31 , 32.
Estos bancos de filtros de síntesis se implementan mediante transformadas en el dominio de la frecuencia al dominio del tiempo. La vía 20 puede ser un medio de transmisión, un medio de comunicación punto a punto, un medio de grabación o cualquier otro medio que pueda transmitir o grabar la información codificada.
El codificador 120 y el decodificador 220 no son esenciales para la práctica de la presente invención. Si se utilizan, pueden realizar procesos de codificación tanto sin pérdida como con pérdida. La presente invención no está limitada por ningún proceso particular de codificación ni decodificación.
En los dibujos se muestran solamente dos canales de señales de entrada y salida de audio para hacer más claro el ejemplo. En muchas ¡mplementaciones, existen más de dos canales de señales de entrada de audio y más de dos canales de señales de salida de audio. Al menos una de las señales de salida de audio tiene un ancho de banda que es mucho más angosto que el ancho de banda que una o varias de las otras señales de salida de audio.
La presente invención está dirigida hacia la reducción de los recursos informáticos que se necesitan para realizar la transformada que implementa el banco de filtros de síntesis 231 o 232 en el receptor 200 utilizado para generar señales de salida de audio de ancho de banda más angosto. La presente invención puede implementar un banco de filtros de síntesis más eficiente en un receptor 200 que mantiene compatibilidad con un banco de filtros de análisis en los transmisores existentes 100.
La presente invención también puede utilizarse para reducir los recursos informáticos necesarios para realizar la transformada que implementa el banco de filtros de análisis 111 o 112 en el transmisor 100 aplicado a señales de entrada de audio de ancho de banda más angosto. Esta implementación puede mantener la compatibilidad con un banco de filtros de síntesis en los receptores existentes 200.
B. Técnicas de implementación Los bancos de filtros de síntesis pueden implementarse mediante una amplia variedad de transformadas del dominio de la frecuencia al dominio del tiempo inclusive muchas variaciones de la Transformada Discreta Inversa del Coseno (IDCT) y la Transformada Discreta Inversa del Coseno Modificada mencionada anteriormente. Los algoritmos que definen estas transformadas en una forma directa se denominan en la presente "transformadas directas".
Una técnica denominada en la presente "técnica de plegado" puede utilizarse para realizar estas transformadas directas de modo más eficaz. La técnica de plegado comprende tres etapas como se ¡lustra en la Fig. Nro. 2. La segunda etapa 402 realiza una transformada que tiene una longitud más corta que la transformada directa que implementa esta técnica de plegado. La transformada que se realiza en la segunda etapa 402 se denomina una "transformada plegada" de modo que en la siguiente descripción se la pueda distinguir más fácilmente de la transformada directa.
La etapa de pre-procesador 401 combina los coeficientes de transformada en un bloque de K coeficientes de transformada de valores reales en el dominio de la frecuencia en un bloque de ½ K coeficientes de transformada de valores complejos. La etapa de la transformada 402 aplica una transformada plegada del dominio de la frecuencia al dominio del tiempo de longitud ½ al bloque de coeficientes de transformada de valores complejos para generar ½ K muestras en el dominio del tiempo de valores complejos. La etapa del post-procesador 403 deriva una secuencia de K muestras en el dominio del tiempo de valores reales a partir de las ½ K muestras de señales en el dominio del tiempo de valores complejos. Excepto por algún error que pudiera ocurrir debido a las operaciones aritméticas de precisión finita, las K muestras de señales en el dominio del tiempo que se obtienen mediante esta técnica son idénticas a las K muestras de señales en el dominio del tiempo que podrían obtenerse al aplicar la transformada directa de longitud K al bloque de K coeficientes de transformada en el dominio de la frecuencia de valores reales. Esta técnica mejora la eficacia debido a que la necesidad de recursos informáticos adicionales necesarios para realizar la transformada directa, en contraposición con la transformada plegada en la etapa 402 es mayor que los recursos informáticos necesarios para implementar los procesos realizados en la etapa de pre-procesador 401 y la etapa del post-procesador 403.
Si un bloque de coeficientes de transformada representa una señal de ancho de banda más angosto en la cual una cantidad importante de coeficientes de transformada es siempre cero, puede utilizarse una técnica adicional de descomposición de transformada para aumentar la eficiencia de procesamiento de la transformada plegada que se realiza en la etapa 402.
Esta técnica se detallará en las secciones a continuación. 1. Transformadas directas En la expresión 2 se muestra la IMDCT directa. Su Transformada Discreta del Coseno Modificada (MDCT) complementaria se muestra en la expresión 1 .
Donde X(k) = coeficiente de transformada K en el dominio de la frecuencia de valores reales; K = cantidad total de coeficientes de transformada en el dominio de la frecuencia de valores reales; x(n) = n muestras de señal en el dominio del tiempo de valores reales; y N = longitud de la ventana en el dominio del tiempo de las muestras, donde N = 2K.
La operación adecuada de estas transformadas directas requiere el uso de funciones ventana de análisis y funciones ventana de síntesis cuyas longitudes y formas satisfacen ciertos requisitos que son ampliamente conocidos en la técnica. La función ventana de análisis se aplica a los segmentos de N muestras de señales de entrada de audio antes de la aplicación de la MDCT. La función ventana de síntesis se aplica a los segmentos de N muestras obtenidas de la aplicación de la IMDCT a bloques de K coeficientes de transformada y estos segmentos de muestras ventaneados se superponen y agregan a los segmentos de muestras ventaneados obtenidos de otros bloques de coeficientes de transformada. Pueden obtenerse detalles adicionales del documento de Princen et al. citado anteriormente. Los párrafos siguientes omiten la exposición ulterior de la función ventana de análisis. 2. Técnica de plegado El proceso realizado en la etapa de pre-procesador 401 puede expresarse como: T(k) = ^ - tt-lj +/- X{2k) J- para 0 < & <— (3) 4 donde X'(k) = coeficiente de transformada k en el dominio de la frecuencia de valores complejos. j = operador imaginario igual a V-T.
La transformada plegada realizada en la etapa de transformada 402 puede expresarse como: x'(n) = muestra de señal en el dominio del tiempo de valores complejos.
El proceso realizado en la etapa post-procesador 403 puede expresarse como: donde y(n) = valor de muestra intermedio usado en subsiguientes cálculos de ventaneo; Re[^'(«)] = parte real del valor complejo x'(n); y Im[V («)] = parte imaginaria del valor complejo x'(n). 3. Función ventana de síntesis para IMDCT La operación adecuada de la IMDCT incluye aplicar una función ventana de síntesis adecuadamente diseñada a las muestras en el dominio del tiempo generadas mediante la transformada. Las muestras de señal en el dominio del tiempo que se obtienen a partir de esta operación de ventaneo pueden expresarse como: donde h(n) = punto n en la función ventana de síntesis; e y'(n) = muestra n intermedia ventaneada.
Las muestras intermedias ventaneadas y' obtenidas de la expresión 6 son las muestras intermedias en el dominio del tiempo que podrían haberse obtenido mediante la aplicación de la IMDCT directa a un bloque de los coeficientes de la transformada en el domino de la frecuencia X seguida de la aplicación de la función ventana de síntesis h. Como se explica en el documento de Princen citado anteriormente, las muestras de señales de salida en el dominio del tiempo se obtienen mediante superposición y adición de las muestras intermedias ventaneadas derivadas de un bloque de coeficientes de transformada "actual" con un conjunto de muestras intermedias ventaneadas "previo" derivadas de un bloque previo de coeficientes de transformada. Este proceso de superposición-adición puede expresarse como: x(n) = y'(n) + yp' rev (n) (7) donde / (n) = muestras intermedias previas ventaneadas. 4. Técnica de descomposición de transformada Puede utilizarse una técnica de descomposición de transformada para derivar un método más eficaz para realizar la transformada plegada para señales de ancho de banda limitado en las que se sabe que algunos de los coeficientes de transformada en un bloque de coeficientes de transformada en el dominio de la frecuencia es igual a cero. Esta técnica de descomposición consiste en expresar la transformada plegada como una transformada equivalente de dos dimensiones y descomponer esta transformada de dos dimensiones en una transformada vertical de una sola dimensión seguido de un banco de Transformada Discreta Inversa de Fourier (IDFT) horizontal de una sola dimensión. La transformada vertical tiene una longitud igual a Q y el banco de IDFT compleja horizontal comprende Q transformadas, cada una con una longitud igual a P, donde P y Q son enteros y el producto de P por Q equivale a la longitud de la transformada plegada.
Con referencia a la exposición precedente de la técnica de plegado, puede verse que la longitud de la transformada plegada es J = YA N = ½ K; por lo tanto, PQ = J. Los valores de P, Q y J tienen la restricción de ser potencias de dos.
La IDFT horizontal y la transformada vertical se muestran en las expresiones 8 y 9, respectivamente: (8) donde (9) El núcleo de la transformada WNn en la transformada vertical puede calcularse utilizando la ley de Euler: Debido a que los coeficientes de la transformada directa X(k) representan una señal de audio en un canal LFE con un ancho de banda limitado, únicamente L de esos coeficientes pueden tener un valor distinto de cero, donde L es mucho menor que K. Como resultado, no más de de los coeficientes de transformada en el dominio de la frecuencia de valores complejos X'(k) obtenidos de la etapa de pre-procesador 401 puede tener valores distintos de cero y la longitud de la transformada vertical pueden reducirse. Se elije un valor M tal que este es la menor potencia de dos igual o superior a este número y el proceso de plegado se modifica para derivar M coeficientes de transformada en el dominio de la frecuencia de valores complejos X'(k) que incluyen los L coeficientes de la transformada directa de valores reales que pueden tener valores distintos de cero.
Estos M coeficientes de transformada en el dominio de la frecuencia de valores complejos se procesan mediante la etapa de transformada 402. El tamaño R de la M transformada vertical se selecciona tal que R =— .
P Los coeficientes de transformada X'(P ' r + p) son cero para Pr + p > 2R o alternativamente, r= R. Teniendo en cuenta estas consideraciones, la expresión 9 puede escribirse como: para 0 < n < Q, 0 < p < P. 5. Preprocesador integrado y transformada vertical La eficacia de la técnica de plegado combinada con la técnica de descomposición de transformada como se describió anteriormente se puede mejorar adicionalmente integrando la etapa de pre-procesador 401 y la transformada vertical como se muestra en la expresión 9 en un proceso. Esto se ilustra esquemáticamente en la Fig. 3.
La longitud R de la transformada vertical se puede seleccionar para que sea igual al valor M o ser una potencia de dos submúltiplo -^ del valor M. En una realización de conformidad con la norma AC-3 mencionada anteriormente, la cantidad ½ N de coeficientes de transformada en el dominio de la frecuencia de valores reales es igual a 256 y el contenido espectral de la señal de audio en el canal LFE se puede representar mediante siete coeficientes de transformada X(k), donde 0= k < 7. La etapa de pre-procesador 401 pliega estos siete coeficientes de transformada de valores reales en cuatro coeficientes de transformada de valores complejos que se procesan subsiguientemente mediante la transformada plegada cuya longitud es J = ¼ N = 128. Como resultado, dados cuatro coeficientes de transformada de valores complejos en esta realización, M es igual a cuatro y R se puede determinar igual a 4, 2 o 1 al determinar P igual a 1 , 2 o , respectivamente. Debido a que PQ = J, la longitud de la transformada horizontal Q es igual a 128, 64 y 32 cuando P es igual a 1 , 2 y 4, respectivamente. Cuando P es igual a uno se logra un aumento de la eficiencia escaso o nulo.
Cuando P se determina igual a dos, no es necesario revertir los bits de los valores obtenidos de la salida de los índices de la transformada vertical dada la pequeña cantidad de coeficientes computados en cada una de las transformadas horizontales. La necesidad de revertir los bits de los índices de la transformada para el algoritmo de la FFT de Cooley-Tukey es ampliamente conocida. No es necesario revertir los bits cuando P se determina igual a dos, sin embargo la reversión de bits para una DFT compleja de longitud dos produce la misma indexación de coeficientes que se logra sin realizar la reversión de bits. Esta ventaja informática es contrarrestada por tener que realizar una gran cantidad de transformadas horizontales. Los valores de P y Q pueden seleccionarse en respuesta a diversas consideraciones de diseño, tales como limitaciones de procesamiento y el hardware elegido para implementar los procesos.
Se puede derivar una integración del proceso que se muestra en la expresión 3 con la transformada vertical que se muestra en la expresión 9 al sustituir X'(k) y ( WN/4 ) en la expresión 9 de acuerdo con las expresiones 3 y 10, respectivamente. Estas sustituciones dan por resultado la siguiente función núcleo para la transformada vertical: (12) El producto vectorial de los términos seno y coseno en la expresión 12 puede reescribirse como: — (— cosa-eos ? -I sen a-sen 0)—j- (cosa sen/? + sen a- eos 0) = -cos(a+yS)- J-sen[a +ß) (13) donde s = P-g + p ; Puede verse que que denotamos como l(s,n) para simplificar la siguiente expresión. Utilizando esta notación, la expresión 11 puede reescribirse como: V{*P) =?[ [ " ^-L)+J xi2»)] (-«B(/(v,i.))-y-se.,(;(vlH)))+ (15) donde v = P r + p; y N u =—— M + (P- r + p) .
Realizando la multiplicación compleja tenemos: (16) La complejidad informática de la función U(n,p) se puede reducir aún más aprovechando el hecho de que los coeficientes del dominio de la frecuencia X(v) pueden distintos de cero únicamente para 0= v <2R. Esta reducción se refleja en la siguiente expresión que también divide la función en funciones con componentes imaginarios y reales UR(n,p) y Ui(n,p), respectivamente, donde U(n,p) = UR(n,p) +j - U,(n,p): jt-t Ua(n,p) = £[jr(2v) sen(J( n))-jr(2Af-2v-l)8s(/(u-i-))] V¡(n,p)=?[-JT(2v) cos(/(K«))- X{2M -2v-l) sen(/(u,»))] Esta integración de la etapa de pre-procesador 401 y la transformada vertical se ilustra esquemáticamente en la Fig. 4 Los recursos informáticos requeridos para implementar la función U(n,p) o sus funciones componentes Up n,p) y U{n,p) se pueden reducir precalculando la función sen(/(v,n)), cos(/(v,n), sen(/(w,rí) y cos(l(u,n) para todos los valores de v, i; y n. El almacenamiento en tablas de consulta de los resultados calculados requiere entradas 4 P R Q, cuando el factor de cuatro cuentas para todas las combinaciones de seno, coseno, v y u en la expresión 17.
El tamaño de la tabla puede reducirse adicionalmente un 12,5% 71 reconociendo que l(0,n) -— para todo n. Como resultado, la cantidad de 4N entradas requeridas para todos los factores de X en la expresión 17 está en el orden de 3.5 PRQ.
Si el tamaño de las tablas es mayor que el deseado puede reducirse su tamaño aprovechando la ventaja de que muchas de las entradas para l(v,n) en la tabla tienen valores duplicados debido a la periodicidad de las funciones sobre la base de seno y coseno. Esta reducción en el tamaño se puede lograr a cambio de los recursos de procesamiento adicionales necesarios para las entradas de consulta en la tabla debido a que se necesitará un esquema de indexación más elaborado para acceder a los datos en la tabla.
Pueden utilizarse otras técnicas para reducir los requerimientos de tamaño de tabla. Por ejemplo, si las tablas de seno y coseno ya existen en una implementación particular, entonces solamente se necesitan l(v,n) e l(u,n), lo cual reduce la cantidad de entradas en la tabla en un factor de dos.
C. Implementación Los dispositivos que incorporan diversos aspectos de la presente invención pueden implementarse en una variedad de formas que incluyen programas de computación para que los ejecute una computadora o algún otro dispositivo que incluye componentes más especializados tales como circuitos procesadores de señales digitales (DSP) acoplados con componentes similares a aquellos que se encuentran en una computadora de uso general. La Fig. 5 es el esquema de un diagrama de bloques de un dispositivo 70 que puede utilizarse para implementar los aspectos de la presente invención. El procesador 72 proporciona recursos informáticos. RAM 73 es el sistema de memoria de acceso aleatorio (RAM) utilizado por el procesador 72 para procesar. ROM 74 representa alguna forma de almacenamiento permanente tal como una memoria sólo de lectura (ROM) para el almacenamiento de los programas necesarios para operar el dispositivo 70 y posibilitar llevar a cabo los diversos aspectos de la presente invención. El control l/O 75 representa los circuitos de interfaz para recibir y transmitir las señales mediante los canales de comunicación 76, 77. En la realización que se muestra, la totalidad de los componentes principales del sistema se conectan con el enlace común 71 , que puede representar más de un enlace común físico o lógico; sin embargo, no se requiere una arquitectura de enlace común para implementar la presente invención.
En realizaciones implementadas mediante un sistema de computación de propósitos generales, se pueden incluir componentes adicionales para la interfaz con dispositivos tales como un teclado o un ratón y una pantalla, y para controlar un dispositivo de almacenamiento 78 que tiene un medio de almacenamiento tal como un disco magnético o un medio óptico. El medio de almacenamiento se puede utilizar para grabar programas de instrucciones para sistemas operativos, utilidades y aplicaciones, y puede incluir programas que implementan diversos aspectos de la presente invención.
Las funciones requeridas para practicar los diversos aspectos de la presente invención pueden realizarse mediante componentes que se implementan en una amplia variedad de formas, inclusive componentes lógicos discretos, circuitos integrados, uno o varios ASIC y/o procesadores de programa controlado. La forma en que se implementan estos componentes carece de importancia para la presente invención.
Las implementaciones de programas informáticos de la presente invención se pueden transmitir mediante una variedad de medios legibles mecánicamente tales como vías de comunicación modulada o banda base a través de todo el espectro inclusive desde frecuencias supersónicas hasta ultravioletas, o medios de almacenamiento que transmiten información utilizando básicamente cualquier tecnología inclusive cintas magnéticas, tarjetas o discos, tarjetas o discos ópticos, y marcas detectables sobre medios inclusive papel.

Claims (7)

REIVINDICACIONES
1. Un método para procesar una señal de audio digital, donde el método comprende: recibir un bloque de coeficientes de transformada de valores reales, donde el bloque tiene una cantidad K de coeficientes de transformada de valores reales de los cuales solamente una cantidad L de los coeficientes de transformada de valores reales representa componentes espectrales de una señal de audio de ancho de banda limitado, ½ L < M < K, y M es una potencia de dos; aplicar una primera transformada de longitud R a un bloque de coeficientes de valores complejos derivados de M coeficientes de transformada de valores complejos que incluyen los L coeficientes de transformada de valores reales que representan componentes espectrales de la señal de audio de ancho de banda M limitado, donde R =— y P es una potencia de dos; aplicar un banco de Q segundas transformadas de longitud P a las salidas de la primera transformada; y derivar una secuencia de N muestras de señales de valores reales de las salidas del banco de las segundas transformadas, donde N = 2 K y las muestras de señales de valores reales representan componentes temporales de la señal de audio de ancho de banda limitado.
2. El método de la reivindicación 1 , donde: cada una de las segundas transformadas es equivalente a realizar los cálculos expresados como para 0=n < Q y 0 =m < P; la secuencia de muestras de señales de valores reales se deriva de las salidas del banco de segundas transformadas mediante la realización de cálculos equivalentes a donde x' representa las salidas de la segunda transformada; U(n,p) = una función núcleo de la primera transformada; (n) representa las muestras de la señal intermedia; Re[ («)] _ |a parte rea| x («) _ L v '? = la parte imaginaria ' ; j = operador imaginario igual a m, n p son índices utilizados en los cálculos.
3. El método de la reivindicación 2, donde la primera transformada es equivalente a realizar los cálculos expresados como para 0 < n < Q y 0 < p < P; donde X representa los coeficientes de transformada de valores reales; M R = r es un índice utilizado en los cálculos.
4. El método de la reivindicación 2, donde la primera transformada es equivalente a la realización de cálculos expresados como para O < n < Q y 0=p< P; donde X representa los coeficientes de transformada de valores reales; p · r es un índice utilizado en los cálculos.
5. El método de la reivindicación 2, donde la primera transformada equivalente a la realización de cálculos expresados como Us (?,?) =? [X(2v) sen(/(, «)) - X{2M - 2 -l) cus (/(a,*))] para 0 < n < Q y 0<p<P; donde X representa los coeficientes de transformada de valores reales; v=P-r + p; r es un índice utilizado en los cálculos.
6. Un aparato para procesar una señal de audio digital, donde el aparato comprende medios para realizar todos los pasos del método de cualquiera de las reivindicaciones 1 a 5.
7. Un medio de almacenamiento que graba un programa de instrucciones que es ejecutable mediante un dispositivo para realizar un método para procesar una señal de audio digital, donde el método comprende todos los pasos del método de cualquiera de las reivindicaciones 1 a 5.
MX2013011131A 2011-03-28 2012-03-19 Transformada con complejidad reducida para canal de efectos de baja frecuencia. MX2013011131A (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201161468373P 2011-03-28 2011-03-28
PCT/US2012/029603 WO2012134851A1 (en) 2011-03-28 2012-03-19 Reduced complexity transform for a low-frequency-effects channel

Publications (1)

Publication Number Publication Date
MX2013011131A true MX2013011131A (es) 2013-10-30

Family

ID=45931032

Family Applications (1)

Application Number Title Priority Date Filing Date
MX2013011131A MX2013011131A (es) 2011-03-28 2012-03-19 Transformada con complejidad reducida para canal de efectos de baja frecuencia.

Country Status (20)

Country Link
US (1) US10410644B2 (es)
EP (1) EP2691951B1 (es)
JP (1) JP5762620B2 (es)
KR (1) KR101411297B1 (es)
CN (1) CN103415883B (es)
AU (1) AU2012238001B2 (es)
CA (1) CA2826018C (es)
CL (1) CL2013002762A1 (es)
DK (1) DK2691951T3 (es)
EA (1) EA030776B9 (es)
ES (1) ES2598827T3 (es)
HK (1) HK1189699A1 (es)
HU (1) HUE030185T2 (es)
IL (1) IL227635A (es)
MX (1) MX2013011131A (es)
MY (1) MY166267A (es)
PL (1) PL2691951T3 (es)
SG (1) SG193237A1 (es)
UA (1) UA107293C2 (es)
WO (1) WO2012134851A1 (es)

Family Cites Families (74)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2888554A (en) 1955-09-06 1959-05-26 Rca Corp Diversity reception
US3900721A (en) 1974-02-14 1975-08-19 Us Navy Serial-access linear transform
US4241411A (en) 1978-11-16 1980-12-23 Probe Systems, Incorporated FFT Parallel processor having mutually connected, multiple identical cards
US4579032A (en) 1984-09-10 1986-04-01 Kawai Musical Instrument Mfg. Co., Ltd Computation time reduction in a polyphonic tone synthesizer
US5394349A (en) 1992-07-10 1995-02-28 Xing Technology Corporation Fast inverse discrete transform using subwords for decompression of information
IL107658A0 (en) 1993-11-18 1994-07-31 State Of Israel Ministy Of Def A system for compaction and reconstruction of wavelet data
US5671168A (en) 1995-07-06 1997-09-23 Technion Research & Development Foundation Ltd. Digital frequency-domain implementation of arrays
US5742527A (en) 1996-03-15 1998-04-21 Motorola, Inc. Flexible asymmetrical digital subscriber line (ADSL) receiver, central office using same, and method therefor
US5781728A (en) 1996-03-15 1998-07-14 Motorola Inc. Flexible asymmetrical digital subscriber line ADSL transmitter, remote terminal using same, and method therefor
US5841890A (en) 1996-05-06 1998-11-24 Northrop Grumman Corporation Multi-dimensional wavelet tomography
US6252965B1 (en) 1996-09-19 2001-06-26 Terry D. Beard Multichannel spectral mapping audio apparatus and method
SE515535C2 (sv) 1996-10-25 2001-08-27 Ericsson Telefon Ab L M En transkoder
SG54383A1 (en) 1996-10-31 1998-11-16 Sgs Thomson Microelectronics A Method and apparatus for decoding multi-channel audio data
SE9703849L (sv) 1997-03-14 1998-09-15 Ericsson Telefon Ab L M Nedskalning av bilder
US6002914A (en) 1997-07-10 1999-12-14 The United States Of America As Represented By The Secretary Of The Navy Method and apparatus for simulating reverberation in a multipath sonar system
US5995803A (en) 1997-07-10 1999-11-30 The United States Of America As Represented By The Secretary Of The Navy Method and apparatus for simulating a multipath sonar system
US5978647A (en) 1997-07-10 1999-11-02 The United States Of America As Represented By The Secretary Of The Navy Method and apparatus for simulating autocorrelation coefficients in a multipath sonar system
US5983067A (en) 1997-07-10 1999-11-09 The United States Of America As Represented By The Secretary Of The Navy Method and apparatus for simulating cross-correlation coefficients in a multipath sonar system
US5978646A (en) 1997-07-10 1999-11-02 The United States Of America As Represented By The Secretary Of The Navy Method and apparatus for simulating a lofargram in a multipath sonar system
DE69738204D1 (de) 1997-08-29 2007-11-22 St Microelectronics Asia Schnelles syntheseverfahren für die sub-bandfiltrierung für die dekodierung von digitalen signalen
US6263312B1 (en) 1997-10-03 2001-07-17 Alaris, Inc. Audio compression and decompression employing subband decomposition of residual signal and distortion reduction
US6081783A (en) 1997-11-14 2000-06-27 Cirrus Logic, Inc. Dual processor digital audio decoder with shared memory data transfer and task partitioning for decompressing compressed audio data, and systems and methods using the same
US6847737B1 (en) 1998-03-13 2005-01-25 University Of Houston System Methods for performing DAF data filtering and padding
US6324559B1 (en) 1998-10-16 2001-11-27 Telefonaktiebolaget Lm Ericsson (Publ) Odd-transform fast convolution
US6477553B1 (en) 1999-01-13 2002-11-05 Philip Druck Measurement scale for non-uniform data sampling in N dimensions
US6430529B1 (en) 1999-02-26 2002-08-06 Sony Corporation System and method for efficient time-domain aliasing cancellation
US6643406B1 (en) 1999-07-28 2003-11-04 Polaroid Corporation Method and apparatus for performing linear filtering in wavelet based domain
EP1236087A1 (en) 1999-10-28 2002-09-04 Philip Druck Self-stabilizing, portable and efficient computer arithmetic using mappings of d scale points
AU2001250817A1 (en) 2000-03-10 2001-09-24 Jaber Associates, L.L.C. Parallel multiprocessing for the fast fourier transform with pipeline architecture
US7246143B2 (en) 2000-04-07 2007-07-17 Comsat Corporation Traced fast fourier transform apparatus and method
DE60132853D1 (de) 2000-07-07 2008-04-03 Nokia Siemens Networks Oy Verfahren und Vorrichtung für die perzeptuelle Tonkodierung von einem mehrkanal Tonsignal mit Verwendung der kaskadierten diskreten Cosinustransformation oder der modifizierten diskreten Cosinustransformation
US6768517B2 (en) 2000-07-11 2004-07-27 Allen Le Roy Limberg Repetitive-PN1023-sequence echo-cancellation reference signal for single-carrier digital television broadcast systems
WO2002057901A1 (en) 2001-01-17 2002-07-25 Exxonmobil Upstream Research Company Simulation method and system using component-phase transformations
US7020672B2 (en) 2001-03-30 2006-03-28 Koninklijke Philips Electronics, N.V. Reduced complexity IDCT decoding with graceful degradation
WO2002091221A2 (en) 2001-05-07 2002-11-14 Jaber Associates, L.L.C. Address generator for fast fourier transform processor
US7366236B1 (en) 2001-06-04 2008-04-29 Cisco Sytems Canada Co. Source adaptive system and method for 2D iDCT
GB2383412B (en) 2001-12-18 2004-06-30 Univ Sheffield Structural health monitoring
US6776760B2 (en) 2002-03-06 2004-08-17 Alfred E. Mann Institute For Biomedical Engineering At The University Of Southern California Multi-mode processing for ultrasonic imaging
US6850589B2 (en) 2002-03-27 2005-02-01 Agilent Technologies, Inc. Tomography of curved surfaces
US7231303B2 (en) 2002-04-13 2007-06-12 I-For-T Gmbh Vibration sensor and method for monitoring the condition of rotating components and bearings
DE10234130B3 (de) * 2002-07-26 2004-02-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen einer komplexen Spektraldarstellung eines zeitdiskreten Signals
US7277493B2 (en) 2003-01-28 2007-10-02 Agere Systems Inc. Equalization in orthogonal frequency domain multiplexing
EP1618686A1 (en) 2003-04-30 2006-01-25 Nokia Corporation Support of a multichannel audio extension
US20040230419A1 (en) 2003-05-15 2004-11-18 Divio, Inc. DRAM access for MDCT/IDMCT implementation
US7606138B2 (en) 2003-09-29 2009-10-20 Her Majesty The Queen In Right Of Canada, As Represented By The Minister Of Industry, Through The Communications Research Centre Canada Multi-symbol encapsulated OFDM system
CN1914669A (zh) * 2004-01-28 2007-02-14 皇家飞利浦电子股份有限公司 使用复数值数据的音频信号解码
US7702002B2 (en) 2004-01-28 2010-04-20 Qualcomm Incorporated Rapid acquisition methods and apparatus for GPS signals
EP1895512A3 (en) 2004-04-05 2014-09-17 Koninklijke Philips N.V. Multi-channel encoder
US7483480B2 (en) 2004-11-24 2009-01-27 Nokia Corporation FFT accelerated iterative MIMO equalizer receiver architecture
JP4943418B2 (ja) 2005-03-30 2012-05-30 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ スケーラブルマルチチャネル音声符号化方法
CN101151660B (zh) 2005-03-30 2011-10-19 皇家飞利浦电子股份有限公司 多通道音频编码器、解码器以及相应方法
WO2006103584A1 (en) 2005-03-30 2006-10-05 Koninklijke Philips Electronics N.V. Multi-channel audio coding
US7961890B2 (en) 2005-04-15 2011-06-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung, E.V. Multi-channel hierarchical audio coding with compact side information
EP2088580B1 (en) 2005-07-14 2011-09-07 Koninklijke Philips Electronics N.V. Audio decoding
US8443026B2 (en) * 2005-09-16 2013-05-14 Dolby International Ab Partially complex modulated filter bank
EP1969901A2 (en) 2006-01-05 2008-09-17 Telefonaktiebolaget LM Ericsson (publ) Personalized decoding of multi-channel surround sound
US8112247B2 (en) 2006-03-24 2012-02-07 International Business Machines Corporation Resource adaptive spectrum estimation of streaming data
CN101411063B (zh) 2006-03-28 2011-11-23 艾利森电话股份有限公司 滤波器自适应频率分辨率
US20070286431A1 (en) 2006-05-25 2007-12-13 Microlink Communications Inc. Headset
US8700387B2 (en) 2006-09-14 2014-04-15 Nvidia Corporation Method and system for efficient transcoding of audio data
CN101192269B (zh) 2006-11-29 2012-05-02 佳能株式会社 从图像估计消失点的方法和装置、计算机程序及其存储介质
TWI370636B (en) 2007-03-02 2012-08-11 Qualcomm Inc Physical layer repeater utilizing real time measurement metrics and adaptive antenna array to promote signal integrity and amplification
US8548815B2 (en) 2007-09-19 2013-10-01 Qualcomm Incorporated Efficient design of MDCT / IMDCT filterbanks for speech and audio coding applications
US20090141808A1 (en) 2007-11-30 2009-06-04 Yiufai Wong System and methods for improved video decoding
US8497743B2 (en) 2007-12-24 2013-07-30 Telefonaktiebolaget L M Ericsson (Publ) Passive fourier transform circuits and butler matrices
US7907683B2 (en) 2008-04-28 2011-03-15 Newport Media, Inc. Application of superfast algorithms to a pilot-based channel estimation process
US7940864B2 (en) 2008-04-28 2011-05-10 Newport Media, Inc. Channel estimation for high doppler mobile environments
FR2938947B1 (fr) * 2008-11-25 2012-08-17 A Volute Procede de traitement du signal, notamment audionumerique.
US8438204B2 (en) 2008-12-18 2013-05-07 Lsi Corporation Apparatus for calculating an N-point discrete fourier transform
US8787501B2 (en) 2009-01-14 2014-07-22 Qualcomm Incorporated Distributed sensing of signals linked by sparse filtering
EP2237269B1 (en) 2009-04-01 2013-02-20 Motorola Mobility LLC Apparatus and method for processing an encoded audio data signal
US9031834B2 (en) * 2009-09-04 2015-05-12 Nuance Communications, Inc. Speech enhancement techniques on the power spectrum
BR112012009447B1 (pt) 2009-10-20 2021-10-13 Voiceage Corporation Codificador de sinal de áudio, decodificador de stnai, de áudio, método para codificar ou decodificar um sinal de áudio usando um cancelamento de aliasing
US9093080B2 (en) * 2010-06-09 2015-07-28 Panasonic Intellectual Property Corporation Of America Bandwidth extension method, bandwidth extension apparatus, program, integrated circuit, and audio decoding apparatus

Also Published As

Publication number Publication date
SG193237A1 (en) 2013-10-30
JP2014514605A (ja) 2014-06-19
AU2012238001B2 (en) 2015-09-17
CN103415883A (zh) 2013-11-27
US20140012588A1 (en) 2014-01-09
IL227635A (en) 2017-05-29
JP5762620B2 (ja) 2015-08-12
IL227635A0 (en) 2013-09-30
CN103415883B (zh) 2015-11-25
UA107293C2 (uk) 2014-12-10
WO2012134851A1 (en) 2012-10-04
CL2013002762A1 (es) 2014-03-07
US10410644B2 (en) 2019-09-10
EA201370207A1 (ru) 2014-01-30
KR101411297B1 (ko) 2014-06-26
CA2826018C (en) 2016-05-17
EA030776B1 (ru) 2018-09-28
HUE030185T2 (en) 2017-04-28
HK1189699A1 (zh) 2014-06-13
MY166267A (en) 2018-06-22
PL2691951T3 (pl) 2017-03-31
EP2691951B1 (en) 2016-08-24
EP2691951A1 (en) 2014-02-05
DK2691951T3 (en) 2016-11-14
KR20130116914A (ko) 2013-10-24
CA2826018A1 (en) 2012-10-04
EA030776B9 (ru) 2019-01-31
ES2598827T3 (es) 2017-01-30

Similar Documents

Publication Publication Date Title
US9620132B2 (en) Decoding of multichannel audio encoded bit streams using adaptive hybrid transformation
JP2007526691A (ja) 信号解析及び合成のための適応型混合変換
CN102158198A (zh) 利用复调制滤波器组的高效滤波
AU2011226118B2 (en) Signal processor and method for processing a signal
TWI581252B (zh) 使用截斷分析或合成窗段重疊部分處理音訊信號的方法及處理器
Britanak et al. Cosine-/Sine-Modulated Filter Banks
CN102483943B (zh) 多通道音频解码方法及其设备
Khaldi et al. HHT-based audio coding
AU2014314477B2 (en) Frequency band table design for high frequency reconstruction algorithms
MX2013011131A (es) Transformada con complejidad reducida para canal de efectos de baja frecuencia.
TWI470622B (zh) 用於低頻效應頻道降低複雜度之轉換
AU2012238001A1 (en) Reduced complexity transform for a low-frequency-effects channel
BR112013022988B1 (pt) Método para processar um sinal de áudio digital, aparelho para processar um sinal de áudio digital e meio de armazenamento

Legal Events

Date Code Title Description
FG Grant or registration