MXPA06003508A

MXPA06003508A - Metodo para transformar una senal digital del dominio de tiempo al dominio de frecuencia y viceversa.

Info

Publication number: MXPA06003508A
Application number: MXPA06003508A
Authority: MX
Inventors: Rongshan Yu; Haibin Huang; Xiao Lin; Susanto Rahardja
Original assignee: Agency Science Tech & Res
Priority date: 2003-09-29
Filing date: 2004-05-06
Publication date: 2007-01-25
Also published as: US20070276893A1; TW200529040A; TWI348282B; JP2009266250A; US8126950B2; MY139788A; MY137920A; KR100885438B1; US8126951B2; KR20070015363A; WO2005031595A1; TWI343534B; TW200527224A; EP1668533A1; JP4942793B2; TW200524290A; KR20070026325A; WO2005031597A1; US20070276894A1; WO2005031596A1

Abstract

Un metodo para transformar una senal digital del dominio de tiempo al dominio de frecuencia y viceversa empleando una funcion de transformacion que comprende una matriz de transformacion; la senal digital comprende simbolos de datos que se agrupan en una pluralidad de bloques, cada bloque comprende un numero predeterminado de simbolos de datos. El metodo incluye el proceso para transformar dos bloques de la senal digital por medio de un elemento transformador, en donde el elemento transformador corresponde a una matriz diagonal de bloques que a su vez comprende dos submatrices, en donde cada submatriz comprende la matriz de transformacion, el elemento transformador comprende una pluralidad de etapas de estiramiento, donde cada etapa de estiramiento comprende el procesamiento de bloques de la senal digital por medio de una transformacion auxiliar por medio de una unidad de redondeo.

Description

frecuencia y viceversa y un medio legible en calculadora" (Process and Device for Determining a Transforming Element for a Given Transformation Function, Method and Device for Transforming a Digital Signal from the Time Domain into the Frequency Domain and vice versa and Computer Readable Médium), Referencia del Abogado No. P100452.

ANTECEDENTES DE LA INVENCIÓN Esta invención se refiere un método para transformar una señal digital del dominio de tiempo al dominio de frecuencia y viceversa. Las transformaciones de dominio, por ejemplo, la transformada discreta de coseno (TDC) , se emplean ampliamente en la industria moderna de procesamiento ' de señales. Recientemente, una variante de la TDC, llamada TDC de número entero, ha atraído un gran interés de investigación debido a su función importante en aplicaciones de codificación sin pérdida. El término "sin pérdida" significa que el decodificador puede generar una copia exacta de la señal fuente desde la corriente de bitios codificados. La TDC es una transformada de bloques de valor real . Aún si el bloque de entrada consiste únicamente de números enteros, el bloque de salida de la TDC puede comprender componentes que no sean números enteros. Por conveniencia, el bloque de entrada se identifica como vector de entrada y el bloque de salida como vector de salida. Si un vector comprende sólo componentes de números enteros, se denomina un vector de números enteros. En contraste con la TDC, la TDC de números enteros genera un vector de salida de números enteros a partir de un vector de entrada de números enteros. Para el mismo vector de entrada de números enteros, el vector de salida de números enteros de la TDC de números enteros se aproxima estrechamente al vector de salida real de la TDC. Por consiguiente, la TDC de números enteros mantiene todos los buenos perfiles de la TDC en el análisis espectral. Una propiedad importante de la TDC de números enteros es la reversibilidad. El término reversibilidad significa que existe una TDC inversa (TDCI) de números enteros, de tal manera que si la TDC de números enteros genera un vector de salida y a partir de un vector de entrada x, la TDCI de números enteros puede recuperar el vector x a partir del vector y. Algunas veces la TDC de números enteros también se denomina la transformada directa, la TDCI de números enteros como la transformada regresiva o inversa. Recientemente se ha propuesto una transformada identificada transformada discreta de coseno modificada de números enteros (TDCMent) se ha empleado en la compresión de audio MPEG-4 de ISO/lEC. La TDCMent se puede derivar a partir de su prototipo - la transformada discreta de coseno modificada (TDCM) . La descripción de H. S. Malvar en "Procesamiento de señales con transformadas solapadas" (Signal Processing with Lapped Transforme) Artech House, 1992, proporciona una realización eficiente de la TDCM al conectar en cascada un banco de rotaciones de Givens con un bloque de TDC-IV. Es bien sabido que la rotación de Givens se puede factorizar en tres pasos de estiramiento para agrupar números enteros con números enteros. Véase, por ejemplo, R. Geiger, T. Sporer, J. oller, K. Brandenburg, "Codificación de audio con base a transformadas de números enteros" [Audio Coding based on Integer Transforme) AES IIIth Convention, New York, EE.UU., Sept . 2001. Por consiguiente, la realización de la TDCMent se basa en una implementación eficiente de la TDC-IV de números enteros. Las transformadas de números enteros se pueden convertir directamente a partir de sus prototipos al reemplazar cada rotación de Givens con tres pasos de estiramiento. Debido a que en cada paso de estiramiento no hay ninguna operación de redondeo, el número total redondeado de una transformada de números enteros es tres veces el número de rotaciones de Givens de la transformada prototipo. Para transformadas trigonométricas discretas (por ejemplo, la Transformada Discreta de Fourier (TDF) o la transformada discreta de coseno (TDC) ) , el número de rotaciones de Givens involucradas por lo usual está en nivel Nlog2N, donde N es el tamaño de los bloques, es decir, la cantidad de símbolos de datos incluidos en cada bloque, la señal de digital se divide adentro. Por consiguiente, el número total redondeado también se encuentra en nivel .Nlc^N para la familia de transformadas de números enteros directamente convertido. Debido a estos redondeos, una transformada de números enteros sólo se aproxima a su prototipo de punto flotante . El error de aproximación se incrementa con el número de redondeos . Por consiguiente, lo que se necesita son sistemas y métodos para llevar a cabo una transformación de dominio de una señal digital de una manera más eficiente.

SUMARIO DE LA INVENCIÓN La presente invención proporciona sistemas y métodos para para llevar a cabo una transformación de dominio de una señal digital, por medio del cual dos bloques de datos de entrada se someten a una transformación de dominio simultáneamente en la misma operación. Esta configuración reduce el número de operaciones de redondeo efectivas, y por consiguiente el error de aproximación. En una modalidad de la presente invención, se presenta un método para transformar una señal digital del dominio de tiempo al dominio de frecuencia y viceversa empleando una función de transformación. La función de transformación comprende una matriz de transformación, la señal digital comprende símbolos de datos que se agrupan en una pluralidad de bloques, cada bloque comprende un número predefinido de símbolos de datos. El método comprende la acción de transformar dos bloques de la señal digital por medio de un elemento transformador, en donde el elemento transformador corresponde a una matriz diagonal de bloques que comprende dos submatrices, en donde cada submatriz comprende la matriz de transformación y el elemento transformador comprende una pluralidad de pasos de estiramiento y en donde cada paso de estiramiento comprende el procesamiento de bloques de la señal digital por medio de una transformación auxiliar y por medio de una unidad de redondeo . Estas y otras características de la presente invención se comprenderán mejor cuando se expliquen haciendo referencia a los dibujos y a la descripción detallada de las modalidades específicas.

BREVE DESCRIPCIÓN DE LOS DIBUJOS La Figura 1 muestra la arquitectura de un codificador de audio de acuerdo con una modalidad de la presente invención; La Figura 2 muestra la arquitectura de un codificador de audio de acuerdo con una modalidad de la presente invención, que corresponde al codificador de audio mostrado en la Figura 1 ; La Figura 3 muestra un diagrama de flujo de una modalidad del método de acuerdo con la presente invención; La Figura 4 ilustra una modalidad del método de acuerdo con la presente invención empleando la TDC-IV como la función de transformación; La Figura 5 ilustra el algoritmo para la transformación inversa de acuerdo con la modalidad de la presente invención ilustrada en la Figura 4; La Figura 6 muestra la arquitectura de un sistema de almacenamiento de imágenes de acuerdo con una modalidad de la presente invención; La Figura 7 muestra los codificadores directo e inverso empleados para evaluar el desempeño del sistema y método propuestos .

DESCRIPCIÓN DETALLADA DE LAS MODALIDADES ESPECÍFICAS La Figura 1 muestra la arquitectura de un codificador de audio 100 de acuerdo con una modalidad de la presente invención. El codificador de audio 100 comprende un codificador base estratificado perceptivo convencional 52/355 basado en la transformada discreta de coseno modificada (TDCM) y un codificador intensificador sin pérdida basado en la transformada discreta de coseno modificada de números enteros (TDCMent) . Una señal de audio 109 la cual se proporciona, por ejemplo, por medio del micrófono 110 y que se digitaliza por medio de un convertidor de análogo a digital 111 se proporciona al codificador de audio 100. La señal de audio 109 comprende una pluralidad de símbolos de datos. La señal de audio 109 se divide en una pluralidad de bloques, en donde cada bloque comprende una pluralidad de símbolos de datos de la señal digital y cada bloque se transforma por medio de un dispositivo 101 de transformada discreta de coseno modificada (TDCM) . Los coeficientes de la TDCM se cuantifican por medio de un cuantificador 103 con la ayuda de un modelo perceptivo 102. El modelo perceptivo controla el cuantificador 103 de manera que las distorsiones audibles que se originan por el error de aproximación son bajas. Los coeficientes de TDCM cuantificados posteriormente se codifican mediante el codificador 104 de corriente de bitios lo que produce la corriente de bitios 112 de salida codificada perceptivamente con pérdida. El codificador 104 de corriente de bitios comprime sin pérdidas su entrada para producir una salida que tenga un índice de bitios promedio inferior que su 52/355 entrada, esto mediante métodos estándares, como por ejemplo, el método de codificación de Huffman o el método de codificación por longitud de recorridos. La señal de audio de entrada 109 también se alimenta en un dispositivo de TDCMent 105 que produce coeficientes de TDCMent . Los coeficientes de TDC cuantificados , los cuales son la salida del cuantificador 103, se emplean para predecir los coeficientes TDCMent. Los coeficientes de TDCM cuantificados se alimentan en un cuantificador inverso 106 y la salida (los coeficientes TDCM restaurados o no cuantificados) se alimenta a unidad de redondeo 107. Los redondeos de unidad hacia un valor de número entero de los coeficientes de TDCM y de los coeficientes de TDCMent residuales, los cuales son la diferencia entre la TDCM de valor de número entero y los coeficientes de TDCMent, se someten a codificación entrópica por medio de un codificador entrópico 108. El codificador entrópico, el codificador de análogo a corriente de bitios 104, reduce sin pérdidas el índice bitios promedio de su entrada y produce una corriente de bitios 113 intensificadora para la acción de no presentar pérdidas. La corriente de bitios 113 intensificadora de la acción para no presentar pérdidas junto con la corriente de bitios perceptivamente codificada 112, portan la suficiente información para reconstruir la señal de audio de entrada 109 con un error mínimo. 52/355 La Figura 2 muestra la arquitectura de un codificador de audio 200 que comprende una modalidad de la presente invención, que corresponde al codificador de audio 100 mostrado en la Figura 1. La corriente de bitios perceptivamente codificada 207 se suministra a un codificador de corriente de bitios 201, el cual realiza las operaciones inversas con respecto a las operaciones del codificador corriente de bitios 104 de la Figura 1, lo que produce una corriente de bitios decodificada . La corriente de bitios decodificada se suministra a un cuantificador inverso 202, cuya salida (coeficientes de TDCM restaurados) se suministran al dispositivo TDCM inverso 203. En consecuencia, se obtiene la señal de audio perceptivamente codificada 209. La corriente de bitios 208 intensificadora para la acción de no presentar pérdidas se suministra hacia un codificador entrópico 204, el cual realiza las operaciones inversas con respecto a las operaciones del codificador corriente de bitios 108 de la Figura 1 y que produce los coeficientes de TDCMent residuales correspondientes. La salida del cuantificador inverso 202 se redondea mediante un dispositivo de redondeo 205 para producir coeficientes de TDCM de valor de número entero. Los coeficientes de TDCM de valor de número entero se agregan a los coeficientes de TDCMent residuales, con lo que se produce los coeficientes 52/355 de TDCMent. Por último, la TDCMent inversa se aplica a los coeficientes de TDCMent por medio del dispositivo de TDCMent inversa 206 para producir la unidad de audio 210 reconstruida y codificada sin pérdidas. La Figura 3 muestra el diagrama de flujo 300 de una modalidad del método de acuerdo con la presente invención empleando la TDC-IV como una transformación y empleando tres pasos de estiramiento, un primer paso de estiramiento 301, un segundo paso de estiramiento 302 y un tercer paso de estiramiento 303. Este método se emplea de preferencia en el dispositivo de TDCMent 105 de la Figura 1 y en el dispositivo de TDCMent inversa 206 de la Figura 2 para implementar la TDCMent y TDCMent inversa, respectivamente. En la Figura 3, x2 y x2 son dos bloques primero y segundo de la señal digital, respectivamente, z es una señal intermedia, e y e y2 son señales de salida que corresponden al primero y segundo bloques de la señal digital, respectivamente. Tal como se ha explicado en lo anterior, el algoritmo de la TDC-IV tiene una función importante en la codificación de audio sin pérdida. La función de transformación de la TDC-IV comprende la matriz de transformación . De acuerdo con esta modalidad de la presente invención, el elemento transformador corresponde a una matriz diagonal de bloques 52/355 comprende dos bloques, en donde cada bloque comprende matriz de transformación CÍT .

De tal modo que, en esta modalidad, la matriz que corresponde al elemento transformador de acuerdo con la presente invención es : /-t IiVl IV c CA, en el contexto de esta modalidad se denominará la matriz de transformación tratada en lo anterior. El número de matrices de estiramiento, y en consecuencia el número de pasos de estiramiento en el elemento transformador en esta modalidad de la presente invención, en donde TDC-IV es la función de transformación, es tres . La TDC-IV de una secuencia x(n) de entrada real en el punto jV se define de la siguiente manera: Considerando Cs, la matriz de transformación de TDC-IV, es decir: 52/355 La siguiente relación mantiene para la matriz TDC-IV inversa: En particular, la matriz IV es involutiva. con x = e ¿; = [m(w)L,w-i ' la ecuación 4 puede expresar como Ahora, considerando xlr x2 dos vectores de números enteros de columna Nx.1. Los vectores de columna ? , x2 que corresponden a dos bloques de la señal digital, de acuerdo con la presente invención, se transforman por un elemento transformador. Las transformadas TDC-IV de xlf x2 son ylr y2l respectivamente. (5) Combinando (5) y {6] La anterior matriz diagonal es la matriz de bloques-diagonal en la que corresponde al elemento 52/355 transformador . se encuentra dentro del alcance de la presente invención si la ecuación anterior se cambia por simples modificaciones algebraicas como la que nos lleva a: Considerando T2N la contra matriz diagonal en (8) , es decir: La 7^- de la matriz se puede factorizar de la siguiente manera: Donde IN es la matriz identidad NxN. La ecuación (10) se puede verificar fácilmente empleando la propiedad TDC-IV en la ecuación (3) . Haciendo uso de la ecuación (10) , la ecuación (8) se puede expresar como: 52/355 Las tres matrices de estiramiento en la ecuación (11) corresponden a los tres pasos de estiramiento mostrados en la Figura 3. A partir de la ecuación (11) , se deriva el siguiente algoritmo TDC-IV de números enteros el cual calcula dos TDC-IV de números enteros con un elemento transformador. La Figura 4 ilustra la modalidad del método de acuerdo con la presente invención empleando TDC-IV como la función de transformación. Esta modalidad se emplea en el codificador de audio 100 mostrado en la Figura 1 para implementar la TDCMent . Al igual que en la Figura 3, ¾ y x2 son dos bloques de la señal digital de entrada, z es una señal intermedia, e yx e y_2 son bloques correspondientes de la señal de salida. Los tres pasos de estiramiento ilustrados en la Figura 4 corresponden a las tres matrices de estiramiento en la ecuación (11) . Tal como se ilustra en la Figura 4, la transformada con números enteros de dominio tiempo a frecuencia se determina de la siguiente manera: En el primer paso 401, x2 se transforma con una transformación TDC-IV 402 y los coeficientes de TDC-IV se redondean 403. Los coeficientes de TDC-IV redondeados después se agregan a xx 404. Por consiguiente, se genera la 52/355 señal intermedia z. En consecuencia, la señal intermedia z cumple con la ecuación: En el segundo paso 405, z se transforma con la transformación TDC-IV 406 y los coeficientes de TDC-IV se redondean 407. Después se sustraen los coeficientes redondeados de TDC-IV a partir de ¾. Por consiguiente, se genera la señal de salida ? . Por ello, la señal de salida ?? cumple con la ecuación: En el tercer paso 409, ?± se transforma con la transformación TDC-IV 410 y los coeficientes de TDC-IV se redondean 411. Después se sustraen los coeficientes redondeados de TDC-IV a partir de z. Por consiguiente, se genera la señal de salida y2. Por ello, la señal de salida y2 cumple con la ecuación: donde [*] denota una operación de redondeo. La Figura 5 ilustra el algoritmo para la 52/355 transformación inversa de acuerdo con una modalidad del método de la presente invención empleando TDC-IV como la función de transformación. Esta modalidad se emplea en el codificador de audio 200 mostrado en la Figura 2 para implementar la TDCMent inversa. El algoritmo ilustrado en la Figura 5 es la inversa del algoritmo ilustrado en la Figura 4. Las denotaciones para las distintas señales yXl y?t ¾/ ¾ y z_ se eligen para que correspondan a las denotaciones de la Figura 4. Tal como se ilustra en la Figura 5, la transformada del dominio de tiempo a frecuencia se determina de la siguiente manera: En el primer paso 501, y2 se transforma con una transformación TDC-IV 502 y los coeficientes de TDC-IV se redondean 503. Los coeficientes de TDC-IV redondeados después se agregan a y? 504. Por consiguiente, se genera la señal intermedia z. En consecuencia, la señal intermedia z cumple con la ecuación: En el segundo paso 505, z se transforma con la transformación TDC-IV 506 y los coeficientes de TDC-IV se redondean 507. Después se sustraen los coeficientes redondeados de TDC-IV a partir de y2. Por consiguiente, se genera la señal de salida x2. Por ello, la señal x2 cumple 52/355 con la ecuación: En el tercer paso 509, x2 se transforma con la transformación TDC-IV 510 y los coeficientes de TDC-IV se redondean 511. Después se sustraen los coeficientes redondeados de TDC-IV a partir de z. Por consiguiente, se genera la señal ¾. Por ello, la señal ? cumple con la ecuación: Se puede observar que el algoritmo de acuerdo con las ecuaciones (13a) a (13c) es inverso al algoritmo de acuerdo con las ecuaciones (12a) a (12c) . En consecuencia, si se emplea el codificador y el decodificador ilustrados en las Figuras 1 y 2, los algoritmos proporcionan un método y un aparato para la codificación de audio sin pérdida. En una modalidad de la presente invención explicada después, el método descrito anteriormente se emplea para un sistema de almacenamiento de imágenes. Las ecuaciones (12a) a (12c) y (13a) a (13c) además muestran que para calcular dos TDC-IV NxN de números enteros, son necesarias tres TDC-IV NxN, tres redondeos Nxl y tres adiciones Nxl. Por ello, para una TDC-IV de números enteros NxN, el promedio es : 52/355 (14) AC(N)«15AC{C™) +1.5N (15) Donde RC ( . ) es el número total redondeado, y AC ( . ) es el número total de operaciones aritméticas. En comparación con los algoritmos TDC-IV de números enteros directamente convertidas, el algoritmo de TDC-IV de números enteros propuesto reduce RC desde el nivel Nlog2N a N. Tal como se ha indicado con la ayuda de la ecuación (15) , la complejidad aritmética del algoritmo de TDC-IV de números enteros propuesto es aproximadamente 50 por ciento más que el de un algoritmo de TDC-IV. Sin embargo, si también se considera RC, la complejidad combinada (AC+RC) del algoritmo propuesto no excede por mucho a la de los algoritmos de números enteros directamente convertidos . El análisis exacto de la complejidad algorítmica depende del algoritmo de TDC-IV empleado. Tal como se muestra en las Figuras 4 y 5, el algoritmo de TDC-IV de números enteros propuesto tiene una estructura simple y modular. Se puede emplear cualquier algoritmo de TDC-IV ya existente en su bloque de cálculo de TDC-IV. El algoritmo propuesto es adecuado para aplicaciones que requieran TDCMent, por ejemplo, en el modelo 0 de referencia de extensión 3 de audio de MPEG-4. 52/355 La Figura 6 muestra la arquitectura de un sistema de almacenamiento de imágenes de acuerdo con una modalidad la presente invención. En la Figura 6 una fuente de imagen 601, por ejemplo una cámara, proporciona una señal de imagen análoga. La señal de imagen se procesa por medio de un convertidor de análogo a digital 602 para proporcionar una señal de imagen digital correspondiente . La señal de imagen digital se codifica sin pérdida por medio de un codificador de imágenes sin pérdida 603 que incluye una transformación del dominio de tiempo al dominio de frecuencia. En esta modalidad, el dominio del tiempo corresponde al espacio de coordenadas de la imagen. La señal de imágenes codificada sin pérdidas se almacena en un dispositivo de almacenamiento 604, por ejemplo un disco duro o un DVD.

Cuando se necesita la imagen, la señal de imagen codificada sin pérdida se extrae del dispositivo de almacenamiento 604 y se transfiere a un decodificador 605 de imágenes sin pérdida que decodifica la señal de imagen codificada sin pérdida y reconstruye la señal de imagen original sin ninguna pérdida de datos . Este almacenamiento sin pérdida de señales de imágenes es importante, por ejemplo, en el caso en que las imágenes son mapas de errores de plaquitas semiconductoras y se tengan que almacenar para su posterior análisis. 52/355 En esta modalidad de la presente invención/ la modalidad del método ilustrado en las Figuras 3 a 5 se emplea en el codificador sin pérdida de imágenes 603 y el codificador sin pérdida de imágenes 605. Tal como se explica en lo anterior, la modalidad del método ilustrado en las Figuras 3 a 5 proporciona una transformación que es reversible, por ello en particular se proporciona un método para la codificación sin pérdida de imágenes. El método de acuerdo con la presente invención no se limita a señales de audio e imágenes. En el método de acuerdo con la presente invención se pueden emplear otras señales digitales, por ejemplo, señales de video. En lo siguiente, se explica una modalidad adicional para el método para la transformación de una señal digital del dominio de tiempo al dominio de frecuencia y viceversa de acuerdo a la invención. En esta modalidad de la presente invención, la transformación de dominio es una transformada de TDC, por medio de la cual el tamaño N del bloque tiene algunos valores enteros . En una modalidad, N es una potencia de dos .

Considerando la matriz de la transformada NxN (también llamada TDC tipo 2) : 52/355 Donde : y N es el tamaño de la transformada, m y n son Indices de matrices. Considerando w la matriz de transformada NxN de TDC tipo IV, tal como ya se ha decidido en la anterior: Como se describió anteriormente, se utilizará una pluralidad de matrices de estiramiento, estas matrices de estiramiento están dentro de esta modalidad de matrices 2Nx2N de la siguiente forma.

J2N {19} >,r ±1 En donde IN es' la matriz identidad NxN, 0N es la matriz cero NxN, AN es una matriz arbitraria NxN. Para cada matriz de estiramiento L2N, se realiza un mapeo de entero a entero reversible a la etapa de estiramiento reversible de la misma manera como en la etapa de estiramiento 2x2 descrita en la referencia incorporada "Factorig Wavlet Transforms into Lifting Steps," Tech. Report, I. And W. Sweldens, Bell Laboratories, Lucent Technologies, 1996. La única diferencia es que el redondeo se aplica a un vector en lugar de hacerlo a una sola variable. En la anterior descripción de las otras modalidades, ya se ha detallado cómo se realiza una etapa de estiramiento para una matriz de estiramiento, así que en lo sucesivo, se omitirá la explicación de las etapas de estiramiento que corresponden a las matrices de estiramiento. Alguien puede advertir que la transposición de L2N, ^. , también es una matriz de estiramiento. En esta modalidad, el elemento transformador corresponde a una matriz, cuya T2N se define como una matriz 2Nx2N de la siguiente manera: 0N (20) * La descomposición de la matriz T2n en las matrices de matrices de estiramiento tiene la siguiente forma: ¾ -P3«L8'L7-L6-P2-LS-L4'I,3'L2-Ll-n {21} Las matrices que constituyen el lado derecho de la anterior ecuación se explicarán más adelante. Pl es una primera matriz de permutación dada por la ecuación: Donde JN es la matriz de índice opuesta N N dada por : y DN es una matriz diagonal NxN con element diagonales que son 1 y -1 de manera alternada: P2 es una segunda matriz de permutación, un ejemplo de la misma se genera por medio de la siguiente programación de MATLAB : Pd = distinguir (2*N) ; para i = 2 : 2 : N, Pd (i, i) = 0; Pd (N+i, N+i) = 0; Pd (i, N+i) = 1; Pd (N+i, i) = 1; Finalizar Peo = ceros (2*N) ; para i = 1 : N, Peo (i, 2*i-l) = 1; Peo(i+N,2*i) = 1; Finalizar P2 = (Pd*Peo) ' ;<BR> P2 = (Pd*Peo) ' ; Como un ejemplo, cuando N es 4, P2 es una mat 8x8 dada como : P3 es una tercera matriz de permutación, un ejemplo de la misma se genera por medio de la programación 52/355 de MATLAB: P3 = ceros (2*N) ; para i = 1: N, P3 (i, 2*i-l) = 1; P3 (N2-i+l,2*i) = 1; finalizar Como un ejemplo, cuando N es 4, P3 es una matriz 8x8 dada como : una primera matriz de estiramiento, Donde Zljr es una matriz diagonal opuesta NxN dada como : 52/355 L2 es una segunda matriz de estiramiento: Donde Z2N es una matriz diagonal opuesta NxN dada como L3 es una tercera matriz de estiramiento Donde (32) L4 es una cuarta matriz de estiramiento: 52/355 Donde : (34) L5 es una quinta matriz de estiramiento: Donde L6 es una sexta matriz de estiramiento Donde Z6N es una matriz diagonal opuesta NxN dada como una séptima matriz de estiramiento 52/355 Donde Z1N es una matriz diagonal opuesta NxN dada como L8 es la octava matriz de estiramiento L8=L6 Por consiguiente, se origina la factorización tal como se muestra en (x) : (42) Donde Pl, P2, y P3 son tres matrices de permutación. Lj, j de 1 a 8, son ocho matrices de estiramiento . La matriz de estiramiento L3, L4 y L5 comprenden una matriz de transformación auxiliar, la cual es, en este caso, por sí misma la matriz de transformación - . A partir de la ecuación (42) , es posible calcular la TDC de números enteros para dos señales de entrada de dimensión Nxl . Dado que la ecuación (42) proporciona una 52/355 factorización de matriz de estiramiento, la cual describe el dominio de transformación de TDC-IV, se pueden emplear sus matrices de estiramiento de la manera que se muestra en este documento para calcular la transformación de dominios de una señal de entrada aplicada. La ecuación (42) se puede derivar de la siguiente manera . La siguiente descomposición se puede derivar empleando la descripción de Wang, Zhongde, ¾Qn Computing the Discrete Fourier and Cosine Transforme", IEEE Transaction on Acoustics, Sprech and Signal Processing, Vol. ASSP-33, No. 4 de octubre de 1985: sabe que, en donde aN/2 denota la matriz de transformación de la transformada de seno discreta de tipo 2 , una matriz de permutación NxN dada por 52/355 ecuación (85) [sic] se puede combinar con ecuación: Donde PE0 es una matriz de permutación par-impar, 52/355 Rp0 es igual a TN, Después, la ecuación de transposición (45) se convierte a La combinación de la ecuación (43) y la ecuación (46) produce: Donde 52/355 ¾-fcJ A partir de la ecuación (47) , la ecuación (42) se puede derivar con facilidad. En esta modalidad, el cálculo de la transformación del dominio solamente requiere de operaciones de redondeo 4N, tal como se explicará a continuació : Considerando oc(*) el número de adiciones reales, µ(*) el número de multiplicaciones reales, e ?(*) el número de redondeos reales, respectivamente. Para el algoritmo de TCDent propuesto, alguien lo obtendría: a(TDCent) = UN + 3a(TDC-IV) µ (TDCent) = 9 + 3µ(???-??) ? (TDCent) = 8N Los resultados anteriores son para dos bloques de muestras de datos, debido a que el algoritmo de TDCent propuesto los procesa juntos. En consecuencia, para un bloque de muestra de datos, los cálculos necesarios se dividen a la mitad, los cuales son: i (TDCent) = 5.5N + 1.5a(TDC-IV) µ? (TDCent) = 4.5J\T + 1.5µ(???-??) 52/355 Y!(TDCent) = 4N Donde cci, µ? e ?a son el número de adiciones reales, el número de multiplicaciones reales y el número de redondeos reales, para un bloque de muestras, respectivamente. Para cálculos de TCD-IV, se puede usar el algoritmo basado en la TRF (transformada rápida de Fourier) descrito en la referencia incorporada. " Signal Processing with lapped Transforme, "H:S Malvar, Norword, MA: Artech House, 1992, págs . 199-201, para lo cual: a(TDC-IV)= 1.5Nlog2N µ(???-??) = 0.5fflog2íí + N Por lo tanto: a!(TDCent)= 2.25Nlog2N + 5.5N µ?????? ?) = 0.75Nlog2N + 6N ? continuación, se explica una modalidad adicional para el método de la transformación de una señal digital del dominio de tiempo al dominio de frecuencia y viceversa de acuerdo con la presente invención. En esta modalidad se emplea una transformada rápida Fourier TRF como la transformación de dominio. Considerando F la matriz transformada NxN de la T F normalizada, (48) Donde N es el tamaño de la transformada, m y n son índices de matrices. En esta modalidad, una matriz de permutación P de dimensión NxN es una matriz que incluye índices 0 ó 1. Después de multiplicarla por un vector Nxl (la presentación de la matriz de señal de entrada) , se cambia el orden de los elementos en el vector. En esta modalidad, las matrices de estiramiento se definen como matrices 2Nx2N de la siguiente forma: Donde Pl y P2 son dos matriz de permutación, 0 es la matriz cero NxN, A es una matriz NxN opuesta, para la matriz de estiramiento L, se realiza un mapeo reversible de número entero a número entero de la misma manera como se hizo en el paso de estiramiento 2x2 en la referencia incorporada antes mencionada de I. Daubechies . Sin embargo, como anteriores explicó anteriormente, se aplica un redondeo a un vector en lugar de hacerlo a una simple variable. Es evidente que en la transposición de L, LT también es una matriz de estiramiento. Además, considerando T como una matriz transformada 2Nx2N : Por consiguiente, la matriz de transformada modificada T (y en consecuencia la misma transformación de dominio) , se puede expresar como la factorización de la matriz de estiramiento: Donde I es la matriz de identidad NxN, y Q es una matriz de permutación NxN dada como: y ???-? y Ojr-ixi son vectores de fila y columna de ceros N-l, respectivamente. J es la matriz de índice opuesta (N-l)x(N-l) dada como : En la ecuación (53) , el espacio en blanco en el corchete representa todos los elementos de valor cero en la matriz. Tal como se puede observar a partir de la ecuación (51) , la factorización de las matrices se puede emplear para el cálculo de la TRF para dos vectores complejos Nxl empleando los métodos descritos en este documento . En esta modalidad, El cálculo de la transformación de dominio sólo requiere de operaciones de redondeo 3N, a continuación también se explicarán: Considerando : a(*) es el número de adiciones reales, µ(*) es el número de multiplicaciones reales, e ?(*) es el número de redondeo reales, respectivamente . Para el propósito de la TRFent propuesto, tenemos (TRFent) = 6N + 3a (TRF) µ (TRFent) = µ(????) ? (TRFent) = 6N 52/355 Los anteriores resultados son para dos bloques de muestra de datos, ya que el algoritmo TRFent propuesto los procesa juntos. Por consiguiente, para un bloque para muestra de datos, los números del cálculo se dividen a la mitad, con lo cual son: i (TRFent) = 3N + 1.5a(TRF) µ? (TRFent) = l^( RF) ?? (TRFent) = 3N Donde a, µa e ?? son el número de adiciones reales, el número multiplicaciones reales y el número de operaciones de redondeo reales para un bloque de muestras, respectivamente. Para el cálculo TRF, se puede usar el algoritmo TRF de base de partida (TRFbp) , para lo cual: a (TRFbp) = 3Wlog2N µ? (TRFbp) = Wlog2N consecuencia, tenemos ai (TRFbp) = 4.5ÍJlog2 N - 1.5N + 6 µ? (TRFbp) = 1.5Wlog2 N - 4.5N + 6 La Figura 7 muestra codificadores de transformada directa e inversa que se emplean para evaluar la exactitud de transformada de la técnica de transformación TDC descrita anteriormente y de la anterior transformación del 52/355 dominio TRF . La prueba implica medir el error medio cuadrado (EMC) de la transformada de acuerdo con los estándares de evaluación propuestos por el grupo de codificación de audio sin pérdida MPEG-4 tal como se describe en " Coding of Moving Pictures and Audio: Work plan fox Evaluation of Integer MDCT for FGS to Lossless Experimentation Framework" , ISO/IEC JTC 1/SC 29/WG 11 N5578 Pattaya, Tailandia, marzo de 2003 que se incorpora a este documento como referencia. Específicamente, los EMC para la TDCent y la TDC de la inversa de números enteros (TDCIent) , están dadas como: Donde la señal de error e es ef para la TDCent , y et para la TDCIent tal como se muestra en la Figura 1. es el número total de bloques de muestras empleados en la evaluación. Los EMC para la TDCIent y la TRF inversa de números eneros (TRFIent) están dadas como: Donde la señal de error e es ef para la TDC ent, y et para la F tal como se muestra en la figura 1. 52/355 representa la forma de un valor complejo. K es el número total de bloques de muestra empleados en la evaluación. Para ambas transformaciones de dominio, se usa un número total de 450 segundos con 15 diferentes tipos de archivos de música en el grupo de prueba de 48 KHz/16 bitios. La Tabla I muestra los resultados de la prueba. Tal como se puede observar en esta Tabla I, el EMC que se genera empleando los sistemas y métodos de la presente invención es mínimo, y a diferencia de los sistemas convencionales, es prácticamente independiente del procesamiento del tamaño del bloque . Haciendo referencia a la transformación de dominio de la TDC-4, el EMC se incrementa sólo ligeramente con el incremento del tamaño n del bloque de hasta 4096 bitios. Los EMC de la TRF son incluso mejores, exhibiendo un EMC constante de 0.4 para tamaños de bloque de hasta 4096 bitios. Cuando el rendimiento demostrado de la presente invención se observa en vista de las actuales capacidades y se incrementa la necesidad de tamaños de bloque más grandes, las ventajas de la invención se vuelven más claras. 52/355 TABLA 1 REFERENCIAS INCORPORADAS Los siguientes documentos se incorporan a esta descripción como referencia: H. S. Malvar, "Signal Processing wifch Lapped Transforme" Artech House, 1992; R. Geiger, T. Sporer, J. Koller, K. Brandenburg, "Audio Coding based on Integer Transforme11 AES IIIth Convention, New York, EE.UU., Sept . 2001; Wang, Zhongde, "On Computing the Diserete Fourier and Cosine Transforme" , IEEE Transactions on Acoustics, Speech and Signal Processing, Vol . ASSP-33, No. 4 octubre de 1985; I. Daubechies y W. Sweldens, "Factoring wavelet transforme into lifting steps" , Tech. Report, Bell Laboratories, Lucent Technologies, 1996; S. Oraintara, Y. J. Chen y T. Q. Nguyen, "Integer faet Fourier transform" , IEEE Trans . Signal Processing, Vol. 52/355 50, No. 3, marzo 2002, págs . 607-618; P. Hao y Q. Shi, " atrix factorizations for reversible integer mapping" , IEEE Trans. Signal Processing, vol. 49, no. 10, Oct . 2001, págs. 2314-2324; G. Plonka y M. Tasche, "Invertible integer DCT algorithms" , Appl . Comput . Harmon. Anal. 15: 70-88,2003; Y. H. Zeng, L. Z. Cheng, G. A. Bi y Alex C. Kot, "Integer DCTs and fast algorithms", IEEE Trans. Signal Processing, vol. 49, No. 11, Nov. 2001, págs. 2774-2782; J. Wang, J. Sun y S. Yu, "1-D and 2-D transforme from integers to integers" , in Proc. Int. Conf. Acoustics, Speech and Signal Processing, Hong ong, 2003, vol. II, pp. 549-552 ; "Coding of Moving Pictures and Audio: Work plan for Evaluation of Integer MDCT for FGS to Lossless Experimentation Framework" , ISO/IEC JTC 1/SC 29/WG 11 N5578, Pattaya, Tailandia, Mar. 2003. 52/355

Claims

REIVINDICACIONES : 1. Un método para transformar una señal digital del dominio de tiempo al dominio de frecuencia y viceversa empleando una función de transformación que comprende una matriz de transformación, la señal digital comprende símbolos de datos que se agrupan en una pluralidad de bloques, cada bloque comprende un número predefinido de símbolos de datos; el método comprende: la acción para transformar dos bloques de la señal digital por medio de un elemento transformador, en donde el elemento transformador corresponde a una matriz diagonal de bloques que comprende dos submatrices, en donde cada submatriz comprende la matriz de transformación y el elemento transformador comprende una pluralidad de pasos de estiramiento y en donde cada paso de estiramiento comprende el procesamiento de bloques de la señal digital por medio de una transformación auxiliar y por medio de una unidad de redondeo. 2. El método según la reivindicación 1, en donde la función de transformación es una función de transformación TDC-I, una función de transformación TDC-IV, una función de transformación TDF-I, una función de transformación TDF-IV, una función de transformación TDS-I, una función de transformación TDS-IV, una transformación TDW-I o una transformación TDW-IV. 3. El método según la reivindicación 1 ó 2, en 52/355 donde cada paso de estiramiento comprende una matriz de estiramiento, en donde la matriz de estiramiento es una matriz triangular de bloques que comprende cuatro submatrices con dos matrices inversas de números enteros como dos de las submatrices en una diagonal, y con la matriz de transformación y un cero como las otras dos submatrices en la otra diagonal . 4. El método según la reivindicación 3, en donde las matrices invertibles de números enteros en cada matriz de estiramiento son matrices identidad o matrices identidad negativas. 5. El método según cualquiera de las reivindicaciones 1 a 4, en donde el elemento transformador comprende tres pasos de estiramiento. 6 El método según las reivindicación 1 a 5, en donde una señal de audio o una señal de video se emplea como la señal digital . 7. Un dipositivo para transformar una señal digital del dominio de tiempo al dominio de frecuencia y viceversa empleando una función de transformación que comprende una matriz de transformación, la señal digital comprende símbolos de datos que se dividen en una pluralidad de bloques, cada bloque comprende un número predefinido de símbolos de datos, el dispositivo comprende: Una unidad de transformación para transformar dos 52/355 bloques de la señal digital mediante un elemento transformador, en donde el espejo retrovisor corresponde a una matriz diagonal de bloques que comprende dos submatrices, en donde cada sub-bloque comprende la matriz de transformación y el elemento transformador comprende una pluralidad de pasos de estiramiento. 8. El dispositivo según la reivindicación 7, en donde la unidad de transformación comprende unidades de transformación auxiliares para cada paso de estiramiento para procesar los bloques de la señal digital. 9. El dispositivo según la reivindicación 7 u 8, en donde la unidad de transformación 7 u 8, en donde la unidad de transformación comprende unidades de redondeo para cada uno de los pasos de estiramiento para procesar los bloques de la señal digital . 10. El dispositivo según cualquiera de las reivindicaciones 7 a 9, en donde la unidad de transformación comprende : Un dispositivo transformada de coseno discreto modificada acoplado para recibir una pluralidad de los bloques de datos y configurado para realizar la transformada de dominio en cada bloque de datos en los coeficientes TDCM; Un cuantificador acoplado para recibir cada uno de los coeficientes de la TDCM, el cuantificador puede 52/355 operar para producir, en respuesta, coeficientes de TDCM cuantificados ; Un codificador de corriente de bitios acoplado para recibir los coeficientes de TDCM cuantificados , la corriente de bitios produce, en respuesta, una corriente de bitios perceptivamente codificada; Un cuantificador inverso acoplado para recibir los coeficientes de TDCM cuantificados , el cuantificador inverso se puede operar para restaurar los coeficientes de TDCM a un estado no cuantificado; y Una unidad de redondeo acoplada para recibir los coeficientes de TDCM restaurados y puede operar para producir coeficientes de TDCM. 11. El dispositivo según la reivindicación 10, en donde la unidad de transformación además comprende : Un dispositivo de transformada de coseno discreta inverso acoplado para recibir los bloques de datos y se puede operar para producir, en respuesta, coeficientes de TDCMent ; Medios para calcular la diferencia entre los coeficientes TDCMent respectivos y los coeficientes TDCM de valor de número entero con el fin de producir coeficientes TDCM residuales respectivos; y Un codificador entrópico acoplado para recibir los coeficientes de TDCM residuales y se puede operar para 52/355 generar, en respuesta, una corriente de bitios intensificadora sin pérdidas. 12. El dispositivo según la reivindicación 11, en donde la unidad de transformación además comprende : Un decodificador de corriente de bitios acoplado para recibir la corriente de bitios perceptivamente codificada y se puede operar para producir, en respuesta, una corriente de bitios decodificad ; Un cuantificador inverso acoplado para recibir la corriente de bitios decodificada y para producir, en respuestas, coeficientes de TDCM restaurados; Una unidad de redondeo acoplada para recibir los coeficientes de TDCM restaurados y que se puede operar para redondear cada coeficiente de TDCM a un valor de número entero; y Un dispositivo de TDCM inversa acoplado para recibir la corriente de TDCM restaurada, para producir y generar, en respuesta, una copia reconstruida de la señal perceptivamente codificada. 13. El dispositivo según la reivindicación 12, en donde la unidad de transformación comprende: Un decodificador entrópico acoplado para recibir la corriente de bitios sin pérdida y se puede operar para generar, en respuesta, coeficientes TDCMent residuales; Medios para adicionar los coeficientes de TDCMent 52/355 residuales a los coeficientes de TDCM de valor de números enteros con el fin de producir coeficientes TDCMent; y Un dispositivo de TDCMent inversa acoplado para recibir la suma de los coeficientes TDCM de valor de número entero y los coeficientes TDCMent con el fin de producir una copia reconstruida de la señal de audio decodificada sin pérdidas . 14. Un medio legible por computadora que tiene un programa registrado en sí mismo, en donde el programa se adapta para hacer que una computadora ejecute un método para realizar una transformación de dominio de una señal digital del dominio tiempo al dominio de frecuencia y viceversa, el medio legible por computadora comprende: Códigos para realizar la transformación de dos bloques de la señal digital por medio de un elemento transformador que a su vez corresponde a una matriz diagonal de bloques que comprende dos submatrices, en donde cada sub-bloque comprende la matriz de transformación y el elemento de transformación comprende una pluralidad de pasos de estiramiento, en donde cada paso de estiramiento comprende el proceso de sub-bloques de la señal digital mediante una transformación auxiliar y una unidad de redondeo . 52/355