MXPA06003509A - Metodo para realizar una transformacion de dominio de una senal digital de dominio de tiempo al dominio de frecuencia y veceversa. - Google Patents
Metodo para realizar una transformacion de dominio de una senal digital de dominio de tiempo al dominio de frecuencia y veceversa.Info
- Publication number
- MXPA06003509A MXPA06003509A MXPA06003509A MXPA06003509A MXPA06003509A MX PA06003509 A MXPA06003509 A MX PA06003509A MX PA06003509 A MXPA06003509 A MX PA06003509A MX PA06003509 A MXPA06003509 A MX PA06003509A MX PA06003509 A MXPA06003509 A MX PA06003509A
- Authority
- MX
- Mexico
- Prior art keywords
- transformation
- coefficients
- matrix
- tdcm
- stretching
- Prior art date
Links
- 230000009466 transformation Effects 0.000 title claims abstract description 148
- 238000000034 method Methods 0.000 title claims abstract description 74
- 239000011159 matrix material Substances 0.000 claims abstract description 142
- 230000001131 transforming effect Effects 0.000 claims abstract description 13
- 230000002441 reversible effect Effects 0.000 claims description 21
- 230000005236 sound signal Effects 0.000 claims description 9
- 238000003491 array Methods 0.000 claims description 2
- LFRXCNXVZHVRSE-JEZACWOJSA-N [(2r,3s,4s,5r,6r)-3,4,5-trihydroxy-6-[(2r,3r,4s,5s,6r)-3,4,5-trihydroxy-6-[[(2r,3r)-3-hydroxy-2-tetradecyloctadecanoyl]oxymethyl]oxan-2-yl]oxyoxan-2-yl]methyl (2r,3r)-3-hydroxy-2-tetradecyloctadecanoate Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](COC(=O)[C@H](CCCCCCCCCCCCCC)[C@H](O)CCCCCCCCCCCCCCC)O[C@@H]1O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](COC(=O)[C@H](CCCCCCCCCCCCCC)[C@H](O)CCCCCCCCCCCCCCC)O1 LFRXCNXVZHVRSE-JEZACWOJSA-N 0.000 claims 18
- 239000013598 vector Substances 0.000 description 32
- 238000004422 calculation algorithm Methods 0.000 description 31
- 238000012545 processing Methods 0.000 description 14
- 238000007792 addition Methods 0.000 description 11
- 238000000844 transformation Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 6
- 238000011156 evaluation Methods 0.000 description 5
- 230000009471 action Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000011426 transformation method Methods 0.000 description 3
- 230000017105 transposition Effects 0.000 description 3
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000003623 enhancer Substances 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/14—Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/14—Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
- G06F17/147—Discrete orthonormal transforms, e.g. discrete cosine transform, discrete sine transform, and variations therefrom, e.g. modified discrete cosine transform, integer transforms approximating the discrete cosine transform
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/14—Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
- G06F17/141—Discrete Fourier transforms
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/14—Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
- G06F17/148—Wavelet transforms
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/63—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/0017—Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Algebra (AREA)
- General Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Discrete Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Complex Calculations (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Magnetic Resonance Imaging Apparatus (AREA)
Abstract
Un metodo para realizar una transformacion de dominio de una senal digital del dominio de tiempo al dominio de frecuencia y viceversa; el metodo incluye realizar la transformacion por medio de un elemento transformador, la resolucion comprende una pluralidad etapas de estiramiento, en donde la transformacion corresponde a una matriz de transformacion y en donde por lo menos una etapa de estiramiento de al pluralidad de etapas de estiramiento comprende por lo menos una matriz de transformacion auxiliar y una unidad de redondeo, la matriz de transformacion auxiliar por si misma comprende la matriz de transformacion o la matriz de transformacion correspondiente de dimension inferior. El metodo ademas comprende realizar una operacion de redondeo de la senal por medio de la unidad de redondeo despues de la transformacion mediante la matriz de transformacion auxiliar.
Description
frecuencia y viceversa y un medio legible en computadora" (Process and Device for Determining a Transforming Element for a Given Transformation Function, Method and Device for Transforming a Digital Signal from the Time Domain into the Frequency Domain and vice versa and Computer Readable Médium), Referencia del Abogado No. P100452.
ANTECEDENTES DE LA INVENCIÓN Esta invención se refiere en términos generales a un procesamiento de señales digitales, y en particular, a sistemas y métodos para realizar transformaciones de dominio de señales digitalmente formateadas . Las transformaciones de dominio, por ejemplo, la transformada discreta de coseno (TDC) , se emplean ampliamente en la industria moderna de procesamiento de señales. Recientemente, una variante de la TDC, llamada TDC de número entero, ha atraído un gran interés de investigación debido a su función importante en aplicaciones de codificación sin pérdida. El término "sin pérdida" significa que el decodificador puede generar una copia exacta de la señal fuente desde la corriente de bitios codificados . La TDC es una transformada de bloques de valor real . Aun si el bloque de entrada consiste únicamente de números enteros, el bloque de salida de la TDC puede comprender componentes que no sean números enteros . Por conveniencia, el bloque de entrada se identifica como vector de entrada y el bloque de salida como vector de salida. Si un vector comprende sólo componentes de números enteros,- se denomina un vector de números enteros. En contraste con la TDC, la TDC de números enteros genera un vector de salida de números enteros a partir de un vector de entrada de números enteros. Para el mismo vector de entrada de números enteros, el vector de salida de números enteros de la TDC de números enteros se aproxima estrechamente al vector de salida real de la TDC. Por consiguiente, la TDC de números enteros mantiene todos los perfiles aptos de la TDC en el análisis espectral . Una propiedad importante de la TDC de números enteros es la reversibilidad. El término reversibilidad significa que existe una TDC inversa (TDCI) de números enteros, de tal manera que si la TDC de números enteros genera un vector de salida y a partir de un vector de entrada x, la TDCI de números enteros puede recuperar el vector x a partir del vector y. Algunas veces la TDC de números enteros también se denomina la transformada directa, la TDCI de números enteros como la transformada regresiva o inversa. Recientemente se ha propuesto y empleado una transformada identificada transformada discreta de coseno modificada por números enteros (TDCMent) en la compresión de audio MPEG-4 de ISO/IEC. La TDCMent se puede derivar a partir de su prototipo - la transformada discreta de coseno modificada (TDCM) . La descripción de H. S. Malvar en "Procesamiento de señales con transformadas solapadas" (Signal Processing with Lapped Transforme) Artech House, 1992, proporciona una realización eficiente de la TDCM al conectar en cascada un banco de rotaciones de Givens con un bloque de TDC-IV. Es bien sabido que la rotación de Givens se puede factorizar en tres pasos de estiramiento para agrupar números enteros con números enteros. Véase, por ejemplo, R. Geiger, T. Sporer, J. Koller, K. Brandenburg, "Codificación de audio con base a transformadas de números enteros" (Audio Coding based on Integer Transforme) AES IIIth Convention, New York, EE.UU., Sept . 2001. Las transformadas de números enteros se pueden convertir directamente a partir de sus prototipos al reemplazar cada rotación de Givens con tres pasos de estiramiento . Debido a que en cada paso de estiramiento no hay alguna operación de redondeo, el número total redondeado de una transformada de números enteros es tres veces el número de rotación de Givens de la transformada prototipo. Para transformadas trigonométricas discretas (por ejemplo, la Transformada Discreta de Fourier (TDF) o la transformada discreta de coseno (TDC) ) , el número de rotaciones de Givens involucradas usualmente está en el nivel Wlog2- , donde N es el tamaño de los bloques, es decir, la cantidad de símbolos de datos incluidos en cada bloque, la señal digital se divide adentro. Por consiguiente, el número total redondeado también se encuentra en nivel Nlog2N para la familia de transformadas de números enteros directamente convertidas. Debido a estos redondeos, una transformada de números enteros sólo se aproxima a su prototipo de punto flotante . El error de aproximación se incrementa con el número de redondeos. Por consiguiente, lo qué se necesita es una implementación de método y sistema para realizar transformaciones de dominio empleando pocas operaciones de redondeo, con lo cual se produzcan transformaciones más exactas e informáticamente menos intensas.
SUMARIO DE LA INVENCIÓN La presente invención resuelve el problema de proporcionar un método para realizar una transformación de dominio de una señal digital desde el dominio de tiempo en el dominio de frecuencia y viceversa; el método comprende una cantidad considerablemente reducida de operaciones de redondeo . En una modalidad de la presente invención, un método para realizar una transformación de dominio de una señal digital desde el dominio de tiempo en el dominio de frecuencia y viceversa incluye la acción para realizar una pluralidad de pasos de estiramiento, en donde la transformación corresponde a una matriz de transformación. Por lo menos un paso de estiramiento incluye por lo menos una matriz de transformación auxiliar, que es la matriz de transformación por sí misma o es la matriz de transformación respectiva de dimensión inferior. Además, cada paso de estiramiento incluye una unidad de redondeo. El método además incluye el procesamiento de la señal mediante la unidad de redondeo respectiva después de la transformación por medio de la matriz de transformación auxiliar respectiva.
BREVE DESCRIPCIÓN DE LOS DIBUJOS La Figura 1 muestra la arquitectura de un codificador de audio de acuerdo con una modalidad de la presente invención; La Figura 2 muestra la arquitectura de un codificador de audio de acuerdo con una modalidad de la presente invención, que corresponde al codificador de audio mostrado en la Figura 1; La Figura 3 muestra un diagrama de flujo de una modalidad del método de acuerdo con la presente invención; La Figura 4 ilustra una modalidad del método de acuerdo con la presente invención empleando la TDC-IV como la función de transformación; La Figura 5 ilustra el algoritmo para la transformación inversa de acuerdo con la modalidad de la presente invención ilustrada en la Figura 4; La Figura 6 muestra un diagrama de flujo de una modalidad del método de acuerdo con la presente invención; La Figura 7 ilustra una modalidad del método de acuerdo con la presente invención empleando la TDC-IV como la función de transformación; La Figura 8 ilustra el algoritmo para la transformación inversa de acuerdo con la modalidad del método de la presente invención ilustrado en la Figura 7; La Figura 9 muestra la arquitectura para un sistema de almacenamiento de imágenes de acuerdo con una modalidad de la presente invención; La Figura 10 muestra una modalidad del método de acuerdo con la presente invención empleando la TDC-IV como la función de transformación; La Figura 11 ilustra el algoritmo para la transformación inversa de acuerdo con la modalidad del método de la presente invención ilustrado en la Figura 10; La Figura 12 ilustra un método para realizar una transformación de dominio de una señal digital de acuerdo con una modalidad de la presente invención;
52/354 d
La Figura 13 muestra codificadores de transformada directa e inversa para evaluar la exactitud de la transformada de la TDC presentada y los métodos de transformación de transformada rápida de Fourier (TRF) de acuerdo con la presente invención.
DESCRIPCIÓN DETALLADA DE LAS MODALIDADES ESPECÍFICAS La Figura 12 ilustra un método para realizar una transformación de dominio de una señal digital de acuerdo con una modalidad de la presente invención. Inicialmente, en el punto 1210, se realiza una transformación de la señal digital por medio de un elemento transformador que comprende una pluralidad de pasos de estiramiento. La transformación corresponde a una matriz de transformación, en donde por lo menos, una de las pasos de estiramiento comprende una matriz de transformación auxiliar y una unidad de redondeo, la matriz auxiliar por sí sola comprende la matriz de transformación de la matriz de transformación correspondiente de dimensión inferior. Más adelante se describen con mayor detalle las modalidades ilustrativas del proceso 1210 y de la transformación de dominio que se pueden emplear en la transformación de dominio . Enseguida en el paso 1220, se realiza un paso de redondeo de la señal por medio de la unidad de redondeo
52/354 después de la transformación mediante la matriz auxiliar. De acuerdo con las modalidades preferidas del método de acuerdo con la presente invención, los símbolos de datos de la señal digital se proporciona al elemento transformador como un vector de datos . En cada paso de estiramiento, el vector de datos o una' parte del vector de datos se transforma por medio de un transformador de dominio, y el resultado de la transformación se redondea posteriormente a un vector de números enteros. Es decir, en contraste con cualquier método de acuerdo con el estado de la técnica, en donde el proceso de redondeo se realiza dentro del proceso de transformación para el elemento individual o para los símbolos de datos en cada bloque de la señal digital. En consecuencia, se reduce en gran medida el número de operaciones de redondeo en el método de acuerdo con la presente invención. Debido a la reducción en el número de operaciones de redondeo, el método de acuerdo con la presente invención no requiere de un gran tiempo computacional ni de recursos de cómputo. Además, se puede reducir considerablemente el error de aproximación de "las transformaciones de dominio de números enteros . En una modalidad preferida, la presente invención proporciona un método para realizar la transformación de TDC IV de tipo números enteros. El método de acuerdo con la presente invención requiere de un número considerablemente
52/354 reducido de operaciones de redondeo en comparación con los métodos de la técnica anterior. Como resultado, el error de aproximación se reduce considerablemente, en el caso de la TDC-IV, la misma se puede reducir a partir de que el nivel Nlog2N usual sea tan bajo como 1.5N en una modalidad y tan bajo como 2.5N en otra modalidad, donde N denota el tamaño del bloque de la señal de digital . El método de acuerdo con la presente invención tiene una baja complejidad computacional y una estructura modular. El método y dispositivo de acuerdo con la presente invención se pueden emplear para cualquier tipo de señales digitales, como por ejemplo, señales de audio, de imágenes o de video. La señal digital, que es una señal digitalizada, corresponde a una señal física medida, se puede generar al explorar por lo menos un aspecto característico de una señal análoga correspondiente (por ejemplo, los valores de luminiscencia y crominancia de una señal de video, la amplitud de una señal análoga de sonido o la señal sensora análoga a partir de un sensor) . La señal digital comprende una pluralidad de símbolos de datos. Los símbolos de datos de la señal digital se agrupan en bloques, cada bloque tiene el mismo número predeterminado de símbolos de datos con base al índice de muestreo de la señal análoga correspondiente . El método de acuerdo con la presente invención se
52/354 puede emplear para transformar una señal digital de entrada la cual represente valores de números enteros a una señal de salida la cual también represente valores de números enteros . El método de transformación de acuerdo con la presente invención es reversible. La señal de salida se puede retransformar a la señal de salida original al efectuar el método de transformación de acuerdo con la presente invención. Esta propiedad de reversibilidad de la transformación de acuerdo el método de la presente invención, se puede utilizar en la codificación sin pérdida en la cual la señal de salida sería idéntica a la señal de salida original . Esta transformación de números enteros de las señales de acuerdo con la presente invención se puede emplear en muchas aplicaciones y sistemas, como por ejemplo, audio MPEG, compresión de imágenes y video, analizadores JPEG2000 o espectrales (para analizar señales infrarrojas, ultravioletas o de radiación magnética nuclear) . También se puede implementar con facilidad en sistemas de hardware, como por ejemplo, en un procesador de señal digital (PSD) de punto fijo, sin tener que considerar factores, como por ejemplo, el sobreflujo en el caso de una transformación de señal de valor real . Una modalidad preferida de la presente invención descrita anteriormente es adecuada tanto para aplicaciones
52/354 mono como para aplicaciones estéreo. En aplicaciones mono, dos bloques consecutivos de muestras se agrupan y procesan juntas. Esto produce un retardo de señal de una longitud de bloque cuando se compara con el procesamiento de un solo bloque. Sin embargo, en aplicaciones estéreo, se puede evitar este retardo adicional del bloque, si simultáneamente se agrupan y procesan juntos bloques de muestras desde el canal izquierdo y derecho. De acuerdo con el método de la presente invención, la señal de digital se transforma en el dominio de frecuencia por medio del elemento transformador. De preferencia, el elemento transformador comprende una pluralidad de pasos de estiramiento. El elemento transformador se puede ilustrar con base al modelo de estiramiento escala . El modelo de estiramiento escala tiene dos piezas, cada una para recibir uno de dos grupos de símbolos de datos . Se proporcionan dos pasos más de estiramiento de conexión en cascada entre las dos piezas laterales. Cada paso de estiramiento recibe una señal en un extremo (extremo de entrada) y le da salida a una señal en el otro extremo (extremo de salida) vía una unidad de suma. Se configura una unidad de redondeo en el extremo de salida. Los pasos de estiramiento se configuran entre las piezas laterales de una manera alternativa, de modo que los extremos de salida
52/354 (o de entrada) de los pasos de estiramiento se conectan a las distintas piezas laterales. Se debe mencionar que aunque el elemento transformador se describe en la forma del modelo de estiramiento escala, el mismo es únicamente para ilustrar las trayectorias de transformación del elemento transformador. Sin embargo, la presente invención no se limita a este modelo de estiramiento escala. Las transformadas discretas de coseno, las transformadas discretas de seno, transformadas discretas de Fourier o transformadas discretas W son ejemplos de transformaciones que se pueden llevar a cabo con el uso del método de acuerdo con la presente invención. En un aspecto de la presente invención, cada paso de estiramiento corresponde a una matriz estirada que es una matriz triangular por bloques que comprende cuatro submatrices, con dos matrices invertibles de número entero en una diagonal. Un ejemplo de una matriz estirada es:
donde C„ es la matriz de función
transformación, en este caso, la matriz de transformación TDC-IV, y P1N y P2N con matrices de permutación. Una matriz
52/354 de permutación es una matriz que cambia la posición de los elementos en otra matriz. Las matrices de permutación también pueden ser idénticas. Las matrices invertibles de números enteros también se pueden configurar en la matriz estirada de otra manera, por ejemplo como:
P2 -rJV (2) 'N
De preferencia, las matrices invertibles de números enteros son matrices diagonales que comprenden sólo componentes que son uno o menos de uno. La Figura 1 muestra la arquitectura de un codificador de audio 100 de acuerdo con una modalidad de la presente invención. El codificador de audio 100 comprende un codificador de fase de base conceptual convencional en la transformada discreta de coseno modificada (TDC ) y un codificador intensificador de la acción de evitar la pérdida basado en la transformada discreta de coseno modificada por números enteros (TDCMent) . En el codificador de audio 100 se proporciona una señal de audio 109 que se proporciona por ejemplo, mediante el micrófono 110 y que se digitaliza por medio del convertidor de análogo a digital 111. La señal de audio 109 comprende una pluralidad de símbolos de datos. La señal de audio 109 se divide en una pluralidad de bloques, en donde
52/354 cada bloque comprende una pluralidad de símbolos de datos de la señal digital y cada bloque se transforma mediante el dispositivo 101 de transformada discreta de coseno modificada (TDCM) . Los coeficientes de TDCM se cuantifican mediante el cuantificador 103 con la ayuda de un modelo perceptivo 102. El modelo perceptivo controla el cuantificador 103 de manera que las distorsiones audibles que se originan por el error de aproximación son bajas. Los coeficientes de TDCM cuantificados posteriormente se codifican mediante el codificador 104 de corriente de bitios lo que produce la corriente de bitios 112 de salida perceptivamente codificada con pérdida. El codificador 104 de corriente de bitios comprime sin pérdidas su entrada para producir una salida que tenga un Indice de bitios promedio inferior que su entrada, esto mediante métodos estándares, como por ejemplo, el método de codificación de Huffman o el método de codificación por longitud de recorridos . La señal de audio de entrada 109 también se alimenta en un dispositivo de TDCMent 105 que produce coeficientes de TDCMent . Los coeficientes de TDCM cuantificados , los cuales son la salida del cuantificador 103, se emplean para predecir los coeficientes TDCMent . Los coeficientes de TDCM cuantificados se alimentan en un cuantificador inverso 106 y la salida (los coeficientes TDCM restaurados o no
52/354 cuantificados) se alimenta a unidad de redondeo 107. Los redondeos de unidad hacia un valor de número entero de los coeficientes de TDCM y de los coeficientes de TDCMent residuales, los cuales son la diferencia entre la TDCM de valor de número entero y los coeficientes de TDCMent, se someten a codificación entrópica por medio de un codificador entrópico 108. El codificador entrópico, el codificador de análogo a corriente de bitios 104, reduce sin pérdidas el Indice bitios promedio de su entrada y produce una corriente de bitios 113 intensificadora de la acción de no presentar pérdidas . La corriente de bitios 113 intensificadora de la acción para no presenta pérdidas junto con la corriente de bitios perceptivamente codificada 112, portan la suficiente información para reconstruir la señal de audio de entrada 109 con un error mínimo. La Figura 2 muestra la arquitectura de un codificador de audio 200 que comprende una modalidad de la presente invención, que corresponde al codificador de audio 100 mostrado en la Figura 1. La corriente de bitios perceptivamente codificada 207 se suministra a un codificador de corriente de bitios 201, el cual realiza las operaciones inversas con respecto a las operaciones del codificador corriente de bitios 104 de la Figura 1, lo que produce una corriente de bitios decodificada . La corriente de bitios decodificada se suministra a un cuantificador
52/354 inverso 202, cuya salida (coeficientes de TDCM restaurados) se suministran al dispositivo TDCM inverso 203. En consecuencia, se obtiene la señal de audio perceptivamente codificada 209. La corriente de bitios 208 intensificadora de la acción para no presentar pérdidas se suministra hacia un codificador entrópico 204, el cual realiza las operaciones inversas con respecto a las operaciones del codificadora corriente de bitios 108 de la Figura 1 y que produce los coeficientes de TDCMent residuales correspondientes. La salida del cuantificador inverso 202 se redondea mediante un dispositivo de redondeo 205 para producir coeficientes de TDCM de valor de número entero. Los coeficientes de TDCM de valor de número entero se agregan a los coeficientes de TDCMent residuales, con lo que se produce los coeficientes de TDCMent. Por último, la TDCMent inversa se aplica a los coeficientes de TDCMent por medio del dispositivo de TDCMent inversa 206 para producir la unidad de audio intensificadora de la acción para no presentar pérdidas 210 reconstruida. La Figura 3 muestra el diagrama de flujo 300 de una modalidad del método de acuerdo con la presente invención empleando la TDC-IV como una transformación y empleando tres paso de estiramiento, un primer paso de estiramiento 301, un segundo paso de estiramiento 302 y un tercer paso de estiramiento 303. Este método se emplea de
52/354 preferencia en el dispositivo de TDCMent 105 de la Figura 1 y en el dispositivo de TDCMent inversa 206 de la Figura 2 para implementar la TDCMent y TDCMent inversa, respectivamente. En la Figura 3,__x1 e x2 son el primero y segundo bloques en la señal digital respectivamente, z_ es una señal intermedia, e y e y2 son señales de salida que corresponden al primero y segundo bloques de la señal digital, respectivamente. Tal como se ha explicado en lo anterior, el algoritmo TDC-IV tiene una función importante en la codificación de audio sin pérdida. La función de transformación de la TDC-IV comprende la matriz de transformación N . De acuerdo con esta modalidad de la presente invención, el elemento transformador corresponde a una matriz de bloques-diagonal que comprenden dos bloques, en donde cada bloque comprende la matriz de transformación . De tal modo que, en esta
modalidad, la matriz que corresponde al elemento transformador es:
en el contexto de esta modalidad se
denominará la matriz de transformación tratada en lo anterior .
52/354 El número de matrices de estiramiento, y en consecuencia, el número de pasos de estiramiento en el elemento transformador, en esta modalidad de la presente invención, en donde TDC-IV es la función de transformación, es tres. La TDC-IV de una secuencia x(n) de entrada real en el punto N se define de la siguiente manera:
Siendo CN la matriz de transformación de TDC-IV,
es decir:
La siguiente relación mantiene para la matriz TDC-IV inversa:
con x = [?(?)]?=?? ... ?_? e y = [m(n)]m=0 ... N_, , la ecuación 4 se puede expresar como : (7¡
Ahora, considerando xlr x2 dos vectores de números enteros de columna Nxl . Los vectores de columna Xi, x2 que
52/354 corresponden a dos bloques de la señal digital, de acuerdo con la presente invención, se transforman por un elemento transformador. Las transformadas TDC-IV de x, x2 son ylt y2l respectivamente.
½ = (8) ?2 CN XZ (9) Combinando (8) y (9)
La anterior matriz diagonal es la matriz de bloques-diagonal en la que corresponde al elemento transformador corresponde . se encuentra dentro de la presente invención si la anterior ecuación se cambia por simples modificaciones algebraicas como la que nos lleva a :
Considerando T2N la contra matriz diagonal en
(1) , es decir:
La T2N de la matriz se puede factorizar de la
52/354 siguiente manera
Donde I_N es la matriz identidad NxN. La ecuación (13) se puede verificar fácilmente empleando la propiedad TDC-IV en la ecuación (7) . Haciendo uso de la ecuación (13) , la ecuación (11) se puede expresar como :
Las tres matrices de estiramiento en la ecuación
(14) corresponden a los tres pasos de estiramiento mostradas en la Figura 3. Cada matriz de estiramiento en la ecuación (14) comprende la matriz auxiliar , que por sí
misma es la matriz de transformación. A partir de la ecuación (14) , se deriva el siguiente algoritmo TDC-IV de números enteros el cual computa dos TDC-IV de números enteros con un elemento transformador . La Figura 4 ilustra la modalidad del método de acuerdo con la presente invención empleando TDC-IV como la función de transformación. Esta modalidad se emplea en al codificador de audio 100 mostrado en la Figura 1 para
52/354 implementar la TDCMent . Al igual que en la Figura 3, x y x2 son dos bloques de la señal digital de entrada, z es una señal intermedia, e 2 e y2 son bloques que correspondientes de la señal de salida. Los tres pasos de estiramiento ilustradas en la
Figura 4 corresponden a las tres matrices de estiramiento en la ecuación (14) . Tal como se ilustra en la Figura 4, la transformada de dominio del tiempo a frecuencia se determina de la siguiente manera: En el primera paso 401, x2 se transforma con una transformación TDC-IV 402 y los coeficientes de TDC-IV se redondean 403. Los coeficientes de TDC-IV redondeados después se agregan a xx 404. Por consiguiente, se genera la señal intermedia z. En consecuencia, la señal intermedia z cumple con la ecuación:
En el segundo paso 405, z se transforma con la transformación TDC-IV 406 y los coeficientes de TDC-IV se redondean 407. Después se substraen los coeficientes redondeados de TDC-IV a partir de xx. Por consiguiente, se genera la señal de salida y2. Por ello, la señal de salida yi cumple con la ecuación:
En el tercer paso 409, y_x se transforma con la transformación TDC-IV 410 y los coeficientes de TDC-IV se redondean 411. Después se substraen los coeficientes redondeados de TDC-IV a partir de z. Por consiguiente, se genera la señal de salida y2. Por ello, la señal de salida y2 cumple con la ecuación:
donde [*] denota una operación de redondeo. La Figura 5 ilustra el algoritmo para la transformación inversa de acuerdo con una modalidad del método de la presente invención empleando TDC-IV como la función de transformación. Esta modalidad se emplea en el codificador de audio 200 mostrado en la Figura 2 para implementar la TDCMent inversa. El algoritmo ilustrado en la Figura 5 es la inversa del algoritmo ilustrado en la Figura 4. Las denotaciones para las distintas señales ylr y2, xlr ¾ y se eligen para que correspondan a las denotaciones de la Figura 4. Tal como se ilustra en la Figura 5, la transformada del dominio de tiempo al dominio de frecuencia se determina de la siguiente manera: En el primer paso 501, yi se transforma con una transformación TDC-IV 502 y los coeficientes de TDC-IV se redondean 503. Los coeficientes de TDC-IV redondeados después se agregan a y2 504. Por consiguiente, se genera la señal intermedia z. En consecuencia, la señal intermedia z cumple con la ecuación:
á = ISL J+ 2 (16a)
En el segundo paso 505, z se transforma con la transformación TDC-IV 506 y los coeficientes de TDC-IV se redondean 507. Después se substraen los coeficientes redondeados de TDC-IV a partir de i. Por consiguiente, se genera la señal de salida x2. Por ello, la señal x2 cumple con la ecuación:
En el tercer paso 509, x2 se transforma con la transformación TDC-IV 510 y los coeficientes de TDC-IV se redondean 511. Después se substraen los coeficientes redondeados de TDC-IV a partir de z. Por consiguiente, se genera la señal ¾. Por ello, la señal ¾ cumple con la ecuación:
Se puede observar que el algoritmo de acuerdo con las ecuaciones (16a) a (16c) es inverso al algoritmo de acuerdo con las ecuaciones (15a) a (15c) . En consecuencia, si se emplea el codificador y el decodificador ilustrados en las Figuras 1 y 2 , los algoritmos proporcionan un método y un aparato para la codificación de audio sin pérdida. Las ecuaciones (15a) a (15c) y (16a) a (16c) además muestran que para calcular dos TDC-IV NxN de números enteros, son necesarias tres TDC-IV NxN, tres redondeos Nxl y tres adiciones Nxl. Por ello, para una TDC-IV de números enteros NxN, el promedio es : RC(N)~15N (17)
ÁC(N) =l.SAC(Cf?)+L5N (18 )
Donde RC ( . ) es el número total redondeado, y AC ( . ) es el número total de operaciones aritméticas. En comparación con los algoritmos TDC-IV de números enteros directamente convertidas, el algoritmo de TDC-IV de números enteros propuesto reduce RC desde el nivel Nlog2N a N. Tal como se ha indicado con la ayuda de la ecuación (18) , la complejidad aritmética del algoritmo de TDC-IV de números enteros propuesto es aproximadamente 50 por ciento más que el de un algoritmo de TDC-IV. Sin embargo, si también se considera RC, la complejidad combinada (AC+RC) del algoritmo propuesto no excede por mucho a la de los algoritmos de números enteros directamente convertidos. El análisis exacto de la complejidad algorítmica depende del
52/354 algoritmo de TDC-IV empleado. Tal como se muestra en las Figuras 4 y 5 , el algoritmo de TDC-IV de números enteros propuesto tiene una estructura simple y modular. Se puede emplear cualquier algoritmo de TDC-IV ya existente en su bloque de computación de TDC-IV. El algoritmo propuesto es adecuado para aplicaciones que requieran TDCMent, por ejemplo, en el modelo 0 de referencia de extensión 3 de audio de MPEG-4. La Figura 6 muestra el diagrama de flujo 600 de una modalidad del método de la presente invención que emplea cinco pasos de estiramiento, un primer paso de estiramiento 601, un segundo paso de estiramiento 602, un tercer paso de estiramiento 603, un cuarto paso de estiramiento 604 y un quinto paso de estiramiento 605. Este método se puede emplear en el dispositivo TDCMent 105 de la Figura 1 y en el dispositivo de TDCMent inversa 206 de la Figura 2 para implementar TDCMent y TDCMent inversa, respectivamente. En la Figura 6, ? y x2 son los bloques primero y segundo de la señal de digital, respectivamente. Zi, z_2, ? , son señales intermedias, e yi e y2 son señales de salida que corresponden al primero y segundo bloques de la señal digital respectivamente . La Figura 7 muestra un diagrama de flujo de una modalidad del método de la presente invención, en donde la función de transformación es una función de transformación
52/354 de TDC-IV. CN de la matriz de TDC-IV (véase la ecuación
(5) ) se puede factorizar como (20)
donde Peo es una matriz par-impar, es decir, una matriz de permutación que reordena los componentes del vector.
al separar los componentes que corresponden a Indices pares de los componentes que corresponden a los índices impares; es decir, de la siguiente manera:
donde además
52/354 con
??G?2 (25) y
La ecuación (20) también se puede escribir como: donde El elemento transformador empleado en la 2/354 modalidad ilustrada en la Figura 7 corresponde a la ecuación (29) . Cada matriz de estiramiento S, T2 y T3 en la ecuación (29) comprende la matriz auxiliar C^l2 , que por sí
misma es la matriz de transformación. El elemento transformador comprende cinco pasos de estiramiento que corresponden a las cinco matrices de estiramiento de la ecuación (29) . Además, el elemento transformador comprende un paso de intercambio de datos que corresponde a la matriz de permutación Peo . En la Figura 7, la entrada del primer paso de estiramiento son los dos bloques de la señal digital ¾ y x2, ??, ? ? Y ?ß son señales intermedias e y e y2 son señales de salida que corresponden al primero y segundo bloques de la señal digital, respectivamente. La entrada del elemento transformador x y los dos bloques de entrada del primer paso de estiramiento del elemento transformador ¾ y ¾ cumplen con la ecuación:
En lo siguiente, se explica el primer paso de estiramiento 701 que es el paso de estiramiento que corresponde a la matriz de estiramiento T3.
V2 Considerando el vector de salida del primer
52/354 paso de estiramiento, para el momento en que no se redondea hacia valores enteros es decir:
Empleando la definición de T3 provista por la ecuación (22), la ecuación (29) se rescribe como:
2 Donde denota la matriz de identidad de dimensión N/2. Dado que en esta modalidad se proporciona un algoritmo reversible para TDC-IV de números enteros, se incluye un redondeo hacia valores de números enteros. Por ello, de acuerdo con la ecuación (30) , en el primer paso 706 del primer paso de estiramiento 701, x se multiplica por k3. El resultado de esta multiplicación se redondea a valores de números enteros en el paso 707. Los valores redondeados después se agregan a x2 en el paso 708. Por consiguiente, la señal intermedia zx cumple con la ecuación:
Donde [*] denota la operación de redondeo.
52/354 Puesto que los otros cuatro pasos de estiramiento 702, 703, 704, 705 del elemento transformador ilustrado en la Figura 7, que corresponden a las matrices T2/ S, R2 y ¾, respectivamente, tienen estructuras idénticas al primer paso de estiramiento 701, se omite su explicación. Sólo se tiene que hacer notar que en el paso de adición 709 del segundo paso de estiramiento 702, ¾ se multiplica, de acuerdo de la definición de T2, con -DN/2 · En lo siguiente, los pasos de estiramiento del elemento transformador de la transformación inversa se explican haciendo referencia a la Figura 8. La Figura 8 ilustra los pasos de estiramiento del elemento transformador para la transformación inversa de la transformación ilustrada en la Figura 7. En la Figura 8, la entrada del primer paso de estiramiento son los dos bloques de la señal de i e y2t zlt j¾ y ¾ son señales intermedias, y ¾ y x.2 son señales de salida que corresponden al primero y segundo bloques de la señal digital, respectivamente. El último paso de estiramiento 805 que se ilustra en la Figura 8 es inversa al primer paso de estiramiento 701 ilustrada en la Figura 7. Por ello, en el primer paso 806 del último paso de estiramiento 805, ¾ se multiplica por ¾. El resultado de esta multiplicación se redondea a valores de números enteros en el paso 807. Los valores
52/354 redondeados después se sustraen de ?_ en el paso 808. En consecuencia la señal x2 cumple con la ecuación:
Donde [*] denota una operación de redondeo. Dado que los otros cuatro pasos de estiramiento 801, 802, 803, 804 del elemento transformador ilustrado en la Figura 8, los cuales son inversas a las etapas de aislamiento 705, 704, 703 y 702 del elemento transformado en la Figura 7, respectivamente, tienen estructuras idénticas a la última etapa de estiramiento 805, se omite su explicación. Sólo se tiene que hacer notar que después de la etapa de adición 809 de la cuarta etapa de estiramiento 804, el resultado de la etapa de adición 809 se multiplica por -DN/2 para producir ¾. Se puede observar que las etapas de estiramiento 805, 804, 803, 802 y 801 de la Figura 8 son inversas a las etapas de estiramiento 701 a 705 de la Figura 7, respectivamente. Puesto que también la permutación de la señal de entrada que corresponde a la matriz Peo se puede invertir y una etapa de intercambio de datos subsiguiente se comprende por el elemento transformador inverso, el método provisto es reversible, por consiguiente, si se emplea en el codificador de audio 100 y el decodificado de audio 200
52/354 ilustrados en las Figuras 1 y 2, se proporciona un método y un aparato para codificación de audio sin pérdida. Un análisis del número de redondeos empleados en esta modalidad se proporciona al final de la descripción de la invención. La Figura 9 muestra la arquitectura de un sistema de almacenamiento de imágenes de acuerdo con una modalidad de la presente invención. La Figura 9 muestra una fuente de imagen 901, por ejemplo una cámara, que proporciona una señal de imagen análoga . La señal de imagen se procesa por medio de un convertidor de análogo a digital 902 para proporcionar una señal de imagen digital correspondiente . La señal de imagen digital se codifica sin pérdida por medio de un codificador de imágenes sin pérdida 903 que incluye una transformación del dominio de tiempo al dominio de frecuencia. En esta modalidad, el dominio del tiempo corresponde al espacio de coordenadas de la imagen. La señal de imágenes codificada sin pérdidas se almacena en un dispositivo de almacenamiento 904, por ejemplo un disco duro o un DVD.
Cuando se necesita la imagen, la señal de imagen codificada sin pérdida se extrae del dispositivo de almacenamiento 904 y se transfiere a un decodificador de imágenes sin pérdida 905 que decodifica la señal de imagen codificada sin pérdida y reconstruye la señal de imagen original sin
52/354 ninguna pérdida de datos . Este almacenamiento sin pérdida de señales de imágenes es importante, por ejemplo, en el caso en que las imágenes son mapas de errores de plaquitas semiconductoras y se tengan que almacenar para su posterior análisis. En lo siguiente, se explica una modalidad adicional para el método para la transformación de una señal digital a partir del dominio de tiempo al dominio de frecuencia y viceversa de acuerdo a la invención. Esta modalidad de preferencia se utiliza en el codificador de imágenes sin pérdidas 903 y en el decodificador de imágenes sin pérdidas 905 del sistema de almacenamiento de imágenes ilustrado en la Figura 9. La Figura 10 ilustra una modalidad del método de acuerdo con la presente invención empleando la TDW-IV como la función de transformación. La TDW-IV de una secuencia x(n) de entrada real de punto N se define de la siguiente manera:
La matriz de transformación de TDW-IV está dada por: matriz TWC-IV se factoriza de la siguient forma WrNlV ~RílTífPN (38)
RN es una matriz de rotación NxN definida como
•un es la matriz de identidad de orden N/2.
J es la matriz de identidad opuesta de orden N/2, es decir,
una matriz de permutación NxN
T es una matriz NxN dada por:
Donde cIV NI2 es la matriz TDC-IV de orden N/2, es decir, una matriz de transformación correspondiente de inferior dimensión.
D Mil es una matriz diagonal de orden N/2 dada por :
RN y N además se puede factorizar en un producto de matrices de estiramiento:
Donde y
En consecuencia, la ecuación (38) se puede cribir en la forma:
RiRtRiTT TiPJ¡ (49)
Las matrices de estiramiento R3 y T¿ se pueden agregar a la matriz de estiramiento S:
A partir de la ecuación (49) y la ecuación (50) , la siguiente fórmula de factorización para la matriz TDW-IV se puede obtener:
La ecuación (51) indica que un elemento transformador para la transformada TDW-IV de números enteros se puede emplear para que comprenda cinco etapas de estiramiento. Cada matriz de estiramiento S, T2 y T3 en la
52/354 ecuación (51) comprende la matriz auxiliar Nlz- , que por sí misma es la matriz de transformación. Además, el elemento transformador comprende una etapa de intercambio de datos que corresponde a la matriz de permutación ¾. La etapa de intercambio de datos reconfigura el orden de los componentes en cada bloque de datos de entrada . De acuerdo a PN, el vector de datos de entrada se reconfigura de la siguiente manera: la primera mitad del vector permanece sin cambios; la segunda mitad del vector se invierte, es decir
(52) En la Figura 10, la entrada de la primera etapa de estiramiento son los dos bloques de la señal digital x% y x2, z?, z2 y z3 son señales intermedias, e 2 e ? son señales de salida que corresponden al primero y segundo bloques de la señal digital, respectivamente. La entrada del elemento transformador x y de los dos bloques de entrada de la primera etapa de estiramiento del elemento transformador ?? y x2 cumplen con la ecuación:
52/354
En lo siguiente, se explica la primera etapa estiramiento 1001, la cual es la etapa de estiramiento corresponde a la matriz de estiramiento T3.
Considerando J| que el vector de salida de la primera etapa de estiramiento, para el momento en que no se redondea hacia un valor de números enteros, es decir:
Empleando la definición de T3 provista por la ecuación (45) , la ecuación (51) se rescribe de la siguiente manera :
Puesto que en esta modalidad se provee un algoritmo reversible para TDW-IV de números enteros, se incluye un redondeo a valores de números enteros. Por ello, de acuerdo con la ecuación (55) , en el primer paso 1006 en la primera etapa de estiramiento 1001, ¾ se multiplica por
52/354 K3. El resultado de esta multiplicación se redondea a valores de números enteros en el paso 1007. Los valores redondeados después se agregan a ¾ en el paso 1008. En consecuencia, la señal intermedia z_x cumple con la ecuación:
Donde [*] denota una operación de redondeo. Puesto que los otros cuatro pasos de estiramiento
1002, 1003, 1004, 1005 del elemento transformador ilustrado en la Figura 10, las cuales corresponden a las matrices T2i S, R2 Y Ri respectivamente, tienen estructuras idénticas a la primera etapa de estiramiento 1001, se omite su explicación. Sólo se tiene que hacer notar que en el paso de adición 1009 de la segunda etapa de estiramiento 1002, x2 se multiplica, de acuerdo a la definición de T2, con DN/2 En lo siguiente, las etapas de estiramiento del elemento transformador de la transformación inversa se explica haciendo referencia a la Figura 11. La Figura 11 ilustra la etapa de estiramiento del elemento transformador para la transformación inversa de la transformación ilustrada en La Figura 10. En la Figura 11, la entrada de la primera etapa de estiramiento son los dos bloques de la señal digital yi e
52/354 ?_2, ??, z_2 Y z_3 son señales intermedias y ?? y x2 son señales de salida que corresponden al primero y segundo bloques de la señal digital, respectivamente La última etapa de estiramiento 1105 ilustrada en la Figura 11 es inversa a la primera etapa de estiramiento 1001 ilustrada en la Figura 10. Por ello, en la primera etapa 1106 de la última etapa de estiramiento 1105, ¾ se multiplica por K3. El resultado de esta multiplicación se redondea a valores de números enteros en el paso 1107. Los valores redondeados después se sustraen de z en el paso 1108. Por consiguiente, la señal ¾ cumple con la ecuación:
Donde [*] denota una operación de redondeo. Puesto que los otros cuatro pasos de estiramiento 1101, 1102, 1103, 1104 del elemento transformador ilustrado en la Figura 11, los cuales son inversos a las matrices de estiramiento 1005, 1004, 1003 y 1002, respectivamente, tienen estructuras idénticas a la primera etapa de estiramiento 1105, se omite su explicación. Sólo se tiene que hacer notar que después del paso de adición 1109 de la cuarta etapa de estiramiento 1104, el resultado del paso de adición 1109 se multiplica con DN/2 para producir
52/354 Se puede observar que las etapas de estiramiento 1105, 1104, 1103, 1102 y 1101 de la Figura 11 son inversas a las etapas de estiramiento 1001 a 1005 de la Figura 10, respectivamente . Puesto que también la permutación de la señal de entrada que corresponde a la matriz PN se puede invertir y una etapa de intercambio de datos correspondiente se comprende por el elemento transformador inverso, el método total provisto es reversible, en consecuencia, si se emplea en el codificador de imágenes sin pérdida 903 y en el decodificador de imágenes sin pérdida 905 ilustrados en la Figura 9, se proporciona un método y un aparato para la codificación de imágenes sin pérdida. Aunque en las modalidades explicadas, las modalidades del método de acuerdo con la presente invención para TDC-IV se emplearon para la codificación de audio y la modalidad del método de acuerdo con la presente invención para TDW-IV se usaron para codificación de imágenes, las modalidades del método de acuerdo con la presente invención para TDC-IV también se pueden emplear para la codificación de imágenes, la modalidad del método de acuerdo con la invención para TDW-IV también se puede emplear para codificación de audio y todas se pueden emplear también para la codificación de otras señales digitales, como por ejemplo, imágenes de video Considerando las ecuaciones (34) y (35) , alguien
52/354 puede advertir que existen redondeos N/2 en cada etapa de estiramiento. Por consiguiente, considerando la ecuación (26) , alguien puede advertir que el número redondeado total para el elemento transformador para la modalidad del algoritmo TDC-IV ilustrado en las Figuras 7 y 8 de acuerdo con la presente invención es cinco veces N/2, es decir, 2.5N, que es consideradamente inferior al Nlog2N de acuerdo con el estado de la técnica. Considerando de nueva cuenta la ecuación (29) , alguien puede advertir que la principal potencia computacional se emplea en las cuatro subrutinas de TDC-IV de punto N/2 que corresponden a una multiplicación con —m=-\,cuando N es un valor grande, por ejemplo, N = 1024. Debido a que TDC-IV de punto flotante se puede calcular empleando una TDC-IV de dos longitudes medias más rotaciones previas y posteriores, la complejidad de la TDC-IV de números enteros propuesta se estima con dificultad que es dos veces la de la TDC-IV de punto flotante. Una conclusión similar se puede extraer para la función de transformación TDW-IV de números enteros. En lo siguiente, se explica una modalidad adicional del método para la transformación de una señal digital del dominio de tiempo al dominio de frecuencia y viceversa de acuerdo con la presente invención. En esta modalidad de la presente invención, la
52/354 transformación del dominio es una transformada de TDC, por medio de la cual el tamaño del bloque N tiene algunos números enteros y donde el vector de entrada comprende dos subvectores .
Considerando la matriz de la transformada NxN (también llamada TDC tipo dos) :
Cj =
Donde :
y N es el tamaño de la transformada que puede ser una potencia de dos, N=2 " en una modalidad e i es un número entero mayor de cero . m y n son índices de matrices .
Considerando ^ I la matriz de transformada NxN de TDC tipo IV, tal como ya se ha decidido en la anterior:
m7n ?*0 "·,? -1
52/354 Tal como en lo anterior, se utilizara una plularidad de matrices de estiramiento, estas matrices de estiramiento están en esta modalidad de matrices 2Nx2N de la siguiente forma.
En donde IN es la matriz identidad NxN, 0N es la matriz cero NxN, &N es una matriz arbitraria NxN. Para cada matriz de estiramiento L2 / se realiza un mapeo de entero a entero reversible a la etapa de estiramiento reversible de la misma manera como en la etapa de estiramiento 2x2 descrita en la referencia incorporada "Factorig Wavlet Transforme into Lifting Steps, " Tech. Report, I. Daubechies and W. Sweldens, Bell Laboratories, Lucent Technologies, 1996. La única diferencia es que el redondeo se aplica a un vector en lugar de hacerlo a una sola variable . En la anterior descripción de las otras modalidades, ya se ha detallado cómo se realiza una etapa de estiramiento para una matriz de estiramiento, asi que en lo sucesivo se omitirá la explicación de las etapas de estiramiento que corresponden a la matrices de estiramiento. Alguien puede advertir que la transposición de
J L2N, , también es una matriz de estiramiento. En esta modalidad, el elemento transformador
52/354 corresponde a una matriz, cuya T2N se define como una matriz 2Nx2N de la siguiente manera:
T* — N o (62) N
La descomposición de la matriz T2N en las matrices de matrices de estiramiento tienen la siguiente forma:
„ = P3 L8 L7 L6 P2 L5 L4 L3 L2 Ll H ( 63)
Las matrices que constituyen el lado derecho de la anterior ecuación se explicarán más adelante. Pl es una primera matriz de permutación dada por la ecuación:
Pl= (64) J* o
Donde JN es la matriz de índice opuesta NxN dada por :
yy DDNN eess una matriz diagonal NxN con elementos
52/354 diagonales que son 1 y -1 alternativamente:
P2 es una segunda matriz de permutación, un ejemplo de la misma se genera por medio de la siguiente programación de MATLAB:
Pd = distinguir (2*N) ; para i = 2 : 2 : N, Pd (i, i) = 0; Pd (N+i, N+i) = 0; Pd (i, N+i) = 1; Pd (N+i, i) = 1; Finalización Peo = ceros (2*N) ; para i = 1 : N, Peo (i, 2*i-l) = 1; Peo(i+N, 2*i) = 1; Finalización P2 = (Pd*Peo) ' ;<BR> P2 = (Pd*Peo) ' ;
Como un ejemplo, cuando N es 4, P2 es una matriz 8x8 dada como :
52/354 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 1 0 0 0 0 0 0 para N = 4 (67)
0 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 1 0 0 0 0 P3 es una tercera matriz de permutación, un ejemplo de la misma se genera por medio de la programación de MATLAB:
P3 = ceros (2*N) ; para i = 1 : N, P3 (i, 2*i-l) P3 (N2-Í+1, 2*i) finalización
Como un ejemplo, cuando N es 4, P3 es una matriz 8x8 dada como :
52/354 Ll es una primera matriz de estiramiento,
Donde Z1N es una matriz diagonal opuesta NxN da como :
L2 es una segunda matriz de estiramiento;
Donde Z2N es una matriz diagonal opuesta NxN dada como :
52/354 L3 es una tercera matriz de estiramiento :
Donde L4 es una cuarta matriz de estiramiento:
Donde : L5 es una quinta matriz de estiramiento: Donde : Z5N +l (78) L6 es una sexta matriz de estiramiento:
Donde Z6N es una matriz diagonal opuesta NxN dada como
L7 es una séptima matriz de estiramiento:
Donde Z7ff es una matriz diagonal opuesta NxN dada como
L8 es la octava matriz de estiramiento :
3L8 = L6 (83) Por consiguiente, se origina la factorización tal como se muestra en (x) :
Tztl = P3-L8-L7-L6-P2'I -I -L3-L2-L1-P1 ( 84 ) Donde Pl, P2, y P3 son tres matrices de permutación. Lj7 j de 1 a 8, son ocho matrices de estiramiento . Las matrices de estiramiento L3, L4 y L5 comprenden una matriz de transformación auxiliar, la cual es en este caso, por si misma la matriz de transformación
4V. A partir de la ecuación (84) , es posible computar la TDC de números enteros para dos señales de entrada de dimensión Nxl . Dado que la ecuación (84) proporciona una factorización de matriz de estiramiento la cual describe el dominio de transformación de TDC-IV, se pueden emplear sus matrices de estiramiento de la manera que se muestra en este documento para calcular la transformación de dominios de una señal de entrada aplicada. La ecuación (84) se puede derivar de la siguiente manera . La siguiente descomposición se puede derivar empleando la descripción de Wang, Zhongde, wQn Computing the Discrete Fourier and Cosine Transforme", IEEE Transaction on Acoustics, Speech and Signal Processing, Vol. ASSP-33, No. 4 de octubre de 1985:
sabido, en donde denota la matriz de transformación de la transformada de seno discreta de tipo 2. PN es una matriz de permutación NxN dada por:
NI2 (86) Nñ
y
ecuación (85) se puede combinar con ecuación: donde PEo es una matriz de permutación par-impar,
RPO es igual a ¾,
Después, la ecuación de transposición (87) se convierte a
La combinación de la ecuación (85) y la ecuación (88) produce:
donde
a partir de la ecuación (89) , la ecuación (84) se puede derivar con facilidad. En esta modalidad, la computación de la transformación del dominio solamente requiere de operaciones de redondeo 4N, tal como se explicará a continuación: Considerando a(*) el número de adiciones reales, µ(*) el número de multiplicaciones reales, e ?(*) el número de redondeos reales, respectivamente. Para el algoritmo de TDCent propuesto, alguien lo obtendría: (TDCent) = 11N + 3a(TDC-IV) µ (TDCent) = 9 + 3µ (TDC-IV) ? (TDCent) = 8N Los resultados anteriores son para dos bloques de muestras de datos, debido a que el algoritmo de TDCent propuesto los procesa juntos. En consecuencia, para un bloque de muestra de datos, los cálculos necesarios se dividen a la mitad, los cuales son: i (TDCent) = 5.5N + 1.5a (TDC-IV) µ1(TDCe t) = 4.5N + l^(TDC-IV) y1 (TDCent) = 4N donde ax, µ? e yx son el número de adiciones reales, el número de multiplicaciones reales y el número de redondeos reales, para un bloque de muestras, respectivamente . Para cálculos de TDC-IV, se puede usar el algoritmo basado en la T F (transformada rápida de Fourier) descrito en la referencia incorporada. "Signal Processing with lapped Transforms,"H:S Malvar, Norword, MA: Artech House, 1992, págs . 199-201, para lo cual:
a (TDC-IV) = 1.51ílog2JÍ
µ (TDC-IV) = 0.5Mog2-N" + N
52/354 Consecuentemente :
aa(TDCent)= 2.25Mog2N + 5.5N
µ?????ß??;) = 0.75Nlog2N + 6N
En lo siguiente se explica una modalidad adicional para el método de la transformación de una señal digital del dominio de tiempo al dominio de frecuencia y viceversa de acuerdo con la presente invención. En esta modalidad se emplea una transformada rápida de Fourier TRF como la transformación de dominio. Considerando F la matriz transformada NxN de la TRF normalizada.
(91)
donde N es el tamaño de la transformada y son algunos números enteros positivos y, en una modalidad puede ser una potencia de dos, e i es un número entero mayor de cero, m y n son índices de matrices. En esta modalidad, una matriz de permutación P de dimensión NxN es una matriz que incluye índices 0 ó 1. Después de multiplicarla por un vector Nxl (la presentación
52/354 de la matriz de señal de entrada) , se cambia el orden de los elementos en el vector. En esta modalidad, las matrices de estiramiento se definen como matrices 2Nx2N de la siguiente forma:
Pt A O (92)
donde Pi y P2 son dos matriz de permutación, O es la matriz cero NxN, A es una matriz Nx opuesta. Para la matriz de estiramiento L, se realiza un mapeo reversible de número entero a número entero de la misma manera como se hizo en el paso de estiramiento 2x2 en la referencia incorporada antes mencionada de I. Daubechies . Sin embargo, tal como lo anterior, se aplica un redondeo a un vector en lugar de hacerlo a una simple variable . Es evidente que en la transposición de L, LT también es una matriz de estiramiento . Además, considerando T como una matriz transformada 2Nx2N :
ff (.93)
Por consiguiente, la matriz transformada modificada T (y en consecuencia la misma transformación de dominio) , se puede expresar como la factorización de la
52/354 matriz de estiramiento:
donde I es la matriz de identidad NxN, y Q es una matriz de permutación NxN dada como:
y Ow_lxi son vectores de fila y columna de ceros N-l, respectivamente. J es la matriz de índice opuesta (N-l)x(N-l) dada como :
En la ecuación 96, el espacio en blanco en el corchete representa todos los elementos de valor cero en la matriz. Las matrices de estiramiento en el lado derecho de la ecuación (94) comprenden una matriz de transformación auxiliar, que es en este caso, por sí misma la matriz de transformación F.
52/354 Tal como se puede observar a partir de la ecuación (94) , la factorización de la matriz de estiramiento se puede emplear para computar la TRF de números enteros para dos vectores complejos Nxl empleando los métodos descritos en este documento. En esta modalidad, el cómputo de la transformación de dominio sólo requiere de operaciones de redondeo 3N, a continuación también se explicarán: Considerando : a(*) es el número de adiciones reales, µ(*) es el número de multiplicaciones reales, e ?(*) es el número de redondeo reales, respectivamente .
Para el propósito de la TRFent propuesta, tenemos a (TRFent) = 6N + 3 (TRF) µ (TRFent) = 3 ^?) ? (TRFent) = 6N Los anteriores resultados son para dos bloques de muestra de datos, ya que el algoritmo TRFent propuesto los procese juntos. Por consiguiente, para un bloque para muestra de datos, los números de cálculo se dividen a la mitad, con lo cual son:
a? (TRFent) = 3N +.1.5a (TRF)
52/354 YiíT Fent) = 3N donde a(*), µ(*) e ?(*) son el número de adiciones reales, el número de multiplicaciones reales y el número de operaciones de redondeo reales para un bloque de muestras , respectivamente . Para el cálculo TRF, se puede usar el algoritmo TRF de base de partida (TRFbp) , para lo cual : a(TRFbp) = 3Nlog2N - 3N + 4 µ? (TRFbp) = Nlog2N - 3N + 4
En consecuencia, tenemos : i (TRFbp) = 4.5Mog2 N - 1.5N + 6 µa (TRFbp) = 1.5Nlog2 N - 4.5N + 6 La Figura 13 demuestra codificadores de transformada directa e inversa que se emplean para evaluar la exactitud de transformada de la técnica de transformación TDC descrita anteriormente y de la anterior transformación del dominio TRF. La prueba implica medir el error medio cuadrado (EMC) de la transformada de acuerdo con los estándares de evaluación propuestos por el grupo de codificación de audio sin pérdida MPEG-4 tal como se describe en " Coding of Moving Pictures and Audio: Work plan fox Evaluation of Integer MDCT fox FGS to Lossless Experimentation Fxamework" , ISO/IEC JTC l/SC 29/WG 11 N5578
52/3S4 Pattaya, Tailandia, marzo de 2003 que se incorpora a este documento como referencia. Específicamente, los EMC para la TDCent y la TDC de la inversa de números enteros (TDCIent) , están dadas como :
donde la señal de error e es para la TDCent , y et para la TDCIent tal como se muestra en la Figura 1. K es el número total de bloques de muestras empleados en la evaluación . Los EMC para la TRFent y la TRF inversa de números eneros (TRFIent) están dadas como:
Donde la señal de error e es para la TRFent, para la TRFent tal como se muestra en la Figura representa el patrón de un valor complejo. K es el número total de bloques de muestra empleados en la evaluación. Para ambas transformaciones de dominio, se usa un número total de 450 segundos con 15 diferentes tipos de archivos de música en el grupo de prueba de 48 Hz/16
52/354 bitios. La Tabla I muestra los resultados de la prueba. Tal como se puede observar en esta Tabla I, el EMC generado empleando los sistemas y métodos de la presente invención es mínimo, y a diferencia de los sistemas convencionales, es prácticamente independiente del procesamiento del bloque del tamaño . Haciendo referencia a la transformación de dominio de la TDC-4, el EMC se incrementa sólo ligeramente con el incremento del tamaño n del bloque de hasta 4096 bitios.- Los EMC de la TRF son incluso mejores, exhibiendo un EMC constante de 0.4 para tamaños de bloque de hasta 4096 bitios. Cuando el rendimiento demostrado de la presente invención se observa en vista de las actuales capacidades y se incrementa la necesidad de tamaños de bloque más grandes, las ventajas de la invención se vuelven mas claras.
TABLA I
52/354 REFERENCIAS INCORPORADAS Los siguientes documentos se incorporan a esta descripción como referencia: H. S. Malvar, " Signal Processing with Lapped Transforme" Artech House, 1992; R. Geiger, T. Sporer, J. Koller, . Brandenburg, "Audio Coding based on Integer Transforme" AES IIIth Convention, New York, EE.UU., Sept . 2001; Wang, Zhongde, "On Computing the Discrete Fourier and Cosíne Transforme", IEEE Transactions on Acoustics, Speech and Signal Processing, Vol . ASSP-33, No. 4 octubre de 1985; I. Daubechies y W. Sweldens, "Factoring wavelet transforme into lifting steps" , Tech. Report, Bell Laboratories, Lucent Technologies, 1996; S. Oraintara, Y. J. Chen y T. Q. Nguyen, "Integer fast Fourier transform" , IEEE Trans . Signal Processing, Vol. 50, No. 3, marzo 2002, págs . 607-618; P. Hao y Q. Shi, " at iz factorizations for reversible integer mapping" , IEEE Trans. Signal Processing, vol. 49, no. 10, Oct . 2001, págs. 2314-2324; G. Plonka y M. Tasche, "Invertibie integer DCT algorithms" , Appl . Comput . Harraon. Anal. 15: 70-88, 2003; Y. H. Zeng, L. Z. Cheng, G. A. Bi y Alex C. Kot, "Jnteg-er DCTs and fast algorithms" , IEEE Trans. Signal
52/354 Processing, vol . 49, No. 11, Nov. 2001, págs . 2774-2782; J. Wang, J. Sun y S. Yu, "l-D and 2-D transforme from integers to integers", in Proc . Int. Conf . Acoustics, Speech and Signal Processing, Hong ong, 2003, vol. II, págs. 549-552; "Coding of Moving Pictures and Audio: Work plan for Evaluation of Integer MDCT for FGS to Lossless Experimentation Framework" , ISO/IEC JTC l/SC 29/WG 11 N5578, Pattaya, Tailandia, Mar. 2003.
52/354
Claims (1)
- REIVINDICACIONES : 1. Un método para realizar transformación de dominio de una señal digital del dominio de tiempo al dominio de frecuencia y viceversa; el método comprende: realizar la transformación por medio de un elemento transformador que comprende una pluralidad de pasos de estiramiento, en donde la transformación corresponde a una matriz de transformación y en donde por lo menos un paso de estiramiento de la pluralidad de pasos de estiramiento comprende por lo menos una matriz de transformación auxiliar y una unidad de redondeo, la matriz de transformación auxiliar comprende la matriz de transformación misma o la matriz de transformación correspondiente de dimensión inferior; y realizar una operación de redondeo de la señal por medio de la unidad de redondeo, después la transformación mediante la matriz de transformación auxiliar. 2. El método según la reivindicación 1, en donde la transformación es una transformación TDC-I, una transformación TDC-IV, una transformación TDS-I, una transformación TDF-I, una transformación TDF-IV, una transformación TDS-IV, una transformación TDW-I o una transformación TDW-IV. 3. el método según la reivindicación 1 ó 2, en 52/354 donde cada paso de estiramiento comprende una matriz de estiramiento, en donde la matriz de estiramiento es una matriz triangular de bloques que comprende cuatro submatrices que son dos matrices invertibles de números enteros como dos de las submatrices en una diagonal . 4. El método según la reivindicación 3, en donde las matrices invertibles de números enteros en cada matriz de estiramiento son matrices diagonales con componentes que son uno o menor a uno . 5. El método según cualquiera de las reivindicaciones 1 a 4, en donde el elemento transformador comprende tres pasos de estiramiento. 6 El método según las reivindicación 1 a 4, en donde el elemento transformador comprende cinco pasos de estiramiento. 7. El método según la reivindicación 1 a 4, en donde el elemento transformador comprende ocho pasos de estiramiento . 8. El método según las reivindicación 1 a 7, en donde una señal de audio o una señal de video se emplea como la señal digital . 9. Un dispositivo para realizar una transformación de dominio de una señal digital del dominio de tiempo al dominio de frecuencia y viceversa, el dispositivo comprende: 52/3S4 una unidad de transformación que comprende un elemento transformador para realizar la transformación, en la unidad de transformación el elemento transformador comprende una pluralidad de pasos de estiramiento, en donde la transformación corresponde a una matriz de transformación, y en donde cada paso de estiramiento comprende por lo menos una matriz de transformación auxiliar, la cual es la matriz de transformación misma o la matriz de transformación respectiva de inferior dimensión, y en donde cada paso de estiramiento además comprende una unidad de redondeo, por medio de la cual, la señal se procesa mediante la unidad de redondeo respectiva, después la transformación mediante la matriz de transformación auxiliar respectiva. 10. El dispositivo según la reivindicación 9, en donde la unidad de transformación comprende : un dispositivo transformada de coseno discreta modificada acoplado para recibir una pluralidad de bloques de datos configurado para realizar la transformada de dominio en cada bloque de datos en los coeficientes TDCM; un cuantificador acoplado para recibir cada uno de los coeficientes de la TDCM, el cuantificador se puede operar para producir, en respuesta, coeficientes de TDCM cuantificados ; 52/354 un codificador de corriente de bitios acoplado para recibir los coeficientes de TDCM cuantificados , la corriente de bitios produce, en respuesta, una corriente de bitios perceptivamente codificada; un cuantificador inverso acoplado para recibir los coeficientes de TDCM cuantificados , el cuantificador inverso se puede operar para restaurar los coeficientes de TDCM a un estado no cuantificado ; y una unidad de redondeo acoplada para recibir los coeficientes de TDCM restaurados y se puede operar para producir coeficientes de TDCM. 11. El dispositivo según la reivindicación 10, en donde la unidad de transformación además comprende : un dispositivo de transformada de coseno discreta inverso acoplado para recibir los bloques de datos que se pueden operar para producir, en respuesta, coeficientes de TDCMent ; medios para calcular la diferencia entre los coeficientes TDCMent respectivos y los coeficientes TDCM de valor de número entero con el fin de producir coeficientes TDCM residuales respectivos; y un codificador entrópico acoplado para recibir los coeficientes de TDCM residuales que se puede operar para generar en respuesta, una corriente de bitios intensificadora sin pérdidas. 52/354 12. El dispositivo según la reivindicación 11, en donde la unidad de transformación además comprende : un decodificador de corriente de bitios acoplado para recibir la corriente de bitios perceptivamente codificada y que se puede operar para producir, en respuesta, una corriente de bitios decodificada; un cuantificador inverso acoplado para recibir la corriente de bitios decodificada y para producir, en respuestas, coeficientes de TDCM restaurados; una unidad de redondeo acoplada para recibir los coeficientes de TDCM restaurados y que se puede operar para redondear cada coeficiente de TDCM a un valor de número entero; y un dispositivo de TDCM inversa acoplado para recibir la corriente de TDCM restaurada, para producir y generar en respuesta, una copia reconstruida de la señal perceptivamente codificada. 13. El dispositivo según la reivindicación 12, en donde la unidad de transformación comprende : un decodificador entrópico acoplado para recibir la corriente de bitios sin pérdida que se puede operar para generar en respuesta, coeficientes TDCMent residuales; medios para adicionar los coeficientes de TDCMent residuales a los coeficientes de TDCM de valor de números enteros con el fin de producir coeficientes TDCMent; y 52/354 un dispositivo de TDCMent inversa acoplado para recibir la suma de los coeficientes TDCM de valor de número entero y los coeficientes TDCMent con el fin de producir una copia reconstruida de la señal de audio decodificada sin pérdidas. 14. Un medio legible por computadora que tiene un programa registrado en sí mismo, en donde el programa se adapta para hacer que una computadora ejecute un método para realizar una transformación de dominio de una señal digital del dominio de tiempo al dominio de frecuencia y viceversa, el medio legible por computadora comprende: códigos para realizar la transformación por medio de un elemento transformador que a su vez comprende una pluralidad de pasos de estiramiento, en donde la transformación corresponde a una matriz de transformación y en donde por lo menos un paso de estiramiento de la pluralidad de pasos de estiramiento comprende por lo menos una matriz de transformación auxiliar y una unidad de redondeo, la matriz de transformación auxiliar comprende la matriz de transformación misma o la matriz de transformación correspondiente de dimensión inferior: y códigos para realizar una operación de redondeo de la señal por medio de la unidad de redondeo, después la transformación mediante la matriz de transformación auxiliar. 52/354
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US50744003P | 2003-09-29 | 2003-09-29 | |
US50721003P | 2003-09-29 | 2003-09-29 | |
PCT/SG2004/000120 WO2005031595A1 (en) | 2003-09-29 | 2004-05-06 | Method for performing a domain transformation of a digital signal from the time domain into the frequency domain and vice versa |
Publications (1)
Publication Number | Publication Date |
---|---|
MXPA06003509A true MXPA06003509A (es) | 2007-01-25 |
Family
ID=34396342
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
MXPA06003509A MXPA06003509A (es) | 2003-09-29 | 2004-05-06 | Metodo para realizar una transformacion de dominio de una senal digital de dominio de tiempo al dominio de frecuencia y veceversa. |
MXPA06003508A MXPA06003508A (es) | 2003-09-29 | 2004-05-06 | Metodo para transformar una senal digital del dominio de tiempo al dominio de frecuencia y viceversa. |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
MXPA06003508A MXPA06003508A (es) | 2003-09-29 | 2004-05-06 | Metodo para transformar una senal digital del dominio de tiempo al dominio de frecuencia y viceversa. |
Country Status (8)
Country | Link |
---|---|
US (3) | US20070276894A1 (es) |
EP (3) | EP1668534A4 (es) |
JP (3) | JP4429316B2 (es) |
KR (2) | KR100885438B1 (es) |
MX (2) | MXPA06003509A (es) |
MY (2) | MY137920A (es) |
TW (3) | TW200527224A (es) |
WO (3) | WO2005031597A1 (es) |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE10331803A1 (de) * | 2003-07-14 | 2005-02-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Umsetzen in eine transformierte Darstellung oder zum inversen Umsetzen der transformierten Darstellung |
US20070276894A1 (en) * | 2003-09-29 | 2007-11-29 | Agency For Science, Technology And Research | Process And Device For Determining A Transforming Element For A Given Transformation Function, Method And Device For Transforming A Digital Signal From The Time Domain Into The Frequency Domain And Vice Versa And Computer Readable Medium |
DE10345996A1 (de) * | 2003-10-02 | 2005-04-28 | Fraunhofer Ges Forschung | Vorrichtung und Verfahren zum Verarbeiten von wenigstens zwei Eingangswerten |
US7577307B2 (en) * | 2005-04-12 | 2009-08-18 | The Aerospace Corporation | Fast adaptive lifting lossless wavelet transform |
US7574064B2 (en) * | 2005-04-12 | 2009-08-11 | The Aerospace Corporation | Fast lifting lossless wavelet transform |
US8392176B2 (en) | 2006-04-10 | 2013-03-05 | Qualcomm Incorporated | Processing of excitation in audio coding and decoding |
US20100292986A1 (en) * | 2007-03-16 | 2010-11-18 | Nokia Corporation | encoder |
US20080288568A1 (en) * | 2007-05-14 | 2008-11-20 | Hou Hsieh S | Low power Fast Hadamard transform |
US8428957B2 (en) | 2007-08-24 | 2013-04-23 | Qualcomm Incorporated | Spectral noise shaping in audio coding based on spectral dynamics in frequency sub-bands |
US8548815B2 (en) | 2007-09-19 | 2013-10-01 | Qualcomm Incorporated | Efficient design of MDCT / IMDCT filterbanks for speech and audio coding applications |
EP2211335A1 (en) * | 2009-01-21 | 2010-07-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and computer program for obtaining a parameter describing a variation of a signal characteristic of a signal |
US8885701B2 (en) * | 2010-09-08 | 2014-11-11 | Samsung Electronics Co., Ltd. | Low complexity transform coding using adaptive DCT/DST for intra-prediction |
US8995532B2 (en) | 2010-09-30 | 2015-03-31 | Texas Instruments Incorporated | Low complexity large transform |
CN106463125B (zh) | 2014-04-25 | 2020-09-15 | 杜比实验室特许公司 | 基于空间元数据的音频分割 |
EP3134897B1 (en) | 2014-04-25 | 2020-05-20 | Dolby Laboratories Licensing Corporation | Matrix decomposition for rendering adaptive audio using high definition audio codecs |
CN105895109B (zh) * | 2016-05-10 | 2019-02-26 | 信阳师范学院 | 一种基于dwt和dct的数字语音取证和篡改恢复方法 |
KR20180089858A (ko) * | 2017-02-01 | 2018-08-09 | 엘지전자 주식회사 | 레이어드 기븐스 변환을 이용하여 변환을 수행하는 방법 및 장치 |
EP3616196A4 (en) | 2017-04-28 | 2021-01-20 | DTS, Inc. | AUDIO ENCODER WINDOW AND TRANSFORMATION IMPLEMENTATIONS |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4031038A (en) * | 1975-06-16 | 1977-06-21 | The Dow Chemical Company | Water insoluble chelate exchange resins having a crosslinked polymer matrix and pendant thereto a plurality of methyleneaminopyridine groups |
US5339265A (en) * | 1992-08-31 | 1994-08-16 | University Of Maryland At College Park | Optimal unified architectures for the real-time computation of time-recursive discrete sinusoidal transforms |
US5523847A (en) * | 1992-10-09 | 1996-06-04 | International Business Machines Corporation | Digital image processor for color image compression |
WO1996015627A2 (en) * | 1994-11-09 | 1996-05-23 | Philips Electronics N.V. | System and method for transmitting picture or sound signals |
US5999656A (en) * | 1997-01-17 | 1999-12-07 | Ricoh Co., Ltd. | Overlapped reversible transforms for unified lossless/lossy compression |
US6058215A (en) | 1997-04-30 | 2000-05-02 | Ricoh Company, Ltd. | Reversible DCT for lossless-lossy compression |
US6073153A (en) * | 1998-06-03 | 2000-06-06 | Microsoft Corporation | Fast system and method for computing modulated lapped transforms |
US6421464B1 (en) * | 1998-12-16 | 2002-07-16 | Fastvdo Llc | Fast lapped image transforms using lifting steps |
WO2000055757A1 (en) | 1999-03-17 | 2000-09-21 | The Johns Hopkins University | A fast multiplierless transform |
US6681052B2 (en) * | 2000-01-15 | 2004-01-20 | Sony Corporation | Methods and systems for performing inverse quantization and inverse weighting of DV video |
AU2002220233A1 (en) * | 2000-12-01 | 2002-06-11 | Lizardtech, Inc. | Method for lossless encoding of image data by approximating linear transforms and preserving selected properties |
US6934676B2 (en) * | 2001-05-11 | 2005-08-23 | Nokia Mobile Phones Ltd. | Method and system for inter-channel signal redundancy removal in perceptual audio coding |
DE10129240A1 (de) * | 2001-06-18 | 2003-01-02 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Verarbeiten von zeitdiskreten Audio-Abtastwerten |
JP3971135B2 (ja) | 2001-07-11 | 2007-09-05 | 株式会社テクノマセマティカル | Dct行列分解方法及びdct装置 |
US7082450B2 (en) * | 2001-08-30 | 2006-07-25 | Nokia Corporation | Implementation of a transform and of a subsequent quantization |
JP3796432B2 (ja) * | 2001-10-31 | 2006-07-12 | キヤノン株式会社 | フィルタ処理装置およびフィルタ処理方法 |
DE10217297A1 (de) * | 2002-04-18 | 2003-11-06 | Fraunhofer Ges Forschung | Vorrichtung und Verfahren zum Codieren eines zeitdiskreten Audiosignals und Vorrichtung und Verfahren zum Decodieren von codierten Audiodaten |
JP3902990B2 (ja) * | 2002-07-02 | 2007-04-11 | キヤノン株式会社 | アダマール変換処理方法及びその装置 |
DE10236694A1 (de) * | 2002-08-09 | 2004-02-26 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren |
DE10331803A1 (de) * | 2003-07-14 | 2005-02-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Umsetzen in eine transformierte Darstellung oder zum inversen Umsetzen der transformierten Darstellung |
US20070276894A1 (en) * | 2003-09-29 | 2007-11-29 | Agency For Science, Technology And Research | Process And Device For Determining A Transforming Element For A Given Transformation Function, Method And Device For Transforming A Digital Signal From The Time Domain Into The Frequency Domain And Vice Versa And Computer Readable Medium |
-
2004
- 2004-05-06 US US10/573,955 patent/US20070276894A1/en not_active Abandoned
- 2004-05-06 MX MXPA06003509A patent/MXPA06003509A/es active IP Right Grant
- 2004-05-06 KR KR1020067007299A patent/KR100885438B1/ko not_active IP Right Cessation
- 2004-05-06 JP JP2006532242A patent/JP4429316B2/ja not_active Expired - Fee Related
- 2004-05-06 WO PCT/SG2004/000122 patent/WO2005031597A1/en active Application Filing
- 2004-05-06 MX MXPA06003508A patent/MXPA06003508A/es active IP Right Grant
- 2004-05-06 EP EP04731532.0A patent/EP1668534A4/en not_active Withdrawn
- 2004-05-06 EP EP04731531.2A patent/EP1668533A4/en not_active Withdrawn
- 2004-05-06 WO PCT/SG2004/000121 patent/WO2005031596A1/en active Application Filing
- 2004-05-06 KR KR1020067007300A patent/KR100885437B1/ko not_active IP Right Cessation
- 2004-05-06 JP JP2006532243A patent/JP2007507790A/ja active Pending
- 2004-05-06 US US10/573,953 patent/US8126950B2/en not_active Expired - Fee Related
- 2004-05-06 WO PCT/SG2004/000120 patent/WO2005031595A1/en active Application Filing
- 2004-05-06 EP EP04731529A patent/EP1687736A1/en not_active Withdrawn
- 2004-05-06 US US10/573,954 patent/US8126951B2/en not_active Expired - Fee Related
- 2004-09-27 MY MYPI20043956A patent/MY137920A/en unknown
- 2004-09-27 TW TW093129241A patent/TW200527224A/zh unknown
- 2004-09-27 MY MYPI20043954A patent/MY139788A/en unknown
- 2004-09-27 TW TW093129238A patent/TWI348282B/zh not_active IP Right Cessation
- 2004-09-27 TW TW093129239A patent/TWI343534B/zh not_active IP Right Cessation
-
2009
- 2009-07-01 JP JP2009156963A patent/JP4942793B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2007507790A (ja) | 2007-03-29 |
US20070276893A1 (en) | 2007-11-29 |
US8126951B2 (en) | 2012-02-28 |
TW200527224A (en) | 2005-08-16 |
EP1668534A1 (en) | 2006-06-14 |
EP1668534A4 (en) | 2013-08-21 |
TW200524290A (en) | 2005-07-16 |
US20080030385A1 (en) | 2008-02-07 |
EP1668533A1 (en) | 2006-06-14 |
WO2005031596A1 (en) | 2005-04-07 |
TWI348282B (en) | 2011-09-01 |
JP4429316B2 (ja) | 2010-03-10 |
KR100885437B1 (ko) | 2009-02-24 |
KR20070026325A (ko) | 2007-03-08 |
KR100885438B1 (ko) | 2009-02-24 |
US8126950B2 (en) | 2012-02-28 |
EP1687736A1 (en) | 2006-08-09 |
WO2005031597A1 (en) | 2005-04-07 |
MY137920A (en) | 2009-03-31 |
TWI343534B (en) | 2011-06-11 |
MXPA06003508A (es) | 2007-01-25 |
WO2005031595A1 (en) | 2005-04-07 |
US20070276894A1 (en) | 2007-11-29 |
JP2007507789A (ja) | 2007-03-29 |
JP4942793B2 (ja) | 2012-05-30 |
EP1668533A4 (en) | 2013-08-21 |
KR20070015363A (ko) | 2007-02-02 |
MY139788A (en) | 2009-10-30 |
TW200529040A (en) | 2005-09-01 |
JP2009266250A (ja) | 2009-11-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4942793B2 (ja) | 時間ドメインから周波数ドメインへ及びそれとは逆にデジタル信号を変換する方法 | |
KR101036731B1 (ko) | 손실 및 무손실 2차원 데이터 압축을 위한 가역 변환 | |
RU2325708C2 (ru) | Устройство и способ обработки сигнала, имеющего последовательность дискретных значений | |
US8195730B2 (en) | Apparatus and method for conversion into a transformed representation or for inverse conversion of the transformed representation | |
US7873227B2 (en) | Device and method for processing at least two input values | |
US7315822B2 (en) | System and method for a media codec employing a reversible transform obtained via matrix lifting | |
CN100570597C (zh) | 将数字信号从时间域变换到频率域及其反向变换的方法 | |
Li | Low noise reversible MDCT (RMDCT) and its application in progressive-to-lossless embedded audio coding | |
Yokotani et al. | Approximation error analysis for transform-based lossless audio coding | |
MXPA06003309A (es) | Dispositivo y metodo para procesar al menos dos valores de entrada |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FG | Grant or registration | ||
HH | Correction or change in general |