MX2012010320A - Procesador de señal, proveedor de ventana, señal de medios codificada, metodo para procesar una señal y metodo para proporcionar una ventana. - Google Patents

Procesador de señal, proveedor de ventana, señal de medios codificada, metodo para procesar una señal y metodo para proporcionar una ventana.

Info

Publication number
MX2012010320A
MX2012010320A MX2012010320A MX2012010320A MX2012010320A MX 2012010320 A MX2012010320 A MX 2012010320A MX 2012010320 A MX2012010320 A MX 2012010320A MX 2012010320 A MX2012010320 A MX 2012010320A MX 2012010320 A MX2012010320 A MX 2012010320A
Authority
MX
Mexico
Prior art keywords
window
values
signal
signal processing
input signal
Prior art date
Application number
MX2012010320A
Other languages
English (en)
Inventor
Ralf Geiger
Christian Helmrich
Original Assignee
Fraunhofer Ges Zur Foeerderung Der Angewandten Forschung E V
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Ges Zur Foeerderung Der Angewandten Forschung E V filed Critical Fraunhofer Ges Zur Foeerderung Der Angewandten Forschung E V
Publication of MX2012010320A publication Critical patent/MX2012010320A/es

Links

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/45Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of analysis window
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Algebra (AREA)
  • Pure & Applied Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Complex Calculations (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

Un procesador de señal para proporcionar una versión procesada de una señal de entrada en dependencia de la señal de entrada comprende una ventana configurada para observar una porción de la señal de entrada, o de una versión pre-procesada de la misma, en dependencia de una ventana de procesamiento de señal descrita por los valores de ventana de procesamiento de señal para una pluralidad de valores índice del valor de ventana, para obtener la versión procesada de la señal de entrada. El procesador de señal también comprende un proveedor de ventana para proporcionar los valores de ventana de procesamiento de señal para una pluralidad de valores índice del valor de ventana en dependencia de uno o más parámetros de forma de ventana.

Description

PROCESADOR DE SEÑAL Y MÉTODO PARA PROCESAR UNA SEÑAL CAMPO TÉCNICO Las modalidades de acuerdo con la invención se refieren a un procesador de señal para proporcionar una versión procesada de una señal de entrada dependiente de la señal de entrada, a un proveedor de ventana para proporcionar valores de ventana de procesamiento de señal, a una señal de medios codificada, a un método para el procesamiento de una señal y a un método para proporcionar valores de ventana de procesamiento de señal.
Una modalidad de acuerdo con la invención se refiere a un aparato para codificar o decodificar una señal de audio o de video usando funciones de ventana variables. Otra modalidad de acuerdo con la invención se refiere a un método para codificar o decodificar una señal de audio o de video usando funciones de ventana variables.
Las modalidades de acuerdo con la presente invención generalmente se refieren a un análisis de señal y métodos de procesamiento, tales como aquellos que pueden utilizarse en sistemas de codificación de audio o de video.
ANTECEDENTES DE LA INVENCIÓN La filtración de respuesta de impulsos finitos (FIR) de señales discretas, particularmente en el contexto de bancos de filtro, se emplea ampliamente en análisis espectral, procesamiento, síntesis y compresión de datos de medios, entre otras aplicaciones. Es bien sabido que la finitud temporal (o espacial) de un filtro de FIR y por lo tanto la finitud del intervalo de señal que puede procesarse en un instante en el tiempo o espacio, puede conducir a un fenómeno conocido como derivación o fuga. Cuando se modifica el intervalo filtrado, por ejemplo, al variar cambios de ganancia o cuant i fi ca ci ón , puede ocurrir el bloqueo o resonancia de artefactos después de la inversión de la operación de filtración. Se ha encontrado que la causa de estos artefactos puede atribuirse a discontinuidades entre los puntos terminales de la forma de onda de señal del intervalo procesado (referido en lo sucesivo como segmento), asi como también aquellos de sus diferenciales. Se ha encontrado que con objeto de reducir tales efectos indeseados de fuga, es por lo tanto útil o incluso necesario el reducir las discontinuidades en el segmento y algunos de sus diferenciales. Esto puede lograrse al multiplicar cada muestra s(n), n=0, 1, N-l, del segmento de longitud-N con un cierto peso w(n) antes de la filtración y, en el caso de manipulación de señal en el dominio filtrado, también después de la filtración inversa, de tal manera que los puntos terminales del segmento y de sus diferenciales se gradúen a cero. Un enfoque equivalente es aplicar los pesos a cada filtro de base del banco de filtro (Ver, por ejemplo, referencia [2] ) . Ya que los factores de ponderación se describen con frecuencia mediante una expresión analítica, un conjunto de factores es comúnmente conocido como una función de ponderación o función de ventana.
En sistemas típicos de codificación de audio y video, una forma de onda de origen se segmenta como arriba y cada segmento se cuantifica en una representación más gruesa a fin de llevar a cabo una elevada compresión de datos, es decir, una baja velocidad de transmisión de bits necesaria para almacenar o transmitir la señal. En un intento por obtener ganancia de codificación por medio de compactación de energía en menos de N muestras (o, en otras palabras, por incrementar la calidad perceptual de la señal codificada para una velocidad de transmisión de bits dada) , se han vuelto populares las transformaciones del banco de filtro de los segmentos previo a la cuantificación . Los sistemas recientemente desarrollados usan transformación ortogonal solapada de tiempo-respecto-a-frecuencia en la forma de la transformación de coseno, discreta, modificada (MDCT), permitiendo un banco de filtro que los segmentos adyacentes se sobrepongan mientras permiten aún el muestreo crítico. Para un desempeño mejorado, las operaciones de MDCT, de avance e inversas, se combinan con la ponderación de cada segmento: en el lado central, se aplica una ventana de análisis wa(n) antes de la MDCT de avance y en el lado receptor, se aplica una ventana de síntesis ws(n) después de la MDCT inversa. Desafortunadamente, no todas las funciones de ponderación son adecuadas para utilizarse con la MDCT. Suponiendo ventanas predeterminadas (no variantes en tiempo/espacio), se ha encontrado que con objeto de que la arquitectura completa produzca una perfecta reconstrucción de entrada en la ausencia de errores de cuantif icación o de transmisión, la wa (n) y ws(n) deben seleccionarse como sigue: wa{n) ws{n) + w N/2+nyws(N/2+n) = 1, « = 0, 1, N/2-1. (1) Si wa(n) y ws(n) son idénticas, es decir, wa(n)= ws(n)=w(n), la ecuación (1) se reduce a la condicionante mejor conocida w(nf + w(N/2+n)2 = 1, n = 0, 1 N/2-1, (2) publicada en la referencia [7] . Para mejor compactación de energía, se adopta normalmente w(n) que es simétrica alrededor de n=N/2-l/2, es decir w(N-l-n) = w(n), n = 0, 1, .., ?/2-l, (3) En la norma de Codificación Avanzada de Audio (AAC) (referencia [8]), se encuentran disponibles dos funciones de ventana. Una es la ventana de seno, dada por wsm( ) =sen( («+l/2)/N), n = 0, 1, N-l, (4) la otra es una ventana derivada de Kaiser-Bessel (KBD) descrita en las patentes de Fielder y Davidson, titulada "Codificador, decodificador y codi fi cado r / de codi fi cado r de transformación de baja velocidad de transmisión de bits para audio de elevada calidad", patentes de E.U. 5109417 y 5142656. La última ventana también se utiliza en la norma de codificación AC-3 (Dolby Digital) (ATSC, Inc., "Norma de Compresión de Audio Digital (AC-3, E-AC-3), Revisión B", documento A/52B, Junio 2005), regla no escrita en una configuración diferente (a=5) . La especificación Vorbis (referencia [9] ) define la ventana W orbi&n) =sen(n 2- sen2 (p>(?+ 112)IN)), n = 0, 1 , .... N-l . (5) La Fig. 5 muestra las respuestas de frecuencia de la AAC y funciones de ventana Vorbis, obtenidas a través de transformación Fourier, de acuerdo con la referencia [4] . Puede observarse que la ventana de seno tiene una selectividad de frecuencia exacta relativamente elevada (lóbulo principal angosto) y rechazo de banda de detención relativamente bajo (atenuación de lóbulo lateral bajo) . La ventana de KBD, por el contrario, tiene una elevada atenuación de banda de detención y baja selectividad de frecuencia exacta. La ventana Vorbis yace aproximadamente a la mitad entre las primeras dos ventanas .
Se ha encontrado que para ciertas aplicaciones, puede ser deseable ejercer un control más fino sobre la selectividad de banda de paso y el rechazo de la banda de detención de una ecuación (2) que satisface la función de ponderación. Más específicamente, se ha encontrado que para mejorar la eficiencia de codificación, puede ser necesario un parámetro de ventana a fin de adaptar continuamente las características de la ventana a aquellas del espectro de entrada. De las tres funciones arriba discutidas, solo la función de KBD ofrece tal parámetro, , que puede variar para lograr diferentes relaciones de selectividad/atenuación. Sin embargo, esta función incorpora matemática computacionalmente costosa (función Bessel, seno hiperbólico, raíz cuadrada y división) , prohibiendo potencialmente su re-cálculo para cada segmento de señal en dispositivos de baja potencia o en sistemas de tiempo real. Lo mismo aplica a la clase de funciones de ventana presentadas en el articulo de Sinha y Ferreira, titulado "Una Nueva Clase de Ventanas Complementarias de Potencia Uniforme y su Aplicación a Procesamiento de Señales de Audio", AES 119 Convención, Octubre 2005, documento 6604, que requiere de operaciones de valor complejo, factori zación espectral y transformación Fourier. También se ha encontrado que la interpolación entre dos funciones (por ejemplo, KBD y seno), más eficientemente por suma ponderada, puede utilizarse para controlar en cierto grado la respuesta de frecuencia, pero este enfoque ofrece solo flexibilidad limitada.
Una multitud de funciones de ventana, optimizadas hacia diferentes criterios, se ha documentado, por ejemplo, en referencias [1], [2], [3], [4], [5] . Podría decirse que tres de las funciones más populares en uso en la actualidad son las reportadas por von Hann, Hamming y Blackman.
En lo sucesivo, se describirán algunas funciones clásicas de ventana. En otras palabras, en lo sucesivo, las funciones de ventana antes mencionadas (por ejemplo, Hann, Hamming y Blackman) serán revisadas y se identificará la ecuación de diseño general subyacente .
Por razones de consistencia y comparación con investigaciones seminales de funciones de ventana, la metodología y notación de Nuttall (ver, por ejemplo, referencia [4]) se adoptará en la presente discusión. En particular, permita que L denote la duración (longitud) de una realización de ventana, t la ubicación (tiempo) dentro de la ponderación, y f la frecuencia dentro del espectro de densidad de potencia de la ventana, obtenidos por transformación Fourier de la función de ventana. Adicionalmente , todas las funciones de ventana se normalizarán hasta una amplitud pico de uno. Ya que solo se estudiarán aquí las ventanas campaniformes, simétricas (preferentemente de longitud uniforme), esto implica que w(L/2)=l. La primer función de ponderación a considerarse se conoce como la función de Hann (o Hanning) . Se especifica en la referencia [2] como para aplicaciones DSP (valores no negativos de t) . Como se muestra en la referencia [2] y es evidente a partir de (11) , la función de Hann es un caso especial de una clase de funciones seno con exponent iación : En la práctica, los enteros positivos se asignan típicamente a a. Observe que (12) también puede ser escrito como la suma de un desplazamiento y un coseno a escala: WHann (t) = 0.5-0.5cos|27r- -j . (13) Esta formulación permite una optimización de espectro en particular de la ventana de Hann (ver la discusión a continuación con respecto a evaluación y optimización) mediante cambio del desplazamiento y el factor de escala. El resultado es la función de Hamming, cuyo cálculo exacto de parámetros se da en la referencia [4] como w„, i r ) = Según se señala por Nuttall (ver, por ejemplo, referencia [4]), las ventanas de Hann y de Hamming son realizaciones a doble término de una clase de funciones de término- ( K+ 1 ) que deberán ser referidas como las funciones de suma de cosenos. Al simplificar la notación de Nuttall, pueden escribirse como w*W para uso en aplicaciones de DSP. Esto iguala a la ecuación 11 de la referencia [4] con 1/L escalar omitido. También son comunes las implementacione s de triple término. Un caso simple es (15) con =2 y factores b0 = 0.375, b = 0.5, b2 - 0.125 , (16) lo cual es equivalente a (12) con a= 4. De manera similar al enfoque de Hamming, Blackman, (ver, por ejemplo, referencia [1]) derivó la siguiente b* optimizada: bQ = 0.42, b, = 0.5, b2 = 0.08 . (17) Nuttall (ver, por ejemplo, referencia [4]) refino aún más los valores de Blackman para una mejor respuesta de espectro cercana al campo (primeros lóbulos laterales, ver la discusión ' a continuación con 1 respecto a evaluación y optimización) : b0 = 0.40897, ¿>, = 0.5, b2 = 0.09103 . (18) El lector interesado se invita a revisar la referencia [4] para otras ventanas optimizadas de suma de cosenos de triple y de cuarto término.
En vista de la discusión anterior, lo que se necesita es una función de ventana alternativa que tenga una comple idad comput acional moderada, pero que proporcione una buena flexibilidad de diseño.
De acuerdo con lo anterior, un objeto de la presente invención es crear un concepto para procesar las señales, que permita obtener una función de ventana con complejidad comput acional moderada y buena flexibilidad de diseño.
BREVE DESCRIPCIÓN DE LA INVENCIÓN Una modalidad de acuerdo con la invención crea un procesador de señal para proporcionar una versión procesada de una señal de entrada dependiente de la señal de entrada. El procesador de señal comprende un proveedor de ventana configurado para enmarcar una porción de la señal de entrada, o de una versión pre-procesada de la misma, dependiente de una ventana de procesamiento de señal descrita por los valores de ventana de procesamiento de señal para una pluralidad de valores índice del valor de ventana, con objeto de obtener la versión procesada de la señal de entrada. El procesador de señal también comprende un proveedor de ventana para proporcionar los valores de ventana de procesamiento de señal para una pluralidad de valores índice del valor de ventana dependientes de uno o más parámetros en forma de ventana. El proveedor de ventana se configura para evaluar una función seno para una pluralidad de valores de argumento asociados con los valores índice del valor de ventana, a fin de obtener valores de ventana del procesamiento de señal. El proveedor de ventana se configura para calcular una suma ponderada de un término lineal, el cual es linealmente dependiente de los valores índice del valor de ventana y el valor de función de una o más funciones de configuración, cuya una o más funciones de configuración representan los valores índice del valor de ventana sobre valores de función correspondientes, y cuya una o más funciones de configuración son simétricas en puntos con respecto a un centro de una inclinación de ventana, a fin de obtener los valores de argumento.
Esta modalidad de acuerdo con la invención se basa en el hallazgo de que una formación de ventana de una señal de entrada puede lograrse en una manera fácilmente ajustable mediante determinación de los valores de ventana del procesamiento de señal en la manera arriba descrita debido a una suma ponderada de un término lineal y pueden llevarse a cabo una o más funciones de configuración con un muy bajo esfuerzo computacional . No obstante, también se ha encontrado que la simetría en puntos de la una o más funciones de configuración y la evaluación de una función seno para una pluralidad de valores de argumento trae consigo propiedades particularmente buenas de la ventana como, por ejemplo, buenas características de conservación de energía entre dos inclinaciones de ventana subsecuentes. Además es fácilmente posible ajustar las características de la ventana definida por los valores de ventana del procesamiento de señal mediante modificación de la ponderación de la una o más funciones de configuración dependientes del uno o más parámetros de forma de ventana, de tal manera que pueden obtenerse ventanas de diferentes características con un esfuerzo computacional comparativamente pequeño. Por ejemplo, el concepto aquí definido permite obtener un gran número de formas de ventana diferentes, que tienen todas las buenas características mencionadas, al variar la ponderación de la una o más funciones de configuración.
Además debe observarse que usando el concepto arriba mencionado, un cálculo de ventanas que tiene diferentes características, que pueden ajustarse con muy elevada granulación, no requiere de cálculos particularmente difíciles, sino meramente requiere de la formación de una suma ponderada para obtener valores de argumento, y la evaluación de una función seno usando los valores de argumento.
Otra modalidad de acuerdo con la invención crea un procesador de señal para proporcionar una versión procesada de una señal de entrada dependiente de la señal de entrada. El procesador de señal comprende un proveedor de ventana configurado para enmarcar una porción de la señal de entrada, o de una versión pre-procesada de la misma, dependiente de una ventana de procesamiento de señal descrita por los valores de ventana de procesamiento de señal para una pluralidad de valores índice de valor de ventana, con objeto de obtener la versión procesada de la señal de entrada. Los valores de ventana del procesamiento de señal son valores de resultado de una evaluación de función de seno para una pluralidad de valores de argumento asociados con valores índice de valor de ventana, en donde los valores de argumento son sumas ponderadas de un término lineal, el cual depende linealmente de los valores índice del valor de ventana, y valores de función de una o más funciones de configuración de tipo seno, cuyas una o más funciones de configuración de tipo seno representan valores índice del valor de ventana sobre valores de función correspondientes y cuyas una o más funciones de configuración de tipo seno son simétricas por punto con respecto a un centro de una inclinación de ventana. Esta modalidad de acuerdo con la invención se basa en las mismas ideas clave que la modalidad previamente discutida. También se ha encontrado que el uso de funciones de configuración de tipo seno trae consigo ventanas de procesamiento de señal que tienen características particularmente buenas.
Otra modalidad de acuerdo con la invención crea un proveedor de ventana para proporcionar valores de ventana de procesamiento de señal para una pluralidad de valores índice de valor de ventana dependientes de uno o más parámetros de forma de ventana. El proveedor de ventana se configura para evaluar una función seno para una pluralidad de valores de argumento con los valores índice de valor de ventana, a fin de obtener los valores de ventana del procesamiento de señal. El proveedor de ventana se configura para calcular una suma ponderada de un término lineal, el cual es linealmente dependiente de los valores índice del valor de ventana, y valores de función de una o más funciones de configuración a fin de obtener los valores de argumento. La una o más funciones de configuración representan los valores índice del valor de ventana sobre valores de función correspondientes y la una o más funciones de configuración son simétricas por puntos con respecto a un centro de una inclinación de ventana.
Esta modalidad de acuerdo con la invención se basa en la misma idea que las modalidades anteriores.
Otra modalidad de acuerdo con la invención crea un procesador de señal para proporcionar una versión procesada de una señal de entrada dependiente de la señal de entrada. El procesador de señal comprende un proveedor de ventana configurado para enmarcar una porción de la señal de entrada o de una versión pre-procesada de la misma, dependiente de una ventana de procesamiento de señal descrita por los valores de ventana del procesamiento de señal para una pluralidad de valores índice de valor de ventana, con objeto de obtener la versión procesada de la señal de entrada. El procesador de señal también comprende un proveedor de ventana para proporcionar los valores de ventana del procesamiento de señal a una pluralidad de valores índice de valor de ventana dependientes de uno o más parámetros de forma de ventana. El proveedor de ventana se configura para calcular una suma ponderada de valores de función de una pluralidad de funciones de configuración de tipo seno, las cuales representan los valores índice del valor de función de ventana sobre los valores de función correspondientes, a fin de obtener los valores de ventana del procesamiento de señal. La ponderación de los valores de función se determina por los parámetros de forma de ventana. Esta modalidad de acuerdo con la invención se basa en el hallazgo de que pueden obtenerse formas de ventana que tienen características suficientemente buenas para muchas aplicaciones, con buena eficiencia computacional y la flexibilidad para ajustar las características de ventana, usando los parámetros en forma de ventana y la regla de cálculo descrita.
Otra modalidad de acuerdo con la invención crea un procesador de señal para proporcionar una versión procesada de una señal de entrada dependiente de la señal de entrada. El procesador comprende un proveedor de ventana configurado para enmarcar una porción de la señal de entrada, o una versión pre-procesada de la misma, dependiente de una ventana de procesamiento de señal descrita por los valores de ventana del procesamiento de señal para una pluralidad de valores índice del valor de ventana, con objeto de obtener la versión procesada de la señal de entrada. Los valores de ventana del procesamiento de señal son valores de resultado de una suma ponderada de valores de función de una pluralidad de funciones de configuración de tipo seno que representan valores índice de valor de ventana sobre valores de función correspondientes. Esta modalidad de acuerdo con la invención se basa en las mismas ideas que la modalidad previamente descrita.
Otra modalidad de acuerdo con la invención crea una señal de medios codificada. La señal de medios codificada comprende una representación codificada de un contenido de medios y uno o más parámetros de forma de ventana. El uno o más parámetros de forma de ventana definen una forma de una ventana por aplicarse en una decodificación de la representación codificada del contenido de medios. El uno o más parámetros de forma de ventana describe pesos para calcular una suma ponderada de un término lineal, el cual es linealmente dependiente de un valor índice de valor de ventana y valores de función de una o más funciones de configuración, a fin de obtener un valor de argumento para derivar valores de ventana del procesamiento de señal para una pluralidad de valores índice de valor de ventana mediante evaluación de una función seno para una pluralidad de valores de argumento. Esta señal de medios anexa proporciona una elevada flexibilidad para la señalización de la formación de ventanas, debido a que es posible describir un gran número de tipos diferentes de ventanas, los cuales pueden derivarse eficientemente por un decodi fi cador , usando los parámetros1 de forma de ventana .
BREVE DESCRIPCION DE LAS FIGURAS Las modalidades de acuerdo con la invención se describirán posteriormente haciendo referencia a las figuras la a 16 anexas en las cuales : Fig. la muestra un diagrama de bloque esquemático de un procesador de señal, de acuerdo con una modalidad de la invención; Fig. Ib muestra un diagrama de bloque esquemático de un procesador de señal, de acuerdo con otra modalidad de la invención ; Fig. 2 muestra un diagrama de bloque esquemático de un procesador de señal, de acuerdo con otra modalidad de la invención ; Fig. 3 muestra un diagrama de bloque esquemático de un proveedor de ventana, de acuerdo con una modalidad de la invención ; muestra una representación esquemática de una señal de medios codificada, de acuerdo con una modalidad de la invención ; muestra una representación gráfica de respuestas de magnitud de frecuencia de las ventanas de Vorbis y AAC a una escala de ordenadas dB; muestra una representación gráfica de las amplitudes de la función de ventana de KBD de AAC y una cierta instancia de la función inventiva; muestra una representación gráfica de la respuesta de magnitud de frecuencia de dicha instancia de la función de ventana inventiva en comparación con la de la ventana de KBD de AAC sobre una abscisa lineal y escala de ordenada de dB; muestra una representación gráfica de la respuesta de magnitud de frecuencia de dicha instancia de la función de ventana inventiva en comparación con la de la ventana de KBD de AAC sobre una abscisa logarítmica y escala de ordenada dB; Fig. 9 muestra una representación gráfica de las respuestas de magnitud de frecuencia de otras dos instancias de la función de ventana inventiva en comparación con aquellas de la KBD de AAC y las ventanas de S i nha - Fe rre i ra de tercer orden; Figs . 10a y 10b muestran, en un diagrama de bloque, el proceso de adaptación de señal para las funciones de ventana, inventivas y similares; Fig. 11 muestra una representación gráfica de espectros de algunas funciones de seno con exponentiacion de acuerdo con la ecuación (12) ; Fig. 12 muestra una representación gráfica de espectros de funciones optimizadas de suma de cosenos de acuerdo con la ecuación (15) ; Fig. 13 muestra una representación gráfica de las ventanas optimizadas de suma de senos, propuestas, de acuerdo con la ecuación (19) ; Fig. 14 muestra una representación gráfica de espectros DFT de dos sinusoides con frecuencias de Lf=32 y 96.5, después de aplicar diferentes funciones de ventana; y Fig. 15 muestra una representación gráfica de espectros de dos ventanas de PC y ventana propuesta.
Fig. 16 muestra una representación esquemática de una ventana.
DESCRIPCIÓN DETALLADA DE LAS MODALIDADES 1. Procesador de Señal de Acuerdo con la Fig . la La Fig. la muestra un diagrama de bloque esquemático de un procesador de señal 100 de acuerdo con una primer modalidad de la invención. El procesador de señal 100 se configura para recibir una señal de entrada 110 y proporcionar, en base a lo mismo, una versión procesada 112 de la señal de entrada. El procesador de señal 100 comprende un proveedor de ventana 120 configurado para enmarcar una porción de la señal de entrada 110, o una versión pre-procesada 110' de la misma (la cual puede obtenerse mediante un pre-procesamiento opcional 111), dependiente de una ventana de procesamiento de señal descrito por los valores de ventana de procesamiento de señal 122 para una pluralidad de valores índice de valor de ventana n, con objeto de obtener la versión procesada 112 de la señal de entrada (o una versión 112' de la señal de entrada que experimenta post-procesamiento adicional en un pos t-procesador opcional 130) .
Para este propósito, el proveedor de ventana 120 recibe los valores de ventana de procesamiento de señal w(n) a partir de un proveedor de ventana 130, el cual también es típicamente parte del procesador de señal 100. El proveedor de ventana 130 se configura para proporcionar los valores de ventana de procesamiento de señal w(n) para una pluralidad de valores índice de valor de ventana n dependientes de uno o más parámetros de forma de ventana 132. El proveedor de ventana se configura para evaluar una función seno para una pluralidad de valores de argumento c' (n) asociados con los valores índice de valor de ventana n, a fin de obtener los valores de ventana de procesamiento de señal w(n) . El proveedor de ventana 130 también se configura para calcular una suma ponderada de un término lineal, por ejemplo, designado con c(n), el cual linealmente dependiente del valor índice de valor de ventana n, y valores de función de una o más funciones de configuración. La una o más funciones de configuración representan valores índice de valor de ventana n sobre valores de función correspondientes. La una o más funciones de configuración son simétricas por puntos con respecto a un centro de una inclinación de ventana. Un cálculo de la suma ponderada se lleva a cabo para obtener los valores de argumento c' (n) .
De acuerdo con lo anterior, el proveedor de ventana 130 proporciona valores de ventana de procesamiento de señal w(n) que describen ventanas que tienen características particularmente buenas. La aplicación de una evaluación de función seno en el proveedor de ventana, con objeto de obtener el valor de ventana de procesamiento de señal w(n), permite obtener ventanas que tienen buenas características de conservación de energía para el caso en que se sobreponen dos inclinaciones de ventana correspondientes. Además, al usar valores de argumento c' (n) para la evaluación de la función seno que no son una función lineal de los valores índice del valor de ventana (también designados brevemente como "valores índice") , sino más bien una superposición de un término lineal, que es linealmente dependiente de los valores índice y los valores de función de una o más funciones de configuración que no son lineales y son simétricas por puntos con respecto a un centro de una inclinación de ventana, es posible ajustar una forma de la ventana de procesamiento de señal descrita por los valores de ventana de procesamiento de señal w(n) .
Por ejemplo, es posible ajustar las contribuciones de las una o más funciones de configuración sobre los valores de argumento c' (n), de tal manera que puedan obtenerse diferentes evoluciones de los valores de argumento (como una función del valor de índice n) dependiendo del uno o más parámetros de forma de ventana 132. De acuerdo con lo anterior, las características de la ventana de procesamiento de señal descritas por los valores de ventana de procesamiento de señal pueden ajustarse a las necesidades particulares dependientes del uno o más parámetros de forma de ventana 132. Además, se ha encontrado que la selección de una o más funciones de configuración, que son simétricas por puntos con respecto a un centro de una inclinación de ventana, ayuda a asegurar buena conservación de energía y características de compactación de la ventana de procesamiento de señal y también proporciona una oportunidad de reducir un esfuerzo comput acional para calcular los valores de argumento.
Los detalles con respecto al cálculo de los valores de ventana de procesamiento de señal wnew(n) , el cual puede tomar el lugar de los valores de ventana de procesamiento de señal w(n), se describirán a continuación. 2. Procesador de Señal de Acuerdo con la Fiq. Ib La Fig. Ib muestra un diagrama de bloque esquemático de un procesador de señal 150, el cual es similar al procesador de señal 100. De acuerdo con lo anterior, se designan medios y señales idénticos con números de referencia idénticos. Sin embargo, el procesador de señal 150 comprende un proveedor de ventana 180, el cual es diferente del proveedor de ventana 130. El proveedor de ventana 180 recibe uno o más parámetros de forma ck- 182 y proporciona, en base a los mismos, valores de ventana de procesamiento de señal w(t), que se designan, por ejemplo, con wc(t) . Debe observarse aquí que la variable t es un valor índice de valor de ventana y también se designa brevemente como "valor índice" .
El proveedor de ventana 180 se configura para proporcionar los valores de ventana de procesamiento de señal w(t) para una pluralidad de valores índice de valor de ventana dependientes de uno o más parámetros de forma de ventana ck. El proveedor de ventana 180 se configura para calcular una suma ponderada de valores de función de una pluralidad de funciones de configuración de tipo seno, a fin de obtener los valores de ventana de procesamiento de señal w(t) . La ponderación de los valores de función se determina por los parámetros de forma de ventana c*.
Al proporcionar los valores de ventana de procesamiento de señal que utilizan el proveedor de ventana 180, pueden proporcionarse los valores de ventana de procesamiento de señal de tal manera que comprendan características suficientemente buenas en muchos casos. También es posible ajustar las características específicas usando el uno o más parámetros de forma de ventana ck, de tal manera que puedan obtenerse diferentes ventanas de procesamiento de señal para una opción diferente de uno o más parámetros de forma de ventana .
Al usar funciones de configuración de tipo seno y formar una suma ponderada de los valores de función de dichas funciones de ponderación de tipo seno, se obtienen las ventanas que tienen buenas características, según se discutirá con mayor detalle a continuación.
Además, debe observarse que se discutirán a continuación los detalles con respecto al cálculo de los valores de ventana de procesamiento de señal w(t), los cuales se proporcionan por el proveedor de ventana 180. 3. Procesador de Señal de Acuerdo con la Fig. 2 La Fig. 2 muestra un diagrama de bloque esquemático de un procesador de señal 200, de acuerdo con una modalidad de la invención. El procesador de señal 200 se configura para recibir una señal de entrada 210 y para proporcionar, en base a lo mismo, una versión procesada 212 de la señal de entrada.
El procesador de señal 200 comprende un proveedor de ventana 220 configurado para enmarcar una porción de la señal de entrada 210, o de una versión pre-procesada 210 de la misma, dependiente de una ventana de procesamiento de señal descrita por valores de ventana de procesamiento de señal para una pluralidad de valores índice de valor de ventana (designados brevemente como "valores índice"), con objeto de obtener la versión procesada 212 de la señal de entrada. El procesador de señal 200 puede comprender un pre-procesamiento opcional 211 y un post- procesamiento opcional 213.
Los valores de ventana de procesamiento de señal son valores de resultado de una evaluación de función seno para una pluralidad de valores de argumento asociados con valores índice de valor de ventana, en donde los valores de argumento son sumas ponderadas de un término lineal, que es linealmente dependiente de los valores índice de valores de ventana y valores de función de una o más funciones de configuración de tipo seno, cuyas una o más funciones de configuración de tipo seno representan valores índice de valor de ventana sobre valores de función correspondientes. La una o más funciones de configuración de tipo seno son simétricas por puntos con respecto a un centro de una inclinación de ventana.
El proveedor de ventana 220 puede llevar a cabo, en consecuencia, una formación de ventana que es muy similar a la formación de ventana llevada a cabo por el proveedor de ventana 120. Por ejemplo, los valores de ventana de procesamiento de señal usados por el proveedor de ventana 220 pueden ser idénticos a los valores de ventana de procesamiento de señal usados por el proveedor de ventana 120. Los valores de ventana de procesamiento de señal usados por el proveedor de ventana 220 pueden almacenarse, por ejemplo, en una? tabla de búsqueda o pueden obtenerse de otro modo.
En modalidades alternativas, pueden utilizarse los valores de ventana de procesamiento de señal. En una modalidad alternativa, los valores de ventana de procesamiento de señal son valores de resultado de una suma ponderada de valores de función de una pluralidad de funciones de configuración de tipo seno, que representan valores índice de valor de ventana sobre valores de función correspondientes.
Para concluir, el proveedor de ventana 220 puede configurarse, por ejemplo, para aplicar una ventana descrita por valores de ventana de procesamiento de señal wnew(n) a la señal de entrada 210, o a la versión pre-procesada 211' de la misma. Sin embargo, de manera alternativa, el proveedor de ventana 220 puede aplicar los valores de procesamiento de señal wc(t) a la señal de entrada 210 o a la versión pre-procesada 210' de la misma.
Podrían describirse a continuación los detalles con respecto a las ventanas de procesamiento de señal aplicadas por el proveedor de ventana 220. 4. Proveedor de Ventana de Acuerdo con la Fig. 3 La Fig. 3 muestra un diagrama de bloque esquemático de un proveedor de ventana 300 de acuerdo con una modalidad de la invención. El proveedor de ventana 300 se configura para recibir uno o más parámetros de forma de ventana 310, que son típicamente valores variables, y para proporcionar, en base a lo mismo, un conjunto de valores de ventana de procesamiento de señal w(n) 312 para una pluralidad de valores índice de valor de ventana. El proveedor de ventana 300 se configura para evaluar una función seno para una pluralidad de valores de argumento asociados con los valores índice de valor de ventana, a fin de obtener los valores de ventana de procesamiento de señal w(n) . El proveedor de ventana también se configura para calcular una suma ponderada de un término lineal, algunas veces designado con c(n), el cual es linealmente dependiente de los valores índice de valor de ventana n y valores de función de una o más funciones de configuración. La una o más funciones de configuración representan valores índice de valor de ventana n sobre valores de función correspondientes. La una o más funciones de configuración son simétricas por puntos con respecto a un centro de una inclinación de ventana.
De acuerdo con lo anterior, el proveedor de ventana 300 cumple esencialmente la funcionalidad del proveedor de ventana 130. Sin embargo, debe observarse que el proveedor de ventana 300 puede ser un componente que es independiente del proveedor de ventana 130. Sin embargo, de manera alternativa, el proveedor de ventana 300 puede cumplir la funcionalidad del proveedor de ventana 180. 5_. Señal de Medios Codificada de Acuerdo con la Fig. 4 En lo sucesivo, se describirá una señal de medios codificada. En la Fig. 4 se muestra una representación esquemática de tal señal de medios codificada. La señal de medios codificada 400 comprende una representación codificada de un contenido de medios y parámetros de forma de ventana. Los parámetros de forma de ventana se adaptan, por ejemplo, para servir como el uno o más parámetros de forma de ventana 132 para el proveedor de ventana 130 o para servir como el uno o más parámetros de ventana 132 para el proveedor de ventana 180. De acuerdo con lo anterior, los parámetros de forma de ventana en la señal de medios codificada 400 se seleccionan para producir valores de ventana de procesamiento de señal w(n) o w(t) usando el proveedor de ventana 130 o el proveedor de ventana 180. También, la representación codificada del contenido de medios se codifica utilizando típicamente una formación de ventana de acuerdo con una ventana descrita por los parámetros de forma de ventana. 6_. Detalles con Respecto a las Ventanas Proporcionadas por el Proveedor de Ventana 130 o Usadas por el Proveedor de Ventana 220 6.1 Aspectos Generales y Definiciones En lo sucesivo, se describirán algunos detalles con respecto a las ventanas proporcionadas por el proveedor de ventana 130, cuyas ventanas también pueden utilizarse por el proveedor de ventana 220. Debe observarse aquí que las ventanas se definen mediante valores de ventana de procesamiento de señal w(n) . Dichos valores de ventana de procesamiento de señal w(n) se multiplican típicamente con la señal de entrada 110, o la versión pre-procesada 110' de la misma, a fin de obtener una versión enmarcada de la señal de entrada, o de la versión pre-procesada 110' de la misma. Una ventana se describe típicamente por los valores de ventana de procesamiento de señal w(n) , en donde n es un valor índice (por ejemplo, un valor índice de tiempo) que designa los valores de ventana del procesador de señal.
Además, debe observarse que una ventana típicamente comprende una inclinación de ventana de lado izquierdo y una inclinación de ventana de lado derecho. Una ventana puede comprender además opcionalmente una porción central constante (o aproximadamente constante), de tal manera que un número de valores de ventana de procesamiento de señal central toman un valor predeterminado. Sin embargo, debe observarse que una inclinación de ventana de lado izquierdo y una inclinación de ventana de lado derecho de una ventana pueden ser diferentes. De acuerdo con lo anterior, debe señalarse que la siguiente discusión describe subs tancialment e una forma de una sola inclinación de ventana, es decir, de una transición entre un pequeño valor de ventana (por ejemplo, un valor de ventana cero) y un valor de ventana grande (por ejemplo, un valor de ventana máximo de uno) .
Tomando como referencia ahora la Fig. 16, que muestra una representación gráfica de la Fig. 16, una abscisa 1610 describe el valor índice n, y una ordenada 1612 describe los valores de ventana de procesamiento de ' señal w(n) asociados con los valores índice n. Como puede observarse, la ventana 1600 comprende una porción de ventana de lado izquierdo 1620 y una porción de ventana de lado derecho 1622. La porción de ventana de lado izquierdo comprende, como un elemento clave, una inclinación de ventana de lado izquierdo 1630. La inclinación de ventana de lado izquierdo 1630 se define, por ejemplo, por una pluralidad de valores de ventana de procesamiento de señal w(n) para n=ni hasta n=n2 · La porción de ventana de lado izquierdo 1620 puede comprender también, opcionalmente, una porción externa de lado izquierdo, para la cual los valores de ventana de procesamiento de señal w(n) toman un valor pequeño de, por ejemplo, w(n)=0. La porción de ventana de lado izquierdo opcionalmente comprende también una parte de una porción de ventana central, para la cual los valores de ventana de procesamiento de señal w(n) toman un valor pre-de te rminado de, por ejemplo, w(n)=l. La ventana 1600 comprende una porción de ventana de lado derecho 1622, que comprende, como un elemento clave, una inclinación de ventana de lado derecho 1640. La porción de ventana de lado derecho puede comprender opcionalmente una parte de una porción de ventana central, para la cual los valores de ventana de procesamiento de señal toman un valor predeterminado de, por ejemplo, w(n)=l. La porción de ventana de lado derecho también puede comprender, opcionalmente, una porción externo de lado derecho, para lo cual los valores de ventana de procesamiento de señal w(n) toman un valor pequeño de, por ejemplo, w (n) =0.
Debe observarse que la porción externa de lado izquierdo, la porción de ventana central y la porción de ventana externa de lado derecho deben considerarse como opcionales. También debe observarse que la ventana 1600 puede ser simétrica o asimétrica. Por lo tanto, la inclinación de ventana de lado izquierdo 1630 y la inclinación de ventana de lado derecho 1640 pueden ser iguales o pueden ser significativamente diferentes en algunas modalidades .
Debe observarse aquí que la siguiente discusión se refiere subs tancialmente a la inclinación de ventana de lado izquierdo 1630, es decir, a una transición entre valores de ventana pequeño o cero y un valor de ventana grande o máximo. Sin embargo, debe observarse que una ventana general 1600 puede obtenerse del conocimiento de la inclinación de ventana de lado izquierdo 1630 al agregar opcionalment e una porción externa de lado izquierdo y al agregar opcionalmente una porción de ventana central y al agregar una inclinación de ventana de lado derecho y al agregar opcionalmente una porción externa de lado derecho. Debe observarse también que la inclinación 1 de ventana de lado derecho 1640 puede obtenerse del mismo modo que una inclinación de ventana de lado izquierdo usando un simple proceso de reflejo, tal como el de la ecuación (3) .
También debe observarse que de acuerdo con la siguiente discusión, la inclinación de ventana de lado izquierdo debe describirse por valores w(n) para n=0 hasta n=N/2-l. Sin embargo, un uso de los diferentes valores índice es naturalmente posible. 6.2 Detalles de la Ventana wnew(n) Las modalidades de acuerdo a la invención se dirigen a la falta de funciones de ventana computacionalmente eficientes y flexibles para aplicaciones de MDCT al declarar una extensión hacia las funciones de ventana de seno de la ecuación (4) .
Observe que la ecuación (4) puede considerarse como el seno de una función de ventana triangular simétrica aproximadamente a n=N/2-l/2. Dada la ecuación (3) , esto implica c(ri) = (n+my2/N, (6) H (») =sen(7i2-c(«))) n = 0, 1, ..., N/2-X, (7) donde c(n) denota la función de núcleo de ventana, que puede calcularse por adelantado ya que se encuentra predeterminada. La extensión propuesta es agregar a c(n) en la ecuación (7) sinusoides ponderados que tienen frecuencias angulares que son múltiplos enteros de 2p: c'(«) = c(n) +?a SGl(2nM- n)), /= 1, 2, (8) w.(«) =sen(n/2c'(*)), n=0, 1, ..., N/2-1. (9) Los términos seno en c' (n) también pueden calcularse por adelantado. Solo su ponderación, según se especifica por los factores, necesita adaptarse. Por lo tanto, cuando se ajusta la ventana propuesta a una señal sobre una base de t rans fo rmación-por-transformación, solo la ecuación (9) y la ponderación en la ecuación (8) tienen que re-calcularse, haciendo la adaptación comput acionalmente menos compleja que la de las ventanas de Sinha-Ferreira y KBD.
Además, es importante mencionar que, debido a los términos seno en las ecuaciones (8) y (9), cada realización de la clase propuesta de funciones de ventana se atenúa completamente hasta cero en sus puntos terminales, lo cual asegura una atenuación de nivel de lóbulo lateral de al menos 12 dB por octavo en la respuesta de frecuencia de la ventana. Este no es el caso con la ventana de KBD y las ventanas publicadas en el articulo de Princen y Bradley, "Diseño de Banco de Filtro de Aná 1 i s i s / Sinte s i s En Base A Cancelación de Solapamiento de Dominio de Tiempo", IEEE Trans. Acoustics, Speech and Signal Processing, Octubre 1986, págs . 1153-1161 y en el articulo de Ferreira, "Efectos Convolucionales en Codificación de Transformación con TDAC: Una Ventana Óptima", IEEE Trans. Speech and Audio Processing, Marzo 1996, págs. 104-114, cuyos lóbulos laterales de frecuencia alejada se atenúan por consiguiente hasta menos de 12 dB por octavo. Para amplitudes de lóbulo principal iguales, esto representa que una ventana de acuerdo con las ecuaciones (8) y (9) potencialment e mejora las ventanas de la técnica anterior en términos de atenuación de lóbulo lateral de frecuencia alejada.
El cálculo o adaptación de una ventana de acuerdo con la presente invención comprende las siguientes etapas: Seleccionar el número de términos seno en c' (n) y los factores de ponderación adecuados en base a consideraciones de diseño .
Determinar o definir la longitud de ventana N y calcular c' (n) con la af seleccionada y el número de términos seno .
Calcular wn u e Va(n) de la ecuación (9) para n=0, 1, N/2-1, empleando entonces la ecuación (3) para obtener una instancia de ventana de longitud-N.
Si se utiliza un cálculo de parámetros de ventana diferente para el segmento adyacente, precedente, satisfacer cualquier condicionante de inversión perfecta ya sea mediante corrección de la mitad derecha de la instancia de ventana precedente o mediante corrección de la mitad izquierda de la instancia de ventana actual, o mediante corrección de ambas mitades, derecha de la instancia precedente e izquierda de la instancia actual.
En una modalidad preferida, la función de ventana es comparable con las ventanas de seno y Vorbis con respecto a complejidad comput cional , pero proporciona al menos la flexibilidad de diseño de la ventana de KBD y Sinha-Ferreira .
Con respecto a lo anterior, debe observarse que los valores de c' (n) pueden considerarse como valores de argumento asociados con los valores índice de valor de ventana n. También debe observarse que las funciones sen ( 2n-f-c (n ) ) pueden considerarse como funciones de configuración.
También debe observarse que no es necesario utilizar funciones seno como las funciones de configuración. Más bien, puede ser suficiente seleccionar las funciones de configuración de tal manera que las funciones de configuración sean simétricas por puntos con respecto a un centro de una inclinación de ventana. El centro de la inclinación de ventana se define, por ejemplo, por un valor del término lineal c(n)=0.5. Por ejemplo, las funciones pol inominales simétricas por puntos pueden utilizarse en lugar de las funciones seno, lo cual puede facilitar la evaluación en algunos casos. También, las funciones de configuración deben tomar preferentemente un valor que sea lo suficientemente cercano a cero para c(n)=0 y c(n)=l, es decir, en un ambiente de un valor índice de ventana en el extremo izquierdo de la inclinación de ventana y en un ambiente del valor índice de valor de ventana en el extremo derecho de la inclinación de ventana. En otras palabras, las funciones de configuración deben tener ceros, o deben tomar aproximadamente valores de cero, en los ambientes (o inmediaciones) del valor índice de valor de ventana en el extremo izquierdo (por ejemplo, n= 0) y el valor índice de valor de ventana en el extremo derecho (por ejemplo, n=N/2-l) .
Además, debe observarse que las ecuaciones (6) y (7) pueden evaluarse, por ejemplo, mediante el cálculo de valor de argumento del proveedor de ventana 130 y que la ecuación (9) puede evaluarse mediante la evaluación de función seno del proveedor de ventana 130. De acuerdo con lo anterior, los valores wnueva(n) obtenidos por la evaluación de la función seno del proveedor de ventana 130 para n=0 hasta n=N/2-l pueden describir, por ejemplo, una inclinación de ventana de lado izquierdo 1630.
El proveedor de ventana 130 puede configurarse, en consecuencia, para ensamblar una ventana entera 1610 en base a dichos valores de ventana de procesamiento de señal, asociados con una inclinación de ventana de lado izquierdo. Para este propósito, el proveedor de ventana puede agregar una porción externa de lado izquierdo, una porción de ventana central, una inclinación de ventana de lado derecho y una porción externa de lado derecho, como se muestra en la Fig. 16. La inclinación de ventana de lado derecho puede obtenerse mediante elaboración de un reflejo de la inclinación de ventana de lado izquierdo para el caso de una ventana simétrica. Sin embargo, de manera alternativa, la inclinación de ventana de lado derecho puede ser diferente de la inclinación de ventana de lado izquierdo y puede obtenerse mediante elaboración de un reflejo de una inclinación de ventana, obtenido para parámetros de forma de ventana diferentes a los de la inclinación de ventana de lado izquierdo. 1 ·¦ También debe observarse que puede asegurarse por el procesador de señal que una inclinación de transición de lado derecho, asociada con una porción precedente de la señal de entrada y una inclinación de transición de lado izquierdo, asociada con una porción posterior de la señal de entrada, se igualan ya que se satisfacen las condicionantes de inversión perfecta. Para este propósito, puede asegurarse que la inclinación de ventana de lado izquierdo asociada con la porción posterior de la señal de entrada se obtenga utilizando los mismos parámetros que se han aplicado a la obtención de la inclinación de ventana de lado derecho, asociada con la porción precedente de la señal de entrada.
Además, debe observarse que el algoritmo definido por las ecuaciones (6), (8) y (9) es muy adecuado a un cálculo en linea de las funciones de ventana en un aparato que tiene potencia comput ac i ona 1 limitada.
No obstante, las ventanas según se definen por las ecuaciones (6), (8) y (9) pueden evaluarse una vez y los resultados de lo mismo pueden almacenarse en una tabla de búsqueda para uso posterior en algunas modalidades . 6.3 Comentarios Sobre El Diseño de Ventana En lo sucesivo, se discutirán algunas condiciones que dan como resultado ventanas que tienen características particularmente buenas. No obstante, debe observarse que la obediencia de las condiciones discutidas en lo sucesivo no debe considerarse esencial.
Como se mencionó en la discusión de la sección de Antecedentes, los codificadores de señal que emplean la MDCT necesitan imponer ciertas condiciones sobre la función de ventana aplicada a la señal con objeto de permitir que el sistema entero sea completamente invertible, es decir, ofrecen reconstrucción de entrada perfecta, cuando no se llevan a cabo manipulaciones de señal. Las funciones conforme a la ecuación (2), también conocidas como funciones complementarias de potencia, representan una categoría adecuada.
Todas las realizaciones de la presente clase de ventana pertenecen a esta categoría. Sin embargo, puede mostrarse que las realizaciones con c' (n) no negativos para toda n desplegada, c'(«) > 0, n = 0, l, ..., N/2-l, (10) producen selectividad de banda de paso particularmente buena y rechazo de banda de detención de manera simultánea. Por consiguiente, la siguiente discusión se enfocará en este sub-conjunto de la clase de ventana. En algunos casos, solo las realizaciones con c' (n) no negativo para toda n desplegada producen selectividad de banda de paso satisfactoria y rechazo de banda de detención de manera simultánea.
Aunque en general es posible usar un número arbitrario de términos seno en la ecuación (8) para designar respuestas de frecuencia de ventana ancladas al caso de uso dado, se descubrió que dos términos seno (f=l, 2) proporcionan una relación adecuada entre flexibilidad, complejidad y uso de memoria. En particular, al usar dos términos seno, pueden derivarse parámetros que reducen la amplitud del lóbulo principal, es decir, maximizan la selectividad de frecuencia exacta, - reducen el nivel máximo de lóbulo lateral por encima de una cierta frecuencia no rmal i z ada , - maximizan la velocidad de atenuación del lóbulo lateral, es decir, la atenuación de banda de detención de frecuencia alejada, minimizan la diferencia máxima en una instancia de ventana de referencia existente de una instancia de ventana. Cada una de estas consideraciones de diseño se examinará a continuación con la ayuda de ejemplos específicos . 6.3.1 Ventanas Con Máxima Selectividad de Banda de Paso Aunque la condición de complementar iedad de potencia de la ecuación (2) limita el rango de respuestas de frecuencia que pueden lograrse, especialmente con respecto a la amplitud y nivel de unos cuantos primeros lóbulos laterales, la función de ventana que conduce al lóbulo principal más angosto puede obtenerse mediante establecimiento de todos los factores af en c' (n) en cero. La ventana resultante, como es fácilmente aparente, iguala la ventana seno de AAC de la ecuación (4) . Su espectro se ilustra en la Fig. 5 junto con aquellos de las ventanas de Vorbis y KBD(a=4) .
Sin embargo, en resumen, debe observarse que preferentemente al menos uno de los parámetros de forma de ventana af debe fijarse en valor diferente de cero. No obstante, la estructura arriba descrita del proveedor de ventana 113 da la flexibilidad para obtener incluso la ventana de seno AAC sin señal especifica alguna al determinar meramente los parámetros de forma de ventana af. 6.3.2 Ventanas Con Máximo Lóbulo Lateral Mínimo Las configuraciones de la ecuación (9) que minimizan el máximo nivel de lóbulo lateral pueden adquirirse mediante optimización conjunta de los parámetros af, ya sea mediante métodos de búsqueda exhaustivos o en base a gradientes. Sin embargo, respecto a la ecuación (2), es recomendable definir un límite de frecuencia inferior Ne>o>1.5 por encima del cual se lleva a cabo la optimización minimax. Se encontró que un valor de ?ß>?= 4.5 produce los parámetros «1=0.1224 y a2=0.00523. La función de ventana asi configurada se muestra en la Fig. 6. La similitud con la función de ventana de KBD de AAC , que también se ilustra, es evidente. Los espectros de ventana correspondientes se muestran en la Fig. 7. Es importante observar que el nivel inferior de los primeros dos lóbulos laterales de la ventana inventiva cuando se comparan con la ventana de KBD, asi como también la reducción en el nivel de lóbulo lateral máximo por encima de N6>o¾5 (los primeros tres lóbulos laterales de la ventana propuesta por encima de esta frecuencia tienen un nivel de -66.8 dB, mientras que la ventana de KBD alcanza un nivel algo superior de -63.0 dB ) .
Debido al uso de términos seno en c' ( n ) , cada realización de la presente clase de ventana es continua y por lo tanto garantiza una atenuación uniforme hasta cero en sus puntos terminales. Esta ventaja se ilustra en la Fig. 8. Como puede observarse, los lóbulos laterales de la ventana previamente derivada caen a una velocidad de 12 dB por octavo. En contraste, la ventana de KBD exhibe una menor velocidad de caída, siendo la razón ligeras discontinuidades en los puntos terminales de la función de ponderación de la función de ponderación de KBD. Como resultado, la ventana propuesta logra mayor rechazo que la ventana de KBD por encima de N¿y«250 aún cuando se mejora por lo último entre No«250 y N<a«7. En algunas aplicaciones de análisis o síntesis, esta característica puede ser benéfica. 6.3.3 Ventanas Con Máxima Atenuación de Lóbulo Lateral En ciertos casos, podría ser deseable utilizar ventanas cuyos lóbulos laterales se atenúan a velocidades mayores de 12 dB por octavo. La presente invención permite la construcción de, por ejemplo, una ventana que disminuye a 24 dB por octavo. Esto se logra al requerir un primer diferencial continuo de la función de ponderación, es decir, un diferencial de anulación en los límites de la instancia de ventana. La solución más intuitiva a este problema es la configuración «1=0.1591, «2=0. La respuesta de ventana resultante se ilustra en la Fig. 9 junto con otras tres respuestas que se discuten en lo sucesivo. 6.3.4 Ventanas Que Se Aproximan ? Ventanas de Referencia Para completar esta demostración de la flexibilidad de la clase de ventana propuesta, se hace un intento por crear dos realizaciones de ventana que semejan exactamente dos ventanas existentes. Debido a su diversidad, las funciones de KBD (a=4) y de S inha - Fe rre i ra de tercer orden se seleccionan como referencias. La reconstrucción a través de c' (n) y la ecuación (9) se enfoca en un sentido de mínimos cuadrados, es decir, mediante reducción de la diferencia cuadrada entre referencia y aproximación (observe que también son posibles otros métodos) . La Fig. 9 muestra el resultado. Puede observarse que las ventanas inventivas son casi idénticas a sus contrapartes de la técnica anterior y que las principales diferencias ocurren solo a niveles muy bajos. En ambientes críticos de complejidad o de memoria, las ventanas de referencia podrían sustituirse, por consiguiente, por un dispositivo que use la presente clase de ventana mientras mantiene un alto grado de compatibilidad de fondo y, si es aplicable, la posibilidad de reconstrucción casi-per fecta . 7_. Implementación de un Sistema Adaptable a la Señal Una ventaja adicional de la clase de ventana presentada surge cuando un sistema procesa segmentos de señal de diferentes longitudes, relacionándose las longitudes por potencias enteras de 2. En AAC , por ejemplo, este procedimiento, que también se conoce como conmutación de bloque, se realiza mediante la aplicación de la MDCT ya sea una vez en 2048 (1920) u 8 veces en 256 (240) muestras por estructura. Aquí, los sub-conj untos de los términos individuales en la ecuación (8), por ejemplo, n - 0 , 1, N/8-1, pueden re-utilizarse como funciones de núcleo para las ventanas de menor longitud o, en caso de los términos seno, incluso como funciones de ventana en si. Si una flexibilidad de diseño reducido para las ventanas de baja longitud es aceptable, esto puede explotarse para reducir aún más la capacidad de memoria requerida para almacenar las funciones de núcleo. 8. Aplicaciones Adicionales de la I nvención Las funciones de ventana complementaria de potencia tales como las reportadas en la presente pueden ser bastante atractivas para varios escenarios de aplicación diferentes de codificación de audio o video. Como se observó en el documento citado en el párrafo 6 de la sección de Antecedentes, las ventanas complementarias de potencia pueden emplearse en sistemas de conmutación o desvanecimiento cruzado de preservación de energía instantánea, así como también dispositivos de análisis y procesamiento de señal que operan en una base de bloque-por-bloque con sobreposición entre bloques sucesivos. Hablando de manera más general, cualquier aparato que lleva a cabo labores de filtración sobre una señal de una o más dimensiones, puede usar ventanas del presente informe en la construcción de su núcleo (s) de filtración, incluyendo, pero sin limitarse, filtros de paso elevado (diferenciación), paso bajo (integración) y paso de banda, prototipo descendente (filtros de decimación) y prototipo ascendente (filtros de interpolación) , - ecuali zadores de múltiple banda o de banda individual, compresores, expansores y limitadores , algoritmos para reducción de ruido y mejora relacionada o herramientas de efectos.
Al adoptar en tales sistemas la función de ventana inventiva aquí presentada y anclando sus características espectrales a requisitos de aplicación, preferentemente en una forma que se adapte a un segmento de señal, se espera que puedan lograrse incrementos en el desempeño perceptual . 9. Codificador de Señal de Medios y Decodificador de Señal de Medios de Acuerdo con las Figs. 10a y 10b Las Figs. 10a y 10b muestran un diagrama de bloque esquemático de un codificador de señal de medios y de un decodif icador de señal de medios. El codificador de señal de medios 1010 se configura para recibir una o más señales de canal si(n) a sM(n) y para proporcionar, en base a lo mismo, una representación codificada. La representación codificada de las señales de medios de entrada puede tomar la forma de coeficientes de MDCT Si(k) a SM(k), o puede ser una representación codificada de tales coeficientes de MDCT. El codificador de señal 1010 comprende, por ejemplo, una pluralidad de trayectorias de señal idénticas 1012a-1012m, que pueden operar de manera independiente o que pueden acoplarse. Además, el codificador de señal 1010 también comprende un cálculo de parámetro de codificación 602, el cual determina uno o más de los parámetros de codificación como, por ejemplo, una longitud de bloque, un parámetro de configuración de ruido temporal (TNS), un parámetro de compensación de ganancia de sub-banda, una información de configuración y/o una información de modelo ps i coacús t i co . En lo sucesivo, se discutirá una trayectoria o ramificación 1012a, pero la discusión anterior también es aplicable a ramificaciones adicionales como, por ejemplo, la ramificación 1012m.
La ramificación 1012a comprende una detección de ventana 603, que recibe la señal de entrada Si(n) del canal respectivo e información proveniente del determinador de parámetro de codificación 602. La detección de ventana 603 puede proporcionar, por ejemplo, una información de forma de ventana 603a, que describe una forma de una ventana deseada.
La información de forma de ventana puede determinarse, por ejemplo, a partir de la entrada al detector de ventana 603 de tal manera que se optimice o mejore el desempeño objetivo (ganancia de codificación, selectividad de frecuencia o compactación de energía, compresión de datos, cantidad de solapamiento introducida) o desempeño subjetivo (calidad perceptual de la salida codificada después de la transmisión y codificación libre de errores o errónea) del codificador 1010.
La ramificación 1012a también comprende una sincronización de ventana 604, que debiera considerarse como opcional y que puede combinar la información de forma de ventana proporcionada por la detección de ventana 603 de la presente ramificación 1012a con la información de forma de ventana provista por detectores de ventana de diferentes ramificaciones. De acuerdo con lo anterior, una información de forma de ventana sincronizada 604a puede proporcionarse opci onalmente por la sincronización de ventana 604. La trayectoria de señal 1012a también comprende una aplicación de reconstrucción perfecta 605, que se configura para recibir la información de forma de ventana 603a, o la información de forma de ventana sincronizada 604a, y a fin de proporcionar, en base a lo mismo, una información de forma de ventana adaptada 605a. Por ejemplo, la aplicación de reconstrucción perfecta 605 puede asegurar que una inclinación de transición de lado derecho (también designada como inclinación de ventana) de una ventana asociada con una porción previa de la señal de entrada, sea una versión reflejada de una inclinación de ventana de una ventana asociada con una porción posterior de la señal de entrada. Por ejemplo, puede asegurarse que las inclinaciones de ventana de las ventanas asociadas con las porciones posteriores de una señal de entrada se definan por parámetros de forma de ventana idénticos. La trayectoria de señal 1012a también comprende un cálculo de ventana 606 que se configura para proporcionar valores de ventana de procesamiento de señal wi(n) a un proveedor de' ventana 1014. El proveedor de ventana 1014 se configura para multiplicar muestras de la señal de entrada Si (n) con los valores de ventana de procesamiento de señal correspondientes wi(n), a fin de obtener valores de señal enmarcados si' (n), que se introducen en un transformador de coseno, discreto, modificado 607, para obtener los coeficientes de MDCT Si(k) .
Debe observarse aquí que el calculador de ventana 606 puede tomar el control de la funcionalidad del proveedor de ventana 130 o del proveedor de ventana 180, de tal manera que los valores de ventana de procesamiento de señal wi (n) sean equivalentes a los valores de ventana de procesamiento de señal w(n) o a los valores de ventana de procesamiento de señal w(t) . También, el proveedor de ventana 1014 puede tomar la funcionalidad del proveedor de ventana 120.
De acuerdo con lo anterior, el codificador 1010 se configura para aplicar una pluralidad de diferentes ventanas para la formación de ventana de la señal de entrada Si(n) dependiente de los parámetros de forma de ventana adaptados 605a, en donde el cálculo de ventana 606 proporciona valores de ventana de procesamiento de señal .
El codificador 1010 puede comprender opcionalment e etapas adicionales de codificación para codificar eficientemente los valores espectrales Si(k) a SM(k) provistos por la transformación de MDCT 607.
El decodificador de señal 1020 se configura para recibir valores espectrales decodi ficados Qi(k) a QM(k) . Los valores espectrales decodif icados Qi(k) a QM ( k ) pueden extraerse de una corriente de bits, que puede proporcionarse por el codificador 1010 mediante codificación de los valores espectrales Si(k) a SM(k) . En otras palabras, los coeficientes espectrales Qi(k) a QM(k) pueden ser idénticos, excepto por errores de cuant ificación, a los valores espectrales Si(k) a SM(k) . Aquí, k es un índice de frecuencia y M>1 designa un número de canales (en donde se proporciona una ramificación por canal) .
El decodificador 1020 también se configura para recibir valores de longitud de ventana Ni a NM (que toman la función de la variable N como se describe' arriba) y uno o más parámetros de forma de ventana ai a aM (por ejemplo, uno por ramificación o canal) . El decodificador 1020 comprende un t rans formador-de-coseno-discreto-modi f icado inverso 608 que se configura para recibir los coeficientes espectrales Qi(k) a QM ( k ) y para proporcionar, en base a lo mismo, señales inversamente transformadas qi(n) a qM(n) . El decodificador 1020 también comprende una selección de ventana 609, que opera en combinación con una aplicación de reconstrucción perfecta 605 para derivar parámetros de forma de ventana adaptados 605a a partir de los parámetros de forma de ventana de entrada ai a aM, en donde los parámetros de forma de ventana de entrada ai a aM pueden extraerse o derivarse de una corriente de bits que representa un contenido de medios. Por ejemplo, tanto los parámetros de forma de ventana de entrada ai a aM como también los valores espectrales Qi(k) a Q (k) pueden representarse en la señal de medios codi fi cada .
El decodi f icador 1020 comprende además un cálculo de ventana 606, que recibe el parámetro de forma de ventana adaptada 605a (o, alternativamente, los parámetros de forma de ventana de entrada ai a aM) y proporciona, en base a lo mismo, los valores de ventana de procesamiento de señal wi (n) a wM ( n ) . El cálculo de ventana 606 puede llevar a cabo la funcionalidad del proveedor de ventana 130 o del proveedor de ventana 180, en donde los parámetros de forma de ventana adaptada 605a pueden corresponder al uno o más parámetros de forma de ventana 132 o al uno o más parámetros de forma de ventana 182. De manera similar, los valores de ventana de proce Sarniento de señal wi(n) a wM(n) pueden ser equivalentes a los valores de ventana de procesamiento de señal w(n) o a los valores de ventana de procesamiento de señal w(t) .
De acuerdo con lo anterior, el cálculo de ventana 606 puede proporcionar ventanas de diferentes formas de acuerdo con los parámetros de forma de ventana adaptada 605a o los parámetros de forma de ventana de entrada ax a aM .
El valor de ventana de procesamiento de señal wi (n) a wM ( n ) provisto por el cálculo de ventana 606 del decodi f icador 1020 puede aplicarse, por ejemplo, por una operación de multiplicación 1024, a las señales inversamente transformadas qi(n) a qM(n) proporcionadas por la transformación de coseno-discreto-raodi ficado- inverso 608 a fin de obtener una versión enmarcada qi' (n) a qM' (n) de los valores qi (n) a qM (n) .
El decodificador 1020 comprende además una sobreposición-y-adición 610, la cual se configura para recibir porciones de ventana posteriores qi' (n) a qM' (n) de las señales inversamente transformadas qi(n) a qM ( n ) y sobreponerlas-y-agregarlas a dichas porciones posteriores, a fin de obtener señales reconstruidas yi(n) a yM ( n ) . La sobreposición-y-adición 610 se coordina preferentemente con la formación de ventana 1024 de tal manera que las porciones de señal enmarcadas qi' (n) a qM' (n) se sobreponen por la sobreposición-y-adición 610 se enmarcan con ventanas "complementarias", de tal manera que una inclinación de ventana de lado derecho de una primer ventana se sobreponga a la inclinación enmarcada de lado izquierdo de una ventana posterior, en donde las inclinaciones de ventana de sobreposición comprenden la conservación de energía y/o las características de reconst ucción perfecta arriba discutidas.
Por lo tanto, el codificador 1010 y el decodificador 1020 son capaces de codificar y decodificar señales de medios como, por ejemplo, señales de audio, señales de voz, señales de video, señales de imagen, etc.
Para concluir, las modalidades anteriores de acuerdo con las presentes invenciones pueden implement arse en software y tanto en microcircuitos de hardware como también en procesadores de señal digital (DSPs) para diversas clases de sistemas y almacenamiento análogo o digital o transmisión de señale s .
Para resumir, las Figs. 10a y 10b ilustran la manera en que puede utilizarse la técnica de formación de ventana propuesta en un codi ficador-decodi ficador de audio como AAC que se adapta a la señal o un tipo diferente de codificador de señal o decodificador de señal. Las funciones de núcleo de ventana 601 para la construcción de c' (n) se almacenan en la memoria junto con una definición de configuraciones de parámetros disponibles. Estos datos se comparten por codificador y decodificador. El codificador, mostrado en la Fig. 10a), de referencia numérica 1010, segmenta para cada estructura los M canales de entrada, y para cada uno de los segmentos M s(n), datos de un modelo ps icoacús t ico espectro-temporal 602 se analizan en un detector de ventana y selector 603 para determinar una forma de ventana adecuada y si es aplicable, longitud y número. Se selecciona una ventana adecuada en base a criterios tales como selectividad de frecuencia (cálculo de energía) o baja sobreposición de estructura (reducción de solapamiento cuando se utiliza TNS o compensación de ganancia de sub-banda (SB) ) .
En otras palabras, el codificador 1010 (o cualquier otro procesador de señal) puede configurarse para determinar, variar o ajustar uno o más de los parámetros de forma de ventana a¿ en una forma que se adapta a la señal de tal manera que se optimice o mejore un desempeño subjetivo del procesador de señal. De acuerdo con lo anterior, el uno o más parámetros de forma de ventana puede determinarse, variarse o ajustarse en una forma que se adapte a la señal de tal manera que se optimice o mejore el desempeño objetivo (es decir, numérico) o subjetivo (es decir, perceptual) del procesador de señal (por ejemplo, el codificador de audio 1010 ) .
Después de la comparación opcional de los parámetros de forma de ventana del canal a través de la unidad de sincronización 604 , se asegura que se lleve a cabo la reconstrucción perfecta (PR) de las transformaciones usando las funciones de ventana seleccionadas, en una unidad de aplicación de PR 605 mediante ajuste de los parámetros para la sobreposición de mitades de ventana de la estructura actual y previa. En base a los parámetros de forma de ventana modificados, al usar las ecuaciones (8) y (9), los coeficientes de ventana reales se calculan 606 y se multiplican con el segmento de audio respectivo, formando un segmento enmarcado s' (n) que se transforma finalmente en dominio de frecuencia por medio de una MDCT 607 para posterior cuantificación, codificación y transmisión. En el decodificador mostrado en la Fig. 10b); en la referencia numérica 1020, los parámetros de forma de ventana recibidos para cada estructura y canal se decodifican y adelantan a un selector de ventana 609, que les representa la configuración de ventana correspondiente para uso después de la MDCT inversa 608 del espectro descuantificado Q ( k ) . Después de reforzar PR de las secuencias de ventana y calcular los coeficientes de ventana análogos al codificador, los segmentos de salida q(n) que resultan de las MDCTs inversas, se enmarcan y, por medio de s obrepos i c ión-adición 610, se reconstruyen las formas de onda de canal individual y(n) . 10. Cálculo Alternativo de Ventana 10.1. Vista General Sobre El Cálculo de una Función de Ventana de una Clase de Ventana Alternativa En lo sucesivo, se describirá una clase alternativa de funciones de ventana, que pueden usarse por un proveedor de ventana (por ejemplo, por el proveedor de ventana 180 o por el proveedor de ventana 300 o por el cálculo de ventana 606) para proporcionar valores de ventana de procesamiento de señal .
En otras palabras, en lo sucesivo, se darán los detalles con respecto a la definición de una clase alternativa de ventanas, los cuales se basan en una modificación substancial de algunas de las ecuaciones anteriores.
En una de las secciones precedentes, se observó que la ecuación (12) con a—2, es decir, w it), es equivalente a la ecuación (15) con K=l , jb0= 0.5, ¿1= 0.5. Además, se estableció la equivalencia entre w4(t) y (15) con K=2 y bk de (16) . Se ha investigado respecto a cuál bk produce wi(t) , w3(t), o más generalmente cualquier wa ( t ) con a impar. Observando las ecuaciones (12) y (15) , se ha encontrado que es imposible construir una ventana de suma-de-cosenos que sea equivalente a una ventana de seno con exponente impar. Sin embargo, en algunas aplicaciones donde se requiere wa ( t ) de a impar, puede ser deseable usar una formulación similar a la ecuación (15) a fin de permitir optimizaciones de fuga espectral según se lleva a cabo por Hamming, Blackman y Nuttall .
Por suerte, se ha encontrado que las funciones de suma-de-senos K i \ *",(<) = ?(- ! )* ctsen (2?+ 1 )tt· - t-o \ Lf (19) proporcionan los medios de optimización necesarios. Como puede observarse, los valores de ventana de procesamiento de señal wc ( t ) pueden obtenerse mediante formación de una suma ponderada de funciones de configuración de tipo seno sen ( ( 2 k+1 ) Tit /L ) . Puede obtenerse una inclinación de ventana de señal para valores de t entre 0 y L/2.
También debe observarse que, preferentemente, se suman las funciones de seno, las frecuencias de lo cual son múltiplos impares de una frecuencia fundamental. Por ejemplo, las frecuencias angulares normalizadas pueden definirse como (2k+l) p/L. Puede observarse que las mayores frecuencias normalizadas son múltiplos impares de una frecuencia normalizada fundamental p/L.
También debe observarse que las funciones de configuración se ponderan de manera alternativa con pesos negativos y positivos (-l)kck con índice de frecuencia creciente k (para k entre cero y un valor índice de frecuencia máximo K) .
Al seleccionar las constantes ck adecuadamente, pueden adquirirse dos configuraciones .
Primero, puede construirse una ventana correspondiente a una ventana de seno con exponente impar de (2) . La ck para impar de tercer orden ínfimo wa ( t ) se especificará aquí. La ventana clásica de seno wi ( t ) es trivial para construcción usando (19) mediante fijación de K=0 y cO = l. Para w3 ( t ) , K se incrementa a K=l , y co = 0.75, o = 0.25 . (20) Finalmente se obtiene w5 ( t ) de quinto orden usando K=2 y c0 = 0.625, ci = 0.3125, c2 = 0.0625 . (21) En segundo lugar, como bk en (15), ck puede determinarse de tal manera que se logre el comportamiento espectral similar al de las ventanas de Blackman, Hamming y Nuttall. Antes de derivar la respectiva ck para K=l y K=2 , es importante determinar exactamente cuál aspecto de una respuesta espectral de ventana debe optimizarse. Para este fin, son necesarias medidas objetivas del desempeño espectral de una ventana. En la siguiente sección, se conduce por lo tanto un análisis de todas las funciones de ventana por medio de algunas medidas populares. 10.2. Evaluación y Optimización En lo sucesivo, se evaluará el desempeño de las variantes de doble y triple término de esta clase de ventana y se comparará con otras ventanas que utilizan algunas de las figuras de mérito descritas en la referencia [2] . Motivado por el resultado, se describirán específicamente las realizaciones optimizadas.
En lo sucesivo, se discutirán diferentes conjuntos de parámetros de forma de ventana ck. Se mostrará que la combinación de los valores de ventana de procesamiento de señal de acuerdo con la ecuación (19) permite crear una amplia variedad de ventanas diferentes que tienen diferentes características. De acuerdo con lo anterior, puede resumirse que el proveedor de ventana configurado para proporcionar las ventanas de procesamiento de señal wc ( t ) de acuerdo con la ecuación (19) puede configurarse de manera muy flexible y trae consigo una complejidad computacional muy baja, debido- a que la función de configuración sen ( (2k+l) p-t/L) puede pre-calcularse mientras la suma ponderada trae consigo una complejidad computacional comparativamente pequeña.
Está bien establecido que la multiplicación de una señal de tiempo por otra señal corresponde a la convolución de las transformaciones de frecuencia de las dos señales. Por lo tanto, al aplicar una función de ponderación a una señal, el espectro de señal se convoluciona con el espectro de la ponderación. Para evaluar el efecto de una función de ventana, es por consiguiente suficiente con estudiar su espectro, por ejemplo, usando transformación Fourier.
Las Figuras 11 y 12 ilustran las magnitudes del espectro de potencia de las ventanas anteriores, normalizadas en frecuencia y amplitud como en la referencia [4] . Debido a ceros espectrales recurrentes, todas las ventanas exhiben un lóbulo principal a frecuencia cero y lóbulos laterales que se atenúan en amplitud con frecuencia creciente. La velocidad de disminución de los lóbulos laterales se dicta por las discontinuidades en los limites de la función de ventana asi como aquellos de sus diferenciales; las derivadas de más bajo orden son continuas, mientras más rápidas son las atenuaciones de ventana hasta cero para f grande. Ver también referencias [2] y [4] .
Para las funciones de seno con exponentiacion wa ( t ) de la Figura 11, puede establecerse que la disminución asintomática en dB por octavo es proporcional a (ver, por ejemplo, referencia [6] ) : dB disminución ( Wa) = — 6.02(<2--l) . oct (22) Esto parece aplicarse a toda a no negativa real, no solo enteros. Para las ventanas optimizadas de la Figura 12, puede observarse un comportamiento de lóbulo lateral diferente. La ventana Hamming, cuya amplitud de lóbulo principal iguala a la de w2 ( t ) =wHann ( t ) , disminuye a solo -6 dB por octavo debido a que la función de ponderación no es continua. De manera similar, las ventanas de Blackman y Nuttall, que tienen la misma amplitud de lóbulo principal que w4(t), muestran una atenuación de solo -18 dB por octavo; sus primeras derivadas de ponderación son continuas, pero sus terceras derivadas no lo son. Sin embargo, estas ventanas exhiben niveles inferiores de lóbulo lateral máximo en comparación con sus contrapartes wa ( t ) . Esto puede conducir a desviación espectral notablemente reducida en algunas aplicaciones y es la razón por la cual se desarrollan ventanas opt imi z ada s .
Ya que se ha encontrado que el procedimiento de optimización usado para la ventana de suma-de-cosenos en la Figura 12 también puede aplicarse a las funciones de suma-de-senos de (19), es posible modificar la ventana de doble término con (20) y la ventana de triple término con (21) para el ínfimo nivel de lóbulo lateral máximo (la ventana seno de un término con Co=l no puede optimizarse de este modo) . Se ha encontrado que debido al uso de sinuosides, cualquier realización de (15) se enfoca a amplitud cero en sus puntos terminales; se garantiza por lo tanto una velocidad de disminución de lóbulo lateral de -12 dB por octavo ( 1 / f2 , ver referencia [2] ) . Si las derivadas se permiten ser discontinuas, se obtienen grados adicionales de libertad para determinar c*, que puede emplearse para reducir la magnitud pico del lóbulo lateral (ver, por ejemplo, referencia [4] ) .
Para la ventana de suma-de-senos de doble término (K=l) , la admisión de una primer derivada discontinua produce un grado extra de libertad en la opción de cO y el. Se encuentra que c = 0.79445, c , = 0.20555 (23) produce el ínfimo lóbulo lateral posible máximo de -54.3 dB (primer y tercer lóbulo lateral) . La ventana de triple término (K=2) ofrece dos grados extra de libertad en la selección de c* . El nivel mínimo de lóbulo lateral pico de -82.8 dB se alcanza usando c0 = 0.69295,a = 0.2758, c2 = 0.03125 (24) La Figura 13 muestra el espectro de potencia de las ventanas (23) y (24) . Para las diez ventanas presentadas, el máximo nivel de lóbulo lateral, la disminución asintomática, la amplitud de lóbulo principal (se da por la ubicación del primer cero), y la amplitud de banda de 6-dB (una medida de la resolución de una ventana, ver referencia [2]) se mencionan en la Tabla 1.
TABLA 1: FIGURAS DE MÉRITO PARA LAS VENTANAS PRESENTADAS Observe cómo en términos de desempeño espectral en general, la ventana (23) yace justo entre la ventana Hamming de doble término y Nuttal de triple-término. Además, aunque se logra un pico de lóbulo lateral similar al de la ventana Blackman, la ventana (23) tiene un lóbulo principal más angosto. La ventana (24) tiene el máximo lóbulo lateral ínfimo de todas las ventanas en esta discusión, pero junto con w5 ( t ) , también exhibe el lóbulo principal más ampl io .
Para concluir, un cálculo de los valores de ventana de procesamiento de señal de acuerdo con la ecuación (19), trae consigo la posibilidad de obtener ventanas de características muy diferentes al variar solo los parámetros Ck sin variar la regla de cálculo subyacente. Esto reduce el esfuerzo computacional y el esfuerzo de implementación . También, en algunas modalidades, pueden usarse uno o más de los diferentes conjuntos de parámetros (20), (21), (23) ó (24) . El valor de ventana de procesamiento de señal puede calcularse y almacenarse en una tabla de búsqueda o puede calcularse en línea (siempre que se requiera) , dependiendo de la implementación real. 10.3. Ventanas de Suma-de Senos y la Transformación Fourier Discreta (DFT) o MDCT En lo sucesivo, se describirá una característica interesante de la clase de ventana propuesta cuando se utiliza en la Transformación Fourier Discreta.
El lector observador habrá notado la diferencia en las ubicaciones de cero entre el espectro de las ventanas de suma -de - s eno s y la suma-de-cosenos. Como es aparente en las figuras, para las últimas ventanas, la mayoría o todos los ceros ocurren en múltiplos enteros de L/, mientras que para las ventanas de suma-de-senos, los ceros yacen a la mitad entre el entero Lf. En lo sucesivo, esta característica deberá iluminarse con respecto a analizar el espectro de señales armónicas enmarcadas que utilizan DFT.
Como se observó con anterioridad, la transformación Fourier ( FT ) de un intervalo de señal s(t) ponderado por w(t) es equivalente a la convolución de las FTs individuales de s(t) y w(t) . Las FTs de la ventana seno wi(t) y la ventana Hann w2(t) se dan por y sen(Tr/) W2(f ) = 2TT (1-/5) (26) respectivamente, (ver, por ejemplo, referencia [3] ) . Por lo tanto, W1(f)=0 para /=n+ 0.5, | n | >_1 , y 2(/)=0 para /=n, | n | >_2 , siendo n un entero. Las FTs de las ventanas de mayor orden y optimizadas de la Tabla 1 difieren de (25) y (26) , pero el término trigonométrico respectivo en el numerador (eos () para las ventanas de suma-de-senos, sen ( ) para la de suma-decosenos) es común a todos. En el contexto de DFT, la implicación es que la máxima fuga espectral con una ventana de suma-de-cosenos coincide con la mínima fuga con una ventana de suma-de-senos y viceversa. Se da un ejemplo en la Figura 14 para la ventana de doble término propuesta (23) y la ventana de triple término de Nuttall (18) aplicadas en un DFT de 256 puntos .
En codificadores contemporáneos de audio o video, se divide una forma de onda de señal en segmentos y cada segmento se cuantifica en una representación más gruesa a fin de obtener una elevada compresión de datos, es decir, una baja velocidad de transmisión de bits requerida para almacenamiento o transmisión de la señal. En un intento por lograr una ganancia de codificación por medio de compactación de energía (o en otras palabras, para incrementar la calidad perceptual de la señal codificada para una velocidad de transmisión de bits dada), se han vuelto populares las transformaciones de banco de filtro (por ejemplo, transformaciones de MDCT 607) de los segmentos previo a la cuanti fi caci ón . Los sistemas más recientemente desarrollados aplican transformación de tiempo-respecto-a-frecuencia en la forma de transformación de coseno discreto modificado (MDCT), permitiendo un banco de filtro que los segmentos adyacentes se sobrepongan mientras se proporciona muestreo crítico.
Para mejor desempeño, las operaciones de MDCT de avance e inversas (por ejemplo, transformación de MDCT 607 y transformación de DCT inversa 608) se acompañan por ponderación de cada segmento: del lado codificador, se emplea un análisis de ventana (por ejemplo, se emplea una ventana wi (n) ) antes de la MDCT, y del lado decodif icador, se aplica una ventana de síntesis (por ejemplo, una ventana de síntesis wi (n) ) después de la MDCT inversa.
Desafortunadamente, no toda función de ponderación es adecuada para uso con la MDCT. Suponiendo funciones de ventana de análisis y síntesis, simétricas, idénticas, w(L-l-í) = el sistema entero puede producir solo la reconstrucción de entrada perfecta en ausencia de cuantificacion o transmisión de errores si w2{t)+w2{T +t) = 1 , t = 0, 1, ..., T-l, con T=L/2. Esta es la así llamada condición de complementar iedad de potencia (PC) o Princen-Badley reportada en [7] . Las ventanas de PC comunes son las ventanas de seno y KBD utilizadas en la norma AAC de MPEG-2/-4 (ver, por ejemplo, referencias [6] y [8]), dadas las primeras por así como también la ventana de la especificación de codi ficador-decodi ficador Vorbis (ver, por ejemplo, referencia [9] ) , Para investigar si la ecuación (19) puede usarse para crear ventanas de suma-desenos que satisfacen (28), observamos que, dado (27), wSeno(t) puede considerarse como el seno de una función triangular: De igual modo, wVOrt>is(t) puede escribirse como (32) con t(t) remplazado por La complementariedad de amplitud acerca de T=L/4 de (31) y (33) ( ' 0 31'), t( +t(G-?-?) = 1, t = 0, 1,..., L/4-1, (34) sugiere que las alternativas a estas funciones pueden diseñarse para optimizar la respuesta de frecuencia de la función de ventana sin sacrificar la propiedad de PC. De hecho, confirmando (27), es una extensión de (31) conforme a (34), que emplea una modificación de la función de súmade-senos de (19) ; se omite el término de señal alterna y en lugar de múltiplos impares de p, se consideran múltiplos pares. Los experimentos informales ejecutados por el presente autor indican que, aunque PC se obtiene incluso con dk produciendo id(t)<0 para alguna t, solo las ejecuciones con xd ( t ) no negativo para toda t producirían selectividad de banda de paso y rechazo de banda de detención, simultáneamente.
Además, en la sección titulada "Evaluación y Optimización" los coeficientes c de (19) se seleccionaron de tal manera que el máximo nivel de lóbulo lateral de la ventana resultante se minimiza. Puede seguirse aquí un procedimiento similar. Sin embargo, respecto a la condicionante de PC de (28), son más limitadas las posibilidades de diseño espectral, especialmente con respecto a los primeros dos o tres lóbulos laterales. En general, ¡ uno debe especificar un limite de menor frecuencia L/o>1.5 (o alternativamente, un lóbulo lateral de inicio) por encima del cual puede reducirse el máximo lóbulo lateral en una cantidad razonable. Para dar un ejemplo, una búsqueda exhaustiva informal con L/0=4.5 produce formación de parámetros de doble término dl=0.12241, d2=0.00523, (36) que produce una ventana cuyos primeros tres lóbulos laterales por encima de L_f0 tienen todos un nivel de -66.8 dB . Los lóbulos laterales de mayor frecuencia se atenúan desde ese valor a una velocidad de -12 dB por octavo, tal como aquellos de las ventanas optimizadas (23) y (24) de las secciones previas. La respuesta de frecuencia de la función de ponderación construida usando (27), (32), (35) y (36) se muestra en la Figura 15 junto con aquellas de Wjeno (t) y wvorbis(t) . Claramente, se logra un incremento sustancial en rechazo de lóbulo lateral en la ventana propuesta en comparación con la ventana de seno. Debido a la condicionante (28), esta ventaja se encuentra a costo de un lóbulo principal ligeramente más amplio y un mayor primer lóbulo lateral. Una comparación con la ventana Vorbis muestra amplitudes casi idénticas de lóbulo principal y máxima de los dos primeros lóbulos laterales. Para 4.5<L/0< 11.5 , la ventana propuesta lleva a cabo wvorbis(t) en términos de atenuación de lóbulo lateral. Observe también que el espectro de ventana Vorbis disminuye a -18 dB por octavo y tiene su magnitud cero a (o cerca) de múltiplos enteros de Lf. Por lo tanto, su comportamiento espectral se asemeja al de la ventana de suma-de-cosenos. De hecho, puede considerarse PC equivalente a la ventana Hann. De igual modo, la ventana de PC propuesta parece ser una contraparte de las ventanas de suma-de-senos optimizadas de la sección titulada "Evaluación y optimización". Una investigación más concienzuda, que incluye una evaluación de desempeño en el contexto de codificación de audio, es un tema de futura investigación . 11. Implementación Alternativa Aunque se han descrito algunos aspectos en el contexto de un aparato, es claro que estos aspectos también representan una descripción del método correspondiente, donde un bloque o dispositivo corresponde a una etapa de método o una característica de una etapa del método. De manera análoga, los aspectos descritos en el contexto de una etapa del método también representan una descripción de un bloque o tema o característica correspondiente de un aparato correspondiente.
Algunas o todas las etapas del método pueden ejecutarse por (o usando) un aparato de hardware, como, por ejemplo, un microprocesador, una computadora programable o un circuito electrónico. En algunas modalidades, una o más de las etapas de método más importantes pueden ejecutarse por tal aparato .
La señal de medios codificada inventiva, que puede ser una señal de audio o video codificada, o secuencia de funciones de ventana, puede almacenarse en un medio de almacenamiento digital o puede transmitirse sobre un medio de transmisión tal como un medio de transmisión inalámbrico o un medio de transmisión conectado por cable tal como la Internet .
Dependiendo de ciertos requisitos de impl ementa el ón , las modalidades de la invención pueden implementarse en hardware o software. La implement ación puede llevarse a cabo usando un medio de almacenamiento digital, por ejemplo, una unidad de almacenamiento de disco, un DVD, un disco de Blu-Ray, un CD, una ROM, una PROM, una EPROM o una memoria de almacenamiento intermedio, que tenga señales de control electrónicamente legibles almacenadas en los mismos, que cooperen (o sean capaces de cooperar) con un sistema de computadora programable de tal manera que se lleve a cabo el método respectivo. Por consiguiente, el medio de almacenamiento digital puede ser legible por computadora.
Algunas modalidades de acuerdo con la invención comprenden un portador de datos que tiene señales de control electrónicamente legibles, que son capaces de cooperar con un sistema de computadora programable, de tal manera que uno de los métodos aquí descritos se lleva a cabo.
En general, las modalidades de la presente invención pueden implementar se como un producto de programa de computadora con un código programable, siendo operativo el código de programa para llevar a cabo uno de los métodos cuando el programa de computadora se ejecuta en una computadora. El código de programa, por ejemplo, puede almacenarse en un portador legible por máquina.
Otras modalidades comprenden un programa de computadora para llevar a cabo uno de los métodos descritos en la presente, almacenados en un portador legible por máquina.
En otras palabras, una modalidad del método inventivo es, por consiguiente, un programa de computadora que tiene un código de programa para llevar a cabo uno de los métodos descritos en la presente, cuando el programa de computadora se ejecuta en una computadora.
Una modalidad adicional de los métodos inventivos, por consiguiente es, un portador de datos (o un medio de almacenamiento digital, o un medio legible por computadora) que comprende, registrado en el mismo, el programa de computadora para llevar a cabo uno de los métodos descritos en la presente. El portador de datos, el medio de almacenamiento digital o el medio registrado son típicamente tangibles y/o no transitorios.
Una modalidad adicional del método inventivo es, por consiguiente, una corriente de datos o una secuencia de señales que representan el programa de computadora para llevar a cabo uno de los métodos descritos en la presente. La corriente de datos o la secuencia de señales pueden configurarse, por ejemplo, para transferirse a través de una conexión de comunicación de datos, por ejemplo, a través de la Internet.
Una modalidad adicional comprende un medio de procesamiento, por ejemplo, una computadora, o un dispositivo lógico programable, configurado o adaptado para llevar a cabo uno de los métodos descritos en la presente .
Una modalidad adicional comprende una computadora que tiene instalado en la misma el programa de computadora para llevar a cabo uno de los métodos descritos en la presente.
Una modalidad adicional de acuerdo con la invención comprende un aparato o un sistema configurado para transferir (por ejemplo, de manera electrónica u óptica) un programa de computadora; para llevar a cabo uno de los métodos descritos en la presente en un receptor. El receptor puede ser, por ejemplo, una computadora, un dispositivo móvil, un dispositivo de memoria o lo similar. El aparato o sistema puede comprender, por ejemplo, un servidor de archivo para transferir el programa de computadora al receptor.
En algunas modalidades, puede utilizarse un dispositivo de lógica programable (por ejemplo, una instalación de compuerta programable por campo) para llevar a cabo algunas de las funcionalidades de los métodos descritos en la presente. En algunas modalidades, una instalación de compuerta programable por campo puede cooperar con un microprocesador con objeto de llevar a cabo uno de los métodos descritos en la presente. En general, los métodos se llevan a cabo preferentemente por un aparato de hardware.
Las modalidades anteriores son meramente ilustrativas de los principios de la presente invención. Se entiende que para otros expertos en la materia serán aparentes modificaciones y variaciones de los arreglos y los detalles descritos en la presente. Por consiguiente, se intenta limitarse solo por el alcance de las reivindicaciones de patente inminentes y no por los detalles específicos presentados a manera de descripción y explicación de las modalidades en la presente. 12. Conclusiones A partir de lo anterior puede concluirse que un cálculo de la función de ventana según se explica con relación a las ecuaciones (6), (8) y (9) produce una función de ventana que tiene características particularmente buenas.
Además, puede concluirse que un cálculo de las funciones de ventana según se explica con relación a la ecuación (19) produce una función de ventana que tiene buenas características .
Para resumir lo anterior, las modalidades de acuerdo con la presente invención se refieren en general a métodos de análisis y procesamiento de señal tal como aquellos que pueden utilizarse en sistemas de codificación de audio o video. Algunas modalidades de acuerdo con la invención se refieren a aplicaciones que requieren de compactación de energía de señal por medio de transformación de banco de filtro variante que se adapta a la señal o invariante, de la fuente. Pueden utilizarse para mejorar el desempeño de compactación de energía mientras se permite una perfecta inversión de dicha transformación. Las modalidades de acuerdo con la presente invención constituyen, por consiguiente, una solución a la necesidad de una función de ventana alternativa que tenga una complejidad computacional moderada, pero que proporcione una buena flexibilidad de diseño.
Algunas modalidades de acuerdo con la presente invención, según se definen por las reivindicaciones anexas o esta descripción, se dirigen a la falta de funciones de ventana, flexibles y computacionalmente eficientes, para aplicaciones de MDCT al declarar una extensión a la función de seno de la ecuación (4) .
Sin embargo, otras modalidades de acuerdo con la invención crean funciones de ventana mejoradas, que proporcionan una flexibilidad incrementada, pero no proporcionan la posibilidad de una reconstrucción perfecta en aplicaciones de MDCT. No obstante, tales funciones de ventana son útiles en muchas aplicaciones .
También debe señalarse que con objeto de facilitar el entendimiento de la presente invención, la invención se ha descrito por medio de ejemplos ilustrativos, que no limitan el alcance o espíritu de la invención con relación a los dibujos acompañantes. En otras palabras, las modalidades descritas en la presente son meramente ilustrativas de los principios de la presente invención para una formación de ventana más flexible y/o compactación de energía de señal mejorada en aplicaciones de filtro. Se entiende que serán aparentes a aquellos expertos en la materia variaciones y modificaciones de los arreglos y los detalles descritos en la presente. Por consiguiente, se intenta limitarse solo por el alcance de las reivindicaciones de patente inminentes y no por los detalles particulares descritos a manera de descripción y explicación de las modalidades en la presente.
Hablando en general, la formación de ventana de señales discretas ¡ mediante ponderación temporal es una herramienta esencial para el análisis espectral en el procesamiento para reducir efectos de desviación. Muchas funciones populares de ponderación (por ejemplo, Hann, Hamming, Blackman) se basan en una suma de cosenos a escala .
Las modalidades de acuerdo con la invención presentan una clase alternativa de ventanas, construidas usando sumas de senos y exhibiendo comportamiento espectral modificado (o incluso único) con respecto a la ubicación de cero y una atenuación de lóbulo lateral de al menos -12 dB/octavo debido a continuidad garantizada de la ponderación. Se proporcionan parámetros para las realizaciones de doble y de triple término con nivel de lóbulo lateral de pico mínimo. Algunas modalidades de acuerdo con la invención se refieren al uso de las ventanas de suma-de-senos con la Transformación Fourier Discreta y su adopción a transformaciones superpuestas tales como la Transformación de Coseno, Discreta, Modificada (MDCT) .
En otras palabras, las modalidades de acuerdo con a invención proponen alternativas a las funciones de ventana convencionales (por ejemplo, Hann, Hamming y Blackman), igualmente fáciles de calcular y con desempeños similares o incluso únicos en términos de reducción de fuga .
Hablando muy en general, las modalidades de acuerdo con la invención crean un aparato, un método o un programa de computadora para codificar o decodificar o procesar una señal de audio o de video usando funciones de ventana variables.
Algunas modalidades de acuerdo con la invención crean un aparato, un método o un programa de computadora para calcular una secuencia de funciones de ventana diferentes para una señal de audio o una señal de video.
Las modalidades adicionales de acuerdo con la invención crean una señal de audio o de video codificada que comprende contenido codificado de audio o video e información de parámetros de ventana con relación a ventanas variables, usadas para codificar una señal de audio o video a fin de obtener la señal codificada de audio o video.
Modalidades adicionales de acuerdo con la invención crean una secuencia de funciones de ventana variables que se determinan en una manera que se adapta a la señal.
Modalidades adicionales de acuerdo con la invención crean el aparato, métodos, programas de computadora, señales codificadas y secuencias de funciones de ventana variables en base a los cuales se deriva una ventana (wnueVa) ) = («+1/2)·2/ = sen(p/2·f)), « = 0, 1, ..., M2-1, donde c(n) denota la función de núcleo de ventana que puede calcularse por adelantado ya que se predetermina. La extensión propuesta se agrega a c(n) en la ecuación (7) sinusoides ponderados que tienen frecuencias angulares que son múltiplos enteros de 2p: c'(rí) » ) + sen (2ir/c(»)), = 1, 2, * >(n) -sen(ji/2r'(«)), n = 0, 1, .... NI2-\ .
Para concluir también, se han presentado alternativas matemáticamente simples a las ventanas de Hamming, Blackman y similares, generadas mediante el uso de sumas de senos ponderados. El enfoque de suma-desenos produce propiedades únicas tales como continuidad garantizada de la función de ventana y también puede aplicarse en la construcción de ventanas complementarias de potencia para codificar, por ejemplo, audio.
Referencias [1] R.B. Blackman y J.W. Tukey. The Measurement of Power Spectra from the Point of View of Communications Engineering, Nueva York, Y , EUA: Dover Publicat ions , 1958. [2] F.J. Harris, "On the Use of Windows for Harmonic Analysis with the Discrete Fourier Transform", Proc. IEEE, vol . 66, no. 1, pp . 51-83, Enero 1978. [3] N.C. Geckinli and D. Yavuz, "Soine Novel Windows and a Concise Tutorial Comparison of Window Families", IEEE Trans. Acoustics, Speech and Signal Processing, vol. ASSP-26, no. 6, pp. 501-507, Diciembre 1978. [4] A.H. Nuttall, "Some Windows with Very Good Sidelobe Behavior", IEEE Trans. Acoustics, Speech and Signal Processing, vol. ASSP-29, no. 1, p . 84-91, Febrero 1981. [5] S.W.A. Bergen and A. Antoniou, "Design of Ult raspherical Window Functions with Prescribed Spectral Characteristics", EURASIP Journal on Applied Signal Processing, vol . 2004 , no. 13, pp . 2053-2065, 2004. Disponible en linea en ht tp : / /www . hindawi . com/ Ge tArt i ele . aspx?doi = 10.1 155/S1110865704403114. [6] J.O. Smith III, Spectral Audio Signal Processing, Marzo 2009 Draft, Center for Computer Research in Music and Acoustics ( CCRMA ) , Stanford University, CA, EUA . Disponible en línea en ht tp : / /cerma . stanford.edu/~jos/sasp/ (accesado Marzo 2010 ) . [7] J.P. Princen, A.W. Johnson y A.B. Bradley, " Subband/Trans form Coding Using Filter Bank Designs Based on Time Domain Aliasing Cancellation" , Proc. IEEE 1987 ICASSP-12, pp . 2161-2164, Mayo 1987. [8] ISO/IEC 14496-3:2009, "Information technology - Coding of audio-visual objeets Part 3: Audio", Geneva, Agosto 2009. [9] Xiph.org Foundation, "Vorbis I specif icat ion" , Feb. 2010. En línea en http://www.xiph.org/vorbis/doc/Vorbis I spec.ht mi .

Claims (5)

REIVINDICACIONES
1. Un procesador de señal para proporcionar una versión procesada de una señal de entrada en dependencia de la señal de entrada, caracterizado porque el procesador de señal comprende: un proveedor de ventana configurado para enmarcar una porción de la señal de entrada o de una versión pre -proce sada de la misma, en dependencia de una ventana de procesamiento de señal descrita por valores de ventana de procesamiento de señal (wc(t) ) para una pluralidad de valores índice de valor de ventana (t) , con objeto de obtener la versión procesada de la señal de entrada; y un proveedor de ventana para proporcionar los valores de ventana de procesamiento de señal (wc(t) ) para una pluralidad de valores índice de valor de ventana (t) en dependencia de uno o más parámetros de forma de ventana (ck), en donde el proveedor de ventana se configura para calcular una suma ponderada de valores de función de una pluralidad de funciones de configuración de tipo seno, que representan valores índice de valor de ventana (t) sobre valores de función correspondientes, a fin de obtener los valores de ventana de procesamiento de señal (wc(t)), en donde una ponderación de los valores de función se determina por los parámetros de forma de ventana (Ck) ; en donde el proveedor de ventana se configura para proporcionar los valores de ventana de procesamiento de señal wc(t) para una pluralidad de valores índice de valor de ventana t de acuerdo con en donde K=l; y en donde ck' son valores de parámetro de ventana determinados por los parámetros de forma de ventana.
2. Un procesador de señal para proporcionar una versión procesada de una señal de entrada en dependencia de la señal de entrada, caracterizado porque el procesador de señal comprende : un proveedor de ventana configurado para enmarcar una porción de la señal de entrada, o una versión pre-procesada de la misma, en dependencia de una ventana de procesamiento de señal descrita por valores de ventana de procesamiento de señal (wc(t) ) para una pluralidad de valores Índice de valor de ventana (t), con objeto de obtener la versión procesada de la señal de entrada, en donde los valores de ventana de procesamiento de señal son valores de -resultado de una suma ponderada de valores de función de una pluralidad de funciones de configuración de tipo seno que representan los valores índice de valor de ventana sobre valores de función correspondientes; en donde los valores de ventana de procesamiento de señal wc ( t ) se definen de acuerdo con en donde t toma valores entre 0 y L/2 para una inclinación de ventana y en donde K=l .
3. Un método para proporcionar una versión procesada de una señal de entrada en dependencia de la señal de entrada, caracterizado el método porque comprende: enmarcado de una porción de la señal de entrada o de una versión pre-procesada de la misma, en dependencia de una ventana de procesamiento de señal descrita por valores de ventana de procesamiento de señal para una pluralidad de valores índice de valor de ventana, con objeto de obtener la versión procesada de la señal de entrada; y proporcionar los valores de ventana de procesamiento de señal para una pluralidad de valores índice de valor de ventana en dependencia de uno o más parámetros de forma de ventana, en donde se calcula una suma ponderada de valores de función de una pluralidad de funciones de configuración de tipo seno para obtener los valores de ventana de procesamiento de señal, en donde las funciones de configuración de tipo seno representan valores índice de valor de ventana sobre valores de función correspondientes, y en donde una ponderación de los valores de función se determina por los parámetros de forma de ventana; en donde los valores de ventana de procesamiento de señal wc ( t ) para una pluralidad de valores índice de valor de ventana t se proporcionan de acuerdo con en donde K=l; y en donde ck' son valores de parámetro de ventana determinados por los parámetros de forma de ventana.
4. Un método para proporcionar una versión procesada de una señal de entrada en dependencia de la señal de entrada, caracterizado porque comprende el método: enmarcado de una porción de la señal de entrada, o de una versión pre-procesada de la misma, en dependencia de una ventana de procesamiento de señal descrita por valores de ventana de procesamiento de señal para una pluralidad de valores índice de valor de ventana, con objeto de obtener la versión procesada de la señal de entrada, en donde los valores de ventana de procesamiento de señal son valores de resultado de una suma ponderada de valores de función de una pluralidad de funciones de configuración de tipo seno, que representan valores índice de valor de ventana sobre valores de función correspondientes; en donde los valores de ventana de procesamiento de señal wc(t) se definen de acuerdo con en donde t toma valores entre 0 y L/2 para una inclinación de ventana y en donde K=l.
5. Un programa de computadora para llevar a cabo los métodos según una de las reivindicaciones 3 a 4 cuando el programa computadora se ejecuta en una computadora.
MX2012010320A 2010-03-11 2011-03-08 Procesador de señal, proveedor de ventana, señal de medios codificada, metodo para procesar una señal y metodo para proporcionar una ventana. MX2012010320A (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US31277510P 2010-03-11 2010-03-11
EP10175142A EP2372704A1 (en) 2010-03-11 2010-09-02 Signal processor and method for processing a signal
PCT/EP2011/053484 WO2011110569A1 (en) 2010-03-11 2011-03-08 Signal processor and method for processing a signal

Publications (1)

Publication Number Publication Date
MX2012010320A true MX2012010320A (es) 2012-11-23

Family

ID=43827399

Family Applications (2)

Application Number Title Priority Date Filing Date
MX2012010440A MX2012010440A (es) 2010-03-11 2011-03-08 Procesador de señal, proveedor de ventana, señal de medios codificada, metodo para procesar una señal y metodo para proporcionar una ventana.
MX2012010320A MX2012010320A (es) 2010-03-11 2011-03-08 Procesador de señal, proveedor de ventana, señal de medios codificada, metodo para procesar una señal y metodo para proporcionar una ventana.

Family Applications Before (1)

Application Number Title Priority Date Filing Date
MX2012010440A MX2012010440A (es) 2010-03-11 2011-03-08 Procesador de señal, proveedor de ventana, señal de medios codificada, metodo para procesar una señal y metodo para proporcionar una ventana.

Country Status (14)

Country Link
US (2) US8907822B2 (es)
EP (5) EP2372704A1 (es)
JP (2) JP5706917B2 (es)
KR (2) KR101445292B1 (es)
CN (2) CN102893329B (es)
AU (2) AU2011226118B2 (es)
BR (2) BR112012022898B1 (es)
CA (2) CA2792454C (es)
ES (3) ES2526774T3 (es)
HK (2) HK1231625A1 (es)
MX (2) MX2012010440A (es)
PL (1) PL2545549T3 (es)
RU (2) RU2611986C2 (es)
WO (2) WO2011110569A1 (es)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8538042B2 (en) * 2009-08-11 2013-09-17 Dts Llc System for increasing perceived loudness of speakers
US9305031B2 (en) * 2013-04-17 2016-04-05 International Business Machines Corporation Exiting windowing early for stream computing
US8908796B1 (en) * 2013-05-15 2014-12-09 University Of South Florida Orthogonal frequency division multiplexing (OFDM) transmitter and receiver windowing for adjacent channel interference (ACI) suppression and rejection
KR101831286B1 (ko) * 2013-08-23 2018-02-22 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에.베. 엘리어싱 오류 신호를 사용하여 오디오 신호를 처리하기 위한 장치 및 방법
US9479272B2 (en) 2014-05-14 2016-10-25 Samsung Electronics Co., Ltd Method and apparatus for processing a transmission signal in communication system
WO2016063171A1 (en) * 2014-10-20 2016-04-28 Koninklijke Philips N.V. Cardiac reconstruction for photon counting ct for heart and lung images
TWI681384B (zh) * 2018-08-01 2020-01-01 瑞昱半導體股份有限公司 音訊處理方法與音訊等化器
CN110889083B (zh) * 2018-09-10 2020-12-22 湖南银杏可靠性技术研究所有限公司 基于窗谱估计的退化数据一致性检验法
JP7422905B1 (ja) 2022-08-02 2024-01-26 三菱電機株式会社 信号処理装置および信号処理方法

Family Cites Families (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5142656A (en) 1989-01-27 1992-08-25 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
US5109417A (en) 1989-01-27 1992-04-28 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
JP3465941B2 (ja) * 1993-01-07 2003-11-10 三菱電機株式会社 ピッチ抽出装置
US6487574B1 (en) * 1999-02-26 2002-11-26 Microsoft Corp. System and method for producing modulated complex lapped transforms
US6496795B1 (en) * 1999-05-05 2002-12-17 Microsoft Corporation Modulated complex lapped transform for integrated signal enhancement and coding
US6978236B1 (en) * 1999-10-01 2005-12-20 Coding Technologies Ab Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching
EP1340317A1 (en) * 2000-11-03 2003-09-03 Koninklijke Philips Electronics N.V. Parametric coding of audio signals
EP1386312B1 (en) * 2001-05-10 2008-02-20 Dolby Laboratories Licensing Corporation Improving transient performance of low bit rate audio coding systems by reducing pre-noise
FR2824978B1 (fr) * 2001-05-15 2003-09-19 Wavecom Sa Dispositif et procede de traitement d'un signal audio
US6963842B2 (en) * 2001-09-05 2005-11-08 Creative Technology Ltd. Efficient system and method for converting between different transform-domain signal representations
EP1394772A1 (en) 2002-08-28 2004-03-03 Deutsche Thomson-Brandt Gmbh Signaling of window switchings in a MPEG layer 3 audio data stream
CA2415105A1 (en) * 2002-12-24 2004-06-24 Voiceage Corporation A method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding
US20040162866A1 (en) * 2003-02-19 2004-08-19 Malvar Henrique S. System and method for producing fast modulated complex lapped transforms
JP2004361731A (ja) * 2003-06-05 2004-12-24 Nec Corp オーディオ復号装置及びオーディオ復号方法
JP3849679B2 (ja) * 2003-09-25 2006-11-22 ヤマハ株式会社 雑音除去方法、雑音除去装置およびプログラム
CN100573666C (zh) * 2003-11-26 2009-12-23 联发科技股份有限公司 子带分析/合成滤波方法
US6980933B2 (en) * 2004-01-27 2005-12-27 Dolby Laboratories Licensing Corporation Coding techniques using estimated spectral magnitude and phase derived from MDCT coefficients
US7088276B1 (en) * 2004-02-13 2006-08-08 Samplify Systems Llc Enhanced data converters using compression and decompression
KR20070001185A (ko) * 2004-03-17 2007-01-03 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 코딩
WO2005096273A1 (fr) * 2004-04-01 2005-10-13 Beijing Media Works Co., Ltd Ameliorations apportees a un procede et un dispositif de codage/decodage audio
WO2005096274A1 (fr) * 2004-04-01 2005-10-13 Beijing Media Works Co., Ltd Dispositif et procede de codage/decodage audio ameliores
JP2006243664A (ja) * 2005-03-07 2006-09-14 Nippon Telegr & Teleph Corp <Ntt> 信号分離装置、信号分離方法、信号分離プログラム及び記録媒体
US7720677B2 (en) 2005-11-03 2010-05-18 Coding Technologies Ab Time warped modified transform coding of audio signals
RU2315424C1 (ru) * 2006-06-06 2008-01-20 Виктор Васильевич Бондаренко Система связи с высокой скоростью передачи информации сверхширокополосными сигналами
US7987089B2 (en) * 2006-07-31 2011-07-26 Qualcomm Incorporated Systems and methods for modifying a zero pad region of a windowed frame of an audio signal
US8036903B2 (en) * 2006-10-18 2011-10-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Analysis filterbank, synthesis filterbank, encoder, de-coder, mixer and conferencing system
EP1918911A1 (en) * 2006-11-02 2008-05-07 RWTH Aachen University Time scale modification of an audio signal
US7522074B2 (en) * 2007-09-17 2009-04-21 Samplify Systems, Inc. Enhanced control for compression and decompression of sampled signals
WO2009049895A1 (en) * 2007-10-17 2009-04-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding using downmix
MY154452A (en) * 2008-07-11 2015-06-15 Fraunhofer Ges Forschung An apparatus and a method for decoding an encoded audio signal
JP4918074B2 (ja) * 2008-08-18 2012-04-18 日本電信電話株式会社 符号化装置、符号化方法、符号化プログラム、及び記録媒体

Also Published As

Publication number Publication date
EP3096317B1 (en) 2018-08-01
EP2545549B1 (en) 2014-10-01
RU2616863C2 (ru) 2017-04-18
CN102893329A (zh) 2013-01-23
HK1181179A1 (en) 2014-03-07
JP2013531264A (ja) 2013-08-01
WO2011110569A1 (en) 2011-09-15
JP5706917B2 (ja) 2015-04-22
AU2011226121A1 (en) 2012-10-25
CN102893328B (zh) 2014-12-10
JP5809645B2 (ja) 2015-11-11
RU2012143351A (ru) 2014-04-20
KR101445292B1 (ko) 2014-09-29
RU2611986C2 (ru) 2017-03-01
ES2526774T3 (es) 2015-01-15
EP2545550A1 (en) 2013-01-16
ES2691479T3 (es) 2018-11-27
US8907822B2 (en) 2014-12-09
BR112012022898B1 (pt) 2021-02-02
CA2792453A1 (en) 2011-09-15
JP2013522657A (ja) 2013-06-13
AU2011226121B2 (en) 2014-08-28
BR112012022898A2 (pt) 2018-09-18
EP2545550B1 (en) 2016-09-07
EP3096317A1 (en) 2016-11-23
CA2792453C (en) 2016-05-31
US20130246492A1 (en) 2013-09-19
US9252803B2 (en) 2016-02-02
KR20130007603A (ko) 2013-01-18
CN102893329B (zh) 2015-04-08
MX2012010440A (es) 2012-12-05
AU2011226118B2 (en) 2014-08-28
CA2792454A1 (en) 2011-09-15
AU2011226118A1 (en) 2012-10-25
EP2372704A1 (en) 2011-10-05
WO2011110572A1 (en) 2011-09-15
ES2601847T3 (es) 2017-02-16
KR20130007601A (ko) 2013-01-18
HK1231625A1 (zh) 2017-12-22
CN102893328A (zh) 2013-01-23
EP2372703A1 (en) 2011-10-05
KR101445290B1 (ko) 2014-09-29
RU2012143352A (ru) 2014-04-27
PL2545549T3 (pl) 2015-03-31
EP2545549A1 (en) 2013-01-16
CA2792454C (en) 2018-01-16
US20130241750A1 (en) 2013-09-19
BR112012022899A2 (pt) 2018-06-05

Similar Documents

Publication Publication Date Title
MX2012010320A (es) Procesador de señal, proveedor de ventana, señal de medios codificada, metodo para procesar una señal y metodo para proporcionar una ventana.
CN105210149B (zh) 用于音频信号解码或编码的时域电平调整
EP2492911B1 (en) Audio encoding apparatus, decoding apparatus, method, circuit and program
JP2016173597A (ja) 高周波オーディオ内容の効率的な復元のための方法およびシステム
AU2015226480B2 (en) Concept for encoding of information
US9373337B2 (en) Reconstruction of a high-frequency range in low-bitrate audio coding using predictive pattern analysis
JP2018532153A (ja) オーディオ変換コーディングにおけるオーバーラップ率の信号適応スイッチングのための符号化器、復号器および方法
Helmrich On the Use of Sums of Sines in the Design of Signal Windows

Legal Events

Date Code Title Description
HH Correction or change in general
FG Grant or registration