ES2526774T3 - Procesador de señal y procedimiento para procesar una señal - Google Patents

Procesador de señal y procedimiento para procesar una señal Download PDF

Info

Publication number
ES2526774T3
ES2526774T3 ES11707660.4T ES11707660T ES2526774T3 ES 2526774 T3 ES2526774 T3 ES 2526774T3 ES 11707660 T ES11707660 T ES 11707660T ES 2526774 T3 ES2526774 T3 ES 2526774T3
Authority
ES
Spain
Prior art keywords
window
values
signal
signal processing
input signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES11707660.4T
Other languages
English (en)
Inventor
Christian Helmrich
Ralf Geiger
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Application granted granted Critical
Publication of ES2526774T3 publication Critical patent/ES2526774T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/45Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of analysis window
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computational Mathematics (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Algebra (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Complex Calculations (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

Un procesador de señal (150) para proporcionar una versión procesada (112) de una señal de entrada (110) en dependencia de la señal de entrada, comprendiendo el procesador de señal comprende: un proveedor de ventana (120) configurado para enmarcar una porción de la señal de entrada (110) o de una versión pre-procesada de la misma (110'), en dependencia de una ventana de procesamiento de señal descrita por valores de ventana de procesamiento de señal (wc(t)) para una pluralidad de valores índice de valor de ventana (t), con objeto de obtener la versión procesada (112) de la señal de entrada; y un proveedor de ventana (180) para proporcionar los valores de ventana de procesamiento de señal (wc(t)) para una pluralidad de valores índice de valor de ventana (t) en dependencia de uno o más parámetros de forma de ventana (ck), en donde el proveedor de ventana (180) se configura para calcular una suma ponderada de valores de función de una pluralidad de funciones de configuración de tipo seno, que representan valores índice de valor de ventana (t) sobre valores de función correspondientes, a fin de obtener los valores de ventana de procesamiento de señal (wc(t)), en donde una ponderación de los valores de función se determina por los parámetros de forma de ventana (ck); en donde el proveedor de ventana se configura para proporcionar los valores de ventana de procesamiento de señal wc(t) para una pluralidad de valores índice de valor de ventana t de acuerdo con**Fórmula** en donde K>=1; en donde ck' son valores de parámetro de ventana determinados por los parámetros de forma de ventana; y en donde la señal de entrada es una señal de audio, una señal de habla, una señal de video o una señal de imagen.

Description

imagen1
DESCRIPCIÓN
Procesador de señal y procedimiento para procesar una señal
5 CAMPO TÉCNICO
[0001] Las modalidades de acuerdo con la invención se refieren a un procesador de señal para proporcionar una versión procesada de una señal de entrada dependiente de la señal de entrada y a un procedimiento para el procesamiento de una señal.
10 [0002] Una modalidad de acuerdo con la invención se refiere a un aparato para codificar o decodificar una señal de audio o de video usando funciones de ventana variables. Otra modalidad de acuerdo con la invención se refiere a un procedimiento para codificar o decodificar una señal de audio o de video usando funciones de ventana variables.
15 [0003] Las modalidades de acuerdo con la presente invención generalmente se refieren a un análisis de señal y procedimientos de procesamiento, tales como aquellos que pueden utilizarse en sistemas de codificación de audio o de video.
ANTECEDENTES DE LA INVENCIÓN
20 [0004] La filtración de respuesta de impulsos finitos (FIR) de señales discretas, particularmente en el contexto de bancos de filtro, se emplea ampliamente en análisis espectral, procesamiento, síntesis y compresión de datos de medios, entre otras aplicaciones. Es bien sabido que la finitud temporal (o espacial) de un filtro de FIR y por lo tanto la finitud del intervalo de señal que puede procesarse en un instante en el tiempo o espacio, puede conducir a un
25 fenómeno conocido como derivación o fuga. Cuando se modifica el intervalo filtrado, por ejemplo, al variar cambios de ganancia o cuantificación, puede ocurrir el bloqueo o resonancia de artefactos después de la inversión de la operación de filtración. Se ha encontrado que la causa de estos artefactos puede atribuirse a discontinuidades entre los puntos terminales de la forma de onda de señal del intervalo procesado (referido en lo sucesivo como segmento), así como también aquellos de sus diferenciales. Se ha encontrado que con objeto de reducir tales efectos indeseados de fuga, es
30 por lo tanto útil o incluso necesario el reducir las discontinuidades en el segmento y algunos de sus diferenciales. Esto puede lograrse al multiplicar cada muestra s(n), n=0, 1, …, N-1, del segmento de longitud-N con un cierto peso w(n) antes de la filtración y, en el caso de manipulación de señal en el dominio filtrado, también después de la filtración inversa, de tal manera que los puntos terminales del segmento y de sus diferenciales se gradúen a cero. Un enfoque equivalente es aplicar los pesos a cada filtro de base del banco de filtro (Ver, por ejemplo, referencia [2]). Ya que los
35 factores de ponderación se describen con frecuencia mediante una expresión analítica, un conjunto de factores es comúnmente conocido como una función de ponderación o función de ventana.
[0005] En sistemas típicos de codificación de audio y video, una forma de onda de origen se segmenta como arriba y cada segmento se cuantifica en una representación más gruesa a fin de llevar a cabo una elevada compresión de datos,
40 es decir, una baja velocidad de transmisión de bits necesaria para almacenar o transmitir la señal. En un intento por obtener ganancia de codificación por medio de compactación de energía en menos de N muestras (o, en otras palabras, por incrementar la calidad perceptual de la señal codificada para una velocidad de transmisión de bits dada), se han vuelto populares las transformaciones del banco de filtro de los segmentos previo a la cuantificación. Los sistemas recientemente desarrollados usan transformación ortogonal solapada de tiempo-respecto-a-frecuencia en la forma de la
45 transformación de coseno, discreta, modificada (MDCT), permitiendo un banco de filtro que los segmentos adyacentes se sobrepongan mientras permiten aún el muestreo crítico. Para un desempeño mejorado, las operaciones de MDCT, de avance e inversas, se combinan con la ponderación de cada segmento: en el lado central, se aplica una ventana de análisis wa(n) antes de la MDCT de avance y en el lado receptor, se aplica una ventana de síntesis ws(n) después de la MDCT inversa. Desafortunadamente, no todas las funciones de ponderación son adecuadas para utilizarse con la
50 MDCT. Suponiendo ventanas predeterminadas (no variantes en tiempo/espacio), se ha encontrado que con objeto de que la arquitectura completa produzca una perfecta reconstrucción de entrada en la ausencia de errores de
[0006] Si wa(n) y ws(n) son idénticas, es decir, wa(n)= ws(n)=w(n), la ecuación (1) se reduce a la condicionante mejor conocida
imagen2
imagen3
publicada en la referencia [7]. Para mejor compactación de energía, se adopta normalmente w(n) que es simétrica alrededor de n=N/2-1/2, es decir
imagen4
imagen5
En la norma de Codificación Avanzada de Audio (AAC) (referencia [8]), se encuentran disponibles dos funciones de ventana. Una es la ventana de seno, dada por
imagen6
la otra es una ventana derivada de Kaiser-Bessel (KBD) descrita en las patentes de Fielder y Davidson, titulada “Codificador, decodificador y codificador/decodificador de transformación de baja velocidad de transmisión de bits para audio de elevada calidad”, patentes de E.U. 5109417 y 5142656. La última ventana también se utiliza en la norma de codificación AC-3 (Dolby Digital) (ATSC, Inc., “Norma de Compresión de Audio Digital (AC-3, E-AC-3), Revisión B”, 10 documento A/52B, Junio 2005), regla no escrita en una configuración diferente (α=5). La especificación Vorbis
imagen7
[0007] La Fig. 5 muestra las respuestas de frecuencia de la AAC y funciones de ventana Vorbis, obtenidas a través de
15 transformación Fourier, de acuerdo con la referencia [4]. Puede observarse que la ventana de seno tiene una selectividad de frecuencia exacta relativamente elevada (lóbulo principal angosto) y rechazo de banda de detención relativamente bajo (atenuación de lóbulo lateral bajo). La ventana de KBD, por el contrario, tiene una elevada atenuación de banda de detención y baja selectividad de frecuencia exacta. La ventana Vorbis yace aproximadamente a la mitad entre las primeras dos ventanas.
20 [0008] Se ha encontrado que para ciertas aplicaciones, puede ser deseable ejercer un control más fino sobre la selectividad de banda de paso y el rechazo de la banda de detención de una ecuación (2) que satisface la función de ponderación. Más específicamente, se ha encontrado que para mejorar la eficiencia de codificación, puede ser necesario un parámetro de ventana a fin de adaptar continuamente las características de la ventana a aquellas del
25 espectro de entrada. De las tres funciones arriba discutidas, solo la función de KBD ofrece tal parámetro, α, que puede variar para lograr diferentes relaciones de selectividad/atenuación. Sin embargo, esta función incorpora matemática computacionalmente costosa (función Bessel, seno hiperbólico, raíz cuadrada y división), prohibiendo potencialmente su re-cálculo para cada segmento de señal en dispositivos de baja potencia o en sistemas de tiempo real. Lo mismo aplica a la clase de funciones de ventana presentadas en el artículo de Sinha y Ferreira, titulado “Una Nueva Clase de
30 Ventanas Complementarias de Potencia Uniforme y su Aplicación a Procesamiento de Señales de Audio”, AES 119 Convención, Octubre 2005, documento 6604, que requiere de operaciones de valor complejo, factorización espectral y transformación Fourier. También se ha encontrado que la interpolación entre dos funciones (por ejemplo, KBD y seno), más eficientemente por suma ponderada, puede utilizarse para controlar en cierto grado la respuesta de frecuencia, pero este enfoque ofrece solo flexibilidad limitada.
35 [0009] Una multitud de funciones de ventana, optimizadas hacia diferentes criterios, se ha documentado, por ejemplo, en referencias [1], [2], [3], [4], [5]. Podría decirse que tres de las funciones más populares en uso en la actualidad son las reportadas por von Hann, Hamming y Blackman.
40 [0010] En lo sucesivo, se describirán algunas funciones clásicas de ventana. En otras palabras, en lo sucesivo, las funciones de ventana antes mencionadas (por ejemplo, Hann, Hamming y Blackman) serán revisadas y se identificará la ecuación de diseño general subyacente.
[0011] Por razones de consistencia y comparación con investigaciones seminales de funciones de ventana, la
45 metodología y notación de Nuttall (ver, por ejemplo, referencia [4]) se adoptará en la presente discusión. En particular, permita que L denote la duración (longitud) de una realización de ventana, t la ubicación (tiempo) dentro de la ponderación, y f la frecuencia dentro del espectro de densidad de potencia de la ventana, obtenidos por transformación Fourier de la función de ventana. Adicionalmente, todas las funciones de ventana se normalizarán hasta una amplitud pico de uno. Ya que solo se estudiarán aquí las ventanas campaniformes, simétricas (preferentemente de longitud
50 uniforme), esto implica que w(L/2)=1. La primer función de ponderación a considerarse se conoce como la función de
55
la función de Hann es un caso especial de una clase de funciones seno con exponentiación: imagen8
60
imagen9
[0012] En la práctica, los enteros positivos se asignan típicamente a a. Observe que (12) también puede ser escrito como la suma de un desplazamiento y un coseno a escala:
imagen10
[0013] Esta formulación permite una optimización de espectro en particular de la ventana de Hann (ver la discusión a continuación con respecto a evaluación y optimización) mediante cambio del desplazamiento y el factor de escala. El
imagen11
imagen12
[0014] Según se señala por Nuttall (ver, por ejemplo, referencia [4]), las ventanas de Hann y de Hamming son 15 realizaciones a doble término de una clase de funciones de término-(K+1) que deberán ser referidas como las funciones
para uso en aplicaciones de DSP. Esto iguala a la ecuación 11 de la referencia [4] con 1/L escalar omitido. También son comunes las implementaciones de triple término. Un caso simple es (15) con K=2 y factores
25
lo cual es equivalente a (12) con a=4. De manera similar al enfoque de Hamming, Blackman, (ver, por ejemplo, referencia [1]) derivó la siguiente bk optimizada:
imagen13
35 espectro cercana al campo (primeros lóbulos laterales, ver la discusión a continuación con respecto a evaluación y optimización):
imagen14
[0016] El lector interesado se invita a revisar la referencia [4] para otras ventanas optimizadas de suma de cosenos de triple y de cuarto término.
45 [0017] En vista de la discusión anterior, lo que se necesita es una función de ventana alternativa que tenga una complejidad computacional moderada, pero que proporcione una buena flexibilidad de diseño.
[0018] De acuerdo con lo anterior, un objeto de la presente invención es crear un concepto para procesar las señales, que permita obtener una función de ventana con complejidad computacional moderada y buena flexibilidad de diseño.
BREVE DESCRIPCIÓN DE LA INVENCIÓN
[0019] Una modalidad de acuerdo con la invención crea un procesador de señal para proporcionar una versión procesada de una señal de entrada dependiente de la señal de entrada según la reivindicación 1. Esta modalidad de
55 acuerdo con la invención se basa en el hallazgo de que pueden obtenerse formas de ventana que tienen características suficientemente buenas para muchas aplicaciones, con buena eficiencia computacional y la flexibilidad para ajustar las características de ventana, usando los parámetros en forma de ventana y la regla de cálculo descrita.
[0020] Otra modalidad de acuerdo con la invención se refiere a un procesador de señal para proporcionar una versión procesada de una señal de entrada dependiente de la señal de entrada según la reivindicación 2. Esta modalidad de acuerdo con la invención se basa en las mismas ideas que la modalidad previamente descrita.
[0021] Otras modalidades de acuerdo se refieren a procedimientos según las reivindicaciones 3 y 4 y a un programa de ordenador según la reivindicación 5.
65 BREVE DESCRIPCIÓN DE LAS FIGURAS
imagen15
[0022] Las modalidades de acuerdo con la invención se describirán posteriormente haciendo referencia a las figuras 1a a 16 anexas en las cuales:
5 Fig. 1a muestra un diagrama de bloque esquemático de un procesador de señal, de acuerdo con una modalidad de la invención;
Fig. 1b muestra un diagrama de bloque esquemático de un procesador de señal, de acuerdo con otra modalidad de la invención;
Fig. 2 muestra un diagrama de bloque esquemático de un procesador de señal, de acuerdo con otra modalidad de la invención;
Fig. 3 muestra un diagrama de bloque esquemático de un proveedor de ventana, de acuerdo con una modalidad de 15 la invención;
Fig. 4 muestra una representación esquemática de una señal de medios codificada, de acuerdo con una modalidad de la invención;
Fig. 5 muestra una representación gráfica de respuestas de magnitud de frecuencia de las ventanas de Vorbis y AAC a una escala de ordenadas dB;
Fig. 6 muestra una representación gráfica de las amplitudes de la función de ventana de KBD de AAC y una cierta instancia de la función inventiva;
25 Fig. 7 muestra una representación gráfica de la respuesta de magnitud de frecuencia de dicha instancia de la función de ventana inventiva en comparación con la de la ventana de KBD de AAC sobre una abscisa lineal y escala de ordenada de dB;
Fig. 8 muestra una representación gráfica de la respuesta de magnitud de frecuencia de dicha instancia de la función de ventana inventiva en comparación con la de la ventana de KBD de AAC sobre una abscisa logarítmica y escala de ordenada dB;
Fig. 9 muestra una representación gráfica de las respuestas de magnitud de frecuencia de otras dos instancias de la
35 función de ventana inventiva en comparación con aquellas de la KBD de AAC y las ventanas de Sinha-Ferreira de tercer orden;
Figs. 10a y 10b muestran, en un diagrama de bloque, el proceso de adaptación de señal para las funciones de ventana, inventivas y similares;
Fig. 11 muestra una representación gráfica de espectros de algunas funciones de seno con exponentiación de acuerdo con la ecuación (12);
Fig. 12 muestra una representación gráfica de espectros de funciones optimizadas de suma de cosenos de acuerdo 45 con la ecuación (15);
Fig. 13 muestra una representación gráfica de las ventanas optimizadas de suma de senos, propuestas, de acuerdo con la ecuación (19);
Fig. 14 muestra una representación gráfica de espectros DFT de dos sinusoides con frecuencias de Lf=32 y 96.5, después de aplicar diferentes funciones de ventana; y
Fig. 15 muestra una representación gráfica de espectros de dos ventanas de PC y ventana propuesta.
55 Fig. 16 muestra una representación esquemática de una ventana.
DESCRIPCIÓN DETALLADA DE LAS MODALIDADES
1. Procesador de Señal de Acuerdo con la Fig. 1a
[0023] La Fig. 1a muestra un diagrama de bloque esquemático de un procesador de señal 100 de acuerdo con un primer ejemplo. El procesador de señal 100 se configura para recibir una señal de entrada 110 y proporcionar, en base a lo mismo, una versión procesada 112 de la señal de entrada. El procesador de señal 100 comprende un proveedor de ventana 120 configurado para enmarcar una porción de la señal de entrada 110, o una versión pre-procesada 110’ de la 65 misma (la cual puede obtenerse mediante un pre-procesamiento opcional 111), dependiente de una ventana de procesamiento de señal descrito por los valores de ventana de procesamiento de señal 122 para una pluralidad de
imagen16
valores índice de valor de ventana n, con objeto de obtener la versión procesada 112 de la señal de entrada (o una versión 112’ de la señal de entrada que experimenta post-procesamiento adicional en un post-procesador opcional 130).
[0024] Para este propósito, el proveedor de ventana 120 recibe los valores de ventana de procesamiento de señal w(n)
5 a partir de un proveedor de ventana 130, el cual también es típicamente parte del procesador de señal 100. El proveedor de ventana 130 se configura para proporcionar los valores de ventana de procesamiento de señal w(n) para una pluralidad de valores índice de valor de ventana n dependientes de uno o más parámetros de forma de ventana
132. El proveedor de ventana se configura para evaluar una función seno para una pluralidad de valores de argumento c’(n) asociados con los valores índice de valor de ventana n, a fin de obtener los valores de ventana de procesamiento de señal w(n). El proveedor de ventana 130 también se configura para calcular una suma ponderada de un término lineal, por ejemplo, designado con c(n), el cual linealmente dependiente del valor índice de valor de ventana n, y valores de función de una o más funciones de configuración. La una o más funciones de configuración representan valores índice de valor de ventana n sobre valores de función correspondientes. La una o más funciones de configuración son simétricas por puntos con respecto a un centro de una inclinación de ventana. Un cálculo de la suma ponderada se
15 lleva a cabo para obtener los valores de argumento c’(n).
[0025] De acuerdo con lo anterior, el proveedor de ventana 130 proporciona valores de ventana de procesamiento de señal w(n) que describen ventanas que tienen características particularmente buenas. La aplicación de una evaluación de función seno en el proveedor de ventana, con objeto de obtener el valor de ventana de procesamiento de señal w(n), permite obtener ventanas que tienen buenas características de conservación de energía para el caso en que se sobreponen dos inclinaciones de ventana correspondientes. Además, al usar valores de argumento c’(n) para la evaluación de la función seno que no son una función lineal de los valores índice del valor de ventana (también designados brevemente como “valores índice”), sino más bien una superposición de un término lineal, que es linealmente dependiente de los valores índice y los valores de función de una o más funciones de configuración que no
25 son lineales y son simétricas por puntos con respecto a un centro de una inclinación de ventana, es posible ajustar una forma de la ventana de procesamiento de señal descrita por los valores de ventana de procesamiento de señal w(n).
[0026] Por ejemplo, es posible ajustar las contribuciones de las una o más funciones de configuración sobre los valores de argumento c’(n), de tal manera que puedan obtenerse diferentes evoluciones de los valores de argumento (como una función del valor de índice n) dependiendo del uno o más parámetros de forma de ventana 132. De acuerdo con lo anterior, las características de la ventana de procesamiento de señal descritas por los valores de ventana de procesamiento de señal pueden ajustarse a las necesidades particulares dependientes del uno o más parámetros de forma de ventana 132. Además, se ha encontrado que la selección de una o más funciones de configuración, que son simétricas por puntos con respecto a un centro de una inclinación de ventana, ayuda a asegurar buena conservación de
35 energía y características de compactación de la ventana de procesamiento de señal y también proporciona una oportunidad de reducir un esfuerzo computacional para calcular los valores de argumento.
[0027] Los detalles con respecto al cálculo de los valores de ventana de procesamiento de señal wnew(n), el cual puede tomar el lugar de los valores de ventana de procesamiento de señal w(n), se describirán a continuación.
2. Procesador de Señal de Acuerdo con la Fig. 1b
[0028] La Fig. 1b muestra un diagrama de bloque esquemático de un procesador de señal 150, el cual es similar al procesador de señal 100. De acuerdo con lo anterior, se designan medios y señales idénticos con números de
45 referencia idénticos. Sin embargo, el procesador de señal 150 comprende un proveedor de ventana 180, el cual es diferente del proveedor de ventana 130. El proveedor de ventana 180 recibe uno o más parámetros de forma ck’ 182 y proporciona, en base a los mismos, valores de ventana de procesamiento de señal w(t), que se designan, por ejemplo, con wc(t). Debe observarse aquí que la variable t es un valor índice de valor de ventana y también se designa brevemente como “valor índice”.
[0029] El proveedor de ventana 180 se configura para proporcionar los valores de ventana de procesamiento de señal w(t) para una pluralidad de valores índice de valor de ventana dependientes de uno o más parámetros de forma de ventana ck. El proveedor de ventana 180 se configura para calcular una suma ponderada de valores de función de una pluralidad de funciones de configuración de tipo seno, a fin de obtener los valores de ventana de procesamiento de
55 señal w(t). La ponderación de los valores de función se determina por los parámetros de forma de ventana ck.
[0030] Al proporcionar los valores de ventana de procesamiento de señal que utilizan el proveedor de ventana 180, pueden proporcionarse los valores de ventana de procesamiento de señal de tal manera que comprendan características suficientemente buenas en muchos casos. También es posible ajustar las características específicas usando el uno o más parámetros de forma de ventana ck, de tal manera que puedan obtenerse diferentes ventanas de procesamiento de señal para una opción diferente de uno o más parámetros de forma de ventana.
[0031] Al usar funciones de configuración de tipo seno y formar una suma ponderada de los valores de función de dichas funciones de ponderación de tipo seno, se obtienen las ventanas que tienen buenas características, según se
65 discutirá con mayor detalle a continuación.
imagen17
[0032] Además, debe observarse que se discutirán a continuación los detalles con respecto al cálculo de los valores de ventana de procesamiento de señal w(t), los cuales se proporcionan por el proveedor de ventana 180.
3. Procesador de Señal de Acuerdo con la Fig. 2
5 [0033] La Fig. 2 muestra un diagrama de bloque esquemático de un procesador de señal 200, de acuerdo con una modalidad de la invención. El procesador de señal 200 se configura para recibir una señal de entrada 210 y para proporcionar, en base a lo mismo, una versión procesada 212 de la señal de entrada.
[0034] El procesador de señal 200 comprende un proveedor de ventana 220 configurado para enmarcar una porción de la señal de entrada 210, o de una versión pre-procesada 210 de la misma, dependiente de una ventana de procesamiento de señal descrita por valores de ventana de procesamiento de señal para una pluralidad de valores índice de valor de ventana (designados brevemente como “valores índice”), con objeto de obtener la versión procesada 212 de la señal de entrada. El procesador de señal 200 puede comprender un pre-procesamiento opcional 211 y un
15 post-procesamiento opcional 213.
[0035] Los valores de ventana de procesamiento de señal son valores de resultado de una evaluación de función seno para una pluralidad de valores de argumento asociados con valores índice de valor de ventana, en donde los valores de argumento son sumas ponderadas de un término lineal, que es linealmente dependiente de los valores índice de valores de ventana y valores de función de una o más funciones de configuración de tipo seno, cuyas una o más funciones de configuración de tipo seno representan valores índice de valor de ventana sobre valores de función correspondientes. La una o más funciones de configuración de tipo seno son simétricas por puntos con respecto a un centro de una inclinación de ventana.
25 [0036] El proveedor de ventana 220 puede llevar a cabo, en consecuencia, una formación de ventana que es muy similar a la formación de ventana llevada a cabo por el proveedor de ventana 120. Por ejemplo, los valores de ventana de procesamiento de señal usados por el proveedor de ventana 220 pueden ser idénticos a los valores de ventana de procesamiento de señal usados por el proveedor de ventana 120. Los valores de ventana de procesamiento de señal usados por el proveedor de ventana 220 pueden almacenarse, por ejemplo, en una tabla de búsqueda o pueden obtenerse de otro modo.
[0037] En modalidades alternativas, pueden utilizarse los valores de ventana de procesamiento de señal. En una modalidad alternativa, los valores de ventana de procesamiento de señal son valores de resultado de una suma ponderada de valores de función de una pluralidad de funciones de configuración de tipo seno, que representan valores
35 índice de valor de ventana sobre valores de función correspondientes.
[0038] Para concluir, el proveedor de ventana 220 puede configurarse, por ejemplo, para aplicar una ventana descrita por valores de ventana de procesamiento de señal wnew(n) a la señal de entrada 210, o a la versión pre-procesada 211’ de la misma. Sin embargo, de manera alternativa, el proveedor de ventana 220 puede aplicar los valores de procesamiento de señal wc(t) a la señal de entrada 210 o a la versión pre-procesada 210’ de la misma.
[0039] Podrían describirse a continuación los detalles con respecto a las ventanas de procesamiento de señal aplicadas por el proveedor de ventana 220.
45 4. Proveedor de Ventana de Acuerdo con la Fig. 3
[0040] La Fig. 3 muestra un diagrama de bloque esquemático de un proveedor de ventana 300 de acuerdo con una modalidad de la invención. El proveedor de ventana 300 se configura para recibir uno o más parámetros de forma de ventana 310, que son típicamente valores variables, y para proporcionar, en base a lo mismo, un conjunto de valores de ventana de procesamiento de señal w(n) 312 para una pluralidad de valores índice de valor de ventana. El proveedor de ventana 300 se configura para evaluar una función seno para una pluralidad de valores de argumento asociados con los valores índice de valor de ventana, a fin de obtener los valores de ventana de procesamiento de señal w(n). El proveedor de ventana también se configura para calcular una suma ponderada de un término lineal, algunas veces designado con c(n), el cual es linealmente dependiente de los valores índice de valor de ventana n y valores de función
55 de una o más funciones de configuración. La una o más funciones de configuración representan valores índice de valor de ventana n sobre valores de función correspondientes. La una o más funciones de configuración son simétricas por puntos con respecto a un centro de una inclinación de ventana.
[0041] De acuerdo con lo anterior, el proveedor de ventana 300 cumple esencialmente la funcionalidad del proveedor de ventana 130. Sin embargo, debe observarse que el proveedor de ventana 300 puede ser un componente que es independiente del proveedor de ventana 130. Sin embargo, de manera alternativa, el proveedor de ventana 300 puede cumplir la funcionalidad del proveedor de ventana 180.
5. Señal de Medios Codificada de Acuerdo con la Fig. 4
65 [0042] En lo sucesivo, se describirá una señal de medios codificada. En la Fig. 4 se muestra una representación esquemática de tal señal de medios codificada. La señal de medios codificada 400 comprende una representación codificada de un contenido de medios y parámetros de forma de ventana. Los parámetros de forma de ventana se adaptan, por ejemplo, para servir como el uno o más parámetros de forma de ventana 132 para el proveedor de ventana 130 o para servir como el uno o más parámetros de ventana 132 para el proveedor de ventana 180. De acuerdo con lo
imagen18
5 anterior, los parámetros de forma de ventana en la señal de medios codificada 400 se seleccionan para producir valores de ventana de procesamiento de señal w(n) o w(t) usando el proveedor de ventana 130 o el proveedor de ventana 180. También, la representación codificada del contenido de medios se codifica utilizando típicamente una formación de ventana de acuerdo con una ventana descrita por los parámetros de forma de ventana.
6. Detalles con Respecto a las Ventanas Proporcionadas por el Proveedor de Ventana 130 o Usadas por el Proveedor de Ventana 220
6.1 Aspectos Generales y Definiciones
15 [0043] En lo sucesivo, se describirán algunos detalles con respecto a las ventanas proporcionadas por el proveedor de ventana 130, cuyas ventanas también pueden utilizarse por el proveedor de ventana 220. Debe observarse aquí que las ventanas se definen mediante valores de ventana de procesamiento de señal w(n). Dichos valores de ventana de procesamiento de señal w(n) se multiplican típicamente con la señal de entrada 110, o la versión pre-procesada 110’ de la misma, a fin de obtener una versión enmarcada de la señal de entrada, o de la versión pre-procesada 110’ de la misma. Una ventana se describe típicamente por los valores de ventana de procesamiento de señal w(n), en donde n es un valor índice (por ejemplo, un valor índice de tiempo) que designa los valores de ventana del procesador de señal.
[0044] Además, debe observarse que una ventana típicamente comprende una inclinación de ventana de lado izquierdo y una inclinación de ventana de lado derecho. Una ventana puede comprender además opcionalmente una porción
25 central constante (o aproximadamente constante), de tal manera que un número de valores de ventana de procesamiento de señal central toman un valor predeterminado. Sin embargo, debe observarse que una inclinación de ventana de lado izquierdo y una inclinación de ventana de lado derecho de una ventana pueden ser diferentes. De acuerdo con lo anterior, debe señalarse que la siguiente discusión describe substancialmente una forma de una sola inclinación de ventana, es decir, de una transición entre un pequeño valor de ventana (por ejemplo, un valor de ventana cero) y un valor de ventana grande (por ejemplo, un valor de ventana máximo de uno).
[0045] Tomando como referencia ahora la Fig. 16, que muestra una representación gráfica de la Fig. 16, una abscisa 1610 describe el valor índice n, y una ordenada 1612 describe los valores de ventana de procesamiento de señal w(n) asociados con los valores índice n. Como puede observarse, la ventana 1600 comprende una porción de ventana de 35 lado izquierdo 1620 y una porción de ventana de lado derecho 1622. La porción de ventana de lado izquierdo comprende, como un elemento clave, una inclinación de ventana de lado izquierdo 1630. La inclinación de ventana de lado izquierdo 1630 se define, por ejemplo, por una pluralidad de valores de ventana de procesamiento de señal w(n) para n=n1 hasta n=n2. La porción de ventana de lado izquierdo 1620 puede comprender también, opcionalmente, una porción externa de lado izquierdo, para la cual los valores de ventana de procesamiento de señal w(n) toman un valor pequeño de, por ejemplo, w(n)=0. La porción de ventana de lado izquierdo opcionalmente comprende también una parte de una porción de ventana central, para la cual los valores de ventana de procesamiento de señal w(n) toman un valor pre-determinado de, por ejemplo, w(n)=1. La ventana 1600 comprende una porción de ventana de lado derecho 1622, que comprende, como un elemento clave, una inclinación de ventana de lado derecho 1640. La porción de ventana de lado derecho puede comprender opcionalmente una parte de una porción de ventana central, para la cual
45 los valores de ventana de procesamiento de señal toman un valor predeterminado de, por ejemplo, w(n)=1. La porción de ventana de lado derecho también puede comprender, opcionalmente, una porción externo de lado derecho, para lo cual los valores de ventana de procesamiento de señal w(n) toman un valor pequeño de, por ejemplo, w(n)=0.
[0046] Debe observarse que la porción externa de lado izquierdo, la porción de ventana central y la porción de ventana externa de lado derecho deben considerarse como opcionales. También debe observarse que la ventana 1600 puede ser simétrica o asimétrica. Por lo tanto, la inclinación de ventana de lado izquierdo 1630 y la inclinación de ventana de lado derecho 1640 pueden ser iguales o pueden ser significativamente diferentes en algunas modalidades.
[0047] Debe observarse aquí que la siguiente discusión se refiere substancialmente a la inclinación de ventana de lado
55 izquierdo 1630, es decir, a una transición entre valores de ventana pequeño o cero y un valor de ventana grande o máximo. Sin embargo, debe observarse que una ventana general 1600 puede obtenerse del conocimiento de la inclinación de ventana de lado izquierdo 1630 al agregar opcionalmente una porción externa de lado izquierdo y al agregar opcionalmente una porción de ventana central y al agregar una inclinación de ventana de lado derecho y al agregar opcionalmente una porción externa de lado derecho. Debe observarse también que la inclinación de ventana de lado derecho 1640 puede obtenerse del mismo modo que una inclinación de ventana de lado izquierdo usando un simple proceso de reflejo, tal como el de la ecuación (3).
[0048] También debe observarse que de acuerdo con la siguiente discusión, la inclinación de ventana de lado izquierdo debe describirse por valores w(n) para n=0 hasta n=N/2-1. Sin embargo, un uso de los diferentes valores índice es
65 naturalmente posible.
imagen19
imagen20
6.2 Detalles de la Ventana wnew(n)
[0049] Las modalidades de acuerdo a la invención se dirigen a la falta de funciones de ventana computacionalmente eficientes y flexibles para aplicaciones de MDCT al declarar una extensión hacia las funciones de ventana de seno de la ecuación (4).
[0050] Observe que la ecuación (4) puede considerarse como el seno de una función de ventana triangular simétrica aproximadamente a n=N/2-1/2. Dada la ecuación (3), esto implica
donde c(n) denota la función de núcleo de ventana, que puede calcularse por adelantado ya que se encuentra predeterminada. La extensión propuesta es agregar a c(n) en la ecuación (7) sinusoides ponderados que tienen 15 frecuencias angulares que son múltiplos enteros de 2π:
imagen21
[0051] Los términos seno en c’(n) también pueden calcularse por adelantado. Solo su ponderación, según se especifica por los factores, necesita adaptarse. Por lo tanto, cuando se ajusta la ventana propuesta a una señal sobre una base de transformación-por-transformación, solo la ecuación (9) y la ponderación en la ecuación (8) tienen que re-calcularse, haciendo la adaptación computacionalmente menos compleja que la de las ventanas de Sinha-Ferreira y KBD.
25 [0052] Además, es importante mencionar que, debido a los términos seno en las ecuaciones (8) y (9), cada realización de la clase propuesta de funciones de ventana se atenúa completamente hasta cero en sus puntos terminales, lo cual asegura una atenuación de nivel de lóbulo lateral de al menos 12 dB por octavo en la respuesta de frecuencia de la ventana. Este no es el caso con la ventana de KBD y las ventanas publicadas en el artículo de Princen y Bradley, “Diseño de Banco de Filtro de Análisis/Síntesis En Base A Cancelación de Solapamiento de Dominio de Tiempo”, IEEE Trans. Acoustics, Speech and Signal Processing, Octubre 1986, págs. 1153-1161 y en el artículo de Ferreira, “EfectosConvolucionales en Codificación de Transformación con TDAC: Una Ventana Óptima”, IEEE Trans. Speech and Audio Processing, Marzo 1996, págs. 104-114, cuyos lóbulos laterales de frecuencia alejada se atenúan por consiguiente hasta menos de 12 dB por octavo. Para amplitudes de lóbulo principal iguales, esto representa que una ventana de acuerdo con las ecuaciones (8) y (9) potencialmente mejora las ventanas de la técnica anterior en términos de
35 atenuación de lóbulo lateral de frecuencia alejada.
[0053] El cálculo o adaptación de una ventana de acuerdo con la presente invención comprende las siguientes etapas:
-Seleccionar el número de términos seno en c’(n) y los factores de ponderación adecuados en base a consideraciones de diseño.
-Determinar o definir la longitud de ventana N y calcular c’(n) con la af seleccionada y el número de términos seno.
45 -Calcular wnueva(n) de la ecuación (9) para n=0, 1, …, N/2-1, empleando entonces la ecuación (3) para obtener una instancia de ventana de longitud-N.
-Si se utiliza un cálculo de parámetros de ventana diferente para el segmento adyacente, precedente, satisfacer cualquier condicionante de inversión perfecta ya sea mediante corrección de la mitad derecha de la instancia de ventana precedente o mediante corrección de la mitad izquierda de la instancia de ventana actual, o mediante corrección de ambas mitades, derecha de la instancia precedente e izquierda de la instancia actual.
[0054] En una modalidad preferida, la función de ventana es comparable con las ventanas de seno y Vorbis con respecto a complejidad computacional, pero proporciona al menos la flexibilidad de diseño de la ventana de KBD y
55 Sinha-Ferreira.
[0055] Con respecto a lo anterior, debe observarse que los valores de c’(n) pueden considerarse como valores de argumento asociados con los valores índice de valor de ventana n. También debe observarse que las funciones sen(2π×f×c(n)) pueden considerarse como funciones de configuración.
[0056] También debe observarse que no es necesario utilizar funciones seno como las funciones de configuración. Más bien, puede ser suficiente seleccionar las funciones de configuración de tal manera que las funciones de configuración sean simétricas por puntos con respecto a un centro de una inclinación de ventana. El centro de la inclinación de ventana se define, por ejemplo, por un valor del término lineal c(n)=0.5. Por ejemplo, las funciones polinominales 65 simétricas por puntos pueden utilizarse en lugar de las funciones seno, lo cual puede facilitar la evaluación en algunos casos. También, las funciones de configuración deben tomar preferentemente un valor que sea lo suficientemente
imagen22
cercano a cero para c(n)=0 y c(n)=1, es decir, en un ambiente de un valor índice de ventana en el extremo izquierdo de la inclinación de ventana y en un ambiente del valor índice de valor de ventana en el extremo derecho de la inclinación de ventana. En otras palabras, las funciones de configuración deben tener ceros, o deben tomar aproximadamente valores de cero, en los ambientes (o inmediaciones) del valor índice de valor de ventana en el extremo izquierdo (por
5 ejemplo, n=0) y el valor índice de valor de ventana en el extremo derecho (por ejemplo, n=N/2-1).
[0057] Además, debe observarse que las ecuaciones (6) y (7) pueden evaluarse, por ejemplo, mediante el cálculo de valor de argumento del proveedor de ventana 130 y que la ecuación (9) puede evaluarse mediante la evaluación de función seno del proveedor de ventana 130. De acuerdo con lo anterior, los valores wnueva(n) obtenidos por la evaluación de la función seno del proveedor de ventana 130 para n=0 hasta n=N/2-1 pueden describir, por ejemplo, una inclinación de ventana de lado izquierdo 1630.
[0058] El proveedor de ventana 130 puede configurarse, en consecuencia, para ensamblar una ventana entera 1610 en base a dichos valores de ventana de procesamiento de señal, asociados con una inclinación de ventana de lado
15 izquierdo. Para este propósito, el proveedor de ventana puede agregar una porción externa de lado izquierdo, una porción de ventana central, una inclinación de ventana de lado derecho y una porción externa de lado derecho, como se muestra en la Fig. 16. La inclinación de ventana de lado derecho puede obtenerse mediante elaboración de un reflejo de la inclinación de ventana de lado izquierdo para el caso de una ventana simétrica. Sin embargo, de manera alternativa, la inclinación de ventana de lado derecho puede ser diferente de la inclinación de ventana de lado izquierdo y puede obtenerse mediante elaboración de un reflejo de una inclinación de ventana, obtenido para parámetros de forma de ventana diferentes a los de la inclinación de ventana de lado izquierdo.
[0059] También debe observarse que puede asegurarse por el procesador de señal que una inclinación de transición de lado derecho, asociada con una porción precedente de la señal de entrada y una inclinación de transición de lado
25 izquierdo, asociada con una porción posterior de la señal de entrada, se igualan ya que se satisfacen las condicionantes de inversión perfecta. Para este propósito, puede asegurarse que la inclinación de ventana de lado izquierdo asociada con la porción posterior de la señal de entrada se obtenga utilizando los mismos parámetros que se han aplicado a la obtención de la inclinación de ventana de lado derecho, asociada con la porción precedente de la señal de entrada.
[0060] Además, debe observarse que el algoritmo definido por las ecuaciones (6), (8) y (9) es muy adecuado a un cálculo en línea de las funciones de ventana en un aparato que tiene potencia computacional limitada.
[0061] No obstante, las ventanas según se definen por las ecuaciones (6), (8) y (9) pueden evaluarse una vez y los resultados de lo mismo pueden almacenarse en una tabla de búsqueda para uso posterior en algunas modalidades.
35
6.3 Comentarios Sobre El Diseño de Ventana
[0062] En lo sucesivo, se discutirán algunas condiciones que dan como resultado ventanas que tienen características particularmente buenas. No obstante, debe observarse que la obediencia de las condiciones discutidas en lo sucesivo no debe considerarse esencial.
[0063] Como se mencionó en la discusión de la sección de Antecedentes, los codificadores de señal que emplean la MDCT necesitan imponer ciertas condiciones sobre la función de ventana aplicada a la señal con objeto de permitir que el sistema entero sea completamente invertible, es decir, ofrecen reconstrucción de entrada perfecta, cuando no se
45 llevan a cabo manipulaciones de señal. Las funciones conforme a la ecuación (2), también conocidas como funciones complementarias de potencia, representan una categoría adecuada.
[0064] Todas las realizaciones de la presente clase de ventana pertenecen a esta categoría. Sin embargo, puede
imagen23
producen selectividad de banda de paso particularmente buena y rechazo de banda de detención de manera simultánea. Por consiguiente, la siguiente discusión se enfocará en este sub-conjunto de la clase de ventana. En algunos casos, solo las realizaciones con c’(n) no negativo para toda n desplegada producen selectividad de banda de
55 paso satisfactoria y rechazo de banda de detención de manera simultánea.
[0065] Aunque en general es posible usar un número arbitrario de términos seno en la ecuación (8) para designar respuestas de frecuencia de ventana ancladas al caso de uso dado, se descubrió que dos términos seno (f=1, 2) proporcionan una relación adecuada entre flexibilidad, complejidad y uso de memoria. En particular, al usar dos términos seno, pueden derivarse parámetros que
-reducen la amplitud del lóbulo principal, es decir, maximizan la selectividad de frecuencia exacta, -reducen el nivel máximo de lóbulo lateral por encima de una cierta frecuencia normalizada, -maximizan la velocidad de atenuación del lóbulo lateral, es decir, la atenuación de banda de detención
65 de frecuencia alejada, -minimizan la diferencia máxima en una instancia de ventana de referencia existente de una instancia de ventana. Cada una de estas consideraciones de diseño se examinará a continuación con la ayuda de ejemplos específicos.
imagen24
6.3.1 Ventanas Con Máxima Selectividad de Banda de Paso
5 [0066] Aunque la condición de complementariedad de potencia de la ecuación (2) limita el rango de respuestas de frecuencia que pueden lograrse, especialmente con respecto a la amplitud y nivel de unos cuantos primeros lóbulos laterales, la función de ventana que conduce al lóbulo principal más angosto puede obtenerse mediante establecimiento de todos los factores af en c’(n) en cero. La ventana resultante, como es fácilmente aparente, iguala la ventana seno de AAC de la ecuación (4). Su espectro se ilustra en la Fig. 5 junto con aquellos de las ventanas de Vorbis y KBD(α=4).
[0067] Sin embargo, en resumen, debe observarse que preferentemente al menos uno de los parámetros de forma de ventana af debe fijarse en valor diferente de cero. No obstante, la estructura arriba descrita del proveedor de ventana 113 da la flexibilidad para obtener incluso la ventana de seno AAC sin señal específica alguna al determinar meramente
15 los parámetros de forma de ventana af.
6.3.2 Ventanas Con Máximo Lóbulo Lateral Mínimo
[0068] Las configuraciones de la ecuación (9) que minimizan el máximo nivel de lóbulo lateral pueden adquirirse mediante optimización conjunta de los parámetros af, ya sea mediante procedimientos de búsqueda exhaustivos o en base a gradientes. Sin embargo, respecto a la ecuación (2), es recomendable definir un límite de frecuencia inferior Nω0>1.5 por encima del cual se lleva a cabo la optimización minimax. Se encontró que un valor de Nω0=4.5 produce los parámetros α1=0.1224 y α2=0.00523. La función de ventana así configurada se muestra en la Fig. 6. La similitud con la función de ventana de KBD de AAC, que también se ilustra, es evidente. Los espectros de ventana correspondientes se
25 muestran en la Fig. 7. Es importante observar que el nivel inferior de los primeros dos lóbulos laterales de la ventana inventiva cuando se comparan con la ventana de KBD, así como también la reducción en el nivel de lóbulo lateral máximo por encima de Nω0≈5 (los primeros tres lóbulos laterales de la ventana propuesta por encima de esta frecuencia tienen un nivel de -66.8 dB, mientras que la ventana de KBD alcanza un nivel algo superior de -63.0 dB).
[0069] Debido al uso de términos seno en c’(n), cada realización de la presente clase de ventana es continua y por lo tanto garantiza una atenuación uniforme hasta cero en sus puntos terminales. Esta ventaja se ilustra en la Fig. 8. Como puede observarse, los lóbulos laterales de la ventana previamente derivada caen a una velocidad de 12 dB por octavo. En contraste, la ventana de KBD exhibe una menor velocidad de caída, siendo la razón ligeras discontinuidades en los puntos terminales de la función de ponderación de la función de ponderación de KBD. Como resultado, la
35 ventana propuesta logra mayor rechazo que la ventana de KBD por encima de Nω≈250 aún cuando se mejora por lo último entre Nω≈250 y Nω≈7. En algunas aplicaciones de análisis o síntesis, esta característica puede ser benéfica.
6.3.3 Ventanas Con Máxima Atenuación de Lóbulo Lateral
[0070] En ciertos casos, podría ser deseable utilizar ventanas cuyos lóbulos laterales se atenúan a velocidades mayores de 12 dB por octavo. La presente invención permite la construcción de, por ejemplo, una ventana que disminuye a 24 dB por octavo. Esto se logra al requerir un primer diferencial continuo de la función de ponderación, es decir, un diferencial de anulación en los límites de la instancia de ventana. La solución más intuitiva a este problema es la configuración α1=0.1591, α2=0. La respuesta de ventana resultante se ilustra en la Fig. 9 junto con otras tres respuestas
45 que se discuten en lo sucesivo.
6.3.4 Ventanas Que Se Aproximan A Ventanas de Referencia
[0071] Para completar esta demostración de la flexibilidad de la clase de ventana propuesta, se hace un intento por crear dos realizaciones de ventana que semejan exactamente dos ventanas existentes. Debido a su diversidad, las funciones de KBD (α=4) y de Sinha-Ferreira de tercer orden se seleccionan como referencias. La reconstrucción a través de c’(n) y la ecuación (9) se enfoca en un sentido de mínimos cuadrados, es decir, mediante reducción de la diferencia cuadrada entre referencia y aproximación (observe que también son posibles otros procedimientos). La Fig. 9 muestra el resultado. Puede observarse que las ventanas inventivas son casi idénticas a sus contrapartes de la técnica
55 anterior y que las principales diferencias ocurren solo a niveles muy bajos. En ambientes críticos de complejidad o de memoria, las ventanas de referencia podrían sustituirse, por consiguiente, por un dispositivo que use la presente clase de ventana mientras mantiene un alto grado de compatibilidad de fondo y, si es aplicable, la posibilidad de reconstrucción casi-perfecta.
7. Implementación de un Sistema Adaptable a la Señal
[0072] Una ventaja adicional de la clase de ventana presentada surge cuando un sistema procesa segmentos de señal de diferentes longitudes, relacionándose las longitudes por potencias enteras de 2. En AAC, por ejemplo, este procedimiento, que también se conoce como conmutación de bloque, se realiza mediante la aplicación de la MDCT ya 65 sea una vez en 2048 (1920) u 8 veces en 256 (240) muestras por estructura. Aquí, los sub-conjuntos de los términos
imagen25
individuales en la ecuación (8), por ejemplo, n = 0, 1, …, N/8-1, pueden re-utilizarse como funciones de núcleo para las ventanas de menor longitud o, en caso de los términos seno, incluso como funciones de ventana en sí. Si una flexibilidad de diseño reducido para las ventanas de baja longitud es aceptable, esto puede explotarse para reducir aún más la capacidad de memoria requerida para almacenar las funciones de núcleo.
5
8. Aplicaciones Adicionales de la Invención
[0073] Las funciones de ventana complementaria de potencia tales como las reportadas en la presente pueden ser bastante atractivas para varios escenarios de aplicación diferentes de codificación de audio o video. Como se observó en el documento citado en el párrafo 6 de la sección de Antecedentes, las ventanas complementarias de potencia pueden emplearse en sistemas de conmutación o desvanecimiento cruzado de preservación de energía instantánea, así como también dispositivos de análisis y procesamiento de señal que operan en una base de bloque-por-bloque con sobreposición entre bloques sucesivos. Hablando de manera más general, cualquier aparato que lleva a cabo labores de filtración sobre una señal de una o más dimensiones, puede usar ventanas del presente informe en la construcción
15 de su núcleo(s) de filtración, incluyendo, pero sin limitarse,
-filtros de paso elevado (diferenciación), paso bajo (integración) y paso de banda, -prototipo descendente (filtros de decimación) y prototipo ascendente (filtros de interpolación), -ecualizadores de múltiple banda o de banda individual, compresores, expansores y limitadores, -algoritmos para reducción de ruido y mejora relacionada o herramientas de efectos.
[0074] Al adoptar en tales sistemas la función de ventana inventiva aquí presentada y anclando sus características espectrales a requisitos de aplicación, preferentemente en una forma que se adapte a un segmento de señal, se espera que puedan lograrse incrementos en el desempeño perceptual.
25
9. Codificador de Señal de Medios y Decodificador de Señal de Medios de Acuerdo con las Figs. 10a y 10b
[0075] Las Figs. 10a y 10b muestran un diagrama de bloque esquemático de un codificador de señal de medios y de un decodificador de señal de medios. El codificador de señal de medios 1010 se configura para recibir una o más señales de canal s1(n) a sM(n) y para proporcionar, en base a lo mismo, una representación codificada. La representación codificada de las señales de medios de entrada puede tomar la forma de coeficientes de MDCT S1(k) a SM(k), o puede ser una representación codificada de tales coeficientes de MDCT. El codificador de señal 1010 comprende, por ejemplo, una pluralidad de trayectorias de señal idénticas 1012a-1012m, que pueden operar de manera independiente o que pueden acoplarse. Además, el codificador de señal 1010 también comprende un cálculo de parámetro de codificación
35 602, el cual determina uno o más de los parámetros de codificación como, por ejemplo, una longitud de bloque, un parámetro de configuración de ruido temporal (TNS), un parámetro de compensación de ganancia de sub-banda, una información de configuración y/o una información de modelo psicoacústico. En lo sucesivo, se discutirá una trayectoria o ramificación 1012a, pero la discusión anterior también es aplicable a ramificaciones adicionales como, por ejemplo, la ramificación 1012m.
[0076] La ramificación 1012a comprende una detección de ventana 603, que recibe la señal de entrada s1(n) del canal respectivo e información proveniente del determinador de parámetro de codificación 602. La detección de ventana 603 puede proporcionar, por ejemplo, una información de forma de ventana 603a, que describe una forma de una ventana deseada.
45 [0077] La información de forma de ventana puede determinarse, por ejemplo, a partir de la entrada al detector de ventana 603 de tal manera que se optimice o mejore el desempeño objetivo (ganancia de codificación, selectividad de frecuencia o compactación de energía, compresión de datos, cantidad de solapamiento introducida) o desempeño subjetivo (calidad perceptual de la salida codificada después de la transmisión y codificación libre de errores o errónea) del codificador 1010.
[0078] La ramificación 1012a también comprende una sincronización de ventana 604, que debiera considerarse como opcional y que puede combinar la información de forma de ventana proporcionada por la detección de ventana 603 de la presente ramificación 1012a con la información de forma de ventana provista por detectores de ventana de diferentes 55 ramificaciones. De acuerdo con lo anterior, una información de forma de ventana sincronizada 604a puede proporcionarse opcionalmente por la sincronización de ventana 604. La trayectoria de señal 1012a también comprende una aplicación de reconstrucción perfecta 605, que se configura para recibir la información de forma de ventana 603a, o la información de forma de ventana sincronizada 604a, y a fin de proporcionar, en base a lo mismo, una información de forma de ventana adaptada 605a. Por ejemplo, la aplicación de reconstrucción perfecta 605 puede asegurar que una inclinación de transición de lado derecho (también designada como inclinación de ventana) de una ventana asociada con una porción previa de la señal de entrada, sea una versión reflejada de una inclinación de ventana de una ventana asociada con una porción posterior de la señal de entrada. Por ejemplo, puede asegurarse que las inclinaciones de ventana de las ventanas asociadas con las porciones posteriores de una señal de entrada se definan por parámetros de forma de ventana idénticos. La trayectoria de señal 1012a también comprende un cálculo de ventana 606 que se 65 configura para proporcionar valores de ventana de procesamiento de señal w1(n) a un proveedor de ventana 1014. El proveedor de ventana 1014 se configura para multiplicar muestras de la señal de entrada s1(n) con los valores de
imagen26
ventana de procesamiento de señal correspondientes w1(n), a fin de obtener valores de señal enmarcados s1’(n), que se introducen en un transformador de coseno, discreto, modificado 607, para obtener los coeficientes de MDCT S1(k).
[0079] Debe observarse aquí que el calculador de ventana 606 puede tomar el control de la funcionalidad del proveedor
5 de ventana 130 o del proveedor de ventana 180, de tal manera que los valores de ventana de procesamiento de señal w1(n) sean equivalentes a los valores de ventana de procesamiento de señal w(n) o a los valores de ventana de procesamiento de señal w(t). También, el proveedor de ventana 1014 puede tomar la funcionalidad del proveedor de ventana 120.
[0080] De acuerdo con lo anterior, el codificador 1010 se configura para aplicar una pluralidad de diferentes ventanas para la formación de ventana de la señal de entrada s1(n) dependiente de los parámetros de forma de ventana adaptados 605a, en donde el cálculo de ventana 606 proporciona valores de ventana de procesamiento de señal.
[0081] El codificador 1010 puede comprender opcionalmente etapas adicionales de codificación para codificar 15 eficientemente los valores espectrales S1(k) a SM(k) provistos por la transformación de MDCT 607.
[0082] El decodificador de señal 1020 se configura para recibir valores espectrales decodificados Q1(k) a QM(k). Los valores espectrales decodificados Q1(k) a QM(k) pueden extraerse de una corriente de bits, que puede proporcionarse por el codificador 1010 mediante codificación de los valores espectrales S1(k) a SM(k). En otras palabras, los coeficientes espectrales Q1(k) a QM(k) pueden ser idénticos, excepto por errores de cuantificación, a los valores espectrales S1(k) a SM(k). Aquí, k es un índice de frecuencia y M>1 designa un número de canales (en donde se proporciona una ramificación por canal).
[0083] El decodificador 1020 también se configura para recibir valores de longitud de ventana N1 a NM (que toman la
25 función de la variable N como se describe arriba) y uno o más parámetros de forma de ventana a1 a aM (por ejemplo, uno por ramificación o canal). El decodificador 1020 comprende un transformador-de-coseno-discreto-modificado inverso 608 que se configura para recibir los coeficientes espectrales Q1(k) a QM(k) y para proporcionar, en base a lo mismo, señales inversamente transformadas q1(n) a qM(n). El decodificador 1020 también comprende una selección de ventana 609, que opera en combinación con una aplicación de reconstrucción perfecta 605 para derivar parámetros de forma de ventana adaptados 605a a partir de los parámetros de forma de ventana de entrada a1 a aM, en donde los parámetros de forma de ventana de entrada a1 a aM pueden extraerse o derivarse de una corriente de bits que representa un contenido de medios. Por ejemplo, tanto los parámetros de forma de ventana de entrada a1 a aM como también los valores espectrales Q1(k) a QM(k) pueden representarse en la señal de medios codificada.
35 [0084] El decodificador 1020 comprende además un cálculo de ventana 606, que recibe el parámetro de forma de ventana adaptada 605a (o, alternativamente, los parámetros de forma de ventana de entrada a1 a aM) y proporciona, en base a lo mismo, los valores de ventana de procesamiento de señal w1(n) a wM(n). El cálculo de ventana 606 puede llevar a cabo la funcionalidad del proveedor de ventana 130 o del proveedor de ventana 180, en donde los parámetros de forma de ventana adaptada 605a pueden corresponder al uno o más parámetros de forma de ventana 132 o al uno o más parámetros de forma de ventana 182. De manera similar, los valores de ventana de procesamiento de señal w1(n) a wM(n) pueden ser equivalentes a los valores de ventana de procesamiento de señal w(n) o a los valores de ventana de procesamiento de señal w(t).
[0085] De acuerdo con lo anterior, el cálculo de ventana 606 puede proporcionar ventanas de diferentes formas de
45 acuerdo con los parámetros de forma de ventana adaptada 605a o los parámetros de forma de ventana de entrada a1 a aM.
[0086] El valor de ventana de procesamiento de señal w1(n) a wM(n) provisto por el cálculo de ventana 606 del decodificador 1020 puede aplicarse, por ejemplo, por una operación de multiplicación 1024, a las señales inversamente transformadas q1(n) a qM(n) proporcionadas por la transformación de coseno-discreto-modificado-inverso 608 a fin de obtener una versión enmarcada q1’(n) a qM’(n) de los valores q1(n) a qM(n).
[0087] El decodificador 1020 comprende además una sobreposición-y-adición 610, la cual se configura para recibir porciones de ventana posteriores q1’(n) a qM’(n) de las señales inversamente transformadas q1(n) a qM(n) y
55 sobreponerlas-y-agregarlas a dichas porciones posteriores, a fin de obtener señales reconstruidas y1(n) a yM(n). La sobreposición-y-adición 610 se coordina preferentemente con la formación de ventana 1024 de tal manera que las porciones de señal enmarcadas q1’(n) a qM’(n) se sobreponen por la sobreposición-y-adición 610 se enmarcan con ventanas “complementarias”, de tal manera que una inclinación de ventana de lado derecho de una primer ventana se sobreponga a la inclinación enmarcada de lado izquierdo de una ventana posterior, en donde las inclinaciones de ventana de sobreposición comprenden la conservación de energía y/o las características de reconstrucción perfecta arriba discutidas.
[0088] Por lo tanto, el codificador 1010 y el decodificador 1020 son capaces de codificar y decodificar señales de medios como, por ejemplo, señales de audio, señales de voz, señales de video, señales de imagen, etc.
65 [0089] Para concluir, las modalidades anteriores de acuerdo con las presentes invenciones pueden implementarse en software y tanto en microcircuitos de hardware como también en procesadores de señal digital (DSPs) para diversas clases de sistemas y almacenamiento análogo o digital o transmisión de señales.
imagen27
[0090] Para resumir, las Figs. 10a y 10b ilustran la manera en que puede utilizarse la técnica de formación de ventana
5 propuesta en un codificador-decodificador de audio como AAC que se adapta a la señal o un tipo diferente de codificador de señal o decodificador de señal. Las funciones de núcleo de ventana 601 para la construcción de c’(n) se almacenan en la memoria junto con una definición de configuraciones de parámetros disponibles. Estos datos se comparten por codificador y decodificador. El codificador, mostrado en la Fig. 10a), de referencia numérica 1010, segmenta para cada estructura los M canales de entrada, y para cada uno de los segmentos M s(n), datos de un modelo psicoacústico espectro-temporal 602 se analizan en un detector de ventana y selector 603 para determinar una forma de ventana adecuada y si es aplicable, longitud y número. Se selecciona una ventana adecuada en base a criterios tales como selectividad de frecuencia (cálculo de energía) o baja sobreposición de estructura (reducción de solapamiento cuando se utiliza TNS o compensación de ganancia de sub-banda (SB)).
15 [0091] En otras palabras, el codificador 1010 (o cualquier otro procesador de señal) puede configurarse para determinar, variar o ajustar uno o más de los parámetros de forma de ventana af en una forma que se adapta a la señal de tal manera que se optimice o mejore un desempeño subjetivo del procesador de señal. De acuerdo con lo anterior, el uno o más parámetros de forma de ventana puede determinarse, variarse o ajustarse en una forma que se adapte a la señal de tal manera que se optimice o mejore el desempeño objetivo (es decir, numérico) o subjetivo (es decir, perceptual) del procesador de señal (por ejemplo, el codificador de audio 1010).
[0092] Después de la comparación opcional de los parámetros de forma de ventana del canal a través de la unidad de sincronización 604, se asegura que se lleve a cabo la reconstrucción perfecta (PR) de las transformaciones usando las funciones de ventana seleccionadas, en una unidad de aplicación de PR 605 mediante ajuste de los parámetros para la
25 sobreposición de mitades de ventana de la estructura actual y previa. En base a los parámetros de forma de ventana modificados, al usar las ecuaciones (8) y (9), los coeficientes de ventana reales se calculan 606 y se multiplican con el segmento de audio respectivo, formando un segmento enmarcado s’(n) que se transforma finalmente en dominio de frecuencia por medio de una MDCT 607 para posterior cuantificación, codificación y transmisión. En el decodificador mostrado en la Fig. 10b), en la referencia numérica 1020, los parámetros de forma de ventana recibidos para cada estructura y canal se decodifican y adelantan a un selector de ventana 609, que les representa la configuración de ventana correspondiente para uso después de la MDCT inversa 608 del espectro descuantificado Q(k). Después de reforzar PR de las secuencias de ventana y calcular los coeficientes de ventana análogos al codificador, los segmentos de salida q(n) que resultan de las MDCTs inversas, se enmarcan y, por medio de sobreposición-adición 610, se reconstruyen las formas de onda de canal individual y(n).
35
10. Cálculo Alternativo de Ventana
10.1. Vista General Sobre El Cálculo de una Función de Ventana de una Clase de Ventana Alternativa
[0093] En lo sucesivo, se describirá una clase alternativa de funciones de ventana, que pueden usarse por un proveedor de ventana (por ejemplo, por el proveedor de ventana 180 o por el proveedor de ventana 300 o por el cálculo de ventana 606) para proporcionar valores de ventana de procesamiento de señal.
[0094] En otras palabras, en lo sucesivo, se darán los detalles con respecto a la definición de una clase alternativa de 45 ventanas, los cuales se basan en una modificación substancial de algunas de las ecuaciones anteriores.
[0095] En una de las secciones precedentes, se observó que la ecuación (12) con α=2, es decir, w2(t), es equivalente a la ecuación (15) con K=1, b0=0.5, b1=0.5. Además, se estableció la equivalencia entre w4(t) y (15) con K=2 y bk de (16). Se ha investigado respecto a cuál bk produce w1(t), w3(t), o más generalmente cualquier wα(t) con α impar. Observando las ecuaciones (12) y (15), se ha encontrado que es imposible construir una ventana de suma-de-cosenos que sea equivalente a una ventana de seno con exponente impar. Sin embargo, en algunas aplicaciones donde se requiere wα(t) de α impar, puede ser deseable usar una formulación similar a la ecuación (15) a fin de permitir optimizaciones de fuga espectral según se lleva a cabo por Hamming, Blackman y Nuttall.
55 [0096] Por suerte, se ha encontrado que las funciones de suma-de-senos
imagen28
proporcionan los medios de optimización necesarios. Como puede observarse, los valores de ventana de procesamiento de señal wc(t) pueden obtenerse mediante formación de una suma ponderada de funciones de configuración de tipo seno sen((2k+1)πt/L). Puede obtenerse una inclinación de ventana de señal para valores de t entre 0 y L/2.
65 [0097] También debe observarse que, preferentemente, se suman las funciones de seno, las frecuencias de lo cual son múltiplos impares de una frecuencia fundamental. Por ejemplo, las frecuencias angulares normalizadas pueden definirse como (2k+1) π/L. Puede observarse que las mayores frecuencias normalizadas son múltiplos impares de una frecuencia normalizada fundamental π/L.
imagen29
5 [0098] También debe observarse que las funciones de configuración se ponderan de manera alternativa con pesos negativos y positivos (-1)kck con índice de frecuencia creciente k (para k entre cero y un valor índice de frecuencia máximo K).
[0099] Al seleccionar las constantes ck adecuadamente, pueden adquirirse dos configuraciones.
10 [0100] Primero, puede construirse una ventana correspondiente a una ventana de seno con exponente impar de (2). La ck para α impar de tercer orden ínfimo wα(t) se especificará aquí. La ventana clásica de seno w1(t) es trivial para
imagen30
[0102] En segundo lugar, como bk en (15), ck puede determinarse de tal manera que se logre el comportamiento
20 espectral similar al de las ventanas de Blackman, Hamming y Nuttall. Antes de derivar la respectiva ck para K=1 y K=2, es importante determinar exactamente cuál aspecto de una respuesta espectral de ventana debe optimizarse. Para este fin, son necesarias medidas objetivas del desempeño espectral de una ventana. En la siguiente sección, se conduce por lo tanto un análisis de todas las funciones de ventana por medio de algunas medidas populares.
25 10.2. Evaluación y Optimización
[0103] En lo sucesivo, se evaluará el desempeño de las variantes de doble y triple término de esta clase de ventana y se comparará con otras ventanas que utilizan algunas de las figuras de mérito descritas en la referencia [2]. Motivado por el resultado, se describirán específicamente las realizaciones optimizadas. En lo sucesivo, se discutirán diferentes 30 conjuntos de parámetros de forma de ventana ck. Se mostrará que la combinación de los valores de ventana de procesamiento de señal de acuerdo con la ecuación (19) permite crear una amplia variedad de ventanas diferentes que tienen diferentes características. De acuerdo con lo anterior, puede resumirse que el proveedor de ventana configurado para proporcionar las ventanas de procesamiento de señal wc(t) de acuerdo con la ecuación (19) puede configurarse de manera muy flexible y trae consigo una complejidad computacional muy baja, debido a que la función de configuración
35 sen((2k+1)π-t/L) puede pre-calcularse mientras la suma ponderada trae consigo una complejidad computacional comparativamente pequeña.
[0104] Está bien establecido que la multiplicación de una señal de tiempo por otra señal corresponde a la convolución de las transformaciones de frecuencia de las dos señales. Por lo tanto, al aplicar una función de ponderación a una
40 señal, el espectro de señal se convoluciona con el espectro de la ponderación. Para evaluar el efecto de una función de ventana, es por consiguiente suficiente con estudiar su espectro, por ejemplo, usando transformación Fourier.
[0105] Las Figuras 11 y 12 ilustran las magnitudes del espectro de potencia de las ventanas anteriores, normalizadas en frecuencia y amplitud como en la referencia [4]. Debido a ceros espectrales recurrentes, todas las ventanas exhiben un
45 lóbulo principal a frecuencia cero y lóbulos laterales que se atenúan en amplitud con frecuencia creciente. La velocidad de disminución de los lóbulos laterales se dicta por las discontinuidades en los límites de la función de ventana así como aquellos de sus diferenciales; las derivadas de más bajo orden son continuas, mientras más rápidas son las atenuaciones de ventana hasta cero para f grande. Ver también referencias [2] y [4].
50 [0106] Para las funciones de seno con exponentiación wα(t) de la Figura 11, puede establecerse que la disminución asintomática en dB por octavo es proporcional a α (ver, por ejemplo, referencia [6]):
imagen31
55 [0107] Esto parece aplicarse a toda a no negativa real, no solo enteros. Para las ventanas optimizadas de la Figura 12, puede observarse un comportamiento de lóbulo lateral diferente. La ventana Hamming, cuya amplitud de lóbulo principal iguala a la de w2(t)=wHann(t), disminuye a solo -6 dB por octavo debido a que la función de ponderación no es continua. De manera similar, las ventanas de Blackman y Nuttall, que tienen la misma amplitud de lóbulo principal que
60 w4(t), muestran una atenuación de solo -18 dB por octava; sus primeras derivadas de ponderación son continuas, pero sus terceras derivadas no lo son. Sin embargo, estas ventanas exhiben niveles inferiores de lóbulo lateral máximo en comparación con sus contrapartes wα(t). Esto puede conducir a desviación espectral notablemente reducida en algunas aplicaciones y es la razón por la cual se desarrollan ventanas optimizadas.
65 [0108] Ya que se ha encontrado que el procedimiento de optimización usado para la ventana de suma-de-cosenos en la Figura 12 también puede aplicarse a las funciones de suma-de-senos de (19), es posible modificar la ventana de doble término con (20) y la ventana de triple término con (21) para el ínfimo nivel de lóbulo lateral máximo (la ventana seno de un término con c0=1 no puede optimizarse de este modo). Se ha encontrado que debido al uso de sinuosides, cualquier realización de (15) se enfoca a amplitud cero en sus puntos terminales; se garantiza por lo tanto una velocidad de disminución de lóbulo lateral de -12 dB por octavo (1/ƒ2, ver referencia [2]). Si las derivadas se permiten ser discontinuas, se obtienen grados adicionales de libertad para determinar ck, que puede emplearse para reducir la magnitud pico del lóbulo lateral (ver, por ejemplo, referencia [4]).
imagen32
[0109] Para la ventana de suma-de-senos de doble término (K=1), la admisión de una primer derivada discontinua produce un grado extra de libertad en la opción de c0y c1. Se encuentra que
imagen33
15 produce el ínfimo lóbulo lateral posible máximo de -54.3 dB (primer y tercer lóbulo lateral). La ventana de triple término (K=2) ofrece dos grados extra de libertad en la selección de ck. El nivel mínimo de lóbulo lateral pico de -82.8 dB se alcanza usando
imagen34
[0110] La Figura 13 muestra el espectro de potencia de las ventanas (23) y (24). Para las diez ventanas presentadas, el máximo nivel de lóbulo lateral, la disminución asintomática, la amplitud de lóbulo principal (se da por la ubicación del primer cero), y la amplitud de banda de 6-dB (una medida de la resolución de una ventana, ver referencia [2]) se mencionan en la Tabla 1. Observe cómo en términos de desempeño espectral en general, la ventana (23) yace justo entre la ventana Hamming de doble término y Nuttal de triple
25
término. Además, aunque se logra un pico de lóbulo lateral similar al de la ventana Blackman, la ventana (23) tiene un lóbulo principal más angosto. La ventana (24) tiene el máximo lóbulo lateral ínfimo de todas las ventanas en esta discusión, pero junto con w5(t), también exhibe el lóbulo principal más amplio.
[0111] Para concluir, un cálculo de los valores de ventana de procesamiento de señal de acuerdo con la ecuación (19), trae consigo la posibilidad de obtener ventanas de características muy diferentes al variar solo los parámetros ck sin variar la regla de cálculo subyacente. Esto reduce el esfuerzo computacional y el esfuerzo de implementación. También, en algunas modalidades, pueden usarse uno o más de los diferentes conjuntos de parámetros (20), (21), (23)
35 ó (24). El valor de ventana de procesamiento de señal puede calcularse y almacenarse en una tabla de búsqueda o puede calcularse en línea (siempre que se requiera), dependiendo de la implementación real.
10.3. Ventanas de Suma-de Senos y la Transformación Fourier Discreta (DFT) o MDCT
[0112] En lo sucesivo, se describirá una característica interesante de la clase de ventana propuesta cuando se utiliza en la Transformación Fourier Discreta.
[0113] El lector observador habrá notado la diferencia en las ubicaciones de cero entre el espectro de las ventanas de suma-de-senos y la suma-de-cosenos. Como es aparente en las figuras, para las últimas ventanas, la mayoría o todos
45 los ceros ocurren en múltiplos enteros de Lƒ, mientras que para las ventanas de suma-de-senos, los ceros yacen a la mitad entre el entero Lƒ. En lo sucesivo, esta característica deberá iluminarse con respecto a analizar el espectro de señales armónicas enmarcadas que utilizan DFT.
[0114] Como se observó con anterioridad, la transformación Fourier (FT) de un intervalo de señal s(t) ponderado por w(t) es equivalente a la convolución de las FTs individuales de s(t) y w(t). Las FTs de la ventana seno w1(t) y la ventana Hann w2(t) se dan por
55 y
imagen35
respectivamente, (ver, por ejemplo, referencia [3]). Por lo tanto, W1(ƒ)=0 para ƒ=n+0.5, |n|>1, y W2(ƒ)=0 para ƒ=n, |n|>2, siendo n un entero. Las FTs de las ventanas de mayor orden y optimizadas de la Tabla 1 difieren de (25) y (26), pero el término trigonométrico respectivo en el numerador (cos() para las ventanas de suma-de-senos, sen() para la de sumade-cosenos) es común a todos. En el contexto de DFT, la implicación es que la máxima fuga espectral con una ventana de suma-de-cosenos coincide con la mínima fuga con una ventana de suma-de-senos y viceversa. Se da un ejemplo en la Figura 14 para la ventana de doble término propuesta (23) y la ventana de triple término de Nuttall (18) aplicadas en un DFT de 256 puntos.
imagen36
5 [0115] En codificadores contemporáneos de audio o video, se divide una forma de onda de señal en segmentos y cada segmento se cuantifica en una representación más gruesa a fin de obtener una elevada compresión de datos, es decir, una baja velocidad de transmisión de bits requerida para almacenamiento o transmisión de la señal. En un intento por lograr una ganancia de codificación por medio de compactación de energía (o en otras palabras, para incrementar la
10 calidad perceptual de la señal codificada para una velocidad de transmisión de bits dada), se han vuelto populares las transformaciones de banco de filtro (por ejemplo, transformaciones de MDCT 607) de los segmentos previo a la cuantificación. Los sistemas más recientemente desarrollados aplican transformación de tiempo-respecto-a-frecuencia en la forma de transformación de coseno discreto modificado (MDCT), permitiendo un banco de filtro que los segmentos adyacentes se sobrepongan mientras se proporciona muestreo crítico.
15 [0116] Para mejor desempeño, las operaciones de MDCT de avance e inversas (por ejemplo, transformación de MDCT 607 y transformación de MDCT inversa 608) se acompañan por ponderación de cada segmento: del lado codificador, se emplea un análisis de ventana (por ejemplo, se emplea una ventana w1(n)) antes de la MDCT, y del lado decodificador, se aplica una ventana de síntesis (por ejemplo, una ventana de síntesis w1(n)) después de la MDCT inversa.
20 [0117] Desafortunadamente, no toda función de ponderación es adecuada para uso con la MDCT. Suponiendo funciones de ventana de análisis y síntesis, simétricas, idénticas,
imagen37
el sistema entero puede producir solo la reconstrucción de entrada perfecta en ausencia de cuantificación o transmisión de errores si
imagen38
con T=L/2. Esta es la así llamada condición de complementariedad de potencia (PC) o Princen-Badley reportada en [7]. Las ventanas de PC comunes son las ventanas de seno y KBD utilizadas en la norma AAC de MPEG-2/-4 (ver, por 35 ejemplo, referencias [6] y [8]), dadas las primeras por
40
imagen39
así como también la ventana de la especificación de codificador-decodificador Vorbis (ver, por ejemplo, referencia [9]),
imagen40
[0118] Para investigar si la ecuación (19) puede usarse para crear ventanas de suma-de-senos que satisfacen (28), observamos que, dado (27), wseno(t) puede considerarse como el seno de una función triangular:
imagen41
imagen42
[0119] De igual modo, wvorbis(t) puede escribirse como (32) con τ(t) remplazado por
imagen43
[0120] La complementariedad de amplitud acerca de T=L/4 de (31) y (33) (´0 31’),
imagen44
sugiere que las alternativas a estas funciones pueden diseñarse para optimizar la respuesta de frecuencia de la función de ventana sin sacrificar la propiedad de PC. De hecho, confirmando (27),
imagen45
es una extensión de (31) conforme a (34), que emplea una modificación de la función de suma-de-senos de (19); se omite el término de señal alterna y en lugar de múltiplos impares de π, se consideran múltiplos pares. Los experimentos informales ejecutados por el presente autor indican que, aunque PC se obtiene incluso con dk produciendo τd(t)<0 para alguna t, solo las ejecuciones con τd(t) no negativo para toda t producirían selectividad de banda de paso y rechazo de banda de detención, simultáneamente.
25 [0121] Además, en la sección titulada “Evaluación y Optimización” los coeficientes ck de (19) se seleccionaron de tal manera que el máximo nivel de lóbulo lateral de la ventana resultante se minimiza. Puede seguirse aquí un procedimiento similar. Sin embargo, respecto a la condicionante de PC de (28), son más limitadas las posibilidades de diseño espectral, especialmente con respecto a los primeros dos o tres lóbulos laterales. En general, uno debe especificar un límite de menor frecuencia Lƒ0>1.5 (o alternativamente, un lóbulo lateral de inicio) por encima del cual puede reducirse el máximo lóbulo lateral en una cantidad razonable. Para dar un ejemplo, una búsqueda exhaustiva informal con Lƒ0=4.5 produce formación de parámetros de doble término
d1=0.12241, d2=0.00523, (36)
35 que produce una ventana cuyos primeros tres lóbulos laterales por encima de Lƒ0 tienen todos un nivel de -66.8 dB. Los lóbulos laterales de mayor frecuencia se atenúan desde ese valor a una velocidad de -12 dB por octavo, tal como aquellos de las ventanas optimizadas (23) y (24) de las secciones previas. La respuesta de frecuencia de la función de ponderación construida usando (27), (32), (35) y (36) se muestra en la Figura 15 junto con aquellas de wseno(t) y wvorbis(t). Claramente, se logra un incremento sustancial en rechazo de lóbulo lateral en la ventana propuesta en comparación con la ventana de seno. Debido a la condicionante (28), esta ventaja se encuentra a costo de un lóbulo principal ligeramente más amplio y un mayor primer lóbulo lateral. Una comparación con la ventana Vorbis muestra amplitudes casi idénticas de lóbulo principal y máxima de los dos primeros lóbulos laterales. Para 4.5<Lƒ0<11.5, la ventana propuesta lleva a cabo wvorbis(t) en términos de atenuación de lóbulo lateral. Observe también que el espectro de ventana Vorbis disminuye a -18 dB por octavo y tiene su magnitud cero a (o cerca) de múltiplos enteros de Lƒ. Por lo
45 tanto, su comportamiento espectral se asemeja al de la ventana de suma-de-cosenos. De hecho, puede considerarse PC equivalente a la ventana Hann. De igual modo, la ventana de PC propuesta parece ser una contraparte de las ventanas de suma-de-senos optimizadas de la sección titulada “Evaluación y optimización”. Una investigación más concienzuda, que incluye una evaluación de desempeño en el contexto de codificación de audio, es un tema de futura investigación.
11. Implementación Alternativa
[0122] Aunque se han descrito algunos aspectos en el contexto de un aparato, es claro que estos aspectos también representan una descripción del procedimiento correspondiente, donde un bloque o dispositivo corresponde a una etapa
55 de procedimiento o una característica de una etapa del procedimiento. De manera análoga, los aspectos descritos en el contexto de una etapa del procedimiento también representan una descripción de un bloque o tema o característica correspondiente de un aparato correspondiente.
[0123] Algunas o todas las etapas del procedimiento pueden ejecutarse por (o usando) un aparato de hardware, como, por ejemplo, un microprocesador, una computadora programable o un circuito electrónico. En algunas modalidades, una
o más de las etapas de procedimiento más importantes pueden ejecutarse por tal aparato.
[0124] La señal de medios codificada, que puede ser una señal de audio o video codificada, o secuencia de funciones de ventana, puede almacenarse en un medio de almacenamiento digital o puede transmitirse sobre un medio de
65 transmisión tal como un medio de transmisión inalámbrico o un medio de transmisión conectado por cable tal como la Internet. 18
imagen46
[0125] Dependiendo de ciertos requisitos de implementación, las modalidades de la invención pueden implementarse en hardware o software. La implementación puede llevarse a cabo usando un medio de almacenamiento digital, por ejemplo, una unidad de almacenamiento de disco, un DVD, un disco de Blu-Ray, un CD, una ROM, una PROM, una
5 EPROM o una memoria de almacenamiento intermedio, que tenga señales de control electrónicamente legibles almacenadas en los mismos, que cooperen (o sean capaces de cooperar) con un sistema de computadora programable de tal manera que se lleve a cabo el procedimiento respectivo. Por consiguiente, el medio de almacenamiento digital puede ser legible por computadora.
[0126] Algunas modalidades de acuerdo con la invención comprenden un portador de datos que tiene señales de control electrónicamente legibles, que son capaces de cooperar con un sistema de computadora programable, de tal manera que uno de los procedimientos aquí descritos se lleva a cabo.
[0127] En general, las modalidades de la presente invención pueden implementarse como un producto de programa de
15 computadora con un código programable, siendo operativo el código de programa para llevar a cabo uno de los procedimientos cuando el programa de computadora se ejecuta en una computadora. El código de programa, por ejemplo, puede almacenarse en un portador legible por máquina.
[0128] Otras modalidades comprenden un programa de computadora para llevar a cabo uno de los procedimientos descritos en la presente, almacenados en un portador legible por máquina.
[0129] En otras palabras, una modalidad del procedimiento inventivo es, por consiguiente, un programa de computadora que tiene un código de programa para llevar a cabo uno de los procedimientos descritos en la presente, cuando el programa de computadora se ejecuta en una computadora.
25 [0130] Una modalidad adicional de los procedimientos inventivos, por consiguiente es, un portador de datos (o un medio de almacenamiento digital, o un medio legible por computadora) que comprende, registrado en el mismo, el programa de computadora para llevar a cabo uno de los procedimientos descritos en la presente. El portador de datos, el medio de almacenamiento digital o el medio registrado son típicamente tangibles y/o no transitorios.
[0131] Una modalidad adicional del procedimiento inventivo es, por consiguiente, una corriente de datos o una secuencia de señales que representan el programa de computadora para llevar a cabo uno de los procedimientos descritos en la presente. La corriente de datos o la secuencia de señales pueden configurarse, por ejemplo, para transferirse a través de una conexión de comunicación de datos, por ejemplo, a través de la Internet.
35 [0132] Una modalidad adicional comprende un medio de procesamiento, por ejemplo, una computadora, o un dispositivo lógico programable, configurado o adaptado para llevar a cabo uno de los procedimientos descritos en la presente.
[0133] Una modalidad adicional comprende una computadora que tiene instalado en la misma el programa de computadora para llevar a cabo uno de los procedimientos descritos en la presente.
[0134] Una modalidad adicional de acuerdo con la invención comprende un aparato o un sistema configurado para transferir (por ejemplo, de manera electrónica u óptica) un programa de computadora para llevar a cabo uno de los
45 procedimientos descritos en la presente en un receptor. El receptor puede ser, por ejemplo, una computadora, un dispositivo móvil, un dispositivo de memoria o lo similar. El aparato o sistema puede comprender, por ejemplo, un servidor de archivo para transferir el programa de computadora al receptor.
[0135] En algunas modalidades, puede utilizarse un dispositivo de lógica programable (por ejemplo, una instalación de compuerta programable por campo) para llevar a cabo algunas de las funcionalidades de los procedimientos descritos en la presente. En algunas modalidades, una instalación de compuerta programable por campo puede cooperar con un microprocesador con objeto de llevar a cabo uno de los procedimientos descritos en la presente. En general, los procedimientos se llevan a cabo preferentemente por un aparato de hardware.
55 [0136] Las modalidades anteriores son meramente ilustrativas de los principios de la presente invención. Se entiende que para otros expertos en la materia serán aparentes modificaciones y variaciones de los arreglos y los detalles descritos en la presente. Por consiguiente, se intenta limitarse solo por el alcance de las reivindicaciones de patente inminentes y no por los detalles específicos presentados a manera de descripción y explicación de las modalidades en la presente.
12. Conclusiones
[0137] A partir de lo anterior puede concluirse que un cálculo de la función de ventana según se explica con relación a las ecuaciones (6), (8) y (9) produce una función de ventana que tiene características particularmente buenas.
65 [0138] Además, puede concluirse que un cálculo de las funciones de ventana según se explica con relación a la
imagen47
ecuación (19) produce una función de ventana que tiene buenas características.
[0139] Para resumir lo anterior, las modalidades de acuerdo con la presente invención se refieren en general a procedimientos de análisis y procesamiento de señal tal como aquellos que pueden utilizarse en sistemas de 5 codificación de audio o video. Algunas modalidades de acuerdo con la invención se refieren a aplicaciones que requieren de compactación de energía de señal por medio de transformación de banco de filtro variante que se adapta a la señal o invariante, de la fuente. Pueden utilizarse para mejorar el desempeño de compactación de energía mientras se permite una perfecta inversión de dicha transformación. Las modalidades de acuerdo con la presente invención constituyen, por consiguiente, una solución a la necesidad de una función de ventana alternativa que tenga una
10 complejidad computacional moderada, pero que proporcione una buena flexibilidad de diseño.
[0140] Algunas modalidades de acuerdo con la presente invención, según se definen por las reivindicaciones anexas o esta descripción, se dirigen a la falta de funciones de ventana, flexibles y computacionalmente eficientes, para aplicaciones de MDCT al declarar una extensión a la función de seno de la ecuación (4).
15 [0141] Sin embargo, otras modalidades de acuerdo con la invención crean funciones de ventana mejoradas, que proporcionan una flexibilidad incrementada, pero no proporcionan la posibilidad de una reconstrucción perfecta en aplicaciones de MDCT. No obstante, tales funciones de ventana son útiles en muchas aplicaciones.
20 [0142] También debe señalarse que con objeto de facilitar el entendimiento de la presente invención, la invención se ha descrito por medio de ejemplos ilustrativos con relación a los dibujos acompañantes. En otras palabras, las modalidades descritas en la presente son meramente ilustrativas de los principios de la presente invención para una formación de ventana más flexible y/o compactación de energía de señal mejorada en aplicaciones de filtro. Se entiende que serán aparentes a aquellos expertos en la materia variaciones y modificaciones de los arreglos y los
25 detalles descritos en la presente. Por consiguiente, se intenta limitarse solo por el alcance de las reivindicaciones de patente inminentes y no por los detalles particulares descritos a manera de descripción y explicación de las modalidades en la presente.
[0143] Hablando en general, la formación de ventana de señales discretas mediante ponderación temporal es una
30 herramienta esencial para el análisis espectral en el procesamiento para reducir efectos de desviación. Muchas funciones populares de ponderación (por ejemplo, Hann, Hamming, Blackman) se basan en una suma de cosenos a escala.
[0144] Las modalidades de acuerdo con la invención presentan una clase alternativa de ventanas, construidas usando
35 sumas de senos y exhibiendo comportamiento espectral modificado (o incluso único) con respecto a la ubicación de cero y una atenuación de lóbulo lateral de al menos -12 dB/octavo debido a continuidad garantizada de la ponderación. Se proporcionan parámetros para las realizaciones de doble y de triple término con nivel de lóbulo lateral de pico mínimo. Algunas modalidades de acuerdo con la invención se refieren al uso de las ventanas de suma-de-senos con la Transformación Fourier Discreta y su adopción a transformaciones superpuestas tales como la Transformación de
40 Coseno, Discreta, Modificada (MDCT).
[0145] En otras palabras, las modalidades de acuerdo con a invención proponen alternativas a las funciones de ventana convencionales (por ejemplo, Hann, Hamming y Blackman), igualmente fáciles de calcular y con desempeños similares
o incluso únicos en términos de reducción de fuga.
45 [0146] Hablando muy en general, las modalidades de acuerdo con la invención crean un aparato, un procedimiento o un programa de computadora para codificar o decodificar o procesar una señal de audio o de video usando funciones de ventana variables.
50 [0147] Algunas modalidades de acuerdo con la invención crean un aparato, un procedimiento o un programa de computadora para calcular una secuencia de funciones de ventana diferentes para una señal de audio o una señal de video.
[0148] Otros ejemplos crean una señal de audio o de video codificada que comprende contenido codificado de audio o
55 video e información de parámetros de ventana con relación a ventanas variables, usadas para codificar una señal de audio o video a fin de obtener la señal codificada de audio o video.
[0149] Modalidades adicionales de acuerdo con la invención crean una secuencia de funciones de ventana variables que se determinan en una manera que se adapta a la señal.
60 [0150] Modalidades adicionales de acuerdo con la invención crean el aparato, procedimientos, programas de
65 donde c(n) denota la función de núcleo de ventana que puede calcularse por adelantado ya que se predetermina. La extensión propuesta se agrega a c(n) en la ecuación (7) sinusoides ponderados que tienen frecuencias angulares que son múltiplos enteros de 2π:
imagen48
imagen49
imagen50
10 [0151] Para concluir también, se han presentado alternativas matemáticamente simples a las ventanas de Hamming, Blackman y similares, generadas mediante el uso de sumas de senos ponderados. El enfoque de suma-de-senos produce propiedades únicas tales como continuidad garantizada de la función de ventana y también puede aplicarse en la construcción de ventanas complementarias de potencia para codificar, por ejemplo, audio.
15 Referencias
[0152]
20 [1] R.B. Blackman y J.W. Tukey. The Measurement of Power Spectra from the Point of View of Communications Engineering, Nueva York, NY, EUA: Dover Publications, 1958.
[2] F.J. Harris, “On the Use of Windows for Harmonic Analysis with the Discrete Fourier Transform”, Proc. IEEE, vol. 66,
no. 1, pp. 51-83, Enero 1978. 25
[3] N.C. Geckinli and D. Yavuz, “Some Novel Windows and a Concise Tutorial Comparison of Window Families”, IEEE Trans. Acoustics, Speech and Signal Processing, vol. ASSP-26, no. 6, pp. 501-507, Diciembre 1978.
[4] A.H. Nuttall, “Some Windows with Very Good Sidelobe Behavior”, IEEE Trans. Acoustics, Speech and Signal 30 Processing, vol. ASSP-29, no. 1, pp. 84-91, Febrero 1981.
[5] S.W.A. Bergen and A. Antoniou, “Design of Ultraspherical Window Functions with Prescribed Spectral Characteristics”, EURASIP Journal on Applied Signal Processing, vol. 2004, no. 13, pp. 2053-2065, 2004. Disponible en línea en http://www.hindawi.com/GetArticle.aspx?doi=10.1155/S1110865704403114.
35
[6] J.O. Smith III, Spectral Audio Signal Processing, Marzo 2009 Draft, Center for Computer Research in Music and Acoustics (CCRMA), Stanford University, CA, EUA. Disponible en línea en http://ccrma.stanford.edu/∼jos/sasp/ (accesado Marzo 2010).
40 [7] J.P. Princen, A.W. Johnson y A.B. Bradley, “Subband/Transform Coding Using Filter Bank Designs Based on Time Domain Aliasing Cancellation”, Proc. IEEE 1987 ICASSP-12, pp. 2161-2164, Mayo 1987.
[8] ISO/IEC 14496-3:2009, “Information technology – Coding of audio-visual objects – Part 3: Audio”, Geneva, Agosto
2009. 45
[9] Xiph.org Foundation, “Vorbis I specification”, Feb. 2010. En línea en http://www.xiph.org/vorbis/doc/Vorbis_I_spec.html.

Claims (5)

  1. imagen1
    REIVINDICACIONES
    1. Un procesador de señal (150) para proporcionar una versión procesada (112) de una señal de entrada (110) en dependencia de la señal de entrada, comprendiendo el procesador de señal comprende:
    5 un proveedor de ventana (120) configurado para enmarcar una porción de la señal de entrada (110) o de una versión pre-procesada de la misma (110’), en dependencia de una ventana de procesamiento de señal descrita por valores de ventana de procesamiento de señal (wc(t)) para una pluralidad de valores índice de valor de ventana (t), con objeto de obtener la versión procesada (112) de la señal de entrada; y
    10 un proveedor de ventana (180) para proporcionar los valores de ventana de procesamiento de señal (wc(t)) para una pluralidad de valores índice de valor de ventana (t) en dependencia de uno o más parámetros de forma de ventana (ck), en donde el proveedor de ventana (180) se configura para calcular una suma ponderada de valores de función de una pluralidad de funciones de configuración de tipo seno, que representan valores índice de valor de ventana (t) sobre valores de función correspondientes, a fin de obtener los valores de ventana de procesamiento de señal (wc(t)),
    15 en donde una ponderación de los valores de función se determina por los parámetros de forma de ventana (ck); en donde el proveedor de ventana se configura para proporcionar los valores de ventana de procesamiento de señal wc(t) para una pluralidad de valores índice de valor de ventana t de acuerdo con
    imagen2
    en donde K≥1; 25 en donde ck’ son valores de parámetro de ventana determinados por los parámetros de forma de ventana; y en donde la señal de entrada es una señal de audio, una señal de habla, una señal de video o una señal de imagen.
  2. 2. Un procesador de señal (200) para proporcionar una versión procesada (212) de una señal de entrada (210) en dependencia de la señal de entrada (210), comprendiendo el procesador de señal:
    30 un proveedor de ventana (220) configurado para enmarcar una porción de la señal de entrada, o una versión preprocesada (210’) de la misma, en dependencia de una ventana de procesamiento de señal descrita por valores de ventana de procesamiento de señal (wc(t)) para una pluralidad de valores índice de valor de ventana (t), con objeto de obtener la versión procesada de la señal de entrada,
    35 en donde los valores de ventana de procesamiento de señal son valores de resultado de una suma ponderada de valores de función de una pluralidad de funciones de configuración de tipo seno que representan los valores índice de valor de ventana sobre valores de función correspondientes; en donde los valores de ventana de procesamiento de señal wc(t) se definen de acuerdo con
    imagen3
    en donde t toma valores entre 0 y L/2 para una inclinación de ventana (1630), y en donde K≥1; donde ck’ son valores de
    45 parámetro de forma de ventana determinados por los parámetros de forma de ventana; y donde L indica la longitud de la ventana; y donde la señal de entrada es una señal de audio, una señal de habla, una señal de video o una señal de imagen.
  3. 3. Un procedimiento para proporcionar una versión procesada de una señal de entrada en dependencia de la señal de 50 entrada, comprendiendo el procedimiento:
    enmarcado de una porción de la señal de entrada o de una versión pre-procesada de la misma, en dependencia de una ventana de procesamiento de señal descrita por valores de ventana de procesamiento de señal para una pluralidad de valores índice de valor de ventana, con objeto de obtener la versión procesada de la señal de entrada; y
    55 proporcionar los valores de ventana de procesamiento de señal para una pluralidad de valores índice de valor de ventana en dependencia de uno o más parámetros de forma de ventana, en donde se calcula una suma ponderada de valores de función de una pluralidad de funciones de configuración de tipo seno para obtener los valores de ventana de procesamiento de señal, en donde las funciones de configuración de tipo seno representan valores índice de valor de ventana sobre valores de
    60 función correspondientes, y en donde una ponderación de los valores de función se determina por los parámetros de forma de ventana; en donde los valores de ventana de procesamiento de señal wc(t) para una pluralidad de valores índice de valor de ventana t se proporcionan de acuerdo con
    65
    22
    imagen4
    en donde K≥1; en donde ck’ son valores de parámetro de ventana determinados por los parámetros de forma de ventana; y donde L indica la longitud de la ventana; y donde la señal de entrada es una señal de audio, una señal de habla, una señal de video o una señal de imagen.
    10
  4. 4. Un procedimiento para proporcionar una versión procesada de una señal de entrada en dependencia de la señal de entrada, comprendiendo el procedimiento:
    15 enmarcado de una porción de la señal de entrada, o de una versión pre-procesada de la misma, en dependencia de una ventana de procesamiento de señal descrita por valores de ventana de procesamiento de señal para una pluralidad de valores índice de valor de ventana, con objeto de obtener la versión procesada de la señal de entrada, en donde los valores de ventana de procesamiento de señal son valores de resultado de una suma ponderada de valores de función de una pluralidad de funciones de configuración de tipo seno, que representan valores índice de valor
    20 de ventana sobre valores de función correspondientes; en donde los valores de ventana de procesamiento de señal wc(t) se definen de acuerdo con
    imagen5
    en donde t toma valores entre 0 y L/2 para una inclinación de ventana (1630) y en donde K≥1; en donde ck’ son valores de parámetro de ventana determinados por los parámetros de forma de ventana; y en donde la señal de entrada es una señal de audio, una señal de habla, una señal de video o una señal de imagen.
  5. 5. Un programa de computadora para llevar a cabo los procedimientos según una de las reivindicaciones 3 a 4 cuando el programa de computadora se ejecuta en una computadora.
    23
ES11707660.4T 2010-03-11 2011-03-08 Procesador de señal y procedimiento para procesar una señal Active ES2526774T3 (es)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US31277510P 2010-03-11 2010-03-11
US312775P 2010-03-11
EP10175142 2010-09-02
EP10175142A EP2372704A1 (en) 2010-03-11 2010-09-02 Signal processor and method for processing a signal
PCT/EP2011/053484 WO2011110569A1 (en) 2010-03-11 2011-03-08 Signal processor and method for processing a signal

Publications (1)

Publication Number Publication Date
ES2526774T3 true ES2526774T3 (es) 2015-01-15

Family

ID=43827399

Family Applications (3)

Application Number Title Priority Date Filing Date
ES16177667.9T Active ES2691479T3 (es) 2010-03-11 2011-03-08 Procesador de señal y procedimiento para procesar una señal
ES11707660.4T Active ES2526774T3 (es) 2010-03-11 2011-03-08 Procesador de señal y procedimiento para procesar una señal
ES11707661.2T Active ES2601847T3 (es) 2010-03-11 2011-03-08 Procesador de señal, señal de medios codificada y método para procesar una señal

Family Applications Before (1)

Application Number Title Priority Date Filing Date
ES16177667.9T Active ES2691479T3 (es) 2010-03-11 2011-03-08 Procesador de señal y procedimiento para procesar una señal

Family Applications After (1)

Application Number Title Priority Date Filing Date
ES11707661.2T Active ES2601847T3 (es) 2010-03-11 2011-03-08 Procesador de señal, señal de medios codificada y método para procesar una señal

Country Status (14)

Country Link
US (2) US8907822B2 (es)
EP (5) EP2372704A1 (es)
JP (2) JP5809645B2 (es)
KR (2) KR101445292B1 (es)
CN (2) CN102893329B (es)
AU (2) AU2011226121B2 (es)
BR (2) BR112012022898B1 (es)
CA (2) CA2792453C (es)
ES (3) ES2691479T3 (es)
HK (2) HK1231625A1 (es)
MX (2) MX2012010320A (es)
PL (1) PL2545549T3 (es)
RU (2) RU2616863C2 (es)
WO (2) WO2011110572A1 (es)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8538042B2 (en) * 2009-08-11 2013-09-17 Dts Llc System for increasing perceived loudness of speakers
US9305031B2 (en) * 2013-04-17 2016-04-05 International Business Machines Corporation Exiting windowing early for stream computing
US8908796B1 (en) * 2013-05-15 2014-12-09 University Of South Florida Orthogonal frequency division multiplexing (OFDM) transmitter and receiver windowing for adjacent channel interference (ACI) suppression and rejection
RU2641253C2 (ru) * 2013-08-23 2018-01-16 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ для обработки звукового сигнала с использованием сигнала ошибки вследствие наложения спектров
US9479272B2 (en) 2014-05-14 2016-10-25 Samsung Electronics Co., Ltd Method and apparatus for processing a transmission signal in communication system
JP6243580B2 (ja) * 2014-10-20 2017-12-06 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. フォトンカウンティングctのための心臓再構成
TWI681384B (zh) * 2018-08-01 2020-01-01 瑞昱半導體股份有限公司 音訊處理方法與音訊等化器
CN110889083B (zh) * 2018-09-10 2020-12-22 湖南银杏可靠性技术研究所有限公司 基于窗谱估计的退化数据一致性检验法
WO2024028966A1 (ja) * 2022-08-02 2024-02-08 三菱電機株式会社 信号処理装置および信号処理方法

Family Cites Families (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5142656A (en) 1989-01-27 1992-08-25 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
US5109417A (en) 1989-01-27 1992-04-28 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
JP3465941B2 (ja) * 1993-01-07 2003-11-10 三菱電機株式会社 ピッチ抽出装置
US6487574B1 (en) * 1999-02-26 2002-11-26 Microsoft Corp. System and method for producing modulated complex lapped transforms
US6496795B1 (en) * 1999-05-05 2002-12-17 Microsoft Corporation Modulated complex lapped transform for integrated signal enhancement and coding
US6978236B1 (en) * 1999-10-01 2005-12-20 Coding Technologies Ab Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching
CN1408146A (zh) * 2000-11-03 2003-04-02 皇家菲利浦电子有限公司 音频信号的参数编码
EP1386312B1 (en) * 2001-05-10 2008-02-20 Dolby Laboratories Licensing Corporation Improving transient performance of low bit rate audio coding systems by reducing pre-noise
FR2824978B1 (fr) 2001-05-15 2003-09-19 Wavecom Sa Dispositif et procede de traitement d'un signal audio
US6963842B2 (en) * 2001-09-05 2005-11-08 Creative Technology Ltd. Efficient system and method for converting between different transform-domain signal representations
EP1394772A1 (en) * 2002-08-28 2004-03-03 Deutsche Thomson-Brandt Gmbh Signaling of window switchings in a MPEG layer 3 audio data stream
CA2415105A1 (en) * 2002-12-24 2004-06-24 Voiceage Corporation A method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding
US20040162866A1 (en) * 2003-02-19 2004-08-19 Malvar Henrique S. System and method for producing fast modulated complex lapped transforms
JP2004361731A (ja) 2003-06-05 2004-12-24 Nec Corp オーディオ復号装置及びオーディオ復号方法
JP3849679B2 (ja) * 2003-09-25 2006-11-22 ヤマハ株式会社 雑音除去方法、雑音除去装置およびプログラム
CN100573666C (zh) * 2003-11-26 2009-12-23 联发科技股份有限公司 子带分析/合成滤波方法
US6980933B2 (en) * 2004-01-27 2005-12-27 Dolby Laboratories Licensing Corporation Coding techniques using estimated spectral magnitude and phase derived from MDCT coefficients
US7088276B1 (en) * 2004-02-13 2006-08-08 Samplify Systems Llc Enhanced data converters using compression and decompression
JP4355745B2 (ja) * 2004-03-17 2009-11-04 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ符号化
WO2005096274A1 (fr) * 2004-04-01 2005-10-13 Beijing Media Works Co., Ltd Dispositif et procede de codage/decodage audio ameliores
EP1873753A1 (en) * 2004-04-01 2008-01-02 Beijing Media Works Co., Ltd Enhanced audio encoding/decoding device and method
JP2006243664A (ja) * 2005-03-07 2006-09-14 Nippon Telegr & Teleph Corp <Ntt> 信号分離装置、信号分離方法、信号分離プログラム及び記録媒体
US7720677B2 (en) 2005-11-03 2010-05-18 Coding Technologies Ab Time warped modified transform coding of audio signals
RU2315424C1 (ru) * 2006-06-06 2008-01-20 Виктор Васильевич Бондаренко Система связи с высокой скоростью передачи информации сверхширокополосными сигналами
US7987089B2 (en) * 2006-07-31 2011-07-26 Qualcomm Incorporated Systems and methods for modifying a zero pad region of a windowed frame of an audio signal
US8036903B2 (en) * 2006-10-18 2011-10-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Analysis filterbank, synthesis filterbank, encoder, de-coder, mixer and conferencing system
EP1918911A1 (en) * 2006-11-02 2008-05-07 RWTH Aachen University Time scale modification of an audio signal
US7522074B2 (en) * 2007-09-17 2009-04-21 Samplify Systems, Inc. Enhanced control for compression and decompression of sampled signals
BRPI0816556A2 (pt) * 2007-10-17 2019-03-06 Fraunhofer Ges Zur Foerderung Der Angewandten Forsschung E V codificação de áudio usando downmix
MY154452A (en) * 2008-07-11 2015-06-15 Fraunhofer Ges Forschung An apparatus and a method for decoding an encoded audio signal
JP4918074B2 (ja) * 2008-08-18 2012-04-18 日本電信電話株式会社 符号化装置、符号化方法、符号化プログラム、及び記録媒体

Also Published As

Publication number Publication date
JP2013531264A (ja) 2013-08-01
EP2372704A1 (en) 2011-10-05
MX2012010320A (es) 2012-11-23
EP3096317A1 (en) 2016-11-23
AU2011226118A1 (en) 2012-10-25
CN102893328B (zh) 2014-12-10
US8907822B2 (en) 2014-12-09
JP5809645B2 (ja) 2015-11-11
WO2011110569A1 (en) 2011-09-15
RU2012143351A (ru) 2014-04-20
AU2011226118B2 (en) 2014-08-28
MX2012010440A (es) 2012-12-05
KR20130007603A (ko) 2013-01-18
KR101445290B1 (ko) 2014-09-29
AU2011226121B2 (en) 2014-08-28
ES2601847T3 (es) 2017-02-16
KR101445292B1 (ko) 2014-09-29
EP3096317B1 (en) 2018-08-01
RU2012143352A (ru) 2014-04-27
US20130241750A1 (en) 2013-09-19
HK1231625A1 (zh) 2017-12-22
EP2545549B1 (en) 2014-10-01
CN102893329B (zh) 2015-04-08
CA2792454C (en) 2018-01-16
PL2545549T3 (pl) 2015-03-31
ES2691479T3 (es) 2018-11-27
CA2792453A1 (en) 2011-09-15
WO2011110572A1 (en) 2011-09-15
US20130246492A1 (en) 2013-09-19
AU2011226121A1 (en) 2012-10-25
EP2545549A1 (en) 2013-01-16
JP2013522657A (ja) 2013-06-13
EP2545550B1 (en) 2016-09-07
RU2616863C2 (ru) 2017-04-18
JP5706917B2 (ja) 2015-04-22
CN102893328A (zh) 2013-01-23
CN102893329A (zh) 2013-01-23
EP2545550A1 (en) 2013-01-16
US9252803B2 (en) 2016-02-02
KR20130007601A (ko) 2013-01-18
EP2372703A1 (en) 2011-10-05
BR112012022898A2 (pt) 2018-09-18
CA2792454A1 (en) 2011-09-15
RU2611986C2 (ru) 2017-03-01
CA2792453C (en) 2016-05-31
HK1181179A1 (en) 2014-03-07
BR112012022899A2 (pt) 2018-06-05
BR112012022898B1 (pt) 2021-02-02

Similar Documents

Publication Publication Date Title
ES2526774T3 (es) Procesador de señal y procedimiento para procesar una señal
RU2691231C2 (ru) Декодер для декодирования кодированного аудиосигнала и кодер для кодирования аудиосигнала
ES2823560T3 (es) Análisis/síntesis espectral de baja complejidad utilizando resolución temporal seleccionable
ES2646814T3 (es) Codificación de señales de audio por transformada modificada deformada en el tiempo
ES2751275T3 (es) Procesador, procedimiento y programa informático para el tratamiento de una señal de audio mediante el uso de las partes de superposición truncadas de ventanas de análisis y de síntesis
BRPI0412166B1 (pt) aparato e método para a conversão em uma representação transformada ou para a conversão inversa da representação transformada
JP6654236B2 (ja) オーディオ変換コーディングにおけるオーバーラップ率の信号適応スイッチングのための符号化器、復号器および方法
RU2643662C2 (ru) Устройство и способ для обработки звукового сигнала с использованием комбинирования в диапазоне перекрытия
MX2013011131A (es) Transformada con complejidad reducida para canal de efectos de baja frecuencia.