ES2691479T3 - Procesador de señal y procedimiento para procesar una señal - Google Patents

Procesador de señal y procedimiento para procesar una señal Download PDF

Info

Publication number
ES2691479T3
ES2691479T3 ES16177667.9T ES16177667T ES2691479T3 ES 2691479 T3 ES2691479 T3 ES 2691479T3 ES 16177667 T ES16177667 T ES 16177667T ES 2691479 T3 ES2691479 T3 ES 2691479T3
Authority
ES
Spain
Prior art keywords
window
values
signal
signal processing
function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES16177667.9T
Other languages
English (en)
Inventor
Christian Helmrich
Ralf Geiger
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Application granted granted Critical
Publication of ES2691479T3 publication Critical patent/ES2691479T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/45Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of analysis window
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Algebra (AREA)
  • Pure & Applied Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Complex Calculations (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

Un procesador de señal (100) para proporcionar una versión procesada de una señal de entrada en dependencia de la señal de entrada, donde la señal de entrada es una señal de audio o una señal de vídeo, comprendiendo el procesador de señal: un proveedor de ventana configurado para enmarcar una porción de la señal de entrada, o de una versión preprocesada de la misma, en dependencia de una ventana de procesamiento de señal descrita por valores de ventana de procesamiento de señal para una pluralidad de valores índice de valor de ventana, con objeto de obtener la versión procesada de la señal de entrada; y un proveedor de ventana (300) para proporcionar los valores de ventana de procesamiento de señal (w(n); w1(n)) de una función de ventana para procesar la señal de audio o de vídeo para la pluralidad de valores índice de valor de ventana (n) en dependencia de uno o más parámetros de forma de ventana (310; af), donde el proveedor de ventana se configura para evaluar una función de seno para una pluralidad de valores de argumento asociados con los valores índice del valor de ventana (n), a fin de obtener los valores de ventana del procesamiento de señal, donde el proveedor de ventana se configura para calcular una suma ponderada de un término lineal (c(n)), el cual es linealmente dependiente de los valores índice del valor de ventana (n), y valores de función de más de una funciones de configuración, cuyas más de una funciones de configuración representan los valores índice del valor de ventana (n) sobre los valores de función correspondientes y cuyas más de una funciones de configuración son simétricas por puntos con respecto a un centro de una inclinación de ventana (1630), a fin de obtener los valores de argumento.

Description

DESCRIPCIÓN
Procesador de señal y procedimiento para procesar una señal 5 Campo técnico
[0001] Las realizaciones según la invención se refieren a un procesador de señal para proporcionar una versión procesada de una señal de entrada dependiente de la señal de entrada y a un procedimiento para procesar una señal.
10
[0002] Otra realización según la invención se refiere a un procedimiento para codificar o decodificar una señal de audio o de video usando funciones de ventana variables.
[0003] Las realizaciones según la presente invención generalmente se refieren a un análisis de señal y 15 procedimientos de procesamiento, tales como aquellos que pueden utilizarse en sistemas de codificación de audio o
de video.
Antecedentes de la invención
20 [0004] La filtración de respuesta de impulsos finitos (FIR) de señales discretas, particularmente en el contexto
de bancos de filtro, se emplea ampliamente en análisis espectral, procesamiento, síntesis y compresión de datos de medios, entre otras aplicaciones. Es bien sabido que la finitud temporal (o espacial) de un filtro de FIR y por lo tanto la finitud del intervalo de señal que puede procesarse en un instante en el tiempo o espacio, puede conducir a un fenómeno conocido como derivación o fuga. Cuando se modifica el intervalo filtrado, por ejemplo al variar cambios 25 de ganancia o cuantificación, puede ocurrir el bloqueo o resonancia de artefactos después de la inversión de la operación de filtración. Se ha encontrado que la causa de estos artefactos puede atribuirse a discontinuidades entre los puntos terminales de la forma de onda de señal del intervalo procesado (referido en lo sucesivo como segmento), así como también aquellos de sus diferenciales. Se ha encontrado que con objeto de reducir tales efectos indeseados de fuga, es por lo tanto útil o incluso necesario el reducir las discontinuidades en el segmento y algunos 30 de sus diferenciales. Esto puede lograrse al multiplicar cada muestra s(n), n=0, 1, ..., N-1, del segmento de longitud- N con un cierto peso w(n) antes de la filtración, y en el caso de manipulación de señal en el dominio filtrado, también después de la filtración inversa, de tal manera que los puntos terminales del segmento y de sus diferenciales se gradúen a cero. Un enfoque equivalente es aplicar los pesos a cada filtro de base del banco de filtro (Ver, por ejemplo, referencia [2]). Ya que los factores de ponderación se describen con frecuencia mediante una expresión 35 analítica, un conjunto de factores es comúnmente conocido como una función de ponderación o función de ventana.
[0005] En sistemas típicos de codificación de audio y video, una forma de onda de origen se segmenta como
arriba, y cada segmento se cuantifica en una representación más gruesa a fin de llevar a cabo una elevada compresión de datos, es decir, una baja velocidad de transmisión de bits necesaria para almacenar o transmitir la 40 señal. En un intento por obtener ganancia de codificación por medio de compactación de energía en menos de N muestras (o, en otras palabras, por incrementar la calidad perceptual de la señal codificada para una velocidad de transmisión de bits dada), se han vuelto populares las transformaciones del banco de filtro de los segmentos previo a la cuantificación. Los sistemas recientemente desarrollados usan transformación ortogonal solapada de tiempo- respecto-a-frecuencia en la forma de la transformación de coseno, discreta, modificada (MDCT), permitiendo un 45 banco de filtro que los segmentos adyacentes se sobrepongan mientras permiten aún el muestreo crítico. Para un desempeño mejorado, las operaciones de MDCT, de avance e inversas, se combinan con la ponderación de cada segmento: en el lado central, se aplica una ventana de análisis wa(n) antes de la MDCT de avance y en el lado receptor, se aplica una ventana de síntesis ws(n) después de la MDCT inversa. Desafortunadamente, no todas las funciones de ponderación son adecuadas para utilizarse con la MDCT. Suponiendo ventanas predeterminadas (no 50 variantes en tiempo/espacio), se ha encontrado que con objeto de que la arquitectura completa produzca una perfecta reconstrucción de entrada en la ausencia de errores de cuantificación o de transmisión, la wa(n) y ws(n) deben seleccionarse como sigue:
wa(n)-ws(n) + wa(N/2+n)-ws(N/2+n) =1, n = 0,1,N/2-1. (1)
[0006] Si wa(n) y ws(n) son idénticas, es decir, wa(n)= ws(n)=w(n), la ecuación (1) se reduce a la condicionante
mejor conocida
w(nf + w{N/2+nf = 1, n = 0, 1,M2-1,
(2)
publicada en la referencia [7]. Para mejor compactación de energía, se adopta normalmente w(n) que es simétrica alrededor de n=N/2-1/2, es decir,
5
imagen1
En la norma de Codificación Avanzada de Audio (AAC) (referencia [8]), se encuentran disponibles dos funciones de ventana. Una es la ventana de seno, dada por
10
HW&) =sen(*•(*+1 (2)!N), (4)
la otra es una ventana derivada de Kaiser-Bessel (KBD) descrita en las patentes de Fielder y Davidson, titulada “Codificador, decodificador y codificador/decodificador de transformación de baja velocidad de transmisión de bits 15 para audio de elevada calidad”, patentes de E.U. 5109417 y 5142656. La última ventana también se utiliza en la norma de codificación AC-3 (Dolby Digital) (ATSC, Inc., “Norma de Compresión de Audio Digital (AC-3, E-AC-3), Revisión B”, documento A/52B, Junio 2005), regla no escrita en una configuración diferente (a=5). La especificación Vorbis (referencia [9]) define la ventana
20
[0007]
través de transformación Fourier, según la referencia [4]. Puede observarse que la ventana de seno tiene una selectividad de frecuencia exacta relativamente elevada (lóbulo principal angosto) y rechazo de banda de detención 25 relativamente bajo (atenuación de lóbulo lateral bajo). La ventana de KBD, por el contrario, tiene una elevada atenuación de banda de detención y baja selectividad de frecuencia exacta. La ventana Vorbis yace aproximadamente a la mitad entre las primeras dos ventanas.
[0008] Se ha encontrado que para ciertas aplicaciones, puede ser deseable ejercer un control más fino sobre la selectividad de banda de paso y el rechazo de la banda de detención de una ecuación (2) que satisface la función de ponderación. Más específicamente, se ha encontrado que para mejorar la eficiencia de codificación, puede ser necesario un parámetro de ventana a fin de adaptar continuamente las características de la ventana a aquellas del espectro de entrada. De las tres funciones arriba discutidas, solo la función de KBD ofrece tal parámetro, a, que puede variar para lograr diferentes relaciones de selectividad/atenuación. Sin embargo, esta función incorpora matemática computacionalmente costosa (función Bessel, seno hiperbólico, raíz cuadrada y división), prohibiendo potencialmente su re-cálculo para cada segmento de señal en dispositivos de baja potencia o en sistemas de tiempo real. Lo mismo aplica a la clase de funciones de ventana presentadas en el artículo de Sinha y Ferreira, titulado “Una Nueva Clase de Ventanas Complementarias de Potencia Uniforme y su Aplicación a Procesamiento de Señales de Audio”, AES 119 Convención, Octubre 2005, documento 6604, que requiere de operaciones de valor complejo, factorización espectral y transformación Fourier. También se ha encontrado que la interpolación entre dos funciones (por ejemplo, KBD y seno), más eficientemente por suma ponderada, puede utilizarse para controlar en cierto grado la respuesta de frecuencia, pero este enfoque ofrece solo flexibilidad limitada.
[0009] Una multitud de funciones de ventana, optimizadas hacia diferentes criterios, se ha documentado, por 45 ejemplo, en referencias [1], [2], [3], [4], [5]. Podría decirse que tres de las funciones más populares en uso en la
actualidad son las reportadas por von Hann, Hamming y Blackman.
[0010] En lo sucesivo, se describirán algunas funciones clásicas de ventana. En otras palabras, en lo sucesivo, las funciones de ventana antes mencionadas (por ejemplo, Hann, Hamming y Blackman) serán revisadas y
50 se identificará la ecuación de diseño general subyacente.
[0011] Por razones de consistencia y comparación con investigaciones seminales de funciones de ventana, la metodología y notación de Nuttall (ver, por ejemplo, referencia [4]) se adoptará en la presente discusión. En particular, permita que L denote la duración (longitud) de una realización de ventana, t la ubicación (tiempo) dentro
55 de la ponderación, y f la frecuencia dentro del espectro de densidad de potencia de la ventana, obtenidos por transformación Fourier de la función de ventana. Adicionalmente, todas las funciones de ventana se normalizarán
30
35
40
~sen(T¿2-sen2(ir{n+l/2)/A/)), n = 0, 1, AM, (5)
La Fig. 5 muestra las respuestas de frecuencia de la AAC y funciones de ventana Vorbis, obtenidas a
hasta una amplitud pico de uno. Ya que solo se estudiarán aquí las ventanas campaniformes, simétricas (preferentemente de longitud uniforme), esto implica que w(L/2)=1. La primera función de ponderación a considerarse se conoce como la función de Hann (o Hanning). Se especifica en la referencia [2] como
5
imagen2
para aplicaciones DSP (valores no negativos de t). Como se muestra en la referencia [2] y es evidente a partir de (11), la función de Hann es un caso especial de una clase de funciones seno con exponenciación:
10
imagen3
[0012] En la práctica, los enteros positivos se asignan típicamente a a. Observe que (12) también puede ser
escrito como la suma de un desplazamiento y un coseno a escala:
15
imagen4
[0013] Esta formulación permite una optimización de espectro en particular de la ventana de Hann (ver la
discusión a continuación con respecto a evaluación y optimización) mediante cambio del desplazamiento y el factor de escala. El resultado es la función de Hamming, cuyo cálculo exacto de parámetros se da en la referencia [4] 20 como
imagen5
[0014] Según se señala por Nuttall (ver, por ejemplo, referencia [4]), las ventanas de Hann y de Hamming son
25 realizaciones a doble término de una clase de funciones de término-(K+1) que deberán ser referidas como las funciones de suma de cosenos. Al simplificar la notación de Nuttall, pueden escribirse como
imagen6
30 para uso en aplicaciones de DSP. Esto iguala a la ecuación 11 de la referencia [4] con 1/L escalar omitido. También son comunes las implementaciones de triple término. Un caso simple es (15) con K=2 y factores
imagen7
35 lo cual es equivalente a (12) con a=4. De manera similar al enfoque de Hamming, Blackman, (ver, por ejemplo, referencia [1 ]) derivó la siguiente bk optimizada:
btí = 0.42, b} ~ 0.5, b, = 0.08 .
‘ (17)
[0015] Nuttall (ver, por ejemplo, referencia [4]) refinó aún más los valores de Blackman para una mejor respuesta de espectro cercana al campo (primeros lóbulos laterales, ver la discusión a continuación con respecto a evaluación y optimización):
5
bQ = 0.40897. b, = 0.5, b2 = 0.09103 .
(18)
[0016] El lector interesado se invita a revisar la referencia [4] para otras ventanas optimizadas de suma de cosenos de triple y de cuarto término. Una ventana alternativa se describe en el párrafo [0093] del documento EP-
10 1873753-A1. En vista de la discusión anterior, lo que se necesita es una función de ventana alternativa que tenga una complejidad computacional moderada, pero que proporcione una buena flexibilidad de diseño.
[0017] Según lo anterior, un objeto de la presente invención es crear un concepto para procesar las señales, que permita obtener una función de ventana con complejidad computacional moderada y buena flexibilidad de
15 diseño.
Resumen de la invención
[0018] Una realización según la invención crea un procesador de señal según la reivindicación 1. Esta 20 realización según la invención se basa en el hallazgo de que una formación de ventana de una señal de entrada
puede lograrse en una manera fácilmente ajustable mediante determinación de los valores de ventana del procesamiento de señal en la manera arriba descrita debido a una suma ponderada de un término lineal y pueden llevarse a cabo una o más funciones de configuración con un muy bajo esfuerzo computacional. No obstante, también se ha encontrado que la simetría en puntos de la una o más funciones de configuración y la evaluación de 25 una función seno para una pluralidad de valores de argumento trae consigo propiedades particularmente buenas de la ventana como, por ejemplo, buenas características de conservación de energía entre dos inclinaciones de ventana subsecuentes. Además, es fácilmente posible ajustar las características de la ventana definida por los valores de ventana del procesamiento de señal mediante modificación de la ponderación de la una o más funciones de configuración dependientes del uno o más parámetros de forma de ventana, de tal manera que pueden obtenerse 30 ventanas de diferentes características con un esfuerzo computacional comparativamente pequeño. Por ejemplo, el concepto aquí definido permite obtener un gran número de formas de ventana diferentes, que tienen todas las buenas características mencionadas, al variar la ponderación de la una o más funciones de configuración.
[0019] Además, debe observarse que usando el concepto arriba mencionado, un cálculo de ventanas que
35 tiene diferentes características, que pueden ajustarse con muy elevada granulación, no requiere de cálculos
particularmente difíciles, sino meramente requiere de la formación de una suma ponderada, para obtener valores de argumento, y la evaluación de una función seno usando los valores de argumento.
[0020] Otra realización según la invención crea un procesador de señal según la reivindicación 2. Esta 40 realización según la invención se basa en las mismas ideas que la realización anterior. Otras realizaciones según la
invención crean procedimientos según las reivindicaciones 3 y 4 y un programa de computadora según la reivindicación 5.
Breve descripción de las figuras 45
[0021] Las realizaciones según la invención se describirán posteriormente haciendo referencia a las figuras anexas en las cuales:
La Figura 1a muestra un diagrama de bloque esquemático de un procesador de señal, según una realización de la 50 invención;
La Figura 1b muestra un diagrama de bloque esquemático de un procesador de señal, según otra realización de la invención;
La Figura 2 muestra un diagrama de bloque esquemático de un procesador de señal, según otra realización de la invención;
55 La Figura 3 muestra un diagrama de bloque esquemático de un proveedor de ventana, según una realización de la invención;
La Figura 4 muestra una representación esquemática de una señal de medios codificada, según una realización de la invención;
La Figura 5 muestra una representación gráfica de respuestas de magnitud de frecuencia de las ventanas de Vorbis
y AAC a una escala de ordenadas dB;
La Figura 6 muestra una representación gráfica de las amplitudes de la función de ventana de KBD de AAC y una cierta instancia de la función inventiva;
La Figura 7 muestra una representación gráfica de la respuesta de magnitud de frecuencia de dicha instancia de la 5 función de ventana inventiva en comparación con la de la ventana de KBD de AAC sobre una abscisa lineal y escala de ordenada de dB;
La Figura 8 muestra una representación gráfica de la respuesta de magnitud de frecuencia de dicha instancia de la función de ventana inventiva en comparación con la de la ventana de KBD de AAC sobre una abscisa logarítmica y escala de ordenada dB;
10 La Figura 9 muestra una representación gráfica de las respuestas de magnitud de frecuencia de otras dos instancias de la función de ventana inventiva en comparación con aquellas de la KBD de AAC y las ventanas de Sinha-Ferreira de tercer orden;
La Figura 10 muestra, en un diagrama de bloque, el proceso de adaptación de señal para las funciones de ventana, inventivas y similares;
15 La Figura 11 muestra una representación gráfica de espectros de algunas funciones de seno con exponenciación según la ecuación (12);
La Figura 12 muestra una representación gráfica de espectros de funciones optimizadas de suma de cosenos según la ecuación (15);
La Figura 13 muestra una representación gráfica de las ventanas optimizadas de suma de senos, propuestas, 20 según la ecuación (19);
La Figura 14 muestra una representación gráfica de espectros DFT de dos sinusoides con frecuencias de Lf=32 y 96.5, después de aplicar diferentes funciones de ventana; y
La Figura 15 muestra una representación gráfica de espectros de dos ventanas de PC y ventana propuesta.
La Figura 16 muestra una representación esquemática de una ventana.
25
Descripción detallada de las realizaciones
1. Procesador de señal según la Fig. 1a
30 [0022] La Fig. 1 muestra un diagrama de bloque esquemático de un procesador de señal 100 según una
primer realización de la invención. El procesador de señal 100 se configura para recibir una señal de entrada 110 y proporcionar, en base a lo mismo, una versión procesada 112 de la señal de entrada. El procesador de señal 100 comprende un proveedor de ventana 120 configurado para enmarcar una porción de la señal de entrada 110, o una versión pre-procesada 110' de la misma (la cual puede obtenerse mediante un pre-procesamiento opcional 111), 35 dependiente de una ventana de procesamiento de señal descrito por los valores de ventana de procesamiento de señal 122 para una pluralidad de valores índice de valor de ventana n, con objeto de obtener la versión procesada 112 de la señal de entrada (o una versión 112' de la señal de entrada que experimenta postprocesamiento adicional en un postprocesador opcional 130).
40 [0023] Para este propósito, el proveedor de ventana 120 recibe los valores de ventana de procesamiento de
señal w(n) a partir de un proveedor de ventana 130, el cual también es típicamente parte del procesador de señal 100. El proveedor de ventana 130 se configura para proporcionar los valores de ventana de procesamiento de señal w(n) para una pluralidad de valores índice de valor de ventana n dependientes de uno o más parámetros de forma de ventana 132. El proveedor de ventana se configura para evaluar una función seno para una pluralidad de valores 45 de argumento c'(n) asociados con los valores índice de valor de ventana n, a fin de obtener los valores de ventana de procesamiento de señal w(n). El proveedor de ventana 130 también se configura para calcular una suma ponderada de un término lineal, por ejemplo, designado con c(n), el cual es linealmente dependiente del valor índice de valor de ventana n, y valores de función de una o más funciones de configuración. La una o más funciones de configuración representan valores índice de valor de ventana n sobre valores de función correspondientes. La una o 50 más funciones de configuración son simétricas por puntos con respecto a un centro de una inclinación de ventana. Un cálculo de la suma ponderada se lleva a cabo para obtener los valores de argumento c'(n).
[0024] De acuerdo con lo anterior, el proveedor de ventana 130 proporciona valores de ventana de
procesamiento de señal w(n) que describen ventanas que tienen características particularmente buenas. La 55 aplicación de una evaluación de función seno en el proveedor de ventana, con objeto de obtener el valor de ventana de procesamiento de señal w(n), permite obtener ventanas que tienen buenas características de conservación de energía para el caso en que se sobreponen dos inclinaciones de ventana correspondientes. Además, al usar valores de argumento c'(n) para la evaluación de la función seno que no son una función lineal de los valores índice del valor de ventana (también designados brevemente como “valores índice”), sino más bien una superposición de un término 60 lineal, que es linealmente dependiente de los valores índice y los valores de función de una o más funciones de configuración que no son lineales y son simétricas por puntos con respecto a un centro de una inclinación de ventana, es posible ajustar una forma de la ventana de procesamiento de señal descrita por los valores de ventana
de procesamiento de señal w(n).
[0025] Por ejemplo, es posible ajustar las contribuciones de las una o más funciones de configuración sobre los valores de argumento c'(n), de tal manera que puedan obtenerse diferentes evoluciones de los valores de
5 argumento (como una función del valor de índice n) dependiendo del uno o más parámetros de forma de ventana 132. De acuerdo con lo anterior, las características de la ventana de procesamiento de señal descritas por los valores de ventana de procesamiento de señal pueden ajustarse a las necesidades particulares dependientes del uno o más parámetros de forma de ventana 132. Además, se ha encontrado que la selección de una o más funciones de configuración, que son simétricas por puntos con respecto a un centro de una inclinación de ventana, 10 ayuda a asegurar buena conservación de energía y características de compactación de la ventana de procesamiento de señal y también proporciona una oportunidad de reducir un esfuerzo computacional para calcular los valores de argumento.
[0026] Los detalles con respecto al cálculo de los valores de ventana de procesamiento de señal wnew(n), los 15 cuales pueden tomar el lugar de los valores de ventana de procesamiento de señal w(n), se describirán a
continuación.
2. Procesador de señal según la Fig. 1b
20 [0027] La Fig. 1b muestra un diagrama de bloque esquemático de un procesador de señal 150, el cual es
similar al procesador de señal 100. De acuerdo con lo anterior, se designan medios y señales idénticos con números de referencia idénticos. Sin embargo, el procesador de señal 150 comprende un proveedor de ventana 180, el cual es diferente del proveedor de ventana 130. El proveedor de ventana 180 recibe uno o más parámetros de forma ck 182 y proporciona, en base a los mismos, valores de ventana de procesamiento de señal w(t), que se designan, por 25 ejemplo, con wc(t). Debe observarse aquí que la variable t es un valor índice de valor de ventana, y también se designa brevemente como “valor índice”.
[0028] El proveedor de ventana 180 se configura para proporcionar los valores de ventana de procesamiento
de señal w(t) para una pluralidad de valores índice de valor de ventana t dependientes de uno o más parámetros de 30 forma de ventana ck. El proveedor de ventana 180 se configura para calcular una suma ponderada de valores de función de una pluralidad de funciones de configuración de tipo seno, que representan valores índice de valor de ventana sobre valores de función correspondientes, a fin de obtener los valores de ventana de procesamiento de señal w(t). La ponderación de los valores de función se determina por los parámetros de forma de ventana ck.
35 [0029] Al proporcionar los valores de ventana de procesamiento de señal que utilizan el proveedor de
ventana 180, pueden proporcionarse los valores de ventana de procesamiento de señal de tal manera que comprendan características suficientemente buenas en muchos casos. También es posible ajustar las características específicas usando el uno o más parámetros de forma de ventana ck, de tal manera que puedan obtenerse diferentes ventanas de procesamiento de señal para una opción diferente de uno o más parámetros de forma de 40 ventana.
[0030] Al usar funciones de configuración de tipo seno y formar una suma ponderada de los valores de función de dichas funciones de ponderación de tipo seno, se obtienen las ventanas que tienen buenas características, según se discutirá con mayor detalle a continuación.
45
[0031] Además, debe observarse que se discutirán a continuación los detalles con respecto al cálculo de los valores de ventana de procesamiento de señal w(t), los cuales se proporcionan por el proveedor de ventana 180.
3. Procesador de señal según la Fig. 2 50
[0032] La Fig. 2 muestra un diagrama de bloque esquemático de un procesador de señal 200, según una realización de la invención. El procesador de señal 200 se configura para recibir una señal de entrada 210 y para proporcionar, en base a lo mismo, una versión procesada 212 de la señal de entrada.
55 [0033] El procesador de señal 200 comprende un proveedor de ventana 220 configurado para enmarcar una
porción de la señal de entrada 210, o de una versión pre-procesada 210 de la misma, dependiente de una ventana de procesamiento de señal descrita por valores de ventana de procesamiento de señal para una pluralidad de valores índice de valor de ventana (designados brevemente como “valores índice”), con objeto de obtener la versión procesada 212 de la señal de entrada. El procesador de señal 200 puede comprender un pre-procesamiento 60 opcional 211 y un post-procesamiento opcional 213.
[0034] Los valores de ventana de procesamiento de señal son valores de resultado de una evaluación de
función seno para una pluralidad de valores de argumento asociados con valores índice de valor de ventana, en donde los valores de argumento son sumas ponderadas de un término lineal, que es linealmente dependiente de los valores índice de valores de ventana, y valores de función de una o más funciones de configuración de tipo seno, cuyas una o más funciones de configuración de tipo seno representan valores índice de valor de ventana sobre 5 valores de función correspondientes. La una o más funciones de configuración de tipo seno son simétricas por puntos con respecto a un centro de una inclinación de ventana.
[0035] El proveedor de ventana 220 puede llevar a cabo, en consecuencia, una formación de ventana, que es
muy similar a la formación de ventana llevada a cabo por el proveedor de ventana 120. Por ejemplo, los valores de
10 ventana de procesamiento de señal usados por el proveedor de ventana 220 pueden ser idénticos a los valores de ventana de procesamiento de señal usados por el proveedor de ventana 120. Los valores de ventana de procesamiento de señal usados por el proveedor de ventana 220 pueden almacenarse, por ejemplo, en una tabla de búsqueda o pueden obtenerse de otro modo.
15 [0036] En realizaciones alternativas, pueden utilizarse diferentes valores de ventana de procesamiento de
señal. En una realización alternativa, los valores de ventana de procesamiento de señal son valores de resultado de una suma ponderada de valores de función de una pluralidad de funciones de configuración de tipo seno, que representan valores índice de valor de ventana sobre valores de función correspondientes.
20 [0037] Para concluir, el proveedor de ventana 220 puede configurarse, por ejemplo, para aplicar una ventana
descrita por valores de ventana de procesamiento de señal wnew(n) a la señal de entrada 210, o a la versión preprocesada 211' de la misma. Sin embargo, de manera alternativa, el proveedor de ventana 220 puede aplicar los valores de ventana de procesamiento de señal wc(t) a la señal de entrada 210 o a la versión pre-procesada 210' de la misma.
25
[0038] Podrían describirse a continuación los detalles con respecto a las ventanas de procesamiento de señal aplicadas por el proveedor de ventana 220.
4. Proveedor de ventana según la Fig. 3
30
[0039] La Fig. 3 muestra un diagrama de bloque esquemático de un proveedor de ventana 300 según una realización de la invención. El proveedor de ventana 300 se configura para recibir uno o más parámetros de forma de ventana 310, que son típicamente valores variables, y para proporcionar, en base a lo mismo, un conjunto de valores de ventana de procesamiento de señal w(n) 312 para una pluralidad de valores índice de valor de ventana.
35 El proveedor de ventana 300 se configura para evaluar una función seno para una pluralidad de valores de argumento asociados con los valores índice de valor de ventana, a fin de obtener los valores de ventana de procesamiento de señal w(n). El proveedor de ventana también se configura para calcular una suma ponderada de un término lineal, algunas veces designado con c(n), el cual es linealmente dependiente de los valores índice de valor de ventana n y valores de función de una o más funciones de configuración. La una o más funciones de
40 configuración representan valores índice de valor de ventana n sobre valores de función correspondientes. La una o más funciones de configuración son simétricas por puntos con respecto a un centro de una inclinación de ventana.
[0040] De acuerdo con lo anterior, el proveedor de ventana 300 cumple esencialmente la funcionalidad del proveedor de ventana 130. Sin embargo, debe observarse que el proveedor de ventana 300 puede ser un
45 componente que es independiente del proveedor de ventana 130. Sin embargo, de manera alternativa, el proveedor de ventana 300 puede cumplir la funcionalidad del proveedor de ventana 180.
5. Señal de medios codificada según la Fig. 4
50 [0041] En lo sucesivo, se describirá una señal de medios codificada. En la Fig. 4 se muestra una
representación esquemática de tal señal de medios codificada. La señal de medios codificada 400 comprende una representación codificada de un contenido de medios y parámetros de forma de ventana. Los parámetros de forma de ventana se adaptan, por ejemplo, para servir como el uno o más parámetros de forma de ventana 132 para el proveedor de ventana 130 o para servir como el uno o más parámetros de forma de ventana 132 para el proveedor
55 de ventana 180. Según lo anterior, los parámetros de forma de ventana en la señal de medios codificada 400 se seleccionan para producir valores de ventana de procesamiento de señal w(n) o w(t) usando el proveedor de ventana 130 o el proveedor de ventana 180. También, la representación codificada del contenido de medios se codifica utilizando típicamente una formación de ventana de acuerdo con una ventana descrita por los parámetros de forma de ventana.
60
6. Detalles con respecto a las ventanas proporcionadas por el proveedor de ventana 130 o usadas por el proveedor de ventana 220
6.1 Aspectos generales y definiciones
[0042] En lo sucesivo, se describirán algunos detalles con respecto a las ventanas proporcionadas por el 5 proveedor de ventana 130, cuyas ventanas también pueden utilizarse por el proveedor de ventana 220. Debe
observarse aquí que las ventanas se definen aquí mediante valores de ventana de procesamiento de señal w(n). Dichos valores de ventana de procesamiento de señal w(n) se multiplican típicamente con la señal de entrada 110, o la versión preprocesada 110' de la misma, a fin de obtener una versión enmarcada de la señal de entrada, o de la versión preprocesada 110' de la misma. Una ventana se describe típicamente por los valores de ventana de 10 procesamiento de señal w(n), donde n es un valor índice (por ejemplo, un valor índice de tiempo) que designa los valores de ventana del procesador de señal.
[0043] Además, debe observarse que una ventana típicamente comprende una inclinación de ventana de lado izquierdo y una inclinación de ventana de lado derecho. Una ventana puede comprender además,
15 opcionalmente, una porción central constante (o aproximadamente constante), de tal manera que un número de valores de ventana de procesamiento de señal central toman un valor predeterminado. Sin embargo, debe observarse que una inclinación de ventana de lado izquierdo y una inclinación de ventana de lado derecho de una ventana pueden ser diferentes. De acuerdo con lo anterior, debe señalarse que la siguiente discusión describe substancialmente una forma de una sola inclinación de ventana, es decir, de una transición entre un pequeño valor 20 de ventana (por ejemplo, un valor de ventana cero) y un valor de ventana grande (por ejemplo, un valor de ventana máximo de uno).
[0044] Tomando como referencia ahora la Fig. 16, que muestra una representación esquemática de una ventana, esto se explicará en más detalle en la representación gráfica de la Fig. 16, una abscisa 1610 describe el
25 valor índice n, y una ordenada 1612 describe los valores de ventana de procesamiento de señal w(n) asociados con los valores índice n. Como puede observarse, la ventana 1600 comprende una porción de ventana de lado izquierdo 1620 y una porción de ventana de lado derecho 1622. La porción de ventana de lado izquierdo comprende, como un elemento clave, una inclinación de ventana de lado izquierdo 1630. La inclinación de ventana de lado izquierdo 1630 se define, por ejemplo, por una pluralidad de valores de ventana de procesamiento de señal w(n) para n=m hasta 30 n=n2. La porción de ventana de lado izquierdo 1620 puede comprender también, opcionalmente, una porción externa de lado izquierdo, para la cual los valores de ventana de procesamiento de señal w(n) toman un valor pequeño de, por ejemplo, w(n)=0. La porción de ventana de lado izquierdo opcionalmente comprende también una parte de una porción de ventana central, para la cual los valores de ventana de procesamiento de señal w(n) toman un valor predeterminado de, por ejemplo, w(n)=1. La ventana 1600 comprende una porción de ventana de lado derecho 1622, 35 que comprende, como un elemento clave, una inclinación de ventana de lado derecho 1640. La porción de ventana de lado derecho puede comprender opcionalmente una parte de una porción de ventana central, para la cual los valores de ventana de procesamiento de señal toman un valor predeterminado de, por ejemplo, w(n)=1. La porción de ventana de lado derecho también puede comprender, opcionalmente, una porción externa de lado derecho, para la cual los valores de ventana de procesamiento de señal w(n) toman un valor pequeño de, por ejemplo, w(n)=0.
40
[0045] Debe observarse que la porción externa de lado izquierdo, la porción de ventana central y la porción de ventana externa de lado derecho deben considerarse como opcionales. También debe observarse que la ventana 1600 puede ser simétrica o asimétrica. Por lo tanto, la inclinación de ventana de lado izquierdo 1630 y la inclinación de ventana de lado derecho 1640 pueden ser iguales, o pueden ser significativamente diferentes en algunas
45 realizaciones.
[0046] Debe observarse aquí que la siguiente discusión se refiere substancialmente a la inclinación de ventana de lado izquierdo 1630, es decir, a una transición entre valores de ventana pequeño o cero y un valor de ventana grande o máximo. Sin embargo, debe observarse que una ventana general 1600 puede obtenerse del
50 conocimiento de la inclinación de ventana de lado izquierdo 1630 al agregar opcionalmente una porción externa de lado izquierdo y al agregar opcionalmente una porción de ventana central y al agregar una inclinación de ventana de lado derecho y al agregar opcionalmente una porción externa de lado derecho. Debe observarse también que la inclinación de ventana de lado derecho 1640 puede obtenerse del mismo modo que una inclinación de ventana de lado izquierdo usando un simple proceso de reflejo, tal como el de la ecuación (3).
55
[0047] También debe observarse aquí que según la siguiente discusión, la inclinación de ventana de lado izquierdo debe describirse por valores w(n) para n=0 hasta n=N/2-1. Sin embargo, un uso de los diferentes valores índice es naturalmente posible.
60 6.2 Detalles de la ventana wnew(n)
[0048] Las realizaciones según la invención se dirigen a la falta de funciones de ventana computacionalmente
eficientes y flexibles para aplicaciones de MDCT al declarar una extensión hacia las funciones de ventana de seno de la ecuación (4).
[0049] Observe que la ecuación (4) puede considerarse como el seno de una función de ventana triangular
5 simétrica aproximadamente a n=N/2-1/2. Dada la ecuación (3), esto implica
c(rí) = (n+myi/N,
(6)
(*) (nJ2 ■c{n)\ w = % 3.....N/2-\, (7)
10
donde c(n) denota la función de núcleo de ventana, que puede calcularse por adelantado ya que se encuentra predeterminada. La extensión propuesta es agregar a c(n) en la ecuación (7) sinusoides ponderados que tienen frecuencias angulares que son múltiplos enteros de 2p:
15
c\n) = c(n) + Xo/’Sen(2n/d(M)), Jp 1 f 2, (8)
“W* (h) = sen'c\n)), n = 0, 1 f ..., A72- í; (?)
[0050] Los términos seno en c'(n) también pueden calcularse por adelantado. Solo su ponderación, según se
20 especifica por los factores af, necesita adaptarse. Por lo tanto, cuando se ajusta la ventana propuesta a una señal sobre una base de transformación-por-transformación, solo la ecuación (9) y la ponderación en la ecuación (8) tienen que recalcularse, haciendo la adaptación computacionalmente menos compleja que la de las ventanas de Sinha-Ferreira y KBD.
25 [0051] Además, es importante mencionar que, debido a los términos seno en las ecuaciones (8) y (9), cada
realización de la clase propuesta de funciones de ventana se atenúa completamente hasta cero en sus puntos terminales, lo cual asegura una atenuación de nivel de lóbulo lateral de al menos 12 dB por octavo en la respuesta de frecuencia de la ventana. Este no es el caso con la ventana de KBD y las ventanas publicadas en el artículo de Princen y Bradley, “Diseño de Banco de Filtro de Análisis/Síntesis En Base A Cancelación de Solapamiento de 30 Dominio de Tiempo”, IEEE Trans. Acoustics, Speech, and Signal Processing, Octubre 1986, págs. 1153-1161 y en el artículo de Ferreira, “Efectos Convolucionales en Codificación de Transformación con TDAC: Una Ventana Óptima”, IEEE Trans. Speech and Audio Processing, Marzo 1996, págs. 104-114, cuyos lóbulos laterales de frecuencia alejada se atenúan por consiguiente hasta menos de 12 dB por octavo. Para amplitudes de lóbulo principal iguales, esto representa que una ventana según las ecuaciones (8) y (9) potencialmente mejora las ventanas de la técnica 35 anterior en términos de atenuación de lóbulo lateral de frecuencia alejada.
[0052] El cálculo o adaptación de una ventana según la presente invención comprende las siguientes etapas:
- Seleccionar el número de términos seno en c'(n) y los factores de ponderación adecuados en base a 40 consideraciones de diseño.
- Determinar o definir la longitud de ventana N y calcular c'(n) con la af seleccionada y el número de términos seno.
- Calcular wnueva(n) de la ecuación (9) para n=0, 1, ..., N/2-1, empleando entonces la ecuación (3) para obtener una instancia de ventana de longitud-N.
- Si se utiliza un cálculo de parámetros de ventana diferente para el segmento adyacente, precedente, satisfacer 45 cualquier condicionante de inversión perfecta ya sea mediante corrección de la mitad derecha de la instancia de
ventana precedente, o mediante corrección de la mitad izquierda de la instancia de ventana actual, o mediante corrección de ambas mitades, derecha de la instancia precedente e izquierda de la instancia actual.
[0053] En una realización preferida, la función de ventana es comparable con las ventanas de seno y Vorbis 50 con respecto a complejidad computacional, pero proporciona al menos la flexibilidad de diseño de las ventanas de
KBD y Sinha-Ferreira.
[0054] Con respecto a lo anterior, debe observarse que los valores de c'(n) pueden considerarse como valores de argumento asociados con los valores índice de valor de ventana n. También, debe observarse que las
55 funciones sen(2pfc(n)) pueden considerarse como funciones de configuración.
[0055] También, debe observarse que no es necesario utilizar funciones seno como las funciones de
configuración. Más bien, puede ser suficiente seleccionar las funciones de configuración de tal manera que las
funciones de configuración sean simétricas por puntos con respecto a un centro de una inclinación de ventana. El centro de la inclinación de ventana se define, por ejemplo, por un valor del término lineal c(n)=0,5. Por ejemplo, las funciones polinominales simétricas por puntos pueden utilizarse en lugar de las funciones seno, lo cual puede facilitar la evaluación en algunos casos. También, las funciones de configuración deben tomar preferentemente un 5 valor que sea lo suficientemente cercano a cero para c(n)=0 y c(n)=1, es decir, en un ambiente de un valor índice de valor de ventana en el extremo izquierdo de la inclinación de ventana y en un ambiente del valor índice de valor de ventana en el extremo derecho de la inclinación de ventana. En otras palabras, las funciones de configuración deben tener ceros, o deben tomar aproximadamente valores de cero, en los ambientes (o inmediaciones) del valor índice de valor de ventana en el extremo izquierdo (por ejemplo, n=0) y el valor índice de valor de ventana en el extremo 10 derecho (por ejemplo, n=N/2-1).
[0056] Además, debe observarse que las ecuaciones (6) y (7) pueden evaluarse, por ejemplo, mediante el cálculo de valor de argumento del proveedor de ventana 130, y que la ecuación (9) puede evaluarse mediante la evaluación de función seno del proveedor de ventana 130. De acuerdo con lo anterior, los valores wn ueva (n)
15 obtenidos por la evaluación de la función seno del proveedor de ventana 130 para n=0 hasta n=N/2-1 pueden describir, por ejemplo, una inclinación de ventana de lado izquierdo 1630.
[0057] El proveedor de ventana 130 puede configurarse, en consecuencia, para ensamblar una ventana entera 1610 en base a dichos valores de ventana de procesamiento de señal, asociados con una inclinación de
20 ventana de lado izquierdo. Para este propósito, el proveedor de ventana puede agregar una porción externa de lado izquierdo, una porción de ventana central, una inclinación de ventana de lado derecho y una porción externa de lado derecho, como se muestra en la Fig. 16. La inclinación de ventana de lado derecho puede obtenerse mediante elaboración de un reflejo de la inclinación de ventana de lado izquierdo para el caso de una ventana simétrica. Sin embargo, de manera alternativa, la inclinación de ventana de lado derecho puede ser diferente de la inclinación de 25 ventana de lado izquierdo, y puede obtenerse mediante elaboración de un reflejo de una inclinación de ventana, obtenido para parámetros de forma de ventana diferentes a los de la inclinación de ventana de lado izquierdo.
[0058] También, debe observarse que puede asegurarse por el procesador de señal que una inclinación de transición de lado derecho, asociada con una porción precedente de la señal de entrada y una inclinación de
30 transición de lado izquierdo, asociada con una porción posterior de la señal de entrada, se igualan ya que se satisfacen las condicionantes de inversión perfecta. Para este propósito, puede asegurarse que la inclinación de ventana de lado izquierdo asociada con la porción posterior de la señal de entrada se obtenga utilizando los mismos parámetros que se han aplicado para la obtención de la inclinación de ventana de lado derecho, asociada con la porción precedente de la señal de entrada.
35
[0059] Además, debe observarse que el algoritmo definido por las ecuaciones (6), (8) y (9) es muy adecuado para un cálculo en línea de las funciones de ventana en un aparato que tiene potencia computacional limitada.
[0060] No obstante, las ventanas según se definen por las ecuaciones (6), (8) y (9) pueden evaluarse una 40 vez, y los resultados de lo mismo pueden almacenarse en una tabla de búsqueda para uso posterior en algunas
realizaciones.
6.3. Comentarios sobre el diseño de ventana
45 [0061] En lo sucesivo, se discutirán algunas condiciones que dan como resultado ventanas que tienen
características particularmente buenas. No obstante, debe observarse que la obediencia de las condiciones discutidas en lo sucesivo no debe considerarse esencial.
[0062] Como se mencionó en la discusión de la sección de Antecedentes, los codificadores de señal que
50 emplean la MDCT necesitan imponer ciertas condiciones sobre la función de ventana aplicada a la señal con objeto de permitir que el sistema entero sea completamente invertible, es decir, ofrecen reconstrucción de entrada perfecta, cuando no se llevan a cabo manipulaciones de señal. Las funciones conforme a la ecuación (2), también conocidas como funciones complementarias de potencia, representan una categoría adecuada.
55 [0063] Todas las realizaciones de la presente clase de ventana pertenecen a esta categoría. Sin embargo,
puede mostrarse que las realizaciones con c'(n) no negativos para toda n desplegada,
imagen8
60 producen selectividad de banda de paso particularmente buena y rechazo de banda de detención de manera simultánea. Por consiguiente, la siguiente discusión se enfocará en este subconjunto de la clase de ventana. En
algunos casos, solo las realizaciones con c'(n) no negativo para toda n desplegada producen selectividad de banda de paso satisfactoria y rechazo de banda de detención de manera simultánea.
[0064] Aunque en general es posible usar un número arbitrario de términos seno en la ecuación (8) para
5 designar respuestas de frecuencia de ventana ancladas al caso de uso dado, se descubrió que dos términos seno (f=1, 2) proporcionan una relación adecuada entre flexibilidad, complejidad y uso de memoria. En particular, al usar dos términos seno, pueden derivarse parámetros que
- minimizan la amplitud del lóbulo principal, es decir, maximizan la selectividad de frecuencia exacta,
10 - minimizan el nivel máximo de lóbulo lateral por encima de una cierta frecuencia normalizada,
- maximizan la velocidad de atenuación del lóbulo lateral, es decir, la atenuación de banda de detención de frecuencia alejada,
- minimizan la diferencia máxima en una instancia de ventana de referencia existente
15 de una instancia de ventana. Cada una de estas consideraciones de diseño se examinará a continuación con la ayuda de ejemplos específicos.
6.3.1 Ventanas con máxima selectividad de banda de paso
20 [0065] Aunque la condición de complementariedad de potencia de la ecuación (2) limita el rango de
respuestas de frecuencia que pueden lograrse, especialmente con respecto a la amplitud y nivel de unos cuantos primeros lóbulos laterales, la función de ventana que conduce al lóbulo principal más angosto puede obtenerse mediante establecimiento de todos los factores af en c'(n) en cero. La ventana resultante, como es fácilmente aparente, iguala la ventana seno de AAC de la ecuación (4). Su espectro se ilustra en la Fig. 5 junto con aquellos de 25 las ventanas de Vorbis y KBD(a=4).
[0066] Sin embargo, en resumen, debe observarse que preferentemente al menos uno de los parámetros de forma de ventana af debe fijarse en valor diferente de cero. No obstante, la estructura arriba descrita del proveedor de ventana 113 da la flexibilidad para obtener incluso la ventana de seno AAC sin señal específica alguna al
30 determinar meramente los parámetros de forma de ventana af.
6.3.2 Ventanas con máximo lóbulo lateral mínimo
[0067] Las configuraciones de la ecuación (9) que minimizan el máximo nivel de lóbulo lateral pueden 35 adquirirse mediante optimización conjunta de los parámetros af, ya sea mediante procedimientos de búsqueda
exhaustivos o en base a gradientes. Sin embargo, respecto a la ecuación (2), es recomendable definir un límite de frecuencia inferior Nw>1,5 por encima del cual se lleva a cabo la optimización minimax. Se encontró que un valor de Nw=4,5 produce los parámetros a1=0,1224 y a2=0,00523. La función de ventana así configurada se muestra en la Fig. 6. La similitud con la función de ventana de KBD de AAC, que también se ilustra, es evidente. Los espectros de 40 ventana correspondientes se muestran en la Fig. 7. Es importante observar que el nivel inferior de los primeros dos lóbulos laterales de la ventana inventiva cuando se comparan con la ventana de KBD, así como también la reducción en el nivel de lóbulo lateral máximo por encima de Nw»5 (los primeros tres lóbulos laterales de la ventana propuesta por encima de esta frecuencia tienen un nivel de -66,8 dB, mientras que la ventana de KBD alcanza un nivel algo superior de -63,0 dB).
45
[0068] Debido al uso de términos seno en c’(n), cada realización de la presente clase de ventana es continua y, por lo tanto, garantiza una atenuación uniforme hasta cero en sus puntos terminales. Esta ventaja se ilustra en la Fig. 8. Como puede observarse, los lóbulos laterales de la ventana previamente derivada caen a una velocidad de 12 dB por octavo. En contraste, la ventana de KBD exhibe una menor velocidad de caída, siendo la razón ligeras
50 discontinuidades en los puntos terminales de la función de ponderación de KBD. Como resultado, la ventana propuesta logra mayor rechazo que la ventana de KBD por encima de Nw=250 aún cuando se mejora por lo último entre Nw=250 y Nw»7. En algunas aplicaciones de análisis o síntesis, esta característica puede ser benéfica.
6.3.3 Ventanas con máxima atenuación de lóbulo lateral 55
[0069] En ciertos casos, podría ser deseable utilizar ventanas cuyos lóbulos laterales se atenúan a velocidades mayores de 12 dB por octavo. La presente invención permite la construcción de, por ejemplo, una ventana que disminuye a 24 dB por octavo. Esto se logra al requerir un primer diferencial continuo de la función de ponderación, es decir, un diferencial de anulación en los límites de la instancia de ventana. La solución más intuitiva
60 a este problema es la configuración a1=0,1591, a2=0. La respuesta de ventana resultante se ilustra en la Fig. 9 junto con otras tres respuestas que se discuten en lo sucesivo.
6.3.4 Ventanas que se aproximan a ventanas de referencia
[0070] Para completar esta demostración de la flexibilidad de la clase de ventana propuesta, se hace un 5 intento por crear dos realizaciones de ventana que semejan exactamente dos ventanas existentes. Debido a su
diversidad, las funciones de KBD (a=4) y de Sinha-Ferreira de tercer orden se seleccionan como referencias. La reconstrucción a través de c’(n) y la ecuación (9) se enfoca en un sentido de mínimos cuadrados, es decir, mediante reducción de la diferencia cuadrada entre referencia y aproximación (observe que también son posibles otros procedimientos). La Fig. 9 muestra el resultado. Puede observarse que las ventanas inventivas son casi idénticas a 10 sus contrapartes de la técnica anterior y que las principales diferencias ocurren solo a niveles muy bajos. En ambientes críticos de complejidad o de memoria, las ventanas de referencia podrían sustituirse, por consiguiente, por un dispositivo que use la presente clase de ventana mientras mantiene un alto grado de compatibilidad de fondo y, si es aplicable, la posibilidad de reconstrucción casi-perfecta.
15 7. Implementación de un sistema adaptable a la señal
[0071] Una ventaja adicional de la clase de ventana presentada surge cuando un sistema procesa segmentos de señal de diferentes longitudes, relacionándose las longitudes por potencias enteras de 2. En AAC, por ejemplo, este procedimiento, que también se conoce como conmutación de bloque, se realiza mediante la aplicación de la
20 MDCT ya sea una vez en 2048 (1920) u 8 veces en 256 (240) muestras por estructura. Aquí, los subconjuntos de los términos individuales en la ecuación (8), por ejemplo, n = 0, 1, ..., N/8-1, pueden re-utilizarse como funciones de núcleo para las ventanas de menor longitud o, en caso de los términos seno, incluso como funciones de ventana en sí. Si una flexibilidad de diseño reducido para las ventanas de baja longitud es aceptable, esto puede explotarse para reducir aún más la capacidad de memoria requerida para almacenar las funciones de núcleo.
25
8. Aplicaciones adicionales de la invención
[0072] Las funciones de ventana complementaria de potencia tales como las reportadas en la presente pueden ser bastante atractivas para varios escenarios de aplicación diferentes de codificación de audio o video.
30 Como se observó en el documento citado en el párrafo 6 de la sección de Antecedentes, las ventanas complementarias de potencia pueden emplearse en sistemas de conmutación o desvanecimiento cruzado de preservación de energía instantánea, así como también dispositivos de análisis y procesamiento de señal que operan en una base de bloque-por-bloque con sobreposición entre bloques sucesivos. Hablando de manera más general, cualquier aparato que lleva a cabo labores de filtración sobre una señal de una o más dimensiones, puede 35 usar ventanas del presente informe en la construcción de su núcleo(s) de filtración, incluyendo, pero sin limitarse a,
- filtros de paso elevado (diferenciación), paso bajo (integración) y paso de banda,
- prototipo descendente (filtros de decimación) y prototipo ascendente (filtros de interpolación),
- ecualizadores de múltiple banda o de banda individual, compresores, expansores y limitadores,
40 - algoritmos para reducción de ruido y mejora relacionada o herramientas de efectos.
[0073] Al adoptar en tales sistemas la función de ventana inventiva aquí presentada y anclando sus características espectrales a requisitos de aplicación, preferentemente en una forma que se adapte a un segmento de señal, se espera que puedan lograrse incrementos en el desempeño perceptual.
45
9. Codificador de señal de medios y decodificador de señal de medios según la Fig. 10
[0074] La Fig. 10 muestra un diagrama de bloque esquemático de un codificador de señal de medios y de un decodificador de señal de medios. El codificador de señal de medios 1010 se configura para recibir una o más
50 señales de canal s1(n) a sM(n) y para proporcionar, en base a lo mismo, una representación codificada. La representación codificada de las señales de medios de entrada puede tomar la forma de coeficientes de MDCT S1(k) a SM(k), o puede ser una representación codificada de tales coeficientes de MDCT. El codificador de señal 1010 comprende, por ejemplo, una pluralidad de trayectorias de señal idénticas 1012a-1012m, que pueden operar de manera independiente o que pueden acoplarse. Además, el codificador de señal 1010 también comprende un
55 cálculo de parámetro de codificación 602, el cual determina uno o más de los parámetros de codificación como, por ejemplo, una longitud de bloque, un parámetro de configuración de ruido temporal (TNS), un parámetro de compensación de ganancia de sub-banda, una información de configuración y/o una información de modelo psicoacústico. En lo sucesivo, se discutirá una trayectoria o ramificación 1012a, pero la discusión anterior también es aplicable a ramificaciones adicionales como, por ejemplo, la ramificación 1012m.
60
[0075] La ramificación 1012a comprende una detección de ventana 603, que recibe la señal de entrada s1(n) del canal respectivo e información proveniente del determinador de parámetro de codificación 602. La detección de
ventana 603 puede proporcionar, por ejemplo, una información de forma de ventana 603a, que describe una forma de una ventana deseada.
[0076] La información de forma de ventana puede determinarse, por ejemplo, a partir de la entrada al
5 detector de ventana 603 de tal manera que se optimice o mejore el desempeño objetivo (ganancia de codificación, selectividad de frecuencia o compactación de energía, compresión de datos, cantidad de solapamiento introducida) o desempeño subjetivo (calidad perceptual de la salida codificada después de la transmisión y decodificación libre de errores o errónea) del codificador 1010.
10 [0077] La ramificación 1012a también comprende una sincronización de ventana 604, que debiera
considerarse como opcional, y que puede combinar la información de forma de ventana proporcionada por la detección de ventana 603 de la presente ramificación 1012a con la información de forma de ventana provista por detectores de ventana de diferentes ramificaciones. De acuerdo con lo anterior, una información de forma de ventana sincronizada 604a puede proporcionarse opcionalmente por la sincronización de ventana 604. La trayectoria 15 de señal 1012a también comprende una aplicación de reconstrucción perfecta 605, que se configura para recibir la información de forma de ventana 603a, o la información de forma de ventana sincronizada 604a, y a fin de proporcionar, en base a lo mismo, una información de forma de ventana adaptada 605a. Por ejemplo, la aplicación de reconstrucción perfecta 605 puede asegurar que una inclinación de transición de lado derecho (también designada como inclinación de ventana) de una ventana asociada con una porción previa de la señal de entrada, 20 sea una versión reflejada de una inclinación de ventana de una ventana asociada con una porción posterior de la señal de entrada. Por ejemplo, puede asegurarse que las inclinaciones de ventana de las ventanas asociadas con las porciones posteriores de una señal de entrada se definan por parámetros de forma de ventana idénticos. La trayectoria de señal 1012a también comprende un cálculo de ventana 606 que se configura para proporcionar valores de ventana de procesamiento de señal w1(n) a un proveedor de ventana 1014. El proveedor de ventana 25 1014 se configura para multiplicar muestras de la señal de entrada s1(n) con los valores de ventana de procesamiento de señal correspondientes w1(n), a fin de obtener valores de señal enmarcados s1'(n), que se introducen en un transformador de coseno, discreto, modificado 607, para obtener los coeficientes de MDCT S1(k).
[0078] Debe observarse aquí que el calculador de ventana 606 puede tomar el control de la funcionalidad del
30 proveedor de ventana 130 o del proveedor de ventana 180, de tal manera que los valores de ventana de procesamiento de señal w1(n) sean equivalentes a los valores de ventana de procesamiento de señal w(n) o a los valores de ventana de procesamiento de señal w(t). También, el proveedor de ventana 1014 puede tomar la funcionalidad del proveedor de ventana 120.
35 [0079] De acuerdo con lo anterior, el codificador 1010 se configura para aplicar una pluralidad de diferentes
ventanas para la formación de ventana de la señal de entrada s1(n) dependiente de los parámetros de forma de ventana adaptados 605a, donde el cálculo de ventana 606 proporciona valores de ventana de procesamiento de señal.
40 [0080] El codificador 1010 puede comprender opcionalmente etapas adicionales de codificación para
codificar eficientemente los valores espectrales S1(k) a SM(k) provistos por la transformación de MDCT 607.
[0081] El decodificador de señal 1020 se configura para recibir valores espectrales decodificados Q1(k) a
QM(k). Los valores espectrales decodificados Q1(k) a QM(k) pueden extraerse de una corriente de bits, que puede 45 proporcionarse por el codificador 1010 mediante codificación de los valores espectrales S1(k) a SM(k). En otras palabras, los coeficientes espectrales Q1(k) a QM(k) pueden ser idénticos, excepto por errores de cuantificación, a los valores espectrales S1(k) a SM(k). Aquí, k es un índice de frecuencia y M>1 designa un número de canales (en donde se proporciona una ramificación por canal).
50 [0082] El decodificador 1020 también se configura para recibir valores de longitud de ventana N1 a Nm (que
toman la función de la variable N como se describe arriba) y uno o más parámetros de forma de ventana a1 a aM (por ejemplo, uno por ramificación o canal). El decodificador 1020 comprende un transformador-de-coseno-discreto- modificado inverso 608 que se configura para recibir los coeficientes espectrales Q1(k) a QM(k) y para proporcionar, en base a lo mismo, señales inversamente transformadas q1(n) a qM(n). El decodificador 1020 también comprende 55 una selección de ventana 609, que opera en combinación con una aplicación de reconstrucción perfecta 605 para derivar parámetros de forma de ventana adaptados 605a a partir de los parámetros de forma de ventana de entrada a1 a aM, donde los parámetros de forma de ventana de entrada a1 a aM pueden extraerse o derivarse de una corriente de bits que representa un contenido de medios. Por ejemplo, tanto los parámetros de forma de ventana de entrada a1 a aM como también los valores espectrales Q1(k) a QM(k) pueden representarse en la señal de medios 60 codificada.
[0083] El decodificador 1020 comprende además un cálculo de ventana 606, que recibe el parámetro de
forma de ventana adaptada 605a (o, alternativamente, los parámetros de forma de ventana de entrada ai a aM) y proporciona, en base a lo mismo, los valores de ventana de procesamiento de señal wi(n) a wM(n). El cálculo de ventana 606 puede llevar a cabo la funcionalidad del proveedor de ventana 130 o del proveedor de ventana 180, en donde los parámetros de forma de ventana adaptada 605a pueden corresponder al uno o más parámetros de forma 5 de ventana 132 o al uno o más parámetros de forma de ventana 182. De manera similar, los valores de ventana de procesamiento de señal W1(n) a WM(n) pueden ser equivalentes a los valores de ventana de procesamiento de señal w(n) o a los valores de ventana de procesamiento de señal w(t).
[0084] De acuerdo con lo anterior, el cálculo de ventana 606 puede proporcionar ventanas de diferentes 10 formas de acuerdo con los parámetros de forma de ventana adaptada 605a o los parámetros de forma de ventana
de entrada a1 a aM.
[0085] El valor de ventana de procesamiento de señal W1(n) a wM(n) provisto por el cálculo de ventana 606 del decodificador 1020 puede aplicarse, por ejemplo, por una operación de multiplicación 1024, a las señales
15 inversamente transformadas q1(n) a qM(n) proporcionadas por la transformación de coseno-discreto-modificado- inverso 608 a fin de obtener una versión enmarcada qV(n) a qM'(n) de los valores q1(n) a qM(n).
[0086] El decodificador 1020 comprende además una sobreposición-y-adición 610, la cual se configura para recibir porciones de ventana posteriores qV(n) a qM'(n) de las señales inversamente transformadas q1(n) a qM(n) y
20 sobreponerlas-y-agregarlas a dichas porciones posteriores, a fin de obtener señales reconstruidas y1(n) a yM(n). La sobreposición-y-adición 610 se coordina preferentemente con la formación de ventana 1024 de tal manera que las porciones de señal enmarcadas qV(n) a qM'(n) que se sobreponen por la sobreposición-y-adición 610 se enmarcan con ventanas “complementarias”, de tal manera que una inclinación de ventana de lado derecho de una primera ventana se sobreponga a una inclinación enmarcada de lado izquierdo de una ventana posterior, en donde las 25 inclinaciones de ventana de sobreposición comprenden la conservación de energía y/o las características de reconstrucción perfecta arriba discutidas.
[0087] Por lo tanto, el codificador 1010 y el decodificador 1020 son capaces de codificar y decodificar señales de medios como, por ejemplo, señales de audio, señales de voz, señales de video, señales de imagen, etc.
30
[0088] Para concluir, las realizaciones anteriores según las presentes invenciones pueden implementarse en software y tanto en microcircuitos de hardware como también en procesadores de señal digital (DSPs) para diversas clases de sistemas y almacenamiento análogo o digital o transmisión de señales.
35 [0089] Para resumir, la Fig. 10 ilustra la manera en que puede utilizarse la técnica de formación de ventana
propuesta en un codificador-decodificador de audio como AAC que se adapta a la señal o un tipo diferente de codificador de señal o decodificador de señal. Las funciones de núcleo de ventana 601 para la construcción de c'(n) se almacenan en la memoria junto con una definición de configuraciones de parámetros disponibles. Estos datos se comparten por codificador y decodificador. El codificador, mostrado en la Fig. 10a), de referencia numérica 1010, 40 segmenta para cada estructura los M canales de entrada, y para cada uno de los segmentos M s(n), datos de un modelo psicoacústico espectro-temporal 602 se analizan en un detector de ventana y selector 603 para determinar una forma de ventana adecuada y si es aplicable, longitud y número. Se selecciona una ventana adecuada en base a criterios tales como selectividad de frecuencia (compactación de energía) o baja sobreposición de estructura (reducción de solapamiento cuando se utiliza TNS o compensación de ganancia de sub-banda (SB)).
45
[0090] En otras palabras, el codificador 1010 (o cualquier otro procesador de señal) puede configurarse para determinar, variar o ajustar uno o más de los parámetros de forma de ventana af en una forma que se adapta a la señal de tal manera que se optimice o mejore un desempeño objetivo o un desempeño subjetivo del procesador de señal. De acuerdo con lo anterior, el uno o más parámetros de forma de ventana puede determinarse, variarse o
50 ajustarse en una forma que se adapte a la señal de entrada de tal manera que se optimice o mejore el desempeño objetivo (es decir, numérico) o subjetivo (es decir, perceptual) del procesador de señal (por ejemplo, el codificador de audio 1010).
[0091] Después de la comparación opcional de los parámetros de forma de ventana de los canales a través 55 de la unidad de sincronización 604, se asegura que se lleve a cabo la reconstrucción perfecta (PR) de las
transformaciones usando las funciones de ventana seleccionadas, en una unidad de aplicación de PR 605 mediante ajuste de los parámetros para la sobreposición de mitades de ventana de la estructura actual y previa. En base a los parámetros de forma de ventana modificados, al usar las ecuaciones (8) y (9), los coeficientes de ventana reales se calculan 606 y se multiplican con el segmento de audio respectivo, formando un segmento enmarcado s'(n) que se 60 transforma finalmente en dominio de frecuencia por medio de una MDCT 607 para posterior cuantificación, codificación y transmisión. En el decodificador mostrado en la Fig. 10b), en la referencia numérica 1020, los parámetros de forma de ventana recibidos para cada estructura y canal se decodifican y adelantan a un selector de
ventana 609, que les representa la configuración de ventana correspondiente para uso después de la MDCT inversa 608 de los espectros descuantificados Q(k). Después de reforzar PR de las secuencias de ventana y calcular los coeficientes de ventana análogos al codificador, los segmentos de salida q(n) que resultan de las MDCTs inversas, se enmarcan y, por medio de sobreposición-adición 610, se reconstruyen las formas de onda de canal individual 5 y(n).
10. Cálculo alternativo de ventana
10.1. Vista general sobre el cálculo de una función de ventana de una clase de ventana alternativa
10
[0092] En lo sucesivo, se describirá una clase alternativa de funciones de ventana, que pueden usarse por un
proveedor de ventana (por ejemplo, por el proveedor de ventana 180 o por el proveedor de ventana 300 o por el cálculo de ventana 606) para proporcionar valores de ventana de procesamiento de señal.
15 [0093] En otras palabras, en lo sucesivo, se darán los detalles con respecto a la definición de una clase
alternativa de ventanas, los cuales se basan en una modificación substancial de algunas de las ecuaciones anteriores.
[0094] En una de las secciones precedentes, se observó que la ecuación (12) con a=2, es decir, W2(t), es 20 equivalente a la ecuación (15) con K=1, b0=0,5, b1=0,5. Además, se estableció la equivalencia entre W4(t) y (15) con
K=2 y bk de (16). Se ha investigado respecto a cuál bk produce W1(t), W3(t), o más generalmente, cualquier wa(t) con a impar. Observando las ecuaciones (12) y (15), se ha encontrado que es imposible construir una ventana de suma- de-cosenos que sea equivalente a una ventana de seno con exponente impar. Sin embargo, en algunas aplicaciones donde se requiere Wa(t) de a impar, puede ser deseable usar una formulación similar a la ecuación (15) a fin de 25 permitir optimizaciones de fuga espectral según se lleva a cabo por Hamming, Blackman y Nuttall.
[0095] Por suerte, se ha encontrado que las funciones de suma-de-senos
imagen9
proporcionan los medios de optimización necesarios. Como puede observarse, los valores de ventana de procesamiento de señal wc(t) pueden obtenerse mediante formación de una suma ponderada de funciones de configuración de tipo seno sen((2k+1)pt/L). Puede obtenerse una inclinación de ventana de señal para valores de t entre 0 y L/2.
35
[0096] También debe observarse que, preferentemente, se suman las funciones de seno, las frecuencias de lo cual son múltiplos impares de una frecuencia fundamental. Por ejemplo, las frecuencias angulares normalizadas pueden definirse como (2k+1) p/L. Puede observarse que las mayores frecuencias normalizadas son múltiplos impares de una frecuencia normalizada fundamental p/L.
40
[0097] También debe observarse que las funciones de configuración se ponderan de manera alternativa con pesos negativos y positivos (-1)kck con índice de frecuencia creciente k (para k entre cero y un valor índice de frecuencia máximo K).
45 [0098] Al seleccionar las constantes ck adecuadamente, pueden adquirirse dos configuraciones.
[0099] Primero, puede construirse una ventana correspondiente a una ventana de seno con exponente impar
de (2). La Ck para a impar de tercer orden ínfimo Wa(t) se especificará aquí. La ventana clásica de seno W1(t) es trivial para construcción usando (19) mediante fijación de 50
K=0 y C0=1. Para W3(t), K se incrementa a K=1, y
c0 = 0.75, C\ = 0.25 .
(20)
55 [0100] Finalmente se obtiene W5(t) de quinto orden usando K=2 y
c0 = 0.625, C\ = 0.3125, c2 = 0.0625 .
(21)
[0101] En segundo lugar, como bk en (15), Ck puede determinarse de tal manera que se logre el comportamiento espectral similar al de las ventanas de Blackman, Hamming y Nuttall. Antes de derivar la respectiva Ck para K=1 y K=2, sin embargo, es importante determinar exactamente cuál aspecto de una respuesta espectral de
5 ventana debe optimizarse. Para este fin, son necesarias medidas objetivas del desempeño espectral de una ventana. En la siguiente sección, se conduce un análisis de todas las funciones de ventana mencionadas hasta ahora por medio de algunas medidas populares.
10.2. Evaluación y optimización
10
[0102] En lo sucesivo, se evaluará el desempeño de las variantes de doble y triple término de esta clase de ventana y se comparará con otras ventanas que utilizan algunas de las figuras de mérito descritas en la referencia [2]. Motivado por el resultado, se describirán las realizaciones optimizadas específicamente.
15 [0103] En lo sucesivo, se discutirán diferentes conjuntos de parámetros de forma de ventana ck. Se mostrará
que la combinación de los valores de ventana de procesamiento de señal según la ecuación (19) permite crear una amplia variedad de ventanas diferentes que tienen diferentes características. De acuerdo con lo anterior, puede resumirse que el proveedor de ventana configurado para proporcionar las ventanas de procesamiento de señal wc(t) según la ecuación (19) puede configurarse de manera muy flexible y trae consigo una complejidad computacional 20 muy baja, debido a que la función de configuración sen((2k+1)p-t/L) puede precalcularse mientras la suma ponderada trae consigo una complejidad computacional comparativamente pequeña.
[0104] Está bien establecido que la multiplicación de una señal de tiempo por otra señal corresponde a la
convolución de las transformaciones de frecuencia de las dos señales. Por lo tanto, al aplicar una función de 25 ponderación a una señal, el espectro de señal se convoluciona con el espectro de la ponderación. Para evaluar el efecto de una función de ventana, es por consiguiente suficiente con estudiar su espectro, por ejemplo, usando transformación Fourier.
[0105] Las Figuras 11 y 12 ilustran las magnitudes del espectro de potencia de las ventanas anteriores, 30 normalizadas en frecuencia y amplitud como en la referencia [4]. Debido a ceros espectrales recurrentes, todas las
ventanas exhiben un lóbulo principal a frecuencia cero y lóbulos laterales que se atenúan en amplitud con frecuencia creciente. La velocidad de disminución de los lóbulos laterales se dicta por las discontinuidades en los límites de la función de ventana así como aquellos de sus diferenciales; las derivadas de más bajo orden son continuas, mientras más rápidas son las atenuaciones de ventana hasta cero para f grande. Ver también referencias [2] y [4].
35
[0106] Para las funciones de seno con exponenciación wa(t) de la Figura 11, puede establecerse que la disminución asintomática en dB por octavo es proporcional a a (ver, por ejemplo, referencia [6]).
40
45
50
disminución (wa) — — 6.02 (Cl +1)
dB
oct
(22)
[0107] Esto parece aplicarse a toda a no negativa real, no solo enteros. Para las ventanas optimizadas de la
Figura 12, puede observarse un comportamiento de lóbulo lateral diferente. La ventana Hamming, cuya amplitud de lóbulo principal iguala a la de w2(t)=wHann(t), disminuye a solo -6 dB por octavo debido a que la función de ponderación no es continua. De manera similar, las ventanas de Blackman y Nuttall, que tienen la misma amplitud de lóbulo principal que w4(t), muestran una atenuación de solo -18 dB por octavo; sus primeras derivadas de ponderación son continuas, pero sus terceras derivadas no lo son. Sin embargo, estas ventanas exhiben niveles inferiores de lóbulo lateral máximo en comparación con sus contrapartes wa(t). Esto puede conducir a desviación espectral notablemente reducida en algunas aplicaciones y es la razón por la cual se desarrollaron las ventanas optimizadas.
[0108] Ya que se ha encontrado que el procedimiento de optimización usado para las ventanas de suma-de-
cosenos en la Figura 12 también puede aplicarse a las funciones de suma-de-senos de (19), es posible modificar la ventana de doble término con (20) y la ventana de triple término con (21) para el ínfimo nivel de lóbulo lateral máximo (la ventana seno de un término con c0=1 no puede optimizarse de este modo). Se ha encontrado que debido al uso de sinuosides, cualquier realización de (15) se enfoca a amplitud cero en sus puntos terminales; se garantiza, por lo tanto, una velocidad de disminución de lóbulo lateral de -12 dB por octavo (1//2, ver referencia [2]). Si las
derivadas se permiten ser discontinuas, se obtienen grados adicionales de libertad para determinar Ck, que puede emplearse para reducir la magnitud pico del lóbulo lateral (ver, por ejemplo, referencia [4]).
[0109] Para la ventana de suma-de-senos de doble término (K=1), la admisión de una primer derivada
5 discontinua produce un grado extra de libertad en la opción de C0 y C1. Se encuentra que
c„ = 0.79445, c, = 0.20555
(23)
produce el ínfimo lóbulo lateral posible máximo de -54,3 dB (primer y tercer lóbulo lateral). La ventana de triple 10 término (K=2) ofrece dos grados extra de libertad en la selección de Ck. El nivel mínimo de lóbulo lateral pico de -82,8 dB se alcanza usando
c0 = 0.69295, C\ = 0.2758, c2 = 0.03125
(24)
15 [0110] La Figura 13 muestra el espectro de potencia de las ventanas (23) y (24). Para las diez ventanas
presentadas, el nivel de lóbulo lateral máximo, la disminución asintomática, la amplitud de lóbulo principal (se da por la ubicación del primer cero), y la amplitud de banda de 6-dB (una medida de la resolución de una ventana, ver referencia [2]) se mencionan en la Tabla 1. Observe cómo en términos de desempeño espectral en general, la ventana (23) yace justo entre la ventana Hamming de doble término y Nuttall de triple término. Además, aunque se 20 logra un pico de lóbulo lateral similar al de la ventana Blackman, la ventana (23) tiene un lóbulo principal más angosto. La ventana (24) tiene el máximo lóbulo lateral ínfimo de todas las ventanas en esta discusión, pero junto con W5(t), también exhibe el lóbulo principal más amplio.
[0111] Para concluir, un cálculo de los valores de ventana de procesamiento de señal según la ecuación (19), 25 trae consigo la posibilidad de obtener ventanas de características muy diferentes al variar solo los parámetros ck sin
variar la regla de cálculo subyacente. Esto reduce el esfuerzo computacional y el esfuerzo de implementación. También, en algunas realizaciones, pueden usarse uno o más de los diferentes conjuntos de parámetros (20), (21), (23) o (24). El valor de ventana de procesamiento de señal puede calcularse y almacenarse en una tabla de búsqueda, o puede calcularse en línea (siempre que se requiera), dependiendo de la implementación real.
30
10.3. Ventanas de suma-de senos y la Transformación Fourier Discreta (DFT) o MDCT
[0112] En lo sucesivo, se describirá una característica interesante de la clase de ventana propuesta cuando se utiliza en la Transformación Fourier Discreta.
35
[0113] El lector observador habrá notado la diferencia en las ubicaciones de cero entre los espectros de las ventanas de suma-de-senos y de suma-de-cosenos. Como es aparente en las figuras, para las últimas ventanas, la mayoría o todos los ceros ocurren en múltiplos enteros de L/, mientras que para las ventanas de suma-de-senos, los ceros yacen a la mitad entre el entero L/. En lo sucesivo, esta característica deberá iluminarse con respecto a
40 analizar el espectro de señales armónicas enmarcadas que utilizan DFT.
[0114] Como se observó con anterioridad, la transformación Fourier (FT) de un intervalo de señal s(t)
ponderado por w(t) es equivalente a la convolución de las FTs individuales de s(t) y w(t). Las FTs de la ventana seno W1(t) y la ventana Hann W2(t) se dan por 45
imagen10
Y
w2(f) =
sen(ír/) 2nf{\-ñ !
respectivamente, (ver, por ejemplo, referencia [3]). Por lo tanto, Wi(f)=0 para f=n+0.5, |n|>1, y W2(f)=0 para f=n, |n|>2, siendo n un entero. Las FTs de las ventanas de mayor orden y optimizadas de la Tabla 1 difieren de (25) y 5 (26), pero el término trigonométrico respectivo en el numerador (cos() para las ventanas de suma-de-senos, sen() para la de suma-de-cosenos) es común a todos. En el contexto de DFT, la implicación es que la máxima fuga espectral con una ventana de suma-de-cosenos coincide con la mínima fuga con una ventana de suma-de-senos y viceversa. Se da un ejemplo en la Figura 14 para la ventana de doble término propuesta (23) y la ventana de triple término de Nuttall (18) aplicadas en un DFT de 256 puntos.
10
[0115] En codificadores contemporáneos de audio o video, se divide una forma de onda de señal en
segmentos, y cada segmento se cuantifica en una representación más gruesa a fin de obtener una elevada compresión de datos, es decir, una baja velocidad de transmisión de bits requerida para almacenamiento o transmisión de la señal. En un intento por lograr una ganancia de codificación por medio de compactación de 15 energía (o en otras palabras, para incrementar la calidad perceptual de la señal codificada para una velocidad de transmisión de bits dada), se han vuelto populares las transformaciones de banco de filtro (por ejemplo, transformaciones de MDCT 607) de los segmentos previo a la cuantificación. Los sistemas más recientemente desarrollados aplican transformación de tiempo-respecto-a-frecuencia en la forma de transformación de coseno discreto modificado (MDCT), permitiendo un banco de filtro que los segmentos adyacentes se sobrepongan mientras 20 se proporciona muestreo crítico.
[0116] Para mejor desempeño, las operaciones de MDCT de avance e inversas (por ejemplo, transformación
de MDCT 607 y transformación de MDCT inversa 608) se acompañan por ponderación de cada segmento: del lado codificador, se emplea una ventana de análisis (por ejemplo, se emplea una ventana W1(n)) antes de la MDCT, y del 25 lado decodificador, se aplica una ventana de síntesis (por ejemplo, una ventana de síntesis W1(n)) después de la MDCT inversa.
30
[0117] Desafortunadamente, no toda función de ponderación es adecuada para uso con la MDCT.
Suponiendo funciones de ventana de análisis y síntesis, simétricas, idénticas,
imagen11
el sistema entero puede producir solo la reconstrucción de entrada perfecta en ausencia de cuantificación o transmisión de errores si 35
imagen12
con T=L/2. Esta es la así llamada condición de complementariedad de potencia (PC) o Princen-Badley reportada en [7]. Las ventanas de PC comunes son las ventanas de seno y KBD utilizadas en la norma AAC de MPEG-2/-4 (ver, 40 por ejemplo, referencias [6] y [8]), dadas las primeras por
imagen13
así como también la ventana de la especificación de codificador Vorbis (ver, por ejemplo, referencia [9]),
imagen14
[0118] Para investigar si la ecuación (19) puede usarse para crear ventanas de suma-de-senos que
satisfacen (28), observamos que, dado (27), wseno(t) puede considerarse como el seno de una función triangular:
imagen15
5
[0119] De igual modo, wvorbis(t) puede escribirse como (32) con t(t) remplazado por
t'(0 = sen'í'T-r(f)l •
* “ > (33)
10
[0120] La complementariedad de amplitud acerca de T=L/4 de (31) y (33) (o 31'),
imagen16
15 sugiere que las alternativas a estas funciones pueden diseñarse para optimizar la respuesta de frecuencia de la función de ventana sin sacrificar la propiedad de PC. De hecho, confirmando (27),
imagen17
20 es una extensión de (31) conforme a (34), que emplea una modificación de la función de suma-de-senos de (19); se omite el término de señal alterna, y en lugar de múltiplos impares de p, se consideran múltiplos pares. Los experimentos informales ejecutados por el presente autor indican que, aunque PC se obtiene incluso con dk produciendo td(t)<0 para alguna t, solo las ejecuciones con td(t) no negativo para toda t producen selectividad de banda de paso y rechazo de banda de detención satisfactorios, simultáneamente.
25
[0121] Además, en la sección titulada “Evaluación y optimización” los coeficientes ck de (19) se seleccionaron
de tal manera que el nivel de lóbulo lateral máximo de la ventana resultante se minimiza. Puede seguirse aquí un procedimiento similar. Sin embargo, respecto a la condicionante de PC de (28), son más limitadas las posibilidades de diseño espectral, especialmente con respecto a los primeros dos o tres lóbulos laterales. En general, uno debe 30 especificar un límite de menor frecuencia L/o>1,5 (o alternativamente, un lóbulo lateral de inicio) por encima del cual puede reducirse el máximo lóbulo lateral en una cantidad razonable. Para dar un ejemplo, una búsqueda exhaustiva informal con L/o=4,5 produce formación de parámetros de doble término
d1=0,12241, d2=0,00523, (36)
35
que produce una ventana cuyos primeros tres lóbulos laterales por encima de L/o tienen todos un nivel de -66,8 dB. Los lóbulos laterales de mayor frecuencia se atenúan desde ese valor a una velocidad de -12 dB por octavo, tal como aquellos de las ventanas optimizadas (23) y (24) de las secciones previas. La respuesta de frecuencia de la función de ponderación construida usando (27), (32), (35) y (36) se muestra en la Figura 15 junto con aquellas de 40 wseno(t) y wvorbis(t). Claramente, se logra un incremento sustancial en rechazo de lóbulo lateral en la ventana propuesta en comparación con la ventana de seno. Debido a la condicionante (28), esta ventaja se encuentra a
costo de un lóbulo principal ligeramente más amplio y un primer lóbulo lateral mayor. Una comparación con la ventana Vorbis muestra amplitudes casi idénticas de lóbulo principal y máxima de los dos primeros lóbulos laterales. Para 4.5<L/o<11.5, la ventana propuesta lleva a cabo wvorbis(t) en términos de atenuación de lóbulo lateral. Observe también que el espectro de ventana Vorbis disminuye a -18 dB por octavo y tiene su magnitud cero a (o cerca) de 5 múltiplos enteros de L/. Por lo tanto, su comportamiento espectral se asemeja al de una ventana de suma-de- cosenos. De hecho, puede considerarse PC equivalente a la ventana Hann. De igual modo, la ventana de PC propuesta parece ser una contraparte de las ventanas de suma-de-senos optimizadas de la sección titulada “Evaluación y optimización”. Una investigación más concienzuda, que incluye una evaluación de desempeño en el contexto de codificación de audio, es un tema de futura investigación.
10
11. Implementación alternativa
[0122] Aunque se han descrito algunos aspectos en el contexto de un aparato, es claro que estos aspectos también representan una descripción del procedimiento correspondiente, donde un bloque o dispositivo corresponde
15 a una etapa de procedimiento o una característica de una etapa del procedimiento. De manera análoga, los aspectos descritos en el contexto de una etapa del procedimiento también representan una descripción de un bloque o ítem o característica correspondiente de un aparato correspondiente.
[0123] Algunas o todas las etapas del procedimiento pueden ejecutarse por (o usando) un aparato de 20 hardware, como, por ejemplo, un microprocesador, una computadora programable o un circuito electrónico. En
algunas realizaciones, una o más de las etapas de procedimiento más importantes pueden ejecutarse por tal aparato.
[0124] La señal de medios codificada inventiva, que puede ser una señal de audio o video codificada, o 25 secuencia de funciones de ventana, puede almacenarse en un medio de almacenamiento digital o puede
transmitirse sobre un medio de transmisión tal como un medio de transmisión inalámbrico o un medio de transmisión conectado por cable tal como la Internet.
[0125] Dependiendo de ciertos requisitos de implementación, las realizaciones de la invención pueden 30 implementarse en hardware o software. La implementación puede llevarse a cabo usando un medio de
almacenamiento digital, por ejemplo, una unidad de almacenamiento de disco, un DVD, un disco de Blu-Ray, un CD, una ROM, una PROM, una EPROM, una EEPROM o una memoria de almacenamiento intermedio, que tenga señales de control electrónicamente legibles almacenadas en los mismos, que cooperen (o sean capaces de cooperar) con un sistema de computadora programable de tal manera que se lleve a cabo el procedimiento 35 respectivo. Por consiguiente, el medio de almacenamiento digital puede ser legible por computadora.
[0126] Algunas realizaciones según la invención comprenden un portador de datos que tiene señales de control electrónicamente legibles, que son capaces de cooperar con un sistema de computadora programable, de tal manera que uno de los procedimientos aquí descritos se lleva a cabo.
40
[0127] En general, las realizaciones de la presente invención pueden implementarse como un producto de programa de computadora con un código de programa, siendo operativo el código de programa para llevar a cabo uno de los procedimientos cuando el producto de programa de computadora se ejecuta en una computadora. El código de programa, por ejemplo, puede almacenarse en un portador legible por máquina.
45
[0128] Otras realizaciones comprenden un programa de computadora para llevar a cabo uno de los procedimientos descritos en la presente, almacenados en un portador legible por máquina.
[0129] En otras palabras, una realización del procedimiento inventivo es, por consiguiente, un programa de 50 computadora que tiene un código de programa para llevar a cabo uno de los procedimientos descritos en la
presente, cuando el programa de computadora se ejecuta en una computadora.
[0130] Una realización adicional de los procedimientos inventivos, por consiguiente, es un portador de datos (o un medio de almacenamiento digital, o un medio legible por computadora) que comprende, registrado en el
55 mismo, el programa de computadora para llevar a cabo uno de los procedimientos descritos en la presente. El portador de datos, el medio de almacenamiento digital o el medio registrado son típicamente tangibles y/o no transitorios.
[0131] Una realización adicional del procedimiento inventivo es, por consiguiente, una corriente de datos o
una secuencia de señales que representan el programa de computadora para llevar a cabo uno de los procedimientos descritos en la presente. La corriente de datos o la secuencia de señales pueden configurarse, por ejemplo, para transferirse a través de una conexión de comunicación de datos, por ejemplo, a través de la Internet.
5 [0132] Una realización adicional comprende un medio de procesamiento, por ejemplo, una computadora, o un
dispositivo lógico programable, configurado o adaptado para llevar a cabo uno de los procedimientos descritos en la presente.
[0133] Una realización adicional comprende una computadora que tiene instalado en la misma el programa 10 de computadora para llevar a cabo uno de los procedimientos descritos en la presente.
[0134] Una realización adicional según la invención comprende un aparato o un sistema configurado para transferir (por ejemplo, de manera electrónica u óptica) un programa de computadora para llevar a cabo uno de los procedimientos descritos en la presente en un receptor. El receptor puede ser, por ejemplo, una computadora, un
15 dispositivo móvil, un dispositivo de memoria o lo similar. El aparato o sistema puede comprender, por ejemplo, un servidor de archivo para transferir el programa de computadora al receptor.
[0135] En algunas realizaciones, puede utilizarse un dispositivo de lógica programable (por ejemplo, una instalación de compuerta programable por campo) para llevar a cabo algunas o todas las funcionalidades de los
20 procedimientos descritos en la presente. En algunas realizaciones, una instalación de compuerta programable por campo puede cooperar con un microprocesador con objeto de llevar a cabo uno de los procedimientos descritos en la presente. En general, los procedimientos se llevan a cabo preferentemente por un aparato de hardware.
[0136] Las realizaciones descritas anteriormente son meramente ilustrativas de los principios de la presente 25 invención. Se entiende que para otros expertos en la materia serán aparentes modificaciones y variaciones de los
arreglos y los detalles descritos en la presente. Por consiguiente, se intenta limitarse solo por el alcance de las reivindicaciones de patente inminentes y no por los detalles específicos presentados a manera de descripción y explicación de las realizaciones en la presente.
30 12. Conclusiones
[0137] A partir de lo anterior puede concluirse que un cálculo de la función de ventana según se explica con relación a las ecuaciones (6), (8) y (9) produce una función de ventana que tiene características particularmente buenas.
35
[0138] Además, puede concluirse que un cálculo de las funciones de ventana según se explica con relación a la ecuación (19) produce una función de ventana que tiene buenas características.
[0139] Para resumir lo anterior, las realizaciones según la presente invención se refieren en general a 40 procedimientos de análisis y procesamiento de señal tal como aquellos que pueden utilizarse en sistemas de
codificación de audio o video. Algunas realizaciones según la invención se refieren a aplicaciones que requieren de compactación de energía de señal por medio de transformación de banco de filtro variante que se adapta a la señal o invariante, de la fuente. Pueden utilizarse para mejorar el desempeño de compactación de energía mientras se permite una perfecta inversión de dicha transformación. Las realizaciones según la presente invención constituyen, 45 por consiguiente, una solución a la necesidad de una función de ventana alternativa que tenga una complejidad computacional moderada, pero que proporcione una buena flexibilidad de diseño.
[0140] Algunas realizaciones según la presente invención, según se definen por las reivindicaciones anexas o esta descripción, se dirigen a la falta de funciones de ventana, flexibles y computacionalmente eficientes, para
50 aplicaciones de MDCT al declarar una extensión a la función de ventana de seno de la ecuación (4).
[0141] Sin embargo, otras realizaciones según la invención crean funciones de ventana mejoradas, que proporcionan una flexibilidad incrementada, pero no proporcionan la posibilidad de una reconstrucción perfecta en aplicaciones de MDCT. No obstante, tales funciones de ventana son útiles en muchas aplicaciones.
55
[0142] También debe señalarse que con objeto de facilitar el entendimiento de la presente invención, la invención se ha descrito por medio de ejemplos ilustrativos, que no limitan el alcance como se define por los dibujos acompañantes. En otras palabras, las realizaciones descritas en la presente son meramente ilustrativas de los principios de la presente invención para una formación de ventana más flexible y/o compactación de energía de
señal mejorada en aplicaciones de filtro. Se entiende que serán aparentes a aquellos expertos en la materia variaciones y modificaciones de los arreglos y los detalles descritos en la presente. Por consiguiente, se intenta limitarse solo por el alcance de las reivindicaciones de patente inminentes y no por los detalles particulares descritos a manera de descripción y explicación de las realizaciones en la presente.
5
[0143] Hablando en general, la formación de ventana de señales discretas mediante ponderación temporal es una herramienta esencial para el análisis espectral en el procesamiento para reducir efectos de desviación. Muchas funciones populares de ponderación (por ejemplo, Hann, Hamming, Blackman) se basan en una suma de cosenos a escala.
10
[0144] Las realizaciones según la invención presentan una clase alternativa de ventanas, construidas usando sumas de senos y exhibiendo comportamiento espectral modificado (o incluso único) con respecto a la ubicación de cero y una atenuación de lóbulo lateral de al menos -12 dB/octavo debido a continuidad garantizada de la ponderación. Se proporcionan los parámetros para las realizaciones de doble y de triple término con nivel de lóbulo
15 lateral de pico mínimo. Algunas realizaciones según la invención se refieren al uso de las ventanas de suma-de- senos con la Transformación Fourier Discreta y su adopción a transformaciones superpuestas tales como la Transformación de Coseno, Discreta, Modificada (MDCT).
[0145] En otras palabras, las realizaciones según a invención proponen alternativas a las funciones de 20 ventana convencionales (por ejemplo, Hann, Hamming y Blackman), igualmente fáciles de calcular y con
desempeños similares o incluso únicos en términos de reducción de fuga.
[0146] Hablando muy en general, las realizaciones según la invención crean un aparato, un procedimiento o un programa de computadora para codificar o decodificar o procesar una señal de audio o de video usando
25 funciones de ventana variables.
[0147] Algunas realizaciones según la invención crean un aparato, un procedimiento o un programa de computadora para calcular una secuencia de funciones de ventana diferentes para una señal de audio o una señal de video.
30
[0148] Las realizaciones adicionales según la invención crean una señal de audio o de video codificada que comprende contenido codificado de audio o video e información de parámetros de ventana con relación a ventanas variables, usadas para codificar una señal de audio o video a fin de obtener la señal codificada de audio o video.
35 [0149] Realizaciones adicionales según la invención crean una secuencia de funciones de ventana variables
que se determinan en una manera que se adapta a la señal.
[0150] Realizaciones adicionales según la invención crean el aparato, procedimientos, programas de
computadora, señales codificadas y secuencias de funciones de ventana variables en los cuales se deriva una 40 ventana (w ) en base a
c(n)= {n+\t2)-2lN,
« = 0» !......M2-1,
donde c(n) denota la función de núcleo de ventana, que puede calcularse por adelantado ya que se predetermina. 45 La extensión propuesta es agregar a c(n) en la ecuación (7) sinusoides ponderados que tienen frecuencias angulares que son múltiplos enteros de 2p:
cr0í) -■ c(n) + ^í/7-sen(2n/í<í0), /= 1*2......
n/2-c'(ri)), t¡ = 0, t......jV/2-I.
50 [0151] Para concluir también, se han presentado alternativas matemáticamente simples a las ventanas de
Hamming, Blackman y similares, generadas mediante el uso de sumas de senos ponderados. El enfoque de suma- de-senos produce propiedades únicas tales como continuidad garantizada de la función de ventana y también puede
5
10
15
20
25
30
35
aplicarse en la construcción de ventanas complementarias de potencia para codificar, por ejemplo, audio.
REFERENCIAS
[0152]
[1] R.B. Blackman y J.W. Tukey, The Measurement of Power Spectra from the Point of View of Communications Engineering, Nueva York, NY, EUA: Dover Publications, 1958.
[2] F.J. Harris, “On the Use of Windows for Harmonic Analysis with the Discrete Fourier Transform”, Proc. IEEE, vol. 66, n.° 1, págs. 51-83, enero 1978.
[3] N.C. Geckinli and D. Yavuz, “Some Novel Windows and a Concise Tutorial Comparison of Window Families”, IEEE Trans. Acoustics, Speech, and Signal Processing, vol. ASSP-26, n.° 6, págs. 501-507, diciembre 1978.
[4] A.H. Nuttall, “Some Windows with Very Good Sidelobe Behavior”, IEEE Trans. Acoustics, Speech, and Signal Processing, vol. ASSP-29, n.° 1, págs. 84-91, febrero 1981.
[5] S.W.A. Bergen and A. Antoniou, “Design of Ultraspherical Window Functions with Prescribed Spectral Characteristics”, EURASIP Journal on Applied Signal Processing, vol. 2004, n.° 13, págs. 2053-2065, 2004. Disponible en línea en
http://www.hindaw¡.com/GetArt¡cle.aspx?do¡=10.1155/S1110865704403114.
[6] J.O. Smith III, Spectral Audio Signal Processing, marzo 2009 Draft, Center for Computer Research in Music and Acoustics (CCRMA), Stanford University, CA, EUA. Disponible en línea en
http://ccrma.stanford.edu/~jos/sasp/ (acceso marzo 2010).
[7] J.P. Princen, A.W. Johnson y A.B. Bradley, “Subband/Transform Coding Using Filter Bank Designs Based on Time Domain Aliasing Cancellation”, Proc. IEEE 1987 ICASSP-12, págs. 2161-2164, mayo 1987.
[8] ISO/IEC 14496-3:2009, “Information technology - Coding of audio-visual objects - Part 3: Audio”, Ginebra, agosto 2009.
[9] Xiph.org Foundation, “Vorbis I specification”, feb. 2010. En línea en
http://www.xiph.org/vorbis/doc/Vorbis_I_spec.html.

Claims (5)

  1. REIVINDICACIONES
    1. Un procesador de señal (100) para proporcionar una versión procesada de una señal de entrada en dependencia de la señal de entrada, donde la señal de entrada es una señal de audio o una señal de vídeo,
    5 comprendiendo el procesador de señal:
    un proveedor de ventana configurado para enmarcar una porción de la señal de entrada, o de una versión preprocesada de la misma, en dependencia de una ventana de procesamiento de señal descrita por valores de ventana de procesamiento de señal para una pluralidad de valores índice de valor de ventana, con objeto de obtener la 10 versión procesada de la señal de entrada; y
    un proveedor de ventana (300) para proporcionar los valores de ventana de procesamiento de señal (w(n); w1(n)) de una función de ventana para procesar la señal de audio o de vídeo para la pluralidad de valores índice de valor de ventana (n) en dependencia de uno o más parámetros de forma de ventana (310; af),
    15 donde el proveedor de ventana se configura para evaluar una función de seno para una pluralidad de valores de argumento asociados con los valores índice del valor de ventana (n), a fin de obtener los valores de ventana del procesamiento de señal,
    donde el proveedor de ventana se configura para calcular una suma ponderada de un término lineal (c(n)), el cual es 20 linealmente dependiente de los valores índice del valor de ventana (n), y valores de función de más de una funciones de configuración, cuyas más de una funciones de configuración representan los valores índice del valor de ventana (n) sobre los valores de función correspondientes y cuyas más de una funciones de configuración son simétricas por puntos con respecto a un centro de una inclinación de ventana (1630), a fin de obtener los valores de argumento.
    25
  2. 2. Un procesador de señal (200) para proporcionar una versión procesada (212) de una señal de entrada (210) en dependencia de la señal de entrada (210), donde la señal de entrada es una señal de audio o una señal de vídeo, comprendiendo el procesador de señal:
    30 un proveedor de ventana (220) configurado para enmarcar una porción de la señal de entrada, o de una versión preprocesada de la misma, en dependencia de una ventana de procesamiento de señal descrita por valores de ventana de procesamiento de señal (w(n);w1(n)) para una pluralidad de valores índice de valor de ventana (n), con objeto de obtener la versión procesada de la señal de entrada;
    35 donde los valores de ventana de procesamiento de señal son valores de resultado de una evaluación de una función de seno para una pluralidad de valores de argumento (p/2 c'(n)) asociados con los valores índice de valor de ventana (n); y
    donde los valores de argumento (p/2c'(n)) son sumas ponderadas de un término lineal (c(n)), el cual depende 40 linealmente de los valores índice del valor de ventana (n), y valores de función de más de una funciones de configuración de tipo seno (sen(2pf c(n))), cuyas más de una funciones de configuración de tipo seno (sen(2pf c(n))) representan los valores índice del valor de ventana (n) sobre los valores de función correspondientes, y cuyas más de una funciones de configuración de tipo seno son simétricas por puntos con respecto a un centro de una inclinación de ventana (1630).
    45
  3. 3. Un procedimiento para codificar o decodificar o procesar una señal de audio o de vídeo para una pluralidad de valores índice de valor de ventana en dependencia de uno o más parámetros de forma de ventana, comprendiendo el procedimiento:
    50 evaluar una función seno para una pluralidad de valores de argumento asociados con los valores índice del valor de ventana, a fin de obtener valores de ventana del procesamiento de señal; y
    calcular una suma ponderada de un término lineal, el cual es linealmente dependiente de los valores índice del valor de ventana, y valores de función de más de una funciones de configuración, cuyas más de una funciones de configuración representan los valores índice del valor de ventana sobre valores de función correspondientes, y cuyas 55 más de una funciones de configuración son simétricas por puntos con respecto a un centro de una inclinación de ventana de la ventana de procesamiento de señal, a fin de obtener los valores de argumento; y codificar o decodificar o procesar la señal de audio o de vídeo usando los valores de ventana de procesamiento de señal.
  4. 4. Un procedimiento para proporcionar una versión procesada de una señal de entrada en dependencia de la señal de entrada, donde la señal de entrada es una señal de audio o una señal de vídeo, comprendiendo el procedimiento:
    5
    enmarcar una porción de la señal de entrada, o de una versión preprocesada de la misma, en dependencia de una ventana de procesamiento de señal descrita por valores de ventana de procesamiento de señal para una pluralidad de valores índice de valor de ventana, con objeto de obtener la versión procesada de la señal de entrada,
    10 donde los valores de ventana de procesamiento de señal son valores de resultado de una evaluación de una función de seno para una pluralidad de valores de argumento asociados con los valores índice del valor de ventana, donde los valores de argumento son sumas ponderadas de un término lineal, el cual depende linealmente de los valores índice del valor de ventana, y valores de función de más de una funciones de configuración de tipo seno, cuyas más de una funciones de configuración de tipo seno representan los valores índice del valor de ventana sobre los valores 15 de función correspondientes, y cuyas más de una funciones de configuración de tipo seno son simétricas por puntos con respecto a un centro de una inclinación de ventana de la ventana de procesamiento de señal.
  5. 5. Un programa de computadora configurado para llevar a cabo los procedimientos según una de las reivindicaciones 3 o 4 cuando el programa de computadora se ejecuta en una computadora.
    20
ES16177667.9T 2010-03-11 2011-03-08 Procesador de señal y procedimiento para procesar una señal Active ES2691479T3 (es)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US31277510P 2010-03-11 2010-03-11
US312775P 2010-03-11
EP10175141A EP2372703A1 (en) 2010-03-11 2010-09-02 Signal processor, window provider, encoded media signal, method for processing a signal and method for providing a window
EP10175141 2010-09-02

Publications (1)

Publication Number Publication Date
ES2691479T3 true ES2691479T3 (es) 2018-11-27

Family

ID=43827399

Family Applications (3)

Application Number Title Priority Date Filing Date
ES11707660.4T Active ES2526774T3 (es) 2010-03-11 2011-03-08 Procesador de señal y procedimiento para procesar una señal
ES11707661.2T Active ES2601847T3 (es) 2010-03-11 2011-03-08 Procesador de señal, señal de medios codificada y método para procesar una señal
ES16177667.9T Active ES2691479T3 (es) 2010-03-11 2011-03-08 Procesador de señal y procedimiento para procesar una señal

Family Applications Before (2)

Application Number Title Priority Date Filing Date
ES11707660.4T Active ES2526774T3 (es) 2010-03-11 2011-03-08 Procesador de señal y procedimiento para procesar una señal
ES11707661.2T Active ES2601847T3 (es) 2010-03-11 2011-03-08 Procesador de señal, señal de medios codificada y método para procesar una señal

Country Status (14)

Country Link
US (2) US8907822B2 (es)
EP (5) EP2372704A1 (es)
JP (2) JP5706917B2 (es)
KR (2) KR101445292B1 (es)
CN (2) CN102893329B (es)
AU (2) AU2011226118B2 (es)
BR (2) BR112012022898B1 (es)
CA (2) CA2792454C (es)
ES (3) ES2526774T3 (es)
HK (2) HK1231625A1 (es)
MX (2) MX2012010440A (es)
PL (1) PL2545549T3 (es)
RU (2) RU2611986C2 (es)
WO (2) WO2011110569A1 (es)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8538042B2 (en) * 2009-08-11 2013-09-17 Dts Llc System for increasing perceived loudness of speakers
US9305031B2 (en) * 2013-04-17 2016-04-05 International Business Machines Corporation Exiting windowing early for stream computing
US8908796B1 (en) * 2013-05-15 2014-12-09 University Of South Florida Orthogonal frequency division multiplexing (OFDM) transmitter and receiver windowing for adjacent channel interference (ACI) suppression and rejection
KR101831286B1 (ko) * 2013-08-23 2018-02-22 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에.베. 엘리어싱 오류 신호를 사용하여 오디오 신호를 처리하기 위한 장치 및 방법
US9479272B2 (en) 2014-05-14 2016-10-25 Samsung Electronics Co., Ltd Method and apparatus for processing a transmission signal in communication system
WO2016063171A1 (en) * 2014-10-20 2016-04-28 Koninklijke Philips N.V. Cardiac reconstruction for photon counting ct for heart and lung images
TWI681384B (zh) * 2018-08-01 2020-01-01 瑞昱半導體股份有限公司 音訊處理方法與音訊等化器
CN110889083B (zh) * 2018-09-10 2020-12-22 湖南银杏可靠性技术研究所有限公司 基于窗谱估计的退化数据一致性检验法
JP7422905B1 (ja) 2022-08-02 2024-01-26 三菱電機株式会社 信号処理装置および信号処理方法

Family Cites Families (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5142656A (en) 1989-01-27 1992-08-25 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
US5109417A (en) 1989-01-27 1992-04-28 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
JP3465941B2 (ja) * 1993-01-07 2003-11-10 三菱電機株式会社 ピッチ抽出装置
US6487574B1 (en) * 1999-02-26 2002-11-26 Microsoft Corp. System and method for producing modulated complex lapped transforms
US6496795B1 (en) * 1999-05-05 2002-12-17 Microsoft Corporation Modulated complex lapped transform for integrated signal enhancement and coding
US6978236B1 (en) * 1999-10-01 2005-12-20 Coding Technologies Ab Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching
EP1340317A1 (en) * 2000-11-03 2003-09-03 Koninklijke Philips Electronics N.V. Parametric coding of audio signals
EP1386312B1 (en) * 2001-05-10 2008-02-20 Dolby Laboratories Licensing Corporation Improving transient performance of low bit rate audio coding systems by reducing pre-noise
FR2824978B1 (fr) * 2001-05-15 2003-09-19 Wavecom Sa Dispositif et procede de traitement d'un signal audio
US6963842B2 (en) * 2001-09-05 2005-11-08 Creative Technology Ltd. Efficient system and method for converting between different transform-domain signal representations
EP1394772A1 (en) 2002-08-28 2004-03-03 Deutsche Thomson-Brandt Gmbh Signaling of window switchings in a MPEG layer 3 audio data stream
CA2415105A1 (en) * 2002-12-24 2004-06-24 Voiceage Corporation A method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding
US20040162866A1 (en) * 2003-02-19 2004-08-19 Malvar Henrique S. System and method for producing fast modulated complex lapped transforms
JP2004361731A (ja) * 2003-06-05 2004-12-24 Nec Corp オーディオ復号装置及びオーディオ復号方法
JP3849679B2 (ja) * 2003-09-25 2006-11-22 ヤマハ株式会社 雑音除去方法、雑音除去装置およびプログラム
CN100573666C (zh) * 2003-11-26 2009-12-23 联发科技股份有限公司 子带分析/合成滤波方法
US6980933B2 (en) * 2004-01-27 2005-12-27 Dolby Laboratories Licensing Corporation Coding techniques using estimated spectral magnitude and phase derived from MDCT coefficients
US7088276B1 (en) * 2004-02-13 2006-08-08 Samplify Systems Llc Enhanced data converters using compression and decompression
KR20070001185A (ko) * 2004-03-17 2007-01-03 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 코딩
WO2005096273A1 (fr) * 2004-04-01 2005-10-13 Beijing Media Works Co., Ltd Ameliorations apportees a un procede et un dispositif de codage/decodage audio
WO2005096274A1 (fr) * 2004-04-01 2005-10-13 Beijing Media Works Co., Ltd Dispositif et procede de codage/decodage audio ameliores
JP2006243664A (ja) * 2005-03-07 2006-09-14 Nippon Telegr & Teleph Corp <Ntt> 信号分離装置、信号分離方法、信号分離プログラム及び記録媒体
US7720677B2 (en) 2005-11-03 2010-05-18 Coding Technologies Ab Time warped modified transform coding of audio signals
RU2315424C1 (ru) * 2006-06-06 2008-01-20 Виктор Васильевич Бондаренко Система связи с высокой скоростью передачи информации сверхширокополосными сигналами
US7987089B2 (en) * 2006-07-31 2011-07-26 Qualcomm Incorporated Systems and methods for modifying a zero pad region of a windowed frame of an audio signal
US8036903B2 (en) * 2006-10-18 2011-10-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Analysis filterbank, synthesis filterbank, encoder, de-coder, mixer and conferencing system
EP1918911A1 (en) * 2006-11-02 2008-05-07 RWTH Aachen University Time scale modification of an audio signal
US7522074B2 (en) * 2007-09-17 2009-04-21 Samplify Systems, Inc. Enhanced control for compression and decompression of sampled signals
WO2009049895A1 (en) * 2007-10-17 2009-04-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding using downmix
MY154452A (en) * 2008-07-11 2015-06-15 Fraunhofer Ges Forschung An apparatus and a method for decoding an encoded audio signal
JP4918074B2 (ja) * 2008-08-18 2012-04-18 日本電信電話株式会社 符号化装置、符号化方法、符号化プログラム、及び記録媒体

Also Published As

Publication number Publication date
EP3096317B1 (en) 2018-08-01
EP2545549B1 (en) 2014-10-01
RU2616863C2 (ru) 2017-04-18
CN102893329A (zh) 2013-01-23
HK1181179A1 (en) 2014-03-07
JP2013531264A (ja) 2013-08-01
WO2011110569A1 (en) 2011-09-15
JP5706917B2 (ja) 2015-04-22
AU2011226121A1 (en) 2012-10-25
CN102893328B (zh) 2014-12-10
MX2012010320A (es) 2012-11-23
JP5809645B2 (ja) 2015-11-11
RU2012143351A (ru) 2014-04-20
KR101445292B1 (ko) 2014-09-29
RU2611986C2 (ru) 2017-03-01
ES2526774T3 (es) 2015-01-15
EP2545550A1 (en) 2013-01-16
US8907822B2 (en) 2014-12-09
BR112012022898B1 (pt) 2021-02-02
CA2792453A1 (en) 2011-09-15
JP2013522657A (ja) 2013-06-13
AU2011226121B2 (en) 2014-08-28
BR112012022898A2 (pt) 2018-09-18
EP2545550B1 (en) 2016-09-07
EP3096317A1 (en) 2016-11-23
CA2792453C (en) 2016-05-31
US20130246492A1 (en) 2013-09-19
US9252803B2 (en) 2016-02-02
KR20130007603A (ko) 2013-01-18
CN102893329B (zh) 2015-04-08
MX2012010440A (es) 2012-12-05
AU2011226118B2 (en) 2014-08-28
CA2792454A1 (en) 2011-09-15
AU2011226118A1 (en) 2012-10-25
EP2372704A1 (en) 2011-10-05
WO2011110572A1 (en) 2011-09-15
ES2601847T3 (es) 2017-02-16
KR20130007601A (ko) 2013-01-18
HK1231625A1 (zh) 2017-12-22
CN102893328A (zh) 2013-01-23
EP2372703A1 (en) 2011-10-05
KR101445290B1 (ko) 2014-09-29
RU2012143352A (ru) 2014-04-27
PL2545549T3 (pl) 2015-03-31
EP2545549A1 (en) 2013-01-16
CA2792454C (en) 2018-01-16
US20130241750A1 (en) 2013-09-19
BR112012022899A2 (pt) 2018-06-05

Similar Documents

Publication Publication Date Title
ES2691479T3 (es) Procesador de señal y procedimiento para procesar una señal
ES2646814T3 (es) Codificación de señales de audio por transformada modificada deformada en el tiempo
ES2496571T3 (es) Método y aparato para procesar una señal de medios
JP5270006B2 (ja) 周波数領域におけるオーディオ信号ラウドネス決定と修正
ES2751275T3 (es) Procesador, procedimiento y programa informático para el tratamiento de una señal de audio mediante el uso de las partes de superposición truncadas de ventanas de análisis y de síntesis
ES2635026T3 (es) Aparato y procedimiento de codificación, procesamiento y decodificación de envolvente de señal de audio por división de la envolvente de la señal de audio utilizando cuantización y codificación de distribución
Helmrich On the Use of Sums of Sines in the Design of Signal Windows
US10210879B2 (en) Apparatus and method for processing an audio signal using an aliasing error signal
ES2812343T3 (es) Sistema de filtro que comprende un convertidor de filtro y un compresor de filtro y método de funcionamiento del sistema de filtro
MX2013011131A (es) Transformada con complejidad reducida para canal de efectos de baja frecuencia.