ES2822163T3 - Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja - Google Patents

Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja Download PDF

Info

Publication number
ES2822163T3
ES2822163T3 ES17173337T ES17173337T ES2822163T3 ES 2822163 T3 ES2822163 T3 ES 2822163T3 ES 17173337 T ES17173337 T ES 17173337T ES 17173337 T ES17173337 T ES 17173337T ES 2822163 T3 ES2822163 T3 ES 2822163T3
Authority
ES
Spain
Prior art keywords
signal
sub
band
filter
signals
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
ES17173337T
Other languages
English (en)
Inventor
Jonas Engdegard
Lars Villemoes
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby International AB
Original Assignee
Dolby International AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=20291180&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=ES2822163(T3) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Dolby International AB filed Critical Dolby International AB
Application granted granted Critical
Publication of ES2822163T3 publication Critical patent/ES2822163T3/es
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03HIMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
    • H03H17/00Networks using digital techniques
    • H03H17/02Frequency selective networks
    • H03H17/0248Filters characterised by a particular frequency response or filtering method
    • H03H17/0264Filter sets with mutual related characteristics
    • H03H17/0266Filter banks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Mathematical Physics (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computer Hardware Design (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Color Television Image Signal Generators (AREA)
  • Picture Signal Circuits (AREA)
  • Epoxy Resins (AREA)
  • Networks Using Active Elements (AREA)
  • Developing Agents For Electrophotography (AREA)
  • Filters That Use Time-Delay Elements (AREA)
  • Wind Motors (AREA)
  • Silver Salt Photography Or Processing Solution Therefor (AREA)

Abstract

Aparato para generar una señal de descorrelación que usa una señal de entrada, comprendiendo: un banco de filtros de sub-banda para proporcionar una pluralidad de señales de sub-banda, en el que una señal de sub-banda incluye una secuencia de al menos dos muestras de sub-banda, representando la secuencia de muestras de sub-banda un ancho de banda de la señal de sub-banda que es menor que un ancho de banda de la señal de entrada, en el que la señal de entrada incluye un bloque de una serie predeterminada de muestras de entrada, siendo menor el número de muestras de sub-banda de la señal de sub-banda que el número de muestras de entrada; un filtro de reverberación para obtener una pluralidad de señales de sub-banda reverberadas a partir de la pluralidad de señales de sub-banda, teniendo el filtrado del filtro de reverberación una característica de paso total, siendo operativo el filtro de reverberación para aplicar un retardo fraccionario a cada señal de sub-banda y estando adaptado para tener diferentes conjuntos de coeficientes de filtro para cada señal de sub-banda en el que la pluralidad de señales de sub-banda reverberadas representan conjuntamente la señal de descorrelación; y un mezclador para mezclar la señal de descorrelación con la señal de entrada para obtener así un canal izquierdo y un canal derecho de una señal estéreo descodificada.

Description

DESCRIPCIÓN
Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja
Campo técnico
La presente invención se refiere a sistemas de codificación de fuentes de audio, pero los mismos métodos podrían aplicarse asimismo en muchos otros campos técnicos. Se introducen diferentes técnicas que son útiles para sistemas de codificación de audio que usan representaciones paramétricas de propiedades estéreo.
Antecedentes de la invención y técnica anterior
La presente invención se refiere a la codificación paramétrica de la imagen estéreo de una señal de audio. Los parámetros habituales usados para describir las propiedades de imágenes estéreo son la diferencia de intensidad entre canales (IID), la diferencia de tiempo entre canales (ITD) y la coherencia entre canales (IC). Para reconstruir la imagen estéreo con base en estos parámetros, se requiere un procedimiento que pueda reconstruir el nivel correcto de correlación entre los dos canales, de acuerdo con el parámetro IC. Esto se consigue mediante un procedimiento de descorrelación.
Existen un par de métodos disponibles para la creación de señales descorrelacionadas. Idealmente, se desea una función invariante en el tiempo y lineal (LTI) con una respuesta de frecuencia de paso total. Un procedimiento obvio para conseguir esto es usando un retardo constante. Sin embargo, usar un retardo, o cualesquiera otras funciones de paso total LTI, tendrá como resultado una respuesta de no paso total después de añadir la señal no procesada. En el caso de un retardo, el resultado será un filtro de peine típico. El filtro de peine proporciona frecuentemente un sonido "metálico" no deseable que, incluso si el efecto de ensanchamiento estéreo puede ser eficiente, reduce mucho la naturalidad del original.
Se conocen asimismo de la técnica anterior métodos de dominio de frecuencias para generar una señal descorrelacionada añadiendo una señal aleatoria a los valores IID a lo largo del eje de frecuencias, donde se usan diferentes secuencias para los diferentes canales de audio. Un problema con la descorrelación del dominio de frecuencias por modificaciones de secuencia aleatorias es la introducción de pre-ecos. Las pruebas subjetivas han demostrado que para señales no estacionarias, los pre-ecos son mucho más molestos que los post-ecos, lo cual también está bien soportado por principios psicoacústicos establecidos. Este problema podría reducirse adaptando dinámicamente tamaños de transformadas a las características de señal, en términos de contenido transitorio. Sin embargo, conmutar tamaños de transformadas es siempre una decisión fuerte (es decir, binaria) que afecta a todo al ancho de banda de la señal y que puede ser difícil de conseguir de manera consistente.
La publicación de solicitud de patente de Estados Unidos US 2003/0219130 A1 describe una síntesis y codificación de audio basada en coherencia. En particular, se sintetiza una escena auditiva a partir de una señal de audio mono modificando, para cada banda crítica, un parámetro de la escena auditiva, tal como una diferencia de nivel interaural (ILD) y/o una diferencia de tiempo interaural (ITD) para cada sub-banda dentro de la banda crítica, donde la modificación se basa en una coherencia estimada promedio para dicha banda crítica. La modificación basada en coherencia produce escenas auditivas con anchuras de objetos, que reproducen con mucha mayor precisión las anchuras de los objetos en la escena auditiva de entrada original. Los parámetros estéreo son parámetros BCC bien conocidos, donde BCC significa codificación biaural de señal. Cuando se generan dos canales de salida descorrelacionados diferentes, los coeficientes de frecuencia que se obtienen mediante una transformada de Fourier discreta se agrupan conjuntamente en una única banda crítica. Con base en la medición de coherencia entre canales, los factores de ponderación son multiplicados por una secuencia pseudoaleatoria, que preferentemente se elige de tal manera que la varianza sea aproximadamente constante para todas las bandas críticas, y el promedio sea "0" dentro de cada banda crítica. La misma secuencia se aplica a los coeficientes espectrales de cada diferente trama.
El artículo de Igor Nikolic: "Improvements of Artificial Reverberation by Use of Subband Feedback Delay Networks", AES 112th Convention, de 10 de mayo de 2002 (10-05-2002), propone un método de descorrelación que usa filtrado de sub-banda en el que los filtros de reverberación tienen características de paso total.
Comprendio de la invención
El objeto de la presente invención es proporcionar un concepto de descodificación para señales multicanal codificadas paramétricamente, o un concepto de codificación para la generación de tales señales, que tiene como resultado una buena calidad de audio y una buena eficiencia de codificación.
Este objeto se consigue mediante un aparato para generar una señal de descorrelación según la reivindicación 1, un método para generar una señal de descorrelación según la reivindicación 5 o un programa de ordenador según la reivindicación 6.
La presente invención se basa en el hallazgo de que, en el lado de descodificación, se obtiene una buena señal de descorrelación para generar un primer y un segundo canales de una señal multicanal con base en la señal mono de entrada, cuando se usa un filtro de reverberación, que introduce un retardo entero o preferentemente fraccionario en la señal de entrada. Es importante que este filtro de reverberación no se aplique a toda la señal de entrada. Por el contrario, se aplican varios filtros de reverberación a varias sub-bandas de la señal de entrada original, es decir, la señal mono, de manera que el filtrado de reverberación que usan los filtros de reverberación no se aplica en el dominio de tiempo o en el dominio de frecuencias, es decir, en el dominio al que se llega cuando se aplica una transformada de Fourier. De forma inventiva, el filtrado de reverberación que usa filtros de reverberación para las sub-bandas se lleva a cabo de manera individual en el dominio de sub-banda.
Una señal de sub-banda incluye una secuencia de por lo menos dos muestras de sub-banda, representando la secuencia de las muestras de sub-banda un ancho de banda de la señal de sub-banda, que es menor que el ancho de banda de la señal de entrada. Por supuesto, el ancho de banda de frecuencia de una señal de sub-banda es mayor que el ancho de banda de frecuencia atribuido a un coeficiente de frecuencia obtenido mediante transformada de Fourier. Las señales de sub-banda se generan preferentemente mediante un banco de filtros que tiene por ejemplo 32 o 64 canales del banco de filtros, mientras que una FFT tendría, para el mismo ejemplo, 1024 o 2048 coeficientes de frecuencia, es decir, canales de frecuencia.
Las señales de sub-banda son señales de sub-banda que se obtienen mediante el filtrado de sub-banda de un bloque de muestras de la señal de entrada. Alternativamente, el banco de filtros de sub-banda puede aplicarse asimismo continuamente sin un procesamiento por bloques. Sin embargo, para la presente invención, se prefiere un procesamiento por bloques.
Puesto que el filtrado de reverberación no se aplica a toda la señal, sino que se aplica por sub-bandas, se evita un sonido "metálico" provocado por el filtrado de peine.
En casos en los que un periodo de muestra entre dos muestras de sub-banda consecutivas de la sub-banda es demasiado grande para una buena impresión sonora en el extremo del descodificador, es preferible usar retardos fraccionarios en un filtro de reverberación, tal como un retardo entre 0,1 y 0,9, y preferentemente de 0,2 a 0,8, del periodo de muestreo de la señal de sub-banda. Debe observarse que, en caso de muestreo crítico, y cuando se generan 64 señales de sub-banda usando un banco de filtros que tiene 64 canales del banco de filtros, el periodo de muestreo en una señal de sub-banda es 64 veces mayor que el periodo de muestreo de la señal de entrada original.
En este caso, debe observarse que los retardos son una parte integral del proceso de filtrado usado en el dispositivo de reverberación. La señal de salida se compone de múltiples versiones retardadas de la señal de entrada. Es preferible retardar señales en fracciones del periodo de muestreo de sub-banda, con el fin de conseguir un buen dispositivo de reverberación en el dominio de sub-banda.
En realizaciones preferidas de la presente invención, el retardo, y preferiblemente el retardo fraccionario introducido por cada filtro de reverberación en cada sub-banda es igual para todas las sub-bandas. Sin embargo, los coeficientes del filtro son diferentes para cada una de las sub-bandas. Se prefiere usar filtros IIR. Dependiendo de la situación real, el retardo fraccionario y los coeficientes del filtro para los diferentes filtros pueden determinarse empíricamente usando pruebas de audición.
Las sub-bandas filtradas mediante el conjunto de filtros de reverberación constituyen una señal de descorrelación que ha de mezclarse con la señal de entrada original, es decir la señal mono, para obtener un canal izquierdo descodificado y un canal derecho descodificado. Esta mezcla de una señal de descorrelación con la señal original se lleva a cabo con base en un parámetro de coherencia entre canales, transmitido junto con la señal codificada paramétricamente. Para obtener diferentes canales izquierdo y derecho, es decir, canales primero y segundo diferentes, la mezcla de la señal de descorrelación con una señal mono para obtener el primer canal de salida es diferente de la mezcla de la señal de descorrelación con la señal mono para obtener el segundo canal de salida.
Para conseguir una eficiencia mayor en el lado de la codificación, se lleva a cabo codificación multicanal usando una determinación adaptativa del conjunto de parámetros estéreo. A este respecto, el codificador incluye, además de medios para calcular la señal mono y además de medios para generar un conjunto de parámetros estéreo, medios para determinar una validez de los conjuntos de parámetros estéreo para partes subsiguientes de los canales izquierdo y derecho. Preferentemente, los medios de determinación son operativos para activar los medios de generación, cuando se determina que el conjunto de parámetros estéreo deja de ser válido, de manera que se calcula un segundo conjunto de parámetros estéreo para partes de los canales izquierdo y derecho que comienzan en un segundo límite de tiempo. Este segundo límite de tiempo se determina asimismo por los medios para determinar la validez.
La señal de salida codificada incluye a continuación la señal mono, un primer conjunto de parámetros estéreo y un primer límite de tiempo asociado con el primer conjunto de parámetros y el segundo conjunto de parámetros estéreo, y el segundo límite de tiempo asociado con el segundo conjunto de parámetros estéreo. En el lado de descodificación, el descodificador usará un conjunto de parámetros estéreo válido hasta que se alcance un nuevo límite de tiempo. Cuando se alcanza este nuevo límite de tiempo, las operaciones de descodificación se llevan a cabo usando el nuevo conjunto de parámetros estéreo.
En comparación con los métodos de la técnica anterior, que realizaban un procesamiento por bloques y, por lo tanto, una determinación por bloques de los conjuntos de parámetros estéreo, la determinación adaptativa inventiva de conjuntos de parámetros estéreo para diferentes límites de tiempo determinados en el lado del codificador proporciona, por una parte, una elevada eficiencia de codificación y, por otra parte, una alta calidad de codificación. Esto se debe al hecho de que para señales relativamente estacionarias, puede usarse el mismo conjunto de parámetros estéreo para muchos bloques de las muestras de la señal mono, sin introducir errores audibles. Por otra parte, cuando están implicadas señales no estacionarias, la determinación de parámetros estéreo adaptativos inventivos proporciona una resolución temporal mejorada, de tal manera que cada parte de señal tiene su conjunto de parámetros estéreo óptimo. La presente invención describe una solución a los problemas de la técnica anterior usando una unidad de reverberación como un descorrelador implementado con líneas de retardo fraccionario en un banco de filtros, y usando un ajuste de nivel adaptativo de la señal reverberada descorrelacionada.
Posteriormente se describen varios aspectos que no forman parte de la presente invención tal como se ha reivindicado. Un aspecto de la invención es un método para retardar una señal al: filtrar una señal en el dominio de tiempo con valor actual mediante la parte de análisis de un banco de filtros complejo; modificar las señales de sub-banda de valor complejo obtenidas a partir del filtrado; y filtrar las señales de sub-banda de valor complejo modificadas mediante la parte de síntesis del banco de filtros; y tomar la parte actual de la señal de salida en el dominio de tiempo de valor complejo, en donde la señal de salida es la suma de las señales obtenidas a partir del filtrado de síntesis.
Otro aspecto de la invención es un método para modificar las señales de sub-banda de valor complejo filtrando cada señal de sub-banda de valor complejo con un filtro de respuesta de impulsos finito de valor complejo, en el que el filtro de respuesta de impulsos finito para un número n de sub-banda es una transformada de Fourier temporal discreta de la forma
para n par;
Figure imgf000004_0001
para n impar
en donde el parámetro, t = T/L, y en donde el banco de filtros de síntesis tiene L sub-bandas y el retardo deseado T se mide en unidades de muestra de señal de salida.
Otro aspecto de la invención es un método para modificar las señales de sub-banda de valor complejo mediante filtrado, en el que el filtro Gt (w ) satisface aproximadamente Vr(w)GT(w)+VT(w+n)GT(w+n)=1, en donde Vt(w ) es la transformada de Fourier temporal discreta de la secuencia
vT(k) = A i ^ p V M l - T - L k ) ,
i
y p(l) es el filtro prototipo de dicho banco de filtros complejo y A es un factor de normalización actual adecuado. Otro aspecto de la invención es un método para modificar las señales de sub-banda de valor complejo mediante filtrado, en donde el filtro Gt(w ) satisface Gt(-w )=Gt(w +^ )* de tal manera que se valoran actualmente muestras pares de respuesta de impulsos indexadas y se valoran de manera puramente imaginaria muestras impares de respuesta de impulsos.
Otro aspecto de la invención es un método para codificar propiedades estéreo de una señal de entrada, mediante un codificador, describiendo unos parámetros de parrilla de tiempo calculados la ubicación temporal de cada conjunto de parámetros estéreo, en donde el número de conjuntos de parámetros estéreo es arbitrario, y en un descodificador se aplica una síntesis estéreo paramétrica según esa rejilla de tiempo.
Otro aspecto de la invención es un método para codificar propiedades estéreo de una señal de entrada, en el que la localización temporal del primer conjunto de parámetros estéreo es, en el caso en el que una señal de tiempo del conjunto de parámetros estéreo coincida con el comienzo de una trama, señalizada explícitamente en vez de señalizar al puntero de tiempo.
Otro aspecto de la invención es un método para la generación de descorrelación estéreo para reconstrucción estéreo paramétrica, mediante un descodificador, aplicando un proceso de reverberación artificial para sintetizar la señal lateral.
Otro aspecto de la invención es un método para la generación de descorrelación estéreo para reconstrucción estéreo paramétrica, mediante un descodificador, realizándose el proceso de reverberación en un banco de filtros modulado complejo que emplea ajuste de retardo de fase en cada canal del banco de filtros.
Otro aspecto de la invención es un método para la generación de descorrelación estéreo para reconstrucción estéreo paramétrica, mediante un descodificador, el proceso de reverberación utiliza un detector diseñado para encontrar señales, en donde la cola de reverberación podría resultar indeseable y que permite atenuar o eliminar la cola de reverberación.
Breve descripción de los dibujos
A continuación, se describirá la presente invención mediante ejemplos ilustrativos, haciendo referencia a los dibujos adjuntos, en los cuales:
la figura 1 ilustra un diagrama de bloques del aparato inventivo;
la figura 2 ilustra un diagrama de bloques de los medios para generar una señal descorrelacionada;
la figura 3 ilustra el análisis de un solo canal y la síntesis del par de canales estéreo con base en las señales de sub­ banda estéreo reconstruidas, de acuerdo con la presente invención;
la figura 4 ilustra un diagrama de bloques de la división de los conjuntos de parámetros estéreo paramétricos en segmentos de tiempo, con base en la característica de señal; y
la figura 5 ilustra un ejemplo de la división de los conjuntos de parámetros estéreo paramétricos en segmentos de tiempo, con base en la característica de señal.
Descripción de realizaciones preferidas
Las realizaciones descritas a continuación son meramente ilustrativas de los principios de la presente invención para codificación estéreo paramétrica. Debe entenderse que resultarán evidentes modificaciones y variaciones de las disposiciones y los detalles descritos en la presente memoria, a los expertos en la técnica. Por lo tanto, la intención es limitarse solamente mediante el ámbito de las reivindicaciones de patente independientes y no mediante los detalles específicos presentados a modo de descripción y explicación de las realizaciones de la presente memoria.
Retardar una señal mediante una fracción de una muestra puede conseguirse mediante varios métodos de interpolación de la técnica anterior. Sin embargo, surgen casos especiales cuando la señal original está disponible como muestras de valor complejo sobremuestreadas. Realizar el retardo fraccionario en el banco qmf aplicando solamente retardo de fase mediante un factor para cada canal qmf, correspondiente a un retardo de tiempo constante, tiene como resultado varios artefactos.
Esto puede evitarse eficazmente usando un filtro de compensación acorde con un enfoque novedoso que permite aproximaciones de alta calidad a retardos arbitrarios en cualquier banco de filtros complejo-exponencial-modulado. A continuación, sigue una descripción detallada.
Un modelo de tiempo continuo
Para simplificar los cálculos, un banco de filtros de la banda L modulado exponencial complejo se modelará en este caso mediante una transformada en ventana de tiempo continua usando las formas de onda de síntesis. u„k(t) = v(t - k) exp\in(n +1/2 )(t - k 9)\, (1)
en la que n,k son enteros con n > 0, y 0 es un término de fase fijo. Se obtienen resultados para señales temporales discretas mediante el muestreo adecuado de la variable t con separación 1/L Se asume que la ventana de valor real v(t) se elige de tal manera que para señales de valor real x(t) se tiene, con mucha precisión, que
Figure imgf000005_0001
si
GO
c„(k) = J x(t)u¡a ( t)d t , (3 )
—GO
en la que * indica conjugación compleja. Se asume asimismo que v(t) está esencialmente limitada en banda al intervalo de frecuencia [-n, n]. Consideremos la modificación de cada banda de frecuencia n filtrando las muestras de análisis temporal discretas cn(k) con un filtro con respuesta de impulso hn(k),
Figure imgf000005_0002
Entonces, puede calcularse que la síntesis modificada
y { t) = 2 Re ¿ ¿ dn (k )u lU(t) (5:
_ n - 0 k=-co
en el dominio de frecuencia vale
v(cd) = H (co)x(co), ( 6 )
en la que / (w) indica transformadas de Fourier de f(t) y
H { a ) = £ t f H(© )|v(cü-7r(« l/2))|2 (7;
en la que, Hn(w)=Xkhn(k)exp(-/kw) es la transformada de Fourier temporal discreta del filtro aplicado en la banda de frecuencia n para n>0 y
H,(co) = H AJ - 6 > y paran<0 (8)
En este caso, debe observarse que el caso especial Hn(w) = 1 conduce a H(w)=1 en (7) debido al diseño especial de la ventana en v(t). Otro caso de interés es Hn(w) = exp(-/w) que proporciona H(w) = exp(-/w), de manera que y(t) = x(t-1).
La solución propuesta
Para obtener un retardo de tamaño t, tal como y(t)=x(t-r), el problema es diseñar filtros Hn(w) para n > 0 de tal manera que
H ( c o ) = exp(-zT®), (9)
en la que H(w) está dado por (7) y (8). La solución particular propuesta en este caso es aplicar los filtros
[exp(-/7r(« 1/2)t)(j t (ct>), para n par;
tf„ (G > )= j )
[exp(-/7r(« l/2 )r )GT(co n ), para n impar (10
En este caso Gr(-w) = Gr(w+n)* implica consistencia con (8) para todo n. La introducción de (10) en el lado derecho de (7) tiene como resultado
H(co) = Qxp(-icoT)[VT(co)GT(co) VT(co tz)Gt(co ti)] ( 11 )
en la que W(w)=Xn¿>(w-n-(2n+1/2)) con ¿>(w)=exp(/rw)|i/(w)|2. Cálculos elementales muestran que Vr(w) es la transformada de Fourier temporal discreta de
Figure imgf000006_0001
Pueden obtenerse aproximaciones muy buenas al retardo perfecto resolviendo sistema lineal
VT(co)GT(co) VT(co n )G T(co 7T) = l (13 !
en el sentido de mínimos cuadrados con un filtro FIR
Gr(o)) = lu ' v¿rrU')cxp(-/Axo) .
En términos de coeficientes de filtro, la ecuación (13) puede escribirse
Figure imgf000006_0002
donde <5[k]=1 para k = 0 y <5[k]=0 para k^0.
En el caso de un banco de filtros de banda L temporal discreta con un filtro prototipo p(k), el retardo obtenido en unidades de muestra es Lr y el cálculo (12) se sustituye con
M ^ Y t P V M i - T - L k ) , (15 )
en la que T es el entero más próximo a Lt. En este caso, p(k) se extiende con ceros fuera de su soporte. Para un filtro prototipo de longitud finita, sólo hay un número finito de VT(k) diferente de cero, y (14) es un sistema de ecuaciones lineales. El número de gr(k) desconocido se elige típicamente para que sea un número pequeño. Para buenos diseños de bancos de filtros QMF, 3-4 tomas proporcionan ya un comportamiento de retardo muy bueno. Además, la dependencia de las tomas del filtro gr(k) con el parámetro de retardo t puede a menudo modelarse satisfactoriamente mediante polinomios de orden bajo.
Parrilla de tiempo adaptativa de señalización para parámetros estéreo
Los sistemas estéreo paramétricos conducen siempre a compromisos en términos de resolución limitada temporal o de frecuencia para minimizar los datos transportados. Sin embargo, es bien sabido por la psicoacústica que algunas señales espaciales pueden ser más importantes que otras, lo que conduce a la posibilidad de descartar las señales menos importantes. Por lo tanto, la resolución temporal no tiene por qué ser constante. Puede obtenerse una gran ganancia en la tasa de bits permitiendo que la parrilla temporal se sincronice con señales espaciales. Esto puede realizarse fácilmente enviando un número variable de conjuntos de parámetros para cada trama de datos que corresponden a un segmento de tiempo de tamaño fijo. Para sincronizar los conjuntos de parámetros con señales espaciales correspondientes, es necesario enviar datos de parrilla de tiempo adicionales que describen la posición temporal para cada conjunto de parámetros. La resolución de estos punteros temporales podría elegirse siendo muy baja para mantener minimizada la cantidad total de datos. Un caso especial, en el que una señal de tiempo para un conjunto de parámetros coincide con el comienzo de una trama, podría señalizarse explícitamente para evitar enviar ese puntero de tiempo.
La figura 4 muestra un aparato inventivo para llevar a cabo análisis de parámetros para segmentos de tiempo que tienen límites de tiempo variables y dependientes de la señal. El aparato inventivo incluye medios 401 para dividir la señal de entrada en uno o varios segmentos de tiempo. Los límites de tiempo que separan los segmentos de tiempo se proporcionan mediante medios 402. Los medios 402 usan un detector diseñado especialmente para extraer señales espaciales que son relevantes para decidir dónde situar los límites de tiempo. Los medios 401 emiten todas las señales de entrada divididas en uno o varios segmentos de tiempo. Esta salida es introducida en medios 403 para análisis paramétrico independiente para cada segmento de tiempo. Los medios 403 entregan un conjunto de parámetros por cada segmento de tiempo analizado.
La figura 5 muestra un ejemplo de cómo el generador de parrilla de tiempo puede funcionar para una señal de entrada hipotética. En este ejemplo, se usa un conjunto de parámetros por cada trama de datos, si no hay presente ninguna otra información de límites de tiempo. Por lo tanto, cuando no existe ninguna otra información de límites de tiempo, se usan los límites de tiempo inherentes de la trama de datos. Los límites de tiempo representados en la figura 5 son emitidos desde los medios 402 de la figura 4. Los segmentos de tiempo representados en la figura 5 se proporcionan mediante los medios 401 de la figura 4.
El aparato para codificar una señal estéreo con el fin de obtener una señal de salida mono y el conjunto de parámetros estéreo, incluye los medios para calcular la señal mono combinando un canal izquierdo y uno derecho de las señales estéreo, mediante una suma ponderada. Adicionalmente, unos medios 403 generan un primer conjunto de parámetros estéreo usando una parte del canal izquierdo y una parte del canal derecho, comenzando las partes en un primer límite de tiempo, y estando conectados a los medios para determinar la validez del primer conjunto de parámetros estéreo para partes subsiguientes del canal izquierdo y el canal derecho.
Los medios de determinación están formados colectivamente por los medios 402 y 401 de la figura 1.
En particular, los medios de determinación son operativos para generar un segundo límite de tiempo y para activar los medios de generación, cuando se determina que este primer conjunto de parámetros estéreo ya no es válido, de manera que se genera un segundo conjunto de parámetros estéreo para partes de los canales izquierdo y derecho que comienzan en el segundo límite de tiempo.
En la figura 4 no se muestran medios para entregar la señal mono, el primer conjunto de parámetros estéreo y el primer límite de tiempo asociado con el primer conjunto de parámetros estéreo, y el segundo conjunto de parámetros estéreo y el segundo límite de tiempo asociado con el segundo conjunto de parámetros estéreo, como la señal estéreo codificada paramétricamente. Los medios para determinar la validez de un conjunto de parámetros estéreo pueden incluir un detector de transitorios, dado que existe una probabilidad elevada de que, después de un transitorio, sea necesario generar un nuevo parámetro estéreo, puesto que la señal ha cambiado significativamente su perfil. Alternativamente, los medios de determinación de la validez pueden incluir un dispositivo de análisis mediante síntesis, que está adaptado para descodificar la señal mono y el conjunto de parámetros estéreo a efectos de obtener un canal izquierdo descodificado y un canal derecho descodificado, con el fin de comparar el canal izquierdo descodificado y el canal derecho descodificado con el canal izquierdo y el canal derecho, y de activar los medios de generación, cuando el canal izquierdo descodificado y el canal derecho descodificado se diferencian del canal izquierdo y el canal derecho en más de un umbral predeterminado.
Trama de datos 1: el segmento de tiempo correspondiente al conjunto de parámetros 1 comienza al principio de la trama de datos 1 dado que no hay presente ninguna otra información de límite de tiempo en esta trama de datos.
Trama de datos 2: están presentes dos límites de tiempo en esta trama de datos. El segmento de tiempo correspondiente al conjunto de parámetros 2 comienza en el primer límite de tiempo en esta trama de datos. El segmento de tiempo correspondiente al conjunto de parámetros 3 comienza en el segundo límite de tiempo en esta trama de datos.
Trama de datos 3: está presente un límite de tiempo en esta trama de datos. El segmento de tiempo correspondiente al conjunto de parámetros 4 comienza en el límite de tiempo en esta trama de datos.
Trama de datos 4: está presente un límite de tiempo en esta trama de datos. Este límite de tiempo coincide con el límite inicial de la trama de datos 4 y no necesita ser señalizado dado que está contemplado en el caso por defecto. Por lo tanto, esta señal de límite de tiempo puede ser eliminada. El segmento de tiempo correspondiente al conjunto de parámetros 5 empieza al comienzo de la trama de datos 4, incluso sin señalizar este límite de tiempo.
Uso de reverberación artificial como método de descorrelación para reconstrucción estéreo paramétrica
Una parte fundamental de la realización de síntesis estéreo en un sistema estéreo paramétrico es reducir la coherencia entre los canales izquierdo y derecho para crear amplitud de la imagen estéreo. Esto puede realizarse añadiendo una versión filtrada de la señal mono original a la señal lateral, en la que las señales lateral y mono están definidas mediante:
mono = (izquierda derecha)/2, y
lateral = (izquierda - derecha)/2, respectivamente.
Para no cambiar demasiado el timbre, el filtro en cuestión deberá ser de carácter de paso total. Un enfoque satisfactorio es usar filtros de paso total similares usados para procesos de reverberación artificial. Los algoritmos de reverberación artificial requieren normalmente una resolución temporal elevada para proporcionar una respuesta de impulso que sea satisfactoriamente difusa en el tiempo. Existen grandes ventajas en basar un algoritmo de reverberación artificial en un banco de filtros complejo, tal como el banco qmf complejo. El banco de filtros proporciona excelentes posibilidades para hacer que las propiedades de reverberación sean selectivas en frecuencia, en términos de, por ejemplo, ecualización de la reverberación, tiempo de caída, densidad y timbre. Sin embargo, las implementaciones de banco de filtros intercambian normalmente resolución temporal por resolución de mayor frecuencia, lo que normalmente complica implementar un proceso de reverberación que sea lo suficientemente suave en el tiempo. Para tratar este problema, un método novedoso debería usar una aproximación de retardo fraccionaria, aplicando solamente un retardo de fase mediante un factor para cada canal qmf correspondiente a un retardo temporal constante. Este método de retardo fraccionario primitivo introduce persistencia temporal grave, que afortunadamente es muy conveniente en este caso. La persistencia temporal contribuye a la difusión temporal, que es muy deseable para algoritmos de reverberación y aumenta a medida que el retardo de fase se aproxima a pi/2 o - pi/2.
Por razones naturales, los procesos de reverberación artificial son procesos con una respuesta infinita al impulso, y ofrecen caídas exponenciales naturales. En el documento [PCT/SE02/01372] se señala que si se usa una unidad de reverberación para generar una señal estéreo, la caída de la reverberación puede en ocasiones ser no deseada después del final de un sonido. Sin embargo, estas colas de reverberación no deseadas pueden fácilmente atenuarse o eliminarse por completo simplemente variando la ganancia de la señal de reverberación. Puede usarse para este propósito un detector diseñado para encontrar finalizaciones de sonidos. Si la unidad de reverberación genera artefactos en algunas señales específicas, por ejemplo, transitorios, puede usarse asimismo un detector para esas señales a efectos de atenuarlas.
La figura 1 muestra un aparato inventivo para el procedimiento de descorrelación de señales que se usa en un sistema estéreo paramétrico. El aparato inventivo incluye medios 101 para proporcionar una serie de señales de sub-banda. Los medios de provisión pueden ser un banco de filtros qMf complejo, en el que cada señal es asociada con un índice de sub-banda.
Las señales de sub-banda emitidas mediante los medios 101 de la figura 1 son introducidas en medios 102 para proporcionar una señal descorrelacionada 102, y en medios 103 y 106 para modificar la señal de sub-banda. La salida de 102 es introducida en medios 104 y 105 para modificar la señal, y las salidas de 103, 104, 105 y 106 son introducidas en medios 107 y 108 para sumar las señales de sub-banda.
En la realización de la invención descrita actualmente, los medios de modificación 103, 104, 105 y 106 de las señales de sub-banda regulan el nivel de la señal descorrelacionada y la señal no procesada que es la salida de 101, multiplicando la señal de sub-banda por un factor de ganancia, de manera que cada suma de cada par tiene como resultado una señal con la cantidad de señal descorrelacionada proporcionada por los parámetros de control. Debe observarse que los factores de ganancia usados en los medios de modificación 103 a 106 no se limitan a un valor positivo. Pueden ser asimismo un valor negativo.
La salida de los medios 107 y 108 para sumar señales de sub-banda es introducida a los medios 109 y 110 para proporcionar una señal en el dominio de tiempo. La salida de 109 corresponde al canal izquierdo de la señal estéreo reconstruida, y la salida de 110 corresponde al canal derecho de la señal estéreo reconstruida. En la realización descrita en este caso, se usa el mismo descorrelador para ambos canales de salida, mientras que los medios para sumar la señal descorrelacionada con la señal no procesada son diferentes para los dos canales de salida. La realización descrita actualmente asegura por lo tanto que las dos señales de salida pueden ser idénticas, así como estar completamente descorrelacionadas, dependiendo de los datos de control proporcionados a los medios para ajustar los niveles de las señales, y de los datos de control proporcionados a los medios para sumar las señales.
En la figura 2 se muestra un diagrama de bloques de los medios para proporcionar una señal descorrelacionada. La señal de sub-banda de entrada es introducida a los medios para filtrar una señal de sub-banda 201. En la realización de la presente invención descrita actualmente, la etapa de filtrado es una unidad de reverberación que incorpora un filtrado de paso total. Los coeficientes del filtro usados son proporcionados mediante los medios para proporcionar coeficientes del filtro 202. El índice de sub-banda de la señal de sub-banda procesada actualmente es introducido a 202. En una realización de la presente invención, se calculan diferentes coeficientes de filtrado con base en el índice de sub-banda proporcionado a 202. La etapa de filtrado en 201, depende de muestras retardadas de la señal de sub­ banda de entrada así como de muestras retardadas de señales intermedias en el procedimiento de filtrado.
Una característica esencial de la presente invención, es que se proporcionan mediante 203 medios para proporcionar un retardo de muestra de sub-banda entero y un retardo de muestra de sub-banda fraccionario. La salida de 201 es introducida en medios para regular el nivel de la señal de sub-banda 204, y asimismo en medios 205 para estimar características de señal, de la señal de sub-banda. En una realización preferida de la presente invención, la característica estimada es el comportamiento transitorio de la señal de sub-banda. En esta realización, un transitorio detectado es señalizado a los medios 204 de regulación del nivel de la señal de sub-banda, de manera que el nivel de la señal se reduce durante los pasos de transitorios. La salida de 204 es la señal descorrelacionada introducida en 104 y 105 de la figura 1.
En la figura 3 se muestran el banco de filtros de análisis individual y los dos bancos de filtros de síntesis. El banco de filtros de análisis 301 funciona sobre la señal de entrada mono, mientras que los bancos de filtros de síntesis 302 y 303 funcionan sobre las señales estéreo reconstruidas.
Por lo tanto, la figura 1 muestra el aparato inventivo para generar una señal de descorrelación que se indica mediante la referencia 102. Tal como se muestra en las figuras 1 ó 3, este aparato incluye medios para proporcionar una serie de señales de sub-banda, en el que una señal de sub-banda incluye la secuencia de por lo menos dos muestras de sub-banda, representando la secuencia de las muestras de sub-banda un ancho de banda de la señal de sub-banda que es menor que un ancho de banda de la señal de entrada. Cada señal de sub-banda es introducida en los medios 201 de filtrado. Cada medio de filtrado 201 incluye un filtro de reverberación, de manera que se obtiene una serie de señales de sub-banda reverberadas, en el que la serie de señales de sub-banda reverberadas representan conjuntamente la señal de descorrelación. Preferentemente, tal como se muestra en la figura 2, puede existir un postprocesamiento a nivel de sub-banda, de señales de sub-banda reverberadas, que se lleva a cabo mediante el bloque 204, que está controlado mediante el bloque 205.
Cada filtro de reverberación se configura con un cierto retardo, y preferentemente un retardo fraccionario, y cada filtro de reverberación tiene varios coeficientes de filtro que, tal como se muestra en la figura 2, dependen del índice de sub-banda. Esto significa que es preferible usar el mismo retardo para cada sub-banda, pero usar conjuntos diferentes de coeficientes de filtro para las diferentes sub-bandas. Esto se simboliza mediante los medios 203 y 202 de la figura 2, aunque en este caso debe mencionarse que los retardos y los coeficientes de filtro se determinan preferiblemente de manera fija cuando se embarca un dispositivo de descorrelación, en el que los retardos y los coeficientes de filtro pueden determinarse empíricamente usando pruebas de audición, etc.
Mediante la figura 1 se muestra un descodificador multicanal, e incluye el aparato inventivo para generar la señal de correlación, que se indica como 102 en la figura 1. El descodificador multicanal mostrado en la figura 1 es para descodificar una señal mono y una medición de coherencia entre canales asociada, representando la medición de coherencia entre canales una coherencia entre una serie de canales originales, en la que la señal mono se obtiene a partir de la serie de canales originales. El bloque 102 de la figura 1 constituye un generador para generar una señal de descorrelación para la señal mono. Los bloques 103, 104, 105, 106 y 107 y 108 constituyen un mezclador para mezclar la señal mono y la señal de descorrelación, de acuerdo con el primer modo de mezclado a efectos de obtener una primera señal de salida descodificada, y de acuerdo con el segundo modo de mezclado a efectos de obtener una segunda señal de salida descodificada, en los que el mezclador es operativo para determinar el primer modo de mezclado y el segundo modo de mezclado con base en la medición de coherencia entre canales transmitida como información lateral a la señal mono.
Preferiblemente, el mezclador es operativo para mezclar en un dominio de sub-bandas, con base en mediciones de coherencia entre canales independientes para diferentes sub-bandas. En este caso, el descodificador multicanal comprende además medios 109 y 110 para transformar la primera y la segunda señales de salida descodificadas, del dominio de sub-banda al dominio de tiempo, a efectos de obtener una primera señal de salida descodificada y una segunda señal de salida descodificada en el dominio de tiempo. Por lo tanto, los medios inventivos 102 para generar una señal de descorrelación y el descodificador multicanal inventivo que se muestra en la figura 1, funcionan en el dominio de sub-bandas y llevan a cabo, como última etapa, una transformación del dominio de sub-bandas al dominio de tiempo.
En función de la situación real, el dispositivo inventivo puede implementarse en equipamiento físico o en soporte lógico, o en un soporte lógico inalterable que incluye componentes de equipamiento físico y componentes de soporte lógico. Cuando se implementa parcial o totalmente en soporte lógico, la invención es asimismo un programa informático con código legible por ordenador para llevar a cabo los métodos inventivos cuando se ejecuta en un ordenador.

Claims (6)

REIVINDICACIONES
1. Aparato para generar una señal de descorrelación que usa una señal de entrada, comprendiendo:
un banco de filtros de sub-banda para proporcionar una pluralidad de señales de sub-banda, en el que una señal de sub-banda incluye una secuencia de al menos dos muestras de sub-banda, representando la secuencia de muestras de sub-banda un ancho de banda de la señal de sub-banda que es menor que un ancho de banda de la señal de entrada, en el que la señal de entrada incluye un bloque de una serie predeterminada de muestras de entrada, siendo menor el número de muestras de sub-banda de la señal de sub-banda que el número de muestras de entrada;
un filtro de reverberación para obtener una pluralidad de señales de sub-banda reverberadas a partir de la pluralidad de señales de sub-banda, teniendo el filtrado del filtro de reverberación una característica de paso total, siendo operativo el filtro de reverberación para aplicar un retardo fraccionario a cada señal de sub-banda y estando adaptado para tener diferentes conjuntos de coeficientes de filtro para cada señal de sub-banda en el que la pluralidad de señales de sub-banda reverberadas representan conjuntamente la señal de descorrelación; y
un mezclador para mezclar la señal de descorrelación con la señal de entrada para obtener así un canal izquierdo y un canal derecho de una señal estéreo descodificada.
2. El aparato de la reivindicación 1, en el que el retardo fraccionario es mayor que cero y menor que un período de muestreo.
3. El aparato de la reivindicación 2, en el que el retardo fraccionario es menor que 0,9 veces el periodo de muestreo de la señal de sub-banda y mayor que 0,1 veces el periodo de muestreo de la señal de sub-banda.
4. El aparato según cualquiera de las reivindicaciones anteriores, en el que el filtro de reverberación es operativo para introducir retardos de fase predeterminados en las señales de sub-banda.
5. Método para generar una señal de descorrelación usando una señal de entrada, que comprende:
proporcionar (101) una pluralidad de señales de sub-banda, en el que una señal de sub-banda incluye una secuencia de al menos dos muestras de sub-banda, representando la secuencia de muestras de sub-banda un ancho de banda de la señal de sub-banda, que es menor que un ancho de banda de la señal de entrada, en el que la señal de entrada incluye un bloque de un número predeterminado de muestras de entrada, siendo el número de muestras de sub-banda en una señal de sub-banda menor que el número de muestras de entrada;
filtrar (201) cada señal de sub-banda usando un filtro de reverberación para obtener una pluralidad de señales de sub-banda reverberadas, teniendo el filtrado del filtro de reverberación una característica de paso total, en el que el filtro de reverberación es operativo para aplicar un retardo fraccionario a cada señal de sub-banda y donde el filtro de reverberación está adaptado para tener conjuntos diferentes de coeficientes de filtro para cada señal de sub-banda, en el que una pluralidad de señales de sub-banda reverberadas representan conjuntamente la señal de descorrelación; y
mezclar la señal de descorrelación con la señal de entrada para obtener así un canal izquierdo y un canal derecho de una señal estéreo descodificada.
6. Un programa informático que tiene un código legible por ordenador para realizar, cuando se ejecuta en un ordenador, el método de la reivindicación 5.
ES17173337T 2003-04-30 2004-04-30 Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja Expired - Lifetime ES2822163T3 (es)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
SE0301273A SE0301273D0 (sv) 2003-04-30 2003-04-30 Advanced processing based on a complex-exponential-modulated filterbank and adaptive time signalling methods

Publications (1)

Publication Number Publication Date
ES2822163T3 true ES2822163T3 (es) 2021-04-29

Family

ID=20291180

Family Applications (9)

Application Number Title Priority Date Filing Date
ES17173336T Expired - Lifetime ES2790886T3 (es) 2003-04-30 2004-04-30 Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja y métodos para señalizar el tiempo adaptativos
ES10180688.3T Expired - Lifetime ES2662671T3 (es) 2003-04-30 2004-04-30 Procesamiento avanzado basado en un banco de filtros modulado exponencialmente complejo y procedimientos de señalización de tiempos adaptativos
ES17173337T Expired - Lifetime ES2822163T3 (es) 2003-04-30 2004-04-30 Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja
ES10180679.2T Expired - Lifetime ES2685508T3 (es) 2003-04-30 2004-04-30 Procesamiento avanzado basado en un banco de filtros modulado exponencialmente complejo y procedimientos de señalización de tiempos adaptativos
ES17173334T Expired - Lifetime ES2749575T3 (es) 2003-04-30 2004-04-30 Procesamiento avanzado basado en un banco de filtros complejo, exponencial y modulado
ES06026639T Expired - Lifetime ES2420764T3 (es) 2003-04-30 2004-04-30 Codificación paramétrica de la imagen estéreo de una señal de audio
ES17173333T Expired - Lifetime ES2789575T3 (es) 2003-04-30 2004-04-30 Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja
ES17173338T Expired - Lifetime ES2790860T3 (es) 2003-04-30 2004-04-30 Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja
ES09009940.9T Expired - Lifetime ES2686088T3 (es) 2003-04-30 2004-04-30 Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja y procedimientos de señalización temporal adaptativos

Family Applications Before (2)

Application Number Title Priority Date Filing Date
ES17173336T Expired - Lifetime ES2790886T3 (es) 2003-04-30 2004-04-30 Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja y métodos para señalizar el tiempo adaptativos
ES10180688.3T Expired - Lifetime ES2662671T3 (es) 2003-04-30 2004-04-30 Procesamiento avanzado basado en un banco de filtros modulado exponencialmente complejo y procedimientos de señalización de tiempos adaptativos

Family Applications After (6)

Application Number Title Priority Date Filing Date
ES10180679.2T Expired - Lifetime ES2685508T3 (es) 2003-04-30 2004-04-30 Procesamiento avanzado basado en un banco de filtros modulado exponencialmente complejo y procedimientos de señalización de tiempos adaptativos
ES17173334T Expired - Lifetime ES2749575T3 (es) 2003-04-30 2004-04-30 Procesamiento avanzado basado en un banco de filtros complejo, exponencial y modulado
ES06026639T Expired - Lifetime ES2420764T3 (es) 2003-04-30 2004-04-30 Codificación paramétrica de la imagen estéreo de una señal de audio
ES17173333T Expired - Lifetime ES2789575T3 (es) 2003-04-30 2004-04-30 Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja
ES17173338T Expired - Lifetime ES2790860T3 (es) 2003-04-30 2004-04-30 Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja
ES09009940.9T Expired - Lifetime ES2686088T3 (es) 2003-04-30 2004-04-30 Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja y procedimientos de señalización temporal adaptativos

Country Status (13)

Country Link
US (2) US7487097B2 (es)
EP (12) EP3244637B1 (es)
JP (2) JP4527716B2 (es)
KR (1) KR100717604B1 (es)
CN (3) CN101819777B (es)
AT (1) ATE444655T1 (es)
DE (1) DE602004023381D1 (es)
DK (9) DK2124485T3 (es)
ES (9) ES2790886T3 (es)
HK (8) HK1081715A1 (es)
PL (9) PL3244637T3 (es)
SE (1) SE0301273D0 (es)
WO (1) WO2004097794A2 (es)

Families Citing this family (61)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE0301273D0 (sv) * 2003-04-30 2003-04-30 Coding Technologies Sweden Ab Advanced processing based on a complex-exponential-modulated filterbank and adaptive time signalling methods
EP1672618B1 (en) * 2003-10-07 2010-12-15 Panasonic Corporation Method for deciding time boundary for encoding spectrum envelope and frequency resolution
WO2006033058A1 (en) * 2004-09-23 2006-03-30 Koninklijke Philips Electronics N.V. A system and a method of processing audio data, a program element and a computer-readable medium
CA2620627C (en) * 2005-08-30 2011-03-15 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
KR100891687B1 (ko) * 2005-08-30 2009-04-03 엘지전자 주식회사 오디오 신호의 인코딩 및 디코딩 장치, 및 방법
WO2007029412A1 (ja) * 2005-09-01 2007-03-15 Matsushita Electric Industrial Co., Ltd. マルチチャンネル音響信号処理装置
KR101370365B1 (ko) 2005-09-13 2014-03-05 코닌클리케 필립스 엔.브이. 3d 사운드를 발생시키기 위한 방법 및 디바이스
WO2007080211A1 (en) * 2006-01-09 2007-07-19 Nokia Corporation Decoding of binaural audio signals
KR100803212B1 (ko) 2006-01-11 2008-02-14 삼성전자주식회사 스케일러블 채널 복호화 방법 및 장치
EP4178110B1 (en) * 2006-01-27 2024-04-24 Dolby International AB Efficient filtering with a complex modulated filterbank
KR100773560B1 (ko) * 2006-03-06 2007-11-05 삼성전자주식회사 스테레오 신호 생성 방법 및 장치
WO2007106553A1 (en) * 2006-03-15 2007-09-20 Dolby Laboratories Licensing Corporation Binaural rendering using subband filters
WO2007110101A1 (en) * 2006-03-28 2007-10-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Enhanced method for signal shaping in multi-channel audio reconstruction
ATE527833T1 (de) 2006-05-04 2011-10-15 Lg Electronics Inc Verbesserung von stereo-audiosignalen mittels neuabmischung
KR100763920B1 (ko) 2006-08-09 2007-10-05 삼성전자주식회사 멀티채널 신호를 모노 또는 스테레오 신호로 압축한 입력신호를 2채널의 바이노럴 신호로 복호화하는 방법 및 장치
JP5232791B2 (ja) 2006-10-12 2013-07-10 エルジー エレクトロニクス インコーポレイティド ミックス信号処理装置及びその方法
PT2076901T (pt) 2006-10-25 2017-08-23 Fraunhofer Ges Forschung Aparelho e método para gerar valores de sub-banda de áudio e aparelho e método para gerar amostras de áudio de domínio de tempo
USRE50009E1 (en) 2006-10-25 2024-06-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating audio subband values and apparatus and method for generating time-domain audio samples
JP5103880B2 (ja) * 2006-11-24 2012-12-19 富士通株式会社 復号化装置および復号化方法
DE102007018032B4 (de) * 2007-04-17 2010-11-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Erzeugung dekorrelierter Signale
JPWO2008132850A1 (ja) * 2007-04-25 2010-07-22 パナソニック株式会社 ステレオ音声符号化装置、ステレオ音声復号装置、およびこれらの方法
CN101790756B (zh) * 2007-08-27 2012-09-05 爱立信电话股份有限公司 瞬态检测器以及用于支持音频信号的编码的方法
WO2009047858A1 (ja) * 2007-10-12 2009-04-16 Fujitsu Limited エコー抑圧システム、エコー抑圧方法、エコー抑圧プログラム、エコー抑圧装置、音出力装置、オーディオシステム、ナビゲーションシステム及び移動体
BR122012006269A2 (pt) 2008-03-10 2019-07-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Equipamento e método para a manipulação de um sinal de áudio tendo um evento transiente
US8831936B2 (en) * 2008-05-29 2014-09-09 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for speech signal processing using spectral contrast enhancement
US8538749B2 (en) * 2008-07-18 2013-09-17 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for enhanced intelligibility
CN102257562B (zh) 2008-12-19 2013-09-11 杜比国际公司 用空间线索参数对多通道音频信号应用混响的方法和装置
CA3152894C (en) 2009-03-17 2023-09-26 Dolby International Ab Advanced stereo coding based on a combination of adaptively selectable left/right or mid/side stereo coding and of parametric stereo coding
CN101533641B (zh) 2009-04-20 2011-07-20 华为技术有限公司 对多声道信号的声道延迟参数进行修正的方法和装置
US9202456B2 (en) * 2009-04-23 2015-12-01 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for automatic control of active noise cancellation
US11657788B2 (en) 2009-05-27 2023-05-23 Dolby International Ab Efficient combined harmonic transposition
TWI675367B (zh) 2009-05-27 2019-10-21 瑞典商杜比國際公司 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體
US9105300B2 (en) 2009-10-19 2015-08-11 Dolby International Ab Metadata time marking information for indicating a section of an audio object
US8718290B2 (en) 2010-01-26 2014-05-06 Audience, Inc. Adaptive noise reduction using level cues
JP5299327B2 (ja) 2010-03-17 2013-09-25 ソニー株式会社 音声処理装置、音声処理方法、およびプログラム
US9378754B1 (en) 2010-04-28 2016-06-28 Knowles Electronics, Llc Adaptive spatial classifier for multi-microphone systems
US9053697B2 (en) 2010-06-01 2015-06-09 Qualcomm Incorporated Systems, methods, devices, apparatus, and computer program products for audio equalization
WO2012009851A1 (en) * 2010-07-20 2012-01-26 Huawei Technologies Co., Ltd. Audio signal synthesizer
MY156027A (en) 2010-08-12 2015-12-31 Fraunhofer Ges Forschung Resampling output signals of qmf based audio codecs
JP5581449B2 (ja) * 2010-08-24 2014-08-27 ドルビー・インターナショナル・アーベー Fmステレオ無線受信機の断続的モノラル受信の隠蔽
KR102073544B1 (ko) 2010-09-16 2020-02-05 돌비 인터네셔널 에이비 교차 곱 강화된 서브밴드 블록 기반 고조파 전위
JP6049762B2 (ja) 2012-02-24 2016-12-21 ドルビー・インターナショナル・アーベー オーディオ処理
EP2875620B1 (en) * 2012-07-23 2020-09-02 Dali Systems Co. Ltd. Method and system for aligning signals widely spaced in frequency for wideband digital predistortion in wireless communication systems
TWI618050B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於音訊處理系統中之訊號去相關的方法及設備
TWI618051B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於利用估計之空間參數的音頻訊號增強的音頻訊號處理方法及裝置
WO2014126688A1 (en) 2013-02-14 2014-08-21 Dolby Laboratories Licensing Corporation Methods for audio signal transient detection and decorrelation control
BR112015018522B1 (pt) 2013-02-14 2021-12-14 Dolby Laboratories Licensing Corporation Método, aparelho e meio não transitório que tem um método armazenado no mesmo para controlar a coerência entre canais de sinais de áudio com upmix.
EP2830053A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal
EP3044783B1 (en) 2013-09-12 2017-07-19 Dolby International AB Audio coding
EP3561809B1 (en) 2013-09-12 2023-11-22 Dolby International AB Method for decoding and decoder.
KR101815082B1 (ko) * 2013-09-17 2018-01-04 주식회사 윌러스표준기술연구소 멀티미디어 신호 처리 방법 및 장치
WO2015060654A1 (ko) 2013-10-22 2015-04-30 한국전자통신연구원 오디오 신호의 필터 생성 방법 및 이를 위한 파라메터화 장치
US9928728B2 (en) * 2014-05-09 2018-03-27 Sony Interactive Entertainment Inc. Scheme for embedding a control signal in an audio signal using pseudo white noise
US10043527B1 (en) * 2015-07-17 2018-08-07 Digimarc Corporation Human auditory system modeling with masking energy adaptation
JP6763194B2 (ja) * 2016-05-10 2020-09-30 株式会社Jvcケンウッド 符号化装置、復号装置、通信システム
KR102201308B1 (ko) 2016-11-23 2021-01-11 텔레호낙티에볼라게트 엘엠 에릭슨(피유비엘) 상관해제 필터들의 적응적 제어를 위한 방법 및 장치
EP3358798A1 (en) * 2017-02-06 2018-08-08 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Receiver, transmitter, communication system for subband communication and methods for subband communication
GB2572650A (en) 2018-04-06 2019-10-09 Nokia Technologies Oy Spatial audio parameters and associated spatial audio playback
GB2574239A (en) 2018-05-31 2019-12-04 Nokia Technologies Oy Signalling of spatial audio parameters
CN110740416B (zh) * 2019-09-27 2021-04-06 广州励丰文化科技股份有限公司 一种音频信号处理方法及装置
CN110740404B (zh) * 2019-09-27 2020-12-25 广州励丰文化科技股份有限公司 一种音频相关性的处理方法及音频处理装置

Family Cites Families (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6424700A (en) * 1987-07-21 1989-01-26 Nippon Chemicon Piezoelectric acoustic transducer
US5235646A (en) * 1990-06-15 1993-08-10 Wilde Martin D Method and apparatus for creating de-correlated audio output signals and audio recordings made thereby
SG49883A1 (en) * 1991-01-08 1998-06-15 Dolby Lab Licensing Corp Encoder/decoder for multidimensional sound fields
JP2727883B2 (ja) * 1992-08-20 1998-03-18 ヤマハ株式会社 楽音合成装置
JP3250577B2 (ja) * 1992-12-15 2002-01-28 ソニー株式会社 適応信号処理装置
SG48273A1 (en) * 1993-11-26 1998-04-17 Philips Electronics Nv A transmission system and a transmitter and a receiver for use in such a system
FR2715527B1 (fr) * 1994-01-21 1996-02-23 Thomson Csf Procédé et dispositif d'analyse et de synthèse en sous bandes adaptatifs.
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US5848164A (en) * 1996-04-30 1998-12-08 The Board Of Trustees Of The Leland Stanford Junior University System and method for effects processing on audio subband data
DE19632734A1 (de) * 1996-08-14 1998-02-19 Thomson Brandt Gmbh Verfahren und Vorrichtung zum Generieren eines Mehrton-Signals aus einem Mono-Signal
GB2318029B (en) * 1996-10-01 2000-11-08 Nokia Mobile Phones Ltd Audio coding method and apparatus
TW369746B (en) * 1996-11-13 1999-09-11 Sanyo Electric Co Surround circuit
FR2761550B1 (fr) * 1997-03-28 1999-06-25 France Telecom Filtre numerique pour retards fractionnaires
WO1998046045A1 (fr) * 1997-04-10 1998-10-15 Sony Corporation Procede et dispositif de codage, procede et dispositif de decodage et support d'enregistrement
JPH1132399A (ja) * 1997-05-13 1999-02-02 Sony Corp 符号化方法及び装置、並びに記録媒体
US5890125A (en) * 1997-07-16 1999-03-30 Dolby Laboratories Licensing Corporation Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method
US6501860B1 (en) * 1998-01-19 2002-12-31 Canon Kabushiki Kaisha Digital signal coding and decoding based on subbands
DE19900819A1 (de) * 1999-01-12 2000-07-13 Bosch Gmbh Robert Verfahren zum Dekodieren gestörter Funksignale von Mehrkanal-Audiosendungen
FR2793629B1 (fr) * 1999-05-12 2001-08-03 Matra Nortel Communications Procede et dispositif d'annulation d'echo stereophonique a filtrage dans le domaine frequentiel
GB2353926B (en) * 1999-09-04 2003-10-29 Central Research Lab Ltd Method and apparatus for generating a second audio signal from a first audio signal
US6978236B1 (en) * 1999-10-01 2005-12-20 Coding Technologies Ab Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching
JP3951690B2 (ja) * 2000-12-14 2007-08-01 ソニー株式会社 符号化装置および方法、並びに記録媒体
JP4137401B2 (ja) * 2001-04-16 2008-08-20 ティーオーエー株式会社 能動型雑音除去装置
US7006636B2 (en) 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis
SE0202159D0 (sv) * 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
CA2354808A1 (en) * 2001-08-07 2003-02-07 King Tam Sub-band adaptive signal processing in an oversampled filterbank
CA2354858A1 (en) * 2001-08-08 2003-02-08 Dspfactory Ltd. Subband directional audio signal processing using an oversampled filterbank
KR100923297B1 (ko) * 2002-12-14 2009-10-23 삼성전자주식회사 스테레오 오디오 부호화 방법, 그 장치, 복호화 방법 및그 장치
JP4597967B2 (ja) * 2003-04-17 2010-12-15 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ信号生成
SE0301273D0 (sv) * 2003-04-30 2003-04-30 Coding Technologies Sweden Ab Advanced processing based on a complex-exponential-modulated filterbank and adaptive time signalling methods
US7391870B2 (en) 2004-07-09 2008-06-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E V Apparatus and method for generating a multi-channel output signal

Also Published As

Publication number Publication date
EP3244640A1 (en) 2017-11-15
EP2124485A2 (en) 2009-11-25
DK3244639T3 (da) 2020-05-04
HK1245552A1 (zh) 2018-08-24
CN101071569A (zh) 2007-11-14
EP1768454B1 (en) 2013-06-12
HK1245554A1 (zh) 2018-08-24
EP3247135B1 (en) 2020-09-02
ES2686088T3 (es) 2018-10-16
HK1081715A1 (en) 2006-05-19
EP3244640B1 (en) 2020-04-08
EP3244637B1 (en) 2020-04-08
EP3247135A1 (en) 2017-11-22
EP3244638A1 (en) 2017-11-15
DK2265041T3 (en) 2018-03-05
SE0301273D0 (sv) 2003-04-30
ATE444655T1 (de) 2009-10-15
EP3244639B1 (en) 2020-04-08
WO2004097794A3 (en) 2005-09-09
ES2790860T3 (es) 2020-10-29
EP1616461B1 (en) 2009-09-30
ES2685508T3 (es) 2018-10-09
ES2749575T3 (es) 2020-03-23
EP2265040A3 (en) 2011-01-26
CN1781338A (zh) 2006-05-31
US7487097B2 (en) 2009-02-03
DK3244640T3 (da) 2020-05-04
PL3247135T3 (pl) 2020-11-30
ES2420764T3 (es) 2013-08-26
PL2265040T3 (pl) 2019-01-31
WO2004097794A2 (en) 2004-11-11
DK3244637T3 (da) 2020-05-04
EP2265040A2 (en) 2010-12-22
EP3244637A1 (en) 2017-11-15
ES2789575T3 (es) 2020-10-26
EP2124485B1 (en) 2018-06-27
US20070121952A1 (en) 2007-05-31
EP2265041A3 (en) 2011-05-25
EP1768454A3 (en) 2010-09-01
EP2265042A2 (en) 2010-12-22
CN1781338B (zh) 2010-04-21
CN101819777A (zh) 2010-09-01
PL3244640T3 (pl) 2020-07-13
PL3244638T3 (pl) 2020-01-31
EP2124485A3 (en) 2009-12-02
EP3823316A1 (en) 2021-05-19
EP2265041B1 (en) 2017-12-13
HK1099882A1 (en) 2007-08-24
EP3244639A1 (en) 2017-11-15
JP2007219542A (ja) 2007-08-30
HK1147591A1 (en) 2011-08-12
KR100717604B1 (ko) 2007-05-15
DK1768454T3 (da) 2013-09-08
EP2265040B1 (en) 2018-06-27
EP2265042A3 (en) 2011-03-16
DE602004023381D1 (de) 2009-11-12
PL2265041T3 (pl) 2018-05-30
JP2006524832A (ja) 2006-11-02
EP3823316B1 (en) 2023-03-29
CN101071569B (zh) 2011-06-22
PL2124485T3 (pl) 2019-01-31
DK2265040T3 (en) 2018-09-24
DK3244638T3 (da) 2019-10-14
HK1245556A1 (zh) 2018-08-24
DK3247135T3 (da) 2020-09-28
US7564978B2 (en) 2009-07-21
EP2265042B1 (en) 2016-10-12
DK2124485T3 (en) 2018-10-01
EP3244638B1 (en) 2019-08-28
PL3244637T3 (pl) 2020-08-24
KR20060020613A (ko) 2006-03-06
HK1245555A1 (zh) 2018-08-24
ES2790886T3 (es) 2020-10-29
EP1616461A2 (en) 2006-01-18
JP4602375B2 (ja) 2010-12-22
EP1768454A2 (en) 2007-03-28
PL3244639T3 (pl) 2020-06-29
PL1768454T3 (pl) 2013-10-31
ES2662671T3 (es) 2018-04-09
US20060053018A1 (en) 2006-03-09
HK1245553A1 (zh) 2018-08-24
CN101819777B (zh) 2012-02-01
JP4527716B2 (ja) 2010-08-18
EP2265041A2 (en) 2010-12-22

Similar Documents

Publication Publication Date Title
ES2822163T3 (es) Procesamiento avanzado basado en un banco de filtros con modulación exponencial compleja
ES2773794T3 (es) Aparato y procedimiento para estimar una diferencia de tiempos entre canales
ES2940283T3 (es) Filtración eficiente con un banco de filtros modulado complejo
ES2812343T3 (es) Sistema de filtro que comprende un convertidor de filtro y un compresor de filtro y método de funcionamiento del sistema de filtro
KR100717607B1 (ko) 스테레오 인코딩 및 디코딩 장치와 방법