ES2215935T3

ES2215935T3 - Realizacion perceptual mejorada de metodos de codificacion de reconstruccion de altas frecuencias por filtrado adaptativo.

Info

Publication number: ES2215935T3
Application number: ES01983041T
Authority: ES
Inventors: Kristofer Kjorling; Per Ekstrand; Fredrik Henn; Lars Villemoes
Original assignee: Coding Technologies Sweden AB
Current assignee: Coding Technologies Sweden AB
Priority date: 2000-11-14
Filing date: 2001-11-13
Publication date: 2004-10-16
Anticipated expiration: 2021-11-13
Also published as: DE60102838T2; EP1342230B1; KR100517229B1; WO2002041301A1; CN1267890C; JP2004514179A; DE60102838D1; HK1056429A1; PT1342230E; US20060036432A1; ATE264533T1; AU2002214496A1; CN1481545A; KR20030062338A; US20020087304A1; US7433817B2; SE0004163D0; EP1342230A1; CN1766993A; JP3954495B2

Abstract

Aparato para estimar un nivel de blanqueo espectral que debe ser aplicado a una señal antes de una etapa de regeneración de altas frecuencias o después de la etapa de regeneración de altas frecuencias que se va a llevar a cabo cuando se genera una señal regenerada en altas frecuencias que tiene una banda alta que se basa en una señal de banda baja, en el cual el blanqueo espectral se obtiene filtrando utilizando un filtro de blanqueo espectral, siendo el filtro de blanqueo espectral un filtro adaptativo que es adaptable por medio de un parámetro de filtro, comprendiendo el aparato: - Medios (803) para estimar un carácter tonal de una señal de audio original que va a ser codificada, en un instante dado, en el cual la señal original de audio se va a codificar mediante un codificador de audio para obtener una señal de audio codificada que representa únicamente una banda baja de la señal de audio original, incluyendo el carácter tonal estimado un carácter tonal estimado de una banda ancha de laseñal original de audio, que no está incluida en la señal codificada de audio; - Medios (803) para determinar un parámetro de filtro variable del filtro de blanqueo espectral basado en el carácter tonal estimado; y - Medios (805) para asociar el parámetro de filtro variable a la señal de audio codificada para obtener una cadena de bits que tiene codificada la señal de audio, teniendo el parámetro de filtro variable, siendo el parámetro de filtro variable dependiente de la señal codificada de audio.

Description

Realización perceptual mejorada de métodos de codificación de reconstrucción de altas frecuencias por filtrado adaptativo.

Campo técnico

La presente invención se refiere a sistemas de codificación de fuentes de audio utilizando reconstrucción de altas frecuencias (HFR) tal como replicación de banda espectral, SBR [documento WO 98/57436] o métodos relacionados. Mejora el rendimiento de los métodos de alta calidad (SBR) así como de los métodos de baja calidad (patente de Estados Unidos nº 5.127.054). Es aplicable tanto a sistemas de codificación de discurso como de codificación de audio natural.

Antecedentes de la invención

En la reconstrucción de altas frecuencias de señales de audio, donde se extrapola una banda alta desde una banda baja, es importante tener medios para controlar los componentes tonales de la banda alta reconstruida hasta un grado mayor del que se puede conseguir con un ajuste basto de la envolvente, según se utiliza comúnmente en los sistemas HFR. Esto es necesario ya que las componentes tonales de la mayoría de las señales de audio tales como voces y la mayoría de los instrumentos acústicos, son usualmente más fuertes en las regiones de baja frecuencia (es decir por debajo de 4 a 5 kHz) en comparación con las regiones de alta frecuencia. Un ejemplo extremo es una serie armónica muy pronunciada en la banda baja y más o menos ruidos puros en la banda alta. Una forma de aproximarse a esto es añadiendo ruido de forma adaptativa a la banda alta reconstruida (Adaptive Noise Addition [documento PCT/SE00/00159]). No obstante, esto no es a veces suficiente para suprimir el carácter tonal de la banda baja, dando a la banda alta reconstruida un carácter de sonido repetitivo "de zumbido". Asimismo, puede ser difícil conseguir las características temporales correctas del ruido. Otro problema tiene lugar cuando se mezclan dos series armónicas, una con gran densidad armónica (tono bajo) y la otra con baja densidad armónica (tono alto). Si la serie armónica de tono alto domina sobre la otra en la banda baja pero no en la banda alta, el HFR provoca que los armónicos de la señal de tono alto dominen la banda alta, haciendo que la banda alta reconstruida suene "metálica" en comparación con la original. Ninguna de las situaciones anteriormente descritas se puede controlar utilizando el ajuste de envolvente utilizado comúnmente en los sistemas HFR. En algunas implementaciones se introduce un grado constante de blanqueo espectral durante el ajuste de envolvente espectral de la señal HFR. Esto da resultados satisfactorios cuando se desea ese grado particular de blanqueo espectral, pero introduce graves alteraciones para fragmentos de señal que no se benefician de ese grado particular de blanqueo espectral.

Sumario de la invención

La presente invención se refiere al problema del sonido "metálico" y de "zumbido" que se introduce comúnmente en los métodos HFR. Este utiliza un sofisticado algoritmo de detección en el lado del codificador para estimar la cantidad preferida de blanqueo espectral que debe aplicarse en el decodificador. El blanqueo espectral varia con el tiempo así como con la frecuencia, garantizando los mejores medios para controlar los contenidos armónicos de la banda alta replicada. La presente invención se puede llevar a cabo en una implementación del dominio del tiempo así como en una implementación de bancos del filtro de sub-banda.

La presente invención comprende las siguientes características:

- En el codificador, estimar el carácter tonal de una señal original para diferentes regiones de frecuencia en un instante dado.

- En el codificador, estimar la cantidad de blanqueo espectral requerida, para regiones de diferentes frecuencias en un instante dado, con objeto de obtener un carácter tonal similar después del HFR en el decodificador, dado el método HFR utilizado en el decodificador.

- Transmitir la información en el grado preferido de blanqueo espectral desde el codificador al decodificador.

- En el decodificador, llevar a cabo el blanqueo espectral bien en el dominio de tiempos o en un banco de filtros de sub-banda, de acuerdo con la información transmitida desde el codificador.

- El filtro adaptativo utilizado para el blanqueo espectral en el decodificador se obtiene usando predicción lineal.

- El grado de blanqueo espectral requerido se estima en el codificador por medios de predicción.

- El grado de blanqueo espectral se controla variando el orden de predicción o variando el factor de expansión de anchura de banda del polinomio LPC, o mezclando la señal filtrada, hasta un grado dado, con la homóloga sin procesar.

- La capacidad de utilizar un banco de filtros de sub-banda consiguiendo factores de predicción de bajo orden, ofrece una implementación muy efectiva, especialmente en un sistema en el que el banco de filtros ya se utiliza para el ajuste de la envolvente.

- El grado de blanqueo espectral, selectivo de frecuencias se obtiene fácilmente dada la nueva implementación de banco de filtros de la presente invención.

Breve descripción de los dibujos

La presente invención será ahora descrita por medio de ejemplos ilustrativos pero no limitativos del alcance o espíritu de la invención, con referencia a los dibujos adjuntos en los que:

La figura 1 ilustra la expansión de anchura de banda de un espectro LPC;

La figura 2 ilustra el espectro absoluto de una señal original en el instante t_{0}, y en el instante t_{1};

La figura 3 ilustra el espectro absoluto de la salida en el instante t_{0} y en el instante t_{1} de una copia de un sistema HFR de la técnica anterior sin filtrado adaptativo;

La figura 4 ilustra el espectro absoluto de la salida, en el instante t_{0} y en el instante t_{1}, de una copia de un sistema HFR sin filtrado adaptativo, de acuerdo con la presente invención.

La figura 5a ilustra la señal del caso peor de acuerdo con la presente invención;

La figura 5b ilustra la autocorrelación para la banda alta y la banda baja de la señal del caso peor;

La figura 5c ilustra la relación q tonal a ruido para diferentes frecuencias, de acuerdo con la presente invención;

La figura 6 ilustra una implementación en dominio de tiempo del filtrado adaptativo en el decodificador, de acuerdo con la presente invención;

La figura 7 ilustra una implementación de banco de filtros de sub-banda del filtrado adaptativo en el decodificador, de acuerdo con la presente invención;

La figura 8 ilustra una implementación de codificador de la presente invención;

La figura 9 ilustra una implementación de decodificador de la presente invención.

Descripción de las realizaciones preferidas

Las realizaciones descritas a continuación son meramente ilustrativas de los principios de la presente invención para la mejora de sistemas de reconstrucción de altas frecuencias. Se entiende que las modificaciones y variaciones en las disposiciones y detalles descritos en este documento serán evidentes a aquellos expertos en la técnica. Se pretende, por ello, que se limite únicamente por el objeto las reivindicaciones de la inminente patente y no por los detalles específicos presentados por medio de la descripción y explicación de las realizaciones de este documen-
to.

Cuando se ajusta una envolvente espectral de una señal a una envolvente espectral dada, siempre se aplica una cierta cantidad de blanqueo espectral. Esto, ya que si la envolvente espectral basta transmitida se describe mediante H_{envRef}(Z)y la envolvente espectral del segmento de señal actual se describe mediante H_{envCur}(Z), la función de filtro aplicada es:

(1)W(z) = \frac{H_{envRef}(z)}{H_{envCur}(z)}

En la presente invención la resolución de frecuencia para H_{envRef}(Z) no es necesariamente la misma que para H_{envCur}(Z). La invención utiliza resolución de frecuencia adaptativa de H_{envCur}(Z) para el ajuste de la envolvente de señales HFR. El segmento de señal se filtra con la inversa de H_{envCur}(Z) con objeto de blanquear espectralmente la señal de acuerdo con la ecuación 1. Si H_{envCur}(Z) se obtiene utilizando predicción lineal, se puede describir de acuerdo con

(2)H_{envCur}(z) = \frac{G}{A(z)'}

donde

(3)A(z) = 1-\sum\limits^{p}\limits_{k=1}\alpha_{k}z^{-k}

es el polinomio obtenido utilizando el método de autocorrelación o el método de covarianza (Digital Processing of Spech Signals, Rabiner and Schafer, Prentice Hall, Inc., Englewood Cliffs, New Jersey 07632, y ISBN 0-13-213603-, Capítulo 8) y G es la ganancia. Dado esto, el grado de blanqueo espectral se puede controlar variando el orden del factor de predicción, es decir, limitando el orden del polinomio A(Z), limitando así la cantidad de estructura fina que se puede describir por H_{envCur}(Z), o aplicando un factor de expansión de anchura de banda al polinomio A(Z). La expansión de anchura de banda se define de acuerdo con lo siguiente; si el factor de expansión de anchura de banda es ñ, el polinomio A(Z) toma el valor de

(4)A(\rho z) = a_{0}z^{0}\rho^{0} + a_{1}z^{1}\rho^{1} + a_{2}z^{2}\rho^{2} + ... + a_{p}z^{p}\rho^{p}

Esto expande la anchura de banda de los formantes estimados por H_{envCur}(Z) según la figura 1. El filtro inverso en un instante dado es, así, según la presente invención, descrito como:

(5)H_{inv}(z,p,\rho) = \frac{1-\sum\limits^{p}\limits_{k=1}\alpha_{k}(z\rho)^{-k}}{G},

Donde P es el orden del factor de predicción y \rho es el factor de expansión de anchura de banda.

Los coeficientes \alpha_{k} pueden, según se mencionó anteriormente, obtenerse de diferentes maneras, por ejemplo con el método de autocorrelación o el método de covarianza. El factor G de ganancia también se puede fijar a uno si H_{inv} se utiliza antes de un ajuste de envolvente convencional. Es una práctica común añadir algún tipo de relajación a la estimación con objeto de garantizar la estabilidad del sistema. Cuando se utiliza el método de autocorrelación, esto se lleva a cabo fácilmente desplazando el retraso de valor cero del vector de correlación. Esto es equivalente a la adición de ruido blanco a un nivel constante a la señal utilizada para estimar A(Z). Los parámetros p y \rho se calculan con base en la información trasmitida desde el codificador.

Una expansión de anchura de banda alternativa se describe mediante:

(6)A_{b}(z) = 1 - b + b \cdot A(z)

Donde b es el factor de mezcla. Esto conduce al filtro adaptativo según:

(7)H_{inv}(z,p,b) = \frac{1 - b + b\cdot\left(1 - \sum\limits^{p}\limits_{k=1}\alpha_{k}(z)^{-k}\right)}{G}

Aquí es evidente que para b = 1 la ecuación 7 toma el valor de la ecuación 5 con \rho = 1, y para b = 0 la ecuación 7 toma el valor de un factor de ganancia constante no selectivo de la frecuencia.

La presente invención aumenta drásticamente el rendimiento de los sistemas HFR, con un coste de tasa de bits muy bajo, ya que la información en el grado de blanqueo que se va a utilizar en el decodificador puede ser transmitida muy eficientemente. Las figuras 2 a 4 describen el rendimiento de un sistema con la presente invención comparado con un sistema sin ésta, por medio de un espectro absoluto ilustrativo. En la figura 2 se muestra el espectro absoluto de la señal original en el instante t_{0} y en el instante t_{1}. Es evidente que el carácter tonal para la banda baja y la banda alta de la señal es similar en el instante t_{0}, mientras que estos difieren significativamente en el instante t_{1}. En la figura 3, se muestra la salida en el instante t_{0} y en el instante t_{1} de un sistema que utiliza una copia basada en HFR sin la presente invención. Aquí, no se aplica ningún blanqueo espectral dando el correcto carácter tonal en el instante t_{0} pero completamente incorrecto en el instante t_{1}. Esto provoca alteraciones muy molestas. Similares resultados podrían ser obtenidos para cualquier grado constante de blanqueo espectral, aunque las alteraciones podrían tener diferentes características y ocurrir en diferentes instantes. En la figura 4, se describe la salida en el instante t_{0} y en el instante t_{1} de un sistema que utiliza la presente invención. Aquí es evidente que la cantidad de blanqueo espectral varía con el tiempo, lo que resulta en una calidad de sonido muy superior a la de un sistema sin la presente invención.

El detector en el lado del codificador

En la presenten invención, se utiliza un detector en el lado del codificador para evaluar grado óptimo de blanqueo espectral (orden LPC, factor de expansión de anchura de banda y/o factor de mezcla) que se va a usar en el decodificador, con objeto de obtener una banda alta tan similar como sea posible a la original, dado el método HFR actualmente utilizado. Se pueden utilizar diferentes enfoques con objeto de obtener una estimación apropiada del grado de blanqueo espectral que se va a utilizar en el decodificador. En la descripción que sigue a continuación, se asume que el algoritmo HFR no altera sustancialmente la estructura tonal del espectro de banda baja durante la generación de altas frecuencias, es decir la banda alta generada tiene el mismo carácter tonal que la banda baja. Si tales asunciones no se pueden hacer, la detección siguiente se puede llevar a cabo utilizando un análisis por síntesis es decir llevando a cabo un HFR en la señal original en el codificador y hacer el estudio comparativo en las bandas altas de las dos señales, en vez de hacer un estudio comparativo en la banda baja y la banda alta de la señal original.

Un enfoque utiliza la autocorrelación para estimar la cantidad apropiada de blanqueo espectral. El detector estima las funciones de autocorrelación para el rango fuente (es decir el rango de frecuencias en el que se basará el HFR en el decodificador) y el rango objetivo (es decir el rango de frecuencias que van a ser reconstruidas en el decodificador). En la figura 5a, se describe una señal del caso peor, con series armónicas en la banda baja y ruido blanco en la banda alta. Las diferentes funciones de autocorrelación se muestran en la figura 5b. Aquí, es evidente que la banda baja está altamente correlacionada mientras que la banda alta no. La correlación máxima, para cualquier retraso mayor que un mínimo retraso se obtiene tanto para la banda alta como para la banda baja. El cociente de las dos se utiliza para calcular el grado óptimo de blanqueo espectral que se va a aplicar en el decodificador. Cuando se implementa la presente invención según se introdujo anteriormente, puede ser preferible utilizar FFT para el cálculo de la correlación. La autocorrelación de una secuencia X(n) se define por:

(8)r_{xx}(m) = FFT^{-1}(|X(k)|^{2}),

Donde

(9)X(k) = FFT(x(n)).

Ya que el objetivo es comparar la diferencia de la autocorrelación en la banda alta y la banda baja, el filtrado se puede hacer en el dominio de frecuencia. Esto conduce a:

1

Donde H_{Lp}(k) y H_{Hp}(k) son las transformadas de Fourier de las respuestas de impulsos de los filtros LP y HP.

Según lo anterior, las funciones de autocorrelación para la banda alta y banda baja se pueden calcular de acuerdo con:

2

El valor máximo, para un retraso mayor que un retraso mínimo, para cada véctor de autocorrelación se calcula como:

3

La cuota de las dos puede utilizarse por ejemplo para delimitar un factor de expansión de anchura de banda adecuado.

Lo anterior implica que sería beneficioso evaluar una medida general de la previsibilidad, es decir la relación tonal a ruido de una señal a una banda de frecuencias dada en un instante dado, con objeto de obtener un correcto nivel de filtrado inverso para una banda de frecuencias dadas en un instante dado. Esto se puede llevar a cabo utilizando el siguiente enfoque más refinado. Aquí se asume un banco de filtros de sub-banda, aunque debe entenderse sin embargo que la invención no está limitada a los mismos.

Una relación q tonal a ruido para cada sub-banda de un filtro de banda puede definirse utilizando predicción lineal en bloques de muestras de sub-banda. Un valor grande de q indica una gran cantidad de tonalidad, mientras que un valor pequeño de q indica que la señal es de tipo ruido en la correspondiente localización en frecuencia y en tiempo. El valor de q se puede obtener utilizando tanto el método de covarianza como el método de autocorrelación.

Para el método de covarianza, se pueden calcular eficazmente los coeficientes de predición lineal y el error de predicción para el bloque de señal de sub-banda [x(0), x(1), ... x(n-1)] utilizando la descomposición de Cholesky (Digital Processing of Speech Signals, Rabiner and Schafer Prentice may Inc. Engelwood Cliffs, New Jersey 07632, ISBN 0-13-213603-1, Capítulo 8). La relación q tonal a ruido está entonces definida por

(13)q = \frac{\Psi - E}{E},

Donde \Psi = |x(0)|^{2}+|x(1)|^{2}+ ... +|x(N-1)|^{2} es la energía del bloque de señal y E es la energía del bloque de predicción de error.

Para el método de autocorrelación, un enfoque más natural consiste en utilizar el algoritmo de Levinson-Durbin, [Digital Signal Processing, Principles, Algorithms and Applications, Third Edition, John G. Proakis, Dimitris G Manolakis Prentice Hall, International Editions, ISBN-0-13-394338-9, capítulo 11] donde q se define entonces de acuerdo con

(14)q = \left(\prod\limits^{p}_{i=1}(1-|K_{i}|^{2})\right)^{-1} - 1,

Donde K_{i} son los coeficientes de reflexión de la correspondiente estructura de filtro de red obtenida a partir del polinomio de predicción y p es el orden de predicción.

La relación entre los valores de banda alta y banda baja de q se utiliza entonces para ajustar el grado de blanqueo espectral de manera que la relación tonal a ruido de la banda alta reconstruida se aproxima a la de la banda alta original. Aquí es ventajoso controlar el grado de blanqueo utilizando el factor b de mezcla (ec.6).

Asumiendo que la relación tonal a ruido q = q_{H} se mide en la banda alta y que q = q_{L} \geq q_{H} se mide en la banda baja, una elección adecuada en el factor de blanqueo b viene dada por la fórmula:

(15)b = 1-\sqrt{\frac{q_{H}}{q_{L}}}.

Para verlo, un primer paso es rescribir la ec.6 en la forma

(16)A_{b}(z) = A(z) + (1-b)(1-A(z))

Esto muestra que si la señal utilizada para estimar A(Z) se filtra con el filtro A_{b}(z), la señal predecida se suprime mediante el factor de ganancia 1-b y el error de predicción se mantiene inalterado. Como la relación tonal a ruido es la relación de la señal cuadrática media predecida a error de predicción cuadrático medio, un valor de q anterior al filtrado se modifica a (1-b)^{2}q mediante la operación de filtrado. Aplicar esto a la señal de banda baja produce una señal con una relación tonal a ruido de (1-b)^{2}q_{L} y bajo la asunción de que el método HFR aplicado no altera la tonalidad, se alcanza exactamente el valor objetivo q_{H} en la banda alta si se escoge b de acuerdo con la ec.15.

Los valores de q basados en el orden de predicción p = 2 en cada sub-banda de un banco de filtros de 64 canales se describen en la figura 5c, para la señal de la figura 5a. Se alcanzan valores significativamente mayores para la parte armónica de la señal que para la parte ruidosa. La variabilidad de las estimaciones en la parte armónica se debe a la resolución de frecuencia elegida y al orden de predicción.

Blanqueo basado en LPC adaptativo en el dominio de tiempo

El filtrado adaptativo en el decodificador se puede hacer antes de, o después de la reconstrucción en altas frecuencias. Si el filtrado se lleva a cabo antes del HFR, se necesita considerar las características del método HFR utilizado. Cuando se lleva a cabo un filtrado adaptativo selectivo en frecuencias, el sistema debe deducir qué región de banda baja originará una cierta región de banda alta, con objeto de aplicar la correcta cantidad de blanqueo espectral a esta región de banda baja, antes de la unidad HFR. En el ejemplo siguiente, una implementación en dominio de tiempo de la presente invención, se introduce un blanqueo espectral adaptativo selectivo en frecuencias. Debería ser obvio para cualquier persona experta en la técnica que las implementaciones en dominio de tiempo de la presente invención no están limitadas a la implementación descrita más adelante.

Cuando se lleva a cabo el filtrado adaptativo en el dominio de tiempos, se prefiere la predicción lineal que utiliza el método de auto correlación. El método de autocorrelación requiere tomar ventanas del segmento de entrada utilizado para estimar los coeficientes \alpha_{k}, lo que no es el caso para el método de covarianza. El filtro utilizado para el blanqueo espectral de acuerdo con la presente invención es

(19)H_{inv}(z,p,\rho) = 1-\sum\limits^{p}\limits_{k=1}\alpha_{k}(z\rho)^{-k},

donde el factor G de ganancia (en la Ec.5) se fija 1. Cuando se lleva a cabo el blanqueo espectral adaptativo antes de la unidad HFR, se consigue una implementación efectiva, ya que el filtro adaptativo puede funcionar con una baja tasa de muestreo. Se toman ventanas de la señal de banda baja sobre una base adecuada de tiempos, con el orden de predicción y los factores de expansión de anchura de banda dados por el codificador, de acuerdo con la figura 6. En esta implementación actual de la presente invención, la señal es filtrada en pasa baja 601 y diezmada 602. La referencia 603 ilustra el filtro adaptativo. Se utiliza una ventana 606 para seleccionar el segmento de tiempo adecuado para la estimación del polinomio A(z), y se utiliza un 50% de solapamiento. La rutina LPC 607 extrae A(z) dados los valores actualmente preferidos de orden LPC y factor de expansión de anchura de banda, con una relajación adecuada. Se utiliza un filtro FIR 608 para filtrar adaptativamente el segmento de señal. Los segmentos de señal blanqueados espectralmente se sobremuestrean 604, 605 y se toman ventanas formando conjuntamente la señal de entrada a la unidad HFR.

Blanqueo basado en LPC adaptativo en un banco de filtros de sub-banda

El filtrado adaptativo se puede llevar a cabo de forma efectiva y robusta utilizando un banco de filtros. La predicción lineal y el filtrado se realizan independientemente para cada una de las señales de sub-bandas producidas por el banco de filtros. Es ventajoso utilizar un banco de filtros cuando se suprimen las componentes alias de las señales de sub-banda. Esto se puede conseguir, por ejemplo, sobremuestreando el banco de filtro. Aparecen alteraciones debidas a la formación de alias por modificaciones independientes de las señales de sub- banda, lo que por ejemplo, da como resultado el filtrado adaptativo, pueden verse entonces grandemente reducidas. El blanqueo espectral de las señales de sub-banda se obtiene a través de predicción lineal análoga al método en dominio de tiempos descrito anteriormente. Si las señales de sub-bandas tienen valores complejos, se utilizan coeficientes de filtro complejos para la predicción lineal así como para el filtrado. El orden de la predicción lineal se puede mantener muy bajo, ya que el número esperado de componentes tonales en cada banda de frecuencias es muy pequeño para un sistema de una cantidad razonable de canales de banco de filtro. Con objeto de corresponder a la misma base de tiempo que el dominio de tiempos LPC, el número de muestras de sub-banda en cada bloque es menor en un factor igual a la reducción de muestreo del banco de filtros. Dado el bajo orden de filtro y los pequeños tamaños de bloque, los coeficientes de predicción de filtro se obtienen preferiblemente utilizando el método de covarianza. El cálculo del coeficiente de filtro y el blanqueo espectral se puede llevar a cabo sobre una base bloque a bloque utilizando un intervalo de tiempo L de muestra de sub-banda, que es menor que la longitud N del bloque. Los bloques blanqueados espectralmente deben sumarse entre sí utilizando una síntesis adecuada por toma de ventanas.

Alimentar un banco de filtros máximamente diezmado con un señal de entrada que consiste en ruido blanco gaussiano producirá señales de sub-banda con densidad espectral blanca. Alimentar un banco de filtro sobremuestreado con ruido blanco proporciona señales de sub-banda con densidad espectral coloreada. Esto se debe a los efectos de la respuesta en frecuencias de los filtros de análisis. Los aparatos de predicción LPC en los canales del banco de filtros trazarán las características de filtro en el caso de señales de entrada similares a ruido. Esta es una característica no deseada, y se beneficia de la compensación. Una posible solución es prefiltrar las señales de entrada con los aparatos de predicción lineal. El prefiltrado debería de ser la inversa o una aproximación a la inversa, de los filtros de análisis, con objeto de compensar la respuesta en frecuencia de los filtros de análisis. Los filtros de blanqueo se alimentan con las señales originales de sub-banda, según se describe anteriormente. La figura 7 ilustra el proceso de blanqueo de una señal de sub- banda. La señal de sub-banda correspondiente al canal l alimenta el bloque 701 de prefiltrado y subsiguientemente una cadena de retardos en la que profundidad de la misma depende del orden 702 de filtro. Las señales retrasadas y sus conjugados 703 alimentan el bloque 704 de predicción lineal, donde se calculan los coeficientes. Los coeficientes de cada cálculo L-ésimo se guardan en el diezmador 705. Las señales de sub-banda se filtran finalmente a través del bloque 706 de filtros, donde se utilizan los coeficientes predecidos y se actualizan para cada muestra L-ésima.

Implementaciones prácticas

La presente invención se puede implementar tanto en chips de equipo físico y DSP, para varios tipos de sistemas, para almacenamiento o transmisión de señales, analógicas o digitales utilizando códecs arbitrarios. Las figuras 8 y 9 muestran una posible implementación de la presente invención. En la figura 8 se muestra el lado del codificador. La señal analógica de entrada alimenta al conversor A/D 801 y a un codificador arbitrario de audio, 802, así como a la unidad 803 de estimación del nivel de filtrado inverso y a una unidad 804 de extracción de envolvente. La información codificada se multiplexa en una cadena de bits (unidades lógicas) en serie 805 y se transmite o almacena. En la figura 9 se muestra una implementación típica de decodificador. La cadena de bits en serie se desmultiplexa, 901 y se descodifican los datos de la envolvente, 902, es decir, la envolvente espectral de la banda alta. La fuente desmultiplexada de señal codificada se decodifica utilizando un decodificador arbitrario de audio, 903. La señal de codificada alimenta una unidad arbitraria HFR, 904, donde se regenera una banda alta. La señal de banda alta alimenta la unidad 905 de blanqueo espectral, que lleva a cabo el blanqueo espectral adaptativo. Subsiguientemente, la señal alimenta el ajustador 906 de envolvente. La salida del ajustador de envolvente se combina con la señal decodificada alimentada a través de un retardo, 907. Finalmente la salida digital se convierte de nuevo a una forma de onda analógica 908.

Claims

1. Aparato para estimar un nivel de blanqueo espectral que debe ser aplicado a una señal antes de una etapa de regeneración de altas frecuencias o después de la etapa de regeneración de altas frecuencias que se va a llevar a cabo cuando se genera una señal regenerada en altas frecuencias que tiene una banda alta que se basa en una señal de banda baja, en el cual el blanqueo espectral se obtiene filtrando utilizando un filtro de blanqueo espectral, siendo el filtro de blanqueo espectral un filtro adaptativo que es adaptable por medio de un parámetro de filtro, comprendiendo el aparato:

- Medios (803) para estimar un carácter tonal de una señal de audio original que va a ser codificada, en un instante dado, en el cual la señal original de audio se va a codificar mediante un codificador de audio para obtener una señal de audio codificada que representa únicamente una banda baja de la señal de audio original, incluyendo el carácter tonal estimado un carácter tonal estimado de una banda ancha de la señal original de audio, que no está incluida en la señal codificada de audio;

- Medios (803) para determinar un parámetro de filtro variable del filtro de blanqueo espectral basado en el carácter tonal estimado; y

- Medios (805) para asociar el parámetro de filtro variable a la señal de audio codificada para obtener una cadena de bits que tiene codificada la señal de audio, teniendo el parámetro de filtro variable, siendo el parámetro de filtro variable dependiente de la señal codificada de audio.

2. Aparato según la reivindicación 1 en el que la etapa de regeneración de altas frecuencias es tal que no altera sustancialmente una estructura tonal de la banda baja, en la cual los medios para estimar se disponen de manera tal que además del carácter tonal de la banda alta, también se determina un carácter tonal de la banda baja, y en el cual los medios para determinar están dispuestos para comparar el carácter tonal de la banda alta y el carácter tonal de la banda baja para determinar el parámetro de filtro.

3. Aparato según la reivindicación 1 que comprende adicionalmente:

- Medios para llevar a cabo la etapa de regeneración de altas frecuencias en la banda baja de la señal original de audio para obtener la señal regenerada de altas frecuencias;

- Medios para estimar un carácter tonal de la señal de alta frecuencia regenerada, y

En el que los medios para determinar están dispuestos para comparar la señal de alta frecuencia regenerada y la banda alta de la señal original de audio para determinar el parámetro de filtro.

4. Aparato según la reivindicación 1, en el cual la estimación del carácter tonal de la señal original se realiza para diferentes regiones de frecuencia.

5. Aparato según la reivindicación 1, en el cual la estimación de la cantidad requerida de blanqueo espectral se realiza para diferentes regiones de frecuencia.

6. Aparato según la reivindicación 1, en el cual el blanqueo espectral se lleva a cabo en el dominio de tiempos.

7. Aparato según la reivindicación 1 en el cual el blanqueo espectral se lleva a cabo en un banco de filtros de sub-banda.

8. Aparato según la reivindicación 1, en el cual la estimación de la cantidad de blanqueo espectral requerida se realiza por comparación de las relaciones tono a ruido de señal de diferentes señales de sub-banda obtenidas por filtrado de sub-banda de la señal original, en el cual las relaciones se obtienen utilizando predicción lineal de las señales de sub-banda.

9. Aparato según la reivindicación 1, en el cual la estimación de la cantidad requerida de blanqueo espectral se realiza por comparación de las relaciones tonal a ruido de señal de diferentes señales de sub-banda obtenidas por filtrado de sub-banda de la señal original y una señal reconstituida de alta frecuencia en la cual las relaciones se obtienen utilizando predicción lineal de las señales de sub-banda, y la señal reconstruida de alta frecuencia se produce de la misma manera que una señal reconstruida de alta frecuencia en un decodificador.

10. Aparato según la reivindicación 1, en el que el filtro de blanqueo espectral es un filtro que tiene coeficientes de filtro obtenidos mediante predicción lineal para obtener un polinomio LPC y en el cual el parámetro de filtro indica un orden de predicción del polinomio LPC, un factor de expansión de anchura de banda del polinomio LPC, o un factor de mezcla que indica una cantidad de mezcla de una señal filtrada y una parte complementaria sin procesar.

11. Aparato para producir una señal de salida basada en una versión decodificada de una señal codificada de audio que representa una banda baja de una señal original de audio, teniendo asociada a esta señal codificada de audio un parámetro de filtro variable para un filtro de blanqueo espectral, dependiendo el parámetro de filtro variable de una característica tonal de una banda alta de la señal original de audio en un instante dado, comprendiendo el aparato:

- Medios (901) para obtener los parámetros de filtro variable asociados a la señal de audio codificada;

- Una unidad (904) de regeneración de altas frecuencias para llevar a cabo una etapa de regeneración de altas frecuencias en una versión decodificada de la señal codificada de audio para producir una señal regenerada en altas frecuencias; y

- Un filtro (905) de blanqueo espectral adaptativo para filtrar la versión decodificada de una señal regenerada en altas frecuencias;

En el cual el filtro de blanqueo espectral adaptativo tiene un parámetro variable, estando fijado el parámetro variable de acuerdo con el parámetro de filtro variable asociado con la señal codificada de audio.

12. Aparato según la reivindicación 11, en el cual se incluye un prefiltrado en una estimación de codificación predictiva lineal con objeto de compensar las características de los filtros de análisis del banco de filtros.

13. Aparato de acuerdo con la reivindicación 11, en el cual el filtro de blanqueo espectral adaptativo comprende:

- Medios (606) para tomar ventanas de la señal que se va a filtrar;

- Medios LPC (607) para obtener un polinomio LPC normal de una señal de ventanas, siendo responsables los medios LPC de un orden LPC y un factor de expansión de anchura de banda como parámetros de filtro variable para un instante dado, y

- Un filtro FIR para filtrar la señal que se va a filtrar, estando el filtro FIR fijado por el polinomio LPC obtenido por los medios LPC.

14. Método para estimar un nivel de blanqueo espectral que se va aplicar a una señal antes de una etapa de regeneración de altas frecuencias o después de la etapa de regeneración de altas frecuencias que se va a llevar a cabo cuando se genera una señal regenerada en altas frecuencias que tiene una banda alta que se basa en una señal de banda baja, en la cual el blanqueo espectral se obtiene filtrando utilizando un filtro de blanqueo espectral, siendo el filtro de blanqueo espectral un filtro adaptativo que es adaptable por medio de un parámetro de filtro, comprendiendo el método las siguientes etapas:

- Estimar un carácter tonal de una señal original de audio que se va a codificar, en un instante dado, en el cual la señal original de audio va a ser codificada por un codificador de audio para obtener una señal codificada de audio que representa únicamente una banda baja de la señal original de audio, incluyendo un carácter tonal estimado en una banda alta de la señal original de audio, que no está incluido en la señal codificada de audio;

- Determinar un parámetro de filtro variable del filtro de blanqueo espectral basado en el carácter tonal estimado; y

- Asociar el parámetro de filtro variable de la señal codificada de audio para obtener una cadena de bits que tiene la señal codificada de audio que tiene el parámetro de filtro variable, siendo el parámetro de filtro variable dependiente de la señal codificada de audio.

15. Método para producir una señal de salida basada en una versión decodificada de una señal codificada de audio que representa una banda baja de una señal original de audio, teniendo la señal codificada de audio asociada a esta un parámetro de filtro variable para un filtro de blanqueo espectral, dependiendo el parámetro de filtro variable de un carácter tonal de una banda alta de la señal original de audio en un instante dado, comprendiendo el método las siguientes etapas:

- Obtener el parámetro de filtro variable asociado a la señal codificada de audio;

- Llevar a cabo una etapa de regeneración de alta frecuencia en una versión decodificada de la señal codificada de audio para producir una señal regenerada en altas frecuencias; y

- Un filtro (905) de blanqueo espectral adaptativo para filtrar la versión decodificada o la señal regenerada en altas frecuencias utilizando un filtro (905) de blanqueo espectral adaptativo;

En el cual el filtro de blanqueo espectral adaptativo tiene un parámetro variable, siendo el parámetro variable fijado de acuerdo con el parámetro de filtro variable asociado a la señal codificada de audio.

16. Codificador para codificar una señal original de audio para obtener una versión codificada de la misma, que comprende:

- Un aparato para estimar un nivel de blanqueo espectral de acuerdo con la reivindicación 1;

- Un codificador (802) de audio para codificar la señal original de audio para obtener la versión codificada de la misma;

- Medios (804) para estimar una envolvente espectral de la señal original de audio para obtener una envolvente espectral estimada; y

- Un múltiplexor (805) para multiplexar la versión codificada de la señal original de audio, el parámetro de filtro del filtro de blanqueo espectral y la envolvente espectral estimada para obtener una cadena de bits.

17. Decodificador para decodificar una cadena de bits que incluye una versión codificada de una señal original de audio, una envolvente espectral estimada y un parámetro de filtro que se va a aplicar a un filtro de blanqueo espectral, comprendiendo el decodificador:

- Un desmultiplexor (901) de cadena de bits para extraer la versión codificada de la señal original de audio, la envolvente espectral estimada y el parámetro de filtro;

- Un decodificador (903) de audio para decodificar la versión codificada de la señal original de audio para obtener una señal de banda baja;

- Un decodificador de envolvente para decodificar la envolvente espectral estimada;

- Un aparato para producir una señal de salida de acuerdo con la reivindicación 11, y

- Un sumador para sumar una señal regenerada en altas frecuencias blanqueada espectralmente de forma adaptativa y una versión retardada de la señal decodificada de audio para obtener una señal de salida de banda ancha.

18. Método para modificar una señal original de audio para obtener una versión codificada de la misma, que comprende las siguientes etapas:

- Estimar un nivel de blanqueo espectral de acuerdo con la reivindicación 14;

- Codificar (802) la señal original de audio para obtener la versión codificada de la misma;

- Estimar (804) una envolvente espectral de la señal original de audio para obtener una envolvente espectral estimada; y

- Multiplexar (805) la versión codificada de la señal original de audio, el parámetro de filtro del filtro de blanqueo espectral y la envolvente espectral estimada para obtener una cadena de bits.

19. El método para decodificar una cadena de bits que incluye una versión codificada de una señal original de audio, una envolvente espectral estimada y un parámetro de filtro que se va a aplicar a un filtro de blanqueo espectral, comprendiendo el método:

- Extraer (901) la versión codificada de la señal original de audio, la envolvente espectral estimada y el parámetro de filtro;

- Decodificar (903) la versión codificada de la señal original de audio para obtener una señal de banda baja;

- Decodificar la envolvente espectral estimada; y

- Producir una señal de salida de acuerdo con la reivindicación 15; y

- Sumar una señal regenerada en altas frecuencias blanqueda espectralmente de manera adaptativa y una versión retardada de la señal decodificada de audio para obtener una señal de salida de banda ancha.