ES2215935T3 - Realizacion perceptual mejorada de metodos de codificacion de reconstruccion de altas frecuencias por filtrado adaptativo. - Google Patents
Realizacion perceptual mejorada de metodos de codificacion de reconstruccion de altas frecuencias por filtrado adaptativo.Info
- Publication number
- ES2215935T3 ES2215935T3 ES01983041T ES01983041T ES2215935T3 ES 2215935 T3 ES2215935 T3 ES 2215935T3 ES 01983041 T ES01983041 T ES 01983041T ES 01983041 T ES01983041 T ES 01983041T ES 2215935 T3 ES2215935 T3 ES 2215935T3
- Authority
- ES
- Spain
- Prior art keywords
- signal
- filter
- spectral
- parameter
- encoded
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 title claims abstract description 34
- 230000003044 adaptive effect Effects 0.000 title claims abstract description 33
- 238000001914 filtration Methods 0.000 title claims abstract description 23
- 230000005236 sound signal Effects 0.000 claims abstract description 39
- 230000003595 spectral effect Effects 0.000 claims description 82
- 238000004061 bleaching Methods 0.000 claims description 55
- 239000007844 bleaching agent Substances 0.000 claims description 12
- 238000002156 mixing Methods 0.000 claims description 6
- 238000011045 prefiltration Methods 0.000 claims description 4
- 230000003111 delayed effect Effects 0.000 claims description 3
- 239000000284 extract Substances 0.000 claims description 3
- 230000008929 regeneration Effects 0.000 claims 9
- 238000011069 regeneration method Methods 0.000 claims 9
- 230000001419 dependent effect Effects 0.000 claims 2
- 230000000295 complement effect Effects 0.000 claims 1
- 238000001228 spectrum Methods 0.000 description 7
- 238000013459 approach Methods 0.000 description 5
- 230000004075 alteration Effects 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 230000000875 corresponding effect Effects 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 238000005311 autocorrelation function Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000000052 comparative effect Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 101150012845 RHO2 gene Proteins 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000004900 laundering Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Amplifiers (AREA)
- Networks Using Active Elements (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
- Surface Acoustic Wave Elements And Circuit Networks Thereof (AREA)
- Filters And Equalizers (AREA)
- Control Of Motors That Do Not Use Commutators (AREA)
- Crystals, And After-Treatments Of Crystals (AREA)
Abstract
Aparato para estimar un nivel de blanqueo espectral que debe ser aplicado a una señal antes de una etapa de regeneración de altas frecuencias o después de la etapa de regeneración de altas frecuencias que se va a llevar a cabo cuando se genera una señal regenerada en altas frecuencias que tiene una banda alta que se basa en una señal de banda baja, en el cual el blanqueo espectral se obtiene filtrando utilizando un filtro de blanqueo espectral, siendo el filtro de blanqueo espectral un filtro adaptativo que es adaptable por medio de un parámetro de filtro, comprendiendo el aparato: - Medios (803) para estimar un carácter tonal de una señal de audio original que va a ser codificada, en un instante dado, en el cual la señal original de audio se va a codificar mediante un codificador de audio para obtener una señal de audio codificada que representa únicamente una banda baja de la señal de audio original, incluyendo el carácter tonal estimado un carácter tonal estimado de una banda ancha de laseñal original de audio, que no está incluida en la señal codificada de audio; - Medios (803) para determinar un parámetro de filtro variable del filtro de blanqueo espectral basado en el carácter tonal estimado; y - Medios (805) para asociar el parámetro de filtro variable a la señal de audio codificada para obtener una cadena de bits que tiene codificada la señal de audio, teniendo el parámetro de filtro variable, siendo el parámetro de filtro variable dependiente de la señal codificada de audio.
Description
Realización perceptual mejorada de métodos de
codificación de reconstrucción de altas frecuencias por filtrado
adaptativo.
La presente invención se refiere a sistemas de
codificación de fuentes de audio utilizando reconstrucción de altas
frecuencias (HFR) tal como replicación de banda espectral, SBR
[documento WO 98/57436] o métodos relacionados. Mejora el
rendimiento de los métodos de alta calidad (SBR) así como de los
métodos de baja calidad (patente de Estados Unidos nº 5.127.054).
Es aplicable tanto a sistemas de codificación de discurso como de
codificación de audio natural.
En la reconstrucción de altas frecuencias de
señales de audio, donde se extrapola una banda alta desde una banda
baja, es importante tener medios para controlar los componentes
tonales de la banda alta reconstruida hasta un grado mayor del que
se puede conseguir con un ajuste basto de la envolvente, según se
utiliza comúnmente en los sistemas HFR. Esto es necesario ya que las
componentes tonales de la mayoría de las señales de audio tales
como voces y la mayoría de los instrumentos acústicos, son
usualmente más fuertes en las regiones de baja frecuencia (es decir
por debajo de 4 a 5 kHz) en comparación con las regiones de alta
frecuencia. Un ejemplo extremo es una serie armónica muy
pronunciada en la banda baja y más o menos ruidos puros en la banda
alta. Una forma de aproximarse a esto es añadiendo ruido de forma
adaptativa a la banda alta reconstruida (Adaptive Noise Addition
[documento PCT/SE00/00159]). No obstante, esto no es a veces
suficiente para suprimir el carácter tonal de la banda baja, dando a
la banda alta reconstruida un carácter de sonido repetitivo "de
zumbido". Asimismo, puede ser difícil conseguir las
características temporales correctas del ruido. Otro problema tiene
lugar cuando se mezclan dos series armónicas, una con gran densidad
armónica (tono bajo) y la otra con baja densidad armónica (tono
alto). Si la serie armónica de tono alto domina sobre la otra en la
banda baja pero no en la banda alta, el HFR provoca que los
armónicos de la señal de tono alto dominen la banda alta, haciendo
que la banda alta reconstruida suene "metálica" en comparación
con la original. Ninguna de las situaciones anteriormente descritas
se puede controlar utilizando el ajuste de envolvente utilizado
comúnmente en los sistemas HFR. En algunas implementaciones se
introduce un grado constante de blanqueo espectral durante el ajuste
de envolvente espectral de la señal HFR. Esto da resultados
satisfactorios cuando se desea ese grado particular de blanqueo
espectral, pero introduce graves alteraciones para fragmentos de
señal que no se benefician de ese grado particular de blanqueo
espectral.
La presente invención se refiere al problema del
sonido "metálico" y de "zumbido" que se introduce
comúnmente en los métodos HFR. Este utiliza un sofisticado algoritmo
de detección en el lado del codificador para estimar la cantidad
preferida de blanqueo espectral que debe aplicarse en el
decodificador. El blanqueo espectral varia con el tiempo así como
con la frecuencia, garantizando los mejores medios para controlar
los contenidos armónicos de la banda alta replicada. La presente
invención se puede llevar a cabo en una implementación del dominio
del tiempo así como en una implementación de bancos del filtro de
sub-banda.
La presente invención comprende las siguientes
características:
- En el codificador, estimar el carácter tonal de
una señal original para diferentes regiones de frecuencia en un
instante dado.
- En el codificador, estimar la cantidad de
blanqueo espectral requerida, para regiones de diferentes
frecuencias en un instante dado, con objeto de obtener un carácter
tonal similar después del HFR en el decodificador, dado el método
HFR utilizado en el decodificador.
- Transmitir la información en el grado preferido
de blanqueo espectral desde el codificador al decodificador.
- En el decodificador, llevar a cabo el blanqueo
espectral bien en el dominio de tiempos o en un banco de filtros de
sub-banda, de acuerdo con la información
transmitida desde el codificador.
- El filtro adaptativo utilizado para el blanqueo
espectral en el decodificador se obtiene usando predicción
lineal.
- El grado de blanqueo espectral requerido se
estima en el codificador por medios de predicción.
- El grado de blanqueo espectral se controla
variando el orden de predicción o variando el factor de expansión
de anchura de banda del polinomio LPC, o mezclando la señal
filtrada, hasta un grado dado, con la homóloga sin procesar.
- La capacidad de utilizar un banco de filtros de
sub-banda consiguiendo factores de predicción de
bajo orden, ofrece una implementación muy efectiva, especialmente
en un sistema en el que el banco de filtros ya se utiliza para el
ajuste de la envolvente.
- El grado de blanqueo espectral, selectivo de
frecuencias se obtiene fácilmente dada la nueva implementación de
banco de filtros de la presente invención.
La presente invención será ahora descrita por
medio de ejemplos ilustrativos pero no limitativos del alcance o
espíritu de la invención, con referencia a los dibujos adjuntos en
los que:
La figura 1 ilustra la expansión de anchura de
banda de un espectro LPC;
La figura 2 ilustra el espectro absoluto de una
señal original en el instante t_{0}, y en el instante
t_{1};
La figura 3 ilustra el espectro absoluto de la
salida en el instante t_{0} y en el instante t_{1} de una copia
de un sistema HFR de la técnica anterior sin filtrado
adaptativo;
La figura 4 ilustra el espectro absoluto de la
salida, en el instante t_{0} y en el instante t_{1}, de una
copia de un sistema HFR sin filtrado adaptativo, de acuerdo con la
presente invención.
La figura 5a ilustra la señal del caso peor de
acuerdo con la presente invención;
La figura 5b ilustra la autocorrelación para la
banda alta y la banda baja de la señal del caso peor;
La figura 5c ilustra la relación q tonal a ruido
para diferentes frecuencias, de acuerdo con la presente
invención;
La figura 6 ilustra una implementación en dominio
de tiempo del filtrado adaptativo en el decodificador, de acuerdo
con la presente invención;
La figura 7 ilustra una implementación de banco
de filtros de sub-banda del filtrado adaptativo en
el decodificador, de acuerdo con la presente invención;
La figura 8 ilustra una implementación de
codificador de la presente invención;
La figura 9 ilustra una implementación de
decodificador de la presente invención.
Las realizaciones descritas a continuación son
meramente ilustrativas de los principios de la presente invención
para la mejora de sistemas de reconstrucción de altas frecuencias.
Se entiende que las modificaciones y variaciones en las
disposiciones y detalles descritos en este documento serán
evidentes a aquellos expertos en la técnica. Se pretende, por ello,
que se limite únicamente por el objeto las reivindicaciones de la
inminente patente y no por los detalles específicos presentados por
medio de la descripción y explicación de las realizaciones de este
documen-
to.
to.
Cuando se ajusta una envolvente espectral de una
señal a una envolvente espectral dada, siempre se aplica una cierta
cantidad de blanqueo espectral. Esto, ya que si la envolvente
espectral basta transmitida se describe mediante
H_{envRef}(Z)y la envolvente espectral del segmento
de señal actual se describe mediante H_{envCur}(Z), la
función de filtro aplicada es:
(1)W(z) =
\frac{H_{envRef}(z)}{H_{envCur}(z)}
En la presente invención la resolución de
frecuencia para H_{envRef}(Z) no es necesariamente la
misma que para H_{envCur}(Z). La invención utiliza
resolución de frecuencia adaptativa de H_{envCur}(Z) para
el ajuste de la envolvente de señales HFR. El segmento de señal se
filtra con la inversa de H_{envCur}(Z) con objeto de
blanquear espectralmente la señal de acuerdo con la ecuación 1. Si
H_{envCur}(Z) se obtiene utilizando predicción lineal, se
puede describir de acuerdo con
(2)H_{envCur}(z) =
\frac{G}{A(z)'}
donde
(3)A(z) =
1-\sum\limits^{p}\limits_{k=1}\alpha_{k}z^{-k}
es el polinomio obtenido utilizando el método de
autocorrelación o el método de covarianza (Digital Processing of
Spech Signals, Rabiner and Schafer, Prentice Hall, Inc., Englewood
Cliffs, New Jersey 07632, y ISBN
0-13-213603-, Capítulo 8) y G es la
ganancia. Dado esto, el grado de blanqueo espectral se puede
controlar variando el orden del factor de predicción, es decir,
limitando el orden del polinomio A(Z), limitando así la
cantidad de estructura fina que se puede describir por
H_{envCur}(Z), o aplicando un factor de expansión de
anchura de banda al polinomio A(Z). La expansión de anchura
de banda se define de acuerdo con lo siguiente; si el factor de
expansión de anchura de banda es ñ, el polinomio A(Z) toma
el valor
de
(4)A(\rho z) =
a_{0}z^{0}\rho^{0} + a_{1}z^{1}\rho^{1} + a_{2}z^{2}\rho^{2} + ...
+
a_{p}z^{p}\rho^{p}
Esto expande la anchura de banda de los formantes
estimados por H_{envCur}(Z) según la figura 1. El filtro
inverso en un instante dado es, así, según la presente invención,
descrito como:
(5)H_{inv}(z,p,\rho) =
\frac{1-\sum\limits^{p}\limits_{k=1}\alpha_{k}(z\rho)^{-k}}{G},
Donde P es el orden del factor de predicción y
\rho es el factor de expansión de anchura de banda.
Los coeficientes \alpha_{k} pueden, según se
mencionó anteriormente, obtenerse de diferentes maneras, por
ejemplo con el método de autocorrelación o el método de covarianza.
El factor G de ganancia también se puede fijar a uno si H_{inv}
se utiliza antes de un ajuste de envolvente convencional. Es una
práctica común añadir algún tipo de relajación a la estimación con
objeto de garantizar la estabilidad del sistema. Cuando se utiliza
el método de autocorrelación, esto se lleva a cabo fácilmente
desplazando el retraso de valor cero del vector de correlación.
Esto es equivalente a la adición de ruido blanco a un nivel
constante a la señal utilizada para estimar A(Z). Los
parámetros p y \rho se calculan con base en la información
trasmitida desde el codificador.
Una expansión de anchura de banda alternativa se
describe mediante:
(6)A_{b}(z) = 1 - b + b
\cdot
A(z)
Donde b es el factor de mezcla. Esto conduce al
filtro adaptativo según:
(7)H_{inv}(z,p,b) = \frac{1
- b + b\cdot\left(1 -
\sum\limits^{p}\limits_{k=1}\alpha_{k}(z)^{-k}\right)}{G}
Aquí es evidente que para b = 1 la ecuación 7
toma el valor de la ecuación 5 con \rho = 1, y para b = 0 la
ecuación 7 toma el valor de un factor de ganancia constante no
selectivo de la frecuencia.
La presente invención aumenta drásticamente el
rendimiento de los sistemas HFR, con un coste de tasa de bits muy
bajo, ya que la información en el grado de blanqueo que se va a
utilizar en el decodificador puede ser transmitida muy
eficientemente. Las figuras 2 a 4 describen el rendimiento de un
sistema con la presente invención comparado con un sistema sin
ésta, por medio de un espectro absoluto ilustrativo. En la figura 2
se muestra el espectro absoluto de la señal original en el instante
t_{0} y en el instante t_{1}. Es evidente que el carácter tonal
para la banda baja y la banda alta de la señal es similar en el
instante t_{0}, mientras que estos difieren significativamente en
el instante t_{1}. En la figura 3, se muestra la salida en el
instante t_{0} y en el instante t_{1} de un sistema que utiliza
una copia basada en HFR sin la presente invención. Aquí, no se
aplica ningún blanqueo espectral dando el correcto carácter tonal
en el instante t_{0} pero completamente incorrecto en el instante
t_{1}. Esto provoca alteraciones muy molestas. Similares
resultados podrían ser obtenidos para cualquier grado constante de
blanqueo espectral, aunque las alteraciones podrían tener
diferentes características y ocurrir en diferentes instantes. En la
figura 4, se describe la salida en el instante t_{0} y en el
instante t_{1} de un sistema que utiliza la presente invención.
Aquí es evidente que la cantidad de blanqueo espectral varía con el
tiempo, lo que resulta en una calidad de sonido muy superior a la
de un sistema sin la presente invención.
En la presenten invención, se utiliza un detector
en el lado del codificador para evaluar grado óptimo de blanqueo
espectral (orden LPC, factor de expansión de anchura de banda y/o
factor de mezcla) que se va a usar en el decodificador, con objeto
de obtener una banda alta tan similar como sea posible a la
original, dado el método HFR actualmente utilizado. Se pueden
utilizar diferentes enfoques con objeto de obtener una estimación
apropiada del grado de blanqueo espectral que se va a utilizar en
el decodificador. En la descripción que sigue a continuación, se
asume que el algoritmo HFR no altera sustancialmente la estructura
tonal del espectro de banda baja durante la generación de altas
frecuencias, es decir la banda alta generada tiene el mismo
carácter tonal que la banda baja. Si tales asunciones no se pueden
hacer, la detección siguiente se puede llevar a cabo utilizando un
análisis por síntesis es decir llevando a cabo un HFR en la señal
original en el codificador y hacer el estudio comparativo en las
bandas altas de las dos señales, en vez de hacer un estudio
comparativo en la banda baja y la banda alta de la señal
original.
Un enfoque utiliza la autocorrelación para
estimar la cantidad apropiada de blanqueo espectral. El detector
estima las funciones de autocorrelación para el rango fuente (es
decir el rango de frecuencias en el que se basará el HFR en el
decodificador) y el rango objetivo (es decir el rango de frecuencias
que van a ser reconstruidas en el decodificador). En la figura 5a,
se describe una señal del caso peor, con series armónicas en la
banda baja y ruido blanco en la banda alta. Las diferentes
funciones de autocorrelación se muestran en la figura 5b. Aquí, es
evidente que la banda baja está altamente correlacionada mientras
que la banda alta no. La correlación máxima, para cualquier retraso
mayor que un mínimo retraso se obtiene tanto para la banda alta
como para la banda baja. El cociente de las dos se utiliza para
calcular el grado óptimo de blanqueo espectral que se va a aplicar
en el decodificador. Cuando se implementa la presente invención
según se introdujo anteriormente, puede ser preferible utilizar FFT
para el cálculo de la correlación. La autocorrelación de una
secuencia X(n) se define por:
(8)r_{xx}(m) =
FFT^{-1}(|X(k)|^{2}),
Donde
(9)X(k) =
FFT(x(n)).
Ya que el objetivo es comparar la diferencia de
la autocorrelación en la banda alta y la banda baja, el filtrado se
puede hacer en el dominio de frecuencia. Esto conduce a:
Donde H_{Lp}(k) y H_{Hp}(k) son
las transformadas de Fourier de las respuestas de impulsos de los
filtros LP y HP.
Según lo anterior, las funciones de
autocorrelación para la banda alta y banda baja se pueden calcular
de acuerdo con:
El valor máximo, para un retraso mayor que un
retraso mínimo, para cada véctor de autocorrelación se calcula
como:
La cuota de las dos puede utilizarse por ejemplo
para delimitar un factor de expansión de anchura de banda
adecuado.
Lo anterior implica que sería beneficioso evaluar
una medida general de la previsibilidad, es decir la relación tonal
a ruido de una señal a una banda de frecuencias dada en un instante
dado, con objeto de obtener un correcto nivel de filtrado inverso
para una banda de frecuencias dadas en un instante dado. Esto se
puede llevar a cabo utilizando el siguiente enfoque más refinado.
Aquí se asume un banco de filtros de sub-banda,
aunque debe entenderse sin embargo que la invención no está
limitada a los mismos.
Una relación q tonal a ruido para cada
sub-banda de un filtro de banda puede definirse
utilizando predicción lineal en bloques de muestras de
sub-banda. Un valor grande de q indica una gran
cantidad de tonalidad, mientras que un valor pequeño de q indica
que la señal es de tipo ruido en la correspondiente localización en
frecuencia y en tiempo. El valor de q se puede obtener utilizando
tanto el método de covarianza como el método de autocorrelación.
Para el método de covarianza, se pueden calcular
eficazmente los coeficientes de predición lineal y el error de
predicción para el bloque de señal de sub-banda
[x(0), x(1), ... x(n-1)]
utilizando la descomposición de Cholesky (Digital Processing of
Speech Signals, Rabiner and Schafer Prentice may Inc. Engelwood
Cliffs, New Jersey 07632, ISBN
0-13-213603-1,
Capítulo 8). La relación q tonal a ruido está entonces definida
por
(13)q = \frac{\Psi -
E}{E},
Donde \Psi =
|x(0)|^{2}+|x(1)|^{2}+ ...
+|x(N-1)|^{2} es la energía del bloque de
señal y E es la energía del bloque de predicción de error.
Para el método de autocorrelación, un enfoque más
natural consiste en utilizar el algoritmo de
Levinson-Durbin, [Digital Signal Processing,
Principles, Algorithms and Applications, Third Edition, John G.
Proakis, Dimitris G Manolakis Prentice Hall, International
Editions,
ISBN-0-13-394338-9,
capítulo 11] donde q se define entonces de acuerdo con
(14)q =
\left(\prod\limits^{p}_{i=1}(1-|K_{i}|^{2})\right)^{-1} -
1,
Donde K_{i} son los coeficientes de reflexión
de la correspondiente estructura de filtro de red obtenida a partir
del polinomio de predicción y p es el orden de predicción.
La relación entre los valores de banda alta y
banda baja de q se utiliza entonces para ajustar el grado de
blanqueo espectral de manera que la relación tonal a ruido de la
banda alta reconstruida se aproxima a la de la banda alta original.
Aquí es ventajoso controlar el grado de blanqueo utilizando el
factor b de mezcla (ec.6).
Asumiendo que la relación tonal a ruido q =
q_{H} se mide en la banda alta y que q = q_{L} \geq q_{H}
se mide en la banda baja, una elección adecuada en el factor de
blanqueo b viene dada por la fórmula:
(15)b =
1-\sqrt{\frac{q_{H}}{q_{L}}}.
Para verlo, un primer paso es rescribir la ec.6
en la forma
(16)A_{b}(z) = A(z) +
(1-b)(1-A(z))
Esto muestra que si la señal utilizada para
estimar A(Z) se filtra con el filtro A_{b}(z), la
señal predecida se suprime mediante el factor de ganancia
1-b y el error de predicción se mantiene
inalterado. Como la relación tonal a ruido es la relación de la
señal cuadrática media predecida a error de predicción cuadrático
medio, un valor de q anterior al filtrado se modifica a
(1-b)^{2}q mediante la operación de
filtrado. Aplicar esto a la señal de banda baja produce una señal
con una relación tonal a ruido de
(1-b)^{2}q_{L} y bajo la asunción de que
el método HFR aplicado no altera la tonalidad, se alcanza
exactamente el valor objetivo q_{H} en la banda alta si se escoge
b de acuerdo con la ec.15.
Los valores de q basados en el orden de
predicción p = 2 en cada sub-banda de un banco de
filtros de 64 canales se describen en la figura 5c, para la señal
de la figura 5a. Se alcanzan valores significativamente mayores para
la parte armónica de la señal que para la parte ruidosa. La
variabilidad de las estimaciones en la parte armónica se debe a la
resolución de frecuencia elegida y al orden de predicción.
El filtrado adaptativo en el decodificador se
puede hacer antes de, o después de la reconstrucción en altas
frecuencias. Si el filtrado se lleva a cabo antes del HFR, se
necesita considerar las características del método HFR utilizado.
Cuando se lleva a cabo un filtrado adaptativo selectivo en
frecuencias, el sistema debe deducir qué región de banda baja
originará una cierta región de banda alta, con objeto de aplicar la
correcta cantidad de blanqueo espectral a esta región de banda
baja, antes de la unidad HFR. En el ejemplo siguiente, una
implementación en dominio de tiempo de la presente invención, se
introduce un blanqueo espectral adaptativo selectivo en
frecuencias. Debería ser obvio para cualquier persona experta en la
técnica que las implementaciones en dominio de tiempo de la
presente invención no están limitadas a la implementación descrita
más adelante.
Cuando se lleva a cabo el filtrado adaptativo en
el dominio de tiempos, se prefiere la predicción lineal que utiliza
el método de auto correlación. El método de autocorrelación
requiere tomar ventanas del segmento de entrada utilizado para
estimar los coeficientes \alpha_{k}, lo que no es el caso para
el método de covarianza. El filtro utilizado para el blanqueo
espectral de acuerdo con la presente invención es
(19)H_{inv}(z,p,\rho) =
1-\sum\limits^{p}\limits_{k=1}\alpha_{k}(z\rho)^{-k},
donde el factor G de ganancia (en la Ec.5) se
fija 1. Cuando se lleva a cabo el blanqueo espectral adaptativo
antes de la unidad HFR, se consigue una implementación efectiva, ya
que el filtro adaptativo puede funcionar con una baja tasa de
muestreo. Se toman ventanas de la señal de banda baja sobre una
base adecuada de tiempos, con el orden de predicción y los factores
de expansión de anchura de banda dados por el codificador, de
acuerdo con la figura 6. En esta implementación actual de la
presente invención, la señal es filtrada en pasa baja 601 y
diezmada 602. La referencia 603 ilustra el filtro adaptativo. Se
utiliza una ventana 606 para seleccionar el segmento de tiempo
adecuado para la estimación del polinomio A(z), y se utiliza
un 50% de solapamiento. La rutina LPC 607 extrae A(z) dados
los valores actualmente preferidos de orden LPC y factor de
expansión de anchura de banda, con una relajación adecuada. Se
utiliza un filtro FIR 608 para filtrar adaptativamente el segmento
de señal. Los segmentos de señal blanqueados espectralmente se
sobremuestrean 604, 605 y se toman ventanas formando conjuntamente
la señal de entrada a la unidad
HFR.
El filtrado adaptativo se puede llevar a cabo de
forma efectiva y robusta utilizando un banco de filtros. La
predicción lineal y el filtrado se realizan independientemente para
cada una de las señales de sub-bandas producidas por
el banco de filtros. Es ventajoso utilizar un banco de filtros
cuando se suprimen las componentes alias de las señales de
sub-banda. Esto se puede conseguir, por ejemplo,
sobremuestreando el banco de filtro. Aparecen alteraciones debidas a
la formación de alias por modificaciones independientes de las
señales de sub- banda, lo que por ejemplo, da como resultado el
filtrado adaptativo, pueden verse entonces grandemente reducidas.
El blanqueo espectral de las señales de sub-banda
se obtiene a través de predicción lineal análoga al método en
dominio de tiempos descrito anteriormente. Si las señales de
sub-bandas tienen valores complejos, se utilizan
coeficientes de filtro complejos para la predicción lineal así como
para el filtrado. El orden de la predicción lineal se puede
mantener muy bajo, ya que el número esperado de componentes tonales
en cada banda de frecuencias es muy pequeño para un sistema de una
cantidad razonable de canales de banco de filtro. Con objeto de
corresponder a la misma base de tiempo que el dominio de tiempos
LPC, el número de muestras de sub-banda en cada
bloque es menor en un factor igual a la reducción de muestreo del
banco de filtros. Dado el bajo orden de filtro y los pequeños
tamaños de bloque, los coeficientes de predicción de filtro se
obtienen preferiblemente utilizando el método de covarianza. El
cálculo del coeficiente de filtro y el blanqueo espectral se puede
llevar a cabo sobre una base bloque a bloque utilizando un intervalo
de tiempo L de muestra de sub-banda, que es menor
que la longitud N del bloque. Los bloques blanqueados
espectralmente deben sumarse entre sí utilizando una síntesis
adecuada por toma de ventanas.
Alimentar un banco de filtros máximamente
diezmado con un señal de entrada que consiste en ruido blanco
gaussiano producirá señales de sub-banda con
densidad espectral blanca. Alimentar un banco de filtro
sobremuestreado con ruido blanco proporciona señales de
sub-banda con densidad espectral coloreada. Esto se
debe a los efectos de la respuesta en frecuencias de los filtros de
análisis. Los aparatos de predicción LPC en los canales del banco de
filtros trazarán las características de filtro en el caso de
señales de entrada similares a ruido. Esta es una característica no
deseada, y se beneficia de la compensación. Una posible solución es
prefiltrar las señales de entrada con los aparatos de predicción
lineal. El prefiltrado debería de ser la inversa o una aproximación
a la inversa, de los filtros de análisis, con objeto de compensar
la respuesta en frecuencia de los filtros de análisis. Los filtros
de blanqueo se alimentan con las señales originales de
sub-banda, según se describe anteriormente. La
figura 7 ilustra el proceso de blanqueo de una señal de sub- banda.
La señal de sub-banda correspondiente al canal l
alimenta el bloque 701 de prefiltrado y subsiguientemente una
cadena de retardos en la que profundidad de la misma depende del
orden 702 de filtro. Las señales retrasadas y sus conjugados 703
alimentan el bloque 704 de predicción lineal, donde se calculan los
coeficientes. Los coeficientes de cada cálculo L-ésimo se guardan en
el diezmador 705. Las señales de sub-banda se
filtran finalmente a través del bloque 706 de filtros, donde se
utilizan los coeficientes predecidos y se actualizan para cada
muestra L-ésima.
La presente invención se puede implementar tanto
en chips de equipo físico y DSP, para varios tipos de sistemas,
para almacenamiento o transmisión de señales, analógicas o
digitales utilizando códecs arbitrarios. Las figuras 8 y 9 muestran
una posible implementación de la presente invención. En la figura 8
se muestra el lado del codificador. La señal analógica de entrada
alimenta al conversor A/D 801 y a un codificador arbitrario de
audio, 802, así como a la unidad 803 de estimación del nivel de
filtrado inverso y a una unidad 804 de extracción de envolvente. La
información codificada se multiplexa en una cadena de bits
(unidades lógicas) en serie 805 y se transmite o almacena. En la
figura 9 se muestra una implementación típica de decodificador. La
cadena de bits en serie se desmultiplexa, 901 y se descodifican los
datos de la envolvente, 902, es decir, la envolvente espectral de
la banda alta. La fuente desmultiplexada de señal codificada se
decodifica utilizando un decodificador arbitrario de audio, 903. La
señal de codificada alimenta una unidad arbitraria HFR, 904, donde
se regenera una banda alta. La señal de banda alta alimenta la
unidad 905 de blanqueo espectral, que lleva a cabo el blanqueo
espectral adaptativo. Subsiguientemente, la señal alimenta el
ajustador 906 de envolvente. La salida del ajustador de envolvente
se combina con la señal decodificada alimentada a través de un
retardo, 907. Finalmente la salida digital se convierte de nuevo a
una forma de onda analógica 908.
Claims (19)
1. Aparato para estimar un nivel de blanqueo
espectral que debe ser aplicado a una señal antes de una etapa de
regeneración de altas frecuencias o después de la etapa de
regeneración de altas frecuencias que se va a llevar a cabo cuando
se genera una señal regenerada en altas frecuencias que tiene una
banda alta que se basa en una señal de banda baja, en el cual el
blanqueo espectral se obtiene filtrando utilizando un filtro de
blanqueo espectral, siendo el filtro de blanqueo espectral un
filtro adaptativo que es adaptable por medio de un parámetro de
filtro, comprendiendo el aparato:
- Medios (803) para estimar un carácter tonal de
una señal de audio original que va a ser codificada, en un instante
dado, en el cual la señal original de audio se va a codificar
mediante un codificador de audio para obtener una señal de audio
codificada que representa únicamente una banda baja de la señal de
audio original, incluyendo el carácter tonal estimado un carácter
tonal estimado de una banda ancha de la señal original de audio, que
no está incluida en la señal codificada de audio;
- Medios (803) para determinar un parámetro de
filtro variable del filtro de blanqueo espectral basado en el
carácter tonal estimado; y
- Medios (805) para asociar el parámetro de
filtro variable a la señal de audio codificada para obtener una
cadena de bits que tiene codificada la señal de audio, teniendo el
parámetro de filtro variable, siendo el parámetro de filtro
variable dependiente de la señal codificada de audio.
2. Aparato según la reivindicación 1 en el que la
etapa de regeneración de altas frecuencias es tal que no altera
sustancialmente una estructura tonal de la banda baja, en la cual
los medios para estimar se disponen de manera tal que además del
carácter tonal de la banda alta, también se determina un carácter
tonal de la banda baja, y en el cual los medios para determinar
están dispuestos para comparar el carácter tonal de la banda alta y
el carácter tonal de la banda baja para determinar el parámetro de
filtro.
3. Aparato según la reivindicación 1 que
comprende adicionalmente:
- Medios para llevar a cabo la etapa de
regeneración de altas frecuencias en la banda baja de la señal
original de audio para obtener la señal regenerada de altas
frecuencias;
- Medios para estimar un carácter tonal de la
señal de alta frecuencia regenerada, y
En el que los medios para determinar están
dispuestos para comparar la señal de alta frecuencia regenerada y
la banda alta de la señal original de audio para determinar el
parámetro de filtro.
4. Aparato según la reivindicación 1, en el cual
la estimación del carácter tonal de la señal original se realiza
para diferentes regiones de frecuencia.
5. Aparato según la reivindicación 1, en el cual
la estimación de la cantidad requerida de blanqueo espectral se
realiza para diferentes regiones de frecuencia.
6. Aparato según la reivindicación 1, en el cual
el blanqueo espectral se lleva a cabo en el dominio de tiempos.
7. Aparato según la reivindicación 1 en el cual
el blanqueo espectral se lleva a cabo en un banco de filtros de
sub-banda.
8. Aparato según la reivindicación 1, en el cual
la estimación de la cantidad de blanqueo espectral requerida se
realiza por comparación de las relaciones tono a ruido de señal de
diferentes señales de sub-banda obtenidas por
filtrado de sub-banda de la señal original, en el
cual las relaciones se obtienen utilizando predicción lineal de las
señales de sub-banda.
9. Aparato según la reivindicación 1, en el cual
la estimación de la cantidad requerida de blanqueo espectral se
realiza por comparación de las relaciones tonal a ruido de señal de
diferentes señales de sub-banda obtenidas por
filtrado de sub-banda de la señal original y una
señal reconstituida de alta frecuencia en la cual las relaciones se
obtienen utilizando predicción lineal de las señales de
sub-banda, y la señal reconstruida de alta
frecuencia se produce de la misma manera que una señal reconstruida
de alta frecuencia en un decodificador.
10. Aparato según la reivindicación 1, en el que
el filtro de blanqueo espectral es un filtro que tiene coeficientes
de filtro obtenidos mediante predicción lineal para obtener un
polinomio LPC y en el cual el parámetro de filtro indica un orden
de predicción del polinomio LPC, un factor de expansión de anchura
de banda del polinomio LPC, o un factor de mezcla que indica una
cantidad de mezcla de una señal filtrada y una parte complementaria
sin procesar.
11. Aparato para producir una señal de salida
basada en una versión decodificada de una señal codificada de audio
que representa una banda baja de una señal original de audio,
teniendo asociada a esta señal codificada de audio un parámetro de
filtro variable para un filtro de blanqueo espectral, dependiendo
el parámetro de filtro variable de una característica tonal de una
banda alta de la señal original de audio en un instante dado,
comprendiendo el aparato:
- Medios (901) para obtener los parámetros de
filtro variable asociados a la señal de audio codificada;
- Una unidad (904) de regeneración de altas
frecuencias para llevar a cabo una etapa de regeneración de altas
frecuencias en una versión decodificada de la señal codificada de
audio para producir una señal regenerada en altas frecuencias;
y
- Un filtro (905) de blanqueo espectral
adaptativo para filtrar la versión decodificada de una señal
regenerada en altas frecuencias;
En el cual el filtro de blanqueo espectral
adaptativo tiene un parámetro variable, estando fijado el parámetro
variable de acuerdo con el parámetro de filtro variable asociado
con la señal codificada de audio.
12. Aparato según la reivindicación 11, en el
cual se incluye un prefiltrado en una estimación de codificación
predictiva lineal con objeto de compensar las características de
los filtros de análisis del banco de filtros.
13. Aparato de acuerdo con la reivindicación 11,
en el cual el filtro de blanqueo espectral adaptativo
comprende:
- Medios (606) para tomar ventanas de la señal
que se va a filtrar;
- Medios LPC (607) para obtener un polinomio LPC
normal de una señal de ventanas, siendo responsables los medios LPC
de un orden LPC y un factor de expansión de anchura de banda como
parámetros de filtro variable para un instante dado, y
- Un filtro FIR para filtrar la señal que se va a
filtrar, estando el filtro FIR fijado por el polinomio LPC obtenido
por los medios LPC.
14. Método para estimar un nivel de blanqueo
espectral que se va aplicar a una señal antes de una etapa de
regeneración de altas frecuencias o después de la etapa de
regeneración de altas frecuencias que se va a llevar a cabo cuando
se genera una señal regenerada en altas frecuencias que tiene una
banda alta que se basa en una señal de banda baja, en la cual el
blanqueo espectral se obtiene filtrando utilizando un filtro de
blanqueo espectral, siendo el filtro de blanqueo espectral un
filtro adaptativo que es adaptable por medio de un parámetro de
filtro, comprendiendo el método las siguientes etapas:
- Estimar un carácter tonal de una señal original
de audio que se va a codificar, en un instante dado, en el cual la
señal original de audio va a ser codificada por un codificador de
audio para obtener una señal codificada de audio que representa
únicamente una banda baja de la señal original de audio, incluyendo
un carácter tonal estimado en una banda alta de la señal original de
audio, que no está incluido en la señal codificada de audio;
- Determinar un parámetro de filtro variable del
filtro de blanqueo espectral basado en el carácter tonal estimado;
y
- Asociar el parámetro de filtro variable de la
señal codificada de audio para obtener una cadena de bits que tiene
la señal codificada de audio que tiene el parámetro de filtro
variable, siendo el parámetro de filtro variable dependiente de la
señal codificada de audio.
15. Método para producir una señal de salida
basada en una versión decodificada de una señal codificada de audio
que representa una banda baja de una señal original de audio,
teniendo la señal codificada de audio asociada a esta un parámetro
de filtro variable para un filtro de blanqueo espectral,
dependiendo el parámetro de filtro variable de un carácter tonal de
una banda alta de la señal original de audio en un instante dado,
comprendiendo el método las siguientes etapas:
- Obtener el parámetro de filtro variable
asociado a la señal codificada de audio;
- Llevar a cabo una etapa de regeneración de alta
frecuencia en una versión decodificada de la señal codificada de
audio para producir una señal regenerada en altas frecuencias;
y
- Un filtro (905) de blanqueo espectral
adaptativo para filtrar la versión decodificada o la señal
regenerada en altas frecuencias utilizando un filtro (905) de
blanqueo espectral adaptativo;
En el cual el filtro de blanqueo espectral
adaptativo tiene un parámetro variable, siendo el parámetro
variable fijado de acuerdo con el parámetro de filtro variable
asociado a la señal codificada de audio.
16. Codificador para codificar una señal original
de audio para obtener una versión codificada de la misma, que
comprende:
- Un aparato para estimar un nivel de blanqueo
espectral de acuerdo con la reivindicación 1;
- Un codificador (802) de audio para codificar la
señal original de audio para obtener la versión codificada de la
misma;
- Medios (804) para estimar una envolvente
espectral de la señal original de audio para obtener una envolvente
espectral estimada; y
- Un múltiplexor (805) para multiplexar la
versión codificada de la señal original de audio, el parámetro de
filtro del filtro de blanqueo espectral y la envolvente espectral
estimada para obtener una cadena de bits.
17. Decodificador para decodificar una cadena de
bits que incluye una versión codificada de una señal original de
audio, una envolvente espectral estimada y un parámetro de filtro
que se va a aplicar a un filtro de blanqueo espectral,
comprendiendo el decodificador:
- Un desmultiplexor (901) de cadena de bits para
extraer la versión codificada de la señal original de audio, la
envolvente espectral estimada y el parámetro de filtro;
- Un decodificador (903) de audio para
decodificar la versión codificada de la señal original de audio
para obtener una señal de banda baja;
- Un decodificador de envolvente para decodificar
la envolvente espectral estimada;
- Un aparato para producir una señal de salida de
acuerdo con la reivindicación 11, y
- Un sumador para sumar una señal regenerada en
altas frecuencias blanqueada espectralmente de forma adaptativa y
una versión retardada de la señal decodificada de audio para
obtener una señal de salida de banda ancha.
18. Método para modificar una señal original de
audio para obtener una versión codificada de la misma, que
comprende las siguientes etapas:
- Estimar un nivel de blanqueo espectral de
acuerdo con la reivindicación 14;
- Codificar (802) la señal original de audio para
obtener la versión codificada de la misma;
- Estimar (804) una envolvente espectral de la
señal original de audio para obtener una envolvente espectral
estimada; y
- Multiplexar (805) la versión codificada de la
señal original de audio, el parámetro de filtro del filtro de
blanqueo espectral y la envolvente espectral estimada para obtener
una cadena de bits.
19. El método para decodificar una cadena de bits
que incluye una versión codificada de una señal original de audio,
una envolvente espectral estimada y un parámetro de filtro que se
va a aplicar a un filtro de blanqueo espectral, comprendiendo el
método:
- Extraer (901) la versión codificada de la señal
original de audio, la envolvente espectral estimada y el parámetro
de filtro;
- Decodificar (903) la versión codificada de la
señal original de audio para obtener una señal de banda baja;
- Decodificar la envolvente espectral estimada;
y
- Producir una señal de salida de acuerdo con la
reivindicación 15; y
- Sumar una señal regenerada en altas frecuencias
blanqueda espectralmente de manera adaptativa y una versión
retardada de la señal decodificada de audio para obtener una señal
de salida de banda ancha.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
SE0004163A SE0004163D0 (sv) | 2000-11-14 | 2000-11-14 | Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering |
SE0004163 | 2000-11-14 |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2215935T3 true ES2215935T3 (es) | 2004-10-16 |
Family
ID=20281813
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES01983041T Expired - Lifetime ES2215935T3 (es) | 2000-11-14 | 2001-11-13 | Realizacion perceptual mejorada de metodos de codificacion de reconstruccion de altas frecuencias por filtrado adaptativo. |
Country Status (14)
Country | Link |
---|---|
US (2) | US7003451B2 (es) |
EP (1) | EP1342230B1 (es) |
JP (2) | JP3954495B2 (es) |
KR (1) | KR100517229B1 (es) |
CN (2) | CN1267890C (es) |
AT (1) | ATE264533T1 (es) |
AU (1) | AU2002214496A1 (es) |
DE (1) | DE60102838T2 (es) |
DK (1) | DK1342230T3 (es) |
ES (1) | ES2215935T3 (es) |
HK (1) | HK1056429A1 (es) |
PT (1) | PT1342230E (es) |
SE (1) | SE0004163D0 (es) |
WO (1) | WO2002041301A1 (es) |
Families Citing this family (100)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7742927B2 (en) * | 2000-04-18 | 2010-06-22 | France Telecom | Spectral enhancing method and device |
SE0004163D0 (sv) * | 2000-11-14 | 2000-11-14 | Coding Technologies Sweden Ab | Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering |
SE0202159D0 (sv) | 2001-07-10 | 2002-07-09 | Coding Technologies Sweden Ab | Efficientand scalable parametric stereo coding for low bitrate applications |
US20030108108A1 (en) * | 2001-11-15 | 2003-06-12 | Takashi Katayama | Decoder, decoding method, and program distribution medium therefor |
WO2003046891A1 (en) * | 2001-11-29 | 2003-06-05 | Coding Technologies Ab | Methods for improving high frequency reconstruction |
US20030187663A1 (en) * | 2002-03-28 | 2003-10-02 | Truman Michael Mead | Broadband frequency translation for high frequency regeneration |
JP4296752B2 (ja) | 2002-05-07 | 2009-07-15 | ソニー株式会社 | 符号化方法及び装置、復号方法及び装置、並びにプログラム |
KR100462615B1 (ko) * | 2002-07-11 | 2004-12-20 | 삼성전자주식회사 | 적은 계산량으로 고주파수 성분을 복원하는 오디오 디코딩방법 및 장치 |
US7555434B2 (en) * | 2002-07-19 | 2009-06-30 | Nec Corporation | Audio decoding device, decoding method, and program |
SE0202770D0 (sv) * | 2002-09-18 | 2002-09-18 | Coding Technologies Sweden Ab | Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks |
BRPI0306434B1 (pt) | 2002-09-19 | 2018-06-12 | Nec Corporation | Aparelho e método de decodificação de áudio |
KR100917464B1 (ko) * | 2003-03-07 | 2009-09-14 | 삼성전자주식회사 | 대역 확장 기법을 이용한 디지털 데이터의 부호화 방법,그 장치, 복호화 방법 및 그 장치 |
US7844451B2 (en) * | 2003-09-16 | 2010-11-30 | Panasonic Corporation | Spectrum coding/decoding apparatus and method for reducing distortion of two band spectrums |
DE602004032587D1 (de) * | 2003-09-16 | 2011-06-16 | Panasonic Corp | Codierungsvorrichtung und Decodierungsvorrichtung |
EP1675908B1 (en) * | 2003-10-07 | 2008-12-17 | Coloplast A/S | Composition useful as an adhesive ans use of such a composition |
US7668711B2 (en) * | 2004-04-23 | 2010-02-23 | Panasonic Corporation | Coding equipment |
KR100608062B1 (ko) * | 2004-08-04 | 2006-08-02 | 삼성전자주식회사 | 오디오 데이터의 고주파수 복원 방법 및 그 장치 |
WO2006090852A1 (ja) * | 2005-02-24 | 2006-08-31 | Matsushita Electric Industrial Co., Ltd. | データ再生装置 |
KR100956877B1 (ko) * | 2005-04-01 | 2010-05-11 | 콸콤 인코포레이티드 | 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 방법 및장치 |
PT1875463T (pt) | 2005-04-22 | 2019-01-24 | Qualcomm Inc | Sistemas, métodos e aparelho para nivelamento de fator de ganho |
US7548853B2 (en) * | 2005-06-17 | 2009-06-16 | Shmunk Dmitry V | Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding |
EP1742509B1 (en) * | 2005-07-08 | 2013-08-14 | Oticon A/S | A system and method for eliminating feedback and noise in a hearing device |
US8050915B2 (en) * | 2005-07-11 | 2011-11-01 | Lg Electronics Inc. | Apparatus and method of encoding and decoding audio signals using hierarchical block switching and linear prediction coding |
BRPI0616624A2 (pt) * | 2005-09-30 | 2011-06-28 | Matsushita Electric Ind Co Ltd | aparelho de codificação de fala e método de codificação de fala |
EP1989703A4 (en) * | 2006-01-18 | 2012-03-14 | Lg Electronics Inc | DEVICE AND METHOD FOR CODING AND DECODING A SIGNAL |
EP1827002A1 (en) * | 2006-02-22 | 2007-08-29 | Alcatel Lucent | Method of controlling an adaptation of a filter |
US7590523B2 (en) * | 2006-03-20 | 2009-09-15 | Mindspeed Technologies, Inc. | Speech post-processing using MDCT coefficients |
EP1852849A1 (en) * | 2006-05-05 | 2007-11-07 | Deutsche Thomson-Brandt Gmbh | Method and apparatus for lossless encoding of a source signal, using a lossy encoded data stream and a lossless extension data stream |
EP1852848A1 (en) * | 2006-05-05 | 2007-11-07 | Deutsche Thomson-Brandt GmbH | Method and apparatus for lossless encoding of a source signal using a lossy encoded data stream and a lossless extension data stream |
US8010352B2 (en) | 2006-06-21 | 2011-08-30 | Samsung Electronics Co., Ltd. | Method and apparatus for adaptively encoding and decoding high frequency band |
KR101390188B1 (ko) * | 2006-06-21 | 2014-04-30 | 삼성전자주식회사 | 적응적 고주파수영역 부호화 및 복호화 방법 및 장치 |
US9159333B2 (en) | 2006-06-21 | 2015-10-13 | Samsung Electronics Co., Ltd. | Method and apparatus for adaptively encoding and decoding high frequency band |
US20080109215A1 (en) * | 2006-06-26 | 2008-05-08 | Chi-Min Liu | High frequency reconstruction by linear extrapolation |
US8077821B2 (en) * | 2006-09-25 | 2011-12-13 | Zoran Corporation | Optimized timing recovery device and method using linear predictor |
US20100017197A1 (en) * | 2006-11-02 | 2010-01-21 | Panasonic Corporation | Voice coding device, voice decoding device and their methods |
FR2911031B1 (fr) * | 2006-12-28 | 2009-04-10 | Actimagine Soc Par Actions Sim | Procede et dispositif de codage audio |
FR2911020B1 (fr) * | 2006-12-28 | 2009-05-01 | Actimagine Soc Par Actions Sim | Procede et dispositif de codage audio |
DE102007003187A1 (de) | 2007-01-22 | 2008-10-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen eines zu sendenden Signals oder eines decodierten Signals |
KR101355376B1 (ko) * | 2007-04-30 | 2014-01-23 | 삼성전자주식회사 | 고주파수 영역 부호화 및 복호화 방법 및 장치 |
ES2403410T3 (es) * | 2007-08-27 | 2013-05-17 | Telefonaktiebolaget L M Ericsson (Publ) | Frecuencia de transición adaptativa entre el rellenado con ruido y la extensión del ancho de banda |
US9177569B2 (en) | 2007-10-30 | 2015-11-03 | Samsung Electronics Co., Ltd. | Apparatus, medium and method to encode and decode high frequency signal |
KR101373004B1 (ko) * | 2007-10-30 | 2014-03-26 | 삼성전자주식회사 | 고주파수 신호 부호화 및 복호화 장치 및 방법 |
KR100970446B1 (ko) * | 2007-11-21 | 2010-07-16 | 한국전자통신연구원 | 주파수 확장을 위한 가변 잡음레벨 결정 장치 및 그 방법 |
EP2077550B8 (en) * | 2008-01-04 | 2012-03-14 | Dolby International AB | Audio encoder and decoder |
EP2242046A4 (en) * | 2008-01-11 | 2013-10-30 | Nec Corp | SYSTEM, APPARATUS, METHOD AND PROGRAM FOR CONTROL OF SIGNAL ANALYSIS, SIGNAL ANALYSIS AND SIGNAL CONTROL |
US8665914B2 (en) | 2008-03-14 | 2014-03-04 | Nec Corporation | Signal analysis/control system and method, signal control apparatus and method, and program |
US8374854B2 (en) * | 2008-03-28 | 2013-02-12 | Southern Methodist University | Spatio-temporal speech enhancement technique based on generalized eigenvalue decomposition |
JP5773124B2 (ja) * | 2008-04-21 | 2015-09-02 | 日本電気株式会社 | 信号分析制御及び信号制御のシステム、装置、方法及びプログラム |
KR101239812B1 (ko) * | 2008-07-11 | 2013-03-06 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 대역폭 확장 신호를 생성하기 위한 장치 및 방법 |
US8880410B2 (en) * | 2008-07-11 | 2014-11-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating a bandwidth extended signal |
USRE47180E1 (en) | 2008-07-11 | 2018-12-25 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating a bandwidth extended signal |
KR101225556B1 (ko) * | 2008-08-25 | 2013-01-23 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 프리-화이트닝을 사용한 lms 알고리즘에 의해 적응된 적응형 필터의 갱신된 필터 계수를 결정하기 위한 방법 |
US8407046B2 (en) * | 2008-09-06 | 2013-03-26 | Huawei Technologies Co., Ltd. | Noise-feedback for spectral envelope quantization |
US8532983B2 (en) * | 2008-09-06 | 2013-09-10 | Huawei Technologies Co., Ltd. | Adaptive frequency prediction for encoding or decoding an audio signal |
US8532998B2 (en) | 2008-09-06 | 2013-09-10 | Huawei Technologies Co., Ltd. | Selective bandwidth extension for encoding/decoding audio/speech signal |
WO2010028301A1 (en) * | 2008-09-06 | 2010-03-11 | GH Innovation, Inc. | Spectrum harmonic/noise sharpness control |
WO2010031003A1 (en) * | 2008-09-15 | 2010-03-18 | Huawei Technologies Co., Ltd. | Adding second enhancement layer to celp based core layer |
US8577673B2 (en) * | 2008-09-15 | 2013-11-05 | Huawei Technologies Co., Ltd. | CELP post-processing for music signals |
GB0822537D0 (en) | 2008-12-10 | 2009-01-14 | Skype Ltd | Regeneration of wideband speech |
GB2466201B (en) * | 2008-12-10 | 2012-07-11 | Skype Ltd | Regeneration of wideband speech |
US9947340B2 (en) * | 2008-12-10 | 2018-04-17 | Skype | Regeneration of wideband speech |
WO2010070770A1 (ja) * | 2008-12-19 | 2010-06-24 | 富士通株式会社 | 音声帯域拡張装置及び音声帯域拡張方法 |
EP2380172B1 (en) | 2009-01-16 | 2013-07-24 | Dolby International AB | Cross product enhanced harmonic transposition |
BR122019023924B1 (pt) | 2009-03-17 | 2021-06-01 | Dolby International Ab | Sistema codificador, sistema decodificador, método para codificar um sinal estéreo para um sinal de fluxo de bits e método para decodificar um sinal de fluxo de bits para um sinal estéreo |
US11657788B2 (en) | 2009-05-27 | 2023-05-23 | Dolby International Ab | Efficient combined harmonic transposition |
TWI675367B (zh) * | 2009-05-27 | 2019-10-21 | 瑞典商杜比國際公司 | 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體 |
WO2011001578A1 (ja) * | 2009-06-29 | 2011-01-06 | パナソニック株式会社 | 通信装置 |
JP5754899B2 (ja) | 2009-10-07 | 2015-07-29 | ソニー株式会社 | 復号装置および方法、並びにプログラム |
JP5771618B2 (ja) | 2009-10-19 | 2015-09-02 | ドルビー・インターナショナル・アーベー | 音声オブジェクトの区分を示すメタデータ時間標識情報 |
JP5850216B2 (ja) | 2010-04-13 | 2016-02-03 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP5609737B2 (ja) | 2010-04-13 | 2014-10-22 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
US9117459B2 (en) * | 2010-07-19 | 2015-08-25 | Dolby International Ab | Processing of audio signals during high frequency reconstruction |
US9047875B2 (en) | 2010-07-19 | 2015-06-02 | Futurewei Technologies, Inc. | Spectrum flatness control for bandwidth extension |
US12002476B2 (en) | 2010-07-19 | 2024-06-04 | Dolby International Ab | Processing of audio signals during high frequency reconstruction |
JP6075743B2 (ja) | 2010-08-03 | 2017-02-08 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
CA3220202A1 (en) | 2010-09-16 | 2012-03-22 | Dolby International Ab | Cross product enhanced subband block based harmonic transposition |
JP5707842B2 (ja) | 2010-10-15 | 2015-04-30 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
CN103548077B (zh) | 2011-05-19 | 2016-02-10 | 杜比实验室特许公司 | 参数化音频编译码方案的取证检测 |
CN103918029B (zh) | 2011-11-11 | 2016-01-20 | 杜比国际公司 | 使用过采样谱带复制的上采样 |
CN103366751B (zh) * | 2012-03-28 | 2015-10-14 | 北京天籁传音数字技术有限公司 | 一种声音编解码装置及其方法 |
CN103366749B (zh) * | 2012-03-28 | 2016-01-27 | 北京天籁传音数字技术有限公司 | 一种声音编解码装置及其方法 |
EP2682941A1 (de) * | 2012-07-02 | 2014-01-08 | Technische Universität Ilmenau | Vorrichtung, Verfahren und Computerprogramm für frei wählbare Frequenzverschiebungen in der Subband-Domäne |
BR112015017632B1 (pt) * | 2013-01-29 | 2022-06-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V. | Aparelho e método para gerar um sinal melhorado da frequência utilizando nivelamento temporal de sub-bandas |
US9881624B2 (en) | 2013-05-15 | 2018-01-30 | Samsung Electronics Co., Ltd. | Method and device for encoding and decoding audio signal |
EP2830061A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping |
KR101406748B1 (ko) * | 2013-08-13 | 2014-06-17 | 한국광성전자 주식회사 | 디지털 오디오 음질 개선 장치 |
US9666202B2 (en) | 2013-09-10 | 2017-05-30 | Huawei Technologies Co., Ltd. | Adaptive bandwidth extension and apparatus for the same |
US9875746B2 (en) | 2013-09-19 | 2018-01-23 | Sony Corporation | Encoding device and method, decoding device and method, and program |
KR102064890B1 (ko) * | 2013-10-22 | 2020-02-11 | 삼성전자 주식회사 | 내부 및 외부 메모리를 선택적으로 사용하는 harq 데이터 처리 장치 및 그 처리 방법 |
US9293143B2 (en) * | 2013-12-11 | 2016-03-22 | Qualcomm Incorporated | Bandwidth extension mode selection |
CA3162763A1 (en) | 2013-12-27 | 2015-07-02 | Sony Corporation | Decoding apparatus and method, and program |
US20150194157A1 (en) * | 2014-01-06 | 2015-07-09 | Nvidia Corporation | System, method, and computer program product for artifact reduction in high-frequency regeneration audio signals |
CN111312277B (zh) | 2014-03-03 | 2023-08-15 | 三星电子株式会社 | 用于带宽扩展的高频解码的方法及设备 |
EP3913628A1 (en) | 2014-03-24 | 2021-11-24 | Samsung Electronics Co., Ltd. | High-band encoding method |
WO2016167216A1 (ja) * | 2015-04-13 | 2016-10-20 | 日本電信電話株式会社 | マッチング装置、判定装置、これらの方法、プログラム及び記録媒体 |
JP6611042B2 (ja) * | 2015-12-02 | 2019-11-27 | パナソニックIpマネジメント株式会社 | 音声信号復号装置及び音声信号復号方法 |
US10825467B2 (en) * | 2017-04-21 | 2020-11-03 | Qualcomm Incorporated | Non-harmonic speech detection and bandwidth extension in a multi-source environment |
JP7214726B2 (ja) * | 2017-10-27 | 2023-01-30 | フラウンホッファー-ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | ニューラルネットワークプロセッサを用いた帯域幅が拡張されたオーディオ信号を生成するための装置、方法またはコンピュータプログラム |
TWI834582B (zh) | 2018-01-26 | 2024-03-01 | 瑞典商都比國際公司 | 用於執行一音訊信號之高頻重建之方法、音訊處理單元及非暫時性電腦可讀媒體 |
CN108630212B (zh) * | 2018-04-03 | 2021-05-07 | 湖南商学院 | 非盲带宽扩展中高频激励信号的感知重建方法与装置 |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4361875A (en) * | 1980-06-23 | 1982-11-30 | Bell Telephone Laboratories, Incorporated | Multiple tone detector and locator |
DE3587251T2 (de) * | 1984-12-20 | 1993-07-15 | Gte Laboratories Inc | Anpassbares verfahren und vorrichtung fuer sprachkodierung. |
US4776014A (en) * | 1986-09-02 | 1988-10-04 | General Electric Company | Method for pitch-aligned high-frequency regeneration in RELP vocoders |
US5127054A (en) * | 1988-04-29 | 1992-06-30 | Motorola, Inc. | Speech quality improvement for voice coders and synthesizers |
ES2164640T3 (es) * | 1991-08-02 | 2002-03-01 | Sony Corp | Codificador digital con asignacion dinamica de bits de cuantificacion. |
JP3144009B2 (ja) * | 1991-12-24 | 2001-03-07 | 日本電気株式会社 | 音声符号復号化装置 |
US5347611A (en) * | 1992-01-17 | 1994-09-13 | Telogy Networks Inc. | Apparatus and method for transparent tone passing over narrowband digital channels |
GB2281680B (en) * | 1993-08-27 | 1998-08-26 | Motorola Inc | A voice activity detector for an echo suppressor and an echo suppressor |
US5915235A (en) * | 1995-04-28 | 1999-06-22 | Dejaco; Andrew P. | Adaptive equalizer preprocessor for mobile telephone speech coder to modify nonideal frequency response of acoustic transducer |
US5822360A (en) * | 1995-09-06 | 1998-10-13 | Solana Technology Development Corporation | Method and apparatus for transporting auxiliary data in audio signals |
US6035177A (en) * | 1996-02-26 | 2000-03-07 | Donald W. Moses | Simultaneous transmission of ancillary and audio signals by means of perceptual coding |
US5812971A (en) * | 1996-03-22 | 1998-09-22 | Lucent Technologies Inc. | Enhanced joint stereo coding method using temporal envelope shaping |
US5995561A (en) * | 1996-04-10 | 1999-11-30 | Silicon Systems, Inc. | Method and apparatus for reducing noise correlation in a partial response channel |
SE512719C2 (sv) * | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
SE9903553D0 (sv) * | 1999-01-27 | 1999-10-01 | Lars Liljeryd | Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL) |
US6249762B1 (en) * | 1999-04-01 | 2001-06-19 | The United States Of America As Represented By The Secretary Of The Navy | Method for separation of data into narrowband and broadband time series components |
US6574593B1 (en) * | 1999-09-22 | 2003-06-03 | Conexant Systems, Inc. | Codebook tables for encoding and decoding |
KR100675309B1 (ko) * | 1999-11-16 | 2007-01-29 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 광대역 오디오 송신 시스템, 송신기, 수신기, 코딩 디바이스, 디코딩 디바이스와, 송신 시스템에서 사용하기 위한 코딩 방법 및 디코딩 방법 |
SE0004163D0 (sv) * | 2000-11-14 | 2000-11-14 | Coding Technologies Sweden Ab | Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering |
JP4067762B2 (ja) * | 2000-12-28 | 2008-03-26 | ヤマハ株式会社 | 歌唱合成装置 |
-
2000
- 2000-11-14 SE SE0004163A patent/SE0004163D0/xx unknown
-
2001
- 2001-11-13 JP JP2002543427A patent/JP3954495B2/ja not_active Expired - Lifetime
- 2001-11-13 DE DE60102838T patent/DE60102838T2/de not_active Expired - Lifetime
- 2001-11-13 DK DK01983041T patent/DK1342230T3/da active
- 2001-11-13 KR KR10-2003-7006515A patent/KR100517229B1/ko active IP Right Grant
- 2001-11-13 AT AT01983041T patent/ATE264533T1/de active
- 2001-11-13 CN CNB018205763A patent/CN1267890C/zh not_active Expired - Lifetime
- 2001-11-13 AU AU2002214496A patent/AU2002214496A1/en not_active Abandoned
- 2001-11-13 CN CN2005101160278A patent/CN1766993B/zh not_active Expired - Lifetime
- 2001-11-13 EP EP01983041A patent/EP1342230B1/en not_active Expired - Lifetime
- 2001-11-13 WO PCT/SE2001/002510 patent/WO2002041301A1/en active IP Right Grant
- 2001-11-13 ES ES01983041T patent/ES2215935T3/es not_active Expired - Lifetime
- 2001-11-13 PT PT01983041T patent/PT1342230E/pt unknown
- 2001-11-14 US US09/987,475 patent/US7003451B2/en not_active Expired - Lifetime
-
2003
- 2003-11-27 HK HK03108654A patent/HK1056429A1/xx not_active IP Right Cessation
-
2005
- 2005-09-21 JP JP2005273150A patent/JP2006079106A/ja not_active Abandoned
- 2005-10-12 US US11/247,176 patent/US7433817B2/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
DE60102838T2 (de) | 2005-04-21 |
EP1342230B1 (en) | 2004-04-14 |
KR100517229B1 (ko) | 2005-09-27 |
WO2002041301A1 (en) | 2002-05-23 |
CN1267890C (zh) | 2006-08-02 |
JP2004514179A (ja) | 2004-05-13 |
DE60102838D1 (de) | 2004-05-19 |
HK1056429A1 (en) | 2004-02-13 |
PT1342230E (pt) | 2004-09-30 |
US20060036432A1 (en) | 2006-02-16 |
ATE264533T1 (de) | 2004-04-15 |
AU2002214496A1 (en) | 2002-05-27 |
CN1481545A (zh) | 2004-03-10 |
KR20030062338A (ko) | 2003-07-23 |
US20020087304A1 (en) | 2002-07-04 |
US7433817B2 (en) | 2008-10-07 |
SE0004163D0 (sv) | 2000-11-14 |
EP1342230A1 (en) | 2003-09-10 |
CN1766993A (zh) | 2006-05-03 |
JP3954495B2 (ja) | 2007-08-08 |
CN1766993B (zh) | 2011-07-27 |
JP2006079106A (ja) | 2006-03-23 |
US7003451B2 (en) | 2006-02-21 |
DK1342230T3 (da) | 2004-08-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2215935T3 (es) | Realizacion perceptual mejorada de metodos de codificacion de reconstruccion de altas frecuencias por filtrado adaptativo. | |
JP4220461B2 (ja) | 時間的に離散した音声信号のアップサンプリングした信号を発生する方法と装置 | |
US9818418B2 (en) | High frequency regeneration of an audio signal with synthetic sinusoid addition | |
KR101376762B1 (ko) | 디코더 및 대응 디바이스에서 디지털 신호의 반향들의 안전한 구별과 감쇠를 위한 방법 | |
ES2796552T3 (es) | Sintetizador de señales de audio y codificador de señales de audio | |
KR100723753B1 (ko) | 스펙트럼 대역 복사에 의한 오디오 디코딩 장치 및 오디오디코딩 방법 | |
RU2419171C2 (ru) | Способ переключения скорости передачи битов при аудиодекодировании с масштабированием скорости передачи битов и масштабированием полосы пропускания | |
JP3557674B2 (ja) | 高能率符号化方法及び装置 | |
JP2004053940A (ja) | オーディオ復号化装置およびオーディオ復号化方法 |