ES2215935T3 - Realizacion perceptual mejorada de metodos de codificacion de reconstruccion de altas frecuencias por filtrado adaptativo. - Google Patents

Realizacion perceptual mejorada de metodos de codificacion de reconstruccion de altas frecuencias por filtrado adaptativo.

Info

Publication number
ES2215935T3
ES2215935T3 ES01983041T ES01983041T ES2215935T3 ES 2215935 T3 ES2215935 T3 ES 2215935T3 ES 01983041 T ES01983041 T ES 01983041T ES 01983041 T ES01983041 T ES 01983041T ES 2215935 T3 ES2215935 T3 ES 2215935T3
Authority
ES
Spain
Prior art keywords
signal
filter
spectral
parameter
encoded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
ES01983041T
Other languages
English (en)
Inventor
Kristofer Kjorling
Per Ekstrand
Fredrik Henn
Lars Villemoes
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Coding Technologies Sweden AB
Original Assignee
Coding Technologies Sweden AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=20281813&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=ES2215935(T3) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Coding Technologies Sweden AB filed Critical Coding Technologies Sweden AB
Application granted granted Critical
Publication of ES2215935T3 publication Critical patent/ES2215935T3/es
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Amplifiers (AREA)
  • Networks Using Active Elements (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Surface Acoustic Wave Elements And Circuit Networks Thereof (AREA)
  • Filters And Equalizers (AREA)
  • Control Of Motors That Do Not Use Commutators (AREA)
  • Crystals, And After-Treatments Of Crystals (AREA)

Abstract

Aparato para estimar un nivel de blanqueo espectral que debe ser aplicado a una señal antes de una etapa de regeneración de altas frecuencias o después de la etapa de regeneración de altas frecuencias que se va a llevar a cabo cuando se genera una señal regenerada en altas frecuencias que tiene una banda alta que se basa en una señal de banda baja, en el cual el blanqueo espectral se obtiene filtrando utilizando un filtro de blanqueo espectral, siendo el filtro de blanqueo espectral un filtro adaptativo que es adaptable por medio de un parámetro de filtro, comprendiendo el aparato: - Medios (803) para estimar un carácter tonal de una señal de audio original que va a ser codificada, en un instante dado, en el cual la señal original de audio se va a codificar mediante un codificador de audio para obtener una señal de audio codificada que representa únicamente una banda baja de la señal de audio original, incluyendo el carácter tonal estimado un carácter tonal estimado de una banda ancha de laseñal original de audio, que no está incluida en la señal codificada de audio; - Medios (803) para determinar un parámetro de filtro variable del filtro de blanqueo espectral basado en el carácter tonal estimado; y - Medios (805) para asociar el parámetro de filtro variable a la señal de audio codificada para obtener una cadena de bits que tiene codificada la señal de audio, teniendo el parámetro de filtro variable, siendo el parámetro de filtro variable dependiente de la señal codificada de audio.

Description

Realización perceptual mejorada de métodos de codificación de reconstrucción de altas frecuencias por filtrado adaptativo.
Campo técnico
La presente invención se refiere a sistemas de codificación de fuentes de audio utilizando reconstrucción de altas frecuencias (HFR) tal como replicación de banda espectral, SBR [documento WO 98/57436] o métodos relacionados. Mejora el rendimiento de los métodos de alta calidad (SBR) así como de los métodos de baja calidad (patente de Estados Unidos nº 5.127.054). Es aplicable tanto a sistemas de codificación de discurso como de codificación de audio natural.
Antecedentes de la invención
En la reconstrucción de altas frecuencias de señales de audio, donde se extrapola una banda alta desde una banda baja, es importante tener medios para controlar los componentes tonales de la banda alta reconstruida hasta un grado mayor del que se puede conseguir con un ajuste basto de la envolvente, según se utiliza comúnmente en los sistemas HFR. Esto es necesario ya que las componentes tonales de la mayoría de las señales de audio tales como voces y la mayoría de los instrumentos acústicos, son usualmente más fuertes en las regiones de baja frecuencia (es decir por debajo de 4 a 5 kHz) en comparación con las regiones de alta frecuencia. Un ejemplo extremo es una serie armónica muy pronunciada en la banda baja y más o menos ruidos puros en la banda alta. Una forma de aproximarse a esto es añadiendo ruido de forma adaptativa a la banda alta reconstruida (Adaptive Noise Addition [documento PCT/SE00/00159]). No obstante, esto no es a veces suficiente para suprimir el carácter tonal de la banda baja, dando a la banda alta reconstruida un carácter de sonido repetitivo "de zumbido". Asimismo, puede ser difícil conseguir las características temporales correctas del ruido. Otro problema tiene lugar cuando se mezclan dos series armónicas, una con gran densidad armónica (tono bajo) y la otra con baja densidad armónica (tono alto). Si la serie armónica de tono alto domina sobre la otra en la banda baja pero no en la banda alta, el HFR provoca que los armónicos de la señal de tono alto dominen la banda alta, haciendo que la banda alta reconstruida suene "metálica" en comparación con la original. Ninguna de las situaciones anteriormente descritas se puede controlar utilizando el ajuste de envolvente utilizado comúnmente en los sistemas HFR. En algunas implementaciones se introduce un grado constante de blanqueo espectral durante el ajuste de envolvente espectral de la señal HFR. Esto da resultados satisfactorios cuando se desea ese grado particular de blanqueo espectral, pero introduce graves alteraciones para fragmentos de señal que no se benefician de ese grado particular de blanqueo espectral.
Sumario de la invención
La presente invención se refiere al problema del sonido "metálico" y de "zumbido" que se introduce comúnmente en los métodos HFR. Este utiliza un sofisticado algoritmo de detección en el lado del codificador para estimar la cantidad preferida de blanqueo espectral que debe aplicarse en el decodificador. El blanqueo espectral varia con el tiempo así como con la frecuencia, garantizando los mejores medios para controlar los contenidos armónicos de la banda alta replicada. La presente invención se puede llevar a cabo en una implementación del dominio del tiempo así como en una implementación de bancos del filtro de sub-banda.
La presente invención comprende las siguientes características:
- En el codificador, estimar el carácter tonal de una señal original para diferentes regiones de frecuencia en un instante dado.
- En el codificador, estimar la cantidad de blanqueo espectral requerida, para regiones de diferentes frecuencias en un instante dado, con objeto de obtener un carácter tonal similar después del HFR en el decodificador, dado el método HFR utilizado en el decodificador.
- Transmitir la información en el grado preferido de blanqueo espectral desde el codificador al decodificador.
- En el decodificador, llevar a cabo el blanqueo espectral bien en el dominio de tiempos o en un banco de filtros de sub-banda, de acuerdo con la información transmitida desde el codificador.
- El filtro adaptativo utilizado para el blanqueo espectral en el decodificador se obtiene usando predicción lineal.
- El grado de blanqueo espectral requerido se estima en el codificador por medios de predicción.
- El grado de blanqueo espectral se controla variando el orden de predicción o variando el factor de expansión de anchura de banda del polinomio LPC, o mezclando la señal filtrada, hasta un grado dado, con la homóloga sin procesar.
- La capacidad de utilizar un banco de filtros de sub-banda consiguiendo factores de predicción de bajo orden, ofrece una implementación muy efectiva, especialmente en un sistema en el que el banco de filtros ya se utiliza para el ajuste de la envolvente.
- El grado de blanqueo espectral, selectivo de frecuencias se obtiene fácilmente dada la nueva implementación de banco de filtros de la presente invención.
Breve descripción de los dibujos
La presente invención será ahora descrita por medio de ejemplos ilustrativos pero no limitativos del alcance o espíritu de la invención, con referencia a los dibujos adjuntos en los que:
La figura 1 ilustra la expansión de anchura de banda de un espectro LPC;
La figura 2 ilustra el espectro absoluto de una señal original en el instante t_{0}, y en el instante t_{1};
La figura 3 ilustra el espectro absoluto de la salida en el instante t_{0} y en el instante t_{1} de una copia de un sistema HFR de la técnica anterior sin filtrado adaptativo;
La figura 4 ilustra el espectro absoluto de la salida, en el instante t_{0} y en el instante t_{1}, de una copia de un sistema HFR sin filtrado adaptativo, de acuerdo con la presente invención.
La figura 5a ilustra la señal del caso peor de acuerdo con la presente invención;
La figura 5b ilustra la autocorrelación para la banda alta y la banda baja de la señal del caso peor;
La figura 5c ilustra la relación q tonal a ruido para diferentes frecuencias, de acuerdo con la presente invención;
La figura 6 ilustra una implementación en dominio de tiempo del filtrado adaptativo en el decodificador, de acuerdo con la presente invención;
La figura 7 ilustra una implementación de banco de filtros de sub-banda del filtrado adaptativo en el decodificador, de acuerdo con la presente invención;
La figura 8 ilustra una implementación de codificador de la presente invención;
La figura 9 ilustra una implementación de decodificador de la presente invención.
Descripción de las realizaciones preferidas
Las realizaciones descritas a continuación son meramente ilustrativas de los principios de la presente invención para la mejora de sistemas de reconstrucción de altas frecuencias. Se entiende que las modificaciones y variaciones en las disposiciones y detalles descritos en este documento serán evidentes a aquellos expertos en la técnica. Se pretende, por ello, que se limite únicamente por el objeto las reivindicaciones de la inminente patente y no por los detalles específicos presentados por medio de la descripción y explicación de las realizaciones de este documen-
to.
Cuando se ajusta una envolvente espectral de una señal a una envolvente espectral dada, siempre se aplica una cierta cantidad de blanqueo espectral. Esto, ya que si la envolvente espectral basta transmitida se describe mediante H_{envRef}(Z)y la envolvente espectral del segmento de señal actual se describe mediante H_{envCur}(Z), la función de filtro aplicada es:
(1)W(z) = \frac{H_{envRef}(z)}{H_{envCur}(z)}
En la presente invención la resolución de frecuencia para H_{envRef}(Z) no es necesariamente la misma que para H_{envCur}(Z). La invención utiliza resolución de frecuencia adaptativa de H_{envCur}(Z) para el ajuste de la envolvente de señales HFR. El segmento de señal se filtra con la inversa de H_{envCur}(Z) con objeto de blanquear espectralmente la señal de acuerdo con la ecuación 1. Si H_{envCur}(Z) se obtiene utilizando predicción lineal, se puede describir de acuerdo con
(2)H_{envCur}(z) = \frac{G}{A(z)'}
donde
(3)A(z) = 1-\sum\limits^{p}\limits_{k=1}\alpha_{k}z^{-k}
es el polinomio obtenido utilizando el método de autocorrelación o el método de covarianza (Digital Processing of Spech Signals, Rabiner and Schafer, Prentice Hall, Inc., Englewood Cliffs, New Jersey 07632, y ISBN 0-13-213603-, Capítulo 8) y G es la ganancia. Dado esto, el grado de blanqueo espectral se puede controlar variando el orden del factor de predicción, es decir, limitando el orden del polinomio A(Z), limitando así la cantidad de estructura fina que se puede describir por H_{envCur}(Z), o aplicando un factor de expansión de anchura de banda al polinomio A(Z). La expansión de anchura de banda se define de acuerdo con lo siguiente; si el factor de expansión de anchura de banda es ñ, el polinomio A(Z) toma el valor de
(4)A(\rho z) = a_{0}z^{0}\rho^{0} + a_{1}z^{1}\rho^{1} + a_{2}z^{2}\rho^{2} + ... + a_{p}z^{p}\rho^{p}
Esto expande la anchura de banda de los formantes estimados por H_{envCur}(Z) según la figura 1. El filtro inverso en un instante dado es, así, según la presente invención, descrito como:
(5)H_{inv}(z,p,\rho) = \frac{1-\sum\limits^{p}\limits_{k=1}\alpha_{k}(z\rho)^{-k}}{G},
Donde P es el orden del factor de predicción y \rho es el factor de expansión de anchura de banda.
Los coeficientes \alpha_{k} pueden, según se mencionó anteriormente, obtenerse de diferentes maneras, por ejemplo con el método de autocorrelación o el método de covarianza. El factor G de ganancia también se puede fijar a uno si H_{inv} se utiliza antes de un ajuste de envolvente convencional. Es una práctica común añadir algún tipo de relajación a la estimación con objeto de garantizar la estabilidad del sistema. Cuando se utiliza el método de autocorrelación, esto se lleva a cabo fácilmente desplazando el retraso de valor cero del vector de correlación. Esto es equivalente a la adición de ruido blanco a un nivel constante a la señal utilizada para estimar A(Z). Los parámetros p y \rho se calculan con base en la información trasmitida desde el codificador.
Una expansión de anchura de banda alternativa se describe mediante:
(6)A_{b}(z) = 1 - b + b \cdot A(z)
Donde b es el factor de mezcla. Esto conduce al filtro adaptativo según:
(7)H_{inv}(z,p,b) = \frac{1 - b + b\cdot\left(1 - \sum\limits^{p}\limits_{k=1}\alpha_{k}(z)^{-k}\right)}{G}
Aquí es evidente que para b = 1 la ecuación 7 toma el valor de la ecuación 5 con \rho = 1, y para b = 0 la ecuación 7 toma el valor de un factor de ganancia constante no selectivo de la frecuencia.
La presente invención aumenta drásticamente el rendimiento de los sistemas HFR, con un coste de tasa de bits muy bajo, ya que la información en el grado de blanqueo que se va a utilizar en el decodificador puede ser transmitida muy eficientemente. Las figuras 2 a 4 describen el rendimiento de un sistema con la presente invención comparado con un sistema sin ésta, por medio de un espectro absoluto ilustrativo. En la figura 2 se muestra el espectro absoluto de la señal original en el instante t_{0} y en el instante t_{1}. Es evidente que el carácter tonal para la banda baja y la banda alta de la señal es similar en el instante t_{0}, mientras que estos difieren significativamente en el instante t_{1}. En la figura 3, se muestra la salida en el instante t_{0} y en el instante t_{1} de un sistema que utiliza una copia basada en HFR sin la presente invención. Aquí, no se aplica ningún blanqueo espectral dando el correcto carácter tonal en el instante t_{0} pero completamente incorrecto en el instante t_{1}. Esto provoca alteraciones muy molestas. Similares resultados podrían ser obtenidos para cualquier grado constante de blanqueo espectral, aunque las alteraciones podrían tener diferentes características y ocurrir en diferentes instantes. En la figura 4, se describe la salida en el instante t_{0} y en el instante t_{1} de un sistema que utiliza la presente invención. Aquí es evidente que la cantidad de blanqueo espectral varía con el tiempo, lo que resulta en una calidad de sonido muy superior a la de un sistema sin la presente invención.
El detector en el lado del codificador
En la presenten invención, se utiliza un detector en el lado del codificador para evaluar grado óptimo de blanqueo espectral (orden LPC, factor de expansión de anchura de banda y/o factor de mezcla) que se va a usar en el decodificador, con objeto de obtener una banda alta tan similar como sea posible a la original, dado el método HFR actualmente utilizado. Se pueden utilizar diferentes enfoques con objeto de obtener una estimación apropiada del grado de blanqueo espectral que se va a utilizar en el decodificador. En la descripción que sigue a continuación, se asume que el algoritmo HFR no altera sustancialmente la estructura tonal del espectro de banda baja durante la generación de altas frecuencias, es decir la banda alta generada tiene el mismo carácter tonal que la banda baja. Si tales asunciones no se pueden hacer, la detección siguiente se puede llevar a cabo utilizando un análisis por síntesis es decir llevando a cabo un HFR en la señal original en el codificador y hacer el estudio comparativo en las bandas altas de las dos señales, en vez de hacer un estudio comparativo en la banda baja y la banda alta de la señal original.
Un enfoque utiliza la autocorrelación para estimar la cantidad apropiada de blanqueo espectral. El detector estima las funciones de autocorrelación para el rango fuente (es decir el rango de frecuencias en el que se basará el HFR en el decodificador) y el rango objetivo (es decir el rango de frecuencias que van a ser reconstruidas en el decodificador). En la figura 5a, se describe una señal del caso peor, con series armónicas en la banda baja y ruido blanco en la banda alta. Las diferentes funciones de autocorrelación se muestran en la figura 5b. Aquí, es evidente que la banda baja está altamente correlacionada mientras que la banda alta no. La correlación máxima, para cualquier retraso mayor que un mínimo retraso se obtiene tanto para la banda alta como para la banda baja. El cociente de las dos se utiliza para calcular el grado óptimo de blanqueo espectral que se va a aplicar en el decodificador. Cuando se implementa la presente invención según se introdujo anteriormente, puede ser preferible utilizar FFT para el cálculo de la correlación. La autocorrelación de una secuencia X(n) se define por:
(8)r_{xx}(m) = FFT^{-1}(|X(k)|^{2}),
Donde
(9)X(k) = FFT(x(n)).
Ya que el objetivo es comparar la diferencia de la autocorrelación en la banda alta y la banda baja, el filtrado se puede hacer en el dominio de frecuencia. Esto conduce a:
1
Donde H_{Lp}(k) y H_{Hp}(k) son las transformadas de Fourier de las respuestas de impulsos de los filtros LP y HP.
Según lo anterior, las funciones de autocorrelación para la banda alta y banda baja se pueden calcular de acuerdo con:
2
El valor máximo, para un retraso mayor que un retraso mínimo, para cada véctor de autocorrelación se calcula como:
3
La cuota de las dos puede utilizarse por ejemplo para delimitar un factor de expansión de anchura de banda adecuado.
Lo anterior implica que sería beneficioso evaluar una medida general de la previsibilidad, es decir la relación tonal a ruido de una señal a una banda de frecuencias dada en un instante dado, con objeto de obtener un correcto nivel de filtrado inverso para una banda de frecuencias dadas en un instante dado. Esto se puede llevar a cabo utilizando el siguiente enfoque más refinado. Aquí se asume un banco de filtros de sub-banda, aunque debe entenderse sin embargo que la invención no está limitada a los mismos.
Una relación q tonal a ruido para cada sub-banda de un filtro de banda puede definirse utilizando predicción lineal en bloques de muestras de sub-banda. Un valor grande de q indica una gran cantidad de tonalidad, mientras que un valor pequeño de q indica que la señal es de tipo ruido en la correspondiente localización en frecuencia y en tiempo. El valor de q se puede obtener utilizando tanto el método de covarianza como el método de autocorrelación.
Para el método de covarianza, se pueden calcular eficazmente los coeficientes de predición lineal y el error de predicción para el bloque de señal de sub-banda [x(0), x(1), ... x(n-1)] utilizando la descomposición de Cholesky (Digital Processing of Speech Signals, Rabiner and Schafer Prentice may Inc. Engelwood Cliffs, New Jersey 07632, ISBN 0-13-213603-1, Capítulo 8). La relación q tonal a ruido está entonces definida por
(13)q = \frac{\Psi - E}{E},
Donde \Psi = |x(0)|^{2}+|x(1)|^{2}+ ... +|x(N-1)|^{2} es la energía del bloque de señal y E es la energía del bloque de predicción de error.
Para el método de autocorrelación, un enfoque más natural consiste en utilizar el algoritmo de Levinson-Durbin, [Digital Signal Processing, Principles, Algorithms and Applications, Third Edition, John G. Proakis, Dimitris G Manolakis Prentice Hall, International Editions, ISBN-0-13-394338-9, capítulo 11] donde q se define entonces de acuerdo con
(14)q = \left(\prod\limits^{p}_{i=1}(1-|K_{i}|^{2})\right)^{-1} - 1,
Donde K_{i} son los coeficientes de reflexión de la correspondiente estructura de filtro de red obtenida a partir del polinomio de predicción y p es el orden de predicción.
La relación entre los valores de banda alta y banda baja de q se utiliza entonces para ajustar el grado de blanqueo espectral de manera que la relación tonal a ruido de la banda alta reconstruida se aproxima a la de la banda alta original. Aquí es ventajoso controlar el grado de blanqueo utilizando el factor b de mezcla (ec.6).
Asumiendo que la relación tonal a ruido q = q_{H} se mide en la banda alta y que q = q_{L} \geq q_{H} se mide en la banda baja, una elección adecuada en el factor de blanqueo b viene dada por la fórmula:
(15)b = 1-\sqrt{\frac{q_{H}}{q_{L}}}.
Para verlo, un primer paso es rescribir la ec.6 en la forma
(16)A_{b}(z) = A(z) + (1-b)(1-A(z))
Esto muestra que si la señal utilizada para estimar A(Z) se filtra con el filtro A_{b}(z), la señal predecida se suprime mediante el factor de ganancia 1-b y el error de predicción se mantiene inalterado. Como la relación tonal a ruido es la relación de la señal cuadrática media predecida a error de predicción cuadrático medio, un valor de q anterior al filtrado se modifica a (1-b)^{2}q mediante la operación de filtrado. Aplicar esto a la señal de banda baja produce una señal con una relación tonal a ruido de (1-b)^{2}q_{L} y bajo la asunción de que el método HFR aplicado no altera la tonalidad, se alcanza exactamente el valor objetivo q_{H} en la banda alta si se escoge b de acuerdo con la ec.15.
Los valores de q basados en el orden de predicción p = 2 en cada sub-banda de un banco de filtros de 64 canales se describen en la figura 5c, para la señal de la figura 5a. Se alcanzan valores significativamente mayores para la parte armónica de la señal que para la parte ruidosa. La variabilidad de las estimaciones en la parte armónica se debe a la resolución de frecuencia elegida y al orden de predicción.
Blanqueo basado en LPC adaptativo en el dominio de tiempo
El filtrado adaptativo en el decodificador se puede hacer antes de, o después de la reconstrucción en altas frecuencias. Si el filtrado se lleva a cabo antes del HFR, se necesita considerar las características del método HFR utilizado. Cuando se lleva a cabo un filtrado adaptativo selectivo en frecuencias, el sistema debe deducir qué región de banda baja originará una cierta región de banda alta, con objeto de aplicar la correcta cantidad de blanqueo espectral a esta región de banda baja, antes de la unidad HFR. En el ejemplo siguiente, una implementación en dominio de tiempo de la presente invención, se introduce un blanqueo espectral adaptativo selectivo en frecuencias. Debería ser obvio para cualquier persona experta en la técnica que las implementaciones en dominio de tiempo de la presente invención no están limitadas a la implementación descrita más adelante.
Cuando se lleva a cabo el filtrado adaptativo en el dominio de tiempos, se prefiere la predicción lineal que utiliza el método de auto correlación. El método de autocorrelación requiere tomar ventanas del segmento de entrada utilizado para estimar los coeficientes \alpha_{k}, lo que no es el caso para el método de covarianza. El filtro utilizado para el blanqueo espectral de acuerdo con la presente invención es
(19)H_{inv}(z,p,\rho) = 1-\sum\limits^{p}\limits_{k=1}\alpha_{k}(z\rho)^{-k},
donde el factor G de ganancia (en la Ec.5) se fija 1. Cuando se lleva a cabo el blanqueo espectral adaptativo antes de la unidad HFR, se consigue una implementación efectiva, ya que el filtro adaptativo puede funcionar con una baja tasa de muestreo. Se toman ventanas de la señal de banda baja sobre una base adecuada de tiempos, con el orden de predicción y los factores de expansión de anchura de banda dados por el codificador, de acuerdo con la figura 6. En esta implementación actual de la presente invención, la señal es filtrada en pasa baja 601 y diezmada 602. La referencia 603 ilustra el filtro adaptativo. Se utiliza una ventana 606 para seleccionar el segmento de tiempo adecuado para la estimación del polinomio A(z), y se utiliza un 50% de solapamiento. La rutina LPC 607 extrae A(z) dados los valores actualmente preferidos de orden LPC y factor de expansión de anchura de banda, con una relajación adecuada. Se utiliza un filtro FIR 608 para filtrar adaptativamente el segmento de señal. Los segmentos de señal blanqueados espectralmente se sobremuestrean 604, 605 y se toman ventanas formando conjuntamente la señal de entrada a la unidad HFR.
Blanqueo basado en LPC adaptativo en un banco de filtros de sub-banda
El filtrado adaptativo se puede llevar a cabo de forma efectiva y robusta utilizando un banco de filtros. La predicción lineal y el filtrado se realizan independientemente para cada una de las señales de sub-bandas producidas por el banco de filtros. Es ventajoso utilizar un banco de filtros cuando se suprimen las componentes alias de las señales de sub-banda. Esto se puede conseguir, por ejemplo, sobremuestreando el banco de filtro. Aparecen alteraciones debidas a la formación de alias por modificaciones independientes de las señales de sub- banda, lo que por ejemplo, da como resultado el filtrado adaptativo, pueden verse entonces grandemente reducidas. El blanqueo espectral de las señales de sub-banda se obtiene a través de predicción lineal análoga al método en dominio de tiempos descrito anteriormente. Si las señales de sub-bandas tienen valores complejos, se utilizan coeficientes de filtro complejos para la predicción lineal así como para el filtrado. El orden de la predicción lineal se puede mantener muy bajo, ya que el número esperado de componentes tonales en cada banda de frecuencias es muy pequeño para un sistema de una cantidad razonable de canales de banco de filtro. Con objeto de corresponder a la misma base de tiempo que el dominio de tiempos LPC, el número de muestras de sub-banda en cada bloque es menor en un factor igual a la reducción de muestreo del banco de filtros. Dado el bajo orden de filtro y los pequeños tamaños de bloque, los coeficientes de predicción de filtro se obtienen preferiblemente utilizando el método de covarianza. El cálculo del coeficiente de filtro y el blanqueo espectral se puede llevar a cabo sobre una base bloque a bloque utilizando un intervalo de tiempo L de muestra de sub-banda, que es menor que la longitud N del bloque. Los bloques blanqueados espectralmente deben sumarse entre sí utilizando una síntesis adecuada por toma de ventanas.
Alimentar un banco de filtros máximamente diezmado con un señal de entrada que consiste en ruido blanco gaussiano producirá señales de sub-banda con densidad espectral blanca. Alimentar un banco de filtro sobremuestreado con ruido blanco proporciona señales de sub-banda con densidad espectral coloreada. Esto se debe a los efectos de la respuesta en frecuencias de los filtros de análisis. Los aparatos de predicción LPC en los canales del banco de filtros trazarán las características de filtro en el caso de señales de entrada similares a ruido. Esta es una característica no deseada, y se beneficia de la compensación. Una posible solución es prefiltrar las señales de entrada con los aparatos de predicción lineal. El prefiltrado debería de ser la inversa o una aproximación a la inversa, de los filtros de análisis, con objeto de compensar la respuesta en frecuencia de los filtros de análisis. Los filtros de blanqueo se alimentan con las señales originales de sub-banda, según se describe anteriormente. La figura 7 ilustra el proceso de blanqueo de una señal de sub- banda. La señal de sub-banda correspondiente al canal l alimenta el bloque 701 de prefiltrado y subsiguientemente una cadena de retardos en la que profundidad de la misma depende del orden 702 de filtro. Las señales retrasadas y sus conjugados 703 alimentan el bloque 704 de predicción lineal, donde se calculan los coeficientes. Los coeficientes de cada cálculo L-ésimo se guardan en el diezmador 705. Las señales de sub-banda se filtran finalmente a través del bloque 706 de filtros, donde se utilizan los coeficientes predecidos y se actualizan para cada muestra L-ésima.
Implementaciones prácticas
La presente invención se puede implementar tanto en chips de equipo físico y DSP, para varios tipos de sistemas, para almacenamiento o transmisión de señales, analógicas o digitales utilizando códecs arbitrarios. Las figuras 8 y 9 muestran una posible implementación de la presente invención. En la figura 8 se muestra el lado del codificador. La señal analógica de entrada alimenta al conversor A/D 801 y a un codificador arbitrario de audio, 802, así como a la unidad 803 de estimación del nivel de filtrado inverso y a una unidad 804 de extracción de envolvente. La información codificada se multiplexa en una cadena de bits (unidades lógicas) en serie 805 y se transmite o almacena. En la figura 9 se muestra una implementación típica de decodificador. La cadena de bits en serie se desmultiplexa, 901 y se descodifican los datos de la envolvente, 902, es decir, la envolvente espectral de la banda alta. La fuente desmultiplexada de señal codificada se decodifica utilizando un decodificador arbitrario de audio, 903. La señal de codificada alimenta una unidad arbitraria HFR, 904, donde se regenera una banda alta. La señal de banda alta alimenta la unidad 905 de blanqueo espectral, que lleva a cabo el blanqueo espectral adaptativo. Subsiguientemente, la señal alimenta el ajustador 906 de envolvente. La salida del ajustador de envolvente se combina con la señal decodificada alimentada a través de un retardo, 907. Finalmente la salida digital se convierte de nuevo a una forma de onda analógica 908.

Claims (19)

1. Aparato para estimar un nivel de blanqueo espectral que debe ser aplicado a una señal antes de una etapa de regeneración de altas frecuencias o después de la etapa de regeneración de altas frecuencias que se va a llevar a cabo cuando se genera una señal regenerada en altas frecuencias que tiene una banda alta que se basa en una señal de banda baja, en el cual el blanqueo espectral se obtiene filtrando utilizando un filtro de blanqueo espectral, siendo el filtro de blanqueo espectral un filtro adaptativo que es adaptable por medio de un parámetro de filtro, comprendiendo el aparato:
- Medios (803) para estimar un carácter tonal de una señal de audio original que va a ser codificada, en un instante dado, en el cual la señal original de audio se va a codificar mediante un codificador de audio para obtener una señal de audio codificada que representa únicamente una banda baja de la señal de audio original, incluyendo el carácter tonal estimado un carácter tonal estimado de una banda ancha de la señal original de audio, que no está incluida en la señal codificada de audio;
- Medios (803) para determinar un parámetro de filtro variable del filtro de blanqueo espectral basado en el carácter tonal estimado; y
- Medios (805) para asociar el parámetro de filtro variable a la señal de audio codificada para obtener una cadena de bits que tiene codificada la señal de audio, teniendo el parámetro de filtro variable, siendo el parámetro de filtro variable dependiente de la señal codificada de audio.
2. Aparato según la reivindicación 1 en el que la etapa de regeneración de altas frecuencias es tal que no altera sustancialmente una estructura tonal de la banda baja, en la cual los medios para estimar se disponen de manera tal que además del carácter tonal de la banda alta, también se determina un carácter tonal de la banda baja, y en el cual los medios para determinar están dispuestos para comparar el carácter tonal de la banda alta y el carácter tonal de la banda baja para determinar el parámetro de filtro.
3. Aparato según la reivindicación 1 que comprende adicionalmente:
- Medios para llevar a cabo la etapa de regeneración de altas frecuencias en la banda baja de la señal original de audio para obtener la señal regenerada de altas frecuencias;
- Medios para estimar un carácter tonal de la señal de alta frecuencia regenerada, y
En el que los medios para determinar están dispuestos para comparar la señal de alta frecuencia regenerada y la banda alta de la señal original de audio para determinar el parámetro de filtro.
4. Aparato según la reivindicación 1, en el cual la estimación del carácter tonal de la señal original se realiza para diferentes regiones de frecuencia.
5. Aparato según la reivindicación 1, en el cual la estimación de la cantidad requerida de blanqueo espectral se realiza para diferentes regiones de frecuencia.
6. Aparato según la reivindicación 1, en el cual el blanqueo espectral se lleva a cabo en el dominio de tiempos.
7. Aparato según la reivindicación 1 en el cual el blanqueo espectral se lleva a cabo en un banco de filtros de sub-banda.
8. Aparato según la reivindicación 1, en el cual la estimación de la cantidad de blanqueo espectral requerida se realiza por comparación de las relaciones tono a ruido de señal de diferentes señales de sub-banda obtenidas por filtrado de sub-banda de la señal original, en el cual las relaciones se obtienen utilizando predicción lineal de las señales de sub-banda.
9. Aparato según la reivindicación 1, en el cual la estimación de la cantidad requerida de blanqueo espectral se realiza por comparación de las relaciones tonal a ruido de señal de diferentes señales de sub-banda obtenidas por filtrado de sub-banda de la señal original y una señal reconstituida de alta frecuencia en la cual las relaciones se obtienen utilizando predicción lineal de las señales de sub-banda, y la señal reconstruida de alta frecuencia se produce de la misma manera que una señal reconstruida de alta frecuencia en un decodificador.
10. Aparato según la reivindicación 1, en el que el filtro de blanqueo espectral es un filtro que tiene coeficientes de filtro obtenidos mediante predicción lineal para obtener un polinomio LPC y en el cual el parámetro de filtro indica un orden de predicción del polinomio LPC, un factor de expansión de anchura de banda del polinomio LPC, o un factor de mezcla que indica una cantidad de mezcla de una señal filtrada y una parte complementaria sin procesar.
11. Aparato para producir una señal de salida basada en una versión decodificada de una señal codificada de audio que representa una banda baja de una señal original de audio, teniendo asociada a esta señal codificada de audio un parámetro de filtro variable para un filtro de blanqueo espectral, dependiendo el parámetro de filtro variable de una característica tonal de una banda alta de la señal original de audio en un instante dado, comprendiendo el aparato:
- Medios (901) para obtener los parámetros de filtro variable asociados a la señal de audio codificada;
- Una unidad (904) de regeneración de altas frecuencias para llevar a cabo una etapa de regeneración de altas frecuencias en una versión decodificada de la señal codificada de audio para producir una señal regenerada en altas frecuencias; y
- Un filtro (905) de blanqueo espectral adaptativo para filtrar la versión decodificada de una señal regenerada en altas frecuencias;
En el cual el filtro de blanqueo espectral adaptativo tiene un parámetro variable, estando fijado el parámetro variable de acuerdo con el parámetro de filtro variable asociado con la señal codificada de audio.
12. Aparato según la reivindicación 11, en el cual se incluye un prefiltrado en una estimación de codificación predictiva lineal con objeto de compensar las características de los filtros de análisis del banco de filtros.
13. Aparato de acuerdo con la reivindicación 11, en el cual el filtro de blanqueo espectral adaptativo comprende:
- Medios (606) para tomar ventanas de la señal que se va a filtrar;
- Medios LPC (607) para obtener un polinomio LPC normal de una señal de ventanas, siendo responsables los medios LPC de un orden LPC y un factor de expansión de anchura de banda como parámetros de filtro variable para un instante dado, y
- Un filtro FIR para filtrar la señal que se va a filtrar, estando el filtro FIR fijado por el polinomio LPC obtenido por los medios LPC.
14. Método para estimar un nivel de blanqueo espectral que se va aplicar a una señal antes de una etapa de regeneración de altas frecuencias o después de la etapa de regeneración de altas frecuencias que se va a llevar a cabo cuando se genera una señal regenerada en altas frecuencias que tiene una banda alta que se basa en una señal de banda baja, en la cual el blanqueo espectral se obtiene filtrando utilizando un filtro de blanqueo espectral, siendo el filtro de blanqueo espectral un filtro adaptativo que es adaptable por medio de un parámetro de filtro, comprendiendo el método las siguientes etapas:
- Estimar un carácter tonal de una señal original de audio que se va a codificar, en un instante dado, en el cual la señal original de audio va a ser codificada por un codificador de audio para obtener una señal codificada de audio que representa únicamente una banda baja de la señal original de audio, incluyendo un carácter tonal estimado en una banda alta de la señal original de audio, que no está incluido en la señal codificada de audio;
- Determinar un parámetro de filtro variable del filtro de blanqueo espectral basado en el carácter tonal estimado; y
- Asociar el parámetro de filtro variable de la señal codificada de audio para obtener una cadena de bits que tiene la señal codificada de audio que tiene el parámetro de filtro variable, siendo el parámetro de filtro variable dependiente de la señal codificada de audio.
15. Método para producir una señal de salida basada en una versión decodificada de una señal codificada de audio que representa una banda baja de una señal original de audio, teniendo la señal codificada de audio asociada a esta un parámetro de filtro variable para un filtro de blanqueo espectral, dependiendo el parámetro de filtro variable de un carácter tonal de una banda alta de la señal original de audio en un instante dado, comprendiendo el método las siguientes etapas:
- Obtener el parámetro de filtro variable asociado a la señal codificada de audio;
- Llevar a cabo una etapa de regeneración de alta frecuencia en una versión decodificada de la señal codificada de audio para producir una señal regenerada en altas frecuencias; y
- Un filtro (905) de blanqueo espectral adaptativo para filtrar la versión decodificada o la señal regenerada en altas frecuencias utilizando un filtro (905) de blanqueo espectral adaptativo;
En el cual el filtro de blanqueo espectral adaptativo tiene un parámetro variable, siendo el parámetro variable fijado de acuerdo con el parámetro de filtro variable asociado a la señal codificada de audio.
16. Codificador para codificar una señal original de audio para obtener una versión codificada de la misma, que comprende:
- Un aparato para estimar un nivel de blanqueo espectral de acuerdo con la reivindicación 1;
- Un codificador (802) de audio para codificar la señal original de audio para obtener la versión codificada de la misma;
- Medios (804) para estimar una envolvente espectral de la señal original de audio para obtener una envolvente espectral estimada; y
- Un múltiplexor (805) para multiplexar la versión codificada de la señal original de audio, el parámetro de filtro del filtro de blanqueo espectral y la envolvente espectral estimada para obtener una cadena de bits.
17. Decodificador para decodificar una cadena de bits que incluye una versión codificada de una señal original de audio, una envolvente espectral estimada y un parámetro de filtro que se va a aplicar a un filtro de blanqueo espectral, comprendiendo el decodificador:
- Un desmultiplexor (901) de cadena de bits para extraer la versión codificada de la señal original de audio, la envolvente espectral estimada y el parámetro de filtro;
- Un decodificador (903) de audio para decodificar la versión codificada de la señal original de audio para obtener una señal de banda baja;
- Un decodificador de envolvente para decodificar la envolvente espectral estimada;
- Un aparato para producir una señal de salida de acuerdo con la reivindicación 11, y
- Un sumador para sumar una señal regenerada en altas frecuencias blanqueada espectralmente de forma adaptativa y una versión retardada de la señal decodificada de audio para obtener una señal de salida de banda ancha.
18. Método para modificar una señal original de audio para obtener una versión codificada de la misma, que comprende las siguientes etapas:
- Estimar un nivel de blanqueo espectral de acuerdo con la reivindicación 14;
- Codificar (802) la señal original de audio para obtener la versión codificada de la misma;
- Estimar (804) una envolvente espectral de la señal original de audio para obtener una envolvente espectral estimada; y
- Multiplexar (805) la versión codificada de la señal original de audio, el parámetro de filtro del filtro de blanqueo espectral y la envolvente espectral estimada para obtener una cadena de bits.
19. El método para decodificar una cadena de bits que incluye una versión codificada de una señal original de audio, una envolvente espectral estimada y un parámetro de filtro que se va a aplicar a un filtro de blanqueo espectral, comprendiendo el método:
- Extraer (901) la versión codificada de la señal original de audio, la envolvente espectral estimada y el parámetro de filtro;
- Decodificar (903) la versión codificada de la señal original de audio para obtener una señal de banda baja;
- Decodificar la envolvente espectral estimada; y
- Producir una señal de salida de acuerdo con la reivindicación 15; y
- Sumar una señal regenerada en altas frecuencias blanqueda espectralmente de manera adaptativa y una versión retardada de la señal decodificada de audio para obtener una señal de salida de banda ancha.
ES01983041T 2000-11-14 2001-11-13 Realizacion perceptual mejorada de metodos de codificacion de reconstruccion de altas frecuencias por filtrado adaptativo. Expired - Lifetime ES2215935T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
SE0004163A SE0004163D0 (sv) 2000-11-14 2000-11-14 Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering
SE0004163 2000-11-14

Publications (1)

Publication Number Publication Date
ES2215935T3 true ES2215935T3 (es) 2004-10-16

Family

ID=20281813

Family Applications (1)

Application Number Title Priority Date Filing Date
ES01983041T Expired - Lifetime ES2215935T3 (es) 2000-11-14 2001-11-13 Realizacion perceptual mejorada de metodos de codificacion de reconstruccion de altas frecuencias por filtrado adaptativo.

Country Status (14)

Country Link
US (2) US7003451B2 (es)
EP (1) EP1342230B1 (es)
JP (2) JP3954495B2 (es)
KR (1) KR100517229B1 (es)
CN (2) CN1267890C (es)
AT (1) ATE264533T1 (es)
AU (1) AU2002214496A1 (es)
DE (1) DE60102838T2 (es)
DK (1) DK1342230T3 (es)
ES (1) ES2215935T3 (es)
HK (1) HK1056429A1 (es)
PT (1) PT1342230E (es)
SE (1) SE0004163D0 (es)
WO (1) WO2002041301A1 (es)

Families Citing this family (100)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7742927B2 (en) * 2000-04-18 2010-06-22 France Telecom Spectral enhancing method and device
SE0004163D0 (sv) * 2000-11-14 2000-11-14 Coding Technologies Sweden Ab Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
US20030108108A1 (en) * 2001-11-15 2003-06-12 Takashi Katayama Decoder, decoding method, and program distribution medium therefor
WO2003046891A1 (en) * 2001-11-29 2003-06-05 Coding Technologies Ab Methods for improving high frequency reconstruction
US20030187663A1 (en) * 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
JP4296752B2 (ja) 2002-05-07 2009-07-15 ソニー株式会社 符号化方法及び装置、復号方法及び装置、並びにプログラム
KR100462615B1 (ko) * 2002-07-11 2004-12-20 삼성전자주식회사 적은 계산량으로 고주파수 성분을 복원하는 오디오 디코딩방법 및 장치
US7555434B2 (en) * 2002-07-19 2009-06-30 Nec Corporation Audio decoding device, decoding method, and program
SE0202770D0 (sv) * 2002-09-18 2002-09-18 Coding Technologies Sweden Ab Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks
BRPI0306434B1 (pt) 2002-09-19 2018-06-12 Nec Corporation Aparelho e método de decodificação de áudio
KR100917464B1 (ko) * 2003-03-07 2009-09-14 삼성전자주식회사 대역 확장 기법을 이용한 디지털 데이터의 부호화 방법,그 장치, 복호화 방법 및 그 장치
US7844451B2 (en) * 2003-09-16 2010-11-30 Panasonic Corporation Spectrum coding/decoding apparatus and method for reducing distortion of two band spectrums
DE602004032587D1 (de) * 2003-09-16 2011-06-16 Panasonic Corp Codierungsvorrichtung und Decodierungsvorrichtung
EP1675908B1 (en) * 2003-10-07 2008-12-17 Coloplast A/S Composition useful as an adhesive ans use of such a composition
US7668711B2 (en) * 2004-04-23 2010-02-23 Panasonic Corporation Coding equipment
KR100608062B1 (ko) * 2004-08-04 2006-08-02 삼성전자주식회사 오디오 데이터의 고주파수 복원 방법 및 그 장치
WO2006090852A1 (ja) * 2005-02-24 2006-08-31 Matsushita Electric Industrial Co., Ltd. データ再生装置
KR100956877B1 (ko) * 2005-04-01 2010-05-11 콸콤 인코포레이티드 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 방법 및장치
PT1875463T (pt) 2005-04-22 2019-01-24 Qualcomm Inc Sistemas, métodos e aparelho para nivelamento de fator de ganho
US7548853B2 (en) * 2005-06-17 2009-06-16 Shmunk Dmitry V Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding
EP1742509B1 (en) * 2005-07-08 2013-08-14 Oticon A/S A system and method for eliminating feedback and noise in a hearing device
US8050915B2 (en) * 2005-07-11 2011-11-01 Lg Electronics Inc. Apparatus and method of encoding and decoding audio signals using hierarchical block switching and linear prediction coding
BRPI0616624A2 (pt) * 2005-09-30 2011-06-28 Matsushita Electric Ind Co Ltd aparelho de codificação de fala e método de codificação de fala
EP1989703A4 (en) * 2006-01-18 2012-03-14 Lg Electronics Inc DEVICE AND METHOD FOR CODING AND DECODING A SIGNAL
EP1827002A1 (en) * 2006-02-22 2007-08-29 Alcatel Lucent Method of controlling an adaptation of a filter
US7590523B2 (en) * 2006-03-20 2009-09-15 Mindspeed Technologies, Inc. Speech post-processing using MDCT coefficients
EP1852849A1 (en) * 2006-05-05 2007-11-07 Deutsche Thomson-Brandt Gmbh Method and apparatus for lossless encoding of a source signal, using a lossy encoded data stream and a lossless extension data stream
EP1852848A1 (en) * 2006-05-05 2007-11-07 Deutsche Thomson-Brandt GmbH Method and apparatus for lossless encoding of a source signal using a lossy encoded data stream and a lossless extension data stream
US8010352B2 (en) 2006-06-21 2011-08-30 Samsung Electronics Co., Ltd. Method and apparatus for adaptively encoding and decoding high frequency band
KR101390188B1 (ko) * 2006-06-21 2014-04-30 삼성전자주식회사 적응적 고주파수영역 부호화 및 복호화 방법 및 장치
US9159333B2 (en) 2006-06-21 2015-10-13 Samsung Electronics Co., Ltd. Method and apparatus for adaptively encoding and decoding high frequency band
US20080109215A1 (en) * 2006-06-26 2008-05-08 Chi-Min Liu High frequency reconstruction by linear extrapolation
US8077821B2 (en) * 2006-09-25 2011-12-13 Zoran Corporation Optimized timing recovery device and method using linear predictor
US20100017197A1 (en) * 2006-11-02 2010-01-21 Panasonic Corporation Voice coding device, voice decoding device and their methods
FR2911031B1 (fr) * 2006-12-28 2009-04-10 Actimagine Soc Par Actions Sim Procede et dispositif de codage audio
FR2911020B1 (fr) * 2006-12-28 2009-05-01 Actimagine Soc Par Actions Sim Procede et dispositif de codage audio
DE102007003187A1 (de) 2007-01-22 2008-10-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines zu sendenden Signals oder eines decodierten Signals
KR101355376B1 (ko) * 2007-04-30 2014-01-23 삼성전자주식회사 고주파수 영역 부호화 및 복호화 방법 및 장치
ES2403410T3 (es) * 2007-08-27 2013-05-17 Telefonaktiebolaget L M Ericsson (Publ) Frecuencia de transición adaptativa entre el rellenado con ruido y la extensión del ancho de banda
US9177569B2 (en) 2007-10-30 2015-11-03 Samsung Electronics Co., Ltd. Apparatus, medium and method to encode and decode high frequency signal
KR101373004B1 (ko) * 2007-10-30 2014-03-26 삼성전자주식회사 고주파수 신호 부호화 및 복호화 장치 및 방법
KR100970446B1 (ko) * 2007-11-21 2010-07-16 한국전자통신연구원 주파수 확장을 위한 가변 잡음레벨 결정 장치 및 그 방법
EP2077550B8 (en) * 2008-01-04 2012-03-14 Dolby International AB Audio encoder and decoder
EP2242046A4 (en) * 2008-01-11 2013-10-30 Nec Corp SYSTEM, APPARATUS, METHOD AND PROGRAM FOR CONTROL OF SIGNAL ANALYSIS, SIGNAL ANALYSIS AND SIGNAL CONTROL
US8665914B2 (en) 2008-03-14 2014-03-04 Nec Corporation Signal analysis/control system and method, signal control apparatus and method, and program
US8374854B2 (en) * 2008-03-28 2013-02-12 Southern Methodist University Spatio-temporal speech enhancement technique based on generalized eigenvalue decomposition
JP5773124B2 (ja) * 2008-04-21 2015-09-02 日本電気株式会社 信号分析制御及び信号制御のシステム、装置、方法及びプログラム
KR101239812B1 (ko) * 2008-07-11 2013-03-06 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 대역폭 확장 신호를 생성하기 위한 장치 및 방법
US8880410B2 (en) * 2008-07-11 2014-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating a bandwidth extended signal
USRE47180E1 (en) 2008-07-11 2018-12-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating a bandwidth extended signal
KR101225556B1 (ko) * 2008-08-25 2013-01-23 돌비 레버러토리즈 라이쎈싱 코오포레이션 프리-화이트닝을 사용한 lms 알고리즘에 의해 적응된 적응형 필터의 갱신된 필터 계수를 결정하기 위한 방법
US8407046B2 (en) * 2008-09-06 2013-03-26 Huawei Technologies Co., Ltd. Noise-feedback for spectral envelope quantization
US8532983B2 (en) * 2008-09-06 2013-09-10 Huawei Technologies Co., Ltd. Adaptive frequency prediction for encoding or decoding an audio signal
US8532998B2 (en) 2008-09-06 2013-09-10 Huawei Technologies Co., Ltd. Selective bandwidth extension for encoding/decoding audio/speech signal
WO2010028301A1 (en) * 2008-09-06 2010-03-11 GH Innovation, Inc. Spectrum harmonic/noise sharpness control
WO2010031003A1 (en) * 2008-09-15 2010-03-18 Huawei Technologies Co., Ltd. Adding second enhancement layer to celp based core layer
US8577673B2 (en) * 2008-09-15 2013-11-05 Huawei Technologies Co., Ltd. CELP post-processing for music signals
GB0822537D0 (en) 2008-12-10 2009-01-14 Skype Ltd Regeneration of wideband speech
GB2466201B (en) * 2008-12-10 2012-07-11 Skype Ltd Regeneration of wideband speech
US9947340B2 (en) * 2008-12-10 2018-04-17 Skype Regeneration of wideband speech
WO2010070770A1 (ja) * 2008-12-19 2010-06-24 富士通株式会社 音声帯域拡張装置及び音声帯域拡張方法
EP2380172B1 (en) 2009-01-16 2013-07-24 Dolby International AB Cross product enhanced harmonic transposition
BR122019023924B1 (pt) 2009-03-17 2021-06-01 Dolby International Ab Sistema codificador, sistema decodificador, método para codificar um sinal estéreo para um sinal de fluxo de bits e método para decodificar um sinal de fluxo de bits para um sinal estéreo
US11657788B2 (en) 2009-05-27 2023-05-23 Dolby International Ab Efficient combined harmonic transposition
TWI675367B (zh) * 2009-05-27 2019-10-21 瑞典商杜比國際公司 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體
WO2011001578A1 (ja) * 2009-06-29 2011-01-06 パナソニック株式会社 通信装置
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
JP5771618B2 (ja) 2009-10-19 2015-09-02 ドルビー・インターナショナル・アーベー 音声オブジェクトの区分を示すメタデータ時間標識情報
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
US9117459B2 (en) * 2010-07-19 2015-08-25 Dolby International Ab Processing of audio signals during high frequency reconstruction
US9047875B2 (en) 2010-07-19 2015-06-02 Futurewei Technologies, Inc. Spectrum flatness control for bandwidth extension
US12002476B2 (en) 2010-07-19 2024-06-04 Dolby International Ab Processing of audio signals during high frequency reconstruction
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
CA3220202A1 (en) 2010-09-16 2012-03-22 Dolby International Ab Cross product enhanced subband block based harmonic transposition
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
CN103548077B (zh) 2011-05-19 2016-02-10 杜比实验室特许公司 参数化音频编译码方案的取证检测
CN103918029B (zh) 2011-11-11 2016-01-20 杜比国际公司 使用过采样谱带复制的上采样
CN103366751B (zh) * 2012-03-28 2015-10-14 北京天籁传音数字技术有限公司 一种声音编解码装置及其方法
CN103366749B (zh) * 2012-03-28 2016-01-27 北京天籁传音数字技术有限公司 一种声音编解码装置及其方法
EP2682941A1 (de) * 2012-07-02 2014-01-08 Technische Universität Ilmenau Vorrichtung, Verfahren und Computerprogramm für frei wählbare Frequenzverschiebungen in der Subband-Domäne
BR112015017632B1 (pt) * 2013-01-29 2022-06-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V. Aparelho e método para gerar um sinal melhorado da frequência utilizando nivelamento temporal de sub-bandas
US9881624B2 (en) 2013-05-15 2018-01-30 Samsung Electronics Co., Ltd. Method and device for encoding and decoding audio signal
EP2830061A1 (en) 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
KR101406748B1 (ko) * 2013-08-13 2014-06-17 한국광성전자 주식회사 디지털 오디오 음질 개선 장치
US9666202B2 (en) 2013-09-10 2017-05-30 Huawei Technologies Co., Ltd. Adaptive bandwidth extension and apparatus for the same
US9875746B2 (en) 2013-09-19 2018-01-23 Sony Corporation Encoding device and method, decoding device and method, and program
KR102064890B1 (ko) * 2013-10-22 2020-02-11 삼성전자 주식회사 내부 및 외부 메모리를 선택적으로 사용하는 harq 데이터 처리 장치 및 그 처리 방법
US9293143B2 (en) * 2013-12-11 2016-03-22 Qualcomm Incorporated Bandwidth extension mode selection
CA3162763A1 (en) 2013-12-27 2015-07-02 Sony Corporation Decoding apparatus and method, and program
US20150194157A1 (en) * 2014-01-06 2015-07-09 Nvidia Corporation System, method, and computer program product for artifact reduction in high-frequency regeneration audio signals
CN111312277B (zh) 2014-03-03 2023-08-15 三星电子株式会社 用于带宽扩展的高频解码的方法及设备
EP3913628A1 (en) 2014-03-24 2021-11-24 Samsung Electronics Co., Ltd. High-band encoding method
WO2016167216A1 (ja) * 2015-04-13 2016-10-20 日本電信電話株式会社 マッチング装置、判定装置、これらの方法、プログラム及び記録媒体
JP6611042B2 (ja) * 2015-12-02 2019-11-27 パナソニックIpマネジメント株式会社 音声信号復号装置及び音声信号復号方法
US10825467B2 (en) * 2017-04-21 2020-11-03 Qualcomm Incorporated Non-harmonic speech detection and bandwidth extension in a multi-source environment
JP7214726B2 (ja) * 2017-10-27 2023-01-30 フラウンホッファー-ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ ニューラルネットワークプロセッサを用いた帯域幅が拡張されたオーディオ信号を生成するための装置、方法またはコンピュータプログラム
TWI834582B (zh) 2018-01-26 2024-03-01 瑞典商都比國際公司 用於執行一音訊信號之高頻重建之方法、音訊處理單元及非暫時性電腦可讀媒體
CN108630212B (zh) * 2018-04-03 2021-05-07 湖南商学院 非盲带宽扩展中高频激励信号的感知重建方法与装置

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4361875A (en) * 1980-06-23 1982-11-30 Bell Telephone Laboratories, Incorporated Multiple tone detector and locator
DE3587251T2 (de) * 1984-12-20 1993-07-15 Gte Laboratories Inc Anpassbares verfahren und vorrichtung fuer sprachkodierung.
US4776014A (en) * 1986-09-02 1988-10-04 General Electric Company Method for pitch-aligned high-frequency regeneration in RELP vocoders
US5127054A (en) * 1988-04-29 1992-06-30 Motorola, Inc. Speech quality improvement for voice coders and synthesizers
ES2164640T3 (es) * 1991-08-02 2002-03-01 Sony Corp Codificador digital con asignacion dinamica de bits de cuantificacion.
JP3144009B2 (ja) * 1991-12-24 2001-03-07 日本電気株式会社 音声符号復号化装置
US5347611A (en) * 1992-01-17 1994-09-13 Telogy Networks Inc. Apparatus and method for transparent tone passing over narrowband digital channels
GB2281680B (en) * 1993-08-27 1998-08-26 Motorola Inc A voice activity detector for an echo suppressor and an echo suppressor
US5915235A (en) * 1995-04-28 1999-06-22 Dejaco; Andrew P. Adaptive equalizer preprocessor for mobile telephone speech coder to modify nonideal frequency response of acoustic transducer
US5822360A (en) * 1995-09-06 1998-10-13 Solana Technology Development Corporation Method and apparatus for transporting auxiliary data in audio signals
US6035177A (en) * 1996-02-26 2000-03-07 Donald W. Moses Simultaneous transmission of ancillary and audio signals by means of perceptual coding
US5812971A (en) * 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping
US5995561A (en) * 1996-04-10 1999-11-30 Silicon Systems, Inc. Method and apparatus for reducing noise correlation in a partial response channel
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
SE9903553D0 (sv) * 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
US6249762B1 (en) * 1999-04-01 2001-06-19 The United States Of America As Represented By The Secretary Of The Navy Method for separation of data into narrowband and broadband time series components
US6574593B1 (en) * 1999-09-22 2003-06-03 Conexant Systems, Inc. Codebook tables for encoding and decoding
KR100675309B1 (ko) * 1999-11-16 2007-01-29 코닌클리케 필립스 일렉트로닉스 엔.브이. 광대역 오디오 송신 시스템, 송신기, 수신기, 코딩 디바이스, 디코딩 디바이스와, 송신 시스템에서 사용하기 위한 코딩 방법 및 디코딩 방법
SE0004163D0 (sv) * 2000-11-14 2000-11-14 Coding Technologies Sweden Ab Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering
JP4067762B2 (ja) * 2000-12-28 2008-03-26 ヤマハ株式会社 歌唱合成装置

Also Published As

Publication number Publication date
DE60102838T2 (de) 2005-04-21
EP1342230B1 (en) 2004-04-14
KR100517229B1 (ko) 2005-09-27
WO2002041301A1 (en) 2002-05-23
CN1267890C (zh) 2006-08-02
JP2004514179A (ja) 2004-05-13
DE60102838D1 (de) 2004-05-19
HK1056429A1 (en) 2004-02-13
PT1342230E (pt) 2004-09-30
US20060036432A1 (en) 2006-02-16
ATE264533T1 (de) 2004-04-15
AU2002214496A1 (en) 2002-05-27
CN1481545A (zh) 2004-03-10
KR20030062338A (ko) 2003-07-23
US20020087304A1 (en) 2002-07-04
US7433817B2 (en) 2008-10-07
SE0004163D0 (sv) 2000-11-14
EP1342230A1 (en) 2003-09-10
CN1766993A (zh) 2006-05-03
JP3954495B2 (ja) 2007-08-08
CN1766993B (zh) 2011-07-27
JP2006079106A (ja) 2006-03-23
US7003451B2 (en) 2006-02-21
DK1342230T3 (da) 2004-08-02

Similar Documents

Publication Publication Date Title
ES2215935T3 (es) Realizacion perceptual mejorada de metodos de codificacion de reconstruccion de altas frecuencias por filtrado adaptativo.
JP4220461B2 (ja) 時間的に離散した音声信号のアップサンプリングした信号を発生する方法と装置
US9818418B2 (en) High frequency regeneration of an audio signal with synthetic sinusoid addition
KR101376762B1 (ko) 디코더 및 대응 디바이스에서 디지털 신호의 반향들의 안전한 구별과 감쇠를 위한 방법
ES2796552T3 (es) Sintetizador de señales de audio y codificador de señales de audio
KR100723753B1 (ko) 스펙트럼 대역 복사에 의한 오디오 디코딩 장치 및 오디오디코딩 방법
RU2419171C2 (ru) Способ переключения скорости передачи битов при аудиодекодировании с масштабированием скорости передачи битов и масштабированием полосы пропускания
JP3557674B2 (ja) 高能率符号化方法及び装置
JP2004053940A (ja) オーディオ復号化装置およびオーディオ復号化方法