ES2565959T3 - Método de extensión del ancho de banda, aparato de extensión del ancho de banda, programa, circuito integrado y aparato de decodificación de audio - Google Patents

Método de extensión del ancho de banda, aparato de extensión del ancho de banda, programa, circuito integrado y aparato de decodificación de audio Download PDF

Info

Publication number
ES2565959T3
ES2565959T3 ES11792129.6T ES11792129T ES2565959T3 ES 2565959 T3 ES2565959 T3 ES 2565959T3 ES 11792129 T ES11792129 T ES 11792129T ES 2565959 T3 ES2565959 T3 ES 2565959T3
Authority
ES
Spain
Prior art keywords
qmf
spectrum
bandwidth
frequency
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES11792129.6T
Other languages
English (en)
Inventor
Tomokazu Ishikawa
Takeshi Norimatsu
Huan ZHOU
Kok Seng Chong
Haishan Zhong
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Intellectual Property Corp of America
Original Assignee
Panasonic Intellectual Property Corp of America
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Intellectual Property Corp of America filed Critical Panasonic Intellectual Property Corp of America
Application granted granted Critical
Publication of ES2565959T3 publication Critical patent/ES2565959T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

Un metodo de extension del ancho de banda para la produccion de una senal de audio de ancho de banda completo a partir de una senal de audio de ancho de banda en baja frecuencia, comprendiendo dicho metodo: una primera etapa de transformada (S21) de la transformacion de la senal de ancho de banda en baja frecuencia en un dominio en el banco de filtros de espejo en cuadratura (QMF) para generar un primer espectro QMF de baja frecuencia; una etapa de generacion de un parche armonico de orden bajo (S22) de la generacion de un parche armonico de orden bajo mediante estiramiento en el tiempo de la senal de ancho de banda en baja frecuencia en un dominio QMF; una etapa de generacion de alta frecuencia (S23) de (i) generacion de senales que estan desplazadas en el tono, mediante la aplicacion de diferentes coeficientes de desplazamiento al parche armonico de orden bajo, y (ii) generacion de un espectro QMF de alta frecuencia a partir de las senales; una etapa de modificacion de espectro (S24) de modificacion del espectro QMF de alta frecuencia para satisfacer las condiciones de energia y tonalidad de alta frecuencia; y una etapa de generacion de ancho de banda completo (S25) de la generacion de la senal en ancho de banda completo mediante la combinacion del espectro QMF de alta frecuencia modificado con el primer espectro QMF de baja frecuencia.

Description

5
10
15
20
25
30
35
40
45
50
55
60
65
DESCRIPCION
Metodo de extension del ancho de banda, aparato de extension del ancho de banda, programa, circuito integrado y aparato de decodificacion de audio
Campo tecnico
La presente invencion se refiere a un metodo de extension del ancho de banda para la extension de un ancho de banda de frecuencia de una senal de audio.
Tecnica anterior
La tecnologia de extension del ancho de banda (BWE) de audio se usa normalmente en los codecs de audio modernos para codificar eficientemente una senal de audio de banda ancha con baja tasa de bits. Su principio es usar una representacion parametrica del contenido original en alta frecuencia (AF) para sintetizar una aproximacion de la AF a partir de los datos de baja frecuencia (BF).
ZHOU HUAN ET AL: "Core Experiment on the eSBR module of USAC", 90. MPEG MEETING, ISO/IEC JTC1/SC29/WG11, MPEG2009/M16933, octubre de 2009, desvela un metodo de extension del ancho de banda para la production de una senal de ancho de banda completo a partir de una senal de ancho de banda en baja frecuencia.
La FIG. 1 es un diagrama que muestra dicho codec de audio basado en la tecnologia BWE. En su codificador, la senal de audio en banda ancha se separa en primer lugar (101 y 103) en la parte de BF y AF; su parte de BF se codifica (104) en una forma de preservation de la forma de onda; mientras tanto, se analiza la relation entre sus partes de BF y de AF (102) (normalmente, en el dominio de la frecuencia) y se describe mediante un conjunto de parametros de AF. Debido a la description parametrica de la parte de AF, los datos de la forma de onda multiplexada (105) y los parametros de AF pueden transmitirse para decodificarse con una baja tasa de bits.
En el decodificador, se decodifica primero (107) la parte de BF. Para aproximar la parte de AF original, la parte de BF decodificada se transforma (108) al dominio de la frecuencia, el espectro de BF resultante se modifica (109) para generar un espectro en AF, bajo la guia de algunos parametros de Af decodificados. El espectro de AF se refina adicionalmente (110) mediante post-procesamiento, tambien bajo la guia de algunos parametros de AF decodificados. El espectro de AF refinado se convierte (111) al dominio del tiempo y se combina con la parte de BF retardada (112). Como resultado, se produce la salida de la senal de audio en banda ancha reconstruida final.
Notese que en la tecnologia BWE, una importante etapa es generar el espectro de AF a partir del espectro de BF (109). Hay algunas pocas formas de realizarlo, tal como copiar la parte de BF a la localization de AF, procesamiento no lineal o muestreo interpolado.
Un muy bien conocido codec de audio que usa dicha tecnologia BWE es MPEG-4 HE-AAC, en donde la tecnologia BWE se especifica como SBR (replication de banda espectral) o tecnologia SBR, en donde la parte de AF se genera simplemente copiando la parte de BF dentro de la representacion QMF a la localizacion espectral de AF.
Dicha operation de copia espectral, tambien denominada parche, es simple y probada como eficiente para la mayor parte de casos. Sin embargo, con tasas de bits muy bajas (por ejemplo, <20 kbit/s mono), en la que solo son factibles anchos de banda con una pequena parte de BF, dicha tecnologia SBR puede conducir a sensaciones de artificiosidades audibles no deseadas tales como rugosidad y timbre desagradable (por ejemplo, vease la literatura no de patente (LNP) 1).
Por lo tanto, para evitar dichas artificiosidades resultantes de la operacion especular o copia presentada en el escenario de codification con baja tasa de bits, la tecnologia SBR estandar se mejora y extiende con los siguientes cambios fundamentales (por ejemplo, vease LNP 2):
(1) modificar el algoritmo de parche desde una plantilla de copia a un vocoder (contraction de "codificador de voz" en ingles o "voice coder") de fase que controla una plantilla de parcheo
(2) incrementar la resolution en el tiempo adaptativa para los parametros de post-procesamiento.
Como resultado de la primera modification (anteriormente mencionada (1)), extendiendo el espectro de BF con multiples factores enteros, se asegura intrinsecamente la continuidad armonica en la AF. En particular, no puede surgir una sensation de rugosidad no deseada debido a efectos de batido en el borde entre la baja frecuencia y la alta frecuencia y entre diferentes partes de alta frecuencia (por ejemplo, vease LNP 1).
Y la segunda modificacion (anteriormente mencionada (2)) facilita que el espectro de AF refinado sea mas adaptativo a las fluctuaciones de senal en las bandas de frecuencia replicadas.
5
10
15
20
25
30
35
40
45
50
55
60
Dado que el nuevo parche preserva la relacion armonica, se denomina como extension del ancho de banda armonico (HBE). Las ventajas de la HBE de la tecnica anterior sobre la SBR estandar se han confirmado tambien experimentalmente para codificacion de audio de baja tasa de bits (por ejemplo, vease LNP 1).
Notese que las dos modificaciones anteriores solo afectan al generador del espectro de AF (109), los procesos restantes en la HBE son identicos a los de SBR.
La FIG. 2 es un diagrama que muestra el generador del espectro de AF en la HBE de la tecnica anterior. Se deberia observar que el generador del espectro de AF incluye una transformada T-F 108 y una reconstruccion de AF 109. Dada una parte de BF de una senal, se supone que su espectro de AF se compone de (T-1) parches armonicos de AF (cada proceso de parcheo produce un parche de AF), a partir del 2.° orden (el parche de AF con la frecuencia mas baja) hasta el orden T-esimo (el parche de AF con la frecuencia mas alta). En la HBE de la tecnica anterior, todos estos parches de AF se generan independientemente en paralelo deducidos de los vocoders de fase.
Como se muestra en la FIG. 2, se emplean (T-1) vocoders de fase (201~203) con diferentes factores de estiramiento, (desde 2 a k) para estirar la parte de BF de entrada. Las salidas estiradas, con diferentes longitudes, se filtran paso banda (204~206) y se remuestrean (207~209) para generar parches de AF mediante la conversion de la dilatacion del tiempo en extension de frecuencia. Al ajustar el factor de estiramiento en dos veces el factor de remuestreo, los parches de AF mantienen la estructura armonica de la senal y tienen el doble de longitud de la parte de BF. Entonces todos los parches de AF se alinean en retardo (210~212) para compensar las diferentes contribuciones potenciales al retardo de la operacion de remuestreo. En la ultima etapa, todos los parches de AF alineados en retardo se suman y transforman (213) en el dominio de QMF para producir el espectro de AF.
Observando el generador de espectro de AF anterior, tiene una elevada cantidad de computacion. La cantidad de computacion procede principalmente de la operacion de estiramiento en el tiempo, realizada por una serie de Transformadas de Fourier de Tiempo Reducido (STFT) y Transformadas de Fourier de Tiempo Reducido Inverso (ISTFT), transformadas adoptadas en los vocoders de fase, y la operacion QMF subsiguiente, aplicada a la parte de AF estirada en el tiempo.
Se describe a continuation una introduction general sobre el vocoder de fase y la transformada QMF.
Un vocoder de fase es una tecnica bien conocida que usa transformaciones en el dominio de la frecuencia para implementar un efecto de estiramiento en el tiempo. Esto es, para modificar una evolution temporal de la senal mientras sus caracteristicas espectrales locales se mantienen sin cambio. Su principio basico se describe a continuacion.
La FIG. 3A y la FIG. 3B son diagramas que muestran el principio basico del estiramiento en el tiempo realizado por el vocoder de fase.
Divide el audio en bloques solapados y redimensiona estos bloques en donde el tamano de salto (el intervalo de tiempo entre bloques sucesivos) no es el mismo en la entrada y en la salida, tal como se ha ilustrado en la FIG. 3A. En ella, el tamano de salto de entrada Ra es mas pequeno que el tamano de salto de salida Rs, como resultado, la senal original se estira con una tasa r mostrada en la (Ecuacion 1) a continuacion.
Expresion matematica 1
1 (Ecuacion 1)
Como se muestra en la FIG. 3B, los bloques redimensionados se solapan en un patron coherente, lo que requiere transformation en el dominio de la frecuencia. Normalmente, los bloques de entrada se transforman en frecuencia, despues de una modification apropiada de fases, los nuevos bloques se transforman de vuelta a sus bloques de salida.
Siguiendo el principio anterior, los vocoders de fase mas clasicos adoptan la transformada de Fourier de tiempo reducido (StFt) como la transformada en el dominio de la frecuencia, e implica una secuencia explicita de analisis, modificacion y resintesis para el estiramiento en el tiempo.
Los bancos QMF transforman las representaciones en el dominio del tiempo en representaciones en el dominio de tiempo-frecuencia conjunto (y viceversa), lo que se usa normalmente en esquemas de codificacion basados en parametricas, como la replication de banda espectral (SBR), la codificacion estereo parametrica (PS) y la codificacion de audio espacial (SAC), etc. Una caracteristica de estos bancos de filtro es que las senales en el dominio de la frecuencia (sub-banda) evaluadas complejas se sobremuestrean efectivamente con un factor de dos. Esto permite operaciones de post-procesamiento de las senales en el dominio de la sub-banda sin introducir distorsion de muestreo.
5
10
15
20
25
30
35
40
45
50
55
60
Con mas detalle, dada una senal en el tiempo discreta evaluada real x(n), con el banco QMF de analisis, las senales en el dominio de la sub-banda evaluada compleja sk(n) se obtienen a traves de (Ecuacion 2) a continuacion.
Expresion matematica 2
imagen1
(Ecuacion 2)
En la (Ecuacion 2), p(n) representa un filtro prototipo paso bajo de respuesta a impulso de orden L-1, a representa un parametro de fase, M representa el numero de bandas y k el fndice de la sub-banda (siendo k=0, 1, ..., M-1).
Notese que como STFT, la transformada QMF es tambien una transformada conjunta tiempo-frecuencia. Esto significa, proporciona tanto el contenido en frecuencia de una senal como el cambio en el contenido de frecuencia a lo largo del tiempo, en el que el contenido de la frecuencia es representado por la sub-banda de frecuencia y la lfnea del tiempo se representa por ranuras de tiempo, respectivamente.
La FIG. 4 es un diagrama que muestra el esquema del analisis y sfntesis QMF.
En detalle, tal como se ha ilustrado en la FIG. 4, una entrada de audio real dada se divide en bloques solapados sucesivos con longitud de L y tamano de salto de M (FIG. 4 (a)), el proceso de analisis QMF transforma cada bloque en una ranura de tiempo, compuesta de M senales de sub-banda compleja. En esta forma, las L muestras de entrada en el dominio del tiempo se transforman en L coeficientes QMF complejos, compuestos de L/M ranuras de tiempo y M sub-bandas (FIG. 4 (b)). Cada ranura de tiempo, combinada con las ranuras de tiempo previas (L/M-1), se sintetiza mediante el proceso de sfntesis QMF para reconstruir M muestras en el dominio del tiempo reales (FIG. 4 (c)) con una reconstruccion casi perfecta.
Lista de citas
Literatura no de patente
[LNP 1] Frederik Nagel y Sascha Disch, 'A harmonic bandwidth extension method for audio codecs', IEEE Int. Conf. on Acoustics, Speech and Signal Proc., 2009
[LNP 2] Max Neuendorf, et al., 'A novel scheme for low bitrate unified speech and audio coding - MPEG RM0', en 126th AeS Convention, Munich, Alemania, mayo de 2009.
Sumario de la invencion
Problema tecnico
Un problema asociado con la tecnologfa HBE de la tecnica anterior es la elevada cantidad de computacion. El vocoder de fase tradicional que se adopta por HBE para estiramiento de la senal tiene una elevada cantidad de computacion debido a la aplicacion sucesiva de unas FFT y unas IFFT, esto es, sucesivas FFT (Transformada de Fourier Rapida) e IFFT (Transformada de Fourier Rapida Inversa); y la subsiguiente transformada QMF incrementa la cantidad de computacion a ser aplicada a la senal estirada en el tiempo. Adicionalmente, en general el intento de reducir la cantidad de computacion conduce al problema potencial de degradacion de la calidad.
Por ello, la presente invencion tal como se define en las reivindicaciones se concibio a la vista del problema anteriormente mencionado y tiene como un objetivo proporcionar un metodo de extension del ancho de banda capaz de reducir la cantidad de computacion en la extension del ancho de banda asf como la supresion del deterioro de la calidad en el ancho de banda extendido.
Solucion al problema
Para conseguir el objetivo anteriormente mencionado, el metodo de extension del ancho de banda en un aspecto de la presente invencion es un metodo de extension del ancho de banda para la produccion de una senal de audio de ancho de banda completo a partir de una senal de audio de ancho de banda de baja frecuencia, incluyendo el metodo: una primera etapa de transformacion para la transformacion de la senal de ancho de banda en baja frecuencia en un dominio de un banco de filtros de espejo en cuadratura (QMF) para generar un primer espectro QMF de baja frecuencia; una etapa de generacion de un parche armonico de orden bajo para la generacion de un parche armonico de orden bajo mediante el estiramiento en el tiempo de la senal de ancho de banda en baja frecuencia en un dominio QMF; una etapa de generacion de alta frecuencia de (i) generacion de senales que estan desplazadas en tono, mediante la aplicacion de diferentes coeficientes de desplazamientos al parche armonico de orden bajo, y (ii) generacion de un espectro QMF de alta frecuencia a partir de las senales; una etapa de modificacion del espectro para modificacion del espectro QMF de alta frecuencia para satisfacer las condiciones de energfa y tonalidad en alta frecuencia; y una etapa de generacion del ancho de banda completo para la generacion
5
10
15
20
25
30
35
40
45
50
55
60
65
de la senal en ancho de banda completo mediante la combinacion del espectro QMF de alta frecuencia modificado con el primer espectro QMF de baja frecuencia.
En consecuencia, el espectro QMF de alta frecuencia se genera mediante estiramiento en el tiempo y desplazamiento de tono de la senal de ancho de banda de baja frecuencia en el dominio QMF. Por lo tanto, es posible evitar el procesamiento complejo convencional (sucesivamente repetidas FFT e IFFT, y posterior transformada QMF), para la generacion de un espectro QMF de alta frecuencia, y por ello la cantidad de computacion puede reducirse. Ademas, dado que las senales desplazadas en tono se generan mediante la aplicacion de coeficientes de desplazamiento mutuamente diferentes en lugar de solo un coeficiente de desplazamiento, y el espectro QMF de alta frecuencia se genera a partir de estas senales, es posible suprimir el deterioro de la calidad del espectro QMF de alta frecuencia. Adicionalmente, dado que el espectro QMF de alta frecuencia se genera a partir del parche armonico de orden bajo, es posible suprimir adicionalmente el deterioro de la calidad del espectro QMF de alta frecuencia.
Deberia tomarse nota que, en el metodo de extension del ancho de banda, el desplazamiento de tono tambien opera en el dominio QMF. Esto es para descomponer la subbanda QMF de BF en el parche de orden bajo en multiples sub-subbandas para una resolucion de frecuencia mas alta, mapeando entonces estas sub-subbandas en la subbanda QMF alta para generar el espectro de parche de orden alto.
Adicionalmente, la etapa de generacion del parche armonico de orden bajo incluye: una segunda etapa de transformacion para transformacion de la senal de ancho de banda de baja frecuencia en un segundo espectro QMF de baja frecuencia; una etapa de paso banda para el filtrado paso banda del segundo espectro QMF de baja frecuencia; y la etapa de estiramiento para estiramiento del segundo espectro QMF de baja frecuencia filtrado paso banda a lo largo de una dimension temporal.
Adicionalmente, el segundo espectro QMF de baja frecuencia tiene una resolucion de frecuencia mas fina que el primer espectro QMF de baja frecuencia.
Adicionalmente, la etapa de generacion de alta frecuencia incluye: una etapa de generacion del parche de un filtro paso banda del parche armonico de orden bajo para generar parches filtrados paso banda; una etapa de generacion de orden alto de mapeado de cada parche filtrado paso banda en una alta frecuencia para generar parches armonicos de orden alto; y una etapa de suma para la suma de los parches armonicos de orden alto con el parche armonico de orden bajo.
Adicionalmente, la etapa de generacion de orden alto incluye: una etapa de division para la division de cada subbanda QMF en cada uno de los parches filtrados paso banda en multiples sub-sub-bandas; una etapa de mapeado para mapeado de las sub-sub-bandas en sub-bandas QMF de alta frecuencia; y una etapa de combinacion para combinacion de los resultados del mapeado de las sub-sub-bandas.
Adicionalmente, la etapa de mapeado incluye: una etapa de division para division de las sub-sub-bandas de cada una de las sub-bandas QMF en una parte de banda de corte y una parte de banda de paso; una etapa de computacion de frecuencia para computacion de las frecuencias centrales transpuestas de las sub-sub-bandas sobre la parte de la banda de paso con el factor dependiente del orden del parche; una primera etapa de mapeado para mapeado de las sub-sub-bandas en la parte de la banda de paso en sub-bandas QMF de alta frecuencia de acuerdo con las frecuencias centrales; y una segunda etapa de mapeado para mapeado de la sub-sub-banda en la parte de banda de corte en las sub-bandas QMF de alta frecuencia de acuerdo con las sub-sub-bandas de la parte de la banda de paso.
Se deberia tomar nota que, en el metodo de extension del ancho de banda de acuerdo con la presente invencion, las operaciones del proceso (etapas) descritas anteriormente pueden combinarse de cualquier manera.
Dicho metodo de extension del ancho de banda de acuerdo con la presente invencion tiene una tecnologia HBE de baja cantidad de computacion que usa un generador de espectro de AF de cantidad reducida de computacion, que contribuye a la cantidad de computacion mas alta para el HBE. Para reducir la cantidad de computacion, se usa un nuevo vocoder de fase basado en QMF que realiza estiramiento en el tiempo en el dominio QMF con una baja cantidad de computacion. Adicionalmente, para evitar los posibles problemas de calidad asociados con la solucion, se usa un nuevo algoritmo de desplazamiento de tono que genera parches armonicos de orden alto a partir del parche de orden bajo en el dominio QMF.
Es el objetivo de la invencion disenar un parche basado en QMF donde se pueda realizar tanto el estiramiento en el tiempo como la extension de la frecuencia en el dominio QMF, para hacer que, adicionalmente, desarrolle una tecnologia HBE de baja cantidad de computacion controlada por el vocoder de fase basado en QMF.
Se deberia tomar nota que la presente invencion puede realizarse, no solo como dicho metodo de extension del ancho de banda, sino tambien como un aparato de extension del ancho de banda y un circuito integrado que extiende el ancho de banda de la frecuencia de una senal de audio usando el metodo de extension del ancho de
5
10
15
20
25
30
35
40
45
50
55
60
65
banda.
Efectos ventajosos de la invencion
El metodo de extension del ancho de banda en la presente invencion disena una nueva tecnologia de extension del ancho de banda armonico (HBE). El nucleo de la tecnologia es realizar tanto estiramiento en el tiempo como desplazamiento de tono en el dominio QMF, en lugar de en el dominio FFT tradicional y en el dominio del tiempo, respectivamente. Comparando con la tecnologia HBE de la tecnica anterior, el metodo de extension del ancho de banda en la presente invencion puede proporcionar una buena calidad sonora y reducir significativamente la cantidad de computacion.
Breve descripcion de los dibujos
[FIG. 1] la FIG. 1 es un diagrama que muestra un esquema de codec de audio que usa una tecnologia BWE normal.
[FIG. 2] la FIG. 2 es un diagrama que muestra un generador de espectro de AF con estructura armonica preservada.
[FIG. 3A] la FIG. 3A es un diagrama que muestra el principio del estiramiento en el tiempo mediante recolocacion de bloques de audio.
[FIG. 3B] la FIG. 3B es un diagrama que muestra el principio del estiramiento en el tiempo mediante recolocacion de bloques de audio.
[FIG. 4] la FIG. 4 es un diagrama que muestra el esquema de analisis y sintesis QMF.
[FIG. 5] la FIG. 5 es un diagrama de flujo que muestra un metodo de extension del ancho de banda en un primer
ejemplo.
[FIG. 6] la FIG. 6 es un diagrama que muestra un generador de espectro de AF en el primer ejemplo.
[FIG. 7] la FIG. 7 es un diagrama que muestra un decodificador de audio en el primer ejemplo.
[FIG. 8] la FIG. 8 es un diagrama que muestra un esquema de cambio de escala de tiempo de una senal sobre la base de la transformada QMF en el primer ejemplo.
[FIG. 9] la FIG. 9 es un diagrama que muestra un metodo de estiramiento en el tiempo en el dominio QMF en el primer ejemplo.
[FIG. 10] la FIG. 10 es un diagrama que muestra la comparacion de los efectos de estiramiento para una senal tonal sinusoidal con diferentes factores de estiramiento.
[FIG. 11] la FIG. 11 es un diagrama que muestra el efecto de desalineacion y distribucion de energia en el esquema HBE.
[FIG. 12] la FIG. 12 es un diagrama de flujo que muestra el metodo de extension del ancho de banda en una realizacion de la presente invencion.
[FIG. 13] la FIG. 13 es un diagrama que muestra un generador de espectro de AF en la realizacion de la presente invencion.
[FIG. 14] la FIG. 14 es un diagrama que muestra un decodificador de audio en la realizacion de la presente invencion.
[FIG. 15] la FIG. 15 es un diagrama que muestra un metodo de extension de la frecuencia en el dominio QMF en la realizacion de la presente invencion.
[FIG. 16] la FIG. 16 es una figura que muestra una distribucion de espectro de sub-sub-banda en la realizacion de la presente invencion.
[FIG. 17] la FIG. 17 es un diagrama que muestra la relacion entre el componente de banda de paso y el componente de banda de corte para una sinusoide en el dominio QMF complejo en la realizacion de la presente invencion
Descripcion de realizaciones
Las siguientes realizaciones son meramente ilustrativas de los principios de varias etapas inventivas. Se entiende que seran evidentes para otros expertos en la materia variaciones de los detalles descritos en el presente documento.
(Primer ejemplo)
De aqui en adelante, se describira un esquema HBE (metodo de extension del ancho de banda armonico) y un decodificador (decodificador de audio o aparato de decodificacion de audio) que usa el mismo.
La FIG. 5 es un diagrama de flujo que muestra el metodo de extension del ancho de banda.
Este metodo de extension del ancho de banda es un metodo de extension del ancho de banda para la produccion de una senal de ancho de banda completo a partir de una senal de ancho de banda en baja frecuencia. El metodo incluye: una primera etapa de transformacion para la transformacion de la senal de ancho de banda en baja frecuencia en un dominio del banco de filtros de espejo en cuadratura (QMF) para generar un primer espectro QMF de baja frecuencia; una etapa de desplazamiento de tono para la generacion de senales desplazadas en tono
5
10
15
20
25
30
35
40
45
50
55
60
65
mediante la aplicacion de diferentes factores de desplazamiento sobre la senal de ancho de banda en baja frecuencia; una etapa de generacion de alta frecuencia para la generacion de un espectro QMF de alta frecuencia mediante extension en el tiempo de las senales desplazadas en tono en un dominio QMF; una etapa de modificacion del espectro para modificacion del espectro QMF de alta frecuencia para satisfacer las condiciones de energia y tonalidad de alta frecuencia; y una etapa de generacion del ancho de banda completo para la generacion de la senal de ancho de banda completo mediante la combinacion del espectro QMF de alta frecuencia modificado con el primer espectro QMF de baja frecuencia.
Deberia tomarse nota de que la primera etapa de transformacion (S11) se realiza mediante una unidad de transformada T-F 1406 a ser descrita mas adelante, la etapa de desplazamiento de tono (S12) se realiza mediante unidades de muestreo 504 a 506 y una unidad de remuestreo en el tiempo 1403 a ser descrita mas adelante. Ademas, la etapa de generacion de alta frecuencia (S13) se realiza mediante unidades de transformada QMF 507 a 509, vocoders de fase 510 a 512, una unidad de transformada QMF 404, y una unidad de estiramiento en el tiempo 1405 a ser descrita mas adelante. Adicionalmente, la etapa de generacion del ancho de banda completo (S15) se realiza mediante una unidad de adicion 1410 a ser descrita mas adelante.
Adicionalmente, la etapa de generacion de alta frecuencia incluye: una segunda etapa de transformacion para la transformacion de las senales desplazadas en tono en un dominio QMF para generar un espectro QMF; una etapa de generacion del parche armonico de estiramiento del espectro QMF a lo largo de una dimension temporal con diferentes factores de estiramiento para generar parches armonicos; una etapa de alineacion para alineacion en el tiempo de los parches armonicos; y una etapa de suma para la suma de los parches armonicos alineados en el tiempo.
Deberia tomarse nota que la segunda etapa de transformacion se realiza mediante las unidades de transformada QMF 507 a 509 y la unidad de transformada QMF 1404, y la etapa de generacion del parche armonico se realiza mediante los vocoders de fase 510 a 512 y la unidad de estiramiento en el tiempo 1405. Adicionalmente, la etapa de alineacion se realiza mediante las unidades de alineacion del retardo 513 a 515 a ser descritas, y la etapa de suma se realiza por una unidad de adicion 516 a ser descrita mas adelante.
En un esquema HBE en la presente realizacion, un generador de espectro de AF en la tecnologia HBE se disena con los procesos de desplazamiento de tono en el dominio del tiempo, seguidos por los procesos de estiramiento en el tiempo controlados por el vocoder en el dominio QMF.
La FIG. 6 es un diagrama que muestra el generador de espectro de AF usado en el esquema HBE. El generador de espectro de AF incluye: unidades paso banda 501, 502, ..., y 503; las unidades de muestreo 504, 505, ..., y 506; las unidades de transformada QMF 507, 508, ..., y 509; los vocoders de fase 510, 511, ..., y 512; las unidades de alineacion del retardo 513, 514, ... y 515; y la unidad de adicion 516.
Una entrada de ancho de banda en BF dada se filtra primero paso banda (501~503) y se remuestrea (504~506) para generar sus partes de ancho de banda en AF. Estas partes de ancho de banda en Af se transforman (507~509) al dominio QMF, las salidas QMF resultantes se estiran en el tiempo (510~512) con factores de estiramiento en dos veces de acuerdo con los factores de remuestreo. Los espectros de AF estirados se alinean en retardo (513~515) para compensar las diferentes contribuciones de retardo potenciales de los procesos de remuestreo y se suman (516) para generar el espectro de AF final. Deberia tomarse nota que cada uno de los numeros 501 a 516 entre parentesis anteriores indica un elemento constituyente del generador del espectro de AF.
Comparando el esquema con el esquema de la tecnica anterior (FIG. 2), puede verse que las diferencias principales son 1) se aplican mas transformadas QMF; y 2) se realizan operaciones de estiramiento en el tiempo en el dominio QMF, no en el dominio de la FFT. La operacion detallada de estiramiento en el tiempo en el dominio QMF se describira mas adelante con mas detalle.
La FIG. 7 es un diagrama que muestra un decodificador que adopta el generador del espectro de AF. El decodificador (aparato de decodificacion de audio) incluye una unidad demultiplexora 1401, una unidad de decodificacion 1402, la unidad de remuestreo en el tiempo 1403, la unidad de transformada QMF 1404, y la unidad estiramiento en el tiempo 1405. Deberia tomarse nota que la unidad demultiplexora 1401 corresponde a la unidad de separacion que separa una senal de ancho de banda en baja frecuencia codificada de la informacion codificada (flujo de bits). Adicionalmente, la unidad de transformada T-F inversa 1409 corresponde a la unidad de transformada inversa que transforma una senal de ancho de banda completo, a partir de una senal en el dominio del banco de filtros de espejo en cuadratura (QMF) a una senal en el dominio del tiempo.
Con el decodificador, el flujo de bits primero se demultiplexa (1401), se decodifica entonces la parte de la senal en BF (1402), para aproximarse a la parte de AF original, la parte de BF (senal de ancho de banda en baja frecuencia) decodificada se remuestrea (1403) en el dominio del tiempo para generar la parte de AF, la parte de AF resultante se transforma (1404) al dominio QMF, el espectro QMF de AF resultante se estira (1405) a lo largo de la direccion temporal, el espectro de AF estirado se refina adicionalmente (1408) mediante post-procesamiento, bajo la guia de algunos parametros de AF decodificados. Entretanto, la parte de bF decodificada se transforma tambien (1406) al
5
10
15
20
25
30
35
40
45
50
55
60
65
dominio QMF. Para al final, combinar el espectro de AF refinado (1410) con el espectro de BF (1407) retardado para producir el espectro de QMF en ancho de banda completo. El espectro QMF de ancho de banda completo resultante se convierte (1409) de vuelta al dominio del tiempo para producir la salida de la senal de audio de banda ancha decodificada. Debena tomarse nota que cada uno de los numeros 1401 a 1410 anteriores entre parentesis denota un elemento constituyente del decodificador.
El metodo de estiramiento en el tiempo
El proceso de estiramiento en el tiempo del esquema HBE es, para una senal de audio, su senal estirada en el tiempo que puede generarse mediante transformada QMF, manipulaciones de fase y transformada QMF inversa. Espedficamente, la etapa de generacion del parche armonico incluye: una etapa de calculo para el calculo de la amplitud y fase de un espectro QMF entre los espectros QMF; una etapa de manipulacion de fase para la manipulacion de la fase para producir una nueva fase; y una etapa de generacion del coeficiente QMF de combinacion de la amplitud con la nueva fase para generar un nuevo conjunto de coeficientes QMF. Debena tomarse nota que cada una de las etapas de calculo, la etapa de manipulacion de fase, y la etapa de generacion del coeficiente QMF se realiza mediante un modulo 702 a ser descrito mas adelante.
La FIG. 8 es un diagrama que muestra un proceso de estiramiento en el tiempo basado en QMF realizado por la unidad de transformada QMF 1404 y la unidad de estiramiento en el tiempo 1405. En primer lugar, una senal de audio se transforma en un conjunto de coeficientes QMF, por ejemplo, X(m,n), mediante transformada de analisis QMF (701). Estos coeficientes QMF se modifican en el modulo 702. En el que, para cada uno de los coeficientes QMF se calculan su amplitud r y fase a, por ejemplo, X(m,n) = r(m,n) exp(j a(m,n)). Las fases a(m,n) se modifican (manipulan) a a(m,n). Las fases modificadas a y las amplitudes originales r construyen un nuevo conjunto de coeficientes QMF. Por ejemplo, un nuevo conjunto de coeficientes QMF se muestra en la (Ecuacion 3) a continuacion.
Expresion matematica 3
X(m,n) = r{m,n) expU ■ a(m,n)) (Ecuacion 3)
Finalmente, el nuevo conjunto de coeficientes QMF se transforma (703) en una nueva senal de audio, que corresponde a la senal original con escala de tiempos modificada.
El algoritmo de estiramiento en el tiempo basado en QMF en el esquema HBE imita el algoritmo de estiramiento basado en STFT: 1) la etapa de modificacion usa el concepto de frecuencia instantanea para modificar fases; 2) para reducir la cantidad de computacion, la adicion de solape se realiza en el dominio QMF usando la propiedad de aditividad de la transformada QMF.
A continuacion esta la descripcion detallada del algoritmo de estiramiento en el tiempo en el esquema HBE.
Suponiendo que hay 2L senales en el dominio del tiempo de valor real, x(n), a ser estiradas con factor de estiramiento s, despues de la etapa de analisis QMF, hay 2L coeficientes complejos QMF, compuestos de 2L/M ranuras de tiempo y M sub-bandas.
Notese que como en el metodo de estiramiento basado en STFT, los coeficientes QMF transformados son opcionalmente, sometidos a analisis por funcion ventana antes de la manipulacion de fase. En la presente invencion, esto puede realizarse o bien en el dominio del tiempo o bien en el dominio QMF.
En el dominio del tiempo, una senal en el dominio de tiempo puede ser sometida a una funcion ventana naturalmente como en la (Ecuacion 4) a continuacion.
Expresion matematica 4
x(n) = x(n) ■ h(mod(n, L)) (Ecuacion 4)
El mod(.) en la (Ecuacion 4) significa la operacion de modulacion.
En el dominio QMF, la operacion equivalente puede realizarse mediante:
1) La transformacion de la ventana de analisis h(n) (con longitud de L) al dominio QMF para producir H(v,k) con L/M ranuras de tiempo y M sub-bandas.
2) La simplificacion de la representacion QMF de la ventana tal como se muestra en la (Ecuacion 5) a continuacion.
5
10
15
20
25
30
35
40
45
50
55
60
Expresion matematica 5
//0(v) = £//(v,/:)
k=0
(Ecuacion 5)
En este caso, v=0,..., L/M-1.
3) La realizacion del analisis por funcion ventana en el dominio QMF mediante X(m,k) = X(m,k) • Ho(w) en la que w = mod(m,L/M) (debena tomarse nota de que mod(.) significa la operacion de modulacion).
Adicionalmente, en el esquema HBE, en la etapa de manipulacion de fase, la nueva fase se produce basandose en la fase original como un conjunto establecido de coeficientes QMF. Espedficamente, como una realizacion detallada del estiramiento en el tiempo, la manipulacion de fase se realiza basandose en el bloque QMF.
La FIG. 9 es un diagrama de un metodo de estiramiento en el tiempo en el dominio QMF.
Estos coeficientes QMF originales pueden tratarse como L+1 bloques QMF solapados con tamano de salto de 1 ranura de tiempo y longitud de bloque de L/M ranuras de tiempo, tal como se ha ilustrado en (a) en la FIG. 9.
Para asegurar ningun efecto de salto de fase, cada bloque QMF original se modifica para generar un nuevo bloque QMF con fases modificadas, y las fases de los nuevos bloques QMF debenan ser continuas en el punto p-s para el solape de los (p)-esimo y (p-1)-esimo nuevos bloques QMF, que es equivalente a continuos en los puntos de union pMs (p e N) en el dominio del tiempo.
Adicionalmente, en el esquema HBE, en la etapa de manipulacion de fase, se realiza la manipulacion repetidamente para conjuntos de coeficientes QMF, y en la etapa de generacion del coeficiente QMF, se generan nuevos conjuntos de coeficientes QMF. En este caso, las fases se modifican en el bloque base siguiendo el criterio que sigue.
Suponiendo que las fases originales son ^u(k) para los coeficientes QMF X(u,k), para u=0, ..., 2L/M-1 y k=0, ..., M-1. Cada bloque QMF original se modifica secuencialmente a un nuevo bloque QMF, como se ilustra en (b) en la FIG. 9, donde se ilustran nuevos bloques QMF con diferentes tramas de llenado.
En lo que sigue, ^u(n)(k) representa informacion de fase del nuevo enesimo bloque QMF para n=1, ..., L/M, u=0, ..., L/M-1 y k=0, 1, ..., M-1. Estas nuevas fases, dependiendo de si el nuevo bloque esta redimensionado o no, se disenan como sigue.
Suponiendo que el 1.er nuevo bloque QMF X(1)(u,k) (u=0, ..., L/M-1) no esta re-espaciado, de ese modo la nueva informacion de fase ^u(1)(k) es identica a ^u(k). Esto es, ^u(1)(k)= ^u(k) para u=0, ..., L/M-1 y k=0, 1, ..., M-1.
Para el 2.° nuevo bloque QMF X(2)(u,k) (u=0, ..., L/M-1), se redimensiona con tamano de salto de ranura de tiempo s (por ejemplo 2 ranuras de tiempo, como se ilustra en la FIG. 9). En este caso, las secuencias instantaneas al inicio del bloque debenan ser consistentes con las de la ranura de tiempo s-esima en el 1.er nuevo bloque QMF X(1)(u,k). De ese modo, las frecuencias instantaneas para la 1 .a ranura de tiempo de X(2)(u,k) debenan ser identicas a las de la 2.a ranura de tiempo en el bloque QMF original. Esto es ^o(2)(k)= ^o(1)(k) + s A^1(k).
Adicionalmente, dado que se cambian las fases para la 1.a ranura de tiempo, las fases restantes se ajustan en consecuencia para preservar las frecuencias instantaneas originales. Esto es, ^u(2)(k)= ^u-1(2)(k) + A^u+1(k) para u=1,..., L/M-1, en la que A^u(k) = ^u(k) - ^u-1(k) representa las frecuencias instantaneas originales para el bloque QMF original.
Para los bloques de smtesis subsiguientes, se aplican las mismas reglas de modificacion de fase. Esto es, para el nuevo m-esimo nuevo bloque QMF (m=3, ..., L/M), sus fases ^u(m)(k) se deciden como se muestra a continuacion.
^o(m)(k) = ^o(m-1)(k) + s A^m-1(k)
Yu(m)(k) = ^u-1(m)(k) + A^m+u-1(k)
para u=1, ..., L/M-1.
Incluyendo la informacion de amplitud del bloque original, las nuevas fases anteriores dan como resultado nuevos L/M bloques.
En este caso, en el esquema HBE en la presente realizacion, en la etapa de manipulacion de fase, se realiza una manipulacion diferente dependiendo de un mdice de sub-banda QMF. Espedficamente, el metodo de modificacion de fase anterior puede disenarse de modo diferente para sub-bandas QMF impares y sub-bandas pares,
5
10
15
20
25
30
35
40
45
50
55
respectivamente.
Se basa en que para una senal tonal, su frecuencia instantanea en el dominio QMF se asocia con la diferencia de fase, A^(n,k)= ^(n,k) - ^(n-1 ,k), en diferentes formas.
Con mas detalle, se ha descubierto que la frecuencia instantanea w(n,k) puede determinarse a traves de la (Ecuacion 6) a continuacion.
Expresion matematica 6
^ ^ | princ arg(A<p(n,k))/it + k kespar
’ [princarg(A<p(n,k) — n)lK + k k es impar
(Ecuacion 6)
En la (ecuacion 6), el princ arg(a) significa el angulo de principio de a, definido por la (Ecuacion 7) a continuacion. Expresion matematica 7
princ arg (or) = mod (or + k-2k) + 71
(Ecuacion 7)
En la ecuacion, mod(a,b) denota la modulacion de a sobre b.
Como resultado, por ejemplo, en el metodo de codificacion de fase anterior, la diferencia de fase se podria elaborar como en la (Ecuacion 8) a continuacion.
Expresion matematica 8
A %(*) =
princ arg {(pu(k) - $?„_,(£)) princ arg(^u (k) - (pu_x (k) - 7t)
k es par k es impar
(Ecuacion 8)
Adicionalmente, en el esquema HBE en la presente realizacion, en la etapa de generacion del coeficiente QMF, los nuevos conjuntos de coeficientes QMF se anaden solapados para generar los coeficientes QMF que corresponden a una senal de audio temporalmente extendida. Especificamente, para reducir la cantidad de computacion, la operacion de sintesis QMF no se aplica directamente sobre cada nuevo bloque QMF individual, se aplica sobre resultados anadidos-solapados de aquellos nuevos bloques QMF.
Notese que como el metodo de estiramiento basado en STFT, los nuevos coeficientes QMF estan opcionalmente sometidos a funcion ventana de sintesis antes de la adicion-solape. Como en el proceso de analisis por funcion ventana, la sintesis por funcion ventana puede realizarse como se muestra a continuacion.
X(n+1)(u,k) = X(n+1)(u,k) • Ho(w),
en la que w=mod(u, L/M).
Entonces, debido a la aditividad de la transformada QMF, todos los nuevos L/M bloques pueden anadirse con solape, con el tamano de salto de s ranuras de tiempo, previamente a la sintesis QMF. Los resultados anadidos con solape Y(u,k) pueden obtenerse a traves de la ecuacion a continuacion.
Expresion matematica 9
imagen2
(Ecuacion 9)
En este caso, n=0, ..., L/M-1, u=1, ..., L/M, y k=0, ..., M-1.
La senal de audio final puede generarse mediante la aplicacion de la sintesis QMF sobre la Y(u,k), que corresponde a la senal original con escala de tiempo modificada.
Comparando el metodo de estiramiento basado en QMF en el esquema HBE de la presente realizacion con el metodo de estiramiento basado en STFT de la tecnica anterior, merece la pena tomar nota de que la resolucion de tiempo inherente de la transformada QMF ayuda a reducir significativamente la cantidad de computacion, lo que solamente puede obtenerse con una serie de transformadas STFT en el metodo de estiramiento basado en STFT de la tecnica anterior.
5
10
15
20
25
30
35
40
45
50
El analisis de cantidad de computacion a continuacion muestra un resultado de la comparacion de la cantidad de conmutacion aproximado considerando solamente la cantidad de computacion a la que contribuyen las transformadas.
Suponiendo que la cantidad de computacion de STFT de tamano L es log2(L)L y la cantidad de computacion de una transformada de analisis QMF es aproximadamente el doble que el de una transformada FFT, la cantidad de computacion de transformada implicada en el generador de espectro de AF de la tecnica anterior se aproxima como se muestra a continuacion.
Expresion matematica 10
imagen3
(Ecuacion 10)
Mediante comparacion, la cantidad de computacion de transformada implicada en el generador de espectro de AF se aproxima como se muestra en la (Ecuacion 11) a continuacion.
Expresion matematica 11
2S(2^)lo8;(2^)"4t>/'t'log2(L)
1=2 1=2 (Ecuacion 11)
Por ejemplo, suponiendo L = 1024 y Ra=128, la comparacion de cantidad de computacion anterior puede concretarse en La tabla 1.
Tabla 1
Tabla 1. Comparacion de la cantidad de computacion entre la HBE de la tecnica anterior y la HBE propuesta con la _______________________adopcion del estiramiento en el tiempo basado en QMF________________________
Numero de parches armonicos (T)
Cantidad de computacion de transformada implicada en el estiramiento en el tiempo Cantidad de computacion de transformada implicada en el estiramiento en el tiempo de la tecnica anterior Ratios de cantidad de computacion
3
33335 350208 9,52 %
4
42551 514048 8,28 %
5
49660 677888 7,33 %
(Realizacion)
Se describira en detalle en el presente documento a continuacion, una realizacion del esquema HBE (metodo de extension del ancho de banda armonico) y un decodificador (decodificador de audio o aparato de decodificacion de audio) que usa el mismo.
Notese que con la adopcion del metodo de estiramiento en el tiempo basado en QMF, la tecnologfa HBE que usa el metodo de estiramiento en el tiempo basado en QMF tiene una cantidad de computacion mucho mas baja. Sin embargo, por otro lado, la adopcion del metodo de estiramiento en el tiempo basado en QMF tambien lleva a dos posibles problemas que presentan el riesgo de degradar la calidad del sonido.
En primer lugar, hay un problema de degradacion de la calidad para tonos de orden elevado. Supongase que el espectro de AF esta compuesto con (T-1) parches que corresponden a factores de estiramiento tales como 2, 3, ..., T. Debido a que el estiramiento en el tiempo basado en QMF se basa en bloques, el reducido numero de operaciones de solape-adicion en el parche de orden alto provoca la degradacion en el efecto de estiramiento.
La FIG. 10 es un diagrama que muestra la senal tonal sinusoidal. El panel superior (a) muestra el efecto de estirado de un parche de 2.° orden para una senal tonal sinusoidal pura, la salida estirada es basicamente limpia, con solo unos pocos otros componentes de frecuencia presentados en pequenas amplitudes. Mientras que el panel inferior (b) muestra el efecto de estirado de un parche de 4.° orden para la misma senal tonal sinusoidal.
Comparando con (a), se puede ver que aunque la frecuencia central se desplaza correctamente en (b), la salida resultante tambien incluye algunos otros componentes de frecuencia con amplitud no despreciable. Esto puede dar como resultado ruidos no deseados presentes en la salida estirada.
5
10
15
20
25
30
35
40
45
50
55
60
65
En segundo lugar, hay un posible problema de degradation de calidad para senales transitorias. Dicho problema de degradation de calidad puede tener 3 fuentes de contribution potenciales.
La primera fuente de contribucion es que el componente transitorio puede perderse durante el remuestreo. Suponiendo una senal transitoria con un impulso de Dirac localizada en una muestra par, para un parche de 4.° orden con un diezmado con factor de 2, dicho impulso de Dirac desaparece en la senal remuestrada. Como resultado, el espectro de AF resultante tiene componentes transitorios incompletos.
La segunda fuente de contribucion es la desalineacion de componentes transitorios entre diferentes parches. Debido a que los parches tienen diferentes factores de remuestreo, un impulso de Dirac situado en una position especificada puede tener varios componentes situados en diferentes ranuras de tiempo en el dominio QMF.
La FIG. 11 es un diagrama que muestra el efecto de desalineacion y dispersion de energia. Para una entrada con un impulso de Dirac (por ejemplo en la FIG. 11, presentada como la 3.a muestra, ilustrada en gris), despues del remuestreo con diferentes factores, su posicion se cambia a diferentes posiciones. Como resultado, la salida estirada muestra un efecto transitorio porcentualmente atenuado.
La tercera fuente de contribucion es que las energias de los componentes transitorios se dispersan irregularmente entre diferentes parches. Como se muestra en la FIG. 11, con el parche de 2.° orden, el componente transitorio asociado se dispersa a la 5.a y 6.a muestras, con el parche de 3.er orden, a las muestras 4.a ~ 6.a; y con el parche de orden 4.° orden, a las muestras 5.a ~ 8A Como resultado, la salida estirada tiene un efecto transitorio mas debil a frecuencia mas alta. Para algunas senales transitorias criticas, la salida estirada incluso muestra algunas artificiosidades pre- y post-eco molestas.
Para superar el anterior problema de degradacion de calidad, se desea una tecnologia HBE mejorada. Sin embargo, una solution demasiado complicada tambien incrementa la cantidad de computation. En la presente realization, se usa un metodo de desplazamiento de tono basado en QMF para evitar el posible problema de degradacion de calidad y mantener la ventaja de cantidad de computacion baja.
Como se describe en detalle a continuation, en el esquema HBE (metodo de extension del ancho de banda armonico) de la presente realizacion, el generador de espectro de AF en la tecnologia HBE de la presente realizacion se disena con, tanto el estiramiento en el tiempo como el proceso de desplazamiento de tono, en el dominio QMF. Adicionalmente, tambien se describira a continuacion un decodificador (decodificador de audio o aparato de decodificacion de audio) que use el HBE de la presente realizacion.
La FIG. 12 es un diagrama de flujo que muestra el metodo de extension del ancho de banda de la presente realizacion.
Este metodo de extension del ancho de banda es un metodo de extension del ancho de banda para la production de una senal de ancho de banda completa a partir de una senal de ancho de banda en baja frecuencia. Incluyendo el metodo: una primera etapa de transformada para transformation de la senal de ancho de banda en baja frecuencia en un dominio del banco de filtros de espejo cuadratura (QMF) para generar un primer espectro QMF de baja frecuencia; una etapa de generation del parche armonico de orden bajo para la generation de un parche armonico de orden bajo mediante desplazamiento en el tiempo de la senal de ancho de banda en baja de frecuencia en un dominio QMF; una etapa de generacion de alta frecuencia de (i) generacion de senales que estan desplazadas en tono, mediante la aplicacion de diferentes coeficientes de desplazamiento al parche armonico de orden bajo, y (ii) generacion de un espectro QMF de alta frecuencia a partir de las senales; una etapa de modification del espectro para modificacion del espectro QMF de alta frecuencia para satisfacer las condiciones de energia y tonalidad en alta frecuencia; y una etapa de generacion del ancho de banda completo para la generacion de la senal en ancho de banda completo mediante la combination del espectro QMF de alta frecuencia modificado con el primer espectro QMF de baja frecuencia.
Deberia tomarse nota de que la primera etapa de transformada se realiza mediante una unidad de transformada T-F 1508 a ser descrita mas adelante, la etapa de generacion del parche armonico de orden bajo se realiza mediante una transformada QMF 1503, una unidad de estiramiento en el tiempo 1504, una unidad de transformada QMF 601, y un vocoder de fase 603 a ser descrito mas adelante. Ademas, la etapa de generacion de alta frecuencia se realiza mediante una unidad de desplazamiento de tono 1506, unidades de paso banda 604 y 605, unidades de extension de frecuencia 606 y 607, y unidades de alineacion del retardo 608 a 610 a ser descritas mas adelante. Adicionalmente, la etapa de modificacion del espectro se realiza mediante una unidad de post-procesamiento de AF 1507 a ser descrita mas adelante, y la etapa de generacion del ancho de banda completo se realiza mediante una unidad de adicion 1512.
Adicionalmente, la etapa de generacion del parche armonico de orden bajo incluye: una segunda etapa de transformacion para transformacion de la senal de ancho de banda en baja frecuencia en un segundo espectro QMF de baja frecuencia; una etapa de paso banda para filtrado paso banda del segundo espectro qMf de baja frecuencia; y una etapa de estiramiento para estiramiento del segundo espectro QMF de baja frecuencia filtrado
5
10
15
20
25
30
35
40
45
50
55
60
65
paso banda a lo largo de una dimension temporal.
Deberia tomarse nota de que la segunda etapa de transformada se realiza mediante una unidad de transformada QMF 601 y la unidad de transformada QMF 1503, la etapa de filtro paso banda se realiza mediante una unidad de paso banda 602 a ser explicada mas adelante, y la etapa de estiramiento se realiza por el vocoder de fase 603 y la unidad de estiramiento en el tiempo 1504.
Adicionalmente, el segundo espectro QMF de baja frecuencia tiene una resolucion de frecuencia mas fina que el primer espectro QMF de baja frecuencia.
Adicionalmente, la etapa de generacion de alta frecuencia incluye: una etapa de generation del parche de un filtro paso banda del parche armonico de orden bajo para generar parches filtrados paso banda; una etapa de generacion de orden alto de mapeado de cada parche filtrado paso banda a una alta frecuencia para generar parches armonicos de orden alto; y una etapa de suma para la suma de los parches armonicos de orden alto con el parche armonico de orden bajo.
Deberia tomarse nota que la etapa de generacion del parche se realiza por las unidades paso banda 604 y 605, la etapa de generacion de orden alto se realiza por las unidades de extension de frecuencia 606 y 607, y la etapa de suma se realiza por la unidad de adicion 611 a ser explicada mas adelante.
La FIG. 13 es un diagrama que muestra el generador de espectro de AF en el esquema HBE en la presente realization. El generador de espectro de AF incluye la unidad de transformada QMF 601, las unidades de paso banda 602, 604, ..., y 605; el vocoder de fase 603; las unidades de extension de frecuencia 606, ..., y 607, las unidades de alineacion del retardo 608, 609,. y 610; y la unidad de adicion 611.
Una entrada de ancho de banda en BF dada se transforma primero (601) al dominio QMF, se filtra paso banda (602) el espectro QMF es estirado en el tiempo (603) para duplicar la longitud. El espectro QMF estirado se filtra paso banda (604~605) para producir (T-2) espectros de banda limitada. El espectro de banda limitada resultante se traslada (606~607) al espectro de ancho de banda en alta frecuencia. Esos espectros de AF se alinean en retardo (608~610) para compensar las contribuciones diferentes potenciales de retardo del proceso de traslado del espectro y se suman (611) para generar el espectro de AF final. Se deberia tomar nota de que cada uno de los numeros 601 a 611 entre parentesis anteriores indica un elemento constituyente del generador de espectro de AF.
Notese que comparando con la transformada QMF (108 en la FIG. 1), la transformada QMF en el esquema HBE de la presente realizacion (unidad de transformada QMF 601) tiene una resolucion de frecuencia mas fina, la resolucion en el tiempo decreciente se compensara con la operation de estirado subsiguiente.
Comparando el esquema HBE en la presente realizacion con el esquema de la tecnica anterior (FIG. 2), puede verse que las diferencias principales son 1) como en la primera realizacion, se lleva a cabo el proceso de estiramiento en el tiempo en el dominio QMF, no en el dominio de la FFT; 2) se generan parches de orden mas alto basandose en el parche de 2.° orden; 3) el proceso de desplazamiento de tono es tambien llevado a cabo en el dominio QMF, no en el dominio del tiempo.
La FIG. 14 es un diagrama que muestra el decodificador que adopta el generador del espectro de AF en el esquema HBE en la presente realizacion. El decodificador (aparato de decodificacion de audio) incluye una unidad demultiplexora 1501, una unidad de decodificacion 1502, la unidad de transformada QMF 1503, y la unidad estiramiento en el tiempo 1504, una unidad de alineacion del retardo 1505, la unidad de desplazamiento de tono 1506, la unidad de post-procesamiento en AF 1507, la unidad de transformada T-F 1508, una unidad de alineacion del retardo 1509, una unidad de transformada T-F inversa 1510, y una unidad de adicion 1511. Deberia tomarse nota que, en la presente realizacion, la unidad demultiplexora 1501 corresponde a la unidad de separation que separa una senal de ancho de banda en baja frecuencia codificada de la information codificada (flujo de bits). Adicionalmente, la unidad de transformada T-F inversa 1510 corresponde a la unidad de transformada inversa que transforma una senal de ancho de banda completo, a partir de una senal en el dominio del banco de filtros de espejo en cuadratura (QMF) a una senal en el dominio del tiempo.
Con el decodificador, el flujo de bits primero se demultiplexa (1501), entonces se decodifica (1502) la parte de la senal en BF. Para aproximarse a la parte de AF original, la parte de BF (senal de ancho de banda en baja frecuencia) decodificada se transforma (1503) al dominio QMF para generar el espectro QMF de BF. El espectro QMF de BF resultante se estira (1504) a lo largo de la direction temporal para generar un parche de AF de orden bajo. El parche de AF de orden bajo se desplaza en tono (1506) para generar parches de orden alto. Los parches de orden alto resultante se combina con el parche de AF de orden bajo con retardo (1505) para generar el espectro de AF, el espectro de AF se refina adicionalmente (1507) mediante post-procesamiento, bajo la guia de algunos parametros de AF decodificados. Mientras tanto, la parte de BF decodificada tambien se transforma (1508) al dominio QMF. Al final, el espectro de AF refinado es combinado con el espectro de BF (1509) retardado para producir (1512) el espectro de QMF de ancho de banda completo. El espectro QMF de ancho de banda completo resultante se convierte (1510) de vuelta al dominio del tiempo para producir la salida de la senal de audio de banda
5
10
15
20
25
30
35
40
45
50
55
60
ancha decodificada. Se deberia tomar nota de que cada uno de los numeros 1501 a 1512 denota un elemento constituyente del decodificador.
El metodo de desplazamiento del tono
Un algoritmo de desplazamiento de tono basado en QMF (metodo de extension de la frecuencia en el dominio QMF) para la unidad de desplazamiento de tono 1506 en el esquema HBE en la presente realization se disena mediante la descomposicion de las sub-bandas QMF de BF en una pluralidad de sub-sub-bandas, trasponiendo aquellas sub- sub-bandas en sub-bandas de AF, y combinando las sub-bandas de AF resultantes para generar el espectro de AF. Especificamente, la etapa de generation de orden alto incluye: una etapa de division para division de cada sub- banda QMF en cada uno de los parches paso banda en multiples sub-sub-bandas; una etapa de mapeado para mapeado de las sub-sub-pandas a sub-sub-bandas QMF de alta frecuencia; y la etapa de combination para combination de los resultados del mapeado de la sub-sub-banda.
Deberia tomar nota que la etapa de division corresponde a la etapa 1 (901 - 903) a ser descrita mas adelante, la etapa de mapeado corresponde a las etapas 2 y 3 (904~909) a ser descritas mas adelante, y la etapa de combinacion corresponde a la etapa 4 (910) a ser descrita mas adelante.
La FIG. 15 es un diagrama que muestra dicho algoritmo de desplazamiento de tono basado en QMF. Dado un espectro filtrado paso banda del parche de 2.° orden, el espectro de AF de un parche de orden t-esimo (t>2) puede reconstruirse mediante: 1) descomposicion (etapa 1: 901~903) del espectro de BF dado, es decir, cada sub-banda QMF en el interior del espectro de BF se descompone en multiples sub-sub-bandas QMF; 2) escalado (etapa 2: 904~906) de las frecuencias centrales de esas sub-sub-bandas con factor de t/2; 3) mapeado (etapa 3: 907~909) de esas sub-sub-bandas en sub-bandas de AF; 4) suma de todas las sub-sub-bandas mapeadas para formar la sub- banda de AF (etapa 4: 910).
Para la etapa 1, hay disponibles unos pocos metodos para descomponer una sub-banda QMF en multiples sub-sub- bandas para obtener una mejor resolution de frecuencia. Por ejemplo, los denominados filtros de banda M-esima que se adoptan en el codec MPEG sourround. En esta realizacion preferida de la invention, la descomposicion de sub-banda se realiza mediante la aplicacion de un conjunto adicional de bancos de filtros modulados exponencialmente, definidos mediante la (Ecuacion 12) a continuation.
Expresion matematica 12
(Ecuacion 12)
En este caso, q=-Q, -Q+1, ..., 0, 1, ..., Q-1 y n=0, 1, ..., N (donde no es una constante entera, N es el orden del banco de filtro).
Mediante la adoption del banco de filtro anterior, una senal de sub-banda dada, digamos, la senal de sub-banda k-esima x(n,k), se descompone en 2Q senales de sub-sub-banda de acuerdo con la (Ecuacion 13) a continuacion.
Expresion matematica 13
(Ecuacion 13)
En este caso, q=-Q, -Q+1, ..., 0, 1, ..., Q-1. En la ecuacion, "conv(.)" denota la funcion convolution.
Con dicha transformada compleja adicional, el espectro de frecuencias de una sub-banda se divide adicionalmente en 2Q espectros de sub-frecuencia. Desde el punto de vista de la resolucion en frecuencia, si la transformada QMF tiene M bandas, su resolucion de frecuencia de sub-banda asociada es n/M y su resolucion de frecuencia de sub- sub-banda se refina a n/(2Q M). Ademas, el sistema global mostrado en la (Ecuacion 14) es invariante en el tiempo, esto es, libre de defectos de muestreo, a pesar del uso del inframuestreo y muestreo interpolado.
Expresion matematica 14
imagen4
imagen5
<2-i
(Ecuacion 14)
Notese que el banco de filtro adicional anterior esta apilado de modo impar (el factor q+0,5), lo que significa que no hay sub-sub-bandas centradas alrededor del valor de CC. Por el contrario, para un numero Q par, las frecuencias
5
10
15
20
25
30
35
40
45
50
55
60
centrales de las sub-sub-bandas son simetricas alrededor de cero.
La FIG. 16 es un grafico que muestra una distribucion del espectro de sub-sub-bandas. Espedficamente, la FIG. 16 muestra dicha distribucion del espectro del banco de filtros para el caso de Q= 6. La finalidad del apilado impar es facilitar su posterior combinacion en sub-sub-bandas.
Para la etapa 2, el escalado de las frecuencias centrales puede simplificarse considerando las caracteristicas de sobremuestreo de la transformada QMF compleja.
Notese que en el dominio QMF complejo, dado que las bandas de paso de sub-bandas adyacentes se solapan entre si, apareceria un componente de frecuencia en la zona de solape en ambas sub-bandas (vease la Publicacion de la Solicitud de Patente Internacional n.° WO 2006048814).
Como resultado, el escalado de frecuencia puede simplificarse a una cantidad de computacion mitad calculando solamente las frecuencias para aquellas sub-sub-bandas que residen en la banda de paso, esto es, la parte de la frecuencia positiva para una sub-banda par o parte de frecuencia negativa para una sub-banda impar.
Con mas detalle, la sub banda kBF-esima se divide en 2Q sub-sub-bandas. En otras palabras, x(n,kBF) se divide tal como se muestra en la (Ecuacion 15) a continuation.
Expresion matematica 15
imagen6
(Ecuacion 15)
Posteriormente, para producir el parche de orden t-esimo, las frecuencias centrales de esas sub-sub-bandas se escalan usando la (ecuacion 16) a continuacion.
Expresion matematica 16
kB . q, escala
fKBF
J i
kBF + 0,5 +
<7 + 0,5
Jt
M
(Ecuacion 16)
En este caso, q=-Q, -Q+1,..., -1 cuando kBF es impar, o q=0, 1,..., Q-1 cuando kBF es par.
Para la etapa 3, el mapeado de las sub-sub-bandas en la sub-banda de AF tambien necesita tener en cuenta las caracteristicas de la transformada QMF compleja. En la presente realization, dicho proceso de mapeado se lleva a cabo en dos etapas, primero se mapean de forma directa todas las sub-sub-bandas de la banda de paso en la sub- banda de AF; segundo, basandose en los resultados del mapeado anterior, se mapean todas las sub-sub-bandas de la banda de corte a la sub-banda de AF. Espedficamente, la etapa de mapeado incluye: una etapa de division para la division de las sub-sub-bandas de cada una de las sub-bandas QMF en una parte de banda de corte y una parte de banda de paso; una etapa de calculo de frecuencia para el calculo de las frecuencias centrales transpuestas de las sub-sub-bandas en la parte de banda de paso con el factor dependiente del orden del parche; una primera etapa de mapeado para mapeado de la sub-sub-bandas en la parte de la banda de paso en las sub-bandas QMF de alta frecuencia de acuerdo con las frecuencias centrales; y una segunda etapa de mapeado para mapeado de las sub- sub-bandas en la parte de la banda de corte dentro de las sub-bandas Qmf de alta frecuencia de acuerdo con las sub-sub-bandas de la parte de la banda de paso.
Para entender el punto anterior, es ventajoso revisar que relation existe para una pareja de frecuencia positiva y frecuencia negativa para el mismo componente de la senal y sus indices de sub-banda asociados.
Como se ha mencionado anteriormente, en el dominio QMF complejo, un espectro sinusoidal tiene tanto frecuencias positivas como negativas. Espedficamente, el espectro sinusoidal tiene una de entre esas frecuencias en la banda de paso de una sub-banda Qmf y la otra de las frecuencias en la banda de corte de una sub-banda adyacente. Considerando la transformada qMf en una transformada apilada de modo impar, dicho par de componentes de senal pueden ilustrarse en la FIG. 17.
La FIG. 17 es un diagrama que muestra la relacion entre el componente de la banda de paso y el componente de la banda de corte para una sinusoide en el dominio QMF complejo.
En este caso, el area gris indica la banda de corte de una sub-banda. Para una senal sinusoidal arbitraria (en linea continua) en la banda de paso de la sub-banda, su parte de solape (en linea de puntos) se localiza en la banda de corte de la sub-banda adyacente (los dos componentes de frecuencia emparejados se asocian mediante una linea con flechas dobles).
5
10
15
20
25
30
35
40
45
50
Una senal sinusoidal con frecuencia fo tal como se muestra en la (Ecuacion 17) a continuation. Expresion matematica 17
imagen7
El componente de la banda de paso de la senal sinusoidal con la frecuencia fo anteriormente descrita reside en la k-esima sub-banda si se satisface la (Ecuacion 18) a continuacion.
Expresion matematica 18
imagen8
Ademas, su componente de la banda de corte reside en la k-esima sub-banda si se satisface la (Ecuacion 19) a continuacion.
Expresion matematica 19
imagen9
(Ecuacion 19)
Si una sub-banda se descompone en 2Q sub-sub-bandas, la relation anterior se elabora con resolution de frecuencia mas alta tal como se muestra en la FIG. 20 a continuacion.
Expresion matematica 20
K =
{k -1)9 para - <q<-1 cuando k es par; o para <q<Q-1 cuando k es impar
fr + 1), para -Q< q < - cuando k es par; o para 0 <q < y^ cuando k es impar
(Ecuacion 20)
Por lo tanto, en la presente realization, para mapear las sub-sub-bandas en la banda de corte a la sub-banda de AF, es necesario asociarlas con los resultados del mapeado para aquellas sub-sub bandas sobre la banda de paso. La motivation de dicha operation es asegurarse de que los pares de frecuencias para los componentes de BF estan aun emparejados cuando se desplazan hacia arriba a los componentes de AF.
Para esta finalidad, en primer lugar, es directo mapear las sub-sub-bandas en la banda de paso con la sub-banda de AF. Al considerar las frecuencias centrales de las sub-sub-bandas escaladas en frecuencia y la resolucion de frecuencia de la transformada QMF, la funcion de mapeado puede describirse mediante m(k,q) tal como se muestra en la (Ecuacion 21) a continuacion.
Expresion matematica 21
imagen10
(Ecuacion 21)
En este caso, q=-Q, -Q+1,..., -1 si kBF es impar, o q=0, 1,..., Q-1 si kBF es par. En este caso, el coeficiente mostrado en la (Ecuacion 22) a continuacion denota una operacion de redondeo para obtener el entero mas proximo de x hacia menos infinito.
Expresion matematica 22
imagen11
(Ecuacion 22)
5
10
15
20
25
30
35
40
45
50
Ademas, debido al escalado ascendente (t/2>1), es posible que una sub-banda de AF tenga una pluralidad de fuentes de mapeado de sub-sub-bandas. Esto es, es posible que m(k,qi)=m(k,q2) o m(ki,qi)=m(k2,q2). Por lo tanto, una sub-banda de AF podria ser una combination de multiples sub-sub-bandas de sub-bandas de BF, como se muestra en la (Ecuacion 23).
Expresion matematica 23 xpaso{n,kAF)=
todo m(kBF.q)=kAF (Ecuacion 23)
En este caso, q=-Q, -Q+1 -1 si kBF es impar, o q=0, 1,..., Q-1 si kBF es par.
En segundo lugar, siguiendo la relation anteriormente mencionada entre pares de frecuencias e indices de sub- banda, la funcion de mapeado para esas sub-sub-bandas en la banda de corte puede establecerse como sigue.
Considerando una sub banda kBF en BF, las funciones de mapeado de las sub-sub-bandas en sub-banda de paso ya se han decidido mediante la 1.a etapa como: m(kBF,-Q), m(kBF,-Q+1),..., m(kBF,-1) para la kBF impar y m(kBF,0), m(kBF,1),..., m(kBF,Q-1) para la kBF par, entonces la banda de paso asociada con la parte de la banda de corte puede mantenerse de acuerdo con la (Ecuacion 24) a continuation.
Expresion matematica 24
imagen12
i/^BF ’ Q) 1
ij^BF ’ *?) 1
condition a en caso contrario
(Ecuacion 24)
En este caso, "condition a" se refiere a cuando kBF es par y la (Ecuacion 25) a continuacion es par, o cuando kBF es impar y la (Ecuacion 26) a continuacion es par.
Expresion matematica 25
(g + 0,5)-;
Q
(Ecuacion 25)
Expresion matematica 26
t , {q + 0,5) t
L J (Ecuacion 26)
Ademas, tal como se ha descrito anteriormente, la (Ecuacion 27) a continuacion denota una operation de redondeo para obtener los enteros mas proximos de x hacia menos infinito.
Expresion matematica 27
imagen13
(Ecuacion 27)
La sub-banda de AF resultante es la combinacion de todas las sub-sub-bandas de BF asociadas, tal como se muestra en la (Ecuacion 28) a continuacion.
Expresion matematica 28
todo m(kBF ,q)=kAF
(/?)
(Ecuacion 28)
En este caso, q=-Q, -Q+1,..., -1 si kBF es par, o q=0, 1,..., Q-1 si kBF es impar.
Al final, todos los resultados de mapeado en la banda de paso y la banda de corte se combinan para formar la sub- banda de AF, tal como se muestra en la (Ecuacion 29) a continuacion.
5
10
15
20
25
30
35
40
45
50
55
Expresion matematica 29
x{n, kAF ) = xpaso (n, kAF ) + Xcorte («, k AF)
(Ecuacion 29)
Notese que el metodo de desplazamiento de tono anterior en el dominio QMF beneficia tanto a la degradacion de la calidad en alta frecuencia como al posible problema de manejo de transitorios.
En primer lugar, todos los parches tienen ahora el mismo factor de estiramiento, el mas pequeno, lo que reduce ampliamente los ruidos en alta frecuencia (procedentes de esos componentes de senal incorrectos generados durante el estiramiento en el tiempo). En segundo lugar, todas las fuentes de contribucion para la degradacion de transitorios se evitan. Esto es, no hay proceso de remuestreo en el dominio del tiempo; se usan los mismos factores de estiramiento para todos los parches, lo que elimina inherentemente la posibilidad de desalineacion.
Ademas, se debena tomar nota de que la presente realizacion tiene algunos inconvenientes en la resolucion de frecuencia. Notese que debido a la adopcion del filtrado de sub-sub-banda, la resolucion de frecuencia se incrementa desde n/M a n/(2QM), pero es aun mas gruesa que la resolucion de frecuencia fina del remuestreo en el dominio del tiempo (n/L). En cualquier caso, considerando que el ofdo humano tiene menos sensibilidad a los componentes de alta frecuencia de la senal, el desplazamiento de tono resultante producido por la presente realizacion se ha probado que es perceptualmente no diferente al producido por el metodo de remuestreo.
Aparte de lo anterior, comparando con el esquema HBE en la primera realizacion, el esquema HBE en la presente realizacion tambien proporciona un beneficio con cantidad de computacion adicionalmente reducida, debido a que solo un parche de orden bajo necesita operacion de estiramiento en el tiempo.
De nuevo, dicha reduccion en la cantidad de computacion puede ser aproximadamente analizada considerado solamente la cantidad de computacion a la que contribuyen las transformadas.
Siguiendo las suposiciones en el analisis de la cantidad de computacion anteriormente mencionadas, la cantidad de computacion de transformada implicada en el generador de espectro de AF en la presente realizacion se aproxima como se muestra a continuacion.
Expresion matematica 30
(Ecuacion 30)
imagen14
Por lo tanto, la tabla 1 puede actualizarse como sigue. Tabla 2
Tabla 2. Comparacion de la cantidad de computacion entre la HBE en la presente realizacion y el esquema HBE en _______________________________________el primer ejemplo______________________________________
Numero de parches armonicos (T)
Cantidad de computacion de transformada implicada en la HBE en la presente realizacion Cantidad de computacion de transformada implicada en la HBE en el primer ejemplo Ratios de cantidad de computacion
3
20480 33335 61,4 %
4
20480 42551 48,1 %
5
20480 49660 41,2 %
La presente invencion es una nueva tecnologfa HBE para codificacion de audio con baja tasa de bits. Usando esta tecnologfa, una senal en banda ancha puede reconstruirse basandose en una senal en ancho de banda de baja frecuencia mediante la generacion de su parte de alta frecuencia (AF) a traves de estiramiento en el tiempo y extension de la frecuencia de la parte de baja frecuencia (BF) en el dominio QMF. En comparacion con la tecnologfa de HBE de la tecnica anterior, la presente invencion proporciona una calidad de sonido comparable y mucha menor cantidad de computacion. Dicha tecnologfa puede desplegarse en aplicaciones tales como telefonos moviles, teleconferencia, etc., en donde el codec de audio funciona con una baja tasa de bits con cantidad de computacion baja.
Debena tomarse nota que cada uno de los bloques de funcion en los diagramas de bloques (Figs. 6, 7, 13, 14 y otros mas) se realizan normalmente como un LSI que es un circuito integrado. Los bloques de funcion pueden realizarse como chips individuales separados, o como un unico chip para incluir una parte o todos entre los mismos.
5
10
15
20
25
30
35
40
Aunque se hace referencia aqui a un LSI, hay casos en donde las designaciones IC, sistema LSI, super LSI, ultra LSI se usan debido a la diferencia en el grado de integracion.
Ademas, los medios para la integracion de circuitos no estan limitados a un LSI, y hay tambien disponible una implementacion con un circuito dedicado o un procesador de proposito general. Es tambien aceptable usar una Matriz de Puertas Programables en Campo (FPGA) que permite la programacion despues de que se haya fabricado el LSI, y un procesador configurable en el que las conexiones y ajustes de las celulas del circuito dentro del LSI son reconfigurables.
Adicionalmente, si una tecnologia de circuitos integrados que sustituya al LSI aparece a lo largo del progreso de la tecnologia de semiconductores u otra tecnologia derivada, esa tecnologia puede usarse naturalmente para llevar a cabo la integracion de los bloques de funcion.
Adicionalmente, entre los bloques de funcion respectivos, la unidad que almacena datos a ser codificados o decodificados puede fabricarse dentro de una estructura separada sin estar incluida en el chip unico.
Aplicabilidad industrial
La presente invention se refiere a una nueva tecnologia de extension del ancho de banda armonico (HBE) para codification de audio con baja tasa de bits. Con la tecnologia, una senal de banda ancha puede reconstruirse basandose en la senal en ancho de banda de baja frecuencia mediante la generation de su parte de alta frecuencia (AF) a traves de estiramiento en el tiempo y extension de la frecuencia de la parte de baja frecuencia (BF) en el dominio QMF. En comparacion con la tecnologia HBE de la tecnica anterior, la presente invencion proporciona una calidad de sonido comparable y mucha menor cantidad de computation. Dicha tecnologia puede desplegarse en aplicaciones tales como telefonos moviles, teleconferencia, etc., en donde el codec de audio funciona con una baja tasa de bits con baja cantidad de computacion.
Lista de signos de referencia
501-503, 602, 604, 605 504-506
507-509, 601, 1404, 1505 510-512, 603
513-515, 608-610, 1407, 1505, 1509 516, 611, 1410, 1511, 1512 606, 607
1401, 1501
1402, 1502 1403
1405, 1504
1406, 1508 1409, 1510 1506
Unidad de paso de banda
Unidad de muestreo
Unidad de transformada QMF
Vocoder de fase
Unidad de alineacion del retardo
Unidad de adicion
Unidad de extension de frecuencia
Unidad demultiplexora
Unidad decodificadora
Unidad de remuestreo en el tiempo
Unidad de estiramiento en el tiempo
Unidad de transformada T-F
Unidad de transformada T-F inversa
Unidad de desplazamiento de tono

Claims (8)

  1. 5
    10
    15
    20
    25
    30
    35
    40
    45
    50
    55
    60
    65
    REIVINDICACIONES
    1. Un metodo de extension del ancho de banda para la produccion de una senal de audio de ancho de banda completo a partir de una senal de audio de ancho de banda en baja frecuencia, comprendiendo dicho metodo:
    una primera etapa de transformada (S21) de la transformacion de la senal de ancho de banda en baja frecuencia en un dominio en el banco de filtros de espejo en cuadratura (QMF) para generar un primer espectro QMF de baja frecuencia;
    una etapa de generacion de un parche armonico de orden bajo (S22) de la generacion de un parche armonico de orden bajo mediante estiramiento en el tiempo de la senal de ancho de banda en baja frecuencia en un dominio QMF;
    una etapa de generacion de alta frecuencia (S23) de (i) generacion de senales que estan desplazadas en el tono, mediante la aplicacion de diferentes coeficientes de desplazamiento al parche armonico de orden bajo, y (ii) generacion de un espectro QMF de alta frecuencia a partir de las senales;
    una etapa de modificacion de espectro (S24) de modificacion del espectro QMF de alta frecuencia para satisfacer las condiciones de energia y tonalidad de alta frecuencia; y
    una etapa de generacion de ancho de banda completo (S25) de la generacion de la senal en ancho de banda completo mediante la combinacion del espectro qMf de alta frecuencia modificado con el primer espectro QMF de baja frecuencia.
  2. 2. El metodo de extension del ancho de banda de acuerdo con la reivindicacion 1, en el que dicha etapa de generacion del parche armonico de orden bajo incluye:
    una segunda etapa de transformada de transformacion de la senal de ancho de banda en baja frecuencia en un segundo espectro QMF de baja frecuencia, y
    el segundo espectro QMF de baja frecuencia tiene una resolucion de frecuencia mas fina que el primer espectro QMF de baja frecuencia.
  3. 3. El metodo de extension del ancho de banda de acuerdo con una de las reivindicaciones 1 y 2, en el que dicha etapa de generacion de alta frecuencia incluye:
    una etapa de generacion de parche de paso banda del parche armonico de orden bajo para generar parches filtrados paso banda;
    una etapa de generacion de orden alto de mapeado de cada uno de los parches filtrados paso banda en alta frecuencia para generar parches armonicos de orden alto; y
    una etapa de suma de la suma de los parches armonicos de orden alto con el parche armonico de orden bajo.
  4. 4. El metodo de extension del ancho de banda de acuerdo con la reivindicacion 3, en el que dicha etapa de generacion de orden alto incluye:
    una etapa de division para la division en multiples sub-sub-bandas de cada sub-banda QMF en cada uno de los parches filtrados paso banda;
    una etapa de mapeado del mapeado de las sub-sub-bandas en sub-bandas QMF de alta frecuencia; y una etapa de combinacion de la combinacion de los resultados del mapeado de las sub-sub-bandas.
  5. 5. El metodo de extension del ancho de banda de acuerdo con la reivindicacion 4, en el que dicha etapa de mapeado incluye:
    una etapa de division de la division de las sub-sub-bandas de cada una de las sub-bandas QMF en una parte de banda de corte y una parte de banda de paso;
    una etapa de calculo de frecuencia del calculo de las frecuencias centrales transpuestas de las sub-sub-bandas sobre la parte de la banda de paso con el factor dependiente del orden del parche;
    una primera etapa de mapeado del mapeado de las sub-sub-bandas en la parte de la banda de paso en sub- bandas QMF de alta frecuencia de acuerdo con las frecuencias centrales; y
    una segunda etapa de mapeado del mapeado de las sub-sub-bandas en la parte de la banda de corte en las sub-bandas QMF de alta frecuencia de acuerdo con las sub-sub-bandas de la parte de la banda de paso.
  6. 6. Un aparato de extension del ancho de banda que produce una senal de audio de ancho de banda completo a partir de una senal de audio de ancho de banda de baja frecuencia, comprendiendo dicho aparato de extension del ancho de banda:
    una primera unidad de transformada (1503) configurada para la transformacion de la senal de ancho de banda en baja frecuencia en un dominio en el banco de filtros de espejo en cuadratura (QMF) para generar un primer espectro QMF de baja frecuencia;
    una unidad de generacion de un parche armonico de orden bajo (1504) configurada para generar un parche
    5
    10
    15
    20
    25
    30
    35
    40
    45
    50
    armonico de orden bajo mediante estiramiento en el tiempo de la senal de ancho de banda en baja frecuencia en un dominio QMF;
    una unidad de generacion de alta frecuencia (1506) configurada para (i) generar senales que estan desplazadas en el tono, mediante la aplicacion de diferentes coeficientes de desplazamiento al parche armonico de orden bajo, y (ii) generar un espectro QMF de alta frecuencia a partir de las senales;
    una unidad de modificacion de espectro (1507) configurada para modificar el espectro QMF de alta frecuencia para satisfacer las condiciones de energia y tonalidad de alta frecuencia; y
    una unidad de generacion del ancho de banda completo (1512) configurada para generar la senal en ancho de banda completo mediante la combinacion del espectro QMF de alta frecuencia modificado con el primer espectro QMF de baja frecuencia.
  7. 7. Un circuito integrado que produce una senal de audio de ancho de banda completo a partir de una senal de audio de ancho de banda en baja frecuencia, que comprende:
    una primera unidad de transformada configurada para transformar la senal de ancho de banda en baja frecuencia en un dominio en el banco de filtro de espejo en cuadratura (QMF) para generar un primer espectro QMF de baja frecuencia;
    una unidad de generacion de un parche armonico de orden bajo configurada para generar un parche armonico de orden bajo mediante estiramiento en el tiempo de la senal de ancho de banda en baja frecuencia en un dominio QMF;
    una unidad de generacion de alta frecuencia configurada para (i) generar senales que estan desplazadas en el tono, mediante la aplicacion de diferentes coeficientes de desplazamiento al parche armonico de orden bajo, y (ii) generar un espectro QMF de alta frecuencia a partir de las senales;
    una unidad de modificacion de espectro configurada para modificar el espectro QMF de alta frecuencia para satisfacer las condiciones de energia y tonalidad de alta frecuencia; y
    una unidad de generacion de ancho de banda completo configurada para generar la senal en ancho de banda completo mediante la combinacion del espectro QMF de alta frecuencia modificado con el primer espectro QMF de baja frecuencia.
  8. 8. Un aparato de decodificacion de audio que comprende:
    una unidad de separacion configurada para separar una senal de ancho de banda en baja frecuencia codificada de la informacion codificada;
    una unidad de decodificacion configurada para decodificar la senal en ancho de banda de baja frecuencia codificada;
    una unidad de transformada configurada para transformar la senal de ancho de banda en baja frecuencia generada a traves de la decodificacion mediante dicha unidad de decodificacion, en un dominio en el banco de filtro de espejo en cuadratura (QMF) para generar un espectro QMF de baja frecuencia;
    una unidad de generacion de un parche armonico de orden bajo configurada para generar un parche armonico de orden bajo mediante estiramiento en el tiempo de la senal de ancho de banda en baja frecuencia en un dominio QMF;
    una unidad de generacion de la alta frecuencia configurada para (i) generar senales que estan desplazadas en el tono, mediante la aplicacion de diferentes coeficientes de desplazamiento al parche armonico de orden bajo, y (ii) generar un espectro QMF de alta frecuencia a partir de las senales;
    una unidad de modificacion de espectro configurada para modificar el espectro QMF de alta frecuencia para satisfacer las condiciones de energia y tonalidad de alta frecuencia;
    una unidad de generacion de ancho de banda completo configurada para generar la senal en ancho de banda completo mediante la combinacion del espectro QMF de alta frecuencia modificado con el primer espectro QMF de baja frecuencia; y
    una unidad de transformada inversa configurada para transformar la senal de ancho de banda completo, desde el dominio del banco del filtro de espejo en cuadratura (QMF) a una senal en el dominio del tiempo.
ES11792129.6T 2010-06-09 2011-06-06 Método de extensión del ancho de banda, aparato de extensión del ancho de banda, programa, circuito integrado y aparato de decodificación de audio Active ES2565959T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2010132205 2010-06-09
JP2010132205 2010-06-09
PCT/JP2011/003168 WO2011155170A1 (ja) 2010-06-09 2011-06-06 帯域拡張方法、帯域拡張装置、プログラム、集積回路およびオーディオ復号装置

Publications (1)

Publication Number Publication Date
ES2565959T3 true ES2565959T3 (es) 2016-04-07

Family

ID=45097787

Family Applications (1)

Application Number Title Priority Date Filing Date
ES11792129.6T Active ES2565959T3 (es) 2010-06-09 2011-06-06 Método de extensión del ancho de banda, aparato de extensión del ancho de banda, programa, circuito integrado y aparato de decodificación de audio

Country Status (19)

Country Link
US (5) US9093080B2 (es)
EP (2) EP2581905B1 (es)
JP (2) JP5243620B2 (es)
KR (1) KR101773631B1 (es)
CN (1) CN102473417B (es)
AR (1) AR082764A1 (es)
AU (1) AU2011263191B2 (es)
BR (1) BR112012002839B1 (es)
CA (1) CA2770287C (es)
ES (1) ES2565959T3 (es)
HU (1) HUE028738T2 (es)
MX (1) MX2012001696A (es)
MY (1) MY176904A (es)
PL (1) PL2581905T3 (es)
RU (1) RU2582061C2 (es)
SG (1) SG178320A1 (es)
TW (1) TWI545557B (es)
WO (1) WO2011155170A1 (es)
ZA (1) ZA201200919B (es)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5339919B2 (ja) * 2006-12-15 2013-11-13 パナソニック株式会社 符号化装置、復号装置およびこれらの方法
PL4231291T3 (pl) * 2008-12-15 2024-04-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Dekoder powiększania szerokości pasma audio, powiązany sposób oraz program komputerowy
JP5762620B2 (ja) * 2011-03-28 2015-08-12 ドルビー ラボラトリーズ ライセンシング コーポレイション 低周波数エフェクトチャネルのための複雑さが低減された変換
KR101816506B1 (ko) * 2012-02-23 2018-01-09 돌비 인터네셔널 에이비 고 주파수 오디오 콘텐트의 효율적인 복구를 위한 방법들 및 시스템들
CN104221082B (zh) 2012-03-29 2017-03-08 瑞典爱立信有限公司 谐波音频信号的带宽扩展
US9252908B1 (en) * 2012-04-12 2016-02-02 Tarana Wireless, Inc. Non-line of sight wireless communication system and method
EP2682941A1 (de) 2012-07-02 2014-01-08 Technische Universität Ilmenau Vorrichtung, Verfahren und Computerprogramm für frei wählbare Frequenzverschiebungen in der Subband-Domäne
EP2709106A1 (en) * 2012-09-17 2014-03-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating a bandwidth extended signal from a bandwidth limited audio signal
EP2717261A1 (en) 2012-10-05 2014-04-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder, decoder and methods for backward compatible multi-resolution spatial-audio-object-coding
KR20140075466A (ko) * 2012-12-11 2014-06-19 삼성전자주식회사 오디오 신호의 인코딩 및 디코딩 방법, 및 오디오 신호의 인코딩 및 디코딩 장치
EP2784775B1 (en) * 2013-03-27 2016-09-14 Binauric SE Speech signal encoding/decoding method and apparatus
CN105408957B (zh) * 2013-06-11 2020-02-21 弗朗霍弗应用研究促进协会 进行语音信号的频带扩展的装置及方法
EP2830061A1 (en) 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
KR102329309B1 (ko) * 2013-09-12 2021-11-19 돌비 인터네셔널 에이비 Qmf 기반 처리 데이터의 시간 정렬
EP3063761B1 (en) * 2013-10-31 2017-11-22 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung E.V. Audio bandwidth extension by insertion of temporal pre-shaped noise in frequency domain
CN111312277B (zh) * 2014-03-03 2023-08-15 三星电子株式会社 用于带宽扩展的高频解码的方法及设备
TWI834582B (zh) * 2018-01-26 2024-03-01 瑞典商都比國際公司 用於執行一音訊信號之高頻重建之方法、音訊處理單元及非暫時性電腦可讀媒體
CN111210831B (zh) * 2018-11-22 2024-06-04 广州广晟数码技术有限公司 基于频谱拉伸的带宽扩展音频编解码方法及装置
CN112863477B (zh) * 2020-12-31 2023-06-27 出门问问(苏州)信息科技有限公司 一种语音合成方法、装置及存储介质
CN113257268B (zh) * 2021-07-02 2021-09-17 成都启英泰伦科技有限公司 结合频率跟踪和频谱修正的降噪和单频干扰抑制方法

Family Cites Families (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3785189T2 (de) 1987-04-22 1993-10-07 Ibm Verfahren und Einrichtung zur Veränderung von Sprachgeschwindigkeit.
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
CN1272911C (zh) * 2001-07-13 2006-08-30 松下电器产业株式会社 音频信号解码装置及音频信号编码装置
US20030187663A1 (en) * 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
US7555434B2 (en) * 2002-07-19 2009-06-30 Nec Corporation Audio decoding device, decoding method, and program
JP4380174B2 (ja) * 2003-02-27 2009-12-09 沖電気工業株式会社 帯域補正装置
KR101106026B1 (ko) 2003-10-30 2012-01-17 돌비 인터네셔널 에이비 오디오 신호 인코딩 또는 디코딩
EP2632076A3 (en) 2004-04-15 2013-11-20 QUALCOMM Incorporated Multi-carrier communications methods and apparatus
ES2791001T3 (es) 2004-11-02 2020-10-30 Koninklijke Philips Nv Codificación y decodificación de señales de audio mediante el uso de bancos de filtros de valor complejo
EP1905002B1 (en) 2005-05-26 2013-05-22 LG Electronics Inc. Method and apparatus for decoding audio signal
JP2008542816A (ja) 2005-05-26 2008-11-27 エルジー エレクトロニクス インコーポレイティド オーディオ信号の符号化及び復号化方法
DE102005032724B4 (de) * 2005-07-13 2009-10-08 Siemens Ag Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen
KR101171098B1 (ko) * 2005-07-22 2012-08-20 삼성전자주식회사 혼합 구조의 스케일러블 음성 부호화 방법 및 장치
US7706905B2 (en) 2005-07-29 2010-04-27 Lg Electronics Inc. Method for processing audio signal
US20080221907A1 (en) 2005-09-14 2008-09-11 Lg Electronics, Inc. Method and Apparatus for Decoding an Audio Signal
EP1946295B1 (en) 2005-09-14 2013-11-06 LG Electronics Inc. Method and apparatus for decoding an audio signal
KR100958144B1 (ko) 2005-11-04 2010-05-18 노키아 코포레이션 오디오 압축
CN101361119B (zh) 2006-01-19 2011-06-15 Lg电子株式会社 处理媒体信号的方法和装置
EP1974347B1 (en) 2006-01-19 2014-08-06 LG Electronics Inc. Method and apparatus for processing a media signal
KR101366291B1 (ko) 2006-01-19 2014-02-21 엘지전자 주식회사 신호 디코딩 방법 및 장치
JP2009532712A (ja) 2006-03-30 2009-09-10 エルジー エレクトロニクス インコーポレイティド メディア信号処理方法及び装置
JP2007272059A (ja) 2006-03-31 2007-10-18 Sony Corp オーディオ信号処理装置,オーディオ信号処理方法,プログラムおよび記憶媒体
WO2008022181A2 (en) * 2006-08-15 2008-02-21 Broadcom Corporation Updating of decoder states after packet loss concealment
US20080235006A1 (en) 2006-08-18 2008-09-25 Lg Electronics, Inc. Method and Apparatus for Decoding an Audio Signal
US9653088B2 (en) 2007-06-13 2017-05-16 Qualcomm Incorporated Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding
US8688441B2 (en) * 2007-11-29 2014-04-01 Motorola Mobility Llc Method and apparatus to facilitate provision and use of an energy value to determine a spectral envelope shape for out-of-signal bandwidth content
DE102008015702B4 (de) 2008-01-31 2010-03-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals
EP3273442B1 (en) * 2008-03-20 2021-10-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for synthesizing a parameterized representation of an audio signal
US8532983B2 (en) * 2008-09-06 2013-09-10 Huawei Technologies Co., Ltd. Adaptive frequency prediction for encoding or decoding an audio signal
CA3076203C (en) * 2009-01-28 2021-03-16 Dolby International Ab Improved harmonic transposition
EP2239732A1 (en) 2009-04-09 2010-10-13 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for generating a synthesis audio signal and for encoding an audio signal
CO6440537A2 (es) 2009-04-09 2012-05-15 Fraunhofer Ges Forschung Aparato y metodo para generar una señal de audio de sintesis y para codificar una señal de audio
TWI675367B (zh) 2009-05-27 2019-10-21 瑞典商杜比國際公司 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體
ES2400661T3 (es) 2009-06-29 2013-04-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codificación y decodificación de extensión de ancho de banda
WO2011047886A1 (en) * 2009-10-21 2011-04-28 Dolby International Ab Apparatus and method for generating a high frequency audio signal using adaptive oversampling
CA2792452C (en) * 2010-03-09 2018-01-16 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for processing an input audio signal using cascaded filterbanks

Also Published As

Publication number Publication date
US20220246159A1 (en) 2022-08-04
RU2012104234A (ru) 2014-07-20
CN102473417B (zh) 2015-04-08
BR112012002839A2 (pt) 2017-02-14
BR112012002839A8 (pt) 2017-10-10
EP3001419A1 (en) 2016-03-30
KR20130042460A (ko) 2013-04-26
RU2582061C2 (ru) 2016-04-20
US9093080B2 (en) 2015-07-28
MX2012001696A (es) 2012-02-22
ZA201200919B (en) 2013-07-31
TW201207840A (en) 2012-02-16
AR082764A1 (es) 2013-01-09
US20150248894A1 (en) 2015-09-03
US20120136670A1 (en) 2012-05-31
US9799342B2 (en) 2017-10-24
US20170358307A1 (en) 2017-12-14
CA2770287C (en) 2017-12-12
EP2581905A1 (en) 2013-04-17
US11341977B2 (en) 2022-05-24
JP5243620B2 (ja) 2013-07-24
PL2581905T3 (pl) 2016-06-30
KR101773631B1 (ko) 2017-08-31
BR112012002839B1 (pt) 2020-10-13
WO2011155170A1 (ja) 2011-12-15
US10566001B2 (en) 2020-02-18
CN102473417A (zh) 2012-05-23
CA2770287A1 (en) 2011-12-15
HUE028738T2 (en) 2017-01-30
JP2013084018A (ja) 2013-05-09
MY176904A (en) 2020-08-26
EP2581905B1 (en) 2016-01-06
JP5750464B2 (ja) 2015-07-22
AU2011263191B2 (en) 2016-06-16
JPWO2011155170A1 (ja) 2013-08-01
US11749289B2 (en) 2023-09-05
EP3001419B1 (en) 2020-01-22
US20200135217A1 (en) 2020-04-30
SG178320A1 (en) 2012-03-29
AU2011263191A1 (en) 2012-03-01
EP2581905A4 (en) 2014-11-05
TWI545557B (zh) 2016-08-11

Similar Documents

Publication Publication Date Title
ES2565959T3 (es) Método de extensión del ancho de banda, aparato de extensión del ancho de banda, programa, circuito integrado y aparato de decodificación de audio
US20240135939A1 (en) Apparatus and method for processing an input audio signal using cascaded filterbanks
CA2966469C (en) Improved harmonic transposition
BRPI1007528A2 (pt) sistema para gerar um sinal de saída a partir de um sinal de entrada usando um fator de transposição t, sistema para decodificar um sinal de multimídia, método para transpor um sinal de entrada por um fator de transposição t, programa de software e meio de armazenamento
AU2020201239A1 (en) Improved Harmonic Transposition