ES2613941T3 - Codificador de audio y descodificador de extensión de ancho de banda - Google Patents

Codificador de audio y descodificador de extensión de ancho de banda Download PDF

Info

Publication number
ES2613941T3
ES2613941T3 ES09797003.2T ES09797003T ES2613941T3 ES 2613941 T3 ES2613941 T3 ES 2613941T3 ES 09797003 T ES09797003 T ES 09797003T ES 2613941 T3 ES2613941 T3 ES 2613941T3
Authority
ES
Spain
Prior art keywords
high frequency
signal
bandwidth extension
audio signal
parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES09797003.2T
Other languages
English (en)
Inventor
Frederik Nagel
Sascha Disch
Guillaume Fuchs
Jürgen HERRE
Christian Griebel
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Application granted granted Critical
Publication of ES2613941T3 publication Critical patent/ES2613941T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • G10L19/265Pre-filtering, e.g. high frequency emphasis prior to encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Abstract

Un codificador de audio (100), (400), (1500) para proveer una señal de salida (132) utilizando una señal de audio de entrada (102), que comprende: un generador de parche (110) configurado para generar por lo menos una señal de alta frecuencia de extensión de ancho de banda (112), en donde la señal de alta frecuencia de extensión de ancho de banda (112) comprende una banda de alta frecuencia, en donde la banda de alta frecuencia de una señal de alta frecuencia de extensión de ancho de banda(112) está basada en una banda de baja frecuencia de la señal de audio de entrada (102), y en donde diferentes señales de alta frecuencia de extensión de ancho de banda (112) comprenden diferentes frecuencias dentro de sus bandas de alta frecuencia, si se generan señales de alta frecuencia de extensión de ancho de banda diferentes; un comparador (120) configurado para calcular una pluralidad de parámetros de comparación, en donde un parámetro de comparación es calculado en base a una comparación de la señal de audio de entrada (102) y una señal de alta frecuencia de extensión de ancho de banda generada (112), en donde cada parámetro de comparación de la pluralidad de parámetros de comparación es calculado en base a una frecuencia desplazada diferente entre la señal de audio de entrada (102) y una señal de alta frecuencia de extensión de ancho de banda generada (112), y en donde el comparador (120) está configurado para determinar el parámetro de comparación a partir de la pluralidad de parámetros de comparación, en donde el parámetro de comparación determinado satisface un criterio predefinido; y una interfase de salida (130) configurada para proveer la señal de salida (132) para transmisión o almacenamiento, en donde la señal de salida (132) comprende un indicación de parámetro basada en una frecuencia desplazada correspondiente al parámetro de comparación determinado.

Description

5
10
15
20
25
30
35
40
45
50
55
60
DESCRIPCION
Codificador de audio y descodificador de extension de ancho de banda
Las realizaciones de acuerdo con la invencion son concernientes con el procesamiento de senales de audio y en particular, con un codificador de audio, un metodo para proveer una senal de salida, un descodificador de extension de ancho de banda y un metodo para proveer una senal de audio extendida en ancho de banda.
La codificacion adaptada a la audicion de senales de audio para reduccion de datos para un almacenamiento y transmision eficiente de estas senales ha ganado aceptacion en muchos campos. Algoritmos de codificacion son conocidos, por ejemplo, tales como MPEG A CAPA 3, “MP3” o MPEG 4 AAC. El algoritmo de codificacion usado para esto, en particular cuando se obtienen proporciones de bits mas bajas, conduce a la reduccion de la calidad de audio que es frecuentemente provocada principalmente por una limitacion lateral del codificador del ancho de banda de la senal de audio a ser transmitida. Una senal filtrada en paso de bajos es codificada utilizando un llamado codificador de nucleo o codificador central y la region con frecuencias mas altas es parametrizada, de tal manera que pueden ser reconstruidas aproximadamente a partir de la senal filtrada en paso de bajos.
Es conocido de WO 98 57436 sobre toda senal de audio a una limitacion de banda en tal situacion en el lado del codificador y codificar solamente una banda mas baja de la senal de audio por medio de un codificador de audio de alta calidad. La banda superior, sin embargo, es solo caracterizada muy burdamente, esto es, por un conjunto de parametros que permiten la reproduccion de la envolvente espectral original de la banda superior. En el lado del descodificador, la banda superior es luego sintetizada. Para este proposito, se propone una transposicion armonica, en donde la banda inferior de la senal de audio descodificada es suministrada a un banco de filtros. Canales de banco de filtros de la banda inferior son conectados a canales de banco de filtros de la banda superior, o son “parcheados” (interconectados), y cada senal de paso de banda parcheada es sometida a un ajuste de envolvente. El banco de filtros de slntesis perteneciente a un banco de filtros de analisis especial recibe aqul senales de paso de banda de la senal de audio en la banda inferior y senales de paso de banda ajustadas a la envolvente de la banda inferior que fueron parcheadas armonicamente a la banda superior. La senal de salida del banco de filtros de slntesis es una senal de audio extendida con respecto a su ancho de banda de audio que fue transmitida del lado del codificador al lado del descodificador con una proporcion de datos muy baja. En particular, los calculos de banco de filtros y parcheo en el dominio de banco de filtros se puede convertir en un esfuerzo computacional alto.
Metodos de complejidad producida para una extension de ancho de banda de senales de audio de banda limitada en lugar de esto utilizan una funcion de copia de ofrecerles la senal de baja frecuenta (LS) al intervalo de alta frecuencia (HF), con el fin de aproximar informacion perdida debido a la limitacion de banda. Tales metodos son descritos en M. Dietz, L. Liljeryd, K. Kjorling y 0. Kunz, "Spectral Band Replication, a novel approach in audio coding," en la 112a Convencion AES, Munich, Mayo de 2002; S. Meltzer, R. Bohm y F. Henn, "SBR enhanced audio codecs for digital broadcasting such as "Digital Radio Mondiale" (DRM)," 112a Convencion AES, Munich, Mayo de 2002; T. Ziegler, A. Ehret, P. Ekstrand y M. Lutzky, "Enhancing mp3 with SBR: Features and Capabilities of the new mp3PRO Algorithm," en 112a Convencion AeS, Munich, Mayo de 2002; International Standard ISO/IEC 14496-3:2001/FPDAM l, "Bandwidth Extension," ISO/IEC, 2002, o "Speech bandwidth extension method and apparatus", Vasu Iyengar et al. Patente estadounidense No. 5,455,888.
En estos metodos, no se efectua ninguna transposicion armonica, pero los canales del banco de filtros de fase de banda adyacentes de la banda inferior son introducidos artificialmente a canales del banco de filtros adyacentes de la banda superior. Esto conduce a una aproximacion burda de la banda superior de la senal de audio. Esta aproximacion burda de la senal es luego, en una etapa adicional, reclinada al definir parametros de control adicionales deducidos de la senal original. Como un ejemplo, el estandar de MPEG-4 utiliza factores estandar para ajustar la envolvente espectral, una combinacion de filtracion inversa y adicion de un piso de ruido para adaptar la tonalidad e inserciones de porciones de senal sinusoidales para complementacion de componentes tonales.
Aparte de esto, existen metodos adicionales tales como la llamada “extension de ancho de banda ciega”, descrita en E. Larsen, R.M. Aarts y M. Danessis, “Efficient high-frequency bandwidth extension of music and speech”, en 112a Convencion AES, Munich, Alemania, Mayo de 2002 en donde no se usa ninguna informacion del intervalo de HF original. Ademas, tambien existe el metodo de la llamada “extension de ancho de banda artificial” que es descrito en K. Kayhko, A Robust Wideband Enhancement for Narrowband Speech Signal; Research Report, Helsinki University of Technology, Laboratory of Acoustics and Audio signal Processing, 2001.
En J. Makinen et al.: AMR-WB+: a new audio coding standard for 3rd generation mobile audio services Broadcasts, IEEE, ICASSP '05 se describe un metodo para extension de ancho de banda, en donde la operacion de copia de componentes de baja frecuencia a la banda alta es efectuada por una operacion de reflejo o espejo obtenida, por ejemplo, mediante
5
10
15
20
25
30
35
40
45
50
55
60
toma de muestras ascendentes de la senal filtrada en paso de bajos.
Como una alternativa, una modulacion de banda lateral individual puede ser empleada que es basicamente equivalente a una operacion de copia en el dominio de banco de filtros. Metodos que habilitan una extension de ancho de banda armonica emplean usualmente una etapa de determinacion del paso (rastreo de paso), una etapa de distorsion no lineal (vease, por ejemplo, “U. Kornagel, Spectral widening of the excitation signal for telephone-band speech enhancement, en: Proceedings of the IWAENC, Darmstadt, Alemania, Septiembre de 2001, pp. 215 - 218”) o hacen uso de vocodificadores de fase tales como por ejemplo como se muestran por la solicitud de patente estadounidense provisional “F.Nagel, S. Disch: “Apparatus and method of harmonic bandwidth extension in audio signals”” con el numero de solicitud US 61/025129.
El documento WO 02/41302 A1, por ejemplo, muestra un metodo para mejorar el desempeno de sistemas de codificacion que usan metodos de reconstruccion de alta frecuencia. Muestra como mejorar el desempeno global de tales sistemas por medio de una adaptacion sobre el tiempo de la frecuencia de cruce entre la banda baja codificada por un codificador central y la banda alta codificada por un sistema de reconstruccion de alta frecuencia. Para este metodo, el codificador de nucleo o codificador central debe ser apto de trabajar con diferentes frecuencias de cruce en el lado del codificador, tambien como en el lado del descodificador. Por consiguiente, la complejidad del codificador del nucleo o codificador central es incrementada.
Tecnologlas adicionales para extensiones de bandas son descritas, por ejemplo, en “R. M. Aarts, E. Larsen y O. Ouweltjes, A unified approach to low- and high-frequency bandwidth extension. En 115a Convention AES, Nueva York, EUA, Octubre de 2003”, E. Larsen y R. M. Aarts: Audio Bandwidth Extension - Application to psychoacoustics, Signal Processing and Loudspeaker Design. John Wiley e hijos, Ltd, 2004”, E. Larsen, R. M. Aarts y M. Danessis: Efficient high- frequency bandwidth extension of music and speech. En 112a Convencion AES 112th, Munich, Alemania, Mayo de 2002”, “J. Makhoul: Spectral Analysis of Speech by Linear Prediction. IEEE Transactions on Audio and Electroacoustics, AU-21(3), Junio de 1973“, “Solicitud de patente estadounidense 08/951,029, Ohmori et al.: Audio band width extending system and method” and “patente estadounidense 6895375, Malah, D y Cox, R. VS.: System for bandwidth extension of Narrow-band speech”.
Los metodos de extension de ancho de banda armonicos frecuentemente exhiben una alta complejidad, en tanto que los metodos de extension de ancho de banda de complejidad reducida muestran perdidas de calidad. En el caso particular en donde una baja proporcion de bits es combinada con un ancho de banda pequeno de la banda baja, se pueden presentar artefactos tales como rugosidad o aspereza y un timbre percibido como desagradable. Una razon por esto es el hecho de que la porcion de HF aproximada esta basada en una operacion de copia que no mantiene ni las relaciones armonicas entre las porciones de senal tonales. Esto se aplica tanto a la relacion armonica entre LF y HF y tambien a la relacion armonica entre interconexiones subsecuentes dentro de la porcion de HF misma. Por ejemplo, dentro de SBR, la yuxtaposicion de los componentes codificados y los componentes replicados, que se presenta en la frontera entre las bandas baja y alta puede provocar impresiones de sonido aspero o rugoso. La razon es ilustrada en la Figura 18 en donde porciones tonales copiadas del intervalo LF al intervalo de HF son espectralmente adyacentes densamente a porciones tonales del intervalo de LF.
La Figura 18a muestra el espectrograma original 1800a de una senal que consiste de tres tonos. De conformidad, la Figura 18b muestra un diagrama 1800b de la senal extendida del ancho de banda correspondiente a la senal original de la Figura 18a. La abcisa indica el tiempo y la ordenada indica la frecuencia. En particular, en el ultimo tono, se pueden observar problemas potenciales 1810 (llneas discontinuas 1810).
Si las relaciones armonicas son consideradas mediante metodos conocidos, esto siempre se hace en base a una estimacion de F0, segun se muestra, entre otros, en US2004/028244A1. En estos casos, el exito de estos metodos depende principalmente de la confiabilidad de esta estimacion.
En general, los metodos de extension de ancho de banda conocidos proveen senales de audio a una baja proporcion de bits, pero con calidad de audio deficiente o una calidad de audio buena a altas proporciones de bits.
Es un objeto de la presente invencion proveer un esquema de codificacion mejorado para senales de audio.
Este objeto es obtenido por un codificador de audio de acuerdo con la reivindicacion 1, un descodificador de extension de ancho de banda de acuerdo con la reivindicacion 3 y la reivindicacion 7 y un metodo de acuerdo con las reivindicaciones 11, 12 y 13.
Una realizacion de la invencion, segun se define en la reivindicando independiente 1, provee un codificador de audio para proveer una senal de salida utilizando una senal de audio de entrada. El codificador de audio comprende un
5
10
15
20
25
30
35
40
45
50
55
60
senalador de interconexion, un comparador y una interfase de salida.
El generador de parche esta configurado para generar por lo menos una senal de alta frecuencia de extension de ancho de banda. Una senal de alta frecuencia de extension de ancho de banda comprende una banda de alta frecuencia, en donde la banda de alta frecuencia de la senal de alta frecuencia de extension de ancho de banda esta basada en una banda de frecuencia baja de la senal de audio de entrada. Diferentes senales de alta frecuencia de extension de ancho de banda comprenden diferentes frecuencias dentro de sus bandas de alta frecuencia si se generan diferentes senales de alta frecuencia de extension de ancho de banda.
El comparador esta configurado para calcular una pluralidad de parametros de comparacion. Un parametro de comparacion es calculado en base a una comparacion de la senal de audio de entrada y una senal de alta frecuencia de extension de ancho de banda generada. Cada parametro de comparacion de la pluralidad de parametros de comparacion es calculado en base a una frecuencia desplazada diferente entre la senal de audio de entrada y una senal de alta frecuencia de extension de ancho de banda generada. Ademas, el comparador esta configurado para determinar un parametro de comparacion a partir de la pluralidad de parametros de comparacion, en donde el parametro de comparacion determinado satisface un criterio predefinido.
En otras palabras, por ejemplo, el comparador puede estar configurado para determinar el parametro de comparacion entre la pluralidad de parametros de comparacion que satisfacen a lo maximo un criterio predefinido.
La interfase de salida esta configurada para proveer la senal de salida para transmision o almacenamiento. La senal de salida comprende una indicacion de parametro basada en una frecuencia de desplazamiento correspondiente al parametro de comparacion determinado.
En otras palabras, la senal de salida puede comprender el parametro de comparacion seleccionado que indica la frecuencia de desplazamiento optima.
Otra realizacion de la invencion, segun se define en la reivindicando independiente 3, provee un descodificador de extension de ancho de banda para proveer una senal de audio excedida en ancho de banda basada en una senal de audio de entrada y una senal de parametro. La senal de parametro comprende una indicacion de una frecuencia de desplazamiento y una indicacion de un parametro de densidad de potencia. El descodificador de extension de ancho de banda comprende un generador de parche, un combinador y una interfase de salida.
El generador de parche esta configurado para generar una senal de alta frecuencia de extension de ancho de banda que comprende una banda de alta frecuencia. La banda de alta frecuencia de la senal de alta frecuencia de la extension de ancho de banda es generada en base a un desplazamiento de frecuencia de una banda de frecuencia de la senal de audio de entrada. El desplazamiento de frecuencia esta basado en la frecuencia de desplazamiento.
Ademas, el generador de parche esta configurado para amplificar o atenuar la banda de alta frecuencia de la senal de alta frecuencia de extension de ancho de banda por un factor igual al valor de los parametros de densidad de energla o potencia o igual al valor reclproco del parametro de densidad de energla, respectivamente.
El combinador esta configurado para combinar la senal de alta frecuencia de extension de ancho de banda y la senal de audio de entrada para obtener la senal de audio extendida en ancho de banda.
El combinador esta configurado ademas para ignorar parte de la banda de alta frecuencia de la senal de alta frecuencia de extension de ancho de banda, en donde la parte ignorada de la banda de alta frecuencia de la senal de alta frecuencia de extension de ancho de banda comprende frecuencias inferiores y superiores a una frecuencia de corte superior de la senal de audio de entrada.
La interfase de salida esta configurada para proveer la senal de audio extendida de ancho de banda.
Una realizacion adicional de la invencion, segun se define en la reivindicacion independiente 7, provee un descodificador de extension de ancho de banda para proveer una senal de audio extendida en el ancho de banda en base a una senal de audio de entrada. El descodificador de extension de ancho de banda comprende un generador de parche, un comparador, un combinador y una interfase de salida.
El generador de parche esta configurado para generar por lo menos una senal de alta frecuencia de extension de ancho de banda que comprende una banda de alta frecuencia basada en la senal de audio de entrada, en donde una frecuencia de corte inferior de la banda de alta frecuencia de una senal de alta frecuencia de extension de ancho de banda generada es mas baja que una frecuencia de corte superior de la senal de audio de entrada. Diferentes senales
5
10
15
20
25
30
35
40
45
50
55
60
de alta frecuencia de extension de ancho de banda generadas comprenden diferentes frecuencias dentro de sus bandas de alta frecuencia, si se generan diferentes senales de alta frecuencia de extension de ancho de banda.
El comparador esta configurado para calcular una pluralidad de parametros de comparacion. Un parametro de comparacion es calculado en base a una comparacion de la senal de audio de entrada y una senal de alta frecuencia de extension de ancho de banda generada. Cada parametro de comparacion de la pluralidad de parametros de comparacion es calculado en base a una frecuencia de desplazamiento diferente entre la senal de audio de entrada y la senal de alta frecuencia de extension de ancho de banda generada. Ademas, el comparador esta configurado para determinar un parametro de comparacion a partir de la pluralidad de parametros de comparacion, en donde el parametro de comparacion determinado satisface un criterio predefinido.
En otras palabras, por ejemplo, el comparador esta configurado para determinar el parametro de comparacion entre la pluralidad de parametros de comparacion que satisface al maximo un criterio predefinido.
El combinador esta configurado para combinar la senal de audio de entrada y una senal de alta frecuencia de extension de ancho de banda para obtener la senal de audio extendida en ancho de banda, en donde la senal de alta frecuencia de la extension de ancho de banda usada para obtener la senal de audio extendida en ancho de banda esta basada en una frecuencia de desplazamiento correspondiente al parametro de comparacion determinado.
La interfase de salida esta configurada para proveer la senal de audio extendida en ancho de banda.
Realizaciones de acuerdo con la presente invencion estan basadas en la idea central de que una senal de alta
frecuencia de extension de ancho de banda que es tambien llamada interconexion, puede ser generada y comparada
con la senal de audio de entrada original. Al utilizar una frecuencia de desplazamiento diferente de la senal de alta frecuencia de extension de ancho de banda o varias senales de alta frecuencia de extension de ancho de banda con
diferentes frecuencias de desplazamiento, se puede calcular una pluralidad de parametros de comparacion
correspondientes a las frecuencias de desplazamiento diferentes. Los parametros de comparacion pueden ser relacionados con una cantidad asociada con la calidad de audio. Por consiguiente, un parametro de comparacion puede ser determinado que asegura la compatibilidad de la senal de alta frecuencia de la extension de ancho de banda y la senal de audio de entrada y como consecuencia, hacer que la calidad de audio mejore.
La proporcion de bits para transmision o almacenamiento de la senal de audio codificada puede ser disminuida al usar una indicacion de parametro basada en la frecuencia de desplazamiento correspondiente al parametro de comparacion determinado para una reconstruccion de la banda de alta frecuencia de la senal de audio de entrada original. De esta manera, solamente una porcion de baja frecuencia de la senal de audio de entrada y la indicacion de parametros necesitan ser almacenadas o transmitidas.
Los terminos parametro de comparacion, frecuencia de cruce e indicacion de parametros seran definidos posteriormente en la presente.
Algunas realizaciones preferidas de acuerdo con la invencion son concernientes con un comparador que monitoriza una correlacion cruzada para la comparacion de la senal de audio de entrada y la senal de alta frecuencia de extension de ancho de banda generada para calcular el parametro de comparacion.
Algunas realizaciones adicionales preferidas de acuerdo con la invencion son concernientes con un generador de parche, que genera la senal de alta frecuencia de extension de ancho de banda en el dominio de tiempo basado en una sola modulacion de banda lateral.
Es una ventaja de realizaciones preferidas de la invencion que un esquema de codificacion mejorado para senales de audio que permite incrementar la calidad de audio y/o disminuir la proporcion de bits para transmision o almacenamiento es provisto.
Realizaciones de acuerdo con la invencion seran detalladas subsecuentemente refiriendose a las figuras adjuntas, en las cuales:
La Figura 1 es un diagrama de bloques de un codificador de audio;
La Figura 2 es una ilustracion esquematica de una generacion de senal de alta frecuencia de extension de ancho de banda, una comparacion de la senal de audio de entrada y una senal de alta frecuencia de extension de ancho de banda generada y una adaptacion de energla de la senal de alta frecuencia de extension de ancho de banda;
5
10
15
20
25
30
35
40
45
50
55
60
La Figura 3 es una ilustracion esquematica de una generacion de senal de alta frecuencia de extension de ancho de banda, una comparacion de la senal de audio de entrada y una senal de alta frecuencia de extension de ancho de banda y una adaptacion de potencia de la senal de alta frecuencia de extension de ancho de banda;
La Figura 4 es un diagrama de bloques de un codificador de extension de ancho de banda;
La Figura 5 es un diagrama de bloques de un descodificador de extension de ancho de banda;
La Figura 6 es un diagrama de bloques de un descodificador de extension de ancho de banda;
La Figura 7 es un diagrama de flujo de un metodo para proveer una senal diferida en base a una senal de audio de entrada;
La Figura 8 es un diagrama de flujo de un metodo para proveer una senal de audio extendida en ancho de banda;
La Figura 9 es un diagrama de flujo de un metodo para proveer una senal de salida en base a una senal de audio de entrada;
La Figura 10 es un diagrama de flujo de un metodo para calcular un parametro de comparacion;
La Figura 11 es una ilustracion esquematica de una interpolacion de la frecuencia de desplazamiento;
La figura 12 es un diagrama de bloques de un descodificador de extension de ancho de banda;
La Figura 13 es un diagrama de flujo de un metodo para proveer una senal de audio extendida de ancho de banda;
La Figura 14 es un diagrama de bloques de un metodo para proveer una senal de audio extendida en ancho de banda;
La Figura 15 es un diagrama de bloques de un codificador de extension de ancho de banda;
La Figura 16a es un espectrograma de tres tonos utilizando frecuencia de cruce variable;
La Figura 16b es un espectrograma de la senal de audio original de tres tonos;
La Figura 17 es un diagrama del espectro de potencia de una senal de audio original, una senal de audio extendida en ancho de banda utilizando la frecuencia de cruce constante y una senal de audio extendida en ancho de banda utilizando una frecuencia de cruce variable;
La Figura 18a es un espectrograma de tres tonos utilizando un metodo de extension de ancho de banda conocido y La Figura 18b es un espectrograma de la senal de audio original de tres tonos.
En lo siguiente, los mismos numeros de referencias son usados parcialmente para objetos y unidades funcionales que tienen las mismas propiedades funcionales o propiedades funcionales similares y la descripcion de las mismas con respecto a una figura tambien se aplicara a otras figuras con el fin de reducir redundancia en la descripcion de las realizaciones.
La Figura 1 muestra un diagrama de bloques de un codificador de audio 100 para proveer una senal de salida 132 de acuerdo con una realizacion de la invencion, utilizando una senal de audio de entrada 102. La senal de salida es apropiada para una extension de ancho de banda en un descodificador. Por consiguiente, el codificador de audio es tambien llamado codificador de extension de ancho de banda. El codificador de extension de ancho de banda 100 comprende un generador de parche 110, un comparador 120 y una interfase de salida 130. El generador de parche 110 es conectado al comparador 120 y el comparador 120 es conectado a la interfase de salida 130.
El generador de parche 110 genera por lo menos una senal de alta frecuencia de extension de ancho de banda 112. Una senal de alta frecuencia de extension de ancho de banda 112 comprende una banda de alta frecuencia, en donde la banda de alta frecuencia de la senal de alta frecuencia de extension de ancho de banda 112 esta basada en una banda de baja frecuencia de la senal de audio de entrada 102. Si se generan diferentes senales de alta frecuencia de extension de ancho de banda 112, las diferentes senales de alta frecuencia de extension de ancho de banda 112 comprenden diferentes frecuencias dentro de sus bandas de alta frecuencia.
5
10
15
20
25
30
35
40
45
50
55
60
El comparador 120 calcula una pluralidad de parametros de comparacion. Un parametro de comparacion es calculado en base a una comparacion de la senal de audio de entrada 102 y una senal de alta frecuencia de extension de ancho de banda generada 112. Cada parametro de comparacion de la pluralidad de parametros de comparacion es calculado en base a una frecuencia de desplazamiento diferente entre la senal de audio de entrada 102 y una senal de alta frecuencia de extension de ancho de banda generada 112. Ademas, el comparador 120 determina un parametro de comparacion de la pluralidad de parametros de comparacion, en donde el parametro de comparacion determinado satisface un criterio predefinido.
La interfase de salida 130 provee la senal de salida 132 para transmision o almacenamiento. La senal de salida 132 comprende una indicacion de parametro basada en una frecuencia de desplazamiento correspondiente al parametro de comparacion determinado.
Al calcular una pluralidad de parametros de comparacion para diferentes frecuencias de desplazamiento, se puede encontrar una senal de alta frecuencia de extension de ancho de banda 112 que se ajusta bien a la senal de audio de entrada original 102. Esto se puede hacer al generar una pluralidad de senales de alta frecuencia de extension de ancho de banda 112 cada una con una frecuencia de desplazamiento diferente o al generar una senal de alta frecuencia de extension de ancho de banda y desplazar la banda de alta frecuencia de la senal de alta frecuencia de extension de ancho de banda 112 por diferentes frecuencias de desplazamiento. Tambien, una combinacion de generar una pluralidad de senales de alta frecuencia de extension de ancho de banda 112 con diferentes frecuencias de desplazamiento y desplazar la banda de alta frecuencia de ellas por otras frecuencias de desplazamiento diferentes puede ser posible. Por ejemplo, se generan cinco senales de alta frecuencia de extension de ancho de banda diferentes 112 y cada una de ellas es desplazada cinco veces por un desplazamiento de frecuencia constante.
La Figura 2 muestra una ilustracion esquematica 200 de la generacion de senal de alta frecuencia de extension de ancho de banda, la comparacion de la senal de alta frecuencia de extension de ancho de banda y la senal de audio de entrada y una adaptacion de potencia opcional de la senal de alta frecuencia de extension de ancho de banda para el caso en que solamente se genera una senal de alta frecuencia de extension de ancho de banda y desplazada por diferentes frecuencias de desplazamiento.
El primer diagrama esquematico de “potencia contra frecuencia” 210 muestra esquematicamente una senal de audio de entrada 102. En base a esta senal de audio de entrada 102, el generador de parche 110 puede generar la senal de alta frecuencia de extension de ancho de banda 112, por ejemplo, al desplazar 222 una banda de baja frecuencia de la senal de audio de entrada 102 a frecuencias mas altas (como se indica por el numero de referencia). Por ejemplo, la banda de baja frecuencia es desplazada por una frecuencia igual a una frecuencia de cruce de un codificador de nucleo, no ilustrado en la Figura 1, que puede ser una parte del codificador de extension de ancho de banda 100 u otra frecuencia predefinida.
La senal de alta frecuencia de extension de ancho de banda generada 112 puede luego ser desplazada por diferentes frecuencias de desplazamiento 232 y para cada frecuencia de desplazamiento 232 (como se indica por el numero de referencia 230), se puede calcular un parametro de comparacion por el comparador 120. La frecuencia de desplazamiento 232 puede ser, por ejemplo definida en relacion con una frecuencia de cruce de un codificador de nucleo, en relacion con otra frecuencia especlfica o puede ser definida como un valor de frecuencia absoluto.
Enseguida, el comparador 120 determina un parametro de comparacion que satisface el criterio predefinido. De esta manera, una senal de alta frecuencia de extension de ancho de banda 112 con una frecuencia de desplazamiento 242 correspondiente al parametro de comparacion determinado puede ser determinada (como se muestra con el numero de referencia 240).
Adicionalmente, tambien un parametro de densidad de energla 252 puede ser determinado (como se indica por el numero de referencia 250). El parametro de densidad de energla 252 puede indicar la proporcion de la banda de alta frecuencia de la senal de alta frecuencia de extension de ancho de banda con la frecuencia de desplazamiento correspondiente al parametro de comparacion determinado y una banda de frecuencia correspondiente de la senal de audio de entrada. Por ejemplo, la proporcion se puede relacionar con una proporcion de densidad de energla, una proporcion de energla, u otra proporcion de una cantidad relacionada con la densidad de energla de una banda de frecuencia.
Alternativamente, la Figura 3 muestra una ilustracion esquematica 300 de la generacion de la senal de alta frecuencia de extension de ancho de banda, la comparacion de las senales de alta frecuencia de extension de ancho de banda generadas y la senal de audio de entrada y la adaptacion de energla opcional de la senal de alta frecuencia de extension de ancho de banda para el caso en que una pluralidad de senales de alta frecuencia de extension de ancho de banda con diferentes frecuencias de desplazamiento son generadas.
5
10
15
20
25
30
35
40
45
50
55
60
En diferencia a la secuencia mostrada en la Figura 2, el generador de parche 110 genera una pluralidad de senales de alta frecuencia de extension de ancho de banda 112 con frecuencias de desplazamiento diferentes 232 (como se indica por el numero de referencia 320). Esto se puede hacer otra vez por un desplazamiento de frecuencia 222 de una banda de baja frecuencia de la senal de audio de entrada 102 a frecuencias mas altas. La banda de baja frecuencia de la senal de audio de entrada 102 puede ser desplazada por una frecuencia constante mas la frecuencia de desplazamiento individual 232 de cada senal de alta frecuencia de extension de ancho de banda 112. La frecuencia constante puede ser igual a la frecuencia de cruce del codificador del nucleo u otra frecuencia especlfica.
Un parametro de comparacion para cada senal de alta frecuencia de extension de ancho de banda generada 112 puede luego ser calculado y el parametro de comparacion que satisface el criterio predefinido puede ser determinado 240 por el comparador 120.
El parametro de densidad de energla puede ser determinado 250 como se describe anteriormente.
Los conceptos mostrados en las Figuras 2 y 3 pueden tambien ser combinados.
La comparacion de la senal de audio de entrada 102 y la senal de alta frecuencia de extension de ancho de banda generada 112 se puede hacer por una correlacion cruzada de ambas senales. En este caso, un parametro de comparacion puede ser por ejemplo, el resultado de una correlacion cruzada para una frecuencia de desplazamiento especlfica entre la senal de audio de entrada 102 y una senal de alta frecuencia de extension de ancho de banda generada 112.
La indicacion de parametro de la senal de salida 132 puede ser la frecuencia de desplazamiento misma, una frecuencia de desplazamiento cuantificada u otra cantidad basada en la frecuencia de desplazamiento.
Al transmitir o almacenar solamente la indicacion del parametro en lugar de la banda de alta frecuencia de la senal de audio de entrada 102, la proporcion de bits para transmision o almacenamiento puede ser reducida. Al escoger el parametro en base a la frecuencia de desplazamiento correspondiente a un parametro de comparacion que satisface un criterio predefinido, esto puede producir una mejor calidad de audio que la descodificacion solamente de la senal de audio limitada en banda o de banda limitada.
Un criterio predefinido puede ser para determinar un parametro de comparacion de la pluralidad de parametros de comparacion que indican, por ejemplo, una senal de alta frecuencia de extension de ancho de banda 112 con una frecuencia de desplazamiento correspondientes que coincide con la senal de audio de entrada 102 mejor que el 70% de las senales de alta frecuencia de extension de ancho de banda 112 con otras frecuencias de desplazamiento, indicando una senal de alta frecuencia de extension de ancho de banda 112 con una frecuencia de desplazamiento correspondiente que es una de las tres mejores coincidencias con la senal de audio de entrada 102 o que indica una senal de alta frecuencia de extension de ancho de banda que coincide mejor 112 con una frecuencia de desplazamiento correspondiente. Esto se relaciona con el caso en donde una pluralidad de senales de alta frecuencia de extension de ancho de banda 112 con diferentes frecuencias de desplazamiento son generadas, tambien como el caso en donde solamente una senal de alta frecuencia de extension de ancho de banda 112 es generada y desplazada por diferentes frecuencias de desplazamiento o una combinacion de estos dos casos.
Un parametro de comparacion puede ser el resultado de una correlacion cruzada u otra cantidad que indica que tan bien una senal de alta frecuencia de extension de ancho de banda 112 con una frecuencia de desplazamiento especlfica coincide con la senal de audio de entrada 102.
El codificador de extension de ancho de banda 100 puede comprender un codificador de nucleo para codificar una banda de baja frecuencia de la senal de audio de entrada 102. Este codificador de nucleo puede comprender una frecuencia de cruce que puede corresponder a la frecuencia de corte superior de la banda de baja frecuencia codificada de la senal de audio de entrada 102. La frecuencia de cruce del codificador del nucleo puede ser constante o variable con el tiempo. La implementacion de una frecuencia de cruce variable puede incrementar la complejidad del codificador de nucleo, pero puede tambien incrementar la flexibilidad para codificacion.
El proceso mostrado en la Figura 2 y/o Figura 3 puede ser repetido para bandas de frecuencia mas altas o interconexiones. Por ejemplo, la banda de baja frecuencia de la senal de audio de entrada 102 comprende una frecuencia de corte superior de 4 kHz. Por consiguiente, si la banda de baja frecuencia de la senal de audio de entrada 102 es desplazada por la frecuencia de corte superior de la banda de baja frecuencia para generar la senal de alta frecuencia de extension de ancho de banda 112, la senal de alta frecuencia de extension de ancho de banda 112 comprende una banda de alta frecuencia con una frecuencia de corte inferior de 4 KHz y una frecuencia de corte
5
10
15
20
25
30
35
40
45
50
55
60
superior de 8 kHz. El proceso puede ser repetido al desplazar una banda de baja frecuencia de la senal de audio de entrada 102 por dos veces la frecuencia de corte superior de la banda de baja frecuencia. Asi, la nueva senal de alta frecuencia de extension de ancho de banda generada 112 comprende una banda de alta frecuencia con una frecuencia de corte inferior de 8 KHz y una frecuencia de corte superior de 12 kHz. Esto puede ser repetido hasta que se alcanza una frecuencia mas alta deseada.
Alternativamente, esto puede tambien ser realizado al generar una senal de alta frecuencia de extension de ancho de banda con una pluralidad de bandas de alta frecuencia diferentes.
Como se ilustra en este ejemplo, el ancho de banda de la banda de baja frecuencia de la senal de audio de entrada y el ancho de banda de una banda de alta frecuencia de una senal de alta frecuencia de extension de ancho de banda puede ser las mismas. Alternativamente, la banda de baja frecuencia de la senal de audio de entrada puede ser esparcida y desplazada para generar la senal de alta frecuencia de extension de ancho de banda.
La determinacion de una senal de alta frecuencia de extension de ancho de banda 112 con una frecuencia de desplazamiento 232 correspondiente al parametro de comparacion determinado puede dejar un espacio o separacion entre la banda de baja frecuencia de la senal de audio de entrada 102 y la banda de alta frecuencia de la senal de alta frecuencia de extension de ancho de banda 112 dependiendo de la frecuencia de desplazamiento 242. Este espacio o separacion puede ser llenado al generar porciones de frecuencia que ajustan en este espacio que contienen por ejemplo ruido limitado en banda o de banda limitada. Alternativamente, el espacio puede ser dejado vacio, puesto que la calidad de audio puede no sufrir espectacularmente.
La Figura 4 muestra un diagrama de bloques de un codificador de extension de ancho de banda 400 para proveer una senal de salida 132 utilizando una senal de audio de entrada 102 de acuerdo con una realizacion preferida de la invencion. El codificador de extension de ancho de banda 400 comprende un generador de parche 110, un comparador 120, una interfase de salida 130, un codificador de nucleo 410, un filtro de paso de banda 420 y una unidad de extraccion de parametros 430. El codificador del nucleo 410 es conectado a la interfase de salida 130 y el generador de parche 110, el generador de parche 110 es conectado al comparador 120, el comparador 120 es conectado a la unidad de extraccion de parametros 430, la unidad de extraccion de parametros 430 es conectada a la interfase de salida 130 y el filtro de paso de banda 420 es conectado al comparador 120.
El generador de parche 110 puede ser realizado como un modulador para generar la senal de alta frecuencia de extension de ancho de banda 112 en base a la senal de audio de entrada 102. El comparador 120 puede efectuar la comparacion de la senal de audio de entrada 102 filtrada por el filtro de paso de banda 420 y la senal de alta frecuencia de extension de ancho de banda generada 112 por una correlacion cruzada de ellas. La determinacion del parametro de comparacion que satisface el criterio predefinido puede tambien ser llamada estimacion de retardo.
La interfase de salida 130 puede tambien incluir una funcionalidad de un formateador de corriente de bits y puede comprender un combinador para combinar una senal de baja frecuencia provista por el codificador del nucleo 410 y una senal de parametro 432 que comprende la indicacion de parametro basada en la frecuencia de desplazamiento provista por la unidad de extraccion de parametros 430. Ademas, la interfase de salida 130 puede comprender un codificador de entropia o un codificador diferencial para reducir la proporcion de bits de la senal de salida 132. El combinador y el codificador de entropia o codificador diferencial puede ser parte de la interfase de salida 130 como se muestra en este ejemplo o pueden consistir de unidades independientes.
La senal de audio 102 puede ser dividida en parte de baja frecuencia y una parte de alta frecuencia. Esto se puede hacer por un filtro de paso de bajos del codificador del nucleo 410 y el filtro de paso de banda 420. El filtro de paso de bajos puede ser parte del codificador del nucleo 410 o un filtro de paso de bajos independiente conectado al codificador del nucleo 410.
La parte de baja frecuencia es procesada por un codificador de nucleo 410 que puede ser un codificador de audio, por ejemplo, que se conforma al estandar MPEG1/2 Capa 3 “MP3” o MPEG 4 AAC o un codificador de habla.
La parte de baja frecuencia puede ser desplazada por un valor fijo, por ejemplo, por medio de una modulacion de banda lateral o una transformacion de Fourier rapida (FFT) en el dominio de frecuencia, de tal manera que esta ubicada por encima de la region de baja frecuencia original en el area objetivo de la interconexion o parte correspondiente. Opcionalmente, la parte de baja frecuencia puede ser obtenida directamente de la senal de entrada 102. Esto se puede hacer por un filtro de paso de bajos independiente conectado al generador de parche 110.
A intervalos de tiempo regulares, la correlacion cruzada entre espectros de amplitud de secciones de senal transformadas en ventana entre la parte de alta frecuencia original (de la senal de audio de entrada) y la parte de alta
5
10
15
20
25
30
35
40
45
50
55
60
frecuencia obtenida (la senal de alta frecuencia de extension de ancho de banda) puede ser calculada. De esta manera, el retardo (la frecuencia de desplazamiento) para correlacion maxima puede ser determinado. Este retardo puede tener el significado de un factor de correccion en terminos de la modulacion de banda lateral individual original, esto es, la unica modulacion de banda lateral puede ser corregida adicionalmente por el retardo para maximizar la correlacion de cruce. En otras palabras, la frecuencia de desplazamiento, que es tambien llamada retardo, correspondiente al parametro de comparacion que satisface el criterio predefinido puede ser determinada, en donde el parametro de comparacion corresponde a la correlacion de cruce y el criterio predefinido puede ser encontrado la correlacion maxima.
Ademas, se pueden determinar las proporciones de los valores absolutos de los espectros de amplitud. Mediante esto, puede ser derivado por cual factor la senal de alta frecuencia obtenida debe ser atenuada o amplificada. En otras palabras, se puede determinar un parametro de densidad de energla que indica la proporcion de energla, las densidades de energla, los valores absolutos de los espectros de amplitud u otro valor relacionado con la proporcion de densidad de energla entre la banda de alta frecuencia de la senal de alta frecuencia de extension de ancho de banda 112 y una banda de frecuencia correspondiente de la senal de audio de entrada original 102. Esto se puede hacer por un comparador de densidad de energla que puede ser parte de la unidad de extraccion de parametros 430 como en el ejemplo mostrado o una unidad independiente. Para determinar el parametro de densidad de energla, por ejemplo, la senal de alta frecuencia de extension de ancho de banda 112 que fue generada al desplazar la banda de baja frecuencia de la senal de audio de entrada 102 por una frecuencia constante o la senal de alta frecuencia de extension de ancho de banda 112 correspondiente al parametro de comparacion determinado u otra senal de alta frecuencia de extension de ancho de banda generada 112 puede ser usada. Una banda de frecuencia correspondiente en este caso significa, por ejemplo, una banda de frecuencia con el mismo intervalo de frecuencia. Por ejemplo, si la banda de alta frecuencia de la senal de alta frecuencia de extension de ancho de banda comprende frecuencias de 4 kHz a 8 kHz, entonces la banda de frecuencia correspondiente de la senal de audio de entrada comprende tambien el intervalo de 4 kHz a 8 kHz.
Los factores de correccion obtenidos (frecuencia de desplazamiento, parametro de densidad de energla) correspondientes al retardo y correspondientes al valor absoluto de la amplitud pueden ser interpolados en el tiempo. En otras palabras, un parametro determinado para una seccion de senal en ventana (para un marco de tiempo) puede ser interpolado por cada etapa de tiempo de la seccion de senal.
Esta senal (senal de parametro) de modulacion (control) o una representacion parametrizada de la misma puede ser almacenada o transmitida a un descodificador. En otras palabras, la senal de parametro 432 puede ser combinada con la banda de baja frecuencia de la senal de audio de entrada 102 procesada por el codificador del nucleo 410 para obtener la senal de salida 132 que puede ser almacenada o transmitida a un descodificador.
Adicionalmente, parametros adicionales para adaptar, por ejemplo, un nivel de ruido y/o la tonalidad pueden ser determinados. Esto se puede hacer por la unidad de extraccion de parametros 430. Los parametros adicionales pueden ser agregados a la senal de parametro 432.
El ejemplo mostrado en la Figura 4 ilustra un calculo del lado codificador de una modulacion variable en el tiempo. La modulacion variable en el tiempo en este caso se relaciona con las senales de alta frecuencia de extension de ancho de banda 112 con diferentes frecuencias de desplazamiento. La frecuencia de desplazamiento correspondiente al parametro de comparacion determinado que satisface el criterio predefinido puede variar con el tiempo.
La Figura 5 muestra un diagrama de bloques de un descodificador de extension de ancho de banda 500 para proveer una senal de audio extendida en ancho de banda 532 basada en una senal de audio de entrada 502 y una senal de parametro 504 de acuerdo con una realizacion de la invencion. La senal de parametro 504 comprende una indicacion de una frecuencia de desplazamiento y una indicacion de un parametro de densidad de energla. El descodificador de extension de ancho de banda 500 comprende un generador de parche 510, un combinador 520 y una interfase de salida 530. El generador de parche 510 es conectado al combinador 520 y el combinador 520 es conectado a la interfase de salida 530.
El generador de parche 510 genera una senal de alta frecuencia de extension de ancho de banda 512 que comprende una banda de alta frecuencia basada en la senal de audio de entrada 502. La banda de alta frecuencia de la senal de alta frecuencia de extension de ancho de banda 512 es generada basada en un desplazamiento de frecuencia de una banda de frecuencia de la senal de audio de entrada 502, en donde el desplazamiento de frecuencia esta basado en la frecuencia de desplazamiento.
Ademas, el generador de parche 510 amplifica o atenua la banda de alta frecuencia de la senal de alta frecuencia de extension de ancho de banda 512 por un factor igual al valor del parametro de densidad de energla o igual al valor reclproco del parametro de densidad de energla.
5
10
15
20
25
30
35
40
45
50
55
60
El combinador 520 combina la senal de alta frecuencia de extension de ancho de banda 512 y la senal de audio de entrada 502 para obtener la senal de audio extendida en ancho de banda 532 y la interfase de salida 530 provee la senal de audio extendida en ancho de banda 532.
La generacion de la senal de alta frecuencia de extension de ancho de banda 112 basada en la frecuencia de desplazamiento puede permitir una continuacion mejorada del intervalo de frecuencia de la senal de audio de entrada en la region de alta frecuencia, por ejemplo, si la frecuencia de desplazamiento es determinada como se describe anteriormente. Esto puede incrementar la calidad de audio de la senal de audio extendida en ancho de banda 532.
Adicionalmente, la densidad de energla de la continuacion de alta frecuencia de la senal de audio de entrada 502 se puede hacer de una manera muy eficiente al amplificar o atenuar la banda de alta frecuencia de la senal de alta frecuencia de extension de ancho de banda 512 por el parametro de densidad de energla. De esta manera, una normalizacion puede no ser necesaria.
El generador de parche 510 puede generar la senal de alta frecuencia de extension de ancho de banda 512 al desplazar la banda de frecuencia de la senal de audio de entrada 512 por una frecuencia constante mas la frecuencia de desplazamiento. El combinador esta configurado para ignorar una parte de la banda de alta frecuencia de la senal de alta frecuencia de extension de ancho de banda 512 que comprende frecuencias mas bajas que una frecuencia de corte superior de la senal de audio de entrada 502.
El generador de parche 510 puede generar la senal de alta frecuencia de extension de ancho de banda 512 en el dominio de tiempo o en el dominio de frecuencia. En el dominio de tiempo, el generador de parche 510 puede generar la senal de alta frecuencia de extension de ancho de banda 512 basada en una sola modulacion de banda lateral.
Adicionalmente, la interfase de salida puede amplificar la senal de salida antes de proveerla.
La Figura 6 muestra un diagrama de bloques de un descodificador de extension de ancho de banda 600 para proveer una senal de audio extendida en ancho de banda 532 basada en una senal de audio de entrada 502 y una senal de parametro 504 de acuerdo con una realizacion preferida de la invencion. El descodificador de extension de ancho de banda 600 comprende un generador de parche 510, un combinador 520, una interfase de salida 530, un descodificador de nucleo 610 y una unidad de extraccion de parametros 620. El descodificador de nucleo 610 es conectado al generador de parche 510 y el combinador 520, la unidad de extraccion de parametros 620 es conectada al generador de parche 510 y a la interfase de salida 530, el generador de parche 510 es conectado al combinador 520 y el combinador 520 es conectado a la interfase de salida 530.
El descodificador de nucleo 610 puede descodificar la corriente de bits recibida 602 y provee la senal de audio de entrada 502 al generador de parche 510 y el combinador 520. La senal de audio de entrada 502 puede comprender una frecuencia de corte superior igual a una frecuencia de cruce del descodificador de nucleo 610. Esta frecuencia de cruce puede ser constante o variable en el tiempo. Variable en el tiempo significa, por ejemplo, variable para intervalos de tiempo diferentes o cuadros de tiempo diferentes, pero constante para un intervalo de tiempo o cuadro de tiempo.
La unidad de extraccion de parametros 620 puede separar la senal de parametro 504 de la corriente de bits recibida 602 y proveerla al generador de parche 510. Adicionalmente, la senal de parametro 504 o un parametro de ruido y/o tonalidad extraldo puede ser provisto a la interfase de salida 530.
El generador de parche 510 puede modular la senal de audio de entrada 502 en base a la frecuencia de desplazamiento para obtener la senal de alta frecuencia de extension de ancho de banda 512 y puede amplificar o atenuar la senal de alta frecuencia de extension de ancho de banda 512 en base al parametro de densidad de energla comprendida en la senal de parametro 504. Esta senal de alta frecuencia de extension de ancho de banda 512 es provista al combinador 530. En otras palabras, el generador de parche 510 puede modular la senal de audio de entrada 502 basado en la frecuencia de desplazamiento y el parametro de densidad de energla para obtener una senal de alta frecuencia. Esto se puede hacer, por ejemplo, en el dominio de tiempo por una sola modulacion de banda lateral 634 con una interpolacion y/o filtracion 632 para cada etapa de tiempo.
El combinador 520 combina la senal de audio de entrada 502 y la senal de alta frecuencia de extension de ancho de banda generada 512 para obtener la senal de audio de extension de ancho de banda 532.
La interfase de salida 530 provee la senal de audio extendida en ancho de banda 532 y puede comprender adicionalmente una unidad de correccion. La unidad de correccion puede llevar a cabo una correccion de tonalidad y/o correccion de ruido basada en los parametros provistos por la unidad de extraccion de parametros 620. La unidad de correccion puede ser parte de la interfase de salida 530 como se muestra en la Figura 6 o puede ser una unidad
5
10
15
20
25
30
35
40
45
50
55
60
independiente. La unidad de correccion puede tambien ser dispuesta entre el generador de parche 510 y el combinador 520. De esta manera, la unidad de correccion puede solamente corregir la tonalidad y/o ruido de la senal de alta frecuencia de extension de ancho de banda generada 512. Una correccion de tonalidad y ruido de la senal de audio de entrada 512 no es necesaria puesto que la senal de audio de entrada 502 corresponde a la senal de audio original.
Resumido en algunas palabras, el descodificador de extension de ancho de banda 600 puede sintetizar y formar espectralmente una senal de alta frecuencia de una senal de salida del descodificador de audio o descodificador de nucleo (la senal de audio de entrada) por medio de la funcion de modulacion transmitida. Funcion de modulacion transmitida, por ejemplo, significa una funcion de modulacion basada en la frecuencia desplazada y en el parametro de densidad de energla. Luego, la senal de alta frecuencia y la senal de baja frecuencia pueden ser combinadas y parametros adicionales para adaptar el nivel de ruido y tonalidad pueden ser aplicados.
La Figura 7 muestra un diagrama de flujo de un metodo 700 para proveer una senal de salida basada en una senal de audio de entrada de acuerdo con una realizacion de la invencion. El metodo comprende generar 710 por lo menos una senal de alta frecuencia de extension de ancho de banda, calcular 720 una pluralidad de parametros de comparacion, determinar 730 un parametro de comparacion a partir de la pluralidad de parametros de comparacion y proveer 740 la senal de salida para transmision o almacenamiento.
Una senal de alta frecuencia de extension de ancho de banda generada comprende una banda de alta frecuencia. La banda de alta frecuencia de la senal de alta frecuencia de extension de ancho de banda esta basada en una banda de baja frecuencia de la senal de audio de entrada. Diferentes senales de alta frecuencia de extension de ancho de banda comprenden diferentes frecuencias dentro de sus bandas de alta frecuencia, si se generan diferentes senales de alta frecuencia de extension de ancho de banda.
Un parametro de comparacion es calculado en base a una comparacion de la senal de audio de entrada y una senal de alta frecuencia de extension de ancho de banda generada. Cada parametro de comparacion de la pluralidad de parametros de comparacion es calculado en base a una frecuencia desplazada diferente entre la senal de audio de entrada y una senal de alta frecuencia de extension de ancho de banda generada.
El parametro de comparacion determinado satisface un criterio predefinido.
La senal de salida comprende una indicacion de parametro basada en una frecuencia desplazada correspondiente al parametro de comparacion determinado.
La Figura 8 muestra un diagrama de flujo de un metodo 800 para proveer una senal de audio extendida en ancho de banda basada en una senal de audio de entrada y una senal de parametro de acuerdo con una realizacion de la invencion. La senal de parametro comprende una indicacion de una frecuencia desplazada y una indicacion de un parametro de densidad de energla. El metodo comprende generar 810 una senal de alta frecuencia de extension de ancho de banda, amplificar 820 o atenuar la banda de alta frecuencia de la senal de alta frecuencia de extension de ancho de banda, combinar 830 la senal de alta frecuencia de extension de ancho de banda y la senal de audio de entrada para obtener la senal de audio extendida en ancho de banda y proveer 840 la senal de audio extendida en ancho de banda.
La senal de alta frecuencia de extension de ancho de banda comprende una banda de alta frecuencia. La banda de alta frecuencia de la senal de alta frecuencia de extension de ancho de banda es generada 810 basada en un desplazamiento de frecuencia de una banda de frecuencia de la senal de audio de entrada. El desplazamiento de frecuencia esta basado en la frecuencia desplazada.
La banda de alta frecuencia de la senal de alta frecuencia de extension de ancho de banda es amplificada 820 o atenuada por un factor igual al valor del parametro de densidad de energla o igual al valor reclproco del parametro de densidad de energla.
La Figura 9 muestra un diagrama de flujo de un metodo 900 para proveer una senal de salida basada en una senal de audio de entrada. Se ilustra una posibilidad para la secuencia del algoritmo en el codificador. Esto puede tambien ser formal matematicamente descrito en lo siguiente. Las senales en tiempo real pueden ser indicadas por letras minusculas latinas, las senales transformadas de Hilbert con Griego correspondiente y las senales transformadas de Fourier con letras mayusculas latinas o alternativamente Griegas.
/HR =
_ ' tit l. ^ fC fC
La senal de entrada puede ser llamada f(n), la senal de salida o(n). J HFi J > max jncjjCa la
transformada de Fourier, j indica el numero imaginario y la transformacion de Hilbert H(.) es definida como es usual:
5
10
15
20
25
30
<p{m) := H(f(n)) = T~\-\ • sgn(cy) •
con
F(jco):=Hf(n))
xOver puede ser la frecuencia de corte del codificador del nucleo, neN puede indicar un tiempo. kmax>keN puede indicar la k-esima extension o interconexion. ak describe un borde de banda de bandas perceptuales relacionadas con xOver, por ejemplo, de acuerdo con la escala de Bark o la excl de ERB. Alternativamente, la ak se puede por ejemplo incrementar linealmente, esto es ak+i-ak = constante. La transformation de Hilbert puede tambien ser calculada computacionalmente eficiente mediante filtration de la senal con un filtro de paso de bajos modulado.
En primer lugar, una funcion de modulador analitico 902 con las frecuencias de modulacion ak y los incrementos de fase
Iak 1
Y* ;= ~~ _L
}f r
resunanies con el incremento de tiempo bs (Fs indica la velocidad de toma de muestras) pueden ser
generados. Esto puede ser descrito matematicamente en las siguientes formulas:
imagen1
La suma puede solamente ser reemplazada por n, si gk es independiente de n.
La senal de audio de entrada 102 o senal de audio real f puede ser filtrada por paso de banda a un ancho de banda de ak+i-ak que puede ser expresado por:
fLF=f* filtLF
En este caso, cada parche (interconexion) comprendera el mismo ancho de banda.
Alternativamente, la senal de audio de entrada f 102 puede ser filtrada por paso de banda a anchos de banda de ak con anchos de banda diferentes que pueden ser descritos por:
imagen2
Luego, las areas de la senal original pueden ser determinadas que deben ser reconstruidas por este metodo. Estas regiones limitadas en banda pueden ser indicadas como:
fHF, = f*f’HtBFkA<k<kmm
y estan ubicadas en los intervalos (ak, ak+1).
La modulacion de la senal de entrada filtrada por paso de bajos 904 se puede hacer en el dominio de frecuencia o el
5
10
15
20
25
30
35
dominio de tiempo.
En el dominio de frecuencia, las senales de entrada pueden ser aplicadas en ventana primero, lo que puede ser descrito por:
f,(n) = f(c-
NFFT
2
+ mod(n,NFFT)
+1) • win(mod(n, NFFT) +1)
en donde NFFT es el numero de bin de transformation de Fourier rapida (por ejemplo 512 bin), % es el numero de ventana y win(.) es una funcion de ventana. Las ventanas o cuadros de tiempo pueden comprender una superposition temporal. Por ejemplo, la formula dada anteriormente describe una superposicion temporal de la mitad de una ventana. Asi, NeN bloques de la senal original y con la misma conectada con tantos espectros de amplitud F%(w) con % < N como valores absolutos de la transformada de Fourier
yk=[_yk-NFFT\
describe el indice del borde de banda k en la transformada de Fourier.
Luego, la senal es modulada en el dominio de frecuencia al desplazar los bins de FFT (bins de transformacion de Fourier rapida). La transformacion de Hilbert implicita no es aqui necesaria, pero hace una description formal igual de las siguientes etapas posibles:
T 4{a) + yk):= :=
para w > 0 y
O ^{co):= ¥ ^(co):=0\/a><0
En el dominio de tiempo, una transformacion de Hilbert 906 de la senal de audio de entrada f 102 para generar una senal analitica 908 se hace primero.
imagen3
y
imagen4
luego la senal analitica jLF, es modulada por banda lateral individual 710 con un modulador p(n) 902:
^riax
V'{n\=Yj <pLFk (n) ■ /uk(n)
k=]
o
y/{n).= <pLF(n) ■/j(n)
De esta manera, una senal de alta frecuencia de extension de ancho de banda que es tambien llamada senal modulada 910 puede ser generada.
Enseguida, una formacion de ventana (tambien posible con superposicion) de la senal de entrada 912 y de la senal extendida 914 y una transformacion de Fourier 916 son efectuados:
imagen5
y y,'(n) = y,(£ ——- + \x\o6{n,NFFT) +1) • win(mod(n,A/FF7) +1)
en donde una NFFT es una vez mas el numero de bines de transformation de Fourier rapida (por ejemplo 256, 512, 1024 bines u otro numero entre 24 y 232), ^ es el numero de ventana y win(.) es una funcion de ventana. Asf, NeN 5 bloques 914 son creados de la senal original y en relation con tantos espectros de amplitud O^(w), ^(w) con ^ < N como valores absolutos de la transformada de Fourier 916.
yk-.= [_yk.NFFT\
pueden describir el fndice del borde de banda k en la transformada de Fourier.
10
El proceso en el dominio de tiempo es mostrado en la Figura 9.
La siguiente etapa es el calculo 720 de la correlation cruzada R$,k (el parametro de comparacion puede ser igual al resultado de la correlacion cruzada) de los espectros de amplitud parciales de la senal original y la senal extendida lo 15 que puede ser expresado matematicamente por:
imagen6
20
con
imagen7
25
30
5 puede indicar el retardo maximo (la frecuencia desplazada maxima) para el cual una correlacion cruzada es calculada. Si la correlacion cruzada debe ser calculada con una predisposition, esto es, retardos pequenos y asf grandes superposiciones deben ser preferidos, asf que p=0 debe ser seleccionado. En contraste, si debe ser compensado que menos bins de FFT (bines de transformacion de Fourier rapida) estan superpuestos para retardos mas grandes que pequenos, p=1 debe ser escogido. En general, 0<£eP puede ser escogido arbitrariamente. Alternativa o adicionalmente,
' , 10d(t5> puede ser escogido para seleccionar una region de la correlacion cruzada que es un
poco mas grande que una interconexion o parche. Con esto la region que es considerada por la correlacion cruzada puede ser extendicra por en ambos extremos espectrales del parche particular.
2
En base a estos resultados de la correlacion cruzada, un maximo de la correlacion cruzada 730
imagen8
35 y el retardo d$,k de la correlacion maxima
imagen9
pueden ser determinados.
5
10
15
20
25
30
Adicionalmente, las proporciones 920 de las energlas o potencias en las interconexiones o parches pueden ser determinadas por los espectros de densidad de energla:
imagen10
Si ningun maximo claro puede ser determinado 924, el retardo es puesto de regreso a 0 (como se muestra en el numero de referencia 922). De otra manera el retardo estimado 918 puede ser el retardo correspondiente a la correlacion cruzada maxima. Para esto, un criterio de umbral, d$,k > t con t a ser seleccionado puede ser determinado. Alternativamente, la curvatura o una planura espectral (SFN) de la correlacion cruzada R$,k puede ser observada, por ejemplo:
imagen11
o
2A+1
2A +1 v=i
2A+1
2A+1I
II^A)
v=1
> r .
Con
imagen12
Los retardos d$,k y los parametros de densidad de energla &k pueden ser interpolados 926 para obtener un valor para cada etapa de tiempo:
gk(n) := interp(c,k)-\(n) = interp(d,k)
Luego, la funcion de modulacion global modulada en amplitud modificada y desplazada en frecuencia puede ser generada:
imagen13
5
10
15
20
25
30
35
40
45
50
^max 2^'Z (yk(m)+Ak(m))
lu(n) = ^k(n)e
k=1
Esta funcion de modulacion global o los parametros de la funcion de modulacion global pueden ser provistos 740 con la senal de salida para almacenamiento o transmision.
Adicionalmente, se pueden determinar parametros adicionales para correccion de fluido y/o correccion de tonalidad.
La modulacion en el decodificador se puede hacer por:
V/(n).=<pLF{n) ■ u(n)
y ademas de las k modulaciones parciales (si hay mas de un parche o interconexion). Para esta funcion de modulacion global pk(n) o p(n) o los parametros Zk(n) y Ak(n) o c$,k y d$,k de la funcion de modulacion global pueden ser codificados apropiadamente, por ejemplo mediante cuantificacion. Opcionalmente, la velocidad de toma de muestras puede ser reducida y se puede introducir una histeresis.
El calculo de los retardos puede ser omitido, si no hay ninguna senal tonal, por ejemplo en silencio, transitorios o ruido. En estos casos, el retardo puede ser ajustado a cero.
La Figura 10 muestra en mas detalle un ejemplo 1000 para determinar el retardo.
Para un cuadro de tiempo o ventana ^=i 1010 el retardo v es ajustado a menos A como valor de partida. Luego, la correlacion cruzada R^k(v) es calculada 720. Si v es mas pequeno que A 1030, entonces v es incrementado 1032 y el siguiente parametro de comparacion en terminos de la correlacion cruzada es calculado 720. Si v es mayor o igual que A 1030, entonces el retardo correspondiente a la correlacion cruzada calculada maxima puede ser determinado 730. Si el maximo es claramente identificable 924 el retardo determinado es usado como parametro d^,k 918. De otra manera, el retardo es ajustado a 0 y usado como parametro d$,k=0 922.
Luego, todo el proceso es repetido 1040 para el siguiente cuadro de tiempo £=£+1 1050. Los retardos determinados pueden ser interpolados 926 para obtener un parametro para cada etapa de tiempo N.
El calculo de la pluralidad de parametros de comparacion, por ejemplo, el resultado de la correlacion cruzada, se puede hacer tambien en paralelo si se usan una pluralidad de comparadores. Tambien, el procesamiento de diferentes cuadros de tiempo se puede hacer en paralelo, si los elementos ffsicos necesarios estan disponibles varias veces. El bucle para calcular la correlacion cruzada puede tambien iniciar en +A y puede ser disminuido cada bucle hasta v < A.
La Figura 11 muestra una ilustracion esquematica de la interpolacion 926 de las frecuencias desplazadas de diferentes cuadros de tiempo, intervalos de tiempo o ventanas. La Figura 11a muestra la interpolacion 1100, si los cuadros de tiempo no se traslapan o superponen. Un retardo d^,k es determinado para todo un cuadro de tiempo 1110. La manera mas facil para interpolar un parametro para cada etapa de tiempo 1120 puede ser realizado al ajustar los parametros de todas las etapas de tiempo 1120 de un cuadro de tiempo 1110 igual al retardo correspondiente d^,k. En los bordes de un cuadro de tiempo, se puede seleccionar el retardo del cuadro de tiempo previo o siguiente. Por ejemplo, los parametros Ak(n) a Ak(n+3) son igual a d^,k y los parametros Ak(n+4) a Ak(n+7) son iguales a d^+1,k.
Alternativamente, los retardos de los cuadros de tiempo 1110 pueden ser interpolados linealmente entre los cuadros de tiempo. Por ejemplo:
1 k) =
d X,k + d X-1,k 2
1 (n + 0 =
3 ' dx,k + dx-1,k
4
5
10
15
20
25
30
35
1 k (n + 2) =
1 k (n + 3)
3 ' d X,k + dX+l,k
4
1 k(n + 4)= ^ ^
Asf, la Figura 11B muestra un ejemplo 1150 para cuadros de tiempo superpuestos 1110. En este caso, una etapa de tiempo 1120 esta asociada a mas de un cuadro de tiempo 1110. Por consiguiente, mas de un retardo determinado puede ser asociado con una etapa de tiempo 1120. Asf, los retardos determinados pueden ser interpolados 926 para obtener un parametro para cada etapa de tiempo 1120. Por ejemplo, los retardos determinados correspondientes a una etapa de tiempo 1120 pueden ser interpolados linealmente. Por ejemplo, una interpolacion posible puede ser:
dX-l,k + dX,k
h(n+1)= ^
1 k (n + 2 )= d
X,k
d X,k + dX+1,k 1 k (n + 3)= 2 ------
Alternativamente, la interpolacion tambien se puede hacer, por ejemplo, mediante una filtracion mediana.
La interpolacion se puede hacer por medio de interpolacion. Los medios de interpolacion pueden ser parte de la unidad de extraccion de parametros o la interfase de salida o pueden ser una unidad separada.
En el lado del decodificador, la extension de ancho de banda se puede hacer mediante:
1 k (n) = d5-u
y/(n).=<pLr{n) ■ fi(n)
Despues de la descodificacion de fl(n) y ^lf(N) como salida del codificador del nucleo. Adicionalmente, puede
ser adaptado con los parametros previamente de los parametros obtenidos de la senal original para el nivel de tonalidad y/o ruido.
El calculo de la funcion de modulacion global en el decodificador se hace de acuerdo con una o ambas de las siguientes formulas:
U
'yd ax
i/An) =Z (pLFk (n) • /uk(n) + tioise(n)
/c=1
5
10
15
20
25
30
35
40
45
50
55
y/(n) = (pLF{n) • ju{n) + noise(n)
La parte imaginaria de la senal puede ser ignorada:
o(n) = R e(y/(n))
Luego, como se menciona anteriormente, una correction de tonalidad, por ejemplo, mediante filtration inversa puede seguir.
La Figura 12 muestra un diagrama de bloques de un descodificador de extension de ancho de banda 1200 para proveer una senal de audio extendida en ancho de banda 532 basada en una senal de audio de entrada 502 de acuerdo con una realization de la invention. El descodificador de extension de ancho de banda 1200 comprende un generador de parche 1210, un comparador 1220, un combinador 1230 y una interfase de salida 1240. El generador de parche 1210 es conectado al comparador 1220, el comparador 1220 es conectado al combinador 1230 y el combinador 1230 es conectado a la interfase de salida 1240.
El generador de parche 1210 genera por lo menos una senal de alta frecuencia de extension de ancho de banda 1212 que comprende una banda de alta frecuencia basada en la senal de audio de entrada 502, en donde una frecuencia de corte inferior de la banda de alta frecuencia de una senal de alta frecuencia de extension de ancho de banda 1212 es mas baja que una frecuencia de corte superior de la senal de audio de entrada 502. Diferentes senales de alta frecuencia de extension de ancho de banda 1212 comprenden diferentes frecuencias dentro de sus bandas de alta frecuencia, si se generan diferentes senales de alta frecuencia de extension de ancho de banda 1212.
El comparador 1220 calcula una pluralidad de parametros de comparacion. Un parametro de comparacion es calculado en base a una comparacion de la senal de audio de entrada 502 y una senal de alta frecuencia de extension de ancho de banda generada 1212. Cada parametro de comparacion de la pluralidad de parametros de comparacion es calculado en base a una frecuencia desplazada diferente entre la senal de audio de entrada 502 y una senal de alta frecuencia de extension de ancho de banda generada 1212. Ademas, el comparador determina un parametro de comparacion de la pluralidad de parametros de comparacion, en donde el parametro de comparacion determinado satisface un criterio predefinido.
Un combinador 1230 combina la senal de audio de entrada 502 y la senal de alta frecuencia de extension de ancho de banda 1212 para obtener la senal de audio extendida en ancho de banda 532, en donde la senal de alta frecuencia de extension de ancho de banda 1212 esta basada en una frecuencia desplazada correspondiente al parametro de comparacion determinado.
La interfase de salida 1240 provee la senal de audio extendida en ancho de banda 532.
En comparacion con el decodificador mostrado en la Figura 5 el descodificador descrito 1200 determina la frecuencia desplazada por si mismo. Por consiguiente, no es necesario recibir este parametro con la senal de audio de entrada 502. De esta manera, la proporcion de bits para transmision o almacenamiento de senales de audio puede ser reducida adicionalmente.
Como se describe para la Figura 1, el generador de parche 1210 puede generar una pluralidad de senales de alta frecuencia de extension de ancho de banda con diferentes frecuencias desplazadas o solamente una senal de alta frecuencia de extension de ancho de banda que es desplazada por diferentes frecuencias desplazadas. Otra vez, tambien se puede usar una combination de estas dos posibilidades.
La Figura 13 muestra un diagrama de flujo de un metodo 1300 para proveer una senal de audio extendida en ancho de banda de acuerdo con una realizacion de la invencion. El metodo 1300 comprende generar en 1310 por lo menos una senal de alta frecuencia de extension de ancho de banda, calcular 1320 una pluralidad de parametros de comparacion, determinar en 1330 un parametro de comparacion de la pluralidad de parametros de comparacion, combinar en 1340 la senal de audio de entrada y una senal de alta frecuencia de extension de ancho de banda y proveer 1350 la senal de audio extendida en ancho de banda.
Una senal de alta frecuencia extendida en ancho de banda comprende una banda de alta frecuencia basada en la senal de audio de entrada. Una frecuencia de corte inferior de la banda de alta frecuencia de una senal de alta frecuencia extendida en ancho de banda es mas baja que una frecuencia de corte superior de la senal de audio de entrada. Diferentes senales de alta frecuencia de extension de ancho de banda comprenden diferentes frecuencias dentro sus
5
10
15
20
25
30
35
40
45
50
55
60
bandas de alta frecuencia, si se generan diferentes senales de alta frecuencia de extension de ancho de banda.
Se calcula un parametro de comparacion en base a la comparacion de la senal de audio de entrada y la senal de alta frecuencia de extension de ancho de banda generada. Cada parametro de comparacion de la pluralidad de parametros de comparacion es calculado en base a una frecuencia desplazada diferente entre la senal de audio de entrada y la senal de alta frecuencia de extension de ancho de banda generada.
El parametro de comparacion determinado satisface un criterio predefinido.
La senal de alta frecuencia de extension de ancho de banda que es combinada con la senal de audio de entrada para obtener la senal de audio de ancho de banda esta basada en una frecuencia desplazada correspondiente al parametro de comparacion determinado.
La Figura 14 muestra un diagrama de flujo de un metodo 1400 para proveer una senal de audio extendida en ancho de banda de acuerdo con una realizacion de la invencion.
Despues de recibir 1402 una corriente de bits que comprende la senal de audio de entrada, un descodificador de nucleo decodifica 1410 la senal de audio de entrada. En base a la senal de audio de entrada, se genera una senal de alta frecuencia de extension de ancho de banda 1310 y la pluralidad de parametros de comparacion en terminos de una correlacion cruzada entre la senal de audio de entrada y una senal de alta frecuencia de extension de ancho de banda generada con diferentes frecuencias desplazadas son calculadas 1320. Luego, se determina el parametro de comparacion que satisface el criterio predefinido 1330 que es tambien llamada estimacion de retardo.
En base a la frecuencia desplazada correspondiente al parametro de comparacion determinado, un modulador puede modular 1420 la senal de audio de entrada. Adicionalmente, un parametro puede ser extraldo 1430 de la corriente de bits recibida 1402 para adaptar, por ejemplo, la densidad de energla de la senal modulada. La senal modulada es luego combinada 1340 con la senal de audio de entrada. Adicionalmente, la tonalidad y el ruido de la senal de audio extendida en ancho de banda puede ser corregido 1440. Esto tambien se puede hacer antes de la combinacion con la senal de audio de entrada. Luego, los datos de audio en terminos de la senal de audio extendida en ancho de banda son provistos 1350, por ejemplo, para reproduccion acustica.
De esta manera, el calculo de la modulacion variable en el tiempo se hace en el lado del decodificador.
Alternativamente al modulador que modula 1420 la senal de audio de entrada para generar una interconexion o parche, por ejemplo, la senal de alta frecuencia de extension de ancho de banda ya generada previamente puede ser usada o el generador de parche puede generar una senal de alta frecuencia de extension de ancho de banda (parche) en base a la frecuencia desplazada correspondiente al parametro de comparacion determinado.
En otras palabras, si la baja velocidad de datos es mas importante que una baja complejidad del lado del descodificador, la determinacion de la modulacion de frecuencia de los moduladores tambien se puede hacer en el lado del descodificador. Para esto, el algoritmo mostrado en la Figura 9 puede ser ejecutado en el decodificador con solamente algunos cambios. Puesto que la senal original no esta disponible para el calculo de la correlacion cruzada en el decodificador, las correlaciones pueden ser calculadas entre la senal original (senal de audio de entrada) y una senal original desplazada (senal de audio de entrada) dentro de un intervalo de superposicion. Por ejemplo, la senal puede ser desplazada entre cero y an, por ejemplo, ak dividido por 2, ak dividido por 3 o ak dividido por 4. ak indica otra vez el k-
esimo borde de banda, por ejemplo, a1 indica la frecuencia de cruce del codificador de nucleo.
Por ejemplo, esto puede suceder de la misma manera en el codificador como en el decodificador. En el codificador, los parametros para formacion espectral, correccion de ruido y/o correccion de tonalidad pueden ser extraldos y transmitidos al decodificador.
Asl, la Figura 15 muestra un diagrama de bloques de un codificador de extension de ancho de banda 1500 para proveer una senal de salida utilizando una senal de audio de entrada. El codificador 1500 corresponde al codificador mostrado en la Figura 4. Sin embargo, el codificador 1500 no provee la senal de salida 132 con una indicacion de parametro basada en la frecuencia desplazada misma. Puede solamente determinar un parametro de densidad de energla y parametros opcionales para correccion de tonalidad y correccion de ruido e incluye una indicacion de parametro de estos parametros a la senal de salida 132. Sin embargo, el parametro de densidad de energla (y tambien los otros parametros, si son determinados) es determinado en base a la frecuencia desplazada correspondiente al parametro de comparacion determinado.
Por ejemplo, el parametro de densidad de energla puede indicar la proporcion entre la senal de audio de entrada 102 y
5
10
15
20
25
30
35
40
45
50
55
60
la senal de alta frecuencia de extension de ancho de banda con una frecuencia desplazada correspondiente al parametro de comparacion determinado. Por consiguiente, la indicacion de parametro que esta relacionada con el parametro de densidad de energla y opcional a los parametros para correccion de tonalidad y/o correccion de ruido esta basada en la frecuencia desplazada correspondiente al parametro de comparacion determinado.
Una diferencia adicional entre el codificador 1500 y el codificador mostrado en la Figura 4 es que el generador de parche 110 genera una senal de alta frecuencia de extension de ancho de banda de la misma manera en que el generador de parche del decodificador 1400 lo hace. De esta manera, el codificador 1500 y el descodificador pueden obtener las mismas frecuencias desplazadas y por consiguiente, los parametros extraldos por el codificador 1500 son validos para las interconexiones generadas por el decodificador.
Un dispositivo y metodo para extension de ancho de banda de senales de audio en el dominio de tiempo puede utilizar moduladores variables en el tiempo. En otras palabras, una interconexion o parche puede ser generado con una frecuencia de corte variable, por ejemplo, para cada etapa de tiempo, cada cuadro de tiempo, una parte de un cuadro de tiempo o para grupos de cuadros de tiempo.
El metodo descrito para extension del ancho de banda de una senal de audio puede ser usado en el lado del codificador y el lado del decodificador tambien como solamente en el lado del decodificador. En contraste con metodos conocidos, el nuevo metodo descrito puede llevar a cabo una llamada extension armonica del ancho de banda sin la necesidad de informacion exacta acerca de la frecuencia fundamental de la senal de audio. Ademas, en contraste con las llamadas de extensiones de ancho de banda armonica como se muestra por ejemplo por la solicitud de patente estadounidense provisional “F. Nagel, S. Disch: “Apparatus and method of harmonic bandwidth extension in audio signals” con el numero de solicitud US 61/025129 que se hacen por medio de vocodificadores de fase, el espectro puede no ser esparcido y por consiguiente, tambien la densidad no puede ser cambiada. Para asegurar la armonla, se aprovechan correlaciones entre la banda extendida y la banda base. Esta correlacion puede ser calculada en el codificador tambien como en el decodificador, dependiendo de la demanda para computo y complejidad de memoria y velocidad de datos.
Por ejemplo, la extension de ancho de banda misma se puede hacer al usar una modulacion de amplitud (AM) y un desplazamiento de frecuencia por medio de una sola modulacion de banda lateral (SSB) con una pluralidad de portadores variables en el tiempo lentos, adaptables unicos. Un post-procesamiento siguiente de acuerdo con parametros adicionales puede intentar aproximar la envolvente espectral y el nivel de ruido tambien como otras propiedades de las senales originales.
El nuevo metodo para transformacion de senales puede evitar los problemas que aparecen debido a una operacion de copia simple o reflejo por una continuacion correcta armonica del espectro por medio de una frecuencia de corte variable en el tiempo XOver entre la region de baja frecuencia (LF) y la region de alta frecuencia (HF) tambien como entre las siguientes regiones de alta frecuencia, los llamados parches o interconexiones. Estas frecuencias de corte son escogidas de tal manera que los parches generados reparan una trama armonica existente ya que era existente en el origina tan bueno como sea posible.
La Figura 16 muestra un modulador con 3 amplitudes variables en el tiempo y frecuencias de corte mediante los cuales 3 parches pueden ser generados mediante la modulacion individual de banda lateral de las bandas base. La Figura 16a muestra un diagrama 1600a del espectro de la senal extendida en ancho de banda utilizando frecuencias de corte variables en el tiempo 1610. La Figura 16b ilustra un diagrama 1600b del espectro de la senal de audio de los tres tonos. En comparacion con el espectrograma ilustrado en la Figura 18b las llneas 1620 son significativamente menos discontinuas.
La Figura 17 ilustra el efecto por medio de un diagrama 1700 del perlodo. El espectro de densidad de energla de los terceros tonos de la senal de audio es mostrado como original 1710, con una frecuencia de corte constante 1720 y con una frecuencia de corte variable 1730. En contraste con usar la frecuencia de corte constante 1720, la estructura armonica permanece al usar la frecuencia de corte variable 1730.
Mediante la continuacion armonica del espectro, se pueden evitar problemas en los puntos de transicion entre ambos, la banda base (codificador del nucleo) y la banda extendida, y entre parches subsecuentes. Sin una estimacion de F0 como requerimiento para la funcion del sistema, senales arbitrarias pueden ser armonicas continuadas, sin la existencia de artefactos audibles, ni por violar la armonla ni por eventos de sonido transitorios.
Algunas realizaciones de acuerdo con la invencion son concernientes con un metodo apropiado para todas las aplicaciones de audio, en donde el pleno ancho de banda no esta disponible. Por ejemplo, para la difusion de contenido de audio como por ejemplo, con radio digital, la corriente o flujo de internet o en aplicaciones de comunicacion de audio, se puede usar el metodo descrito.
Una realizacion adicional de acuerdo con la invencion es concernientes con un descodificador de extension de ancho de banda para proveer una senal de audio extendida en ancho de banda basada en una senal de audio de entrada y una senal de parametro, segun se define en la reivindicacion 3.
Algunas realizaciones preferidas adicionales de acuerdo con la invencion son concernientes con un descodificador de extension de ancho de banda como se describe anteriormente, en donde el generador de parche esta configurado para amplificar o atenuar la banda de alta frecuencia de la senal de alta frecuencia de extension de ancho de banda por un factor igual al valor de un parametro de densidad de energla o igual al valor reclproco del parametro de densidad de 10 energla, en donde una indicacion del parametro de densidad de energla esta contenido por la senal de audio de entrada.
En particular, se indica que, dependiendo de las condiciones, el esquema de la invencion puede tambien ser implementado en elementos de programacion. La implementacion se puede hacer por un medio de almacenamiento digital, particularmente un disco flexible o un CD con senales de control que se pueden leer electronicamente aptas de 15 cooperar con un sistema de ordenador programable de tal manera que el metodo correspondiente es ejecutado. En general, la invencion as! tambien consiste en un producto de programa de ordenador con codigos de programa almacenados en un portador que se puede leer por la maquina para efectuar el metodo de la invencion, cuando el producto de programa de ordenador es ejecutado en un ordenador. En otras palabras, la invencion puede as! tambien ser realizada como un programa de ordenador con codigos de programa para efectuar el metodo, de acuerdo con una de 20 las reivindicaciones 11-13, cuando el programa de ordenador es ejecutado en un ordenador.

Claims (14)

  1. 5
    10
    15
    20
    25
    30
    35
    40
    45
    50
    55
    60
    REIVINDICACIONES
    1. Un codificador de audio (100), (400), (1500) para proveer una senal de salida (132) utilizando una senal de audio de entrada (102), que comprende:
    un generador de parche (110) configurado para generar por lo menos una senal de alta frecuencia de extension de ancho de banda (112), en donde la senal de alta frecuencia de extension de ancho de banda (112) comprende una banda de alta frecuencia, en donde la banda de alta frecuencia de una senal de alta frecuencia de extension de ancho de banda(112) esta basada en una banda de baja frecuencia de la senal de audio de entrada (102), y en donde diferentes senales de alta frecuencia de extension de ancho de banda (112) comprenden diferentes frecuencias dentro de sus bandas de alta frecuencia, si se generan senales de alta frecuencia de extension de ancho de banda diferentes;
    un comparador (120) configurado para calcular una pluralidad de parametros de comparacion, en donde un parametro de comparacion es calculado en base a una comparacion de la senal de audio de entrada (102) y una senal de alta frecuencia de extension de ancho de banda generada (112), en donde cada parametro de comparacion de la pluralidad de parametros de comparacion es calculado en base a una frecuencia desplazada diferente entre la senal de audio de entrada (102) y una senal de alta frecuencia de extension de ancho de banda generada (112), y en donde el comparador (120) esta configurado para determinar el parametro de comparacion a partir de la pluralidad de parametros de comparacion, en donde el parametro de comparacion determinado satisface un criterio predefinido; y
    una interfase de salida (130) configurada para proveer la senal de salida (132) para transmision o almacenamiento, en donde la senal de salida (132) comprende un indicacion de parametro basada en una frecuencia desplazada correspondiente al parametro de comparacion determinado.
  2. 2. Codificador de audio de acuerdo con la reivindicacion 1, que comprende un comparador de densidad de energla (430) configurado para comparar un parametro basado en la densidad de energla de la banda de alta frecuencia de una senal de alta frecuencia de extension de ancho de banda generada (112) y una banda de frecuencia correspondiente de la senal de audio de entrada (102) para obtener un parametro de densidad de energla, en donde el parametro de densidad de energla indica una proporcion basada en la densidad de energla de la banda de alta frecuencia de la senal de alta frecuencia de extension de ancho de banda generada (112) y la banda de frecuencia correspondiente de la senal de audio de entrada, y en donde la indicacion del parametro de la senal de salida (132) esta basada en el parametro de densidad de energla.
  3. 3. Un descodificador de extension de ancho de banda (500), (600) para proveer una senal de audio extendida en ancho de banda (532) basada en una senal de audio de entrada (502) y una senal de parametro (504), en donde la senal de parametro (504) comprende una indicacion de una frecuencia desplazada y una indicacion de un parametro de densidad de energla, en donde el descodificador de extension de ancho de banda comprende:
    un generador de parche (510) configurado para generar una senal de alta frecuencia de extension de ancho de banda (512) que comprende una banda de alta frecuencia, en donde la banda de alta frecuencia de la senal de alta frecuencia de extension de ancho de banda (512) es generada en base a un desplazamiento de frecuencia de una banda de frecuencia de la senal de audio de entrada (502), en donde el desplazamiento de frecuencia esta basado en la frecuencia desplazada, y en donde el generador de parche (510) esta configurado para amplificar o atenuar la banda de alta frecuencia de la senal de alta frecuencia de extension de ancho de banda (512) por un factor igual al valor del parametro de densidad de energla o igual al valor reclproco del parametro de densidad de energla, respectivamente;
    un combinador (520) configurado para combinar la senal de alta frecuencia de extension de ancho de banda (512) y la senal de audio de entrada (502) para obtener la senal de audio extendida en ancho de banda (532);
    donde el combinador (520) esta configurado para ignorar parte de la banda de alta frecuencia de la senal de alta frecuencia de extension de ancho de banda (512), en donde la parte ignorada de la banda de alta frecuencia de la senal de alta frecuencia de extension de ancho de banda (512) comprende frecuencias mas bajas que una frecuencia de corte superior de la senal de audio de entrada (502); y
    una interfase de salida (530) configurada para proveer la senal de audio extendida en ancho de banda (532).
  4. 4. El descodificador de extension de ancho de banda de acuerdo con la reivindicacion 3, que comprende un descodificador de nucleo (610) configurado para generar la senal de audio de entrada (502) en base a una senal de audio de entrada codificada (602), en donde el descodificador de nucleo (610) genera la senal de audio de entrada (502) con una frecuencia de corte superior constante, y en donde el generador de parche (510) esta configurado para generar la banda de alta frecuencia de la senal de alta frecuencia de extension de ancho de banda (512) al desplazar la banda
    5
    10
    15
    20
    25
    30
    35
    40
    45
    50
    55
    60
    de frecuencia de la senal de audio de entrada (502) por una frecuencia igual a la frecuencia de corte superior de la senal de audio de entrada (502) mas la frecuencia desplazada.
  5. 5. El descodificador de extension de ancho de banda de acuerdo con una de las reivindicaciones 3 a 4, en donde el generador de parche (510) esta configurado para generar la senal de alta frecuencia de extension de ancho de banda (512) en el dominio de tiempo.
  6. 6. El descodificador de extension de ancho de banda de acuerdo con la reivindicacion 5, en donde el generador de parche (510) esta configurado para generar la senal de alta frecuencia de extension de ancho de banda en base a una sola modulacion de banda lateral.
  7. 7. Un descodificador de extension de ancho de banda (1200) para proveer una senal de audio extendida en ancho de banda (532) basada en una senal de audio de entrada (502), que comprende:
    un generador de parche (1210) configurado para generar por lo menos una senal de alta frecuencia de extension de ancho de banda (1212) que comprende una banda de alta frecuencia basada en la senal de audio de entrada (502), en donde una frecuencia de corte inferior de la banda de alta frecuencia de una senal de alta frecuencia de extension de ancho de banda (1212) es mas baja que una frecuencia de corte superior de la senal de audio de entrada (502), y en donde diferentes senales de alta frecuencia de extension de ancho de banda (1212) comprenden diferentes frecuencias dentro de sus bandas de alta frecuencia, si se generan diferentes senales de alta frecuencia de extension de ancho de banda (1212);
    un comparador (1220) configurado para calcular una pluralidad de parametros de comparacion, en donde un parametro de comparacion es calculado en base a una comparacion de la senal de audio de entrada (502) y una senal de alta frecuencia de extension de ancho de banda generada (1212), en donde cada parametro de comparacion de la pluralidad de parametros de comparacion es calculado en base a una frecuencia desplazada diferente entre la senal de audio de entrada (502) y una senal de alta frecuencia de extension de ancho de banda generada (1212), y en donde el comparador (1220) esta configurado para determinar un parametro de comparacion a partir de la pluralidad de parametros de comparacion, en donde el parametro de comparacion determinado satisface un criterio predefinido;
    un combinador (1230) configurado para combinar la senal de audio de entrada (502) y una senal de alta frecuencia de extension de ancho de banda para obtener la senal de audio extendida en ancho de banda (532), en donde la senal de alta frecuencia de extension de ancho de banda usada para obtener la senal de audio de extension de ancho de banda (532) esta basada en una frecuencia desplazada correspondiente al parametro de comparacion determinado; y
    una interfase de salida (1240) configurada para proveer la senal de audio extendida en ancho de banda (532).
  8. 8. Descodificador de extension de ancho de banda de acuerdo con la reivindicacion 7, en donde el generador de parche (1210) esta configurado para amplificar o atenuar la banda de alta frecuencia de la senal de alta frecuencia de extension de ancho de banda (1212) por un factor igual al valor de un parametro de densidad de energla o igual al valor reclproco del parametro de densidad de energla respectivamente, en donde una indicacion del parametro de densidad de energla esta contenida por la senal de audio de entrada (502).
  9. 9. Descodificador de extension de ancho de banda de acuerdo con una cualquiera de las reivindicaciones 3 a 8, caracterizado que comprende medios de interpolacion, en donde un cuadro de tiempo comprende una pluralidad de etapas de tiempo, en donde cada cuadro de tiempo comprende una frecuencia desplazada correspondiente, en donde los medios de interpolacion estan configurados para interpolar una frecuencia desplazada de un cuadro de tiempo o una pluralidad de frecuencias desplazadas de diferentes cuadros de tiempo para cada etapa de tiempo de un cuadro de tiempo para obtener una frecuencia desplazada interpolada para cada etapa de tiempo.
  10. 10. Codificador de audio o descodificador de extension de ancho de banda de acuerdo con una cualquiera de las reivindicaciones 1,2, 7 u 8, en donde el comparador esta configurado para efectuar la comparacion de la senal de audio de entrada y la senal de alta frecuencia de extension de ancho de banda generada al calcular un resultado de la correlacion cruzada de la senal de audio de entrada y la senal de alta frecuencia de extension de ancho de banda generada, en donde el parametro de comparacion a ser calculado esta basado en el resultado de la correlacion cruzada, en donde un parametro de la correlacion cruzada es una frecuencia desplazada de la senal de alta frecuencia de extension de ancho de banda y esta por consiguiente asociada con el parametro de comparacion calculado.
  11. 11. Un metodo (700) para proveer una senal de salida utilizando una senal de audio de entrada, el metodo comprende: generar (710) por lo menos una senal de alta frecuencia de extension de ancho de banda, en donde la senal de alta
    5
    10
    15
    20
    25
    30
    35
    40
    45
    50
    55
    60
    frecuencia de extension de ancho de banda comprende una banda de alta frecuencia, en donde la banda de alta frecuencia de la senal de alta frecuencia de extension de ancho de banda esta basada en una banda de baja frecuencia de la senal de audio de entrada, y en donde diferentes senales de alta frecuencia de extension de ancho de banda comprenden diferentes frecuencias dentro de sus bandas de alta frecuencia, si se generan diferentes senales de alta frecuencia de extension de ancho de banda;
    calcular (720) una pluralidad de parametros de comparacion, en donde un parametro de comparacion es calculado en base a una comparacion de la senal de audio de entrada y una senal de alta frecuencia de extension de ancho de banda generada, en donde cada parametro de comparacion de la pluralidad de parametros de comparacion es calculado en base a una frecuencia desplazada diferente entre la senal de audio de entrada y una senal de alta frecuencia de extension de ancho de banda generada;
    determinar (730) un parametro de comparacion a partir de la pluralidad de parametros de comparacion, en donde el parametro de comparacion determinado satisface un criterio predefinido; y
    proveer (749) la senal de salida para transmision o almacenamiento, en donde la senal de salida comprende una indicacion de parametro basada en una frecuencia desplazada correspondiente al parametro de comparacion determinado.
  12. 12. Un metodo (800) para proveer una senal de audio extendida en ancho de banda en base a una senal de audio de entrada y una senal de parametro, en donde la senal de parametro comprende una indicacion de una frecuencia desplazada y una indicacion de un parametro de densidad de energla, el metodo comprende:
    generar (810) una senal de alta frecuencia de extension de ancho de banda que comprende una banda de alta frecuencia, en donde la banda de alta frecuencia de la senal de alta frecuencia de extension de ancho de banda es generada en base al desplazamiento de frecuencia de una banda de frecuencia de la senal de audio de entrada, en donde el desplazamiento de frecuencia esta basado en la frecuencia desplazada;
    amplificar (820) o atenuar la banda de alta frecuencia de la senal de alta frecuencia de extension de ancho de banda por un factor igual al valor del parametro de densidad de energla o igual al valor reclproco del parametro de densidad de energla;
    combinar (830) la senal de alta frecuencia de extension de ancho de banda y la senal de audio de entrada para obtener una senal de audio extendida en ancho de banda;
    en donde parte de la banda de alta frecuencia de la senal de alta frecuencia de extension de ancho de banda (512) es ignorada, en donde la parte ignorada de la banda de alta frecuencia de la senal de alta frecuencia de extension de ancho de banda (512) comprende frecuencias mas bajas que una frecuencia de corte superior de la senal de audio de entrada (502); y
    proveer (840) la senal de audio extendida en ancho de banda.
  13. 13. Un metodo (1300) para proveer una senal de audio extendida en ancho de banda en base a una senal de audio de entrada, el metodo comprende:
    generar (1310) por lo menos una senal de alta frecuencia de extension de ancho de banda que comprende una banda de alta frecuencia basada en la senal de audio de entrada, en donde una frecuencia de corte inferior de la banda de alta frecuencia de una senal de alta frecuencia de extension de ancho de banda es mas baja que una frecuencia de corte superior de la senal de audio de entrada, y en donde diferentes senales de alta frecuencia de extension de ancho de banda comprenden diferentes frecuencias dentro de sus bandas de alta frecuencia, si se generan diferentes senales de alta frecuencia de extension de ancho de banda;
    calcular (1320) una pluralidad de parametros de comparacion, en donde un parametro de comparacion es calculado en base a una comparacion de la senal de audio de entrada y una senal de alta frecuencia de extension de ancho de banda generada, en donde cada parametro de comparacion de la pluralidad de parametros de comparacion es calculado en base a una frecuencia desplazada diferente entre la senal de audio de entrada y una senal de frecuencia de extension de ancho de banda generada;
    determinar (1330) un parametro de comparacion a partir de la pluralidad de parametros de comparacion, en donde el parametro de comparacion determinado satisface un criterio predefinido;
    combinar (1340) la senal de audio de entrada y una senal de alta frecuencia de extension de ancho de banda para obtener la senal de audio extendida en ancho de banda, en donde la senal de alta frecuencia extendida en ancho de banda usada para obtener la senal de audio extendida en ancho de banda esta basada en una frecuencia desplazada correspondiente al parametro de compensacion determinado; y 5
    proveer (1350) la senal de audio extendida en ancho de banda.
  14. 14. Un programa de ordenador con codigos de programa para efectuar el metodo de acuerdo con una de las reivindicaciones 11 a 13, c el programa de ordenador se ejecuta en un ordenador o un microcontrolador.
    10
ES09797003.2T 2008-12-15 2009-12-11 Codificador de audio y descodificador de extensión de ancho de banda Active ES2613941T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US12255208P 2008-12-15 2008-12-15
US122552P 2008-12-15
PCT/EP2009/066980 WO2010069885A1 (en) 2008-12-15 2009-12-11 Audio encoder and bandwidth extension decoder

Publications (1)

Publication Number Publication Date
ES2613941T3 true ES2613941T3 (es) 2017-05-29

Family

ID=42104496

Family Applications (4)

Application Number Title Priority Date Filing Date
ES09797003.2T Active ES2613941T3 (es) 2008-12-15 2009-12-11 Codificador de audio y descodificador de extensión de ancho de banda
ES18151917T Active ES2921059T3 (es) 2008-12-15 2009-12-11 Decodificador de extensión de ancho de banda de audio, programa informático y procedimiento correspondiente
ES15167199.7T Active ES2674386T3 (es) 2008-12-15 2009-12-11 Codificador de audio y decodificador de extensión de ancho de banda
ES22166970T Active ES2951163T3 (es) 2008-12-15 2009-12-11 Decodificador de extensión de ancho de banda de audio, procedimiento correspondiente y programa informático

Family Applications After (3)

Application Number Title Priority Date Filing Date
ES18151917T Active ES2921059T3 (es) 2008-12-15 2009-12-11 Decodificador de extensión de ancho de banda de audio, programa informático y procedimiento correspondiente
ES15167199.7T Active ES2674386T3 (es) 2008-12-15 2009-12-11 Codificador de audio y decodificador de extensión de ancho de banda
ES22166970T Active ES2951163T3 (es) 2008-12-15 2009-12-11 Decodificador de extensión de ancho de banda de audio, procedimiento correspondiente y programa informático

Country Status (16)

Country Link
US (13) US8401862B2 (es)
EP (12) EP4231291B1 (es)
JP (3) JP2012512437A (es)
KR (2) KR101369267B1 (es)
CN (1) CN102246231B (es)
AU (1) AU2009328247B9 (es)
BR (2) BRPI0917762B1 (es)
CA (5) CA2908847C (es)
DK (1) DK3364414T3 (es)
ES (4) ES2613941T3 (es)
HK (2) HK1217810A1 (es)
MX (1) MX2011006163A (es)
PL (8) PL4231290T3 (es)
PT (3) PT2359366T (es)
TR (1) TR201808500T4 (es)
WO (1) WO2010069885A1 (es)

Families Citing this family (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6992481B2 (en) 2003-05-29 2006-01-31 Timex Group B. V. Method for compensating for predictable generated signals in an electronic device
EP4231291B1 (en) * 2008-12-15 2023-11-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio bandwidth extension decoder, corresponding method and computer program
ES2805349T3 (es) * 2009-10-21 2021-02-11 Dolby Int Ab Sobremuestreo en un banco de filtros de reemisor combinado
JP5649084B2 (ja) 2010-03-09 2015-01-07 フラウンホーファーゲゼルシャフトツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. 再生速度またはピッチを変更する際にオーディオ信号における過渡音声事象を処理するための装置および方法
KR101414736B1 (ko) * 2010-03-09 2014-08-06 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 캐스케이드 필터뱅크들을 이용한 입력 오디오 신호를 처리하는 장치 및 방법
WO2011110494A1 (en) 2010-03-09 2011-09-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Improved magnitude response and temporal alignment in phase vocoder based bandwidth extension for audio signals
FR2961938B1 (fr) * 2010-06-25 2013-03-01 Inst Nat Rech Inf Automat Synthetiseur numerique audio ameliore
US8560330B2 (en) * 2010-07-19 2013-10-15 Futurewei Technologies, Inc. Energy envelope perceptual correction for high band coding
JP5714180B2 (ja) 2011-05-19 2015-05-07 ドルビー ラボラトリーズ ライセンシング コーポレイション パラメトリックオーディオコーディング方式の鑑識検出
US20130006644A1 (en) * 2011-06-30 2013-01-03 Zte Corporation Method and device for spectral band replication, and method and system for audio decoding
US9173025B2 (en) 2012-02-08 2015-10-27 Dolby Laboratories Licensing Corporation Combined suppression of noise, echo, and out-of-location signals
US20140046670A1 (en) * 2012-06-04 2014-02-13 Samsung Electronics Co., Ltd. Audio encoding method and apparatus, audio decoding method and apparatus, and multimedia device employing the same
KR101990884B1 (ko) * 2012-09-04 2019-06-19 에스케이 텔레콤주식회사 이종망 간의 통신품질 향상 방법 및 장치
EP2709106A1 (en) 2012-09-17 2014-03-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating a bandwidth extended signal from a bandwidth limited audio signal
US9258428B2 (en) * 2012-12-18 2016-02-09 Cisco Technology, Inc. Audio bandwidth extension for conferencing
EP2950308B1 (en) * 2013-01-22 2020-02-19 Panasonic Corporation Bandwidth expansion parameter-generator, encoder, decoder, bandwidth expansion parameter-generating method, encoding method, and decoding method
PL3067890T3 (pl) 2013-01-29 2018-06-29 Fraunhofer Ges Forschung Koder audio, dekoder audio, sposób dostarczania zakodowanej informacji audio, sposób dostarczania zdekodowanej informacji audio, program komputerowy i zakodowana reprezentacja, wykorzystujące adaptacyjne względem sygnału powiększanie szerokości pasma
ES2899781T3 (es) 2013-01-29 2022-03-14 Fraunhofer Ges Forschung Aparato y procedimiento para generar una señal de refuerzo de frecuencia mediante la configuración de la señal de refuerzo
CN103971694B (zh) * 2013-01-29 2016-12-28 华为技术有限公司 带宽扩展频带信号的预测方法、解码设备
RU2622872C2 (ru) * 2013-04-05 2017-06-20 Долби Интернэшнл Аб Аудиокодер и декодер для кодирования по форме волны с перемежением
CN104217727B (zh) * 2013-05-31 2017-07-21 华为技术有限公司 信号解码方法及设备
EP2830056A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding an audio signal with intelligent gap filling in the spectral domain
US10083708B2 (en) * 2013-10-11 2018-09-25 Qualcomm Incorporated Estimation of mixing factors to generate high-band excitation signal
EP2871641A1 (en) * 2013-11-12 2015-05-13 Dialog Semiconductor B.V. Enhancement of narrowband audio signals using a single sideband AM modulation
JP6593173B2 (ja) * 2013-12-27 2019-10-23 ソニー株式会社 復号化装置および方法、並びにプログラム
JP6576934B2 (ja) * 2014-01-07 2019-09-18 ハーマン インターナショナル インダストリーズ インコーポレイテッド 圧縮済みオーディオ信号の信号品質ベース強調及び補償
FR3017484A1 (fr) * 2014-02-07 2015-08-14 Orange Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences
EP3128513B1 (en) * 2014-03-31 2019-05-15 Fraunhofer Gesellschaft zur Förderung der Angewand Encoder, decoder, encoding method, decoding method, and program
US9984699B2 (en) * 2014-06-26 2018-05-29 Qualcomm Incorporated High-band signal coding using mismatched frequency ranges
EP2963645A1 (en) * 2014-07-01 2016-01-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Calculator and method for determining phase correction data for an audio signal
JP2016038435A (ja) * 2014-08-06 2016-03-22 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
US9852744B2 (en) * 2014-12-16 2017-12-26 Psyx Research, Inc. System and method for dynamic recovery of audio data
US10847170B2 (en) 2015-06-18 2020-11-24 Qualcomm Incorporated Device and method for generating a high-band signal from non-linearly processed sub-ranges
KR101677137B1 (ko) * 2015-07-17 2016-11-17 국방과학연구소 변조 스펙트로그램을 이용한 수중 방사체의 데몬 및 lofar 특징을 동시 추출하는 방법 및 장치
EP3182411A1 (en) 2015-12-14 2017-06-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing an encoded audio signal
EP3182410A3 (en) * 2015-12-18 2017-11-01 Dolby International AB Enhanced block switching and bit allocation for improved transform audio coding
JP6790114B2 (ja) * 2016-03-18 2020-11-25 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 音声スペクトログラムに基づく構造テンソルを使用して位相情報を復元することによるエンコーディング
TW202341126A (zh) * 2017-03-23 2023-10-16 瑞典商都比國際公司 用於音訊信號之高頻重建的諧波轉置器的回溯相容整合
EP3382702A1 (en) * 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for determining a predetermined characteristic related to an artificial bandwidth limitation processing of an audio signal
GB2562253B (en) * 2017-05-09 2021-11-03 Imagination Tech Ltd Efficient detection of ranging code correlation function of a GNSS signal
US10896684B2 (en) * 2017-07-28 2021-01-19 Fujitsu Limited Audio encoding apparatus and audio encoding method
CN109729585B (zh) * 2017-10-27 2022-04-15 成都鼎桥通信技术有限公司 网络处理方法和装置
US11158297B2 (en) * 2020-01-13 2021-10-26 International Business Machines Corporation Timbre creation system
EP4211701A1 (en) * 2020-09-09 2023-07-19 Sparrow Acoustics Inc. Method and system for performing time-domain processing of a waveform signal
US20230110255A1 (en) * 2021-10-12 2023-04-13 Zoom Video Communications, Inc. Audio super resolution

Family Cites Families (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2512908A (en) 1947-10-16 1950-06-27 Mina M Arndt Telephone switchboard mounting plate with plug-in components
US5455888A (en) 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
WO1997029549A1 (fr) 1996-02-08 1997-08-14 Matsushita Electric Industrial Co., Ltd. Codeur, decodeur, codeur-decodeur et support d'enregistrement de signal audio large bande
JPH10124088A (ja) 1996-10-24 1998-05-15 Sony Corp 音声帯域幅拡張装置及び方法
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US6549884B1 (en) * 1999-09-21 2003-04-15 Creative Technology Ltd. Phase-vocoder pitch-shifting
US7742927B2 (en) * 2000-04-18 2010-06-22 France Telecom Spectral enhancing method and device
SE0001926D0 (sv) * 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
SE0004187D0 (sv) * 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
JP2003108197A (ja) * 2001-07-13 2003-04-11 Matsushita Electric Ind Co Ltd オーディオ信号復号化装置およびオーディオ信号符号化装置
DE60230856D1 (de) * 2001-07-13 2009-03-05 Panasonic Corp Audiosignaldecodierungseinrichtung und audiosignalcodierungseinrichtung
US6895375B2 (en) 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech
AU2002352182A1 (en) 2001-11-29 2003-06-10 Coding Technologies Ab Methods for improving high frequency reconstruction
US20040002844A1 (en) 2002-06-27 2004-01-01 Jess Jochen A.G. System and method for statistical modeling and statistical timing analysis of integrated circuits
US8090577B2 (en) 2002-08-08 2012-01-03 Qualcomm Incorported Bandwidth-adaptive quantization
JP3861770B2 (ja) 2002-08-21 2006-12-20 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
DE10328777A1 (de) 2003-06-25 2005-01-27 Coding Technologies Ab Vorrichtung und Verfahren zum Codieren eines Audiosignals und Vorrichtung und Verfahren zum Decodieren eines codierten Audiosignals
CN101800049B (zh) * 2003-09-16 2012-05-23 松下电器产业株式会社 编码装置和译码装置
DE10345996A1 (de) 2003-10-02 2005-04-28 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Verarbeiten von wenigstens zwei Eingangswerten
DE10345995B4 (de) 2003-10-02 2005-07-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Verarbeiten eines Signals mit einer Sequenz von diskreten Werten
JP4254479B2 (ja) * 2003-10-27 2009-04-15 ヤマハ株式会社 オーディオ帯域拡張再生装置
DE102004046746B4 (de) * 2004-09-27 2007-03-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren zum Synchronisieren von Zusatzdaten und Basisdaten
WO2006049205A1 (ja) * 2004-11-05 2006-05-11 Matsushita Electric Industrial Co., Ltd. スケーラブル復号化装置およびスケーラブル符号化装置
EP1686564B1 (en) * 2005-01-31 2009-04-15 Harman Becker Automotive Systems GmbH Bandwidth extension of bandlimited acoustic signals
JP4604864B2 (ja) 2005-06-14 2011-01-05 沖電気工業株式会社 帯域拡張装置及び不足帯域信号生成器
US7953605B2 (en) * 2005-10-07 2011-05-31 Deepen Sinha Method and apparatus for audio encoding and decoding using wideband psychoacoustic modeling and bandwidth extension
US7953604B2 (en) * 2006-01-20 2011-05-31 Microsoft Corporation Shape and scale parameters for extended-band frequency coding
US20080004866A1 (en) * 2006-06-30 2008-01-03 Nokia Corporation Artificial Bandwidth Expansion Method For A Multichannel Signal
PL2109098T3 (pl) * 2006-10-25 2021-03-08 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Urządzenie i sposób do generowania próbek audio w dziedzinie czasu
JP2008158300A (ja) * 2006-12-25 2008-07-10 Sony Corp 信号処理装置、信号処理方法、再生装置、再生方法、電子機器
US7912729B2 (en) * 2007-02-23 2011-03-22 Qnx Software Systems Co. High-frequency bandwidth extension in the time domain
DE102008015702B4 (de) 2008-01-31 2010-03-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals
MX2010009932A (es) * 2008-03-10 2010-11-30 Fraunhofer Ges Forschung Metodo y dispositivo para manipular una señal de audio que tiene un evento transitorio.
US7977562B2 (en) * 2008-06-20 2011-07-12 Microsoft Corporation Synthesized singing voice waveform generator
AU2009267525B2 (en) * 2008-07-11 2012-12-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio signal synthesizer and audio signal encoder
US8880410B2 (en) * 2008-07-11 2014-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating a bandwidth extended signal
WO2010036062A2 (en) * 2008-09-25 2010-04-01 Lg Electronics Inc. A method and an apparatus for processing a signal
EP2224433B1 (en) * 2008-09-25 2020-05-27 Lg Electronics Inc. An apparatus for processing an audio signal and method thereof
EP4231291B1 (en) * 2008-12-15 2023-11-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio bandwidth extension decoder, corresponding method and computer program
EP3246919B1 (en) * 2009-01-28 2020-08-26 Dolby International AB Improved harmonic transposition
ES2805349T3 (es) * 2009-10-21 2021-02-11 Dolby Int Ab Sobremuestreo en un banco de filtros de reemisor combinado
PL2581905T3 (pl) * 2010-06-09 2016-06-30 Panasonic Ip Corp America Sposób rozszerzania pasma częstotliwości, urządzenie do rozszerzania pasma częstotliwości, program, układ scalony oraz urządzenie dekodujące audio
WO2012113035A1 (en) 2011-02-25 2012-08-30 Polyline Piping Systems Pty Ltd Mobile plastics extrusion plant
CN103928029B (zh) * 2013-01-11 2017-02-08 华为技术有限公司 音频信号编码和解码方法、音频信号编码和解码装置
US9666202B2 (en) * 2013-09-10 2017-05-30 Huawei Technologies Co., Ltd. Adaptive bandwidth extension and apparatus for the same

Also Published As

Publication number Publication date
EP2945159A1 (en) 2015-11-18
US8401862B2 (en) 2013-03-19
EP4224474A1 (en) 2023-08-09
CA2908550C (en) 2018-02-13
PL2359366T3 (pl) 2017-04-28
US20230049083A1 (en) 2023-02-16
KR20130133914A (ko) 2013-12-09
EP3364414B1 (en) 2022-04-13
EP4231291C0 (en) 2023-11-15
ES2674386T3 (es) 2018-06-29
CA2908847C (en) 2018-02-13
EP4231293C0 (en) 2023-11-15
EP4231290C0 (en) 2023-11-15
EP4053838A1 (en) 2022-09-07
PT3364414T (pt) 2022-07-04
US10229696B2 (en) 2019-03-12
BR122015019030B1 (pt) 2020-05-05
US20230041923A1 (en) 2023-02-09
AU2009328247B9 (en) 2013-12-05
US20150243293A1 (en) 2015-08-27
HK1259024A1 (zh) 2019-11-22
AU2009328247A1 (en) 2011-07-07
US11646043B2 (en) 2023-05-09
MX2011006163A (es) 2011-11-02
EP4231292B1 (en) 2023-11-15
CA2746837A1 (en) 2010-06-24
CA2908576C (en) 2018-11-27
US20210151063A1 (en) 2021-05-20
EP4231294A1 (en) 2023-08-23
PT2945159T (pt) 2018-06-26
WO2010069885A1 (en) 2010-06-24
EP4053838B1 (en) 2023-06-21
JP5970014B2 (ja) 2016-08-17
BRPI0917762B1 (pt) 2020-09-29
US20230072871A1 (en) 2023-03-09
CA2908847A1 (en) 2010-06-24
KR20110095354A (ko) 2011-08-24
PL4231290T3 (pl) 2024-04-02
EP4224474C0 (en) 2023-11-01
US11664039B2 (en) 2023-05-30
US9058802B2 (en) 2015-06-16
US11626124B2 (en) 2023-04-11
US20190156845A1 (en) 2019-05-23
US11631418B2 (en) 2023-04-18
BRPI0917762A2 (pt) 2016-07-26
CA2989886A1 (en) 2010-06-24
CA2746837C (en) 2016-09-20
KR101369267B1 (ko) 2014-03-04
EP4231294C0 (en) 2023-11-15
EP4231290B1 (en) 2023-11-15
PL4224475T3 (pl) 2024-03-18
PL4053838T3 (pl) 2023-11-13
EP2359366B1 (en) 2016-11-02
ES2921059T3 (es) 2022-08-17
CA2989886C (en) 2020-05-05
DK3364414T3 (da) 2022-06-27
US20230032124A1 (en) 2023-02-02
EP4231294B1 (en) 2023-11-15
US20230051135A1 (en) 2023-02-16
CA2908576A1 (en) 2010-06-24
EP2945159B1 (en) 2018-03-21
US20130185082A1 (en) 2013-07-18
US11594237B2 (en) 2023-02-28
JP2015187747A (ja) 2015-10-29
EP4231291A1 (en) 2023-08-23
CN102246231B (zh) 2013-07-10
BR122015019030A2 (pt) 2019-08-27
EP4231290A1 (en) 2023-08-23
EP3364414A1 (en) 2018-08-22
JP2012512437A (ja) 2012-05-31
US20230053046A1 (en) 2023-02-16
US11670316B2 (en) 2023-06-06
TR201808500T4 (tr) 2018-07-23
US10937437B2 (en) 2021-03-02
EP4231295A1 (en) 2023-08-23
US11741978B2 (en) 2023-08-29
US11705146B2 (en) 2023-07-18
EP4231291B1 (en) 2023-11-15
EP4224474B1 (en) 2023-11-01
EP2359366A1 (en) 2011-08-24
EP4231293B1 (en) 2023-11-15
EP4224475C0 (en) 2023-10-11
JP6076407B2 (ja) 2017-02-08
PL2945159T3 (pl) 2018-08-31
EP4231292C0 (en) 2023-11-15
PL4231292T3 (pl) 2024-04-02
PT2359366T (pt) 2017-01-20
CN102246231A (zh) 2011-11-16
AU2009328247B2 (en) 2013-06-06
CA2908550A1 (en) 2010-06-24
EP4231295B1 (en) 2024-02-21
US20230377590A1 (en) 2023-11-23
PL3364414T3 (pl) 2022-08-16
EP4231293A1 (en) 2023-08-23
ES2951163T3 (es) 2023-10-18
JP2014142653A (ja) 2014-08-07
HK1217810A1 (zh) 2017-01-20
EP4053838C0 (en) 2023-06-21
US20230037621A1 (en) 2023-02-09
EP4224475B1 (en) 2023-10-11
PL4224474T3 (pl) 2024-04-02
KR101424944B1 (ko) 2014-08-01
EP4231295C0 (en) 2024-02-21
EP4224475A1 (en) 2023-08-09
US20110288873A1 (en) 2011-11-24
EP4231292A1 (en) 2023-08-23

Similar Documents

Publication Publication Date Title
ES2613941T3 (es) Codificador de audio y descodificador de extensión de ancho de banda
AU2015203736B2 (en) Audio encoder and bandwidth extension decoder