MX2011006163A - Codificador de audio y descodificador de extension de ancho de banda. - Google Patents

Codificador de audio y descodificador de extension de ancho de banda.

Info

Publication number
MX2011006163A
MX2011006163A MX2011006163A MX2011006163A MX2011006163A MX 2011006163 A MX2011006163 A MX 2011006163A MX 2011006163 A MX2011006163 A MX 2011006163A MX 2011006163 A MX2011006163 A MX 2011006163A MX 2011006163 A MX2011006163 A MX 2011006163A
Authority
MX
Mexico
Prior art keywords
signal
high frequency
bandwidth extension
audio signal
parameter
Prior art date
Application number
MX2011006163A
Other languages
English (en)
Inventor
Sascha Disch
Juergen Herre
Frederik Nagel
Guillaume Fuchs
Christian Griebel
Original Assignee
Fraunhofer Ges Forschung
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Ges Forschung filed Critical Fraunhofer Ges Forschung
Publication of MX2011006163A publication Critical patent/MX2011006163A/es

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • G10L19/265Pre-filtering, e.g. high frequency emphasis prior to encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Abstract

Se describe un codificador de audio para proveer una señal de salida usando una señal de audio de entrada que comprende un generador de interconexión, un comparador y una interfase de salida. El generador de interconexión genera por lo menos una señal de alta frecuencia de extensión de ancho de banda, en donde una señal de alta frecuencia de extensión de ancho de banda comprende una banda de alta frecuencia. La banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda está basada en una banda de baja frecuencia de la señal de audio de entrada. El comparador calcula una pluralidad de parámetros de comparación. Se calcula un parámetro de comparación en base a la comparación de la señal de audio de entrada y una señal de alta frecuencia de extensión de ancho de banda generada. Cada parámetro de comparación de la pluralidad de parámetros de comparación es calculado en base a una frecuencia de desplazamiento diferente entre la señal de audio de entrada y una señal de alta frecuencia de extensión de ancho de banda generada. Además, el comparador determina un parámetro de comparación de la pluralidad de parámetros de comparación, en donde el parámetro de comparación determinado satisface un criterio predefinido.

Description

CODIFICADOR DE AÜDIO Y DESCODIFICADOR DE EXTENSION DE ANCHO DE BANDA DESCRIPCIÓN DE LA INVENCIÓN Las modalidades de acuerdo con la invención son concernientes con el procesamiento de señales de audio y en particular, con un codificador de audio, un método para proveer una señal de salida, un descodificador de extensión de ancho de banda y un método para proveer una señal de audio extendida en ancho de banda .
La codificación adaptada a la audición de señales de audio para reducción de datos para un almacenamiento y transmisión eficiente de estas señales ha ganado aceptación en muchos campos. Algoritmos de codificación son conocidos, por ejemplo, tales como MPEG ½ CAPA 3, "MP3" o MPEG 4 AAC. El algoritmo de codificación usado para esto, en particular cuando se obtienen proporciones de bits más bajas, conduce a la reducción de la calidad de audio que es frecuentemente provocada principalmente por una limitación lateral del codificador del ancho de banda de la señal de audio a ser transmitida. Una señal filtrada en paso de bajos es codificada utilizando un llamado codificador de núcleo o codificador central y la región con frecuencias más altas es parametrizada, de tal manera que pueden ser reconstruidas aproximadamente a partir de la señal filtrada en paso de bajos.
Es conocido de WO 98 57436 sobre toda señal de audio a una limitación de banda en tal situación en el lado del codificador y codificar solamente una banda más baja de la señal de audio por medio de un codificador de audio de alta calidad. La banda superior, sin embargo, es solo caracterizada muy burdamente, esto es, por un conjunto de parámetros que permiten la reproducción de la envolvente espectral original de la banda superior. En el lado del descodificador, la banda superior es luego sintetizada. Para este propósito, se propone una transposición armónica, en donde la banda inferior de la señal de audio descodificada es suministrada a un banco de filtros. Canales de banco de filtros de la banda inferior son conectados a canales de banco de filtros de la banda superior o son "interconectados" y cada señal de paso de banda interconectada es sometida a un ajuste de envolvente. El banco de filtros de síntesis perteneciente a un banco de filtros de análisis especial recibe aquí señales de paso de banda de la señal de audio en la banda inferior y señales de paso de banda ajustados al envolvente de la banda inferior que fueron interconectadas armónicamente a la banda superior. La señal de salida del banco de filtros de síntesis es una señal de audio extendida con respecto a su ancho de banda de audio que fue transmitida del lado del codificador al lado del descodificador con una proporción de datos muy baja. En particular, los cálculos de banco de filtros e interconexión en el dominio de banco de filtros se puede convertir en un esfuerzo computacional alto.
Métodos de complejidad producida para una extensión de ancho de banda de señales de audio de banda limitada en lugar de esto utilizan una función de copia de ofrecerles la señal de baja frecuenta (LS) al intervalo de alta frecuencia (HF) , con el fin de aproximar información perdida debido a la limitación de banda. Tales métodos son descritos en M. Dietz, L. Liljeryd, K. Kjorling y 0. Kunz, "Spectral Band Replication, a novel approach in audio coding," en la 112a Convención AES, Munich, Mayo de 2002; S. Meltzer, R. Bohm y F. Henn, "SBR enhanced audio codees for digital broadcasting such as "Digital Radio Mondiale" (DRM) , " 112a Convención AES, Munich, Mayo de 2002; T. Ziegler, A. Ehret, P. Ekstrand y M. Lutzky, "Enhancing mp3 with SBR: Features and Capabilities of the new mp3PRO Algorithm, " en 112a Convención AES, Munich, Mayo de 2002; International Standard ISO/IEC 14496-3 : 2001/FPDAM 1, "Bandwidth Extensión," ISO/IEC, 2002, o "Speech bandwidth extensión method and apparatus", Vasu Iyengar et al. Patente estadounidense No. 5,455,888.
En estos métodos, no se efectúa ninguna transposición armónica, pero los canales del banco de filtros de fase de banda adyacentes de la banda inferior son introducidos artificialmente a canales del banco de filtros adyacentes de la banda superior. Esto conduce a una aproximación burda de la banda superior de la señal de audio . Esta aproximación burda de la señal es luego, en una etapa adicional, reclinada al definir parámetros de control adicionales deducidos de la señal original. Como un ejemplo, el estándar de MPEG-4 utiliza factores estándar para ajustar la envolvente espectral, una combinación de filtración inversa y adición de un piso de ruido para adaptar la tonalidad e inserciones de porciones de señal sinusoidales para complementación de componentes tonales.
Aparte de esto, existen métodos adicionales tales como la llamada "extensión de ancho de banda ciega", descrita en E. Larsen,' R.M. Aarts y M. Danessis, "Efficient high-frequency bandwidth extensión of music and speech" , en 112a Convención AES, Munich, Alemania, Mayo de 2002 en donde no se usa ninguna información del intervalo de HF original. Además, también existe el método de la llamada "extensión de ancho de banda artificial" que es descrito en K. Káyhko, A Robust Wideband Enhancement for Narrowband Speech Signal; Research Report, Helsinki University of Technology, Laboratory of Acoustics and Audio signal Processing, 2001 .
En J. Makinen et al.: AMR-WB+ : a new audio coding standard for 3rd generation mobile audio services Broadcasts, IEEE, ICASSP ' 05 se describe un método para extensión de ancho de banda, en donde la operación de copia de componentes de baja frecuencia a la banda alta es efectuada por una operación de reflejo o espejo obtenida, por ejemplo, mediante toma de muestras ascendentes de la señal filtrada en paso de bajos.
Como una alternativa, una modulación de banda lateral individual puede ser empleada que es básicamente equivalente a una operación de copia en el dominio de banco de filtros. Métodos que habilitan una extensión de ancho de banda armónica emplean usualmente una etapa de determinación del paso (rastreo de paso) , una etapa de distorsión no lineal (véase, por ejemplo, "U. Kornagel, Spectral wideriing of the excitation signal for telephone-band speech enhancement, en: Proceedings of the IWAENC, Darmstadt, Alemania, Septiembre de 2001, pp. 215 - 218") o hacen uso de vocoders de fase tales como por ejemplo como se muestran por la solicitud de patente estadounidense provisional "F.Nagel, S. Disch: "Apparatus and method of harmonic bandwidth extensión in audio signáis"" con el número, de solicitud US 61/025129.
El documento WO 02/41302 Al, por ejemplo, muestra un método para mejorar el desempeño de sistemas de codificación que usan métodos de reconstrucción de alta frecuencia. Muestra cómo mejorar el desempeño global de tales sistemas por medio de una adaptación sobre el tiempo de la frecuencia de cruce entre la banda baja codificada por un codificador central y la banda alta codificada por un sistema de reconstrucción de alta frecuencia. Para este método, el codificador de núcleo o codificador central debe ser apto de trabajar con diferentes frecuencias de cruce en el lado del codificador, también como en el lado del descodificador . Por consiguiente, la complejidad del codificador del núcleo o codificador central es incrementada .
Tecnologías adicionales para extensiones de bandas son descritas, por ejemplo, en "R. M. Aarts, E. Larsen y 0. Ouweltjes, A unified approach to low- and high-frequency bandwidth extensión. En 115a Convention AES, Nueva York, EUA, Octubre de 2003", E. Larsen y R. M. Aarts: Audio Bandwidth Extensión - Application to psychoacoustics , Signal Processing and Loudspeaker Design. John Wiley e hijos, Ltd, 2004", E. Larsen, R. M. Aarts y M. Danessis: Efficient high-frequency bandwidth extensión of music and speech. En 112a Convención AES 112th, Munich, Alemania, Mayo de 2002", "J. Makhoul: Spectral Analysis of Speech by Linear Prediction. IEEE Transactions on Audio and Electroacoustics , AU-21(3), Junio de 1973", "Solicitud de patente estadounidense 08/951,029, Ohmori et al.: Audio band width extending system and method" and "patente estadounidense 6895375, Malah, D y Cox, R. vs.: System for bandwidth extensión of Narrow-band speech".
Los métodos de extensión de ancho de banda armónicos frecuentemente exhiben una alta complejidad, en tanto que los métodos de extensión de ancho de banda de complejidad reducida muestran pérdidas de calidad. En el caso particular en donde una baja proporción de bits es combinada con un ancho de banda pequeño de la banda baja, se pueden presentar artefactos tales como rugosidad o aspereza y un timbre percibido como desagradable. Una razón por esto es el hecho de que la porción de HF aproximada está basada en una operación de copia que no mantiene ni las relaciones armónicas entre las porciones de señal tonales. Esto se aplica tanto a la relación armónica entre LF y HF y también a la relación armónica entre interconexiones subsecuentes dentro de la porción de HF misma. Por ejemplo, dentro de SBR, la yuxtaposición de los componentes codificados y los componentes replicados, que se presenta en la frontera entre las bandas baja y alta puede provocar impresiones de sonido áspero o rugoso. La razón es ilustrada en la Figura 18 en donde porciones tonales copiadas del intervalo LF al intervalo de HF son espectralmente adyacentes densamente a porciones tonales del intervalo de LF.
La Figura 18a muestra el espectrograma original 1800a de una señal que consiste de tres tonos. De conformidad, la Figura 18b muestra un diagrama 1800b de la señal extendida del ancho de banda correspondiente a la señal original de la Figura 18a. La abcisa indica el tiempo y la ordenada indica la frecuencia. En particular, en el último tono, se pueden observar problemas potenciales 1810 (líneas discontinuas 1810) .
Si las relaciones armónicas son consideradas mediante métodos conocidos, esto siempre se hace en base a una estimación de F0. En estos casos, el éxito de estos métodos depende principalmente de la conflabilidad de esta estimación.
En general, los métodos de extensión de ancho de banda conocidos proveen señales de audio a una baja proporción de bits, pero con calidad de audio deficiente o una calidad de audio buena a altas proporciones de bits .
Es un objeto de la presente invención proveer un esquema de codificación mejorado para señales de audio.
Este objeto es obtenido por un codificador de audio de acuerdo con la reivindicación 1, un descodificador de extensión de ancho de banda de acuerdo con la reivindicación 3 • y la reivindicaicón 8 y el méodo de acuerdo con las reivindicaciones 12, 13 y 14.
Una modalidad de la invención provee un codificador de audio para proveer una señal de salida utilizando una señal de audio de entrada. El codificador de audio comprende un señalador de interconexión, un comparador y una interfase ' de salida.
El generador de interconexión está configurado para generar por lo menos una señal de alta frecuencia de extensión de ancho de banda. Una señal de alta frecuencia de extensión de ancho de banda comprende una banda de alta frecuencia, en donde la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda está basada en una banda de frecuencia baja de la señal de audio de entrada. Diferentes señales de alta frecuencia de extensión de ancho de banda comprenden diferentes frecuencias dentro de sus bandas de alta frecuencia si se generan diferentes señales de alta frecuencia de extensión de ancho de banda.
El comparador está configurado para calcular una pluralidad de parámetros de comparación. Un parámetro de comparación es calculado en base a una comparación de la señal de audio de entrada y una señal de alta frecuencia de extensión de ancho de banda generada. Cada parámetro de comparación de la pluralidad de parámetros de comparación es calculado en base a una frecuencia desplazada diferente entre la señal de audio de entrada y una señal de alta frecuencia de extensión de ancho de banda generada. Además, el comparador está configurado para determinar un parámetro de comparación a partir de la pluralidad de parámetros de comparación, en donde el parámetro de comparación determinado satisface un criterio predefinido.
En otras palabras, por ejemplo, el comparador puede estar configurado para determinar el parámetro de comparación entre la pluralidad de parámetros de comparación que satisfacen a lo máximo un criterio predefinido .
La interfase de salida está configurada para proveer la señal de salida para transmisión o almacenamiento. La señal de salida comprendé una indicación de parámetro basada en una frecuencia de desplazamiento correspondiente al parámetro de comparación determinado.
En otras palabras, la señal de salida puede comprender el parámetro de comparación seleccionado que indica la frecuencia de desplazamiento óptima.
Otra modalidad de la invención provee un descodificador de extensión de ancho de banda para proveer una señal de audio excedida en ancho de banda basada en una señal de audio de entrada y una señal de parámetro. La señal de parámetro comprende una indicación de una frecuencia de desplazamiento y una indicación de un parámetro de densidad de potencia. El descodificador de extensión de ancho de banda comprende un generador de interconexión, un combinador y una interfase de salida.
El generador de interconexión que está configurado para generar una señal de alta frecuencia de extensión de ancho de banda que comprende una banda de alta frecuencia. La banda de alta frecuencia de la señal de alta frecuencia de la extensión de ancho de banda es generada en base a uno o más desplazamientos de frecuencia de una banda de frecuencia de la señal de audio de entrada. Los desplazamientos de frecuencia están basados en la frecuencia de desplazamiento.
Además, el generador de interconexión está configurado para ser apto de amplificar o atenuar la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda por un factor igual al valor de los parámetros de densidad de energía o potencia o igual al valor recíproco del parámetro de densidad de energía, respectivamente.
El combinador está configurado para combinar la señal de alta frecuencia de extensión de ancho de banda y la señal de audio de entrada para obtener la señal de audio extendida en ancho de banda.
La interfase de salida está configurada para proveer la señal de audio extendida de ancho de banda.
Una modalidad adicional de la invención provee un descodificador de extensión de ancho de banda para proveer una señal de audio extendida en el ancho de banda en base a una señal de audio de entrada. El descodificador de extensión de ancho de banda comprende un generador de interconexión, un comparador, un combinador y una interfase de salida.
El generador de interconexión está configurado para generar por lo menos una señal de alta frecuencia de extensión de ancho de banda que comprende una banda de alta frecuencia basada en la señal de audio de entrada, en donde una frecuencia de corte inferior de la banda de alta frecuencia de una señal de alta frecuencia de extensión de ancho de banda generada es más baja que una frecuencia de corte superior de la señal de audio de entrada. Diferentes señales de alta frecuencia de extensión de ancho de banda generadas comprenden diferentes frecuencias dentro de sus bandas de alta frecuencia, si se generan diferentes señales de alta frecuencia de extensión de ancho de banda.
El comparador está configurado para calcular una pluralidad de parámetros de comparación. Un parámetro de comparación es calculado en base a una comparación de la señal de audio de entrada y una señal de alta frecuencia de extensión de ancho de banda generada. Cada parámetro de comparación de la pluralidad de parámetros de comparación es calculado en base a una frecuencia de desplazamiento diferente entre la señal de audio de entrada y la señal de alta frecuencia de extensión de ancho de banda generada. Además, el comparador está configurado para determinar un parámetro de comparación a partir de la pluralidad de parámetros de comparación, en donde el parámetro de comparación determinado satisface un criterio predefinido.
En otras palabras, por ejemplo, el comparador está configurado para determinar el parámetro de comparación entre la pluralidad de parámetros de comparación que satisface al máximo un criterio predefinido.
El combinador está configurado para combinar la señal de audio de entrada y una señal de alta frecuencia de extensión de ancho de banda para obtener la señal de audio extendida en ancho de banda, en donde la señal de alta frecuencia de la extensión de ancho de banda usada para obtener la señal de audio extendida en ancho de banda está basada en una frecuencia de desplazamiento correspondiente al parámetro de comparación determinado .
La interfase de salida está configurada para proveer la señal de audio extendida en ancho de banda.
Modalidades de acuerdo con la presente invención están basadas en la idea central de que una señal de alta frecuencia de extensión de ancho de banda que es también llamada interconexión, puede ser generada y comparada con la señal de audio de entrada original. Al utilizar una frecuencia de desplazamiento diferénte de la señal de alta frecuencia de extensión de ancho de banda o varias señales de alta frecuencia de extensión de ancho de banda con diferentes frecuencias de desplazamiento, se puede calcular una pluralidad de parámetros de comparación correspondientes a las frecuencias de desplazamiento diferentes. Los parámetros de comparación pueden ser relacionados con una cantidad asociada con la calidad de audio. Por consiguiente, un parámetro de comparación puede ser determinado que asegura la compatibilidad de la señal de alta frecuencia de la extensión de ancho de banda y la señal de audio de entrada y como consecuencia, hacer que la calidad de audio mejore.
La proporción de bits para transmisión ó almacenamiento de la señal de audio codificada puede ser disminuida al usar una indicación de parámetro basada en la frecuencia de desplazamiento correspondiente al parámetro de comparación determinado para una reconstrucción de la banda de alta frecuencia de la señal de audio de entrada original . De esta manera, solamente una porción de baja frecuencia de la señal de audio de entrada y la indicación de parámetros necesitan ser almacenadas o transmitidas.
Los términos parámetro de comparación, frecuencia de cruce e indicación de parámetros serán definidos posteriormente en la presente.
Algunas modalidades de acuerdo con la invención son concernientes con un comparador que monitoriza una correlación cruzada para la comparación de la señal de audio de entrada y la señal de alta frecuencia de extensión de ancho de banda generada para calcular el parámetro de comparación.
Algunas modalidades adicionales de acuerdo con la invención son concernientes con un generador de interconexión, que genera la señal de alta frecuencia de extensión de ancho de banda en el dominio de tiempo basado en una sola modulación de banda lateral.
Es una ventaja de modalidades preferidas de la invención que un esquema de codificación mejorado para señales de audio que permite incrementar la calidad de audio y/o disminuir la proporción de bits para transmisión o almacenamiento es provisto.
Modalidades de acuerdo con la invención serán detalladas subsecuentemente refiriéndose a las figuras adjuntas, en las cuales: La Figura 1 es un diagrama de bloques de un codificador de audio; La Figura 2 es una ilustración esquemática de una generación de señal de alta frecuencia de extensión de ancho de banda, una comparación de la señal de audio de entrada y una señal de alta frecuencia de extensión de ancho de banda generada y una adaptación de energía de la señal de alta frecuencia de extensión de ancho de banda; La Figura 3 es una ilustración esquemática de una generación de señal de alta frecuencia de extensión de ancho de banda, una comparación de la señal de audio de entrada y una señal de alta frecuencia de extensión de ancho de banda y una adaptación de potencia de la señal de alta frecuencia de extensión de ancho de banda; La Figura 4 es un diagrama de bloques de un codificador de extensión de ancho de banda; La Figura 5 es un diagrama de bloques de un descodificador de extensión de ancho de banda; La Figura 6 es un diagrama de bloques de un descodificador de extensión de ancho de banda; La Figura 7 es un diagrama de flujo de un método para proveer una señal diferida en base a una señal de audio de entrada ; La Figura 8 es un diagrama de flujo de un método para proveer una señal de audio extendida en ancho de banda; La Figura 9 es un diagrama de flujo de un método para proveer una señal de salida en base a una señal de audio de entrada ; La Figura 10 es un diagrama de flujo de un método para calcular un parámetro de comparación; La Figura 11 es una ilustración esquemática de una interpolación de la frecuencia de desplazamiento; La figura 12 es un diagrama de bloques de un descodificador de extensión de ancho de banda; La Figura 13 es un diagrama de flujo de un método para proveer una señal de audio extendida de ancho de banda; La Figura 14 es un diagrama de bloques de un método para proveer una señal de audio extendida en ancho de banda; La Figura 15 es un diagrama de bloques de un codificador de extensión de ancho de banda; La Figura 16a es un espectrograma de tres tonos utilizando frecuencia de .cruce variable; La Figura 16b es un espectrograma de la señal de audio original de tres tonos; La Figura 17 es un diagrama del espectro de potencia de una señal de audio original, una señal de audio extendida en ancho de banda utilizando la frecuencia de cruce constante y una señal de audio extendida en ancho de banda utilizando una frecuencia de cruce variable; La Figura 18a es un espectrograma de tres tonos utilizando un método de extensión de ancho de banda conocido y La Figura 18b es un espectrograma de la señal de audio original de-tres tonos.
En lo siguiente, los mismos números de referencias son usados parcialmente para objetos y unidades funcionales que tienen las mismas propiedades funcionales o propiedades funcionales similares y la descripción de las mismas con respecto a una figura también se aplicará a otras figuras con el fin de reducir redundancia en la descripción de las modalidades .
La Figura 1 muestra un diagrama de bloques de un codificador de audio 100 para proveer una señal de salida 132 de acuerdo con una modalidad de la invención, utilizando una señal de audio de entrada 102. La señal de salida es apropiada para una extensión de ancho de banda en un descodificador . Por consiguiente, el codificador de audio es también llamado codificador de extensión de ancho de banda. El codificador de extensión de ancho de banda 100 comprende un generador de interconexión 110, un comparador 120 y una interfase de salida 130. El generador de interconexión 110 es conectado al comparador 120 y el comparador 120 es conectado a la interfase de salida 130.
El generador de interconexión 110 genera por lo menos una señal de alta frecuencia de extensión de ancho de banda 112. Una señal de alta frecuencia de extensión de ancho de banda 112 comprende una banda de alta frecuencia, en donde la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda 112 está basada en una banda de baja frecuencia de la señal de audio de entrada 102. Si se generan diferentes señales de alta frecuencia de extensión de ancho de banda 112, las diferentes señales de alta frecuencia de extensión de ancho de banda 112 comprenden diferentes frecuencias dentro de sus bandas de alta frecuencia.
El comparador 120 calcula una pluralidad de parámetros de comparación. Un parámetro de comparación es calculado en base a una comparación de la señal de audio de entrada 102 y una señal de alta frecuencia de extensión de ancho de banda generada 112. Cada parámetro de comparación de la pluralidad de parámetros de comparación es calculado en base a una frecuencia de desplazamiento diferente entre la señal de audio de entrada 102 y una señal de alta frecuencia de extensión de ancho de banda generada 112. Además, el comparador 120 determina un parámetro de comparación de la pluralidad de parámetros de comparación, en donde el parámetro de comparación determinado satisface un criterio predefinido.
La interfase de salida 130 provee la señal de salida 132 para transmisión o almacenamiento. La señal de salida 132 comprende una indicación de parámetro basada en una frecuencia de desplazamiento correspondiente al parámetro de comparación determinado .
Al calcular una pluralidad de parámetros de comparación para diferentes frecuencias de desplazamiento, se puede encontrar una señal de alta frecuencia de extensión de ancho de banda 112 que se ajusta bien a la señal de audio de entrada original 102 . Esto se puede hacer al generar una pluralidad de señales de alta frecuencia de extensión de ancho de banda 112 cada una con una frecuencia de desplazamiento diferente o al generar una señal de alta frecuencia de extensión de ancho de banda y desplazar la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda 112 por diferentes frecuencias de desplazamiento. También, una combinación de generar una pluralidad de señales de alta frecuencia de extensión de ancho de banda 112 con diferentes frecuencias de desplazamiento y desplazar la banda de alta frecuencia de ellas por otras . frecuencias de desplazamiento diferentes puede ser posible. Por ejemplo, se generan cinco señales de alta frecuencia de extensión de ancho de banda diferentes 112 y cada una de ellas es desplazada cinco veces por un desplazamiento de frecuencia constante.
La Figura 2 muestra una ilustración esquemática 200 de la generación de señal de alta frecuencia de extensión de ancho de banda, la comparación de la señal de alta frecuencia de extensión de ancho de banda y la señal de audio de entrada y una adaptación de potencia opcional de la señal de alta frecuencia de extensión de ancho de banda para el caso en que solamente se genera una señal de alta frecuencia de extensión de ancho de banda y desplazada por diferentes frecuencias de desplazamiento .
El primer diagrama esquemático de "potencia contra frecuencia" 210 muestra esquemáticamente una. señal de audio de entrada 102. En base a esta señal de audio de entrada 102, el generador de interconexión 110 puede generar la señal de alta frecuencia de extensión de ancho de banda 112, por ejemplo, al desplazar 222 una banda de baja frecuencia de la señal de audio de entrada 102 a frecuencias más altas (como se indica por el número de referencia) . Por ejemplo, la banda de baja frecuencia es desplazada por una frecuencia igual a una frecuencia de cruce de un codificador de núcleo, no ilustrado en la Figura 1, que puede ser una parte del codificador de extensión de ancho de banda 100 u otra frecuencia predefinida.
La señal de alta frecuencia de extensión de ancho de banda generada 112 puede luego ser desplazada por diferentes frecuencias de desplazamiento 232 y para cada frecuencia de desplazamiento 232 (como se indica por el número de referencia 230), se puede calcular un parámetro de comparación por el comparador 120. La frecuencia de desplazamiento 232 puede ser, por ejemplo definida en relación con una frecuencia de cruce de un codificador de núcleo, en relación con otra frecuencia específica o puede ser definida como un valor de frecuencia absoluto.
Enseguida, el comparador 120 determina un parámetro de comparación que satisface el criterio predefinido. De esta manera, una señal de alta frecuencia de extensión de ancho de banda 112 con una frecuencia de desplazamiento 242 correspondiente al parámetro de comparación determinado puede ser determinada (como se muestra con el número de referencia 240 ) .
Adicionalmente, también un parámetro de densidad de energía 252 puede ser determinado (como se indica por el número de referencia 250 ) . El parámetro de densidad de energía 252 puede indicar la proporción de la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda con la frecuencia de desplazamiento correspondiente al parámetro de comparación determinado y una banda de frecuencia correspondiente de la señal de audio de entrada. Por ejemplo, la proporción se puede relacionar con una proporción de densidad de energía, una proporción de energía, u otra proporción de una cantidad relacionada con la densidad de energía de una banda de frecuencia.
Alternativamente, la Figura 3 muestra una ilustración esquemática 300 de la generación de la señal de alta frecuencia de extensión de ancho de banda, la comparación de las señales de alta frecuencia de extensión de ancho de banda generadas y la señal de audio de entrada y la adaptación de energía opcional de la señal de alta frecuencia de extensión de ancho de banda para el caso en que una pluralidad de señales de alta frecuencia de extensión de ancho de banda con diferentes frecuencias de desplazamiento son generadas.
En diferencia a la secuencia mostrada en la Figura 2 , el generador de interconexión 110 genera una pluralidad de señales de alta frecuencia de extensión de ancho de banda 112 con frecuencias de desplazamiento diferentes 232 (como se indica por el número de referencia 320 ) . Esto se puede hacer otra vez por un desplazamiento de frecuencia 222 de una banda de baja frecuencia de la señal de audio de entrada 102 a frecuencias más altas. La banda de baja frecuencia de la señal de audio de entrada 102 puede ser desplazada por una frecuencia constante más la frecuencia de desplazamiento individual 232 de cada señal de alta frecuencia, de extensión de ancho de banda 112 . La frecuencia constante puede ser igual a la frecuencia de cruce del codificador del núcleo u otra frecuencia especifica.
Un parámetro de comparación para cada señal de alta frecuencia de extensión de ancho de banda generada 112 puede luego ser calculado y el parámetro de comparación que satisface el criterio predefinido puede ser determinado 240 por el comparador 120 .
El parámetro de densidad de energía puede ser determinado 250 como se describe anteriormente.
Los conceptos mostrados en las Figuras 2 y 3 pueden también ser combinados.
La comparación de la señal de audio de entrada 102 y la señal de alta frecuencia de extensión de ancho de banda generada 112 se puede hacer por una correlación cruzada de ambas señales. En este caso, un parámetro de comparación puede ser por ejemplo, el resultado de una correlación cruzada para una frecuencia de desplazamiento específica entre la señal de audio de entrada 102 y una señal de alta frecuencia de extensión de ancho de banda generada 112.
La indicación de parámetro de la señal de salida 132 puede ser la frecuencia de desplazamiento misma, una frecuencia de desplazamiento cuantificada u otra cantidad basada en la frecuencia de desplazamiento.
Al transmitir o almacenar solamente la indicación del parámetro en lugar de la banda de alta frecuencia de la señal de audio de entrada 102 , la proporción de bits para transmisión o almacenamiento puede ser reducida. Al escoger el parámetro en base a la frecuencia de desplazamiento correspondiente a un parámetro de comparación que satisface un criterio predefinido, esto puede producir una mejor calidad de audio que la descodificación solamente de la señal de audio limitada en banda o de banda limitada.
Un criterio predefinido puede ser para determinar un parámetro de comparación de la pluralidad de parámetros de comparación que indican, por ejemplo, una señal de alta frecuencia de extensión de ancho de banda 112 con una frecuencia de desplazamiento correspondientes que coincide con la señal de audio de entrada 102 mejor que el 70% de las señales de alta frecuencia de extensión de ancho de banda 112 con otras frecuencias de desplazamiento, indicando una señal de alta frecuencia de extensión de ancho de banda 112 con una frecuencia de desplazamiento correspondiente que es una de las tres mejores coincidencias con la señal de audio de entrada 102 o que indica una señal de alta frecuencia de extensión de ancho de banda que coincide mejor 112 con una frecuencia de desplazamiento correspondiente. Esto se relaciona con el caso en donde una pluralidad de señales de alta frecuencia de extensión de ancho de banda 112 con diferentes frecuencias de desplazamiento son generadas, también como el caso en donde solamente una señal de alta frecuencia de extensión de ancho de banda 112 es generada y desplazada por diferentes frecuencias de desplazamiento o una combinación de estos dos casos .
Un parámetro de comparación puede ser el resultado de una correlación cruzada u otra cantidad que indica que tan bien una señal de alta frecuencia de extensión de ancho de banda 112 con una frecuencia de desplazamiento especifica coincide con la señal de audio de entrada 102.
El codificador de extensión de ancho de banda 100 puede comprender un codificador de núcleo para codificar una banda de baja frecuencia de la señal de audio de entrada 102. Este codificador de núcleo puede comprender una frecuencia de cruce que puede corresponder a la frecuencia de corte superior de la banda de baja frecuencia codificada de la señal de audio de entrada 102. La frecuencia de cruce del codificador del núcleo puede ser constante o variable con el tiempo. La implementación de una frecuencia de cruce variable puede incrementar la complejidad del codificador de núcleo, pero puede también incrementar la flexibilidad para codificación.
El proceso mostrado en la Figura 2 y/o Figura 3 puede ser repetido para bandas de frecuencia más altas o interconexiones. Por ejemplo, la banda de baja frecuencia de la señal de audio de entrada 102 comprende una frecuencia de corte superior de 4 kHz . Por consiguiente, si la banda de baja frecuencia de la señal de audio de entrada 102 es desplazada por la frecuencia de corte superior de la banda de baja frecuencia para generar la señal de alta frecuencia de extensión de ancho de banda 112 , la señal de alta frecuencia de extensión de ancho de banda 112 comprende una banda de alta frecuencia con una frecuencia de corte inferior de 4 KHz y una frecuencia de corte superior de 8 kHz. El proceso puede ser repetido al desplazar una banda de baja frecuencia de la señal de audio de entrada 102 por dos veces la frecuencia de corte superior de la banda de baja frecuencia. Así, la nueva señal de alta frecuencia de extensión de ancho de banda generada 112 comprende una banda de alta frecuencia con una frecuencia de corte inferior de 8 KHz y una frecuencia de corte superior de 12 kHz. Esto puede ser repetido hasta que se alcanza una frecuencia más alta deseada.
Alternativamente, esto puede también ser realizado al generar una señal de alta frecuencia de extensión de ancho de banda con una pluralidad de bandas de alta frecuencia diferentes .
Como se ilustra en este ejemplo, el ancho de banda de la banda de baja frecuencia de la señal de audio de entrada y el ancho de banda de una banda de alta frecuencia de una señal de alta frecuencia de extensión de ancho de banda puede ser las mismas. Alternativamente, la banda de baja frecuencia de la señal de audio de entrada puede ser esparcida y desplazada para generar la señal de alta frecuencia de extensión de ancho de banda.
La determinación de una señal de alta frecuencia de extensión de ancho de banda 112 con una frecuencia de desplazamiento 232 correspondiente al parámetro de comparación determinado puede dejar un espacio o separación entre la banda de baja frecuencia de la señal de audio de entrada 102 y la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda 112 dependiendo de la frecuencia de desplazamiento 242. Este espacio o separación puede ser llenado al generar porciones de frecuencia que ajustan en este espacio que contienen por ejemplo ruido limitado en banda o de banda limitada. Alternativamente, el espacio puede ser dejado vacío, puesto que la calidad de audio puede no sufrir espectacularmente .
La Figura 4 muestra un diagrama de bloques de un codificador de extensión de ancho de banda 400 para proveer una señal de salida 132 utilizando una señal de audio de entrada 102 de acuerdo con una modalidad de la invención. El codificador de extensión de ancho de. banda 400 comprende un generador de interconexión 110 , un comparador 120 , una interfase de salida 130 , un codificador de núcleo 410 , un filtro de paso de banda 420 y una unidad de extracción de parámetros 430 . El codificador del núcleo 410 es conectado a la interfase de salida 130 y el generador de interconexión 110 , el generador de interconexión 110 es conectado al comparador 120 , el comparador 120 es conectado a la unidad de extracción de parámetros 430 , la unidad de extracción de parámetros 430 es conectada a la interfase de salida 130 y el filtro de paso de banda 420 es conectado al comparador 120 .
El generador de interconexión 110 puede ser realizado como un modulador para generar la señal de alta frecuencia de extensión de ancho de banda 112 en base a la señal de audio de entrada 102 . El comparador 120 puede efectuar la comparación de la señal de audio de entrada 102 filtrada por el filtro de paso de banda 420 y la señal de alta frecuencia de extensión de ancho de banda generada 112 por una correlación cruzada de ellas. La determinación del parámetro de comparación que satisface el criterio predefinido puede también ser llamada estimación de retardo.
La interfase de salida 130 puede también incluir una funcionalidad de un formateador de corriente de bits y puede comprender un combinador para combinar una señal de baja frecuencia provista por el codificador del núcleo 410 y una señal de parámetro 432 que comprende la indicación de parámetro basada en la frecuencia de desplazamiento provista por la unidad de extracción de parámetros 430. Además, la interfase de salida 130 puede comprender un codificador de entropía o un codificador diferencial para reducir la proporción de bits de la señal de salida 132. El combinador y el codificador de entropía o codificador diferencial puede ser parte de la interfase de salida 130 como se muestra en este ejemplo o pueden consistir de unidades independientes.
La señal de audio 102 puede ser dividida en parte de baja frecuencia y una parte de alta frecuencia. Esto se puede hacer por un filtro de paso de bajos del codificador del núcleo 410 y el filtro de paso de banda 420. El filtro de paso de bajos puede ser parte del codificador del núcleo 410 o un filtro de paso de bajos independiente conectado al codificador del núcleo 410.
La parte de baja frecuencia es procesada por un codificador de núcleo 410 que puede ser un codificador de audio, por ejemplo, que se conforma al estándar MPEG1/2 Capa 3 "MP3" o MPEG 4 AAC o un codificador de habla.
La parte de baja frecuencia puede ser desplazada por un valor fijo, por ejemplo, por medio de una modulación de banda lateral o una transformación de Fourier rápida (FFT) en el dominio de frecuencia, de tal manera que está ubicada por encima de la región de baja frecuencia original en el área objetivo de la interconexión o parte correspondiente. Opcionalmente, la parte de baja frecuencia puede ser obtenida directamente de la señal de entrada 102. Esto se puede hacer por un filtro de paso de bajos independiente conectado al generador de interconexión 110.
A intervalos de tiempo regulares, la correlación cruzada entre espectros de amplitud de secciones de señal transformadas en ventana entre la parte de alta frecuencia original (de la señal de audio de entrada) y la parte de alta frecuencia obtenida (la señal de alta frecuencia de extensión de ancho de banda) puede ser calculada. De esta manera, el retardo (la frecuencia de desplazamiento) para correlación máxima puede ser determinado. Este retardo puede tener el significado de un factor de corrección en términos de la modulación de banda lateral individual original, esto es, la única modulación de banda lateral puede ser corregida adicionalmente por el retardo para maximizar la correlación de cruce. En otras palabras, la frecuencia de desplazamiento, que es también llamada retardo, correspondiente al parámetro de comparación que satisface el criterio predefinido puede ser determinada, en donde el parámetro de comparación corresponde a la correlación de cruce y el criterio predefinido puede ser encontrado la correlación máxima.
Además, se pueden determinar las proporciones de los valores absolutos de los espectros de amplitud. Mediante esto, puede ser derivado por cual factor la señal de alta frecuencia obtenida debe ser atenuada o amplificada. En otras palabras, se puede determinar un parámetro de densidad de energía que indica la proporción de energía, las densidades de energía, los valores absolutos de los espectros de amplitud u otro valor relacionado con la proporción de densidad de energía entre la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda 112 y una banda de frecuencia correspondiente de la señal de audio de entrada original 102. Esto se puede hacer por un comparador de densidad de energía que puede ser parte de la unidad de extracción de parámetros 430 como en el ejemplo mostrado o una unidad independiente. Para determinar el parámetro de densidad de energía, por ejemplo, la señal de alta frecuencia de extensión de ancho de banda 112 que fue generada al desplazar la banda de baja frecuencia de la señal de audio de entrada 102 por una frecuencia constante o la señal de alta frecuencia de extensión de ancho de banda 112 correspondiente al parámetro de comparación determinado u otra señal de alta frecuencia de extensión de ancho de banda generada 112 puede ser usada. Una banda de frecuencia correspondiente en este caso significa, por ejemplo, una banda de frecuencia con el mismo intervalo de frecuencia. Por ejemplo, si la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda comprende frecuencias de 4 kHz a 8 kHz, entonces la. banda de frecuencia correspondiente de la señal de audio de entrada comprende también el intervalo de 4 kHz a 8 kHz .
Los factores de corrección obtenidos (frecuencia de desplazamiento, parámetro de densidad de energía) correspondientes al retardo y correspondientes al valor absoluto de la amplitud pueden ser interpolados en el tiempo. En otras palabras, un parámetro determinado para una sección de señal en ventana (para un marco de tiempo) puede ser interpolado por cada etapa de tiempo de la sección de señal.
Esta señal (señal de parámetro) de modulación (control) o 'una representación parametrizada de la misma puede ser almacenada o transmitida a un descodificador . En otras palabras, la señal de parámetro 432 puede ser combinada con la banda de bada frecuencia de la señal de audio de entrada 102 procesada por el codificador del núcleo 410 para obtener la señal de salida 132 que puede ser almacenada o transmitida a un descodificador .
Adicionalmente, parámetros adicionales para adaptar, por ejemplo, un nivel de ruido y/o la tonalidad pueden ser determinados. Esto se puede hacer por la unidad de extracción de parámetros 430 . Los parámetros adicionales pueden ser agregados a la señal de parámetro 432 .
El ejemplo mostrado en la Figura 4 ilustra un cálculo del lado codificador de una modulación variable en el tiempo. La modulación variable en el tiempo en este caso se relaciona con las señales de alta frecuencia de extensión de ancho de banda 112 con diferentes frecuencias de desplazamiento. La frecuencia de desplazamiento correspondiente al parámetro de comparación determinado que satisface el criterio predefinido puede variar con el tiempo.
La Figura 5 muestra un diagrama de bloques de un descodificador de extensión de ancho de banda 500 para proveer una señal de audio extendida en ancho de banda 532 basada en una señal de audio de entrada 502 y una señal de parámetro 504 de acuerdo con una modalidad de la invención. La señal de parámetro 504 comprende una indicación de una frecuencia de desplazamiento y una indicación de un parámetro de densidad de energía. El descodificador de extensión de ancho de banda 500 comprende un generador de interconexión 510 , un combinador 520 y una interfase de salida 530 . El generador de interconexión 510 es conectado al combinador 520 y el combinador 520 es conectado a la interfase de salida 530 .
El generador de interconexión 510 genera una señal de alta frecuencia de- extensión de ancho de banda 512 que comprende una banda de alta frecuencia basada en la señal de audio de entrada 502. La banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda 512 es generada basada en un desplazamiento de frecuencia de una banda de frecuencia de la señal de audio de entrada 502 , en donde el desplazamiento de frecuencia está basado en la frecuencia de desplazamiento.
Además, el generador de interconexión 510 amplifica o atenúa la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda 512 por un factor igual al valor del parámetro de densidad de energía o igual al valor recíproco del parámetro de densidad de energía.
El combinador 520 combina la señal de alta frecuencia de extensión de ancho de banda 512 y la señal de audio de entrada 502 para obtener la señal de audio extendida en ancho de banda 532 y la interfase de salida 530 provee la señal de audio extendida en ancho de banda 532 .
La generación de la señal, de alta frecuencia de extensión de ancho de banda 112 basada en la frecuencia de desplazamiento puede permitir una continuación mejorada del intervalo de frecuencia de la señal de audio de entrada en la región de alta frecuencia, por ejemplo, si la frecuencia de desplazamiento es determinada como se describe anteriormente. Esto puede incrementar la calidad de audio de la señal de audio extendida en ancho de banda 532 .
Adicionalmente, la densidad de energía de la continuación de alta frecuencia de la señal de audio de entrada 502 sé puede hacer de una manera muy eficiente al amplificar o atenuar la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda 512 por el parámetro de densidad de energía. De esta manera, una normalización puede no ser necesaria.
El generador de interconexión 510 puede generar la señal de alta frecuencia de extensión de ancho de banda 512 al desplazar la banda de frecuencia de la señal de audio de entrada 512 por una frecuencia constante más la frecuencia de desplazamiento. Si la frecuencia de desplazamiento incluye un desplazamiento de frecuencia a frecuencias más bajas, el combinador puede ignorar una parte de la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda 512 que comprende frecuencias más bajas que una frecuencia de corte superior de la señal de audio de entrada 502 .
El generador de interconexión 510 puede generar la señal de alta frecuencia de extensión de ancho de banda 512 en el dominio de tiempo o en el dominio de frecuencia. En el dominio de tiempo, el generador de interconexión 510 puede generar la señal de alta frecuencia de extensión de ancho de banda 512 basada en una sola modulación de banda lateral.
Adicionalmente, la ínterfase de salida puede amplificar la señal de salida antes de proveerla.
La Figura 6 muestra un diagrama de bloques de un · descodificador de extensión de ancho de banda 600 para proveer una señal de audio extendida en ancho de banda 532 basada en una señal de audio de entrada 502 y una señal de parámetro 504 de acuerdo con una modalidad de la invención. El descodificador de extensión de ancho de banda 600 comprende un generador de interconexión 510 , un combinador 520 , una interfase de salida 530 , un descodificador de núcleo 610 y una unidad de extracción de parámetros 620 . El descodificador de núcleo 610 es conectado al generador de interconexión 510 y el combinador 520 , la unidad de extracción de parámetros 620 es conectada al generador de interconexión 510 y a la interfase de salida 530 , el generador de interconexión 510 es conectado al combinador 520 y el combinador 520 es conectado a la interfase de salida 530 .
El descodificador de núcleo 610 puede descodificar la corriente de bits recibida 602 y provee la señal de audio de entrada 502 al generador de interconexión 510 y el combinador 520 . La señal de audio de entrada 502 puede comprender una frecuencia de corte superior igual a una frecuencia de cruce del descodificador de núcleo 610 . Esta frecuencia de cruce puede ser constante o variable en el tiempo. Variable en el tiempo significa, por ejemplo, variable para intervalos de tiempo diferentes o cuadros de tiempo diferentes, pero constante para un intervalo de tiempo o cuadro de tiempo.
La unidad de extracción de parámetros 620 puede separar la señal de parámetro 504 de la corriente de bits recibida 602 y proveerla al generador de interconexión 510 .
Adicionalmente, la señal de parámetro 504 o un parámetro de ruido y/o tonalidad extraído puede ser provisto a la interfase de salida 530 .
El generador de interconexión 510 puede modular la señal de audio de entrada 502 en base a la frecuencia de desplazamiento para obtener la señal de alta frecuencia de extensión de ancho de banda 512 y puede amplificar o atenuar la señal de alta frecuencia de extensión de ancho de banda 512 en base al parámetro de densidad de energía comprendida en la señal de parámetro 504 . Esta señal de alta frecuencia de extensión de ancho de banda 512 es provista al combinador 530 . En otras palabras, el generador de interconexión 510 puede modular la señal de audio de entrada 502 basado en la frecuencia de. desplazamiento y el parámetro de densidad de energía para obtener una señal de alta frecuencia. Esto se puede hacer, por ejemplo, en el dominio de tiempo por una sola modulación de banda lateral 634 con una interpolación y/o filtración 632 para cada etapa de tiempo.
El combinador 520 combina la señal de audio de entrada 502 y la señal de alta frecuencia de extensión de ancho de banda generada 512 para obtener la señal de audio de extensión de ancho de banda 532 .
La interfase de salida 530 provee la señal de audio extendida en ancho de banda 532 y puede comprender adicionalmente una unidad de corrección. La unidad de corrección puede llevar a cabo una corrección de tonalidad y/o corrección de ruido basada en los parámetros provistos por la unidad de extracción de parámetros 620 . La unidad de corrección puede ser parte de la interfase de salida 530 como se muestra en la Figura 6 o puede ser una unidad independiente. La unidad de corrección puede también ser dispuesta entre el generador de interconexión 510 y el combinador 520 . De esta manera, la unidad de corrección puede solamente corregir la tonalidad y/o ruido de la señal de alta frecuencia de extensión de ancho de banda generada 512 . Una corrección de tonalidad y ruido de la señal de audio de entrada 512 no es necesaria puesto que la señal de audio de entrada 502 corresponde a la señal de audio original.
Resumido en algunas palabras, el descodificador de extensión de ancho de banda 600 puede sintetizar y formar espectralmente una señal de alta frecuencia de una señal de salida del descodificador de audio o descodificador de núcleo (la señal de audio de entrada) por medio de la función de modulación transmitida. Función de modulación transmitida, por ejemplo, significa una función de modulación basad en la frecuencia desplazada y en el parámetro de densidad de energía. Luego, la señal de alta frecuencia y la señal de baja frecuencia pueden ser combinadas y parámetros adicionales para adaptar el nivel de ruido y tonalidad pueden ser aplicados.
La Figura 7 muestra un diagrama de flujo de un método 700 para proveer una señal de salida basada en una señal de audio de entrada de acuerdo con una modalidad de la invención. El método comprende generar 710 por lo menos una señal de alta frecuencia de extensión de ancho de banda, calcular 720 una pluralidad de parámetros de comparación, determinar 730 un parámetro de comparación a partir de la pluralidad de parámetros de comparación y proveer 740 la señal de salida para transmisión o almacenamiento.
Una señal de alta frecuencia de extensión de ancho de banda generada comprende una banda de alta frecuencia. La banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda está basada en una banda de baja frecuencia de la señal de audio de entrada. Diferentes señales de alta frecuencia de extensión de ancho de banda comprenden diferentes frecuencias dentro de sus bandas de alta frecuencia, si se generan diferentes señales de alta frecuencia de extensión de ancho de banda .
Un parámetro de comparación es calculado en base a una comparación de la señal de audio de entrada y una señal de alta frecuencia de extensión de ancho de banda generada. Cada parámetro de comparación de la pluralidad de parámetros de comparación es calculado en base a una frecuencia desplazada diferente entre la señal de audio de entrada y una señal de alta frecuencia de extensión de ancho de banda generada.
El parámetro de comparación determinado satisface un criterio predefinido.
La señal de salida comprende una indicación de parámetro basada en una frecuencia desplazada correspondiente al parámetro de comparación determinado .
La Figura 8 muestra un diagrama de flujo de un método 800 para proveer una señal de audio extendida en ancho de banda basada en una señal de audio de entrada y una señal de parámetro de acuerdo con una modalidad de la invención. La señal de parámetro comprende una indicación de una frecuencia desplazada y una indicación de un parámetro de densidad de energía. El método comprende generar 810 una señal de alta frecuencia de extensión de ancho de banda, amplificar 820 o atenuar la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda, combinar 830 la señal de alta frecuencia de extensión de ancho de banda y la señal de audio de entrada para obtener la señal de audio extendida en ancho de banda y proveer 840 la señal de audio extendida en ancho de banda .
La señal de alta frecuencia de extensión de ancho de banda comprende una banda de alta frecuencia. La banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda es generada 810 basada en un desplazamiento de frecuencia de una banda de frecuencia de la señal de audio de entrada. El desplazamiento de frecuencia está basado en la frecuencia desplazada.
La banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda es amplificada 820 o atenuada por un factor igual al valor del parámetro de densidad de energía o igual al valor recíproco del parámetro de densidad de energía.
La Figura 9 muestra un diagrama de flujo de un método 900 para proveer una señal de salida basada en una señal de audio de entrada de acuerdo con una modalidad de la invención. Se ilustra una posibilidad para la secuencia del algoritmo en el codificador. Esto puede también ser formal matemáticamente descrito en lo siguiente. Las señales en tiempo real pueden ser indicadas por letras minúsculas latinas, las señales transformadas de Hilbert con Griego correspondiente y las señales transformadas de Fourier con letras mayúsculas latinas o alternativamente Griegas.
La señal de entrada puede ser llamada f(n), la señal de salida o (n) . indica la transformada de Fourier, j indica el número imaginario y la transformación de Hilbert H(.) es definid como es usual: ?m) = H(f(n)) = -sgn(¿y) · F(ja>)) · con F(ja>) = F(f(n)) xOver puede ser la frecuencia de corte del codificador del núcleo, neN puede indicar un tiempo. kmax>keN puede indicar la k-ésima extensión o interconexión. ak describe un borde de banda de bandas perceptuales relacionadas con xOver, por ejemplo, dé acuerdo con la escala de Bark o la excl de ERB. Alternativamente, la ak se puede por ejemplo incrementar linealmente, esto es ak+i-ak = constante. La transformación de Hilbert puede también ser calculada computacionalmente eficiente mediante filtración de la señal con un filtro de paso de bajos modulado.
En primer lugar, una función de modulador analítico 902 con las frecuencias de modulación ak y los incrementos de fase resultantes con el incremento de tiempo Fs (Fs indica la velocidad de toma de muestras) pueden ser generados. Esto puede ser descrito matemáticamente en las siguientes fórmulas: n k=l k=\ La suma puede solamente ser reemplazada por n, si ?¾ es independiente de n.
La señal de audio de entrada 102 o señal de audio real f puede ser filtrada por paso de banda a un ancho de banda de oík+i-oík que puede ser expresado por: En este caso, cada interconexión comprenderá el mismo ancho de banda.
Alternativamente, la señal de audio de entrada f 102 puede ser filtrada por paso de banda a anchos de banda de ak con anchos de banda diferentes lo que puede ser descrito por: Luego, las áreas de la señal original pueden ser determinadas que deben ser reconstruidas por este método. Estas regiones limitadas en banda pueden ser indicadas como: =f*fÍltBFk>-'[< k <l<™x y están ubicadas en los intervalos (ak, ak+i) .
La modulación de la señal de entrada filtrada por paso de bajos 904 se puede hacer en el dominio de frecuencia o el dominio de tiempo.
En el dominio de frecuencia, las señales de entrada pueden ser aplicadas en ventana primero, lo que puede ser descrito por: ??(?) = ?{?-^- + mod{n,NFFT)+1) ·win(mod(n,A/F/T) +1) en donde NFFT es el número de bin de transformación de Fourier rápida (por ejemplo 512 bin) , ? es el número de ventana y win(.) es una función de ventana. Las ventanas o cuadros de tiempo pueden comprender una superposición temporal. Por ejemplo, la fórmula dada anteriormente describe una. superposición temporal de la mitad de una ventana. Así, NeN bloques de la señal original y con la misma conectada con tantos espectros de amplitud ??(?) con ? = N como valores absolutos de la transformada de Fourier describe el índice del borde de banda k en la transformada de Fourier.
Luego, la señal es modulada en el dominio de ' frecuencia al desplazar los bins de FFT (bins de transformación de Fourier rápida) . La transformación de Hilbert implícita no es aquí necesaria, pero hace una descripción formal igual de las siguientes etapas posibles: ??(?+ ?,)=??(?)F?(?):=??(?) para ? = O y En el dominio de tiempo, una transformación de Hilbert 906 de la señal de audio de entrada f 102 para generar una señal analítica 908 se hace primero. tp \= f + jW) ¾ := fLFk +vW½ ) luego la señal analítica <pLF, es modulada por banda lateral individual 710 con un modulador µ(?) 902: ?{?).= (pLF{n) · µ{?) De esta manera, una señal de alta frecuencia de extensión de ancho de banda que es también llamada señal modulada 910 puede ser generada.
Enseguida, una formación de ventana (también posible con superposición) de la señal de entrada 912 y de la señal extendida 914 y una transformación de Fourier 916 son efectuados : ???) = ?(?¦ !^L + mod(n,NFFT) + 1) · w¡n(mod(n,NFFT) + 1) en donde una NFFT es una vez más el número de bines de transformación de Fourier rápida (por ejemplo 256 , 512 , 1024 bines u otro número entre 24 y 232 ) , ? es el número de ventana y win(.) es una función de ventana. Así, NeN bloques 914 son creados de la señal original y en relación con tantos espectros de amplitud F?(?), ??(?) con ? = N como valores absolutos de la transformada de Fourier 916 . pueden describir el índice del borde de banda k en la transformada de Fourier.
El proceso en el dominio de tiempo es mostrado en la Figura 9: La siguiente etapa es el cálculo 720 de la correlación cruzada F^,k (el parámetro de comparación puede ser igual al resultado de la correlación cruzada) de los espectros de amplitud parciales de la señal original y la señal extendida lo que puede ser expresado matemáticamente por: con F?{?).=¥?(?) := ??? < 0;? < ? d puede indicar el retardo máximo (la frecuencia desplazada máxima) para el cual una correlación cruzada es calculada. Si la correlación cruzada debe ser calculada con una predisposición, esto es, retardos pequeños y así grandes superposiciones deben ser preferidos, así que ß=0 debe ser seleccionado. En contraste, si debe ser compensado que menos bins de FFT (bines de transformación de Fourier rápida) están superpuestos para retardos más grandes que pequeños, ß=1 debe ser escogido. En general, 0=ße? puede ser escogido arbitrariamente. Alternativa o adicionalmente, 2< ¿e ;mod(¿,2)=0 puede ser escogido para seleccionar una región de la correlación cruzada que es un poco más grande que una interconexión o parche. Con esto la región que es considerada por la correlación cruzada puede ser extendida por d 2 en ambos extremos espectrales del parche particular.
En base a estos resultados de la correlación cruzada, un máximo de la correlación cruzada 730 G?? := max(? (v)) V y el retardo d^,* de la correlación máxima pueden ser determinados .
Adicionalmente, las proporciones 920 de las energías o potencias en las interconexiones o parches pueden ser determinadas por los espectros de densidad de energía: Si ningún máximo claro puede ser determinado 924, el retardo es puesto de regreso a 0 (comó se muestra en el número de referencia 922) . De otra manera el retardo estimado 918 puede ser el retardo correspondiente a la correlación cruzada máxima. Para esto, un criterio de umbral, ??,* > t con t a ser seleccionado puede ser determinado. Alternativamente, la o curvatura o una planura espectral (SFN) de la correl cruzada R^, puede ser observada, por ejemplo: >t;\? < ? 0 + (R k (v))2 )/2 Con dv d v Los retardos y los parámetros de densidad de energía ??,* pueden ser interpolados 926 para obtener un valor para cada etapa de tiempo : gk(n) := ¡nterp(cE fc);^(n) = interp(dÍ Jt) Luego, la función de modulación global modulada en amplitud modificada y desplazada en frecuencia puede ser generada: n fik(n) = k(n)e m-' Esta función de modulación global o los parámetros de la función de modulación global pueden ser provistos 740 con la señal de salida para almacenamiento o transmisión.
Adicionalmente, se pueden determinar parámetros adicionales para corrección de fluido y/o corrección de tonalidad.
La modulación en el decodificador se puede hacer por: ?(?).=f??(?) - µ(?) y además de las k modulaciones parciales (si hay más de un parche o interconexión) . Para esta función de modulación global µ¾(?) o µ(?) o los parámetros ??(?) y Ak(n) o c^,^ y d?,k de la función de modulación global pueden ser codificados apropiadamente, por ejemplo mediante cuantificación. Opcionalmente, la velocidad de toma de muestras puede ser reducida y se puede introducir una histéresis.
El cálculo de los retardos puede ser omitido, si no hay ninguna señal tonal, por ejemplo en silencio, transitorios o ruido. En estos casos, el retardo puede ser ajustado a cero.
La Figura 10 muestra en más detalle un ejemplo 1000 para determinar el retardo .
Para un cuadro de tiempo o ventana ?=? 1010 el retardo v es ajustado a menos ? como valor de partida. Luego, la correlación cruzada R5,k(v) es calculada 720. Si v es más pequeño que ? 1030 , entonces v es incrementado 1032 y el siguiente parámetro de comparación en términos de la correlación cruzada es calculado 720 . Si v es mayor o igual que ? 1030 , entonces el retardo correspondiente a la correlación cruzada calculada máxima puede ser determinado 730 . Si' el máximo es claramente identificable 924 el retardo determinado es usado como parámetro ??, 918 . De otra manera, el retardo es ajustado a 0 y usado como parámetro ??,¾:=0 922 .
Luego, todo el proceso es repetido 1040 para el siguiente cuadro de tiempo ?= ?+1 1050 . Los retardos determinados pueden ser interpolados 926 para obtener un parámetro para cada etapa de tiempo N.
El cálculo de la pluralidad de parámetros de comparación, por ' ejemplo, el resultado de la correlación cruzada, se puede hacer también en paralelo si se usan una pluralidad de comparadores. También, el procesamiento de diferentes cuadros de tiempo se puede hacer en paralelo, si los elementos físicos necesarios están disponibles varias veces. El bucle para calcular la correlación cruzada puede también iniciar en +? y puede ser disminuido cada bucle hasta v = ?.
La Figura 11 muestra una ilustración esquemática de la . interpolación 926 de las frecuencias desplazadas de diferentes cuadros de tiempo, intervalos de tiempo o ventanas. La Figura lia muestra la interpolación 1100 , si los cuadros de tiempo no se traslapan o superponen. Un retardo ??, es determinado para todo un cuadro de tiempo 1110. La manera más fácil para interpolar un parámetro para cada etapa de tiempo 1120 puede ser realizado al ajustar los parámetros de todas las etapas de tiempo 1120 de un cuadro de tiempo 1110 igual al retardo correspondiente d5,k. En los bordes de un cuadro de tiempo, se puede seleccionar el retardo del cuadro de tiempo previo o siguiente. Por ejemplo, los parámetros A (n) a Ak(n+3) son igual a ??,? y los parámetros Xk(n+4) a Xk(n+7) son iguales a + · Alternativamente, los retardos de los cuadros de tiempo 1110 pueden ser interpolados linealmente entre los cuadros de tiempo. Por ejemplo: Í,(„+I)=3 ¿" ¿'-" ?*(" + 2)=?/?,* ? +3)=3'^4+^+'·* Así, la Figura 11B muestra un ejemplo 1150 para cuadros de tiempo superpuestos 1110. En este caso, una etapa de tiempo 1120 está asociada a más de un cuadro de tiempo 1110 . Por consiguiente, más de un retardo determinado puede ser asociado con una etapa de tiempo 1120 . Así, los retardos determinados pueden ser interpolados 926 para obtener un parámetro para cada etapa de tiempo 1120 . Por ejemplo, los retardos determinados correspondientes a una etapa de tiempo 1120 pueden ser interpolados linealmente. Por ejemplo, una interpolación posible puede ser: + d, Xk(n + 2) = dl Alternativamente, la interpolación también se puede hacer, por ejemplo, mediante una filtración mediana.
La interpolación se puede hacer por medio de interpolación. Los medios de interpolación pueden ser parte de la unidad de extracción de parámetros o la interfase de salida o pueden ser una unidad separada.
En el lado del decodificador, la extensión de ancho de banda se puede hacer mediante: ?{?).=f??(?) · µ(?) Después de la descodificación de µ(?) y cpLF(N) como salida del codificador del núcleo. Adicionalmente, Vn^ puede ser adaptado con los parámetros previamente de los parámetros obtenidos de la señal original para el nivel de tonalidad y/o ruido .
El cálculo de la función de modulación global en el decodificador se hace de acuerdo con una o ambas de las siguientes fórmulas: k ?(?) = (pLFk (n) · ¿ik(n) + noise(n) y ?{?) = <pLF{n)¦ µ{?) + noise(n) La parte imaginaria de la señal puede ser ignorada: o(n) = ReO n)) Luego, como se menciona anteriormente, una corrección de tonalidad, por ejemplo, mediante filtración inversa puede seguir .
La Figura 12 muestra un diagrama de bloques de un descodificador de extensión de ancho de banda 1200 para proveer una señal de audio extendida en ancho de banda 532 basada en una señal de audio de entrada 502 de acuerdo con una modalidad de la invención. El descodificador de extensión de ancho de banda 1200 comprende un generador de interconexión 1210, un comparador 1220, un combinador 1230 y una interfase de salida 1240. El generador de interconexión 1210 es conectado al comparador 1220, el comparador 1220 es conectado al combinador 1230 y el combinador 1230 es conectado a la interfase de salida 1240.
El generador de interconexión 1210 genera por lo menos una señal de alta frecuencia de extensión de ancho de banda 1212 que comprende una banda de alta frecuencia basada en la señal de audio de entrada 502, en donde una frecuencia de corte inferior de la banda de alta frecuencia de una señal de alta frecuencia de extensión de ancho de banda 1212 es más baja que una frecuencia de corte superior de la señal de audio de entrada 502. Diferentes señales de alta frecuencia de extensión de ancho de banda 1212 comprenden diferentes frecuencias dentro de sus bandas de alta frecuencia, si se generan diferentes señales de alta frecuencia de extensión de ancho de banda 1212.
¦ El comparador 1220 calcula una pluralidad de parámetros de comparación. Un parámetro de comparación es calculado en base a una comparación de la señal de audio de entrada 502 y una señal de alta frecuencia de extensión de ancho de banda generada 1212. Cada parámetro de comparación de la pluralidad de parámetros de comparación es calculado en base a una frecuencia desplazada diferente entre la señal de audio de entrada 502 y una señal de alta frecuencia de extensión de ancho de banda generada 1212. Además, el comparador determina un parámetro de comparación de la pluralidad de parámetros de comparación, en donde el parámetro de comparación determinado • satisface un criterio predefinido.
Un combinador 1230 combina la señal de audio de entrada 502 y la señal de alta frecuencia de extensión de ancho de banda 1212 para obtener la señal de audio extendida en ancho de banda 532, en donde la señal de alta frecuencia de extensión de ancho de banda 1212 está basada en una frecuencia desplazada correspondiente al parámetro de comparación determinado.
La interfase de salida 1240 provee la señal de audio extendida en ancho de banda 532.
En comparación con el decodificador mostrado en la Figura 5 el descodificador descrito 1200 determina la frecuencia desplazada por si mismo. Por consiguiente, no es necesario recibir este parámetro con la señal de audio de entrada 502. De esta manera, la proporción de bits para transmisión o almacenamiento de señales de audio puede ser reducida adicionalmente .
Como se describe para la Figura 1, el generador de interconexión 1210 puede generar una pluralidad de señales de alta frecuencia de extensión de ancho de banda con diferentes frecuencias desplazadas o solamente una señal de alta frecuencia de extensión de ancho de banda que es desplazada por diferentes frecuencias desplazadas. Otra vez, también se puede usar una combinación de estas dos posibilidades.
La Figura 13 muestra un diagrama de flujo de un método 1300 para proveer una señal de audio extendida en ancho de banda de acuerdo con una modalidad de la invención. El método 1300 comprende generar en 1310 por lo menos una señal de alta frecuencia de extensión de ancho de banda, calcular 1320 una pluralidad de parámetros de comparación, determinar en 1330 un parámetro de comparación de la pluralidad de parámetros de comparación, combinar en 1340 la señal de audio de entrada y una señal de alta frecuencia de extensión de ancho de banda y proveer 1350 la señal de audio extendida en ancho de banda.
Una señal de alta frecuencia extendida en ancho de banda comprende una banda de alta frecuencia basada en la señal de audio de entrada. Una frecuencia de corte inferior de la banda de alta frecuencia de una señal de alta frecuencia extendida en ancho de banda es más baja que una frecuencia de corte superior de la señal de audio de entrada. Diferentes señales de alta frecuencia de extensión de ancho de banda comprenden diferentes frecuencias dentro sus bandas de alta frecuencia, si se generan diferentes señales de alta frecuencia de extensión de ancho de banda.
Se calcula un parámetro de comparación en base a la comparación de la señal de audio de entrada y la señal de alta frecuencia de extensión de ancho de banda generada. Cada parámetro de comparación de la pluralidad de parámetros de comparación es calculado en base a una frecuencia desplazada diferente entre la señal de audio de entrada y la señal de alta frecuencia de extensión de ancho de banda generada.
El parámetro de comparación determinado satisface un criterio predefinido.
La señal de alta frecuencia de extensión de ancho de banda que es combinada con la señal de audio de entrada para obtener la señal de audio de ancho de banda está basada en una frecuencia desplazada correspondiente al parámetro de comparación determinado. ¦ La Figura 14 muestra un diagrama de flujo de un método 1400 para proveer una señal de audio extendida en ancho de banda de acuerdo con una modalidad de la invención.
Después de recibir 1402 una corriente de bits que comprende la señal de audio de entrada, un descodificador de núcleo decodifica 1410 la señal de audio de entrada. En base a la señal de audio de entrada, se genera una señal de alta frecuencia de extensión de ancho de banda 1310 y la pluralidad de parámetros de comparación en términos de una correlación cruzada entre la señal de audio de entrada y una señal de alta frecuencia de extensión de ancho de banda generada con diferentes frecuencias desplazadas son calculadas 1320 . Luego, se determina el parámetro " de comparación que satisface el criterio predefinido 1330 que es también llamada estimación de retardo .
En base a la frecuencia desplazada correspondiente al parámetro de comparación determinado, un modulador puede modular 1420 la señal de audio de entrada. Adicionalmente , un parámetro puede ser extraído 1430 de la corriente de bits recibida 1402 para adaptar, por ejemplo, la densidad de energía de la señal modulada. La señal modulada es luego combinada 1340 con la señal de audio de entrada. Adicionalmente, la tonalidad y el ruido de la señal de audio extendida en ancho de banda puede ser corregido 1440. Esto también se puede hacer antes de la combinación con la señal de audio de entrada. Luego, los datos de audio en términos de la señal de audio extendida en ancho de banda son provistos 1350, por ejemplo, para reproducción acústica.
De esta manera, el cálculo de la modulación variable en el tiempo se hace en el lado del decodificador .
Alternativamente al modulador .que modula 1420 la señal de audio de entrada para, generar una interconexión o parche, por ejemplo, la señal de alta frecuencia de extensión de ancho de banda ya generada previamente puede ser usada o el generador de interconexión puede generar una señal de alta frecuencia de extensión de ancho de banda (parche) en base a la frecuencia desplazada correspondiente al parámetro de comparación determinado .
En otras palabras, si la baja velocidad de datos es más importante que una baja complejidad del lado del descodificador , la determinación de la modulación de frecuencia de los moduladores también se puede hacer en el lado del descodificador . Para esto, el algoritmo mostrado en la Figura 9 puede ser ejecutado en el decodificador con solamente algunos cambios. Puesto que la señal original no está disponible para el cálculo de la correlación cruzada en el decodificador, las correlaciones pueden ser calculadas entre la señal original (señal de audio de entrada) y una señal original desplazada (señal de audio de entrada) dentro de un intervalo de superposición. Por ejemplo, la señal puede ser desplazada entre cero y o¡k, por ejemplo, a dividido por 2 , a dividido por 3 o ak dividido por 4 . oík indica otra vez el k-ésimo borde de banda,. por ejemplo, i indica la frecuencia de cruce del codificador de núcleo .
Por ejemplo, esto puede suceder de la misma manera en el codificador como en el decodificador . En el codificador, los parámetros para formación espectral, corrección de ruido y/o corrección de tonalidad pueden ser extraídos y transmitidos al decodificador .
Así, la Figura 15 muestra un diagrama de bloques de un codificador de extensión de ancho de banda 1500 para proveer una señal de salida utilizando una señal de audio de entrada de acuerdo con una modalidad de la invención. El codificador 1500 corresponde al codificador mostrado en la Figura 4 . Sin embargo, el codificador 1500 no provee la señal de salida 132 con una indicación de parámetro basada en la frecuencia desplazada misma. Puede solamente determinar un parámetro de densidad de energía y parámetros opcionales para corrección de tonalidad y corrección de ruido e incluye una indicación de parámetro de estos parámetros a la señal de salida 132. Sin embargo, el parámetro de densidad de energía (y también los otros parámetros, si son determinados) es determinado en base a la frecuencia desplazada correspondiente al parámetro de comparación determinado.
Por ejemplo, el parámetro de densidad de energía puede indicar la proporción entre la señal de audio de entrada 102 y la señal de alta frecuencia de extensión de ¦ ancho de banda con una frecuencia desplazada correspondiente al parámetro de comparación determinado. Por consiguiente, la indicación de parámetro que está relacionada con el parámetro de densidad de energía y opcional a los parámetros para corrección de tonalidad y/o corrección de ruido está basada en la frecuencia desplazada . correspondiente al parámetro de comparación determinado.
Una diferencia adicional entre el codificador 1500 y el codificador mostrado en la Figura 4 es que el generador de interconexión 110 genera una señal de alta frecuencia de extensión de ancho de banda de la misma manera en que el generador de interconexión del decodificador 1400 lo hace. De esta manera, el codificador 1500 y el descodificador pueden obtener las mismas frecuencias desplazadas y pór consiguiente, los parámetros extraídos por el codificador 1500 son válidos para las interconexiones generadas por el decodificador .
Algunas modalidades de acuerdo con la invención son concernientes con un dispositivo y método para extensión de ancho de banda de señales de audio en el dominio de tiempo utilizando moduladores variables en el tiempo. En otras palabras, una interconexión o parche puede ser generado con una frecuencia de corte variable, por ejemplo, para cada etapa de tiempo, cada cuadro de tiempo, una parte de un cuadro de tiempo o para grupos de cuadros de tiempo .
El método descrito para extensión del ancho de banda de una señal de audio puede ser usado en el lado del codificador y el lado del decodificador también como solamente en el lado del decodificador . En contraste con métodos conocidos, el nuevo método descrito puede llevar a cabo una llamada extensión armónica del ancho de banda sin la necesidad de información exacta acerca de la frecuencia fundamental de la señal de audio. Además, en contraste con las llamadas de extensiones de ancho de banda armónica como se muestra por ejemplo por la solicitud de patente estadounidense provisional "F. Nagel, S. Disch: "Apparatus and method of harmonic bandwidth extensión in audio signáis" con el número de solicitud US 61/025129 que se hacen por medio de vocoders de fase, el espectro puede no ser esparcido y por consiguiente, también la densidad no puede ser cambiada. Para asegurar la armonía, se aprovechan correlaciones entre la banda extendida y la banda base. Esta correlación puede ser calculada en el codificador también como en el decodificador, dependiendo de la demanda para cómputo y complejidad de memoria y velocidad de datos .
Por ejemplo, la extensión de ancho de banda misma se puede hacer al usar una modulación de amplitud (AM) y un desplazamiento de frecuencia por medio de una sola modulación de banda lateral (SSB) con una pluralidad de portadores variables en el tiempo lentos, adaptables únicos. Un postprocesamiento siguiente de acuerdo con parámetros adicionales puede intentar aproximar la envolvente espectral y el nivel de ruido también como otras propiedades de las señales originales .
El nuevo método para transformación de señales puede evitar los problemas que aparecen debido a una operación de copia simple o reflejo por una continuación correcta armónica del espectro por medio de una frecuencia de corte variable en el tiempo XOver entre la región de baja frecuencia (LF) y la región de alta frecuencia (HF) también como entre las siguientes regiones de alta frecuencia, los llamados parches o interconexiones. Estas frecuencias de corte son escogidas de tal manera que los parches generados reparan una trama armónica existente ya que era existente en el origina tan bueno como sea posible.
La Figura 16 muestra un modulador con 3 amplitudes variables en el tiempo y frecuencias de corte mediante los cuales 3 parches pueden ser generados mediante la modulación individual de banda lateral de las bandas base. La Figura 16a muestra un diagrama 1600a del espectro de la señal extendida en ancho de banda utilizando frecuencias de corte variables en el tiempo 1610. La Figura 16b ilustra un diagrama 1600b del espectro de la señal de audio de los tres tonos. En comparación con el espectrograma ilustrado en la Figura 18b las líneas 1620 son significativamente menos discontinuas.
La Figura 17 ilustra el efecto por medio de un diagrama 1700 del período. El espectro de densidad de energía de los terceros tonos de la señal de audio es mostrado como original 1710, con una frecuencia de corte constante 1720 y con una frecuencia de corte variable 1730. En contraste con usar la frecuencia de corte constante 1720, la estructura armónica permanece al usar la frecuencia de corte variable 1730.
Mediante la continuación armónica del espectro, se pueden evitar problemas en los puntos de transición entre ambos, la banda base (codificador del núcleo) y la banda extendida, y entre parches subsecuentes. Sin una estimación de F0 como requerimiento para la función del sistema, señales arbitrarias pueden ser armónicas continuadas, sin la existencia de artefactos audibles, ni por violar la armonía ni por eventos de sonido transitorios.
Algunas modalidades de acuerdo con la invención son concernientes con un método apropiado para todas las aplicaciones de audio, en donde el pleno ancho de banda no está disponible. Por ejemplo, para la difusión de contenido de audio como por ejemplo, con radio digital, la corriente o flujo de internet o en aplicaciones de comunicación de audio, se puede usar el método descrito.
Modalidades adicionales de acuerdo con la invención son concernientes con un descodificador de extensión de ancho de banda para proveer una señal de audio extendida en ancho de banda basada en una señal de audio de entrada y una señal de parámetro, en donde la señal de parámetro comprende una indicación de una frecuencia desplazada y una indicación de un parámetro de densidad de energía. El descodificador de extensión de ancho de banda comprende un generador de parche, un combinador y una interfase de salida. El generador de interconexión está configurado para generar una señal de alta frecuencia de extensión de ancho de banda que comprende una banda de alta frecuencia, en donde la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda es generada basada en un desplazamiento de frecuencia de una banda de frecuencia de la señal de audio de entrada, en donde el desplazamiento de frecuencia está basado en la frecuencia desplazada, y en donde el generador de parche está configurado para amplificar o atenuar la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda por un factor igual al valor del parámetro de densidad de energía o igual al valor recíproco del parámetro de densidad de energía.
El combinador está configurado para combinar la señal de alta frecuencia de extensión de ancho de banda y la señal ' de audio de entrada para obtener la señal de audio extendida en ancho de banda. La interfase de salida está configurada para proveer la señal de audio extendida en ancho de banda.
Algunas modalidades adicionales de acuerdo con la invención son concernientes con un descodificador de extensión de ancho de banda como se describe anteriormente, en donde el generador de parche está configurado para amplificar o atenuar la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda por un factor igual al valor de un parámetro de densidad de energía o igual al valor recíproco del parámetro de densidad de energía, en donde una indicación del parámetro de densidad de energía está contenido por la señal de audio de entrada.
En tanto que esta invención ha sido descrita en términos de varias modalidades, hay alteraciones, permutaciones y equivalentes que caen dentro del alcance de esta invención. También se debe notar que hay muchas maneras alternativas para implementar los métodos y composiciones de la presente invención. Por consiguiente, se pretende que las siguientes reivindicaciones adjuntas sean interpretadas incluyendo todas de tales alteraciones, permutaciones y equivalentes a medida que caigan dentro del verdadero espíritu y alcance de la presente invención.
En particular, se indica que, dependiendo de las condiciones, el esquema de la invención puede también ser implementado en elementos de programación. La implementación se puede hacer por un medio de almacenamiento digital, particularmente un disco flexible o un CD con señales de control que se pueden leer electrónicamente aptas de cooperar con un sistema de computadora programable de tal manera que el método correspondiente es ejecutado. En general, la invención así también consiste en un producto de programa de computadora con códigos de programa almacenados en un portador que se puede leer por la máquina para efectuar el método de la invención, cuando el producto de programa de computadora es ejecutado en una computadora. En otras palabras, la invención puede así también ser realizada como un programa de computadora con códigos de programa para efectuar el método, cuando el producto de programa de computadora es ejecutado en una computadora.

Claims (15)

REIVINDICACIONES
1. Un codificador de audio "para proveer una señal de salida utilizando una señal de audio de entrada, caracterizado porque comprende: un generador de interconexión configurado para generar por lo menos una señal de alta frecuencia de extensión de ancho de banda, en donde la señal de alta frecuencia de extensión de ancho de banda comprende una banda de alta frecuencia, en donde la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda está basada en una banda de baja frecuencia de la señal de audio de entrada y en donde diferentes señales de alta frecuencia de extensión de ancho de banda comprenden diferentes frecuencias dentro de sus bandas de alta frecuencia, si se generan señales de alta frecuencia de extensión de ancho de banda diferentes; un comparador configurado para calcular una pluralidad de parámetros de comparación, en donde un parámetro de comparación es calculado en base a una comparación de la señal de audio de entrada y una señal de alta frecuencia de extensión de ancho de banda generada, en donde cada parámetro de comparación de la pluralidad de parámetros de comparación es calculado en base a una frecuencia desplazada diferente entre la señal de audio de entrada y una señal de alta frecuencia de extensión de ancho de banda generada, y en donde el comparador está configurado para determinar el parámetro de comparación a partir de la pluralidad de parámetros de comparación, en donde el parámetro de comparación determinado satisface un criterio predefinido; y una interfase de salida config rada para proveer la señal de salida para transmisión o almacenamiento, en donde la señal de salida comprende un indicación de parámetro basada en una frecuencia desplazada correspondiente al parámetro de comparación determinado .
2. El codificador de audio de conformidad con la reivindicación 1, caracterizado porgue comprende un comparador de densidad de energía configurado para comparar un parámetro basado en la densidad de energía de la banda de alta frecuencia de una señal de alta frecuencia de extensión de ancho de banda generada y una banda de frecuencia correspondiente de la señal de audio de entrada para obtener un parámetro de densidad de energía, en donde el parámetro de densidad de energía indica una proporción basada en la densidad de energía de la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda generada y la banda de frecuencia correspondiente de la señal de audio de entrada, y en donde la indicación del parámetro de la señal de salida 132 está basado en el parámetro de densidad de energía.
3. Un descodificador de extensión de ancho de banda para proveer una señal de audio extendida en ancho de banda basada en una señal de audio de entrada y una señal de parámetro, en donde la señal de parámetro comprende una indicación de una frecuencia desplazada y una indicación de un parámetro de densidad de energía, el descodificador de extensión de ancho de banda está caracterizado porque comprende : un generador de interconexión configurado para generar una señal de alta frecuencia de extensión de ancho de banda que comprende una banda de alta frecuencia, en donde la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda es generada en base a un desplazamiento de frecuencia de una banda de frecuencia de la señal de audio de entrada, en donde el desplazamiento de frecuencia está basado en la frecuencia desplazada, y en donde el generador de parche está configurado para amplificar o atenuar la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda por un factor igual, al valor del parámetro de densidad de energía o igual al valor recíproco del parámetro de densidad de energía, respectivamente; un combinador configurado para combinar la señal de alta frecuencia de extensión de ancho de banda y la señal de audio de entrada para obtener la señal de audio extendida en ancho de banda; y una interfase de salida configurada para proveer la señal de audio extendida en ancho de banda.
4. El descodificador de extensión de ancho de banda de conformidad con la reivindicación 3, caracterizado porque el combinador está configurado para ignorar parte de la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda, en donde la parte ignorada de la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda comprende¦ frecuencias más bajas que una frecuencia de corte superior de la señal de audio de entrada.
5. El descodificador de extensión de ancho de banda de acuerdo con la reivindicación 3 ó 4, caracterizado porque comprende un descodificador de núcleo configurado para generar la señal de audio de entrada en base a una señal de audio de entrada codificada, en donde el descodificador de núcleo genera la señal de audio de entrada con una frecuencia de corte superior constante, y en donde el generador de interconexión está configurado para generar la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda al desplazar la banda de frecuencia de la señal de audio de entrada por una frecuencia igual a la frecuencia de corte superior de la señal de audio de entrada más la frecuencia desplazada.
6. El descodificador de extensión de ancho de banda de acuerdo con una de las reivindicaciones 3 a 5, caracterizado porque el generador de interconexión está configurado para generar la señal de alta frecuencia de extensión de ancho de banda en el dominio de tiempo.
7. El descodificador de extensión de ancho de banda de acuerdo con la reivindicación 6, caracterizado porque el generador de interconexión está configurado para generar la señal de alta frecuencia de extensión de ancho de banda en base a una sola modulación de banda lateral .
8. Un descodificador de extensión de ancho de banda para proveer una señal de audio extendida en ancho de banda basada en una señal de audio de entrada, caracterizado porque comprende: un generador de interconexión configurado para generar por lo menos una señal de alta frecuencia de extensión de ancho de banda que comprende una banda de alta frecuencia basada en la señal de audio de entrada, en donde una frecuencia de corte inferior de la banda de alta frecuencia de una señal de alta frecuencia de extensión de ancho de banda es más baja que una frecuencia de corte superior de la señal de audio de entrada, y en donde diferentes señales de alta frecuencia de extensión de ancho de banda comprenden diferentes frecuencias dentro de sus bandas de alta frecuencia, si se generan diferentes señales de alta frecuencia de extensión de ancho de banda; un comparador configurado para calcular una pluralidad de parámetros de comparación, en donde un parámetro de comparación es calculado en base a una comparación de la señal de audio de entrada y una señal de alta frecuencia de extensión de ancho de banda generada, en donde cada parámetro de comparación de la pluralidad de parámetros de comparación es calculado en base a una frecuencia desplazada diferente entre la señal de audio de entrada y una señal de alta frecuencia de extensión de ancho de banda generada, y en donde el comparador está configurado para determinar un parámetro de comparación de la pluralidad de parámetros de comparación, en donde el parámetro de comparación determinado satisface un criterio predefinido; un combinador configurado para combinar la señal de audio de entrada y una señal de alta frecuencia de extensión de ancho de banda para obtener la señal de audio extendida en ancho de banda, en donde la señal de alta frecuencia de extensión de ancho de banda usada para obtener la señal de audio de extensión de ancho de banda está basada en una frecuencia desplazada correspondiente al parámetro de comparación determinado; y una interfase de salida configurada para proveer la señal de audio extendida en ancho de banda.
9. El descodificador de extensión de ancho de banda de acuerdo con la reivindicación 8, caracterizado porgue el generador de interconexión está configurado para amplificar o atenuar la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda por un factor igual al valor de un parámetro de densidad de energía o igual al valor recíproco del parámetro de densidad de energía respectivamente, en donde una indicación del parámetro de densidad de energía está contenida por la señal de audio de entrada .
10.. El descodificador de extensión de ancho de banda de acuerdo con cualquiera de las reivindicaciones 3 a 9 , caracterizado porque comprende medios de interpolación, en donde un cuadro de tiempo comprende una pluralidad de etapas de tiempo, en donde cada cuadro de tiempo comprende una frecuencia desplazada correspondienté, en donde los medios de interpolación están configurados para interpolar una frecuencia desplazada de un cuadro de tiempo o una pluralidad de frecuencias desplazadas de diferentes cuadros de tiempo para cada etapa de tiempo de un cuadro de tiempo para obtener una frecuencia desplazada interpolada para cada etapa de tiempo.
11. El codificador de audio o descodificador de extensión de ancho de banda de acuerdo con cualquiera de las reivindicaciones 1, 2, 8 ó 9, caracterizado porque el ' comparador está configurado para efectuar la comparación de la señal de audio de entrada y la señal de alta frecuencia de extensión de ancho de banda generada al calcular un resultado de la correlación cruzada de la señal de audio de entrada y la señal de alta frecuencia de extensión de ancho de banda generada, en donde el parámetro de comparación a ser calculado está basado en el resultado de la correlación cruzada, en donde un. parámetro de la correlación cruzada es una frecuencia desplazada de la señal de alta frecuencia de extensión de ancho de banda y está por consiguiente asociada con el parámetro de comparación calculado.
12. Un método para proveer una señal de salida utilizando una señal de audio de entrada, el método está caracterizado porque comprende: generar por lo menos una señal de alta frecuencia de extensión de ancho de banda, en donde la señal de alta frecuencia de extensión de ancho de banda comprende una banda de alta frecuencia, en donde la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda está basada en una banda de baja frecuencia de la señal de audio de entrada, y en donde diferentes señales de alta frecuencia de extensión de ancho de banda comprenden diferentes frecuencias dentro de sus bandas de alta frecuencia, si se generan diferentes señales de alta frecuencia de extensión de ancho de banda,- calcular una pluralidad de parámetros de comparación, en donde un parámetro de comparación es calculado en base a una comparación de la señal de audio de entrada y una señal de alta frecuencia de extensión de ancho de banda generada, en donde cada parámetro de comparación de la pluralidad de parámetros de comparación es calculado en base a una frecuencia desplazada diferente entre la señal de audio de entrada y una señal de alta frecuencia de extensión de ancho de banda generada; determinar un parámetro de comparación a partir de la pluralidad de parámetros de comparación, en donde el parámetro de comparación determinado satisface un criterio predefinido; y proveer la señal de salida para transmisión o almacenamiento, en donde la señal de salida comprende una indicación de parámetro basada en una frecuencia desplazada correspondiente al parámetro de comparación determinado.
13. Un método para proveer una señal de audio extendida en ancho de banda en base a una señal de audio de entrada y una señal de parámetro, en donde la señal de parámetro comprende una indicación de una frecuencia desplazada y una indicación de un parámetro de densidad de energía, el método está caracterizado porque comprende: generar una señal de alta frecuencia de extensión de ancho de banda que comprende una banda de alta frecuencia, en donde la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda es generada en base al desplazamiento de frecuencia de una banda de frecuencia de la señal de audio de entrada, en donde el desplazamiento de frecuencia está basado en la frecuencia desplazada; amplificar o atenuar la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda por un factor igual al valor del parámetro de densidad de energía o , igual al valor recíproco del parámetro de densidad de energía; combinar la señal de alta frecuencia de extensión de ancho de banda y la señal de audio de entrada para obtener una señal de audio extendida en ancho de banda; y proveer la señal de audio extendida en ancho de banda .
14. Un método para proveer una señal de audio extendida en ancho de banda en base a una señal de audio de entrada, el método está caracterizado porque comprende: generar por lo menos una señal de alta frecuencia de extensión de ancho de banda que comprende una banda de alta frecuencia basada en la señal de audio de entrada, en donde una frecuencia de corte inferior de la banda de alta frecuencia de una señal de alta frecuencia de extensión de ancho de banda es más baja que una frecuencia de corte superior de la señal de audio de entrada, y en donde diferentes señales de alta frecuencia de extensión de ancho de banda comprenden diferentes frecuencias dentro de sus bandas de alta frecuencia, si se generan diferentes señales de alta frecuencia de extensión de ancho de banda; calcular una pluralidad de parámetros de comparación, en donde un parámetro de comparación es calculado en base a una comparación de la señal de audio de entrada y una señal de alta frecuencia de extensión de ancho de banda generada, en donde cada parámetro de comparación de la pluralidad de parámetros de comparación es calculado en base a una frecuencia desplazada diferente entre la señal de audio de entrada y una señal de frecuencia de extensión de ancho de banda generada; . determinar un parámetro de comparación a partir de la pluralidad de parámetros de comparación, en donde el parámetro de comparación determinado satisface un criterio predefinido; combinar la señal de audio de entrada y una señal de alta frecuencia de extensión de ancho de banda para obtener la señal de audio extendida en ancho de banda, en donde la señal de alta frecuencia extendida en ancho de banda usada para obtener la señal de audio extendida en ancho de banda está basada en una frecuencia desplazada correspondiente al parámetro de compensación determinado; y proveer la señal de audio extendida en ancho de banda.
15. Un programa de computadora con códigos de programa para efectuar el método de acuerdo con una de las reivindicaciones 12 a 14, caracterizado porque el programa de computadora se ejecuta en una computadora o un microcontrolador.
MX2011006163A 2008-12-15 2009-12-11 Codificador de audio y descodificador de extension de ancho de banda. MX2011006163A (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US12255208P 2008-12-15 2008-12-15
PCT/EP2009/066980 WO2010069885A1 (en) 2008-12-15 2009-12-11 Audio encoder and bandwidth extension decoder

Publications (1)

Publication Number Publication Date
MX2011006163A true MX2011006163A (es) 2011-11-02

Family

ID=42104496

Family Applications (1)

Application Number Title Priority Date Filing Date
MX2011006163A MX2011006163A (es) 2008-12-15 2009-12-11 Codificador de audio y descodificador de extension de ancho de banda.

Country Status (16)

Country Link
US (13) US8401862B2 (es)
EP (12) EP4231291B1 (es)
JP (3) JP2012512437A (es)
KR (2) KR101369267B1 (es)
CN (1) CN102246231B (es)
AU (1) AU2009328247B9 (es)
BR (2) BRPI0917762B1 (es)
CA (5) CA2908847C (es)
DK (1) DK3364414T3 (es)
ES (4) ES2613941T3 (es)
HK (2) HK1217810A1 (es)
MX (1) MX2011006163A (es)
PL (8) PL4231290T3 (es)
PT (3) PT2359366T (es)
TR (1) TR201808500T4 (es)
WO (1) WO2010069885A1 (es)

Families Citing this family (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6992481B2 (en) 2003-05-29 2006-01-31 Timex Group B. V. Method for compensating for predictable generated signals in an electronic device
EP4231291B1 (en) * 2008-12-15 2023-11-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio bandwidth extension decoder, corresponding method and computer program
ES2805349T3 (es) * 2009-10-21 2021-02-11 Dolby Int Ab Sobremuestreo en un banco de filtros de reemisor combinado
JP5649084B2 (ja) 2010-03-09 2015-01-07 フラウンホーファーゲゼルシャフトツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. 再生速度またはピッチを変更する際にオーディオ信号における過渡音声事象を処理するための装置および方法
KR101414736B1 (ko) * 2010-03-09 2014-08-06 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 캐스케이드 필터뱅크들을 이용한 입력 오디오 신호를 처리하는 장치 및 방법
WO2011110494A1 (en) 2010-03-09 2011-09-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Improved magnitude response and temporal alignment in phase vocoder based bandwidth extension for audio signals
FR2961938B1 (fr) * 2010-06-25 2013-03-01 Inst Nat Rech Inf Automat Synthetiseur numerique audio ameliore
US8560330B2 (en) * 2010-07-19 2013-10-15 Futurewei Technologies, Inc. Energy envelope perceptual correction for high band coding
JP5714180B2 (ja) 2011-05-19 2015-05-07 ドルビー ラボラトリーズ ライセンシング コーポレイション パラメトリックオーディオコーディング方式の鑑識検出
US20130006644A1 (en) * 2011-06-30 2013-01-03 Zte Corporation Method and device for spectral band replication, and method and system for audio decoding
US9173025B2 (en) 2012-02-08 2015-10-27 Dolby Laboratories Licensing Corporation Combined suppression of noise, echo, and out-of-location signals
US20140046670A1 (en) * 2012-06-04 2014-02-13 Samsung Electronics Co., Ltd. Audio encoding method and apparatus, audio decoding method and apparatus, and multimedia device employing the same
KR101990884B1 (ko) * 2012-09-04 2019-06-19 에스케이 텔레콤주식회사 이종망 간의 통신품질 향상 방법 및 장치
EP2709106A1 (en) 2012-09-17 2014-03-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating a bandwidth extended signal from a bandwidth limited audio signal
US9258428B2 (en) * 2012-12-18 2016-02-09 Cisco Technology, Inc. Audio bandwidth extension for conferencing
EP2950308B1 (en) * 2013-01-22 2020-02-19 Panasonic Corporation Bandwidth expansion parameter-generator, encoder, decoder, bandwidth expansion parameter-generating method, encoding method, and decoding method
PL3067890T3 (pl) 2013-01-29 2018-06-29 Fraunhofer Ges Forschung Koder audio, dekoder audio, sposób dostarczania zakodowanej informacji audio, sposób dostarczania zdekodowanej informacji audio, program komputerowy i zakodowana reprezentacja, wykorzystujące adaptacyjne względem sygnału powiększanie szerokości pasma
ES2899781T3 (es) 2013-01-29 2022-03-14 Fraunhofer Ges Forschung Aparato y procedimiento para generar una señal de refuerzo de frecuencia mediante la configuración de la señal de refuerzo
CN103971694B (zh) * 2013-01-29 2016-12-28 华为技术有限公司 带宽扩展频带信号的预测方法、解码设备
RU2622872C2 (ru) * 2013-04-05 2017-06-20 Долби Интернэшнл Аб Аудиокодер и декодер для кодирования по форме волны с перемежением
CN104217727B (zh) * 2013-05-31 2017-07-21 华为技术有限公司 信号解码方法及设备
EP2830056A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding an audio signal with intelligent gap filling in the spectral domain
US10083708B2 (en) * 2013-10-11 2018-09-25 Qualcomm Incorporated Estimation of mixing factors to generate high-band excitation signal
EP2871641A1 (en) * 2013-11-12 2015-05-13 Dialog Semiconductor B.V. Enhancement of narrowband audio signals using a single sideband AM modulation
JP6593173B2 (ja) * 2013-12-27 2019-10-23 ソニー株式会社 復号化装置および方法、並びにプログラム
JP6576934B2 (ja) * 2014-01-07 2019-09-18 ハーマン インターナショナル インダストリーズ インコーポレイテッド 圧縮済みオーディオ信号の信号品質ベース強調及び補償
FR3017484A1 (fr) * 2014-02-07 2015-08-14 Orange Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences
EP3128513B1 (en) * 2014-03-31 2019-05-15 Fraunhofer Gesellschaft zur Förderung der Angewand Encoder, decoder, encoding method, decoding method, and program
US9984699B2 (en) * 2014-06-26 2018-05-29 Qualcomm Incorporated High-band signal coding using mismatched frequency ranges
EP2963645A1 (en) * 2014-07-01 2016-01-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Calculator and method for determining phase correction data for an audio signal
JP2016038435A (ja) * 2014-08-06 2016-03-22 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
US9852744B2 (en) * 2014-12-16 2017-12-26 Psyx Research, Inc. System and method for dynamic recovery of audio data
US10847170B2 (en) 2015-06-18 2020-11-24 Qualcomm Incorporated Device and method for generating a high-band signal from non-linearly processed sub-ranges
KR101677137B1 (ko) * 2015-07-17 2016-11-17 국방과학연구소 변조 스펙트로그램을 이용한 수중 방사체의 데몬 및 lofar 특징을 동시 추출하는 방법 및 장치
EP3182411A1 (en) 2015-12-14 2017-06-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing an encoded audio signal
EP3182410A3 (en) * 2015-12-18 2017-11-01 Dolby International AB Enhanced block switching and bit allocation for improved transform audio coding
JP6790114B2 (ja) * 2016-03-18 2020-11-25 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 音声スペクトログラムに基づく構造テンソルを使用して位相情報を復元することによるエンコーディング
TW202341126A (zh) * 2017-03-23 2023-10-16 瑞典商都比國際公司 用於音訊信號之高頻重建的諧波轉置器的回溯相容整合
EP3382702A1 (en) * 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for determining a predetermined characteristic related to an artificial bandwidth limitation processing of an audio signal
GB2562253B (en) * 2017-05-09 2021-11-03 Imagination Tech Ltd Efficient detection of ranging code correlation function of a GNSS signal
US10896684B2 (en) * 2017-07-28 2021-01-19 Fujitsu Limited Audio encoding apparatus and audio encoding method
CN109729585B (zh) * 2017-10-27 2022-04-15 成都鼎桥通信技术有限公司 网络处理方法和装置
US11158297B2 (en) * 2020-01-13 2021-10-26 International Business Machines Corporation Timbre creation system
EP4211701A1 (en) * 2020-09-09 2023-07-19 Sparrow Acoustics Inc. Method and system for performing time-domain processing of a waveform signal
US20230110255A1 (en) * 2021-10-12 2023-04-13 Zoom Video Communications, Inc. Audio super resolution

Family Cites Families (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2512908A (en) 1947-10-16 1950-06-27 Mina M Arndt Telephone switchboard mounting plate with plug-in components
US5455888A (en) 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
WO1997029549A1 (fr) 1996-02-08 1997-08-14 Matsushita Electric Industrial Co., Ltd. Codeur, decodeur, codeur-decodeur et support d'enregistrement de signal audio large bande
JPH10124088A (ja) 1996-10-24 1998-05-15 Sony Corp 音声帯域幅拡張装置及び方法
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US6549884B1 (en) * 1999-09-21 2003-04-15 Creative Technology Ltd. Phase-vocoder pitch-shifting
US7742927B2 (en) * 2000-04-18 2010-06-22 France Telecom Spectral enhancing method and device
SE0001926D0 (sv) * 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
SE0004187D0 (sv) * 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
JP2003108197A (ja) * 2001-07-13 2003-04-11 Matsushita Electric Ind Co Ltd オーディオ信号復号化装置およびオーディオ信号符号化装置
DE60230856D1 (de) * 2001-07-13 2009-03-05 Panasonic Corp Audiosignaldecodierungseinrichtung und audiosignalcodierungseinrichtung
US6895375B2 (en) 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech
AU2002352182A1 (en) 2001-11-29 2003-06-10 Coding Technologies Ab Methods for improving high frequency reconstruction
US20040002844A1 (en) 2002-06-27 2004-01-01 Jess Jochen A.G. System and method for statistical modeling and statistical timing analysis of integrated circuits
US8090577B2 (en) 2002-08-08 2012-01-03 Qualcomm Incorported Bandwidth-adaptive quantization
JP3861770B2 (ja) 2002-08-21 2006-12-20 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
DE10328777A1 (de) 2003-06-25 2005-01-27 Coding Technologies Ab Vorrichtung und Verfahren zum Codieren eines Audiosignals und Vorrichtung und Verfahren zum Decodieren eines codierten Audiosignals
CN101800049B (zh) * 2003-09-16 2012-05-23 松下电器产业株式会社 编码装置和译码装置
DE10345996A1 (de) 2003-10-02 2005-04-28 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Verarbeiten von wenigstens zwei Eingangswerten
DE10345995B4 (de) 2003-10-02 2005-07-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Verarbeiten eines Signals mit einer Sequenz von diskreten Werten
JP4254479B2 (ja) * 2003-10-27 2009-04-15 ヤマハ株式会社 オーディオ帯域拡張再生装置
DE102004046746B4 (de) * 2004-09-27 2007-03-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren zum Synchronisieren von Zusatzdaten und Basisdaten
WO2006049205A1 (ja) * 2004-11-05 2006-05-11 Matsushita Electric Industrial Co., Ltd. スケーラブル復号化装置およびスケーラブル符号化装置
EP1686564B1 (en) * 2005-01-31 2009-04-15 Harman Becker Automotive Systems GmbH Bandwidth extension of bandlimited acoustic signals
JP4604864B2 (ja) 2005-06-14 2011-01-05 沖電気工業株式会社 帯域拡張装置及び不足帯域信号生成器
US7953605B2 (en) * 2005-10-07 2011-05-31 Deepen Sinha Method and apparatus for audio encoding and decoding using wideband psychoacoustic modeling and bandwidth extension
US7953604B2 (en) * 2006-01-20 2011-05-31 Microsoft Corporation Shape and scale parameters for extended-band frequency coding
US20080004866A1 (en) * 2006-06-30 2008-01-03 Nokia Corporation Artificial Bandwidth Expansion Method For A Multichannel Signal
PL2109098T3 (pl) * 2006-10-25 2021-03-08 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Urządzenie i sposób do generowania próbek audio w dziedzinie czasu
JP2008158300A (ja) * 2006-12-25 2008-07-10 Sony Corp 信号処理装置、信号処理方法、再生装置、再生方法、電子機器
US7912729B2 (en) * 2007-02-23 2011-03-22 Qnx Software Systems Co. High-frequency bandwidth extension in the time domain
DE102008015702B4 (de) 2008-01-31 2010-03-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals
MX2010009932A (es) * 2008-03-10 2010-11-30 Fraunhofer Ges Forschung Metodo y dispositivo para manipular una señal de audio que tiene un evento transitorio.
US7977562B2 (en) * 2008-06-20 2011-07-12 Microsoft Corporation Synthesized singing voice waveform generator
AU2009267525B2 (en) * 2008-07-11 2012-12-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio signal synthesizer and audio signal encoder
US8880410B2 (en) * 2008-07-11 2014-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating a bandwidth extended signal
WO2010036062A2 (en) * 2008-09-25 2010-04-01 Lg Electronics Inc. A method and an apparatus for processing a signal
EP2224433B1 (en) * 2008-09-25 2020-05-27 Lg Electronics Inc. An apparatus for processing an audio signal and method thereof
EP4231291B1 (en) * 2008-12-15 2023-11-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio bandwidth extension decoder, corresponding method and computer program
EP3246919B1 (en) * 2009-01-28 2020-08-26 Dolby International AB Improved harmonic transposition
ES2805349T3 (es) * 2009-10-21 2021-02-11 Dolby Int Ab Sobremuestreo en un banco de filtros de reemisor combinado
PL2581905T3 (pl) * 2010-06-09 2016-06-30 Panasonic Ip Corp America Sposób rozszerzania pasma częstotliwości, urządzenie do rozszerzania pasma częstotliwości, program, układ scalony oraz urządzenie dekodujące audio
WO2012113035A1 (en) 2011-02-25 2012-08-30 Polyline Piping Systems Pty Ltd Mobile plastics extrusion plant
CN103928029B (zh) * 2013-01-11 2017-02-08 华为技术有限公司 音频信号编码和解码方法、音频信号编码和解码装置
US9666202B2 (en) * 2013-09-10 2017-05-30 Huawei Technologies Co., Ltd. Adaptive bandwidth extension and apparatus for the same

Also Published As

Publication number Publication date
EP2945159A1 (en) 2015-11-18
US8401862B2 (en) 2013-03-19
EP4224474A1 (en) 2023-08-09
CA2908550C (en) 2018-02-13
PL2359366T3 (pl) 2017-04-28
US20230049083A1 (en) 2023-02-16
ES2613941T3 (es) 2017-05-29
KR20130133914A (ko) 2013-12-09
EP3364414B1 (en) 2022-04-13
EP4231291C0 (en) 2023-11-15
ES2674386T3 (es) 2018-06-29
CA2908847C (en) 2018-02-13
EP4231293C0 (en) 2023-11-15
EP4231290C0 (en) 2023-11-15
EP4053838A1 (en) 2022-09-07
PT3364414T (pt) 2022-07-04
US10229696B2 (en) 2019-03-12
BR122015019030B1 (pt) 2020-05-05
US20230041923A1 (en) 2023-02-09
AU2009328247B9 (en) 2013-12-05
US20150243293A1 (en) 2015-08-27
HK1259024A1 (zh) 2019-11-22
AU2009328247A1 (en) 2011-07-07
US11646043B2 (en) 2023-05-09
EP4231292B1 (en) 2023-11-15
CA2746837A1 (en) 2010-06-24
CA2908576C (en) 2018-11-27
US20210151063A1 (en) 2021-05-20
EP4231294A1 (en) 2023-08-23
PT2945159T (pt) 2018-06-26
WO2010069885A1 (en) 2010-06-24
EP4053838B1 (en) 2023-06-21
JP5970014B2 (ja) 2016-08-17
BRPI0917762B1 (pt) 2020-09-29
US20230072871A1 (en) 2023-03-09
CA2908847A1 (en) 2010-06-24
KR20110095354A (ko) 2011-08-24
PL4231290T3 (pl) 2024-04-02
EP4224474C0 (en) 2023-11-01
US11664039B2 (en) 2023-05-30
US9058802B2 (en) 2015-06-16
US11626124B2 (en) 2023-04-11
US20190156845A1 (en) 2019-05-23
US11631418B2 (en) 2023-04-18
BRPI0917762A2 (pt) 2016-07-26
CA2989886A1 (en) 2010-06-24
CA2746837C (en) 2016-09-20
KR101369267B1 (ko) 2014-03-04
EP4231294C0 (en) 2023-11-15
EP4231290B1 (en) 2023-11-15
PL4224475T3 (pl) 2024-03-18
PL4053838T3 (pl) 2023-11-13
EP2359366B1 (en) 2016-11-02
ES2921059T3 (es) 2022-08-17
CA2989886C (en) 2020-05-05
DK3364414T3 (da) 2022-06-27
US20230032124A1 (en) 2023-02-02
EP4231294B1 (en) 2023-11-15
US20230051135A1 (en) 2023-02-16
CA2908576A1 (en) 2010-06-24
EP2945159B1 (en) 2018-03-21
US20130185082A1 (en) 2013-07-18
US11594237B2 (en) 2023-02-28
JP2015187747A (ja) 2015-10-29
EP4231291A1 (en) 2023-08-23
CN102246231B (zh) 2013-07-10
BR122015019030A2 (pt) 2019-08-27
EP4231290A1 (en) 2023-08-23
EP3364414A1 (en) 2018-08-22
JP2012512437A (ja) 2012-05-31
US20230053046A1 (en) 2023-02-16
US11670316B2 (en) 2023-06-06
TR201808500T4 (tr) 2018-07-23
US10937437B2 (en) 2021-03-02
EP4231295A1 (en) 2023-08-23
US11741978B2 (en) 2023-08-29
US11705146B2 (en) 2023-07-18
EP4231291B1 (en) 2023-11-15
EP4224474B1 (en) 2023-11-01
EP2359366A1 (en) 2011-08-24
EP4231293B1 (en) 2023-11-15
EP4224475C0 (en) 2023-10-11
JP6076407B2 (ja) 2017-02-08
PL2945159T3 (pl) 2018-08-31
EP4231292C0 (en) 2023-11-15
PL4231292T3 (pl) 2024-04-02
PT2359366T (pt) 2017-01-20
CN102246231A (zh) 2011-11-16
AU2009328247B2 (en) 2013-06-06
CA2908550A1 (en) 2010-06-24
EP4231295B1 (en) 2024-02-21
US20230377590A1 (en) 2023-11-23
PL3364414T3 (pl) 2022-08-16
EP4231293A1 (en) 2023-08-23
ES2951163T3 (es) 2023-10-18
JP2014142653A (ja) 2014-08-07
HK1217810A1 (zh) 2017-01-20
EP4053838C0 (en) 2023-06-21
US20230037621A1 (en) 2023-02-09
EP4224475B1 (en) 2023-10-11
PL4224474T3 (pl) 2024-04-02
KR101424944B1 (ko) 2014-08-01
EP4231295C0 (en) 2024-02-21
EP4224475A1 (en) 2023-08-09
US20110288873A1 (en) 2011-11-24
EP4231292A1 (en) 2023-08-23

Similar Documents

Publication Publication Date Title
US11670316B2 (en) Audio encoder and bandwidth extension decoder
AU2015203736B2 (en) Audio encoder and bandwidth extension decoder

Legal Events

Date Code Title Description
FG Grant or registration