ES2921059T3 - Decodificador de extensión de ancho de banda de audio, programa informático y procedimiento correspondiente - Google Patents

Decodificador de extensión de ancho de banda de audio, programa informático y procedimiento correspondiente Download PDF

Info

Publication number
ES2921059T3
ES2921059T3 ES18151917T ES18151917T ES2921059T3 ES 2921059 T3 ES2921059 T3 ES 2921059T3 ES 18151917 T ES18151917 T ES 18151917T ES 18151917 T ES18151917 T ES 18151917T ES 2921059 T3 ES2921059 T3 ES 2921059T3
Authority
ES
Spain
Prior art keywords
signal
frequency
bandwidth
audio signal
bandwidth extension
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES18151917T
Other languages
English (en)
Inventor
Frederik Nagel
Guillaume Fuchs
Sascha Disch
Jürgen Herre
Christian Griebel
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Application granted granted Critical
Publication of ES2921059T3 publication Critical patent/ES2921059T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • G10L19/265Pre-filtering, e.g. high frequency emphasis prior to encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Abstract

Un decodificador de extensión de ancho de banda (500), (600) para proporcionar una señal de audio extendida de ancho de banda (532) basada en una señal de audio de entrada (502) y una señal de parámetro (504), en la que la señal de parámetro (504) comprende una indicación de una indicación de una indicación de una indicación de una indicación frecuencia de desplazamiento y una indicación de un parámetro de densidad de potencia, comprende: un generador de parche (510) configurado para generar una señal de alta frecuencia de extensión de ancho de banda (512) que comprende una banda de alta frecuencia, en la que la banda de alta frecuencia de la extensión de banda alta -La señal de frecuencia (512) se genera en función de un cambio de frecuencia de una banda de frecuencia de la señal de audio de entrada (502), en la que el cambio de frecuencia se basa en la frecuencia de desplazamiento y en el que el generador de parche (510) está configurado para amplificar o amplificar o atenúe la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda (512) por un factor igual al valor del parámetro de densidad de potencia o igual al valor recíproco del parámetro de densidad de potencia, respectivamente; un combinador (529) configurado para combinar la señal de alta frecuencia de extensión de ancho de banda (512) y la señal de audio de entrada (502) para obtener la señal de audio extendida de ancho de banda (532); y una interfaz de salida (530) configurada para proporcionar la señal de audio extendida de ancho de banda (532). (Traducción automática con Google Translate, sin valor legal)

Description

DESCRIPCIÓN
Decodificador de extensión de ancho de banda de audio, programa informático y procedimiento correspondiente [0001] Las realizaciones según la invención se refieren al procesamiento de señales de audio y, en particular, a un decodificador de extensión de ancho de banda y un procedimiento para proporcionar una señal de audio extendida en ancho de banda.
[0002] La codificación adaptada a la audición de señales de audio para reducción de datos para un almacenamiento y transmisión eficiente de estas señales ha ganado aceptación en muchos campos. Se conocen algoritmos de codificación, por ejemplo, como MPEG 1/2 CAPA 3, “MP3” o MPEG 4 AAC. El algoritmo de codificación usado para esto, en particular cuando se obtienen proporciones de bits más bajas, conduce a la reducción de la calidad de audio que es frecuentemente provocada principalmente por una limitación lateral del codificador del ancho de banda de la señal de audio que se va a transmitir. Una señal de filtro de paso bajo se codifica utilizando un llamado codificador de núcleo o codificador central y la región con frecuencias más altas se parametriza, de tal manera que se pueden reconstruir aproximadamente a partir de la señal filtrada de paso bajo.
[0003] Se conoce a partir del documento WO 9857436 el hecho de someter la señal de audio a una limitación de banda en tal situación en el lado del codificador y codificar solamente una banda más baja de la señal de audio por medio de un codificador de audio de alta calidad. La banda superior, sin embargo, se caracteriza únicamente de forma muy brusca, es decir, por un conjunto de parámetros que permiten la reproducción de la envolvente espectral original de la banda superior. En el lado del decodificador, la banda superior se sintetiza a continuación. Para este propósito, se propone una transposición armónica, en la que la banda inferior de la señal de audio decodificada se suministra a un banco de filtros. Canales de banco de filtros de la banda inferior están conectados a canales de banco de filtros de la banda superior, o son “parcheados” (interconectados), y cada señal de paso de banda parcheada se somete a un ajuste de envolvente. El banco de filtros de síntesis que pertenece a un banco de filtros de análisis especial recibe aquí señales de paso de banda de la señal de audio en la banda inferior y señales de paso de banda ajustadas a la envolvente de la banda inferior que se parchearon armónicamente a la banda superior. La señal de salida del banco de filtros de síntesis es una señal de audio extendida con respecto a su ancho de banda de audio que se transmitió del lado del codificador al lado del decodificador con una proporción de datos muy baja. En particular, los cálculos de banco de filtros y parcheo en el dominio de banco de filtros se puede convertir en un esfuerzo computacional alto.
[0004] Los procedimientos de complejidad reducida para una extensión de ancho de banda de señales de audio de banda limitada en lugar de esto utilizan una función de copia de porciones de señal de baja frecuencia (LS) al intervalo de alta frecuencia (HF), con el fin de aproximar información perdida debido a la limitación de banda. Tales procedimientos se describen en M. Dietz, L. Liljeryd, K. Kjorling y 0. Kunz, "Spectral Band Replication, a novel approach in audio coding," en la 112a Convención AES, Munich, Mayo de 2002; S. Meltzer, R. Bohm y F. Henn, "SBR enhanced audio codecs for digital broadcasting such as "Digital Radio Mondiale" (DRM)," 112a Convención AES, Munich, Mayo de 2002; T. Ziegler, A. Ehret, P. Ekstrand y M. Lutzky, "Enhancing mp3 with SBR: Features and Capabilities of the new mp3PRO Algorithm," en 112a Convención AES, Munich, Mayo de 2002; International Standard ISO/IEC 14496-3:2001/FPDAM l, "Bandwidth Extension," ISO/IEC, 2002, o "Speech bandwidth extension method and apparatus", Vasu lyengar y col. Patente estadounidense No. 5.455.888.
[0005] En estos procedimientos, no se efectúa ninguna transposición armónica, pero los canales del banco de filtros de fase de banda adyacentes de la banda inferior se introducen artificialmente a canales del banco de filtros adyacentes de la banda superior. Esto conduce a una aproximación burda de la banda superior de la señal de audio. Esta aproximación burda de la señal se refina a continuación, en una etapa adicional, al definir parámetros de control adicionales deducidos de la señal original. Como un ejemplo, el estándar de MPEG-4 utiliza factores de escala para ajustar la envolvente espectral, una combinación de filtración inversa y adición de un ruido de fondo para adaptar la tonalidad e inserciones de porciones de señal sinusoidales para complementación de componentes tonales.
[0006] Aparte de esto, existen procedimientos adicionales tales como la llamada “extensión de ancho de banda ciega”, descrita en E. Larsen, R.M. Aarts y M. Danessis, “Efficient high-frequency bandwidth extension of music and speech”, en 112a Convención AES, Munich, Alemania, Mayo de 2002 en la que no se usa ninguna información del intervalo de HF original. Además, también existe el procedimiento de la llamada “extensión de ancho de banda artificial” que se describe en K. Kayhko, A Robust Wideband Enhancement for Narrowband Speech Signal; Research Report, Helsinki University of Technology, Laboratory of Acoustics and Audio signal Processing, 2001.
[0007] En J. Makinen y col.: AMR-WB+: a new audio coding standard for 3rd generation mobile audio services Broadcasts, IEEE, ICASSP '05 se describe un procedimiento para extensión de ancho de banda, en el que la operación de copia de componentes de baja frecuencia a la banda alta es efectuada por una operación de reflejo o espejo obtenida, por ejemplo, mediante toma de muestras ascendentes de la señal de filtro de paso bajo.
[0008] Como una alternativa, se puede emplear una modulación de banda lateral individual que es básicamente equivalente a una operación de copia en el dominio de banco de filtros. Procedimientos que habilitan una extensión de ancho de banda armónica emplean usualmente una etapa de determinación del paso (rastreo de paso), una etapa de distorsión no lineal (véase, por ejemplo, “U. Kornagel, Spectral widening of the excitation signal for telephone-band speech enhancement, en: Proceedings of the IWAENC, Darmstadt, Alemania, Septiembre de 2001, pp. 215 - 218”) o hacen uso de vocodificadores de fase tales como por ejemplo como se muestran por la solicitud de patente estadounidense provisional “F.Nagel, S. Disch: “Apparatus and method of harmonic bandwidth extension in audio signals”” con el número de solicitud US 61/025129.
[0009] El documento WO 02/41302 A1, por ejemplo, muestra un procedimiento para mejorar el desempeño de sistemas de codificación que usan procedimientos de reconstrucción de alta frecuencia. Muestra cómo mejorar el desempeño global de tales sistemas por medio de una adaptación sobre el tiempo de la frecuencia de cruce entre la banda baja codificada por un codificador central y la banda alta codificada por un sistema de reconstrucción de alta frecuencia. Para este procedimiento, el codificador de núcleo o codificador central debe ser capaz de trabajar con diferentes frecuencias de cruce en el lado del codificador, así como en el lado del decodificador. Por consiguiente, se incrementa la complejidad del codificador del núcleo o codificador central.
[0010] Tecnologías adicionales para extensiones de ancho de banda se describen, por ejemplo, en “R. M. Aarts, E. Larsen y O. Ouweltjes, A unified approach to low- and high-frequency bandwidth extension. En 115a Convention AES, Nueva York, EUA, Octubre de 2003”, E. Larsen y R. M. Aarts: Audio Bandwidth Extension -Application to psychoacoustics, Signal Processing and Loudspeaker Design. John Wiley e hijos, Ltd, 2004”, E. Larsen, R. M. Aarts y M. Danessis: Efficient high-frequency bandwidth extension of music and speech. En 112a Convención AES 112th, Munich, Alemania, Mayo de 2002”, “J. Makhoul: Spectral Analysis of Speech by Linear Prediction. IEEE Transactions on Audio and Electroacoustics, AU-21(3), Junio de 1973“, “Solicitud de patente estadounidense 08/951,029, Ohmori y col.: Audio band width extending system and method” and “patente estadounidense 6895375, Malah, D y Cox, R. VS.: System for bandwidth extension of Narrow-band speech”.
[0011] Los procedimientos de extensión de ancho de banda armónicos frecuentemente exhiben una alta complejidad, mientras que los procedimientos de extensión de ancho de banda de complejidad reducida muestran pérdidas de calidad. En el caso particular en el que una baja proporción de bits se combina con un ancho de banda pequeño de la banda baja, se pueden presentar artefactos tales como rugosidad o aspereza y un timbre percibido como desagradable. Una razón para esto es el hecho de que la porción de HF aproximada está basada en una operación de copia que no mantiene ni las relaciones armónicas entre las porciones de señal tonales. Esto se aplica tanto a la relación armónica entre LF y HF y también a la relación armónica entre interconexiones subsecuentes dentro de la porción de HF misma. Por ejemplo, dentro de SBR, la yuxtaposición de los componentes codificados y los componentes replicados, que se presenta en la frontera entre las bandas baja y alta puede provocar impresiones de sonido áspero o rugoso. La razón se ilustra en la figura 18 en la que las porciones tonales copiadas del intervalo LF al intervalo de HF son espectralmente adyacentes densamente a porciones tonales del intervalo de LF.
[0012] La figura 18a muestra el espectrograma original 1800a de una señal constituido por tres tonos. De conformidad, la figura 18b muestra un diagrama 1800b de la señal extendida del ancho de banda correspondiente a la señal original de la figura 18a. La abscisa indica el tiempo y la ordenada indica la frecuencia. En particular, en el último tono, se pueden observar problemas potenciales 1810 (líneas discontinuas 1810).
[0013] Si las relaciones armónicas son consideradas mediante procedimientos conocidos, esto siempre se hace en base a una estimación de F0. En estos casos, el éxito de estos procedimientos depende principalmente de la fiabilidad de esta estimación.
[0014] En general, los procedimientos de extensión de ancho de banda conocidos proporcionan señales de audio a una baja proporción de bits, pero con calidad de audio deficiente o una calidad de audio buena a altas proporciones de bits.
[0015] El documento US 2004/0028244 A1 describe un dispositivo de decodificación que genera datos espectrales de frecuencia a partir de un flujo de datos de audio codificado introducido. El dispositivo de decodificación incluye: una unidad de decodificación central para decodificar el flujo de datos codificados de entrada y generar datos espectrales de baja frecuencia que representan una señal de audio; y una unidad de decodificación extendida para generar, en base a los datos espectrales de frecuencia más baja, datos espectrales de frecuencia extendida que indican una estructura armónica, que es lo mismo que una extensión a lo largo del eje de frecuencia de la estructura armónica indicada por los datos espectrales de frecuencia más baja, en una región de frecuencia que no está representada por el flujo de datos codificados.
[0016] La publicación "Spectral Widening of the Excitation Signal for Telephone-Band Speech Enhancement", U. Kornagel, International Workshop an Acoustic Echo and Noise Control, Darmstadt, Alemania, septiembre de 2001, páginas 215 a 218, describe cómo abordar una degradación de la calidad del discurso mediante complementar los componentes espectrales que faltan de una banda de frecuencia ampliada de forma artificial. Un filtro de síntesis de banda ancha se activa con una señal de excitación de banda ancha.
[0017] El objeto de la presente invención es proporcionar un esquema mejorado de decodificación de extensión de ancho de banda para señales de audio.
[0018] Este objeto es obtenido por un decodificador de extensión de ancho de banda según la reivindicación 1 o un procedimiento según la reivindicación 4 o un programa informático según la reivindicación 5.
[0019] Un ejemplo para ilustrar la invención proporciona un codificador de audio para proporcionar una señal de salida utilizando una señal de audio de entrada. El codificador de audio comprende un generador de parches, un comparador y una interfaz de salida.
[0020] El generador de parches está configurado para generar al menos una señal de alta frecuencia de extensión de ancho de banda. Una señal de alta frecuencia de extensión de ancho de banda comprende una banda de alta frecuencia, donde la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda se basa en una banda de baja frecuencia de la señal de audio de entrada. Las diferentes señales de alta frecuencia de extensión de ancho de banda comprenden diferentes frecuencias dentro de sus bandas de alta frecuencia si se generan diferentes señales de alta frecuencia de extensión de ancho de banda.
[0021] El comparador está configurado para calcular una pluralidad de parámetros de comparación. Se calcula un parámetro de comparación basado en una comparación de la señal de audio de entrada y una señal de alta frecuencia de extensión de ancho de banda generada. Cada parámetro de comparación de la pluralidad de parámetros de comparación se calcula en base a una frecuencia de desplazamiento diferente entre la señal de audio de entrada y una señal de alta frecuencia de extensión de ancho de banda generada. Además, el comparador está configurado para determinar un parámetro de comparación de la pluralidad de parámetros de comparación, en el que el parámetro de comparación determinado cumple un criterio predefinido.
[0022] En otras palabras, por ejemplo, el comparador puede configurarse para determinar el parámetro de comparación entre la pluralidad de parámetros de comparación que cumple en el mejor de los casos un criterio predefinido.
[0023] La interfaz de salida está configurada para proporcionar la señal de salida para transmisión o almacenamiento. La señal de salida comprende una indicación de parámetro basada en una frecuencia de desplazamiento correspondiente al parámetro de comparación determinado.
[0024] En otras palabras, la señal de salida puede comprender el parámetro de comparación seleccionado que indica la frecuencia de desplazamiento óptima.
[0025] Una realización de la invención proporciona un decodificador de extensión de ancho de banda para proporcionar una señal de audio extendida de ancho de banda en base a una señal de audio de entrada y una señal de parámetro. La señal de parámetro comprende una indicación de una frecuencia de desplazamiento y una indicación de un parámetro de densidad de energía. El decodificador de extensión de ancho de banda comprende un generador de parches, un combinador y una interfaz de salida.
[0026] El generador de parches está configurado para generar una señal de alta frecuencia de extensión de ancho de banda que comprende una banda de alta frecuencia. La banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda se genera realizando un cambio de frecuencia de una banda de frecuencia de la señal de audio de entrada a frecuencias más altas. El cambio de frecuencia se basa en la frecuencia de desplazamiento.
[0027] Además, el generador de parches está configurado para amplificar o atenuar la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda por un factor igual al valor del parámetro de densidad de energía o igual al valor recíproco del parámetro de densidad de energía, respectivamente.
[0028] El combinador está configurado para combinar la señal de alta frecuencia de extensión de ancho de banda y la señal de audio de entrada para obtener la señal de audio extendida de ancho de banda.
[0029] La interfaz de salida está configurada para proporcionar la señal de audio extendida de ancho de banda.
[0030] Otro ejemplo para ilustrar la invención proporciona un decodificador de extensión de ancho de banda para proporcionar una señal de audio extendida de ancho de banda basada en una señal de audio de entrada. El decodificador de extensión de ancho de banda comprende un generador de parches, un comparador, un combinador y una interfaz de salida.
[0031] El generador de parches está configurado para generar al menos una señal de alta frecuencia de extensión de ancho de banda que comprende una banda de alta frecuencia basada en la señal de audio de entrada, donde una frecuencia de corte más baja de la banda de alta frecuencia de una señal de alta frecuencia de extensión de ancho de banda generada es inferior a una frecuencia de corte superior de la señal de audio de entrada. Las diferentes señales de alta frecuencia de extensión de ancho de banda generadas comprenden diferentes frecuencias dentro de sus bandas de alta frecuencia, si se generan diferentes señales de alta frecuencia de extensión de ancho de banda.
[0032] El comparador está configurado para calcular una pluralidad de parámetros de comparación. Se calcula un parámetro de comparación basado en una comparación de la señal de audio de entrada y una señal de alta frecuencia de extensión de ancho de banda generada. Cada parámetro de comparación de la pluralidad de parámetros de comparación se calcula en base a una frecuencia de desplazamiento diferente entre la señal de audio de entrada y la señal de alta frecuencia de extensión de ancho de banda generada. Además, el comparador está configurado para determinar un parámetro de comparación de la pluralidad de parámetros de comparación, en el que el parámetro de comparación determinado cumple un criterio predefinido.
[0033] En otras palabras, por ejemplo, el comparador está configurado para determinar el parámetro de comparación entre la pluralidad de parámetros de comparación que cumple en el mejor de los casos un criterio predefinido.
[0034] El combinador está configurado para combinar la señal de audio de entrada y una señal de alta frecuencia de extensión de ancho de banda para obtener la señal de audio extendida de ancho de banda, donde la señal de alta frecuencia de extensión de ancho de banda utilizada para obtener la señal de audio extendida de ancho de banda se basa en una frecuencia de desplazamiento correspondiente al parámetro de comparación determinado.
[0035] La interfaz de salida está configurada para proporcionar la señal de audio extendida de ancho de banda.
[0036] Las realizaciones según la presente invención se basan en la idea central de que una señal de alta frecuencia de extensión de ancho de banda, que también se denomina parche, puede generarse y compararse con la señal de audio de entrada original. Usando una frecuencia de desplazamiento diferente de la señal de alta frecuencia de extensión de ancho de banda o varias señales de alta frecuencia de extensión de ancho de banda con diferentes frecuencias de desplazamiento, se puede calcular una pluralidad de parámetros de comparación correspondientes a las diferentes frecuencias de desplazamiento. Los parámetros de comparación pueden estar relacionados con una cantidad asociada con la calidad de audio. Por lo tanto, se puede determinar un parámetro de comparación que asegure la compatibilidad de la señal de alta frecuencia de extensión de ancho de banda y la señal de audio de entrada y, como consecuencia, mejorar la calidad del audio.
[0037] La tasa de bits para la transmisión o el almacenamiento de la señal de audio codificada puede reducirse utilizando una indicación de parámetro basada en la frecuencia de desplazamiento correspondiente al parámetro de comparación determinado para una reconstrucción de la banda de alta frecuencia de la señal de audio de entrada original. De esta forma, solo es necesario almacenar o transmitir una porción de baja frecuencia de la señal de audio de entrada y la indicación de parámetros.
[0038] Los términos parámetro de comparación, frecuencia de cruce e indicación de parámetro se definirán más adelante.
[0039] Algunos ejemplos para ilustrar la invención se refieren a un comparador que usa una correlación cruzada para la comparación de la señal de audio de entrada y la señal de alta frecuencia de extensión de ancho de banda generada para calcular el parámetro de comparación.
[0040] Algunas realizaciones adicionales según la invención se refieren a un generador de parche, que genera la señal de alta frecuencia de extensión de ancho de banda en el dominio de tiempo basada en una única modulación de banda lateral.
[0041] Un esquema de codificación mejorado para señales de audio permite incrementar la calidad de audio y/o disminuir la tasa de bits para transmisión o almacenamiento.
[0042] Ejemplos para ilustrar la invención y realizaciones según la invención serán detalladas posteriormente en referencia a los dibujos adjuntos, en los que:
La figura 1 es un diagrama de bloques de un codificador de audio;
La figura 2 es una ilustración esquemática de una generación de señal de alta frecuencia de extensión de ancho de banda, una comparación de la señal de audio de entrada y una señal de alta frecuencia de extensión de ancho de banda generada y una adaptación de energía de la señal de alta frecuencia de extensión de ancho de banda;
La figura 3 es una ilustración esquemática de una generación de señal de alta frecuencia de extensión de ancho de banda, una comparación de la señal de audio de entrada y una señal de alta frecuencia de extensión de ancho de banda y una adaptación de energía de la señal de alta frecuencia de extensión de ancho de banda;
La figura 4 es un diagrama de bloques de un codificador de extensión de ancho de banda;
La figura 5 es un diagrama de bloques de un decodificador de extensión de ancho de banda;
La figura 6 es un diagrama de bloques de un decodificador de extensión de ancho de banda;
La figura 7 es un diagrama de flujo de un procedimiento para proporcionar una señal de salida en base a una señal de audio de entrada;
La figura 8 es un diagrama de flujo de un procedimiento para proporcionar una señal de audio extendida de ancho de banda;
La figura 9 es un diagrama de flujo de un procedimiento para proporcionar una señal de salida en base a una señal de audio de entrada;
La figura 10 es un diagrama de flujo de un procedimiento para calcular un parámetro de comparación;
La figura 11 es una ilustración esquemática de una interpolación de la frecuencia de desplazamiento;
La figura 12 es un diagrama de bloques de un decodificador de extensión de ancho de banda;
La figura 13 es un diagrama de flujo de un procedimiento para proporcionar una señal de audio extendida de ancho de banda;
La figura 14 es un diagrama de bloques de un procedimiento para proporcionar una señal de audio extendida de ancho de banda;
La figura 15 es un diagrama de bloques de un codificador de extensión de ancho de banda;
La figura 16a es un espectrograma de tres tonos mediante el uso de una frecuencia de cruce variable;
La figura 16b es un espectrograma de la señal de audio original de tres tonos;
La figura 17 es un diagrama del espectro de energía de una señal de audio original, una señal de audio extendida de ancho de banda mediante el uso de la frecuencia de cruce constante y una señal de audio extendida de ancho de banda mediante el uso de una frecuencia de cruce variable;
La figura 18a es un espectrograma de tres tonos mediante el uso de un procedimiento de extensión de ancho de banda conocido; y
La figura 18b es un espectrograma de la señal de audio original de tres tonos.
[0043] En lo sucesivo, los mismos números de referencia se utilizan parcialmente para objetos y unidades funcionales que tienen las mismas propiedades funcionales o propiedades funcionales similares y la descripción de las mismas con respecto a una figura también se aplicará a otras figuras con el fin de reducir redundancia en la descripción de las realizaciones.
[0044] La figura 1 muestra un diagrama de bloques de un codificador de audio 100 para proporcionar una señal de salida 132 mediante el uso de una señal de audio de entrada 102. La señal de salida es apropiada para una extensión de ancho de banda en un decodificador. Por consiguiente, el codificador de audio se denomina también codificador de extensión de ancho de banda. El codificador de extensión de ancho de banda 100 comprende un generador de parche 110, un comparador 120 y una interfaz de salida 130. El generador de parche 110 está conectado al comparador 120 y el comparador 120 está conectado a la interfaz de salida 130.
[0045] El generador de parche 110 genera al menos una señal de alta frecuencia de extensión de ancho de banda 112. Una señal de alta frecuencia de extensión de ancho de banda 112 comprende una banda de alta frecuencia, en la que la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda 112 está basada en una banda de baja frecuencia de la señal de audio de entrada 102. Si se generan diferentes señales de alta frecuencia de extensión de ancho de banda 112, las diferentes señales de alta frecuencia de extensión de ancho de banda 112 comprenden diferentes frecuencias dentro de sus bandas de alta frecuencia.
[0046] El comparador 120 calcula una pluralidad de parámetros de comparación. Un parámetro de comparación se calcula en base a una comparación de la señal de audio de entrada 102 y una señal de alta frecuencia de extensión de ancho de banda generada 112. Cada parámetro de comparación de la pluralidad de parámetros de comparación se calcula en base a una frecuencia de desplazamiento diferente entre la señal de audio de entrada 102 y una señal de alta frecuencia de extensión de ancho de banda generada 112. Además, el comparador 120 determina un parámetro de comparación de la pluralidad de parámetros de comparación, en el que el parámetro de comparación determinado cumple un criterio predefinido.
[0047] La interfaz de salida 130 proporciona la señal de salida 132 para transmisión o almacenamiento. La señal de salida 132 comprende una indicación de parámetro basada en una frecuencia de desplazamiento correspondiente al parámetro de comparación determinado.
[0048] Al calcular una pluralidad de parámetros de comparación para diferentes frecuencias de desplazamiento, se puede encontrar una señal de alta frecuencia de extensión de ancho de banda 112 que se ajusta bien a la señal de audio de entrada original 102. Esto se puede hacer al generar una pluralidad de señales de alta frecuencia de extensión de ancho de banda 112 cada una con una frecuencia de desplazamiento diferente o al generar una señal de alta frecuencia de extensión de ancho de banda y cambiar la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda 112 por diferentes frecuencias de desplazamiento. También, una combinación de generación de una pluralidad de señales de alta frecuencia de extensión de ancho de banda 112 con diferentes frecuencias de desplazamiento y cambio de la banda de alta frecuencia de ellas por otras frecuencias de desplazamiento diferentes puede ser posible. Por ejemplo, se generan cinco señales de alta frecuencia de extensión de ancho de banda diferentes 112 y cada una de ellas se cambia cinco veces por un desplazamiento de frecuencia constante.
[0049] La figura 2 muestra una ilustración esquemática 200 de la generación de señal de alta frecuencia de extensión de ancho de banda, la comparación de la señal de alta frecuencia de extensión de ancho de banda y la señal de audio de entrada y una adaptación de energía opcional de la señal de alta frecuencia de extensión de ancho de banda para el caso en que solamente se genera una señal de alta frecuencia de extensión de ancho de banda y cambiada por diferentes frecuencias de desplazamiento.
[0050] El primer diagrama esquemático de “energía contra frecuencia” 210 muestra esquemáticamente una señal de audio de entrada 102. En base a esta señal de audio de entrada 102, el generador de parche 110 genera la señal de alta frecuencia de extensión de ancho de banda 112, al cambiar 222 una banda de baja frecuencia de la señal de audio de entrada 102 a frecuencias más altas (como se indica por el número de referencia). Por ejemplo, la banda de baja frecuencia se cambia por una frecuencia igual a una frecuencia de cruce de un codificador de núcleo, no ilustrado en la figura 1, que puede ser una parte del codificador de extensión de ancho de banda 100 u otra frecuencia predefinida.
[0051] La señal de alta frecuencia de extensión de ancho de banda generada 112 se puede cambiar a continuación por diferentes frecuencias de desplazamiento 232 y para cada frecuencia de desplazamiento 232 (como se indica por el número de referencia 230), se puede calcular un parámetro de comparación por el comparador 120. La frecuencia de desplazamiento 232 se puede definir, por ejemplo, en relación con una frecuencia de cruce de un codificador de núcleo, en relación con otra frecuencia específica o se puede definir como un valor de frecuencia absoluto.
[0052] A continuación, el comparador 120 determina un parámetro de comparación que cumple el criterio predefinido. De esta manera, se puede determinar una señal de alta frecuencia de extensión de ancho de banda 112 con una frecuencia de desplazamiento 242 correspondiente al parámetro de comparación determinado (como se muestra con el número de referencia 240).
[0053] Adicionalmente, se puede determinar también un parámetro de densidad de energía 252 (como se indica por el número de referencia 250). El parámetro de densidad de energía 252 puede indicar la proporción de la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda con la frecuencia de desplazamiento correspondiente al parámetro de comparación determinado y una banda de frecuencia correspondiente de la señal de audio de entrada. Por ejemplo, la proporción se puede relacionar con una proporción de densidad de energía, una proporción de energía u otra proporción de una cantidad relacionada con la densidad de energía de una banda de frecuencia.
[0054] Alternativamente, la figura 3 muestra una ilustración esquemática 300 de la generación de la señal de alta frecuencia de extensión de ancho de banda, la comparación de las señales de alta frecuencia de extensión de ancho de banda generadas y la señal de audio de entrada y la adaptación de energía opcional de la señal de alta frecuencia de extensión de ancho de banda para el caso en que se genere una pluralidad de señales de alta frecuencia de extensión de ancho de banda con diferentes frecuencias de desplazamiento.
[0055] A diferencia de la secuencia mostrada en la figura 2, el generador de parche 110 genera una pluralidad de señales de alta frecuencia de extensión de ancho de banda 112 con frecuencias de desplazamiento diferentes 232 (como se indica por el número de referencia 320). Esto se puede hacer de nuevo por un cambio de frecuencia 222 de una banda de baja frecuencia de la señal de audio de entrada 102 a frecuencias más altas. La banda de baja frecuencia de la señal de audio de entrada 102 se puede cambiar por una frecuencia constante más la frecuencia de desplazamiento individual 232 de cada señal de alta frecuencia de extensión de ancho de banda 112. La frecuencia constante puede ser igual a la frecuencia de cruce del codificador del núcleo u otra frecuencia específica.
[0056] Un parámetro de comparación para cada señal de alta frecuencia de extensión de ancho de banda generada 112 se puede calcular a continuación y el parámetro de comparación que cumple el criterio predefinido puede ser determinado 240 por el comparador 120.
[0057] El parámetro de densidad de energía se puede determinar 250 como se describe anteriormente.
[0058] Los conceptos mostrados en las figuras 2 y 3 también se pueden combinar.
[0059] La comparación de la señal de audio de entrada 102 y la señal de alta frecuencia de extensión de ancho de banda generada 112 se puede hacer por una correlación cruzada de ambas señales. En este caso, un parámetro de comparación puede ser, por ejemplo, el resultado de una correlación cruzada para una frecuencia de desplazamiento específica entre la señal de audio de entrada 102 y una señal de alta frecuencia de extensión de ancho de banda generada 112.
[0060] La indicación de parámetro de la señal de salida 132 puede ser la frecuencia de desplazamiento en sí misma, una frecuencia de desplazamiento cuantificada u otra cantidad basada en la frecuencia de desplazamiento.
[0061] Mediante la transmisión o el almacenamiento solamente de la indicación del parámetro en lugar de la banda de alta frecuencia de la señal de audio de entrada 102, se puede reducir la proporción de bits para transmisión o almacenamiento. Al escoger el parámetro en base a la frecuencia de desplazamiento correspondiente a un parámetro de comparación que cumple un criterio predefinido, esto puede producir una mejor calidad de audio que la decodificación solamente de la señal de audio limitada en banda o de banda limitada.
[0062] Un criterio predefinido puede ser para determinar un parámetro de comparación de la pluralidad de parámetros de comparación que indican, por ejemplo, una señal de alta frecuencia de extensión de ancho de banda 112 con una frecuencia de desplazamiento correspondientes que coincide con la señal de audio de entrada 102 mejor que el 70 % de las señales de alta frecuencia de extensión de ancho de banda 112 con otras frecuencias de desplazamiento, indicando una señal de alta frecuencia de extensión de ancho de banda 112 con una frecuencia de desplazamiento correspondiente que es una de las tres mejores coincidencias con la señal de audio de entrada 102 o que indica una señal de alta frecuencia de extensión de ancho de banda que coincide mejor 112 con una frecuencia de desplazamiento correspondiente. Esto se relaciona con el caso en el que se genera una pluralidad de señales de alta frecuencia de extensión de ancho de banda 112 con diferentes frecuencias de desplazamiento, también como el caso en el que solamente una señal de alta frecuencia de extensión de ancho de banda 112 es generada y cambiada por diferentes frecuencias de desplazamiento o una combinación de estos dos casos.
[0063] Un parámetro de comparación puede ser el resultado de una correlación cruzada u otra cantidad que indica cómo de bien una señal de alta frecuencia de extensión de ancho de banda 112 con una frecuencia de desplazamiento específica coincide con la señal de audio de entrada 102.
[0064] El codificador de extensión de ancho de banda 100 puede comprender un codificador de núcleo para codificar una banda de baja frecuencia de la señal de audio de entrada 102. Este codificador de núcleo puede comprender una frecuencia de cruce que puede corresponder a la frecuencia de corte superior de la banda de baja frecuencia codificada de la señal de audio de entrada 102. La frecuencia de cruce del codificador del núcleo puede ser constante o variable con el tiempo. La implementación de una frecuencia de cruce variable puede incrementar la complejidad del codificador de núcleo, pero puede también incrementar la flexibilidad para codificación.
[0065] El procedimiento mostrado en la figura 2 y/o figura 3 puede ser repetido para bandas de frecuencia más altas o parches. Por ejemplo, la banda de baja frecuencia de la señal de audio de entrada 102 comprende una frecuencia de corte superior de 4 kHz. Por consiguiente, si la banda de baja frecuencia de la señal de audio de entrada 102 es cambiada por la frecuencia de corte superior de la banda de baja frecuencia para generar la señal de alta frecuencia de extensión de ancho de banda 112, la señal de alta frecuencia de extensión de ancho de banda 112 comprende una banda de alta frecuencia con una frecuencia de corte inferior de 4 KHz y una frecuencia de corte superior de 8 kHz. El proceso se puede repetir al desplazar una banda de baja frecuencia de la señal de audio de entrada 102 por dos veces la frecuencia de corte superior de la banda de baja frecuencia. Así, la nueva señal de alta frecuencia de extensión de ancho de banda generada 112 comprende una banda de alta frecuencia con una frecuencia de corte inferior de 8 KHz y una frecuencia de corte superior de 12 kHz. Esto se puede repetir hasta que se alcanza una frecuencia más alta deseada. Alternativamente, esto se puede realizar también al generar una señal de alta frecuencia de extensión de ancho de banda con una pluralidad de bandas de alta frecuencia diferentes.
[0066] Como se ilustra en este ejemplo, el ancho de banda de la banda de baja frecuencia de la señal de audio de entrada y el ancho de banda de una banda de alta frecuencia de una señal de alta frecuencia de extensión de ancho de banda pueden ser los mismos. Alternativamente, la banda de baja frecuencia de la señal de audio de entrada puede ser esparcida y cambiada para generar la señal de alta frecuencia de extensión de ancho de banda.
[0067] La determinación de una señal de alta frecuencia de extensión de ancho de banda 112 con una frecuencia de desplazamiento 232 correspondiente al parámetro de comparación determinado puede dejar un espacio o separación entre la banda de baja frecuencia de la señal de audio de entrada 102 y la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda 112 dependiendo de la frecuencia de desplazamiento 242.
[0068] Este espacio o separación puede ser completado al generar porciones de frecuencia que se ajustan en este espacio que contienen por ejemplo ruido limitado en banda o de banda limitada. Alternativamente, el espacio se puede dejar vacío, puesto que la calidad de audio puede no verse afectada drásticamente.
[0069] La figura 4 muestra un diagrama de bloques de un codificador de extensión de ancho de banda 400 para proporcionar una señal de salida 132 mediante el uso de una señal de audio de entrada 102. El codificador de extensión de ancho de banda 400 comprende un generador de parche 110, un comparador 120, una interfaz de salida 130, un codificador de núcleo 410, un filtro de paso de banda 420 y una unidad de extracción de parámetros 430. El codificador del núcleo 410 está conectado a la interfaz de salida 130 y el generador de parche 110, el generador de parche 110 está conectado al comparador 120, el comparador 120 está conectado a la unidad de extracción de parámetros 430, la unidad de extracción de parámetros 430 está conectada a la interfaz de salida 130 y el filtro de paso de banda 420 está conectado al comparador 120.
[0070] El generador de parche 110 se puede realizar como un modulador para generar la señal de alta frecuencia de extensión de ancho de banda 112 en base a la señal de audio de entrada 102. El comparador 120 puede efectuar la comparación de la señal de audio de entrada 102 filtrada por el filtro de paso de banda 420 y la señal de alta frecuencia de extensión de ancho de banda generada 112 por una correlación cruzada de ellas. La determinación del parámetro de comparación que cumple el criterio predefinido puede denominarse también estimación de retraso.
[0071] La interfaz de salida 130 puede incluir también una funcionalidad de un formateador de corriente de bits y puede comprender un combinador para combinar una señal de baja frecuencia proporcionada por el codificador del núcleo 410 y una señal de parámetro 432 que comprende la indicación de parámetro basada en la frecuencia de desplazamiento proporcionada por la unidad de extracción de parámetros 430. Además, la interfaz de salida 130 puede comprender un codificador de entropía o un codificador diferencial para reducir la proporción de bits de la señal de salida 132. El combinador y el codificador de entropía o codificador diferencial puede ser parte de la interfaz de salida 130 como se muestra en este ejemplo o pueden ser unidades independientes.
[0072] La señal de audio 102 se puede dividir en una parte de baja frecuencia y una parte de alta frecuencia. Esto puede ser realizado por un filtro de paso bajo del codificador del núcleo 410 y el filtro de paso de banda 420. El filtro de paso bajo puede ser parte del codificador del núcleo 410 o un filtro de paso bajo independiente conectado al codificador del núcleo 410.
[0073] La parte de baja frecuencia es procesada por un codificador de núcleo 410 que puede ser un codificador de audio, por ejemplo, de conformidad con el estándar MPEG1/2 Capa 3 “MP3” o MPEG 4 AAC o un codificador de voz.
[0074] La parte de baja frecuencia puede ser cambiada por un valor fijo, por ejemplo, por medio de una modulación de banda lateral o una transformación de Fourier rápida (FFT) en el dominio de frecuencia, de tal manera que esté ubicada por encima de la región de baja frecuencia original en el área objetivo del parche correspondiente. Opcionalmente, la parte de baja frecuencia se puede obtener directamente de la señal de entrada 102. Esto puede ser realizado por un filtro de paso bajo independiente conectado al generador de parche 110.
[0075] A intervalos de tiempo regulares, la correlación cruzada entre espectros de amplitud de secciones de señal transformadas en ventana entre la parte de alta frecuencia original (de la señal de audio de entrada) y la parte de alta frecuencia obtenida (la señal de alta frecuencia de extensión de ancho de banda) se puede calcular. De esta manera, se puede determinar el retraso (la frecuencia de desplazamiento) para correlación máxima. Este retraso puede tener el significado de un factor de corrección en términos de la modulación de banda lateral individual original, es decir, la única modulación de banda lateral se puede corregir adicionalmente por el retraso para maximizar la correlación de cruce. En otras palabras, se puede determinar la frecuencia de desplazamiento, que se denomina también retraso, correspondiente al parámetro de comparación que cumple el criterio predefinido, en la que el parámetro de comparación corresponde a la correlación de cruce y el criterio predefinido puede ser encontrar la correlación máxima.
[0076] Además, se pueden determinar las proporciones de los valores absolutos de los espectros de amplitud. Mediante esto, puede ser derivado por cuyo factor la señal de alta frecuencia obtenida se debe atenuar o amplificar. En otras palabras, se puede determinar un parámetro de densidad de energía que indica la proporción de energía, las densidades de energía, los valores absolutos de los espectros de amplitud u otro valor relacionado con la proporción de densidad de energía entre la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda 112 y una banda de frecuencia correspondiente de la señal de audio de entrada original 102. Esto puede ser realizado por un comparador de densidad de energía que puede ser parte de la unidad de extracción de parámetros 430 como en el ejemplo mostrado o una unidad independiente. Para determinar el parámetro de densidad de energía, se puede usar por ejemplo, la señal de alta frecuencia de extensión de ancho de banda 112 que se generó al cambiar la banda de baja frecuencia de la señal de audio de entrada 102 por una frecuencia constante o la señal de alta frecuencia de extensión de ancho de banda 112 correspondiente al parámetro de comparación determinado u otra señal de alta frecuencia de extensión de ancho de banda generada 112. Una banda de frecuencia correspondiente en este caso significa, por ejemplo, una banda de frecuencia con el mismo intervalo de frecuencia. Por ejemplo, si la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda comprende frecuencias de 4 kHz a 8 kHz, entonces la banda de frecuencia correspondiente de la señal de audio de entrada comprende también el intervalo de 4 kHz a 8 kHz.
[0077] Los factores de corrección obtenidos (frecuencia de desplazamiento, parámetro de densidad de energía) correspondientes al retraso y correspondientes al valor absoluto de la amplitud pueden ser interpolados en el tiempo. En otras palabras, un parámetro determinado para una sección de señal en ventana (para un marco de tiempo) puede ser interpolado por cada paso de tiempo de la sección de señal.
[0078] Esta señal (señal de parámetro) de modulación (control) o una representación parametrizada de la misma se puede almacenar o transmitir a un decodificador. En otras palabras, la señal de parámetro 432 se puede combinar con la banda de baja frecuencia de la señal de audio de entrada 102 procesada por el codificador del núcleo 410 para obtener la señal de salida 132 que se puede almacenar o transmitir a un decodificador.
[0079] Adicionalmente, se pueden determinar parámetros adicionales para adaptar, por ejemplo, un nivel de ruido y/o la tonalidad. Esto se puede hacer por la unidad de extracción de parámetros 430. Los parámetros adicionales pueden ser agregados a la señal de parámetro 432.
[0080] El ejemplo mostrado en la figura 4 ilustra un cálculo del lado del codificador de una modulación variable en el tiempo. La modulación variable en el tiempo en este caso se relaciona con las señales de alta frecuencia de extensión de ancho de banda 112 con diferentes frecuencias de desplazamiento. La frecuencia de desplazamiento correspondiente al parámetro de comparación determinado que cumple el criterio predefinido puede variar con el tiempo.
[0081] La figura 5 muestra un diagrama de bloques de un decodificador de extensión de ancho de banda 500 para probar una señal de audio extendida de ancho de banda 532 basada en una señal de audio de entrada 502 y una señal de parámetro 504 según una realización de la invención. La señal de parámetro 504 comprende una indicación de una frecuencia de desplazamiento y una indicación de un parámetro de densidad de energía. El decodificador de extensión de ancho de banda 500 comprende un generador de parche 510, un combinador 520 y una interfaz de salida 530. El generador de parche 510 está conectado al combinador 520 y el combinador 520 está conectado a la interfaz de salida 530.
[0082] El generador de parche 510 genera una señal de alta frecuencia de extensión de ancho de banda 512 que comprende una banda de alta frecuencia basada en la señal de audio de entrada 502. La banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda 512 se genera realizando un cambio de frecuencia de una banda de frecuencia de la señal de audio de entrada 502 a frecuencias más altas, en la que el cambio de frecuencia está basado en la frecuencia de desplazamiento.
[0083] Además, el generador de parche 510 amplifica o atenúa la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda 512 por un factor igual al valor del parámetro de densidad de energía o igual al valor recíproco del parámetro de densidad de energía.
[0084] El combinador 520 combina la señal de alta frecuencia de extensión de ancho de banda 512 y la señal de audio de entrada 502 para obtener la señal de audio extendida de ancho de banda 532 y la interfaz de salida 530 proporciona la señal de audio extendida de ancho de banda 532.
[0085] La generación de la señal de alta frecuencia de extensión de ancho de banda 112 basada en la frecuencia de desplazamiento puede permitir una continuación mejorada del intervalo de frecuencia de la señal de audio de entrada en la región de alta frecuencia, por ejemplo, si la frecuencia de desplazamiento se determina como se describe anteriormente. Esto puede incrementar la calidad de audio de la señal de audio extendida de ancho de banda 532.
[0086] Adicionalmente, la densidad de energía de la continuación de alta frecuencia de la señal de audio de entrada 502 se puede hacer de una manera muy eficiente al amplificar o atenuar la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda 512 por el parámetro de densidad de energía. De esta manera, una normalización puede no ser necesaria.
[0087] El generador de parche 510 puede generar la señal de alta frecuencia de extensión de ancho de banda 512 al cambiar la banda de frecuencia de la señal de audio de entrada 512 por una frecuencia constante más la frecuencia de desplazamiento.
[0088] El generador de parche 510 puede generar la señal de alta frecuencia de extensión de ancho de banda 512 en el dominio de tiempo o en el dominio de frecuencia. En el dominio de tiempo, el generador de parche 510 puede generar la señal de alta frecuencia de extensión de ancho de banda 512 basada en una sola modulación de banda lateral.
[0089] Adicionalmente, la interfaz de salida puede amplificar la señal de salida antes de proporcionarla.
[0090] La figura 6 muestra un diagrama de bloques de un decodificador de extensión de ancho de banda 600 para proporcionar una señal de audio extendida de ancho de banda 532 basada en una señal de audio de entrada 502 y una señal de parámetro 504 según un ejemplo para ilustrar la invención. El decodificador de extensión de ancho de banda 600 comprende un generador de parche 510, un combinador 520, una interfaz de salida 530, un decodificador de núcleo 610 y una unidad de extracción de parámetros 620. El decodificador de núcleo 610 está conectado al generador de parche 510 y el combinador 520, la unidad de extracción de parámetros 620 está conectada al generador de parche 510 y a la interfaz de salida 530, el generador de parche 510 está conectado al combinador 520 y el combinador 520 está conectado a la interfaz de salida 530.
[0091] El decodificador de núcleo 610 puede decodificar la corriente de bits recibida 602 y proporciona la señal de audio de entrada 502 al generador de parche 510 y el combinador 520. La señal de audio de entrada 502 puede comprender una frecuencia de corte superior igual a una frecuencia de cruce del decodificador de núcleo 610. Esta frecuencia de cruce puede ser constante o variable en el tiempo. Variable en el tiempo significa, por ejemplo, variable para intervalos de tiempo diferentes o marcos de tiempo diferentes, pero constante para un intervalo de tiempo o marco de tiempo.
[0092] La unidad de extracción de parámetros 620 puede separar la señal de parámetro 504 de la corriente de bits recibida 602 y proporcionarla al generador de parche 510. Adicionalmente, la señal de parámetro 504 o un parámetro de ruido y/o tonalidad extraído se puede proporcionar a la interfaz de salida 530.
[0093] El generador de parche 510 puede modular la señal de audio de entrada 502 en base a la frecuencia de desplazamiento para obtener la señal de alta frecuencia de extensión de ancho de banda 512 y puede amplificar o atenuar la señal de alta frecuencia de extensión de ancho de banda 512 en base al parámetro de densidad de energía comprendida en la señal de parámetro 504. Esta señal de alta frecuencia de extensión de ancho de banda 512 se proporciona al combinador 530. En otras palabras, el generador de parche 510 puede modular la señal de audio de entrada 502 basado en la frecuencia de desplazamiento y el parámetro de densidad de energía para obtener una señal de alta frecuencia. Esto se puede hacer, por ejemplo, en el dominio de tiempo por una sola modulación de banda lateral 634 con una interpolación y/o filtración 632 para cada paso de tiempo.
[0094] El combinador 520 combina la señal de audio de entrada 502 y la señal de alta frecuencia de extensión de ancho de banda generada 512 para obtener la señal de audio de extensión de ancho de banda 532.
[0095] La interfaz de salida 530 proporciona la señal de audio extendida de ancho de banda 532 y puede comprender adicionalmente una unidad de corrección. La unidad de corrección puede llevar a cabo una corrección de tonalidad y/o corrección de ruido basada en los parámetros proporcionados por la unidad de extracción de parámetros 620. La unidad de corrección puede ser parte de la interfaz de salida 530 como se muestra en la figura 6 o puede ser una unidad independiente. La unidad de corrección puede estar dispuesta también entre el generador de parche 510 y el combinador 520. De esta manera, la unidad de corrección puede corregir solamente la tonalidad y/o ruido de la señal de alta frecuencia de extensión de ancho de banda generada 512. Una corrección de tonalidad y ruido de la señal de audio de entrada 512 no es necesaria puesto que la señal de audio de entrada 502 corresponde a la señal de audio original.
[0096] Resumido en algunas palabras, el decodificador de extensión de ancho de banda 600 puede sintetizar y formar espectralmente una señal de alta frecuencia de una señal de salida del decodificador de audio o decodificador de núcleo (la señal de audio de entrada) por medio de la función de modulación transmitida. Función de modulación transmitida, por ejemplo, significa una función de modulación basada en la frecuencia de desplazamiento y en el parámetro de densidad de energía. A continuación, la señal de alta frecuencia y la señal de baja frecuencia se pueden combinar y se pueden aplicar parámetros adicionales para adaptar el nivel de ruido y tonalidad.
[0097] La figura 7 muestra un diagrama de flujo de un procedimiento 700 para proporcionar una señal de salida basada en una señal de audio de entrada. El procedimiento comprende la generación 710 de al menos una señal de alta frecuencia de extensión de ancho de banda, el cálculo 720 de una pluralidad de parámetros de comparación, la determinación 730 de un parámetro de comparación a partir de la pluralidad de parámetros de comparación y el suministro 740 de la señal de salida para transmisión o almacenamiento.
[0098] Una señal de alta frecuencia de extensión de ancho de banda generada comprende una banda de alta frecuencia. La banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda se basa en una banda de baja frecuencia de la señal de audio de entrada. Diferentes señales de alta frecuencia de extensión de ancho de banda comprenden diferentes frecuencias dentro de sus bandas de alta frecuencia, si se generan diferentes señales de alta frecuencia de extensión de ancho de banda.
[0099] Un parámetro de comparación se calcula en base a una comparación de la señal de audio de entrada y una señal de alta frecuencia de extensión de ancho de banda generada. Cada parámetro de comparación de la pluralidad de parámetros de comparación se calcula en base a una frecuencia de desplazamiento diferente entre la señal de audio de entrada y una señal de alta frecuencia de extensión de ancho de banda generada.
[0100] El parámetro de comparación determinado cumple un criterio predefinido.
[0101] La señal de salida comprende una indicación de parámetro basada en una frecuencia de desplazamiento correspondiente al parámetro de comparación determinado.
[0102] La figura 8 muestra un diagrama de flujo de un procedimiento 800 para proporcionar una señal de audio extendida de ancho de banda basada en una señal de audio de entrada y una señal de parámetro según una realización de la invención. La señal de parámetro comprende una indicación de una frecuencia de desplazamiento y una indicación de un parámetro de densidad de energía. El procedimiento comprende la generación 810 de una señal de alta frecuencia de extensión de ancho de banda, la amplificación 820 o atenuación de la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda, la combinación 830 de la señal de alta frecuencia de extensión de ancho de banda y la señal de audio de entrada para obtener la señal de audio extendida de ancho de banda y el suministro 840 de la señal de audio extendida de ancho de banda.
[0103] La señal de alta frecuencia de extensión de ancho de banda comprende una banda de alta frecuencia. La banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda se genera 810 basada en un cambio de frecuencia de una banda de frecuencia de la señal de audio de entrada. El desplazamiento de frecuencia está basado en la frecuencia de desplazamiento.
[0104] La banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda se amplifica 820 o atenúa por un factor igual al valor del parámetro de densidad de energía o igual al valor recíproco del parámetro de densidad de energía. La figura 9 muestra un diagrama de flujo de un procedimiento 900 para proporcionar una señal de salida basada en una señal de audio de entrada. Se ilustra una posibilidad para la secuencia del algoritmo en el codificador. Esto puede ser también formal matemáticamente descrito en lo sucesivo. Las señales en tiempo real se pueden indicar por letras minúsculas latinas, las señales transformadas de Hilbert con griego correspondiente y las señales transformadas de Fourier con letras mayúsculas latinas o alternativamente griegas.
[0105] La señal de entrada puede ser llamada f(n), la señal de salida o(n). fHFk = f * filtBFk; 1 < k < kmax indica la transformada de Fourier, j indica el número imaginario y la transformación de Hilbert H(.) se define como de costumbre:
Figure imgf000012_0001
con
f ( » : = n m )
xOver puede ser la frecuencia de corte del codificador del núcleo, neN puede indicar un tiempo. kmax>keN puede indicar la k-ésima extensión o parche. ak describe un borde de banda de bandas perceptuales relacionadas con xOver, por ejemplo, según la escala de Bark o la escala de ERB. Alternativamente, la ak se puede incrementar por ejemplo linealmente, es decir ak+1-ak= constante. La transformación de Hilbert se puede calcular también computacionalmente eficiente mediante la filtración de la señal con un filtro de paso bajo modulado.
[0106] En primer lugar, se pueden generar una función de modulador analítico 902 con las frecuencias de a . 1
Y* Fs
modulación a ky los incrementos de fase resultantes con el incremento de tiempo (Fs indica la velocidad de toma de muestras). Esto se puede describir de forma matemática en las siguientes fórmulas:
Figure imgf000012_0002
[0107] La suma se puede reemplazar únicamente por n, si yk es independiente de n.
[0108] La señal de audio de entrada 102 o señal de audio real f se puede filtrar por paso de banda a un ancho de banda de ak+1-ak que se puede expresar por:
Figure imgf000012_0003
[0109] En este caso, cada parche comprenderá el mismo ancho de banda.
[0110] Alternativamente, la señal de audio de entrada f 102 se puede filtrar por paso de banda a anchos de banda de ak con anchos de banda diferentes que se pueden describir por:
Figure imgf000013_0001
[0111] A continuación, se pueden determinar las áreas de la señal original que deben ser reconstruidas por este procedimiento. Estas regiones limitadas en banda se pueden indicar como:
ft*. =f*fi¡tB^ < k < k l
y están ubicadas en los intervalos (ak, ak+1).
[0112] La modulación de la señal de entrada de filtro de paso bajo 904 se puede realizar en el dominio de frecuencia o el dominio de tiempo.
[0113] En el dominio de frecuencia, las señales de entrada se pueden aplicar en ventana primero, lo que se puede describir por:
Figure imgf000013_0002
en la que NFFT es el número de bins de transformación de Fourier rápida (por ejemplo 512 bins), ês el número de ventana y win(.) es una función de ventana. Las ventanas o marcos de tiempo pueden comprender una superposición temporal. Por ejemplo, la fórmula dada anteriormente describe una superposición temporal de la mitad de una ventana. Así, NeN bloques de la señal original y con la misma conectada con tantos espectros de amplitud F^(w) con ^ ^ N como valores absolutos de la transformada de Fourier
Figure imgf000013_0003
describe el índice del borde de banda k en la transformada de Fourier.
[0114] A continuación, la señal se modula en el dominio de frecuencia mediante el desplazamiento de los bins de FFT (bins de transformación de Fourier rápida). La transformación de Hilbert implícita no es necesaria aquí, pero hace una descripción formal igual de las siguientes etapas posibles:
Figure imgf000013_0004
para u> > 0 y
Figure imgf000013_0005
[0115] En el dominio de tiempo, se realiza primero una transformación de Hilbert 906 de la señal de audio de entrada f 102 para generar una señal analítica 908.
Figure imgf000013_0006
y
Figure imgf000013_0007
a continuación, la señal analítica $tfk, es modulada por banda lateral individual 710 con un modulador p(n) 902:
Figure imgf000013_0008
o
[0116] De esta manera, se puede generar una señal de alta frecuencia de extensión de ancho de banda que se denomina también señal modulada 910.
[0117] A continuación, se efectúan una formación de ventana (también posible con superposición) de la señal de entrada 912 y de la señal extendida 914 y una transformación de Fourier 916:
Figure imgf000014_0004
en la que una NFFT es una vez más el número de bins de transformación de Fourier rápida (por ejemplo 256, 512, 1024 bins u otro número entre 24 y 232), ^ es el número de ventana y win(.) es una función de ventana. Así, NeN bloques 914 se crean de la señal original y en relación con tantos espectros de amplitud O^(w), ^ (w ) con ^^ N como valores absolutos de la transformada de Fourier 916.
Figure imgf000014_0001
pueden describir el índice del borde de banda k en la transformada de Fourier.
[0118] El proceso en el dominio de tiempo se muestra en la figura 9.
[0119] La siguiente etapa es el cálculo 720 de la correlación cruzada R^k (el parámetro de comparación puede ser igual al resultado de la correlación cruzada) de los espectros de amplitud parciales de la señal original y la señal extendida lo que se puede expresar matemáticamente por:
Figure imgf000014_0005
con
Figure imgf000014_0002
8 puede indicar el retraso máximo (la frecuencia de desplazamiento máxima) para el cual se calcula una correlación cruzada. Si la correlación cruzada se debe calcular con una predisposición, es decir, retrasos pequeños y así se deberían preferir grandes superposiciones, así que se debe seleccionar p=0. Por el contrario, si se debe compensar que menos bins de FFT (bins de transformación de Fourier rápida) están superpuestos para retrasos más grandes que pequeños, se debe escoger p=1. En general, se puede escoger 0<pxP de forma arbitraria. Alternativa o adicionalmente, se puede escoger ' ' ’ ~ para seleccionar una región de la correlación cruzada que es un poco más grande que un parche. Con esto la región que es considerada por la correlación cruzada puede ser
extendida por ^ en ambos extremos espectrales del parche particular.
[0120] En base a estos resultados de la correlación cruzada, un máximo de la correlación cruzada 730
Figure imgf000014_0003
y el retraso d^k de la correlación máxima
se pueden determinar.
[0121] Adicionalmente, las proporciones 920 de las energías o potencias en los parches se pueden determinar por los espectros de densidad de energía:
Z k H 1
il S ««>•, h H *
[0122] Si no se puede determinar ningún máximo claro 924, el retraso se vuelve a poner a 0 (como se muestra en el número de referencia 922). De otra manera el retraso estimado 918 puede ser el retraso correspondiente a la correlación cruzada máxima. Para esto, se puede determinar un criterio de umbral, d^k > T con T que se va a seleccionar. Alternativamente, se puede observar la curvatura o una planura espectral (SFN) de la correlación cruzada R^ k, por ejemplo:
Figure imgf000015_0003
con
Figure imgf000015_0001
[0123] Los retrasos d^k y los parámetros de densidad de energía ^,k se pueden interpolar 926 para obtener un valor para cada paso de tiempo:
gk (n) := interp(cí t ); (n) = ¡nterp(cO *)
[0124] A continuación, se puede generar la función de modulación global modulada en amplitud modificada y cambiada en frecuencia:
2 i r j ^ ( n (m )+ ^(m ))
& (n ) = gk(n)e
• 'rrw
Figure imgf000015_0002
M(n) = ^ c k{n)e
[0125] Esta función de modulación global o los parámetros de la función de modulación global se pueden proporcionar 740 con la señal de salida para almacenamiento o transmisión.
[0126] Adicionalmente, se pueden determinar parámetros adicionales para corrección de fluido y/o corrección de tonalidad.
[0127] La modulación en el decodificador se puede realizar por:
<P(n}=<piF(n) ¡Un)
y además de las k modulaciones parciales (si hay más de un parche). Para esta función de modulación global jk(n) o |j(n) o los parámetros Zk(n) y Ak(n) o c^ ,k y d^ ,k de la función de modulación global se pueden codificar apropiadamente, por ejemplo mediante cuantificación. Opcionalmente, la velocidad de toma de muestras se puede reducir y se puede introducir una histéresis.
[0128] El cálculo de los retrasos se puede omitir, si no hay ninguna señal tonal, por ejemplo, en silencio, transitorios o ruido. En estos casos, el retraso se puede ajustar a cero.
[0129] La figura 10 muestra en más detalle un ejemplo 1000 para determinar el retraso.
[0130] Para un marco de tiempo o ventana 5=i 1010 el retraso v se ajusta a menos A como valor de partida. A continuación, se calcula la correlación cruzada R^k(v) 720. Si v es más pequeño que A 1030, entonces v se incrementa 1032 y el siguiente parámetro de comparación en términos de la correlación cruzada se calcula 720. Si v es mayor o igual que A 1030, entonces se puede determinar el retraso correspondiente a la correlación cruzada calculada máxima 730. Si el máximo es claramente identificable 924 el retraso determinado se usa como parámetro d^k 918. De otra manera, el retraso se ajusta a 0 y se usa como parámetro d ^=0 922.
[0131] A continuación, todo el proceso se repite 1040 para el siguiente marco de tiempo 5=5+1 1050. Los retrasos determinados se pueden interpolar 926 para obtener un parámetro para cada paso de tiempo N.
[0132] El cálculo de la pluralidad de parámetros de comparación, por ejemplo, el resultado de la correlación cruzada se puede hacer también en paralelo si se usan una pluralidad de comparadores. También, el procesamiento de diferentes marcos de tiempo se puede hacer en paralelo, si los elementos físicos necesarios están disponibles varias veces. El bucle para calcular la correlación cruzada puede iniciar también en A y puede disminuirse cada bucle hasta v < A.
[0133] La figura 11 muestra una ilustración esquemática de la interpolación 926 de las frecuencias de desplazamiento de diferentes marcos de tiempo, intervalos de tiempo o ventanas. La figura 11a muestra la interpolación 1100, si los marcos de tiempo no se traslapan o superponen. Se determina un retraso d^ k para todo un marco de tiempo 1110. La manera más fácil para interpolar un parámetro para cada paso de tiempo 1120 se puede realizar al ajustar los parámetros de todos los pasos de tiempo 1120 de un marco de tiempo 1110 igual al retraso correspondiente d^ k. En los bordes de un marco de tiempo, se puede seleccionar el retraso del marco de tiempo anterior o siguiente. Por ejemplo, los parámetros Ak(n) a Ak(n+3) son iguales a d^k y los parámetros Ak(n+4) a Ak(n+7) son iguales ad$+1,k.
[0134] Alternativamente, los retrasos de los marcos de tiempo 1110 se pueden interpolar linealmente entre los marcos de tiempo. Por ejemplo:
Figure imgf000016_0001
[0135] De manera conveniente, la figura 11B muestra un ejemplo 1150 para marcos de tiempo superpuestos 1110. En este caso, un paso de tiempo 1120 está asociado a más de un marco de tiempo 1110. Por consiguiente, más de un retraso determinado se puede asociar a un paso de tiempo 1120. Así, los retrasos determinados se pueden interpolar 926 para obtener un parámetro para cada paso de tiempo 1120. Por ejemplo, los retrasos determinados correspondientes a un paso de tiempo 1120 se pueden interpolar linealmente. Por ejemplo, una interpolación posible puede ser:
Figure imgf000017_0001
X l ( „ i ) = 4 ü l í i
Xk(n 2 ) = d u
l k(n 3 ) = d ^ d w
[0136] Alternativamente, la interpolación también se puede hacer, por ejemplo, mediante una filtración mediana.
[0137] La interpolación se puede realizar por medio de interpolación. Los medios de interpolación pueden ser parte de la unidad de extracción de parámetros o la interfaz de salida o pueden ser una unidad separada.
[0138] En el lado del decodificador, la extensión de ancho de banda se puede hacer mediante:
'//(n).=<pu.{n) ■ fi{n)
[0139] Después de la decodificación de
Figure imgf000017_0002
y 9 LF(N) como salida del codificador del núcleo.
Adicionalmente, se puede adaptar con los parámetros previamente de los parámetros obtenidos de la señal original para el nivel de tonalidad y/o ruido.
[0140] El cálculo de la función de modulación global en el decodificador se hace según una o ambas de las siguientes fórmulas:
Figure imgf000017_0003
noise(n)
y
y/(n) = <plf (n) • //(n) noise(n)
[0141] La parte imaginaria de la señal se puede ignorar:
o{n) = ReG y(n))
[0142] A continuación, como se menciona anteriormente, puede seguir una corrección de tonalidad, por ejemplo, mediante filtración inversa.
[0143] La figura 12 muestra un diagrama de bloques de un decodificador de extensión de ancho de banda 1200 para proporcionar una señal de audio extendida en ancho de banda 532 basada en una señal de audio de entrada 502. El decodificador de extensión de ancho de banda 1200 comprende un generador de parche 1210, un comparador 1220, un combinador 1230 y una interfaz de salida 1240. El generador de parche 1210 está conectado al comparador 1220, el comparador 1220 está conectado al combinador 1230 y el combinador 1230 está conectado a la interfaz de salida 1240.
[0144] El generador de parche 1210 genera al menos una señal de alta frecuencia de extensión de ancho de banda 1212 que comprende una banda de alta frecuencia basada en la señal de audio de entrada 502, en la que una frecuencia de corte inferior de la banda de alta frecuencia de una señal de alta frecuencia de extensión de ancho de banda 1212 es más baja que una frecuencia de corte superior de la señal de audio de entrada 502. Diferentes señales de alta frecuencia de extensión de ancho de banda 1212 comprenden diferentes frecuencias dentro de sus bandas de alta frecuencia, si se generan diferentes señales de alta frecuencia de extensión de ancho de banda 1212.
[0145] El comparador 1220 calcula una pluralidad de parámetros de comparación. Un parámetro de comparación se calcula en base a una comparación de la señal de audio de entrada 502 y una señal de alta frecuencia de extensión de ancho de banda generada 1212. Cada parámetro de comparación de la pluralidad de parámetros de comparación se calcula en base a una frecuencia de desplazamiento diferente entre la señal de audio de entrada 502 y una señal de alta frecuencia de extensión de ancho de banda generada 1212. Además, el comparador determina un parámetro de comparación de la pluralidad de parámetros de comparación, en el que el parámetro de comparación determinado cumple un criterio predefinido.
[0146] Un combinador 1230 combina la señal de audio de entrada 502 y la señal de alta frecuencia de extensión de ancho de banda 1212 para obtener la señal de audio extendida en ancho de banda 532, en la que la señal de alta frecuencia de extensión de ancho de banda 1212 está basada en una frecuencia de desplazamiento correspondiente al parámetro de comparación determinado.
[0147] La interfaz de salida 1240 proporciona la señal de audio extendida en ancho de banda 532.
[0148] En comparación con el decodificador mostrado en la figura 5 el decodificador descrito 1200 determina la frecuencia de desplazamiento por sí mismo. Por consiguiente, no es necesario recibir este parámetro con la señal de audio de entrada 502. De esta manera, la proporción de bits para transmisión o almacenamiento de señales de audio se puede reducir adicionalmente.
[0149] Como se describe para la figura 1, el generador de parche 1210 puede generar una pluralidad de señales de alta frecuencia de extensión de ancho de banda con diferentes frecuencias de desplazamiento o solamente una señal de alta frecuencia de extensión de ancho de banda que es desplazada por diferentes frecuencias de desplazamiento. De nuevo, también se puede usar una combinación de estas dos posibilidades.
[0150] La figura 13 muestra un diagrama de flujo de un procedimiento 1300 para proporcionar una señal de audio extendida de ancho de banda. El procedimiento 1300 comprende la generación 1310 de al menos una señal de alta frecuencia de extensión de ancho de banda, el cálculo 1320 de una pluralidad de parámetros de comparación, la determinación 1330 de un parámetro de comparación de la pluralidad de parámetros de comparación, la combinación 1340 de la señal de audio de entrada y una señal de alta frecuencia de extensión de ancho de banda y el suministro 1350 de la señal de audio extendida de ancho de banda.
[0151] Una señal de alta frecuencia extendida de ancho de banda comprende una banda de alta frecuencia basada en la señal de audio de entrada. Una frecuencia de corte inferior de la banda de alta frecuencia de una señal de alta frecuencia extendida de ancho de banda es más baja que una frecuencia de corte superior de la señal de audio de entrada. Diferentes señales de alta frecuencia de extensión de ancho de banda comprenden diferentes frecuencias dentro de sus bandas de alta frecuencia, si se generan diferentes señales de alta frecuencia de extensión de ancho de banda.
[0152] Se calcula un parámetro de comparación en base a la comparación de la señal de audio de entrada y la señal de alta frecuencia de extensión de ancho de banda generada. Cada parámetro de comparación de la pluralidad de parámetros de comparación se calcula en base a una frecuencia de desplazamiento diferente entre la señal de audio de entrada y la señal de alta frecuencia de extensión de ancho de banda generada.
[0153] El parámetro de comparación determinado cumple un criterio predefinido.
[0154] La señal de alta frecuencia de extensión de ancho de banda que se combina con la señal de audio de entrada para obtener la señal de audio de ancho de banda se basa en una frecuencia de desplazamiento correspondiente al parámetro de comparación determinado.
[0155] La figura 14 muestra un diagrama de flujo de un procedimiento 1400 para proporcionar una señal de audio extendida en ancho de banda.
[0156] Después de recibir 1402 una corriente de bits que comprende la señal de audio de entrada, un decodificador de núcleo decodifica 1410 la señal de audio de entrada. En base a la señal de audio de entrada, se genera una señal de alta frecuencia de extensión de ancho de banda 1310 y la pluralidad de parámetros de comparación en términos de una correlación cruzada entre la señal de audio de entrada y una señal de alta frecuencia de extensión de ancho de banda generada con diferentes frecuencias de desplazamiento se calculan 1320. A continuación, se determina el parámetro de comparación que cumple el criterio predefinido 1330 que se denomina también estimación de retraso.
[0157] En base a la frecuencia de desplazamiento correspondiente al parámetro de comparación determinado, un modulador puede modular 1420 la señal de audio de entrada. Adicionalmente, se puede extraer un parámetro 1430 de la corriente de bits recibida 1402 para adaptar, por ejemplo, la densidad de energía de la señal modulada. La señal modulada se combina a continuación 1340 con la señal de audio de entrada. Adicionalmente, la tonalidad y el ruido de la señal de audio extendida de ancho de banda se pueden corregir 1440. Esto también se puede hacer antes de la combinación con la señal de audio de entrada. A continuación, los datos de audio en términos de la señal de audio extendida de ancho de banda se proporcionan 1350, por ejemplo, para reproducción acústica.
[0158] De esta manera, el cálculo de la modulación variable en el tiempo se hace en el lado del decodificador.
[0159] Alternativamente al modulador que modula 1420 la señal de audio de entrada para generar un parche, por ejemplo, se puede utilizar la señal de alta frecuencia de extensión de ancho de banda ya generada previamente o el generador de parche puede generar una señal de alta frecuencia de extensión de ancho de banda (parche) en base a la frecuencia de desplazamiento correspondiente al parámetro de comparación determinado.
[0160] En otras palabras, si la velocidad de datos baja es más importante que una complejidad baja del lado del decodificador, la determinación de la modulación de frecuencia de los moduladores también se puede hacer en el lado del decodificador. Para esto, se puede ejecutar el algoritmo mostrado en la figura 9 en el decodificador con solo algunos cambios. Puesto que la señal original no está disponible para el cálculo de la correlación cruzada en el decodificador, las correlaciones se pueden calcular entre la señal original (señal de audio de entrada) y una señal original cambiada (señal de audio de entrada) dentro de un intervalo de superposición. Por ejemplo, la señal se puede cambiar entre cero y ak, por ejemplo, ak dividido por 2, ak dividido por 3 o ak dividido por 4. ak indica otra vez el k-ésimo borde de banda, por ejemplo, a1 indica la frecuencia de cruce del codificador de núcleo.
[0161] Por ejemplo, esto puede suceder de la misma manera en el codificador como en el decodificador. En el codificador, los parámetros para formación espectral, corrección de ruido y/o corrección de tonalidad se pueden extraer y transmitir al decodificador.
[0162] De manera conveniente, la figura 15 muestra un diagrama de bloques de un codificador de extensión de ancho de banda 1500 para proporcionar una señal de salida utilizando una señal de audio de entrada. El codificador 1500 corresponde al codificador mostrado en la figura 4. Sin embargo, el codificador 1500 no proporciona la señal de salida 132 con una indicación de parámetro basada en la frecuencia de desplazamiento misma. Puede determinar solamente un parámetro de densidad de energía y parámetros opcionales para corrección de tonalidad y corrección de ruido e incluye una indicación de parámetro de estos parámetros a la señal de salida 132. Sin embargo, el parámetro de densidad de energía (y también los otros parámetros, si se determinan) se determina en base a la frecuencia de desplazamiento correspondiente al parámetro de comparación determinado.
[0163] Por ejemplo, el parámetro de densidad de energía puede indicar la proporción entre la señal de audio de entrada 102 y la señal de alta frecuencia de extensión de ancho de banda con una frecuencia de desplazamiento correspondiente al parámetro de comparación determinado. Por consiguiente, la indicación de parámetro que está relacionada con el parámetro de densidad de energía y opcional a los parámetros para corrección de tonalidad y/o corrección de ruido se basa en la frecuencia de desplazamiento correspondiente al parámetro de comparación determinado.
[0164] Una diferencia adicional entre el codificador 1500 y el codificador mostrado en la figura 4 es que el generador de parche 110 genera una señal de alta frecuencia de extensión de ancho de banda de la misma manera en que el generador de parche del decodificador 1400 lo hace. De esta manera, el codificador 1500 y el decodificador pueden obtener las mismas frecuencias de desplazamiento y por consiguiente, los parámetros extraídos por el codificador 1500 son válidos para las interconexiones generadas por el decodificador.
[0165] Algunas realizaciones preferidas según la invención se refieren a un dispositivo y un procedimiento para extensión de ancho de banda de señales de audio en el dominio de tiempo mediante el uso de moduladores variables de tiempo. En otras palabras, un parche se puede generar con frecuencia de corte variable, por ejemplo, para cada paso de tiempo, cada marco de tiempo, una parte de un marco de tiempo o para grupos de marcos de tiempo.
[0166] El procedimiento descrito para extensión del ancho de banda de una señal de audio se puede utilizar en el lado del codificador y el lado del decodificador así como solo en el lado del decodificador. Por el contrario, para procedimientos conocidos, el nuevo procedimiento descrito puede llevar a cabo una extensión denominada armónica del ancho de banda sin la necesidad de información exacta sobre la frecuencia fundamental de la señal de audio. Además, en contraste con las extensiones de ancho de banda denominadas armónicas como, por ejemplo, mostradas por la solicitud de patente provisional de EE.UU. "F.Nagel, S. Disch: "Apparatus and method of harmonic bandwidth extension in audio signals"" con el número de solicitud US 61/025129 que son realizadas por medio de vocodificadores de fase, el espectro puede no ser esparcido y por consiguiente, también la densidad puede no ser cambiada. Para asegurar la armonía, se aprovechan correlaciones entre la banda extendida y la banda base. Esta correlación se puede calcular en el codificador, así como en el decodificador, dependiendo de la demanda para cómputo y complejidad de memoria y velocidad de datos.
[0167] Por ejemplo, la extensión de ancho de banda en sí misma se puede hacer mediante el uso de una modulación de amplitud (AM) y un cambio de frecuencia por medio de una sola modulación de banda lateral (SSB) con una pluralidad de portadores variables en el tiempo lentos, adaptables únicos. Un post-procesamiento siguiente según parámetros adicionales puede intentar aproximar la envolvente espectral y el nivel de ruido, así como otras propiedades de las señales originales.
[0168] El nuevo procedimiento para transformación de señales puede evitar los problemas que aparecen debido a una operación de copia simple o reflejo por una continuación correcta armónica del espectro por medio de una frecuencia de corte variable en el tiempo XOver entre la región de baja frecuencia (LF) y la región de alta frecuencia (HF) así como entre las siguientes regiones de alta frecuencia, los llamados parches o interconexiones. Estas frecuencias de corte se escogen de tal manera que los parches generados reparan una trama armónica existente ya que era existente en el original tan bueno como sea posible.
[0169] La figura 16 muestra un modulador con 3 amplitudes variables en el tiempo y frecuencias de corte mediante las cuales se pueden generar 3 parches mediante la modulación individual de banda lateral de las bandas base. La figura 16a muestra un diagrama 1600a del espectro de la señal extendida en ancho de banda mediante el uso de frecuencias de corte variables en el tiempo 1610. La figura 16b ilustra un diagrama 1600b del espectro de la señal de audio de los tres tonos. En comparación con el espectrograma ilustrado en la figura 18b las líneas 1620 son significativamente menos discontinuas.
[0170] La figura 17 ilustra el efecto por medio de un diagrama 1700 del período. El espectro de densidad de energía de los terceros tonos de la señal de audio se muestra como original 1710, con una frecuencia de corte constante 1720 y con una frecuencia de corte variable 1730. En contraste con el uso de la frecuencia de corte constante 1720, la estructura armónica permanece mediante el uso de la frecuencia de corte variable 1730.
[0171] Mediante la continuación armónica del espectro, se pueden evitar problemas en los puntos de transición entre ambos, la banda base (codificador del núcleo) y la banda extendida, y entre parches subsecuentes. Sin una estimación de F0 como requisito para la función del sistema, señales arbitrarias pueden ser armónicas continuadas, sin la existencia de artefactos audibles, ni por incumplir la armonía ni por eventos de sonido transitorios.
[0172] Algunas realizaciones según la invención se refieren a un procedimiento apropiado para todas las aplicaciones de audio, donde el ancho de banda completo no está disponible. Por ejemplo, para la difusión de contenido de audio como, por ejemplo, con radio digital, la corriente o flujo de Internet o en aplicaciones de comunicación de audio, se puede usar el procedimiento descrito.
[0173] Realizaciones adicionales según la invención se refieren a un decodificador de extensión de ancho de banda para proporcionar una señal de audio extendida en ancho de banda basada en una señal de audio de entrada y una señal de parámetro, en el que la señal de parámetro comprende una indicación de un parámetro de densidad de energía. El decodificador de extensión de ancho de banda comprende un generador de parche, un combinador y una interfaz de salida. El generador de parche está configurado para generar una señal de alta frecuencia de extensión de ancho de banda que comprende una banda de alta frecuencia, en la que la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda se genera realizando un cambio de frecuencia de una banda de frecuencia de la señal de audio de entrada a frecuencias más altas, en la que el cambio de frecuencia se basa en la frecuencia de desplazamiento y en la que el generador de parche está configurado para amplificar o atenuar la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda por un factor igual al valor de un parámetro de densidad de energía o igual al valor recíproco del parámetro de densidad de energía. El combinador está configurado para combinar la señal de alta frecuencia de extensión de ancho de banda y la señal de audio de entrada para obtener la señal de audio extendida de ancho de banda. La interfaz de salida está configurada para proporcionar la señal de audio extendida de ancho de banda.
[0174] Aunque esta invención se ha descrito en términos de varias realizaciones, existen alteraciones, permutaciones y equivalentes que entran dentro del alcance de esta invención. También debe señalarse que existen muchas formas alternativas de implementar los procedimientos y composiciones de la presente invención. Por lo tanto, se pretende que las siguientes reivindicaciones adjuntas se interpreten como que incluyen todas las alteraciones, permutaciones y equivalentes que entran dentro del alcance de la presente invención.
[0175] En particular, se indica que, dependiendo de las condiciones, el esquema de la invención se puede implementar también en software. La implementación se puede hacer por un medio de almacenamiento digital, particularmente un disco flexible o un CD con señales de control que se pueden leer electrónicamente capaces de cooperar con un sistema de ordenador programable de tal manera que se ejecute el procedimiento correspondiente. En general, la invención también consiste de este modo en un producto de programa de ordenador con códigos de programa almacenados en un soporte que se puede leer por la máquina para efectuar el procedimiento de la invención, cuando el producto de programa de ordenador se ejecuta en un ordenador. En otras palabras, la invención se puede realizar también de este modo como un programa de ordenador con un código de programa para efectuar el procedimiento, cuando el programa de ordenador se ejecuta en un ordenador.

Claims (5)

REIVINDICACIONES
1. Decodificador de extensión de ancho de banda (500, 600) para proporcionar una señal de audio extendida de ancho de banda (532) basada en una señal de audio de entrada (502) y una señal de parámetro (504), en el que la señal de parámetro (504) comprende una indicación de una frecuencia de desplazamiento y una indicación de un parámetro de densidad de energía, en el que el decodificador de extensión de ancho de banda comprende: un generador de parche (510) configurado para generar una señal de alta frecuencia de extensión de ancho de banda (512) que comprende una banda de alta frecuencia, en el que la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda (512) se genera realizando un cambio de frecuencia de una banda de frecuencia de la señal de audio de entrada (502) a frecuencias más altas, donde el cambio de frecuencia se basa en la frecuencia de desplazamiento y donde el generador de parches (510) se configura para amplificar o atenuar la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda (512) por un factor igual al valor del parámetro de densidad de energía o igual al valor recíproco del parámetro de densidad de energía, respectivamente;
un combinador (529) configurado para combinar la señal de alta frecuencia de extensión de ancho de banda (512) y la señal de audio de entrada (502) para obtener la señal de audio extendida en ancho de banda (532); y una interfaz de salida (530) configurada para proporcionar la señal de audio extendida en ancho de banda (532).
2. Decodificador de extensión de ancho de banda según la reivindicación 1, en el que el generador de parches (510) está configurado para generar la señal de alta frecuencia de extensión de ancho de banda (512) en el dominio del tiempo, y en el que el generador de parches (510) está configurado para generar la señal de alta frecuencia de extensión de ancho de banda (512) basado en una modulación de banda lateral única.
3. Decodificador de extensión de ancho de banda según la reivindicación 1, en el que el generador de parches (510) está configurado para generar la señal de alta frecuencia de extensión de ancho de banda (512) en el dominio del tiempo, y en el que el generador de parches (510) está configurado para generar la señal de alta frecuencia de extensión de ancho de banda (512) basada en una modulación de banda lateral única con una interpolación y/o filtrado para cada paso de tiempo.
4. Procedimiento (800) para proporcionar una señal de audio extendida de ancho de banda (532) en base a una señal de audio de entrada (502) y una señal de parámetro (504), en el que la señal de parámetro (504) comprende una indicación de una frecuencia de desplazamiento y una indicación de un parámetro de densidad de energía, comprendiendo el procedimiento:
la generación (810) de una señal de alta frecuencia de extensión de ancho de banda (512) que comprende una banda de alta frecuencia, en el que la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda (512) se genera realizando un cambio de frecuencia de una banda de frecuencia de la señal de audio de entrada (502) a frecuencias más altas, donde el cambio de frecuencia se basa en la frecuencia de desplazamiento;
amplificación (820) o atenuación de la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda (512) por un factor igual al valor del parámetro de densidad de energía o igual al valor recíproco del parámetro de densidad de energía;
combinación (830) de la señal de alta frecuencia de extensión de ancho de banda (512) y la señal de audio de entrada (502) para obtener la señal de audio extendida de ancho de banda (532); y
suministro (840) de la señal de audio extendida de ancho de banda (532).
5. Un programa informático que comprende instrucciones que, cuando el programa informático es ejecutado por un ordenador o por un microcontrolador, hace que el ordenador o el microcontrolador lleve a cabo el procedimiento según la reivindicación 4.
ES18151917T 2008-12-15 2009-12-11 Decodificador de extensión de ancho de banda de audio, programa informático y procedimiento correspondiente Active ES2921059T3 (es)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US12255208P 2008-12-15 2008-12-15

Publications (1)

Publication Number Publication Date
ES2921059T3 true ES2921059T3 (es) 2022-08-17

Family

ID=42104496

Family Applications (4)

Application Number Title Priority Date Filing Date
ES09797003.2T Active ES2613941T3 (es) 2008-12-15 2009-12-11 Codificador de audio y descodificador de extensión de ancho de banda
ES18151917T Active ES2921059T3 (es) 2008-12-15 2009-12-11 Decodificador de extensión de ancho de banda de audio, programa informático y procedimiento correspondiente
ES15167199.7T Active ES2674386T3 (es) 2008-12-15 2009-12-11 Codificador de audio y decodificador de extensión de ancho de banda
ES22166970T Active ES2951163T3 (es) 2008-12-15 2009-12-11 Decodificador de extensión de ancho de banda de audio, procedimiento correspondiente y programa informático

Family Applications Before (1)

Application Number Title Priority Date Filing Date
ES09797003.2T Active ES2613941T3 (es) 2008-12-15 2009-12-11 Codificador de audio y descodificador de extensión de ancho de banda

Family Applications After (2)

Application Number Title Priority Date Filing Date
ES15167199.7T Active ES2674386T3 (es) 2008-12-15 2009-12-11 Codificador de audio y decodificador de extensión de ancho de banda
ES22166970T Active ES2951163T3 (es) 2008-12-15 2009-12-11 Decodificador de extensión de ancho de banda de audio, procedimiento correspondiente y programa informático

Country Status (16)

Country Link
US (13) US8401862B2 (es)
EP (12) EP4231291B1 (es)
JP (3) JP2012512437A (es)
KR (2) KR101369267B1 (es)
CN (1) CN102246231B (es)
AU (1) AU2009328247B9 (es)
BR (2) BRPI0917762B1 (es)
CA (5) CA2908847C (es)
DK (1) DK3364414T3 (es)
ES (4) ES2613941T3 (es)
HK (2) HK1217810A1 (es)
MX (1) MX2011006163A (es)
PL (8) PL4231290T3 (es)
PT (3) PT2359366T (es)
TR (1) TR201808500T4 (es)
WO (1) WO2010069885A1 (es)

Families Citing this family (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6992481B2 (en) 2003-05-29 2006-01-31 Timex Group B. V. Method for compensating for predictable generated signals in an electronic device
EP4231291B1 (en) * 2008-12-15 2023-11-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio bandwidth extension decoder, corresponding method and computer program
ES2805349T3 (es) * 2009-10-21 2021-02-11 Dolby Int Ab Sobremuestreo en un banco de filtros de reemisor combinado
JP5649084B2 (ja) 2010-03-09 2015-01-07 フラウンホーファーゲゼルシャフトツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. 再生速度またはピッチを変更する際にオーディオ信号における過渡音声事象を処理するための装置および方法
KR101414736B1 (ko) * 2010-03-09 2014-08-06 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 캐스케이드 필터뱅크들을 이용한 입력 오디오 신호를 처리하는 장치 및 방법
WO2011110494A1 (en) 2010-03-09 2011-09-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Improved magnitude response and temporal alignment in phase vocoder based bandwidth extension for audio signals
FR2961938B1 (fr) * 2010-06-25 2013-03-01 Inst Nat Rech Inf Automat Synthetiseur numerique audio ameliore
US8560330B2 (en) * 2010-07-19 2013-10-15 Futurewei Technologies, Inc. Energy envelope perceptual correction for high band coding
JP5714180B2 (ja) 2011-05-19 2015-05-07 ドルビー ラボラトリーズ ライセンシング コーポレイション パラメトリックオーディオコーディング方式の鑑識検出
US20130006644A1 (en) * 2011-06-30 2013-01-03 Zte Corporation Method and device for spectral band replication, and method and system for audio decoding
US9173025B2 (en) 2012-02-08 2015-10-27 Dolby Laboratories Licensing Corporation Combined suppression of noise, echo, and out-of-location signals
US20140046670A1 (en) * 2012-06-04 2014-02-13 Samsung Electronics Co., Ltd. Audio encoding method and apparatus, audio decoding method and apparatus, and multimedia device employing the same
KR101990884B1 (ko) * 2012-09-04 2019-06-19 에스케이 텔레콤주식회사 이종망 간의 통신품질 향상 방법 및 장치
EP2709106A1 (en) 2012-09-17 2014-03-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating a bandwidth extended signal from a bandwidth limited audio signal
US9258428B2 (en) * 2012-12-18 2016-02-09 Cisco Technology, Inc. Audio bandwidth extension for conferencing
EP2950308B1 (en) * 2013-01-22 2020-02-19 Panasonic Corporation Bandwidth expansion parameter-generator, encoder, decoder, bandwidth expansion parameter-generating method, encoding method, and decoding method
PL3067890T3 (pl) 2013-01-29 2018-06-29 Fraunhofer Ges Forschung Koder audio, dekoder audio, sposób dostarczania zakodowanej informacji audio, sposób dostarczania zdekodowanej informacji audio, program komputerowy i zakodowana reprezentacja, wykorzystujące adaptacyjne względem sygnału powiększanie szerokości pasma
ES2899781T3 (es) 2013-01-29 2022-03-14 Fraunhofer Ges Forschung Aparato y procedimiento para generar una señal de refuerzo de frecuencia mediante la configuración de la señal de refuerzo
CN103971694B (zh) * 2013-01-29 2016-12-28 华为技术有限公司 带宽扩展频带信号的预测方法、解码设备
RU2622872C2 (ru) * 2013-04-05 2017-06-20 Долби Интернэшнл Аб Аудиокодер и декодер для кодирования по форме волны с перемежением
CN104217727B (zh) * 2013-05-31 2017-07-21 华为技术有限公司 信号解码方法及设备
EP2830056A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding an audio signal with intelligent gap filling in the spectral domain
US10083708B2 (en) * 2013-10-11 2018-09-25 Qualcomm Incorporated Estimation of mixing factors to generate high-band excitation signal
EP2871641A1 (en) * 2013-11-12 2015-05-13 Dialog Semiconductor B.V. Enhancement of narrowband audio signals using a single sideband AM modulation
JP6593173B2 (ja) * 2013-12-27 2019-10-23 ソニー株式会社 復号化装置および方法、並びにプログラム
JP6576934B2 (ja) * 2014-01-07 2019-09-18 ハーマン インターナショナル インダストリーズ インコーポレイテッド 圧縮済みオーディオ信号の信号品質ベース強調及び補償
FR3017484A1 (fr) * 2014-02-07 2015-08-14 Orange Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences
EP3128513B1 (en) * 2014-03-31 2019-05-15 Fraunhofer Gesellschaft zur Förderung der Angewand Encoder, decoder, encoding method, decoding method, and program
US9984699B2 (en) * 2014-06-26 2018-05-29 Qualcomm Incorporated High-band signal coding using mismatched frequency ranges
EP2963645A1 (en) * 2014-07-01 2016-01-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Calculator and method for determining phase correction data for an audio signal
JP2016038435A (ja) * 2014-08-06 2016-03-22 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
US9852744B2 (en) * 2014-12-16 2017-12-26 Psyx Research, Inc. System and method for dynamic recovery of audio data
US10847170B2 (en) 2015-06-18 2020-11-24 Qualcomm Incorporated Device and method for generating a high-band signal from non-linearly processed sub-ranges
KR101677137B1 (ko) * 2015-07-17 2016-11-17 국방과학연구소 변조 스펙트로그램을 이용한 수중 방사체의 데몬 및 lofar 특징을 동시 추출하는 방법 및 장치
EP3182411A1 (en) 2015-12-14 2017-06-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing an encoded audio signal
EP3182410A3 (en) * 2015-12-18 2017-11-01 Dolby International AB Enhanced block switching and bit allocation for improved transform audio coding
JP6790114B2 (ja) * 2016-03-18 2020-11-25 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 音声スペクトログラムに基づく構造テンソルを使用して位相情報を復元することによるエンコーディング
TW202341126A (zh) * 2017-03-23 2023-10-16 瑞典商都比國際公司 用於音訊信號之高頻重建的諧波轉置器的回溯相容整合
EP3382702A1 (en) * 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for determining a predetermined characteristic related to an artificial bandwidth limitation processing of an audio signal
GB2562253B (en) * 2017-05-09 2021-11-03 Imagination Tech Ltd Efficient detection of ranging code correlation function of a GNSS signal
US10896684B2 (en) * 2017-07-28 2021-01-19 Fujitsu Limited Audio encoding apparatus and audio encoding method
CN109729585B (zh) * 2017-10-27 2022-04-15 成都鼎桥通信技术有限公司 网络处理方法和装置
US11158297B2 (en) * 2020-01-13 2021-10-26 International Business Machines Corporation Timbre creation system
EP4211701A1 (en) * 2020-09-09 2023-07-19 Sparrow Acoustics Inc. Method and system for performing time-domain processing of a waveform signal
US20230110255A1 (en) * 2021-10-12 2023-04-13 Zoom Video Communications, Inc. Audio super resolution

Family Cites Families (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2512908A (en) 1947-10-16 1950-06-27 Mina M Arndt Telephone switchboard mounting plate with plug-in components
US5455888A (en) 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
WO1997029549A1 (fr) 1996-02-08 1997-08-14 Matsushita Electric Industrial Co., Ltd. Codeur, decodeur, codeur-decodeur et support d'enregistrement de signal audio large bande
JPH10124088A (ja) 1996-10-24 1998-05-15 Sony Corp 音声帯域幅拡張装置及び方法
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US6549884B1 (en) * 1999-09-21 2003-04-15 Creative Technology Ltd. Phase-vocoder pitch-shifting
US7742927B2 (en) * 2000-04-18 2010-06-22 France Telecom Spectral enhancing method and device
SE0001926D0 (sv) * 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
SE0004187D0 (sv) * 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
JP2003108197A (ja) * 2001-07-13 2003-04-11 Matsushita Electric Ind Co Ltd オーディオ信号復号化装置およびオーディオ信号符号化装置
DE60230856D1 (de) * 2001-07-13 2009-03-05 Panasonic Corp Audiosignaldecodierungseinrichtung und audiosignalcodierungseinrichtung
US6895375B2 (en) 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech
AU2002352182A1 (en) 2001-11-29 2003-06-10 Coding Technologies Ab Methods for improving high frequency reconstruction
US20040002844A1 (en) 2002-06-27 2004-01-01 Jess Jochen A.G. System and method for statistical modeling and statistical timing analysis of integrated circuits
US8090577B2 (en) 2002-08-08 2012-01-03 Qualcomm Incorported Bandwidth-adaptive quantization
JP3861770B2 (ja) 2002-08-21 2006-12-20 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
DE10328777A1 (de) 2003-06-25 2005-01-27 Coding Technologies Ab Vorrichtung und Verfahren zum Codieren eines Audiosignals und Vorrichtung und Verfahren zum Decodieren eines codierten Audiosignals
CN101800049B (zh) * 2003-09-16 2012-05-23 松下电器产业株式会社 编码装置和译码装置
DE10345996A1 (de) 2003-10-02 2005-04-28 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Verarbeiten von wenigstens zwei Eingangswerten
DE10345995B4 (de) 2003-10-02 2005-07-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Verarbeiten eines Signals mit einer Sequenz von diskreten Werten
JP4254479B2 (ja) * 2003-10-27 2009-04-15 ヤマハ株式会社 オーディオ帯域拡張再生装置
DE102004046746B4 (de) * 2004-09-27 2007-03-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren zum Synchronisieren von Zusatzdaten und Basisdaten
WO2006049205A1 (ja) * 2004-11-05 2006-05-11 Matsushita Electric Industrial Co., Ltd. スケーラブル復号化装置およびスケーラブル符号化装置
EP1686564B1 (en) * 2005-01-31 2009-04-15 Harman Becker Automotive Systems GmbH Bandwidth extension of bandlimited acoustic signals
JP4604864B2 (ja) 2005-06-14 2011-01-05 沖電気工業株式会社 帯域拡張装置及び不足帯域信号生成器
US7953605B2 (en) * 2005-10-07 2011-05-31 Deepen Sinha Method and apparatus for audio encoding and decoding using wideband psychoacoustic modeling and bandwidth extension
US7953604B2 (en) * 2006-01-20 2011-05-31 Microsoft Corporation Shape and scale parameters for extended-band frequency coding
US20080004866A1 (en) * 2006-06-30 2008-01-03 Nokia Corporation Artificial Bandwidth Expansion Method For A Multichannel Signal
PL2109098T3 (pl) * 2006-10-25 2021-03-08 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Urządzenie i sposób do generowania próbek audio w dziedzinie czasu
JP2008158300A (ja) * 2006-12-25 2008-07-10 Sony Corp 信号処理装置、信号処理方法、再生装置、再生方法、電子機器
US7912729B2 (en) * 2007-02-23 2011-03-22 Qnx Software Systems Co. High-frequency bandwidth extension in the time domain
DE102008015702B4 (de) 2008-01-31 2010-03-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals
MX2010009932A (es) * 2008-03-10 2010-11-30 Fraunhofer Ges Forschung Metodo y dispositivo para manipular una señal de audio que tiene un evento transitorio.
US7977562B2 (en) * 2008-06-20 2011-07-12 Microsoft Corporation Synthesized singing voice waveform generator
AU2009267525B2 (en) * 2008-07-11 2012-12-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio signal synthesizer and audio signal encoder
US8880410B2 (en) * 2008-07-11 2014-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating a bandwidth extended signal
WO2010036062A2 (en) * 2008-09-25 2010-04-01 Lg Electronics Inc. A method and an apparatus for processing a signal
EP2224433B1 (en) * 2008-09-25 2020-05-27 Lg Electronics Inc. An apparatus for processing an audio signal and method thereof
EP4231291B1 (en) * 2008-12-15 2023-11-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio bandwidth extension decoder, corresponding method and computer program
EP3246919B1 (en) * 2009-01-28 2020-08-26 Dolby International AB Improved harmonic transposition
ES2805349T3 (es) * 2009-10-21 2021-02-11 Dolby Int Ab Sobremuestreo en un banco de filtros de reemisor combinado
PL2581905T3 (pl) * 2010-06-09 2016-06-30 Panasonic Ip Corp America Sposób rozszerzania pasma częstotliwości, urządzenie do rozszerzania pasma częstotliwości, program, układ scalony oraz urządzenie dekodujące audio
WO2012113035A1 (en) 2011-02-25 2012-08-30 Polyline Piping Systems Pty Ltd Mobile plastics extrusion plant
CN103928029B (zh) * 2013-01-11 2017-02-08 华为技术有限公司 音频信号编码和解码方法、音频信号编码和解码装置
US9666202B2 (en) * 2013-09-10 2017-05-30 Huawei Technologies Co., Ltd. Adaptive bandwidth extension and apparatus for the same

Also Published As

Publication number Publication date
EP2945159A1 (en) 2015-11-18
US8401862B2 (en) 2013-03-19
EP4224474A1 (en) 2023-08-09
CA2908550C (en) 2018-02-13
PL2359366T3 (pl) 2017-04-28
US20230049083A1 (en) 2023-02-16
ES2613941T3 (es) 2017-05-29
KR20130133914A (ko) 2013-12-09
EP3364414B1 (en) 2022-04-13
EP4231291C0 (en) 2023-11-15
ES2674386T3 (es) 2018-06-29
CA2908847C (en) 2018-02-13
EP4231293C0 (en) 2023-11-15
EP4231290C0 (en) 2023-11-15
EP4053838A1 (en) 2022-09-07
PT3364414T (pt) 2022-07-04
US10229696B2 (en) 2019-03-12
BR122015019030B1 (pt) 2020-05-05
US20230041923A1 (en) 2023-02-09
AU2009328247B9 (en) 2013-12-05
US20150243293A1 (en) 2015-08-27
HK1259024A1 (zh) 2019-11-22
AU2009328247A1 (en) 2011-07-07
US11646043B2 (en) 2023-05-09
MX2011006163A (es) 2011-11-02
EP4231292B1 (en) 2023-11-15
CA2746837A1 (en) 2010-06-24
CA2908576C (en) 2018-11-27
US20210151063A1 (en) 2021-05-20
EP4231294A1 (en) 2023-08-23
PT2945159T (pt) 2018-06-26
WO2010069885A1 (en) 2010-06-24
EP4053838B1 (en) 2023-06-21
JP5970014B2 (ja) 2016-08-17
BRPI0917762B1 (pt) 2020-09-29
US20230072871A1 (en) 2023-03-09
CA2908847A1 (en) 2010-06-24
KR20110095354A (ko) 2011-08-24
PL4231290T3 (pl) 2024-04-02
EP4224474C0 (en) 2023-11-01
US11664039B2 (en) 2023-05-30
US9058802B2 (en) 2015-06-16
US11626124B2 (en) 2023-04-11
US20190156845A1 (en) 2019-05-23
US11631418B2 (en) 2023-04-18
BRPI0917762A2 (pt) 2016-07-26
CA2989886A1 (en) 2010-06-24
CA2746837C (en) 2016-09-20
KR101369267B1 (ko) 2014-03-04
EP4231294C0 (en) 2023-11-15
EP4231290B1 (en) 2023-11-15
PL4224475T3 (pl) 2024-03-18
PL4053838T3 (pl) 2023-11-13
EP2359366B1 (en) 2016-11-02
CA2989886C (en) 2020-05-05
DK3364414T3 (da) 2022-06-27
US20230032124A1 (en) 2023-02-02
EP4231294B1 (en) 2023-11-15
US20230051135A1 (en) 2023-02-16
CA2908576A1 (en) 2010-06-24
EP2945159B1 (en) 2018-03-21
US20130185082A1 (en) 2013-07-18
US11594237B2 (en) 2023-02-28
JP2015187747A (ja) 2015-10-29
EP4231291A1 (en) 2023-08-23
CN102246231B (zh) 2013-07-10
BR122015019030A2 (pt) 2019-08-27
EP4231290A1 (en) 2023-08-23
EP3364414A1 (en) 2018-08-22
JP2012512437A (ja) 2012-05-31
US20230053046A1 (en) 2023-02-16
US11670316B2 (en) 2023-06-06
TR201808500T4 (tr) 2018-07-23
US10937437B2 (en) 2021-03-02
EP4231295A1 (en) 2023-08-23
US11741978B2 (en) 2023-08-29
US11705146B2 (en) 2023-07-18
EP4231291B1 (en) 2023-11-15
EP4224474B1 (en) 2023-11-01
EP2359366A1 (en) 2011-08-24
EP4231293B1 (en) 2023-11-15
EP4224475C0 (en) 2023-10-11
JP6076407B2 (ja) 2017-02-08
PL2945159T3 (pl) 2018-08-31
EP4231292C0 (en) 2023-11-15
PL4231292T3 (pl) 2024-04-02
PT2359366T (pt) 2017-01-20
CN102246231A (zh) 2011-11-16
AU2009328247B2 (en) 2013-06-06
CA2908550A1 (en) 2010-06-24
EP4231295B1 (en) 2024-02-21
US20230377590A1 (en) 2023-11-23
PL3364414T3 (pl) 2022-08-16
EP4231293A1 (en) 2023-08-23
ES2951163T3 (es) 2023-10-18
JP2014142653A (ja) 2014-08-07
HK1217810A1 (zh) 2017-01-20
EP4053838C0 (en) 2023-06-21
US20230037621A1 (en) 2023-02-09
EP4224475B1 (en) 2023-10-11
PL4224474T3 (pl) 2024-04-02
KR101424944B1 (ko) 2014-08-01
EP4231295C0 (en) 2024-02-21
EP4224475A1 (en) 2023-08-09
US20110288873A1 (en) 2011-11-24
EP4231292A1 (en) 2023-08-23

Similar Documents

Publication Publication Date Title
ES2921059T3 (es) Decodificador de extensión de ancho de banda de audio, programa informático y procedimiento correspondiente
AU2015203736B2 (en) Audio encoder and bandwidth extension decoder