ES2674386T3 - Codificador de audio y decodificador de extensión de ancho de banda - Google Patents

Codificador de audio y decodificador de extensión de ancho de banda Download PDF

Info

Publication number
ES2674386T3
ES2674386T3 ES15167199.7T ES15167199T ES2674386T3 ES 2674386 T3 ES2674386 T3 ES 2674386T3 ES 15167199 T ES15167199 T ES 15167199T ES 2674386 T3 ES2674386 T3 ES 2674386T3
Authority
ES
Spain
Prior art keywords
signal
high frequency
bandwidth extension
audio signal
input audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES15167199.7T
Other languages
English (en)
Inventor
Frederik Nagel
Guillaume Fuchs
Sascha Disch
Jürgen HERRE
Christian Griebel
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Application granted granted Critical
Publication of ES2674386T3 publication Critical patent/ES2674386T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • G10L19/265Pre-filtering, e.g. high frequency emphasis prior to encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Circuits Of Receivers In General (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Amplifiers (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)

Abstract

Un codificador de audio para proporcionar una señal de salida (132) mediante el uso de una señal de audio de entrada (102), que comprende: un generador de parche (110) configurado para generar una señal de alta frecuencia de extensión de ancho de banda (112), en el que la señal de alta frecuencia de extensión de ancho de banda (112) comprende una banda de alta frecuencia, en el que la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda (112) se deriva de una banda de baja frecuencia de la señal de audio de entrada (102) mediante el desplazamiento de la parte de baja frecuencia por un valor fijo mediante el uso de una modulación de banda lateral, de tal manera que la banda de alta frecuencia esté localizada por encima de la banda de baja frecuencia de la señal de audio de entrada (102); un comparador (120) configurado para llevar a cabo una comparación de la señal de audio de entrada filtrada por un filtro de paso de banda (420) y la señal de alta frecuencia de extensión de ancho de banda (112) mediante el uso de un cálculo de correlación cruzada en intervalos de tiempo regulares entre espectros de amplitud de secciones de señal en ventana de la señal de audio de entrada filtrada por el filtro de paso de banda (420) y la señal de alta frecuencia de extensión de ancho de banda (112) para determinar un retraso para una correlación máxima para una sección de señal; y una interfaz de salida (130) configurada para proporcionar la señal de salida (132) para transmisión o almacenamiento, en la que la señal de salida (132) comprende una indicación de parámetro basada en el retraso para la correlación máxima.

Description

DESCRIPCIÓN
Codificador de audio y decodificador de extensión de ancho de banda
5
[0001] Las realizaciones según la invención se refieren al procesamiento de señales de audio y, en particular,
a un codificador de audio, un procedimiento para proporcionar una señal de salida, un decodificador de extensión de ancho de banda y un procedimiento para proporcionar una señal de audio extendida en ancho de banda.
10 [0002] La codificación adaptada a la audición de señales de audio para reducción de datos para un
almacenamiento y transmisión eficiente de estas señales ha ganado aceptación en muchos campos. Algoritmos de codificación son conocidos, por ejemplo, tales como MPEG A CAPA 3, “MP3” o MPEG 4 AAC. El algoritmo de codificación usado para esto, en particular cuando se obtienen proporciones de bits más bajas, conduce a la reducción de la calidad de audio que es frecuentemente provocada principalmente por una limitación lateral del codificador del 15 ancho de banda de la señal de audio que se va a transmitir. Una señal filtrada en paso de bajos es codificada utilizando un llamado codificador de núcleo o codificador central y la región con frecuencias más altas es parametrizada, de tal manera que pueden ser reconstruidas aproximadamente a partir de la señal filtrada en paso de bajos.
[0003] Se conoce a partir del documento WO 98 57436 el hecho de someter la señal de audio a una limitación
20 de banda en tal situación en el lado del codificador y codificar solamente una banda más baja de la señal de audio por medio de un codificador de audio de alta calidad. La banda superior, sin embargo, se caracteriza únicamente de forma muy brusca, es decir, por un conjunto de parámetros que permiten la reproducción de la envolvente espectral original de la banda superior. En el lado del decodificador, la banda superior se sintetiza a continuación. Para este propósito, se propone una transposición armónica, en la que la banda inferior de la señal de audio decodificada es suministrada 25 a un banco de filtros. Canales de banco de filtros de la banda inferior están conectados a canales de banco de filtros de la banda superior, o son “parcheados” (interconectados), y cada señal de paso de banda parcheada es sometida a un ajuste de envolvente. El banco de filtros de síntesis que pertenece a un banco de filtros de análisis especial recibe aquí señales de paso de banda de la señal de audio en la banda inferior y señales de paso de banda ajustadas a la envolvente de la banda inferior que fueron parcheadas armónicamente a la banda superior. La señal de salida del 30 banco de filtros de síntesis es una señal de audio extendida con respecto a su ancho de banda de audio que fue transmitida del lado del codificador al lado del decodificador con una proporción de datos muy baja. En particular, los cálculos de banco de filtros y parcheo en el dominio de banco de filtros se puede convertir en un esfuerzo computacional alto.
35 [0004] Procedimientos de complejidad reducida para una extensión de ancho de banda de señales de audio
de banda limitada en lugar de esto utilizan una función de copia de ofrecerles la señal de baja frecuenta (LS) al intervalo de alta frecuencia (HF), con el fin de aproximar información perdida debido a la limitación de banda. Tales procedimientos son descritos en M. Dietz, L. Liljeryd, K. Kjorling y 0. Kunz, "Spectral Band Replication, a novel approach in audio coding," en la 112a Convención aEs, Munich, Mayo de 2002; S. Meltzer, R. Bohm y F. Henn, "SBR 40 enhanced audio codecs for digital broadcasting such as "Digital Radio Mondiale" (DRM)," 112a Convención AES, Munich, Mayo de 2002; T. Ziegler, A. Ehret, P. Ekstrand y M. Lutzky, "Enhancing mp3 with SBR: Features and Capabilities of the new mp3PRO Algorithm," en 112a Convención AES, Munich, Mayo de 2002; International Standard IsO/IEC 14496-3:2001/FPDAM l, "Bandwidth Extension," ISO/IEC, 2002, o "Speech bandwidth extension method and apparatus", Vasu Iyengar et al. Patente estadounidense No. 5,455,888.
45
[0005] En estos procedimientos, no se efectúa ninguna transposición armónica, pero los canales del banco de filtros de fase de banda adyacentes de la banda inferior son introducidos artificialmente a canales del banco de filtros adyacentes de la banda superior. Esto conduce a una aproximación burda de la banda superior de la señal de audio. Esta aproximación burda de la señal es reclinada a continuación, en una etapa adicional, al definir parámetros de
50 control adicionales deducidos de la señal original. Como un ejemplo, el estándar de MPEG-4 utiliza factores de escala para ajustar la envolvente espectral, una combinación de filtración inversa y adición de un piso de ruido para adaptar la tonalidad e inserciones de porciones de señal sinusoidales para complementación de componentes tonales.
[0006] Aparte de esto, existen procedimientos adicionales tales como la llamada “extensión de ancho de banda 55 ciega”, descrita en E. Larsen, R.M. Aarts y M. Danessis, “Efficient high-frequency bandwidth extension of music and
speech”, en 112a Convención AES, Munich, Alemania, Mayo de 2002 en la que no se usa ninguna información del intervalo de HF original. Además, también existe el procedimiento de la llamada “extensión de ancho de banda artificial” que es descrito en K. Kayhko, A Robust Wideband Enhancement for Narrowband Speech Signal; Research Report, Helsinki University of Technology, Laboratory of Acoustics and Audio signal Processing, 2001.
60
[0007] En J. Makinen et al.: AMR-WB+: a new audio coding standard for 3rd generation mobile audio services Broadcasts, IEEE, ICASSP '05 se describe un procedimiento para extensión de ancho de banda, en el que la operación de copia de componentes de baja frecuencia a la banda alta es efectuada por una operación de reflejo o espejo obtenida, por ejemplo, mediante toma de muestras ascendentes de la señal filtrada en paso de bajos.
65
[0008] Como una alternativa, se puede emplear una modulación de banda lateral individual que es básicamente
equivalente a una operación de copia en el dominio de banco de filtros. Procedimientos que habilitan una extensión de ancho de banda armónica emplean usualmente una etapa de determinación del paso (rastreo de paso), una etapa de distorsión no lineal (véase, por ejemplo, “U. Kornagel, Spectral widening of the excitation signal for telephone-band speech enhancement, en: Proceedings of the IWAENC, Darmstadt, Alemania, Septiembre de 2001, pp. 215 - 218”) o 5 hacen uso de vocodificadores de fase tales como por ejemplo como se muestran por la solicitud de patente estadounidense provisional “F.Nagel, S. Disch: “Apparatus and method of harmonic bandwidth extension in audio signals”” con el número de solicitud US 61/025129.
[0009] El documento WO 02/41302 A1, por ejemplo, muestra un procedimiento para mejorar el desempeño de 10 sistemas de codificación que usan procedimientos de reconstrucción de alta frecuencia. Muestra cómo mejorar el
desempeño global de tales sistemas por medio de una adaptación sobre el tiempo de la frecuencia de cruce entre la banda baja codificada por un codificador central y la banda alta codificada por un sistema de reconstrucción de alta frecuencia. Para este procedimiento, el codificador de núcleo o codificador central debe ser capaz de trabajar con diferentes frecuencias de cruce en el lado del codificador, así como en el lado del decodificador. Por consiguiente, se 15 incrementa la complejidad del codificador del núcleo o codificador central.
[0010] Tecnologías adicionales para extensiones de ancho de banda se describen, por ejemplo, en “R. M. Aarts, E. Larsen y O. Ouweltjes, A unified approach to low- and high-frequency bandwidth extension. En 115a Convention AES, Nueva York, EUA, Octubre de 2003”, E. Larsen y R. M. Aarts: Audio Bandwidth Extension -
20 Application to psychoacoustics, Signal Processing and Loudspeaker Design. John Wiley e hijos, Ltd, 2004”, E. Larsen, R. M. Aarts y M. Danessis: Efficient high-frequency bandwidth extension of music and speech. En 112a Convención AES 112th, Munich, Alemania, Mayo de 2002”, “J. Makhoul: Spectral Analysis of Speech by Linear Prediction. IEEE Transactions on Audio and Electroacoustics, AU-21(3), Junio de 1973“, “Solicitud de patente estadounidense 08/951,029, Ohmori et al.: Audio band width extending system and method” and “patente estadounidense 6895375, 25 Malah, D y Cox, R. VS.: System for bandwidth extension of Narrow-band speech”.
[0011] Los procedimientos de extensión de ancho de banda armónicos frecuentemente exhiben una alta complejidad, mientras que los procedimientos de extensión de ancho de banda de complejidad reducida muestran pérdidas de calidad. En el caso particular en donde una baja proporción de bits es combinada con un ancho de banda
30 pequeño de la banda baja, se pueden presentar artefactos tales como rugosidad o aspereza y un timbre percibido como desagradable. Una razón para esto es el hecho de que la porción de HF aproximada está basada en una operación de copia que no mantiene ni las relaciones armónicas entre las porciones de señal tonales. Esto se aplica tanto a la relación armónica entre LF y HF y también a la relación armónica entre interconexiones subsecuentes dentro de la porción de HF misma. Por ejemplo, dentro de SBR, la yuxtaposición de los componentes codificados y los 35 componentes replicados, que se presenta en la frontera entre las bandas baja y alta puede provocar impresiones de sonido áspero o rugoso. La razón es ilustrada en la figura 18 en donde porciones tonales copiadas del intervalo LF al intervalo de HF son espectralmente adyacentes densamente a porciones tonales del intervalo de LF.
[0012] La figura 18a muestra el espectrograma original 1800a de una señal constituido por tres tonos. De 40 conformidad, la figura 18b muestra un diagrama 1800b de la señal extendida del ancho de banda correspondiente a
la señal original de la figura 18a. La abscisa indica el tiempo y la ordenada indica la frecuencia. En particular, en el último tono, se pueden observar problemas potenciales 1810 (líneas discontinuas 1810).
[0013] Si las relaciones armónicas son consideradas mediante procedimientos conocidos, esto siempre se 45 hace en base a una estimación de F0, según se muestra, entre otros, en US2004/028244A1. En estos casos, el éxito
de estos procedimientos depende principalmente de la fiabilidad de esta estimación.
[0014] En general, los procedimientos de extensión de ancho de banda conocidos proporcionan señales de audio a una baja proporción de bits, pero con calidad de audio deficiente o una calidad de audio buena a altas
50 proporciones de bits.
[0015] Es un objeto de la presente invención proporcionar un esquema de codificación mejorado para señales de audio.
55 [0016] Este objeto es obtenido por un codificador de audio según la reivindicación 1, un decodificador de
extensión de ancho de banda según la reivindicación 5 o un procedimiento según las reivindicaciones 10 u 11.
[0017] Algunas realizaciones según la invención se refieren a un comparador mediante el uso de una correlación cruzada para la comparación de la señal de audio de entrada y la señal de alta frecuencia de extensión de
60 ancho de banda generada para calcular el parámetro de comparación.
[0018] Algunas realizaciones adicionales según la invención se refieren a un generador de parche, que genera la señal de alta frecuencia de extensión de ancho de banda en el dominio de tiempo basada en una única modulación de banda lateral.
65
[0019] Es una ventaja de realizaciones preferidas de la invención que un esquema de codificación mejorado
para señales de audio que permite incrementar la calidad de audio y/o disminuir la proporción de bits para transmisión o almacenamiento es proporcionado.
[0020] Realizaciones según la invención serán detalladas subsecuentemente en referencia a los dibujos
5 adjuntos, en los cuales:
La figura 1 es un diagrama de bloques de un codificador de audio;
La figura 2 es una ilustración esquemática de una generación de señal de alta frecuencia de extensión de ancho de banda, una comparación de la señal de audio de entrada y una señal de alta frecuencia de extensión de ancho de 10 banda generada y una adaptación de energía de la señal de alta frecuencia de extensión de ancho de banda;
La figura 3 es una ilustración esquemática de una generación de señal de alta frecuencia de extensión de ancho de banda, una comparación de la señal de audio de entrada y una señal de alta frecuencia de extensión de ancho de banda y una adaptación de potencia de la señal de alta frecuencia de extensión de ancho de banda;
La figura 4 es un diagrama de bloques de un codificador de extensión de ancho de banda;
15 La figura 5 es un diagrama de bloques de un decodificador de extensión de ancho de banda;
La figura 6 es un diagrama de bloques de un decodificador de extensión de ancho de banda;
La figura 7 es un diagrama de flujo de un procedimiento para proporcionar una señal de salida en base a una señal de audio de entrada;
La figura 8 es un diagrama de flujo de un procedimiento para proporcionar una señal de audio extendida en ancho de 20 banda;
La figura 9 es un diagrama de flujo de un procedimiento para proporcionar una señal de salida en base a una señal de audio de entrada;
La figura 10 es un diagrama de flujo de un procedimiento para calcular un parámetro de comparación;
La figura 11 es una ilustración esquemática de una interpolación de la frecuencia de desplazamiento;
25 La figura 12 es un diagrama de bloques de un decodificador de extensión de ancho de banda;
La figura 13 es un diagrama de flujo de un procedimiento para proporcionar una señal de audio extendida de ancho de banda;
La figura 14 es un diagrama de bloques de un procedimiento para proporcionar una señal de audio extendida en ancho de banda;
30 La figura 15 es un diagrama de bloques de un codificador de extensión de ancho de banda;
La figura 16a es un espectrograma de tres tonos mediante el uso de una frecuencia de cruce variable;
La figura 16b es un espectrograma de la señal de audio original de tres tonos;
La figura 17 es un diagrama del espectro de potencia de una señal de audio original, una señal de audio extendida en ancho de banda mediante el uso de la frecuencia de cruce constante y una señal de audio extendida en ancho de 35 banda mediante el uso de una frecuencia de cruce variable;
La figura 18a es un espectrograma de tres tonos mediante el uso de un procedimiento de extensión de ancho de banda conocido; y
La figura 18b es un espectrograma de la señal de audio original de tres tonos.
40 [0021] En lo sucesivo, los mismos números de referencia se utilizan parcialmente para objetos y unidades
funcionales que tienen las mismas propiedades funcionales o propiedades funcionales similares y la descripción de las mismas con respecto a una figura también se aplicará a otras figuras con el fin de reducir redundancia en la descripción de las realizaciones.
45 [0022] La figura 1 muestra un diagrama de bloques de un codificador de audio 100 para proporcionar una señal
de salida 132 según una realización de la invención, mediante el uso de una señal de audio de entrada 102. La señal de salida es apropiada para una extensión de ancho de banda en un decodificador. Por consiguiente, el codificador de audio se denomina también codificador de extensión de ancho de banda. El codificador de extensión de ancho de banda 100 comprende un generador de parche 110, un comparador 120 y una interfaz de salida 130. El generador de 50 parche 110 está conectado al comparador 120 y el comparador 120 está conectado a la interfaz de salida 130.
[0023] El generador de parche 110 genera al menos una señal de alta frecuencia de extensión de ancho de
banda 112. Una señal de alta frecuencia de extensión de ancho de banda 112 comprende una banda de alta frecuencia, en la que la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda 112
55 está basada en una banda de baja frecuencia de la señal de audio de entrada 102. Si se generan diferentes señales de alta frecuencia de extensión de ancho de banda 112, las diferentes señales de alta frecuencia de extensión de ancho de banda 112 comprenden diferentes frecuencias dentro de sus bandas de alta frecuencia.
[0024] El comparador 120 calcula una pluralidad de parámetros de comparación. Un parámetro de
60 comparación es calculado en base a una comparación de la señal de audio de entrada 102 y una señal de alta
frecuencia de extensión de ancho de banda generada 112. Cada parámetro de comparación de la pluralidad de parámetros de comparación es calculado en base a una frecuencia de desplazamiento diferente entre la señal de audio de entrada 102 y una señal de alta frecuencia de extensión de ancho de banda generada 112. Además, el comparador 120 determina un parámetro de comparación de la pluralidad de parámetros de comparación, en el que 65 el parámetro de comparación determinado satisface un criterio predefinido.
[0025] La interfaz de salida 130 proporciona la señal de salida 132 para transmisión o almacenamiento. La
señal de salida 132 comprende una indicación de parámetro basada en una frecuencia de desplazamiento correspondiente al parámetro de comparación determinado.
5 [0026] Al calcular una pluralidad de parámetros de comparación para diferentes frecuencias de
desplazamiento, se puede encontrar una señal de alta frecuencia de extensión de ancho de banda 112 que se ajusta bien a la señal de audio de entrada original 102. Esto se puede hacer al generar una pluralidad de señales de alta frecuencia de extensión de ancho de banda 112 cada una con una frecuencia de desplazamiento diferente o al generar una señal de alta frecuencia de extensión de ancho de banda y desplazar la banda de alta frecuencia de la señal de
10 alta frecuencia de extensión de ancho de banda 112 por diferentes frecuencias de desplazamiento. También, una combinación de generación de una pluralidad de señales de alta frecuencia de extensión de ancho de banda 112 con diferentes frecuencias de desplazamiento y desplazamiento de la banda de alta frecuencia de ellas por otras frecuencias de desplazamiento diferentes puede ser posible. Por ejemplo, se generan cinco señales de alta frecuencia de extensión de ancho de banda diferentes 112 y cada una de ellas es desplazada cinco veces por un desplazamiento
15 de frecuencia constante.
[0027] La figura 2 muestra una ilustración esquemática 200 de la generación de señal de alta frecuencia de extensión de ancho de banda, la comparación de la señal de alta frecuencia de extensión de ancho de banda y la señal de audio de entrada y una adaptación de potencia opcional de la señal de alta frecuencia de extensión de ancho
20 de banda para el caso en que solamente se genera una señal de alta frecuencia de extensión de ancho de banda y desplazada por diferentes frecuencias de desplazamiento.
[0028] El primer diagrama esquemático de “energía contra frecuencia” 210 muestra esquemáticamente una señal de audio de entrada 102. En base a esta señal de audio de entrada 102, el generador de parche 110 puede
25 generar la señal de alta frecuencia de extensión de ancho de banda 112, por ejemplo, al desplazar 222 una banda de baja frecuencia de la señal de audio de entrada 102 a frecuencias más altas (como se indica por el número de referencia). Por ejemplo, la banda de baja frecuencia es desplazada por una frecuencia igual a una frecuencia de cruce de un codificador de núcleo, no ilustrado en la figura 1, que puede ser una parte del codificador de extensión de ancho de banda 100 u otra frecuencia predefinida.
30
[0029] La señal de alta frecuencia de extensión de ancho de banda generada 112 puede ser desplazada a continuación por diferentes frecuencias de desplazamiento 232 y para cada frecuencia de desplazamiento 232 (como se indica por el número de referencia 230), se puede calcular un parámetro de comparación por el comparador 120. La frecuencia de desplazamiento 232 puede ser, por ejemplo, definida en relación con una frecuencia de cruce de un
35 codificador de núcleo, en relación con otra frecuencia específica o puede ser definida como un valor de frecuencia absoluto.
[0030] A continuación, el comparador 120 determina un parámetro de comparación que satisface el criterio
predefinido. De esta manera, una señal de alta frecuencia de extensión de ancho de banda 112 con una frecuencia
40 de desplazamiento 242 correspondiente al parámetro de comparación determinado puede ser determinada (como se muestra con el número de referencia 240).
[0031] Adicionalmente, también un parámetro de densidad de energía 252 puede ser determinado (como se indica por el número de referencia 250). El parámetro de densidad de energía 252 puede indicar la proporción de la
45 banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda con la frecuencia de desplazamiento correspondiente al parámetro de comparación determinado y una banda de frecuencia correspondiente de la señal de audio de entrada. Por ejemplo, la proporción se puede relacionar con una proporción de densidad de energía, una proporción de energía u otra proporción de una cantidad relacionada con la densidad de energía de una banda de frecuencia.
50
[0032] Alternativamente, la figura 3 muestra una ilustración esquemática 300 de la generación de la señal de alta frecuencia de extensión de ancho de banda, la comparación de las señales de alta frecuencia de extensión de ancho de banda generadas y la señal de audio de entrada y la adaptación de energía opcional de la señal de alta frecuencia de extensión de ancho de banda para el caso en que una pluralidad de señales de alta frecuencia de
55 extensión de ancho de banda con diferentes frecuencias de desplazamiento son generadas.
[0033] A diferencia de la secuencia mostrada en la figura 2, el generador de parche 110 genera una pluralidad de señales de alta frecuencia de extensión de ancho de banda 112 con frecuencias de desplazamiento diferentes 232 (como se indica por el número de referencia 320). Esto se puede hacer de nuevo por un desplazamiento de frecuencia
60 222 de una banda de baja frecuencia de la señal de audio de entrada 102 a frecuencias más altas. La banda de baja frecuencia de la señal de audio de entrada 102 puede ser desplazada por una frecuencia constante más la frecuencia de desplazamiento individual 232 de cada señal de alta frecuencia de extensión de ancho de banda 112. La frecuencia constante puede ser igual a la frecuencia de cruce del codificador del núcleo u otra frecuencia específica.
65 [0034] Un parámetro de comparación para cada señal de alta frecuencia de extensión de ancho de banda
generada 112 puede ser calculado a continuación y el parámetro de comparación que satisface el criterio predefinido
puede ser determinado 240 por el comparador 120.
[0035] El parámetro de densidad de energía puede ser determinado 250 como se describe anteriormente.
5 [0036] Los conceptos mostrados en las figuras 2 y 3 pueden ser combinados también.
[0037] La comparación de la señal de audio de entrada 102 y la señal de alta frecuencia de extensión de ancho de banda generada 112 se puede hacer por una correlación cruzada de ambas señales. En este caso, un parámetro de comparación puede ser, por ejemplo, el resultado de una correlación cruzada para una frecuencia de
10 desplazamiento específica entre la señal de audio de entrada 102 y una señal de alta frecuencia de extensión de ancho de banda generada 112.
[0038] La indicación de parámetro de la señal de salida 132 puede ser la frecuencia de desplazamiento en sí misma, una frecuencia de desplazamiento cuantificada u otra cantidad basada en la frecuencia de desplazamiento.
15
[0039] Mediante la transmisión o el almacenamiento solamente de la indicación del parámetro en lugar de la banda de alta frecuencia de la señal de audio de entrada 102, la proporción de bits para transmisión o almacenamiento puede ser reducida. Al escoger el parámetro en base a la frecuencia de desplazamiento correspondiente a un parámetro de comparación que satisface un criterio predefinido, esto puede producir una mejor calidad de audio que
20 la decodificación solamente de la señal de audio limitada en banda o de banda limitada.
[0040] Un criterio predefinido puede ser para determinar un parámetro de comparación de la pluralidad de parámetros de comparación que indican, por ejemplo, una señal de alta frecuencia de extensión de ancho de banda 112 con una frecuencia de desplazamiento correspondientes que coincide con la señal de audio de entrada 102 mejor
25 que el 70 % de las señales de alta frecuencia de extensión de ancho de banda 112 con otras frecuencias de desplazamiento, indicando una señal de alta frecuencia de extensión de ancho de banda 112 con una frecuencia de desplazamiento correspondiente que es una de las tres mejores coincidencias con la señal de audio de entrada 102 o que indica una señal de alta frecuencia de extensión de ancho de banda que coincide mejor 112 con una frecuencia de desplazamiento correspondiente. Esto se relaciona con el caso en donde una pluralidad de señales de alta 30 frecuencia de extensión de ancho de banda 112 con diferentes frecuencias de desplazamiento son generadas, también como el caso en donde solamente una señal de alta frecuencia de extensión de ancho de banda 112 es generada y desplazada por diferentes frecuencias de desplazamiento o una combinación de estos dos casos.
[0041] Un parámetro de comparación puede ser el resultado de una correlación cruzada u otra cantidad que 35 indica cómo de bien coincide una señal de alta frecuencia de extensión de ancho de banda 112 con una frecuencia
de desplazamiento específica coincide con la señal de audio de entrada 102.
[0042] El codificador de extensión de ancho de banda 100 puede comprender un codificador de núcleo para codificar una banda de baja frecuencia de la señal de audio de entrada 102. Este codificador de núcleo puede
40 comprender una frecuencia de cruce que puede corresponder a la frecuencia de corte superior de la banda de baja frecuencia codificada de la señal de audio de entrada 102. La frecuencia de cruce del codificador del núcleo puede ser constante o variable con el tiempo. La implementación de una frecuencia de cruce variable puede incrementar la complejidad del codificador de núcleo, pero puede también incrementar la flexibilidad para codificación.
45 [0043] El procedimiento mostrado en la figura 2 y/o figura 3 puede ser repetido para bandas de frecuencia más
altas o interconexiones. Por ejemplo, la banda de baja frecuencia de la señal de audio de entrada 102 comprende una frecuencia de corte superior de 4 kHz. Por consiguiente, si la banda de baja frecuencia de la señal de audio de entrada 102 es desplazada por la frecuencia de corte superior de la banda de baja frecuencia para generar la señal de alta frecuencia de extensión de ancho de banda 112, la señal de alta frecuencia de extensión de ancho de banda 112 50 comprende una banda de alta frecuencia con una frecuencia de corte inferior de 4 KHz y una frecuencia de corte superior de 8 kHz. El proceso puede ser repetido al desplazar una banda de baja frecuencia de la señal de audio de entrada 102 por dos veces la frecuencia de corte superior de la banda de baja frecuencia. Así, la nueva señal de alta frecuencia de extensión de ancho de banda generada 112 comprende una banda de alta frecuencia con una frecuencia de corte inferior de 8 KHz y una frecuencia de corte superior de 12 kHz. Esto puede ser repetido hasta que se alcanza 55 una frecuencia más alta deseada.
[0044] Alternativamente, esto puede ser realizado también al generar una señal de alta frecuencia de extensión
de ancho de banda con una pluralidad de bandas de alta frecuencia diferentes.
60 [0045] Como se ilustra en este ejemplo, el ancho de banda de la banda de baja frecuencia de la señal de audio
de entrada y el ancho de banda de una banda de alta frecuencia de una señal de alta frecuencia de extensión de ancho de banda pueden ser los mismos. Alternativamente, la banda de baja frecuencia de la señal de audio de entrada puede ser esparcida y desplazada para generar la señal de alta frecuencia de extensión de ancho de banda.
65 [0046] La determinación de una señal de alta frecuencia de extensión de ancho de banda 112 con una
frecuencia de desplazamiento 232 correspondiente al parámetro de comparación determinado puede dejar un espacio
o separación entre la banda de baja frecuencia de la señal de audio de entrada 102 y la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda 112 dependiendo de la frecuencia de desplazamiento 242. Este espacio o separación puede ser completado al generar porciones de frecuencia que se ajustan en este espacio que contienen por ejemplo ruido limitado en banda o de banda limitada. Alternativamente, el espacio se puede dejar 5 vacío, puesto que la calidad de audio puede no verse afectada drásticamente.
[0047] La figura 4 muestra un diagrama de bloques de un codificador de extensión de ancho de banda 400 para proporcionar una señal de salida 132 mediante el uso de una señal de audio de entrada 102 según una realización preferida de la invención. El codificador de extensión de ancho de banda 400 comprende un generador de parche 110,
10 un comparador 120, una interfaz de salida 130, un codificador de núcleo 410, un filtro de paso de banda 420 y una unidad de extracción de parámetros 430. El codificador del núcleo 410 está conectado a la interfaz de salida 130 y el generador de parche 110, el generador de parche 110 está conectado al comparador 120, el comparador 120 está conectado a la unidad de extracción de parámetros 430, la unidad de extracción de parámetros 430 está conectada a la interfaz de salida 130 y el filtro de paso de banda 420 está conectado al comparador 120.
15
[0048] El generador de parche 110 puede ser realizado como un modulador para generar la señal de alta frecuencia de extensión de ancho de banda 112 en base a la señal de audio de entrada 102. El comparador 120 puede efectuar la comparación de la señal de audio de entrada 102 filtrada por el filtro de paso de banda 420 y la señal de alta frecuencia de extensión de ancho de banda generada 112 por una correlación cruzada de ellas. La determinación
20 del parámetro de comparación que satisface el criterio predefinido puede también ser llamada estimación de retraso.
[0049] La interfaz de salida 130 puede incluir también una funcionalidad de un formateador de corriente de bits y puede comprender un combinador para combinar una señal de baja frecuencia proporcionada por el codificador del núcleo 410 y una señal de parámetro 432 que comprende la indicación de parámetro basada en la frecuencia de
25 desplazamiento proporcionada por la unidad de extracción de parámetros 430. Además, la interfaz de salida 130 puede comprender un codificador de entropía o un codificador diferencial para reducir la proporción de bits de la señal de salida 132. El combinador y el codificador de entropía o codificador diferencial puede ser parte de la interfaz de salida 130 como se muestra en este ejemplo o pueden ser unidades independientes.
30 [0050] La señal de audio 102 puede ser dividida en una parte de baja frecuencia y una parte de alta frecuencia.
Esto puede ser realizado por un filtro de paso de bajos del codificador del núcleo 410 y el filtro de paso de banda 420. El filtro de paso de bajos puede ser parte del codificador del núcleo 410 o un filtro de paso de bajos independiente conectado al codificador del núcleo 410.
35 [0051] La parte de baja frecuencia es procesada por un codificador de núcleo 410 que puede ser un codificador
de audio, por ejemplo, de conformidad con el estándar MPEG1/2 Capa 3 “MP3” o MPEG 4 AAC o un codificador de voz.
[0052] La parte de baja frecuencia puede ser desplazada por un valor fijo, por ejemplo, por medio de una
40 modulación de banda lateral o una transformación de Fourier rápida (FFT) en el dominio de frecuencia, de tal manera que está ubicada por encima de la región de baja frecuencia original en el área objetivo de la interconexión o parte correspondiente. Opcionalmente, la parte de baja frecuencia puede ser obtenida directamente de la señal de entrada 102. Esto puede ser realizado por un filtro de paso de bajos independiente conectado al generador de parche 110.
45 [0053] A intervalos de tiempo regulares, la correlación cruzada entre espectros de amplitud de secciones de
señal transformadas en ventana entre la parte de alta frecuencia original (de la señal de audio de entrada) y la parte de alta frecuencia obtenida (la señal de alta frecuencia de extensión de ancho de banda) puede ser calculada. De esta manera, el retraso (la frecuencia de desplazamiento) para correlación máxima puede ser determinado. Este retraso puede tener el significado de un factor de corrección en términos de la modulación de banda lateral individual original,
50 es decir, la única modulación de banda lateral puede ser corregida adicionalmente por el retraso para maximizar la correlación de cruce. En otras palabras, la frecuencia de desplazamiento, que es también llamada retraso, correspondiente al parámetro de comparación que satisface el criterio predefinido puede ser determinada, en la que el parámetro de comparación corresponde a la correlación de cruce y el criterio predefinido puede ser encontrar la correlación máxima.
55
[0054] Además, se pueden determinar las proporciones de los valores absolutos de los espectros de amplitud. Mediante esto, puede ser derivado por cuyo factor la señal de alta frecuencia obtenida debe ser atenuada o amplificada. En otras palabras, se puede determinar un parámetro de densidad de energía que indica la proporción de energía, las densidades de energía, los valores absolutos de los espectros de amplitud u otro valor relacionado con
60 la proporción de densidad de energía entre la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda 112 y una banda de frecuencia correspondiente de la señal de audio de entrada original 102. Esto puede ser realizado por un comparador de densidad de energía que puede ser parte de la unidad de extracción de parámetros 430 como en el ejemplo mostrado o una unidad independiente. Para determinar el parámetro de densidad de energía, por ejemplo, la señal de alta frecuencia de extensión de ancho de banda 112 que fue generada al desplazar
65 la banda de baja frecuencia de la señal de audio de entrada 102 por una frecuencia constante o la señal de alta frecuencia de extensión de ancho de banda 112 correspondiente al parámetro de comparación determinado u otra
señal de alta frecuencia de extensión de ancho de banda generada 112 puede ser usada. Una banda de frecuencia correspondiente en este caso significa, por ejemplo, una banda de frecuencia con el mismo intervalo de frecuencia. Por ejemplo, si la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda comprende frecuencias de 4 kHz a 8 kHz, entonces la banda de frecuencia correspondiente de la señal de audio de entrada 5 comprende también el intervalo de 4 kHz a 8 kHz.
[0055] Los factores de corrección obtenidos (frecuencia de desplazamiento, parámetro de densidad de energía) correspondientes al retraso y correspondientes al valor absoluto de la amplitud pueden ser interpolados en el tiempo. En otras palabras, un parámetro determinado para una sección de señal en ventana (para un marco de tiempo) puede
10 ser interpolado por cada paso de tiempo de la sección de señal.
[0056] Esta señal (señal de parámetro) de modulación (control) o una representación parametrizada de la misma puede ser almacenada o transmitida a un decodificador. En otras palabras, la señal de parámetro 432 puede ser combinada con la banda de baja frecuencia de la señal de audio de entrada 102 procesada por el codificador del
15 núcleo 410 para obtener la señal de salida 132 que puede ser almacenada o transmitida a un decodificador.
[0057] Adicionalmente, parámetros adicionales para adaptar, por ejemplo, un nivel de ruido y/o la tonalidad pueden ser determinados. Esto se puede hacer por la unidad de extracción de parámetros 430. Los parámetros adicionales pueden ser agregados a la señal de parámetro 432.
20
[0058] El ejemplo mostrado en la figura 4 ilustra un cálculo del lado codificador de una modulación variable en el tiempo. La modulación variable en el tiempo en este caso se relaciona con las señales de alta frecuencia de extensión de ancho de banda 112 con diferentes frecuencias de desplazamiento. La frecuencia de desplazamiento correspondiente al parámetro de comparación determinado que satisface el criterio predefinido puede variar con el
25 tiempo.
[0059] La figura 5 muestra un diagrama de bloques de un decodificador de extensión de ancho de banda 500 para probar una señal de audio extendida en ancho de banda 532 basada en una señal de audio de entrada 502 y una señal de parámetro 504 según una realización de la invención. La señal de parámetro 504 comprende una
30 indicación de una frecuencia de desplazamiento y una indicación de un parámetro de densidad de energía. El decodificador de extensión de ancho de banda 500 comprende un generador de parche 510, un combinador 520 y una interfaz de salida 530. El generador de parche 510 está conectado al combinador 520 y el combinador 520 está conectado a la interfaz de salida 530.
35 [0060] El generador de parche 510 genera una señal de alta frecuencia de extensión de ancho de banda 512
que comprende una banda de alta frecuencia basada en la señal de audio de entrada 502. La banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda 512 se genera basada en un desplazamiento de frecuencia de una banda de frecuencia de la señal de audio de entrada 502, en la que el desplazamiento de frecuencia está basado en la frecuencia de desplazamiento.
40
[0061] Además, el generador de parche 510 amplifica o atenúa la banda de alta frecuencia de la señal de alta
frecuencia de extensión de ancho de banda 512 por un factor igual al valor del parámetro de densidad de energía o igual al valor recíproco del parámetro de densidad de energía.
45 [0062] El combinador 520 combina la señal de alta frecuencia de extensión de ancho de banda 512 y la señal
de audio de entrada 502 para obtener la señal de audio extendida en ancho de banda 532 y la interfaz de salida 530 proporciona la señal de audio extendida en ancho de banda 532.
[0063] La generación de la señal de alta frecuencia de extensión de ancho de banda 112 basada en la
50 frecuencia de desplazamiento puede permitir una continuación mejorada del intervalo de frecuencia de la señal de audio de entrada en la región de alta frecuencia, por ejemplo, si la frecuencia de desplazamiento es determinada como se describe anteriormente. Esto puede incrementar la calidad de audio de la señal de audio extendida en ancho de banda 532.
55 [0064] Adicionalmente, la densidad de energía de la continuación de alta frecuencia de la señal de audio de
entrada 502 se puede hacer de una manera muy eficiente al amplificar o atenuar la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda 512 por el parámetro de densidad de energía. De esta manera, una normalización puede no ser necesaria.
60 [0065] El generador de parche 510 puede generar la señal de alta frecuencia de extensión de ancho de banda
512 al desplazar la banda de frecuencia de la señal de audio de entrada 512 por una frecuencia constante más la frecuencia de desplazamiento. El combinador está configurado para ignorar una parte de la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda 512 que comprende frecuencias más bajas que una frecuencia de corte superior de la señal de audio de entrada 502.
[0066] El generador de parche 510 puede generar la señal de alta frecuencia de extensión de ancho de banda
512 en el dominio de tiempo o en el dominio de frecuencia. En el dominio de tiempo, el generador de parche 510 puede generar la señal de alta frecuencia de extensión de ancho de banda 512 basada en una sola modulación de banda lateral.
5 [0067] Adicionalmente, la interfaz de salida puede amplificar la señal de salida antes de proporcionarla.
[0068] La figura 6 muestra un diagrama de bloques de un decodificador de extensión de ancho de banda 600 para proporcionar una señal de audio extendida en ancho de banda 532 basada en una señal de audio de entrada 502 y una señal de parámetro 504 según una realización de la invención. El decodificador de extensión de ancho de
10 banda 600 comprende un generador de parche 510, un combinador 520, una interfaz de salida 530, un decodificador de núcleo 610 y una unidad de extracción de parámetros 620. El decodificador de núcleo 610 está conectado al generador de parche 510 y el combinador 520, la unidad de extracción de parámetros 620 está conectada al generador de parche 510 y a la interfaz de salida 530, el generador de parche 510 está conectado al combinador 520 y el combinador 520 está conectado a la interfaz de salida 530.
15
[0069] El decodificador de núcleo 610 puede decodificar la corriente de bits recibida 602 y proporciona la señal de audio de entrada 502 al generador de parche 510 y el combinador 520. La señal de audio de entrada 502 puede comprender una frecuencia de corte superior igual a una frecuencia de cruce del decodificador de núcleo 610. Esta frecuencia de cruce puede ser constante o variable en el tiempo. Variable en el tiempo significa, por ejemplo, variable
20 para intervalos de tiempo diferentes o cuadros de tiempo diferentes, pero constante para un intervalo de tiempo o cuadro de tiempo.
[0070] La unidad de extracción de parámetros 620 puede separar la señal de parámetro 504 de la corriente de bits recibida 602 y proporcionarla al generador de parche 510. Adicionalmente, la señal de parámetro 504 o un
25 parámetro de ruido y/o tonalidad extraído puede ser proporcionado a la interfaz de salida 530.
[0071] El generador de parche 510 puede modular la señal de audio de entrada 502 en base a la frecuencia de desplazamiento para obtener la señal de alta frecuencia de extensión de ancho de banda 512 y puede amplificar o atenuar la señal de alta frecuencia de extensión de ancho de banda 512 en base al parámetro de densidad de energía
30 comprendida en la señal de parámetro 504. Esta señal de alta frecuencia de extensión de ancho de banda 512 se proporciona al combinador 530. En otras palabras, el generador de parche 510 puede modular la señal de audio de entrada 502 basado en la frecuencia de desplazamiento y el parámetro de densidad de energía para obtener una señal de alta frecuencia. Esto se puede hacer, por ejemplo, en el dominio de tiempo por una sola modulación de banda lateral 634 con una interpolación y/o filtración 632 para cada paso de tiempo.
35
[0072] El combinador 520 combina la señal de audio de entrada 502 y la señal de alta frecuencia de extensión de ancho de banda generada 512 para obtener la señal de audio de extensión de ancho de banda 532.
[0073] La interfaz de salida 530 proporciona la señal de audio extendida en ancho de banda 532 y puede 40 comprender adicionalmente una unidad de corrección. La unidad de corrección puede llevar a cabo una corrección de
tonalidad y/o corrección de ruido basada en los parámetros proporcionados por la unidad de extracción de parámetros 620. La unidad de corrección puede ser parte de la interfaz de salida 530 como se muestra en la figura 6 o puede ser una unidad independiente. La unidad de corrección puede estar dispuesta también entre el generador de parche 510 y el combinador 520. De esta manera, la unidad de corrección puede corregir solamente la tonalidad y/o ruido de la 45 señal de alta frecuencia de extensión de ancho de banda generada 512. Una corrección de tonalidad y ruido de la señal de audio de entrada 512 no es necesaria puesto que la señal de audio de entrada 502 corresponde a la señal de audio original.
[0074] Resumido en algunas palabras, el decodificador de extensión de ancho de banda 600 puede sintetizar 50 y formar espectralmente una señal de alta frecuencia de una señal de salida del decodificador de audio o decodificador
de núcleo (la señal de audio de entrada) por medio de la función de modulación transmitida. Función de modulación transmitida, por ejemplo, significa una función de modulación basada en la frecuencia de desplazamiento y en el parámetro de densidad de energía. Luego, la señal de alta frecuencia y la señal de baja frecuencia pueden ser combinadas y parámetros adicionales para adaptar el nivel de ruido y tonalidad pueden ser aplicados.
55
[0075] La figura 7 muestra un diagrama de flujo de un procedimiento 700 para proporcionar una señal de salida basada en una señal de audio de entrada según una realización de la invención. El procedimiento comprende la generación 710 de al menos una señal de alta frecuencia de extensión de ancho de banda, el cálculo 720 de una pluralidad de parámetros de comparación, la determinación 730 de un parámetro de comparación a partir de la
60 pluralidad de parámetros de comparación y el suministro 740 de la señal de salida para transmisión o almacenamiento.
[0076] Una señal de alta frecuencia de extensión de ancho de banda generada comprende una banda de alta frecuencia. La banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda está basada en una banda de baja frecuencia de la señal de audio de entrada. Diferentes señales de alta frecuencia de extensión
65 de ancho de banda comprenden diferentes frecuencias dentro de sus bandas de alta frecuencia, si se generan diferentes señales de alta frecuencia de extensión de ancho de banda.
[0077] Un parámetro de comparación se calcula en base a una comparación de la señal de audio de entrada y una señal de alta frecuencia de extensión de ancho de banda generada. Cada parámetro de comparación de la pluralidad de parámetros de comparación se calcula en base a una frecuencia de desplazamiento diferente entre la
5 señal de audio de entrada y una señal de alta frecuencia de extensión de ancho de banda generada.
[0078] El parámetro de comparación determinado satisface un criterio predefinido.
[0079] La señal de salida comprende una indicación de parámetro basada en una frecuencia de 10 desplazamiento correspondiente al parámetro de comparación determinado.
[0080] La figura 8 muestra un diagrama de flujo de un procedimiento 800 para proporcionar una señal de audio extendida en ancho de banda basada en una señal de audio de entrada y una señal de parámetro según una realización de la invención. La señal de parámetro comprende una indicación de una frecuencia de desplazamiento y una indicación de un parámetro de densidad de energía. El procedimiento comprende la generación 810 de una señal de alta frecuencia de extensión de ancho de banda, la amplificación 820 o atenuación de la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda, la combinación 830 de la señal de alta frecuencia de extensión de ancho de banda y la señal de audio de entrada para obtener la señal de audio extendida en ancho de banda y el suministro 840 de la señal de audio extendida en ancho de banda.
[0081] La señal de alta frecuencia de extensión de ancho de banda comprende una banda de alta frecuencia. La banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda se genera 810 basada en un desplazamiento de frecuencia de una banda de frecuencia de la señal de audio de entrada. El desplazamiento de frecuencia está basado en la frecuencia de desplazamiento.
[0082] La banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda es amplificada 820 o atenuada por un factor igual al valor del parámetro de densidad de energía o igual al valor recíproco del parámetro de densidad de energía.
30 [0083] La figura 9 muestra un diagrama de flujo de un procedimiento 900 para proporcionar una señal de salida
basada en una señal de audio de entrada. Se ilustra una posibilidad para la secuencia del algoritmo en el codificador. Esto puede ser también formal matemáticamente descrito en lo sucesivo. Las señales en tiempo real pueden ser indicadas por letras minúsculas latinas, las señales transformadas de Hilbert con griego correspondiente y las señales transformadas de Fourier con letras mayúsculas latinas o alternativamente griegas.
35
[0084] La señal de entrada puede ser llamada f(n), la señal de salida o(n). fH* = f * filíe*; 1 < k < km» indica la
transformada de Fourier, j indica el número imaginario y la transformación de Hilbert H(.) se define como de costumbre:
imagen1
40
con
15
20
25
F(/©):= Hfin))
45 [0085] xOver puede ser la frecuencia de corte del codificador del núcleo, neN puede indicar un tiempo.
kmax>keN puede indicar la k-ésima extensión o parche. ak describe un borde de banda de bandas perceptuales relacionadas con xOver, por ejemplo, según la escala de Bark o la escala de ERB. Alternativamente, la ak se puede incrementar por ejemplo linealmente, es decir ak+1-ak = constante. La transformación de Hilbert puede ser calculada también computacionalmente eficiente mediante la filtración de la señal con un filtro de paso de bajos modulado.
50
[0086]
En primer lugar, una función de modulador analítico 902 con las frecuencias de modulación ak y los
1
a*
Fs
incrementos de fase resultantes r' con el incremento de tiempo (Fs indica la velocidad de toma de
muestras) pueden ser generados. Esto se puede describir de forma matemática en las siguientes fórmulas:
imagen2
5
[0087] La suma puede ser reemplazada únicamente por n, si gk es independiente de n.
[0088] La señal de audio de entrada 102 o señal de audio real f puede ser filtrada por paso de banda a un ancho de banda de ak+1-ak que puede ser expresado por:
imagen3
10 [0089] En este caso, cada parche comprenderá el mismo ancho de banda.
[0090] Alternativamente, la señal de audio de entrada f 102 puede ser filtrada por paso de banda a anchos de
banda de ak con anchos de banda diferentes que pueden ser descritos por:
15
[0091] A continuación, se pueden determinar las áreas de la señal original que deben ser reconstruidas por
este procedimiento. Estas regiones limitadas en banda pueden ser indicadas como:
20
y están ubicadas en los intervalos (ak, ak+1).
[0092] La modulación de la señal de entrada filtrada por paso de bajos 904 se puede realizar en el dominio de 25 frecuencia o el dominio de tiempo.
[0093] En el dominio de frecuencia, las señales de entrada pueden ser aplicadas en ventana primero, lo que puede ser descrito por:
f. (n) = f{£ ■ ^1- i- mod(n, NFFT) +1) • w¡n(mod(n, NFFT) +1)
30
en la que NFFT es el número de bins de transformación de Fourier rápida (por ejemplo 512 bins), ^ es el número de ventana y win(.) es una función de ventana. Las ventanas o cuadros de tiempo pueden comprender una superposición temporal. Por ejemplo, la fórmula dada anteriormente describe una superposición temporal de la mitad de una ventana. 35 Así, NeN bloques de la señal original y con la misma conectada con tantos espectros de amplitud F^(w) con ^ ^ N como valores absolutos de la transformada de Fourier
imagen4
imagen5
imagen6
40 describe el índice del borde de banda k en la transformada de Fourier.
[0094] A continuación, la señal es modulada en el dominio de frecuencia mediante el desplazamiento de los
bins de FFT (bins de transformación de Fourier rápida). La transformación de Hilbert implícita no es aquí necesaria, pero hace una descripción formal igual de las siguientes etapas posibles:
imagen7
para w > 0 y
imagen8
5
[0095] En el dominio de tiempo, se realiza primero una transformación de Hilbert 906 de la señal de audio de
entrada f 102 para generar una señal analítica 908.
imagen9
10
y
imagen10
15 a continuación, la señal analítica jLFk, es modulada por banda lateral individual 710 con un modulador p(n) 902:
imagen11
o
20
imagen12
[0096] De esta manera, se puede generar una señal de alta frecuencia de extensión de ancho de banda que se denomina también señal modulada 910.
25
[0097] A continuación, una formación de ventana (también posible con superposición) de la señal de entrada 912 y de la señal extendida 914 y una transformación de Fourier 916 son efectuados:
, . NFFT ,
30
y
vAn) = v(4
NFFT
+ vr\oó(n,NFFT) +1) • win(mod{n, NFFT) +1)
35 en la que una NFFT es una vez más el número de bins de transformación de Fourier rápida (por ejemplo 256, 512, 1024 bins u otro número entre 24 y 232), ^ es el número de ventana y win(.) es una función de ventana. Así, NeN bloques 914 son creados de la señal original y en relación con tantos espectros de amplitud O^(w), ^(w) con ^ ^ N como valores absolutos de la transformada de Fourier 916.
40
imagen13
pueden describir el índice del borde de banda k en la transformada de Fourier.
[0098] El proceso en el dominio de tiempo se muestra en la figura 9.
45
[0099] La siguiente etapa es el cálculo 720 de la correlación cruzada R^k (el parámetro de comparación puede ser igual al resultado de la correlación cruzada) de los espectros de amplitud parciales de la señal original y la señal extendida lo que puede ser expresado matemáticamente por:
imagen14
y>0 v < 0
con
imagen15
5
[0100] 8 puede indicar el retraso máximo (la frecuencia de desplazamiento máxima) para el cual se calcula una
correlación cruzada. Si la correlación cruzada debe ser calculada con una predisposición, es decir, retrasos pequeños y así se deberían preferir grandes superposiciones, así que se debe seleccionar p=0. Por el contrario, si se debe compensar que menos bins de FFT (bins de transformación de Fourier rápida) están superpuestos para retrasos más 10 grandes que pequeños, se debe escoger (3=1. En general, se puede escoger 0<(3eP de forma arbitraria. Alternativa o
adicionalmente, se puede escoger ' ’ ~ -' para seleccionar una región de la correlación cruzada que es
un poco más grande que una interconexión parche. Con esto la región que es considerada por la correlación cruzada
£
puede ser extendida por 2 en ambos extremos espectrales del parche particular.
15 [0101]
En base a estos resultados de la correlación cruzada, un máximo de la correlación cruzada 730
m<j. :=max{Rsk(v))
y el retraso d^,k de la correlación máxima
20
imagen16
pueden ser determinados.
25 [0102] Adicionalmente, las proporciones 920 de las energías o potencias en las interconexiones o parches
pueden ser determinadas por los espectros de densidad de energía:
imagen17
30 [0103] Si no se puede determinar ningún máximo claro 924, el retraso se vuelve a poner a 0 (como se muestra
en el número de referencia 922). De otra manera el retraso estimado 918 puede ser el retraso correspondiente a la correlación cruzada máxima. Para esto, un criterio de umbral, d^,k > t con t que se va a seleccionar puede ser determinado. Alternativamente, se puede observar la curvatura o una planura espectral (SFN) de la correlación cruzada R$,k, por ejemplo:
35
imagen18
o
con
imagen19
imagen20
[0104] Los retrasos d^.k y los parámetros de densidad de energía Z&k pueden ser interpolados 926 para obtener un valor para cada paso de tiempo:
5
gk (n) := interp(cw); K {n) = ¡nterpícf, *)
[0105] A continuación, se puede generar la función de modulación global modulada en amplitud modificada y desplazada en frecuencia:
10
n
/\(n) = ^(n)e
fi(n) = ]?gk(n)e
[0106] Esta función de modulación global o los parámetros de la función de modulación global se pueden proporcionar 740 con la señal de salida para almacenamiento o transmisión.
15
[0107] Adicionalmente, se pueden determinar parámetros adicionales para corrección de fluido y/o corrección de tonalidad.
[0108] La modulación en el decodificador puede ser realizada por:
20
tp(n}=<pLF(n) ■ jj{ri)
y además de las k modulaciones parciales (si hay más de un parche o interconexión). Para esta función de modulación global |Jk(n) o j(n) o los parámetros Zk(n) y A*(n) o c^,k y d^,k de la función de modulación global pueden ser codificados 25 apropiadamente, por ejemplo mediante cuantificación. Opcionalmente, la velocidad de toma de muestras puede ser reducida y se puede introducir una histéresis.
[0109] El cálculo de los retrasos puede ser omitido, si no hay ninguna señal tonal, por ejemplo, en silencio, transitorios o ruido. En estos casos, el retraso puede ser ajustado a cero.
30
[0110] La figura 10 muestra en más detalle un ejemplo 1000 para determinar el retraso.
[0111] Para un cuadro de tiempo o ventana ^=¡ 1010 el retraso v es ajustado a menos A como valor de partida. A continuación, la correlación cruzada R$,k(v) es calculada 720. Si v es más pequeño que A 1030, entonces v es
35 incrementado 1032 y el siguiente parámetro de comparación en términos de la correlación cruzada es calculado 720. Si v es mayor o igual que A 1030, entonces el retraso correspondiente a la correlación cruzada calculada máxima puede ser determinado 730. Si el máximo es claramente identificable 924 el retraso determinado es usado como parámetro d^,k 918. De otra manera, el retraso es ajustado a 0 y usado como parámetro d^,k=0 922.
40 [0112] A continuación, todo el proceso se repite 1040 para el siguiente cuadro de tiempo ^=^+1 1050. Los
retrasos determinados pueden ser interpolados 926 para obtener un parámetro para cada paso de tiempo N.
[0113] El cálculo de la pluralidad de parámetros de comparación, por ejemplo, el resultado de la correlación cruzada se puede hacer también en paralelo si se usan una pluralidad de comparadores. También, el procesamiento
45 de diferentes cuadros de tiempo se puede hacer en paralelo, si los elementos físicos necesarios están disponibles varias veces. El bucle para calcular la correlación cruzada puede también iniciar en +A y puede ser disminuido cada bucle hasta v < A.
[0114] La figura 11 muestra una ilustración esquemática de la interpolación 926 de las frecuencias de 50 desplazamiento de diferentes cuadros de tiempo, intervalos de tiempo o ventanas. La figura 11a muestra la
interpolación 1100, si los cuadros de tiempo no se traslapan o superponen. Se determina un retraso d^,k para todo un cuadro de tiempo 1110. La manera más fácil para interpolar un parámetro para cada paso de tiempo 1120 se puede
realizar al ajustar los parámetros de todos los pasos de tiempo 1120 de un cuadro de tiempo 1110 igual al retraso correspondiente d$,k. En los bordes de un cuadro de tiempo, se puede seleccionar el retraso del cuadro de tiempo previo o siguiente. Por ejemplo, los parámetros Ak(n) a Ak(n+3) son igual a d^,k y los parámetros Ak(n+4) a Ak(n+7) son iguales a d?+1,k.
5
[0115] Alternativamente, los retrasos de los cuadros de tiempo 1110 pueden ser interpolados linealmente entre
los cuadros de tiempo. Por ejemplo:
10
a(»+i
4
[0116] De manera conveniente, la figura 11B muestra un ejemplo 1150 para cuadros de tiempo superpuestos
1110. En este caso, un paso de tiempo 1120 está asociada a más de un cuadro de tiempo 1110. Por consiguiente, más de un retraso determinado se puede asociar a un paso de tiempo 1120. Así, los retrasos determinados pueden ser interpolados 926 para obtener un parámetro para cada paso de tiempo 1120. Por ejemplo, los retrasos 15 determinados correspondientes a un paso de tiempo 1120 pueden ser interpolados linealmente. Por ejemplo, una interpolación posible puede ser:
20
\k(n)=d
6-1.*
Xt (« + 2) = d^k
x,(„+3)=4t±4íü
[0117] Alternativamente, la interpolación también se puede hacer, por ejemplo, mediante una filtración mediana.
[0118] La interpolación se puede realizar por medio de interpolación. Los medios de interpolación pueden ser 25 parte de la unidad de extracción de parámetros o la interfaz de salida o pueden ser una unidad separada.
[0119] En el lado del decodificador, la extensión de ancho de banda se puede hacer mediante:
i¡/(n).=(pU:{n)-pi(n)
[0120] Después de la decodificación de |i(n) y ^lf(N) como salida del codificador del núcleo. Adicionalmente,
y (n) puede ser adaptado con los parámetros previamente de los parámetros obtenidos de la señal original para el nivel de tonalidad y/o ruido.
[0121] El cálculo de la función de modulación global en el decodificador se hace según una o ambas de las
siguientes fórmulas:
i//(n) =2_, <Pifk (n) ■ Mk (n)+ noise(n)
k=]
5 y
y/(n) = <ptf(n)-//(n) + noise(n)
[0122]
10
La parte imaginaria de la señal puede ser ignorada:
o(n) = Re(ty(n))
[0123] A continuación, como se menciona anteriormente, puede seguir una corrección de tonalidad, por ejemplo, mediante filtración inversa.
15
[0124] La figura 12 muestra un diagrama de bloques de un decodificador de extensión de ancho de banda 1200 para proporcionar una señal de audio extendida en ancho de banda 532 basada en una señal de audio de entrada 502 según una realización de la invención. El decodificador de extensión de ancho de banda 1200 comprende un generador de parche 1210, un comparador 1220, un combinador 1230 y una interfaz de salida 1240. El generador de
20 parche 1210 está conectado al comparador 1220, el comparador 1220 está conectado al combinador 1230 y el combinador 1230 está conectado a la interfaz de salida 1240.
[0125] El generador de parche 1210 genera al menos una señal de alta frecuencia de extensión de ancho de
banda 1212 que comprende una banda de alta frecuencia basada en la señal de audio de entrada 502, en la que una
25 frecuencia de corte inferior de la banda de alta frecuencia de una señal de alta frecuencia de extensión de ancho de banda 1212 es más baja que una frecuencia de corte superior de la señal de audio de entrada 502. Diferentes señales de alta frecuencia de extensión de ancho de banda 1212 comprenden diferentes frecuencias dentro de sus bandas de alta frecuencia, si se generan diferentes señales de alta frecuencia de extensión de ancho de banda 1212.
30 [0126] El comparador 1220 calcula una pluralidad de parámetros de comparación. Un parámetro de
comparación se calcula en base a una comparación de la señal de audio de entrada 502 y una señal de alta frecuencia de extensión de ancho de banda generada 1212. Cada parámetro de comparación de la pluralidad de parámetros de comparación se calcula en base a una frecuencia de desplazamiento diferente entre la señal de audio de entrada 502 y una señal de alta frecuencia de extensión de ancho de banda generada 1212. Además, el comparador determina un
35 parámetro de comparación de la pluralidad de parámetros de comparación, en el que el parámetro de comparación determinado satisface un criterio predefinido.
[0127] Un combinador 1230 combina la señal de audio de entrada 502 y la señal de alta frecuencia de extensión de ancho de banda 1212 para obtener la señal de audio extendida en ancho de banda 532, en la que la señal de alta
40 frecuencia de extensión de ancho de banda 1212 está basada en una frecuencia de desplazamiento correspondiente al parámetro de comparación determinado.
[0128] La interfaz de salida 1240 proporciona la señal de audio extendida en ancho de banda 532.
45 [0129] En comparación con el decodificador mostrado en la figura 5 el decodificador descrito 1200 determina
la frecuencia de desplazamiento por sí mismo. Por consiguiente, no es necesario recibir este parámetro con la señal de audio de entrada 502. De esta manera, la proporción de bits para transmisión o almacenamiento de señales de audio puede ser reducida adicionalmente.
50 [0130] Como se describe para la figura 1, el generador de parche 1210 puede generar una pluralidad de
señales de alta frecuencia de extensión de ancho de banda con diferentes frecuencias de desplazamiento o solamente una señal de alta frecuencia de extensión de ancho de banda que es desplazada por diferentes frecuencias de desplazamiento. De nuevo, también se puede usar una combinación de estas dos posibilidades.
55 [0131] La figura 13 muestra un diagrama de flujo de un procedimiento 1300 para proporcionar una señal de
audio extendida en ancho de banda según una realización de la invención. El procedimiento 1300 comprende la generación 1310 de al menos una señal de alta frecuencia de extensión de ancho de banda, el cálculo 1320 de una pluralidad de parámetros de comparación, la determinación 1330 de un parámetro de comparación de la pluralidad de parámetros de comparación, la combinación 1340 de la señal de audio de entrada y una señal de alta frecuencia de
60 extensión de ancho de banda y el suministro 1350 de la señal de audio extendida en ancho de banda.
[0132] Una señal de alta frecuencia extendida en ancho de banda comprende una banda de alta frecuencia basada en la señal de audio de entrada. Una frecuencia de corte inferior de la banda de alta frecuencia de una señal de alta frecuencia extendida en ancho de banda es más baja que una frecuencia de corte superior de la señal de audio de entrada. Diferentes señales de alta frecuencia de extensión de ancho de banda comprenden diferentes frecuencias
5 dentro de sus bandas de alta frecuencia, si se generan diferentes señales de alta frecuencia de extensión de ancho de banda.
[0133] Se calcula un parámetro de comparación en base a la comparación de la señal de audio de entrada y la señal de alta frecuencia de extensión de ancho de banda generada. Cada parámetro de comparación de la pluralidad
10 de parámetros de comparación es calculado en base a una frecuencia de desplazamiento diferente entre la señal de audio de entrada y la señal de alta frecuencia de extensión de ancho de banda generada.
[0134] El parámetro de comparación determinado cumple un criterio predefinido.
15 [0135] La señal de alta frecuencia de extensión de ancho de banda que es combinada con la señal de audio
de entrada para obtener la señal de audio de ancho de banda está basada en una frecuencia de desplazamiento correspondiente al parámetro de comparación determinado.
[0136] La figura 14 muestra un diagrama de flujo de un procedimiento 1400 para proporcionar una señal de
20 audio extendida en ancho de banda según una realización de la invención.
[0137] Después de recibir 1402 una corriente de bits que comprende la señal de audio de entrada, un
decodificador de núcleo decodifica 1410 la señal de audio de entrada. En base a la señal de audio de entrada, se
genera una señal de alta frecuencia de extensión de ancho de banda 1310 y la pluralidad de parámetros de
25 comparación en términos de una correlación cruzada entre la señal de audio de entrada y una señal de alta frecuencia de extensión de ancho de banda generada con diferentes frecuencias de desplazamiento son calculadas 1320. A continuación, se determina el parámetro de comparación que cumple el criterio predefinido 1330 que se denomina también estimación de retraso.
30 [0138] En base a la frecuencia de desplazamiento correspondiente al parámetro de comparación determinado,
un modulador puede modular 1420 la señal de audio de entrada. Adicionalmente, un parámetro puede ser extraído 1430 de la corriente de bits recibida 1402 para adaptar, por ejemplo, la densidad de energía de la señal modulada. La señal modulada se combina a continuación 1340 con la señal de audio de entrada. Adicionalmente, la tonalidad y el ruido de la señal de audio extendida en ancho de banda pueden ser corregidos 1440. Esto también se puede hacer
35 antes de la combinación con la señal de audio de entrada. A continuación, los datos de audio en términos de la señal de audio extendida en ancho de banda se proporcionan 1350, por ejemplo, para reproducción acústica.
[0139] De esta manera, el cálculo de la modulación variable en el tiempo se hace en el lado del decodificador.
40 [0140] Alternativamente al modulador que modula 1420 la señal de audio de entrada para generar una
interconexión o parche, por ejemplo, se puede utilizar la señal de alta frecuencia de extensión de ancho de banda ya generada previamente o el generador de parche puede generar una señal de alta frecuencia de extensión de ancho de banda (parche) en base a la frecuencia de desplazamiento correspondiente al parámetro de comparación determinado.
45
[0141] En otras palabras, si la velocidad de datos baja es más importante que una complejidad baja del lado
del decodificador, la determinación de la modulación de frecuencia de los moduladores también se puede hacer en el lado del decodificador. Para esto, se puede ejecutar el algoritmo mostrado en la figura 9 en el decodificador con solo algunos cambios. Puesto que la señal original no está disponible para el cálculo de la correlación cruzada en el
50 decodificador, las correlaciones pueden ser calculadas entre la señal original (señal de audio de entrada) y una señal original desplazada (señal de audio de entrada) dentro de un intervalo de superposición. Por ejemplo, la señal puede ser desplazada entre cero y ak, por ejemplo, ak dividido por 2, ak dividido por 3 o ak dividido por 4. ak indica otra vez el k-ésimo borde de banda, por ejemplo, a1 indica la frecuencia de cruce del codificador de núcleo.
55 [0142] Por ejemplo, esto puede suceder de la misma manera en el codificador como en el decodificador. En el
codificador, los parámetros para formación espectral, corrección de ruido y/o corrección de tonalidad pueden ser extraídos y transmitidos al decodificador.
[0143] De manera conveniente, la figura 15 muestra un diagrama de bloques de un codificador de extensión
60 de ancho de banda 1500 para proporcionar una señal de salida utilizando una señal de audio de entrada. El codificador 1500 corresponde al codificador mostrado en la figura 4. Sin embargo, el codificador 1500 no proporciona la señal de salida 132 con una indicación de parámetro basada en la frecuencia de desplazamiento misma. Puede determinar solamente un parámetro de densidad de energía y parámetros opcionales para corrección de tonalidad y corrección de ruido e incluye una indicación de parámetro de estos parámetros a la señal de salida 132. Sin embargo, el parámetro
65 de densidad de energía (y también los otros parámetros, si son determinados) se determina en base a la frecuencia de desplazamiento correspondiente al parámetro de comparación determinado.
[0144] Por ejemplo, el parámetro de densidad de energía puede indicar la proporción entre la señal de audio de entrada 102 y la señal de alta frecuencia de extensión de ancho de banda con una frecuencia de desplazamiento correspondiente al parámetro de comparación determinado. Por consiguiente, la indicación de parámetro que está
5 relacionada con el parámetro de densidad de energía y opcional a los parámetros para corrección de tonalidad y/o corrección de ruido está basada en la frecuencia de desplazamiento correspondiente al parámetro de comparación determinado.
[0145] Una diferencia adicional entre el codificador 1500 y el codificador mostrado en la figura 4 es que el 10 generador de parche 110 genera una señal de alta frecuencia de extensión de ancho de banda de la misma manera
en que el generador de parche del decodificador 1400 lo hace. De esta manera, el codificador 1500 y el decodificador pueden obtener las mismas frecuencias de desplazamiento y por consiguiente, los parámetros extraídos por el codificador 1500 son válidos para las interconexiones generadas por el decodificador.
15 [0146] Algunas realizaciones según la invención se refieren a un dispositivo y un procedimiento para extensión
de ancho de banda de señales de audio en el dominio de tiempo mediante el uso de moduladores variables de tiempo. En otras palabras, un parche puede ser generado con frecuencia de corte variable, por ejemplo, para cada paso de tiempo, cada marco de tiempo, una parte de un marco de tiempo o para grupos de marcos de tiempo.
20 [0147] El procedimiento descrito para extensión del ancho de banda de una señal de audio se puede utilizar
en el lado del codificador y el lado del decodificador así como solo en el lado del decodificador. Por el contrario, para procedimientos conocidos, el nuevo procedimiento descrito puede llevar a cabo una extensión denominada armónica del ancho de banda sin la necesidad de información exacta sobre la frecuencia fundamental de la señal de audio. Además, en contraste con las extensiones de ancho de banda denominadas armónicas como, por ejemplo, mostradas 25 por la solicitud de patente provisional de EE.UU. "F.Nagel, S. Disch: "Apparatus and method of harmonic bandwidth extension in audio signals"" con el número de solicitud US 61/025129 que son realizadas por medio de vocodificadores de fase, el espectro puede no ser esparcido y por consiguiente, también la densidad puede no ser cambiada. Para asegurar la armonía, se aprovechan correlaciones entre la banda extendida y la banda base. Esta correlación puede ser calculada en el codificador, así como en el decodificador, dependiendo de la demanda para cómputo y complejidad 30 de memoria y velocidad de datos.
[0148] Por ejemplo, la extensión de ancho de banda en sí misma se puede hacer mediante el uso de una modulación de amplitud (AM) y un desplazamiento de frecuencia por medio de una sola modulación de banda lateral (SSB) con una pluralidad de portadores variables en el tiempo lentos, adaptables únicos. Un post-procesamiento
35 siguiente según parámetros adicionales puede intentar aproximar la envolvente espectral y el nivel de ruido, así como otras propiedades de las señales originales.
[0149] El nuevo procedimiento para transformación de señales puede evitar los problemas que aparecen debido a una operación de copia simple o reflejo por una continuación correcta armónica del espectro por medio de
40 una frecuencia de corte variable en el tiempo XOver entre la región de baja frecuencia (LF) y la región de alta frecuencia (HF) también como entre las siguientes regiones de alta frecuencia, los llamados parches o interconexiones. Estas frecuencias de corte son escogidas de tal manera que los parches generados reparan una trama armónica existente ya que era existente en el original tan bueno como sea posible.
45 [0150] La figura 16 muestra un modulador con 3 amplitudes variables en el tiempo y frecuencias de corte
mediante los cuales 3 parches pueden ser generados mediante la modulación individual de banda lateral de las bandas base. La figura 16a muestra un diagrama 1600a del espectro de la señal extendida en ancho de banda mediante el uso de frecuencias de corte variables en el tiempo 1610. La figura 16b ilustra un diagrama 1600b del espectro de la señal de audio de los tres tonos. En comparación con el espectrograma ilustrado en la figura 18b las líneas 1620 son 50 significativamente menos discontinuas.
[0151] La figura 17 ilustra el efecto por medio de un diagrama 1700 del período. El espectro de densidad de energía de los terceros tonos de la señal de audio es mostrado como original 1710, con una frecuencia de corte constante 1720 y con una frecuencia de corte variable 1730. En contraste con el uso de la frecuencia de corte
55 constante 1720, la estructura armónica permanece mediante el uso de la frecuencia de corte variable 1730.
[0152] Mediante la continuación armónica del espectro, se pueden evitar problemas en los puntos de transición entre ambos, la banda base (codificador del núcleo) y la banda extendida, y entre parches subsecuentes. Sin una estimación de F0 como requisito para la función del sistema, señales arbitrarias pueden ser armónicas continuadas,
60 sin la existencia de artefactos audibles, ni por violar la armonía ni por eventos de sonido transitorios.
[0153] Algunas realizaciones según la invención se refieren a un procedimiento apropiado para todas las
aplicaciones de audio, en donde el ancho de banda completo no está disponible. Por ejemplo, para la difusión de contenido de audio como, por ejemplo, con radio digital, la corriente o flujo de Internet o en aplicaciones de
65 comunicación de audio, se puede usar el procedimiento descrito.
[0154] Realizaciones adicionales según la invención se refieren a un decodificador de extensión de ancho de banda para proporcionar una señal de audio extendida en ancho de banda basada en una señal de audio de entrada y una señal de parámetro, en el que la señal de parámetro comprende una indicación de un parámetro de densidad de energía. El decodificador de extensión de ancho de banda comprende un generador de parche, un combinador y
5 una interfaz de salida. El generador de parche está configurado para generar una señal de alta frecuencia de extensión de ancho de banda que comprende una banda de alta frecuencia, en la que la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda se genera basada en un desplazamiento de frecuencia de una banda de frecuencia de la señal de audio de entrada, en la que el desplazamiento de frecuencia se basa en la frecuencia de desplazamiento y en la que el generador de parche está configurado para amplificar o atenuar la banda de alta
10 frecuencia de la señal de alta frecuencia de extensión de ancho de banda por un factor igual al valor del parámetro de densidad de energía o igual al valor recíproco del parámetro de densidad de energía. El combinador está configurado para combinar la señal de alta frecuencia de extensión de ancho de banda y la señal de audio de entrada para obtener la señal de audio extendida de ancho de banda. La interfaz de salida está configurada para proporcionar la señal de audio extendida de ancho de banda.
15
[0155] Algunas realizaciones preferidas adicionales según la invención se refieren a un decodificador de extensión de ancho de banda como se describe anteriormente, en el que el generador de parche está configurado para amplificar o atenuar la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda por un factor igual al valor de un parámetro de densidad de energía o igual al valor recíproco del parámetro de densidad
20 de energía, en el que una indicación del parámetro de densidad de energía está contenido por la señal de audio de entrada.
[0156] En particular, se indica que, dependiendo de las condiciones, el esquema de la invención puede ser implementado también en software. La implementación se puede hacer por un medio de almacenamiento digital,
25 particularmente un disco flexible o un CD con señales de control que se pueden leer electrónicamente capaces de cooperar con un sistema de ordenador programable de tal manera que se ejecute el procedimiento correspondiente. En general, la invención también consiste de este modo en un producto de programa de ordenador con códigos de programa almacenados en un soporte que se puede leer por la máquina para efectuar el procedimiento de la invención, cuando el producto de programa de ordenador es ejecutado en un ordenador. En otras palabras, la invención puede
30 ser realizada también de este modo como un programa de ordenador con un código de programa para efectuar el procedimiento, cuando el programa de ordenador es ejecutado en un ordenador.

Claims (8)

  1. REIVINDICACIONES
    1. Un codificador de audio para proporcionar una señal de salida (132) mediante el uso de una señal de
    audio de entrada (102), que comprende:
    5
    un generador de parche (110) configurado para generar una señal de alta frecuencia de extensión de ancho de banda (112), en el que la señal de alta frecuencia de extensión de ancho de banda (112) comprende una banda de alta frecuencia, en el que la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda (112) se deriva de una banda de baja frecuencia de la señal de audio de entrada (102) mediante el desplazamiento de la 10 parte de baja frecuencia por un valor fijo mediante el uso de una modulación de banda lateral, de tal manera que la banda de alta frecuencia esté localizada por encima de la banda de baja frecuencia de la señal de audio de entrada (102);
    un comparador (120) configurado para llevar a cabo una comparación de la señal de audio de entrada filtrada por un 15 filtro de paso de banda (420) y la señal de alta frecuencia de extensión de ancho de banda (112) mediante el uso de un cálculo de correlación cruzada en intervalos de tiempo regulares entre espectros de amplitud de secciones de señal en ventana de la señal de audio de entrada filtrada por el filtro de paso de banda (420) y la señal de alta frecuencia de extensión de ancho de banda (112) para determinar un retraso para una correlación máxima para una sección de señal; y
    20
    una interfaz de salida (130) configurada para proporcionar la señal de salida (132) para transmisión o almacenamiento, en la que la señal de salida (132) comprende una indicación de parámetro basada en el retraso para la correlación máxima.
    25 2. Codificador de audio según la reivindicación 1, que comprende un comparador de densidad de energía
    (430) configurado para comparar un parámetro basado en una densidad de energía de la banda de alta frecuencia de una señal de alta frecuencia de extensión de ancho de banda generada (112) y una banda de frecuencia correspondiente de la señal de audio de entrada (102) para obtener un parámetro de densidad de energía, en el que el parámetro de densidad de energía indica una proporción basada en la densidad de energía de la banda de alta 30 frecuencia de la señal de alta frecuencia de extensión de ancho de banda generada (112) y la banda de frecuencia correspondiente de la señal de audio de entrada (102), y en el que la interfaz de salida (130) está configurada para proporcionar la señal de salida de forma que la indicación del parámetro de la señal de salida (132) esté basada en el parámetro de densidad de energía.
    35 3. Codificador de audio según la reivindicación 1, en el que la modulación de banda lateral es una
    modulación de banda lateral única.
  2. 4. Codificador de audio según la reivindicación 1 o 2, que se ha configurado para interpolar en el que el
    retraso para la correlación máxima determinada para una sección de señal en ventana se interpola para cada paso de
    40 tiempo de la sección de señal en ventana.
  3. 5. Un decodificador de extensión de ancho de banda para proporcionar una señal de audio extendida en ancho de banda (532) basada en una señal de audio de entrada (502) y una señal de parámetro (504), en el que la señal de parámetro (504) comprende una indicación de una frecuencia de desplazamiento y una indicación de un
    45 parámetro de densidad de energía, en el que el decodificador de extensión de ancho de banda comprende:
    un generador de parche (510) configurado para generar una señal de alta frecuencia de extensión de ancho de banda (512) que comprende una banda de alta frecuencia, en el que la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda (512) es generada por una modulación de banda lateral única de la señal de audio 50 de entrada (502) en base a la frecuencia de desplazamiento y al parámetro de densidad de energía para obtener la señal de alta frecuencia de extensión de ancho de banda, en el que el generador de parche (501) está configurado para llevar a cabo la modulación de banda lateral única en un dominio de tiempo con una interpolación y/o filtrado para cada paso de tiempo;
    55 un combinador (529) configurado para combinar la señal de alta frecuencia de extensión de ancho de banda (512) y la señal de audio de entrada (502) para obtener la señal de audio extendida en ancho de banda (532); y
    una interfaz de salida (530) configurada para proporcionar la señal de audio extendida en ancho de banda (532).
    60 6. Decodificador de extensión de ancho de banda según la reivindicación 5, que comprende un medio de
    interpolación, en el que un marco de tiempo comprende una pluralidad de pasos de tiempo, en el que cada marco de tiempo comprende una frecuencia de desplazamiento correspondiente, en el que los medios de interpolación están configurados para interpolar una frecuencia de desplazamiento de un marco de tiempo o una pluralidad de frecuencias de desplazamiento de diferentes marcos de tiempo para cada paso de tiempo de un marco de tiempo para obtener 65 una frecuencia de desplazamiento interpolada para cada paso de tiempo.
  4. 7. Decodificador de extensión de ancho de banda según una de las reivindicaciones 5 o 6, en el que el
    generador de parche está configurado para calcular la señal de alta frecuencia de extensión de ancho de banda (512) basándose en las siguientes ecuaciones:
    5
    o
    10
    y
    imagen1
    imagen2
    imagen3
    15 donde n es un índice de tiempo, k es un índice de parche, ^ es una señal compleja de dominio de tiempo, 9 es la señal de audio de entrada (502), m es una función de modulación, noise es una señal de ruido, o es la señal de alta frecuencia de extensión de ancho de banda, y Re es una función para tomar la parte real.
  5. 8. Decodificador de extensión de ancho de banda según una de las reivindicaciones 5 a 7, en el que el
    20 generador de parche está configurado para utilizar una función de modulación que va a ser multiplicada por la señal de audio de entrada (502), en el que la función de modulación está basada en la siguiente ecuación:
    fik(n) = £k(n)e
    25 en el que k es un índice de parche, n es un índice de tiempo, es un valor de una función de modulación para
    un índice de tiempo n, $k(n) es un parámetro de densidad de energía interpolada para un índice de tiempo n y un índice de parche k, m es un índice de número entero, j es el número complejo, g(m) es un incremento de fase para el índice de parche k y el índice de número entero m, y !k(m) es un valor de retraso interpolado para el índice de parche k y el índice de número entero m, estando el valor de retraso interpolado derivado de la señal de parámetro (504) que 30 comprende una indicación de una frecuencia de desplazamiento.
  6. 9. Decodificador de extensión de ancho de banda según una de las reivindicaciones 5 a 8, en el que el
    generador de parche está configurado para utilizar una función de modulación que va a ser multiplicada por la señal de audio de entrada (502), en el que la función de modulación está basada en la siguiente ecuación:
    35
    K 2 .rj \ (m)+ 4 (m))
    fi(n) = 2>*(n)e ''"!
    *=1
    donde k es un índice de parche, kmax es un número máximo de parches, n es un índice de tiempo, es un valor
    de una función de modulación para un índice de tiempo n, ^k(n) es un parámetro de densidad de energía interpolada 40 para un índice de tiempo n y un índice de parche k, m es un índice de número entero, j es el número complejo, g(m) es un incremento de fase para el índice de parche k y el índice de número entero m, y 4<(m) es un valor de retraso interpolado para el índice de parche k y el índice de número entero m, estando el valor de retraso interpolado derivado de la señal de parámetro (504) que comprende una indicación de una frecuencia de desplazamiento.
    45 10. Procedimiento (700) para proporcionar una señal de salida mediante el uso de una señal de audio de
    entrada, comprendiendo el procedimiento:
    la generación (710) de una señal de alta frecuencia de extensión de ancho de banda (112), en el que la señal de alta frecuencia de extensión de ancho de banda (112) comprende una banda de alta frecuencia, en el que la banda de alta 50 frecuencia de la señal de alta frecuencia de extensión de ancho de banda (112) se deriva de una banda de baja frecuencia de la señal de audio de entrada (102) por medio del desplazamiento de la parte de baja frecuencia por un valor fijo mediante el uso de una modulación de banda lateral, de forma que la banda de alta frecuencia esté localizada por encima de la banda de baja frecuencia de la señal de audio de entrada (102);
    55 la realización (720) de una comparación de la señal de audio de entrada filtrada por un filtro de paso de banda (420)
    y la señal de alta frecuencia de extensión de ancho de banda (112) mediante el uso de un cálculo de correlación cruzada en intervalos de tiempo regulares entre espectros de amplitud de secciones de señal en ventana de la señal de audio de entrada filtrada por el filtro de paso de banda (420) y la señal de alta frecuencia de extensión de ancho de banda (112) para determinar un retraso para una correlación máxima para una sección de señal; y 5
    el suministro (740) de la señal de salida (132) para transmisión o almacenamiento, en el que la señal de salida (132) comprende una indicación de parámetro basada en el retraso para la correlación máxima.
  7. 11. Procedimiento (800) para proporcionar una señal de audio extendida en ancho de banda en base a una 10 señal de audio de entrada y una señal de parámetro, en el que la señal de parámetro comprende una indicación de
    una frecuencia de desplazamiento y una indicación de un parámetro de densidad de energía, comprendiendo el procedimiento:
    la generación (810) de una señal de alta frecuencia de extensión de ancho de banda que comprende una banda de 15 alta frecuencia, en el que la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda es generada por una modulación de banda lateral única de la señal de audio de entrada (502) en base a la frecuencia de desplazamiento y el parámetro de densidad de energía para obtener la señal de alta frecuencia de extensión de ancho de banda, en el que el generador de parche (501) está configurado para llevar a cabo la modulación de banda lateral única en un dominio de tiempo con una interpolación y/o filtración para cada paso de tiempo;
    20
    la combinación (830) de la señal de alta frecuencia de extensión de ancho de banda y la señal de audio de entrada (502) para obtener una señal de audio extendida en ancho de banda; y
    el suministro (840) de la señal de audio extendida en ancho de banda.
    25
  8. 12. Un programa informático con un código de programa para efectuar el procedimiento según una de las reivindicaciones 10 u 11, cuando el programa informático se ejecuta en un ordenador o un microcontrolador.
ES15167199.7T 2008-12-15 2009-12-11 Codificador de audio y decodificador de extensión de ancho de banda Active ES2674386T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US12255208P 2008-12-15 2008-12-15
US122552P 2008-12-15

Publications (1)

Publication Number Publication Date
ES2674386T3 true ES2674386T3 (es) 2018-06-29

Family

ID=42104496

Family Applications (9)

Application Number Title Priority Date Filing Date
ES23180061T Active ES2968884T3 (es) 2008-12-15 2009-12-11 Decodificador de extensión de audio de ancho de banda, procedimiento correspondiente y programa de ordenador
ES23180085T Active ES2968886T3 (es) 2008-12-15 2009-12-11 Decodificador de extensión de audio de ancho de banda, procedimiento correspondiente y programa de ordenador
ES22166970T Active ES2951163T3 (es) 2008-12-15 2009-12-11 Decodificador de extensión de ancho de banda de audio, procedimiento correspondiente y programa informático
ES09797003.2T Active ES2613941T3 (es) 2008-12-15 2009-12-11 Codificador de audio y descodificador de extensión de ancho de banda
ES23180374T Active ES2966659T3 (es) 2008-12-15 2009-12-11 Decodificador de extensión de ancho de banda de audio, procedimiento correspondiente y programa informático
ES15167199.7T Active ES2674386T3 (es) 2008-12-15 2009-12-11 Codificador de audio y decodificador de extensión de ancho de banda
ES23180084T Active ES2968885T3 (es) 2008-12-15 2009-12-11 Decodificador de extensión de audio de ancho de banda, procedimiento correspondiente y programa de ordenador
ES18151917T Active ES2921059T3 (es) 2008-12-15 2009-12-11 Decodificador de extensión de ancho de banda de audio, programa informático y procedimiento correspondiente
ES23180365T Active ES2968852T3 (es) 2008-12-15 2009-12-11 Decodificador de extensión de ancho de banda, procedimiento correspondiente y programa de ordenador

Family Applications Before (5)

Application Number Title Priority Date Filing Date
ES23180061T Active ES2968884T3 (es) 2008-12-15 2009-12-11 Decodificador de extensión de audio de ancho de banda, procedimiento correspondiente y programa de ordenador
ES23180085T Active ES2968886T3 (es) 2008-12-15 2009-12-11 Decodificador de extensión de audio de ancho de banda, procedimiento correspondiente y programa de ordenador
ES22166970T Active ES2951163T3 (es) 2008-12-15 2009-12-11 Decodificador de extensión de ancho de banda de audio, procedimiento correspondiente y programa informático
ES09797003.2T Active ES2613941T3 (es) 2008-12-15 2009-12-11 Codificador de audio y descodificador de extensión de ancho de banda
ES23180374T Active ES2966659T3 (es) 2008-12-15 2009-12-11 Decodificador de extensión de ancho de banda de audio, procedimiento correspondiente y programa informático

Family Applications After (3)

Application Number Title Priority Date Filing Date
ES23180084T Active ES2968885T3 (es) 2008-12-15 2009-12-11 Decodificador de extensión de audio de ancho de banda, procedimiento correspondiente y programa de ordenador
ES18151917T Active ES2921059T3 (es) 2008-12-15 2009-12-11 Decodificador de extensión de ancho de banda de audio, programa informático y procedimiento correspondiente
ES23180365T Active ES2968852T3 (es) 2008-12-15 2009-12-11 Decodificador de extensión de ancho de banda, procedimiento correspondiente y programa de ordenador

Country Status (17)

Country Link
US (13) US8401862B2 (es)
EP (12) EP4231290B1 (es)
JP (3) JP2012512437A (es)
KR (2) KR101424944B1 (es)
CN (1) CN102246231B (es)
AU (1) AU2009328247B9 (es)
BR (2) BRPI0917762B1 (es)
CA (5) CA2908550C (es)
DK (1) DK3364414T3 (es)
ES (9) ES2968884T3 (es)
HK (2) HK1217810A1 (es)
HU (9) HUE064773T2 (es)
MX (1) MX2011006163A (es)
PL (12) PL4231292T3 (es)
PT (3) PT2359366T (es)
TR (1) TR201808500T4 (es)
WO (1) WO2010069885A1 (es)

Families Citing this family (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6992481B2 (en) 2003-05-29 2006-01-31 Timex Group B. V. Method for compensating for predictable generated signals in an electronic device
BRPI0917762B1 (pt) * 2008-12-15 2020-09-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V Codificador de áudio e decodificador de extensão de largura de banda
PL3998606T3 (pl) * 2009-10-21 2023-03-06 Dolby International Ab Nadrpóbkowanie w połączonym banku filtrów modułu transpozycji
AU2011226211B2 (en) * 2010-03-09 2014-01-09 Dolby International Ab Apparatus and method for processing an audio signal using patch border alignment
ES2449476T3 (es) 2010-03-09 2014-03-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato, procedimiento y programa de ordenador para procesar una señal de audio
WO2011110494A1 (en) 2010-03-09 2011-09-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Improved magnitude response and temporal alignment in phase vocoder based bandwidth extension for audio signals
FR2961938B1 (fr) * 2010-06-25 2013-03-01 Inst Nat Rech Inf Automat Synthetiseur numerique audio ameliore
US8560330B2 (en) * 2010-07-19 2013-10-15 Futurewei Technologies, Inc. Energy envelope perceptual correction for high band coding
WO2012158333A1 (en) 2011-05-19 2012-11-22 Dolby Laboratories Licensing Corporation Forensic detection of parametric audio coding schemes
US20130006644A1 (en) * 2011-06-30 2013-01-03 Zte Corporation Method and device for spectral band replication, and method and system for audio decoding
US9173025B2 (en) 2012-02-08 2015-10-27 Dolby Laboratories Licensing Corporation Combined suppression of noise, echo, and out-of-location signals
JP2015525374A (ja) * 2012-06-04 2015-09-03 サムスン エレクトロニクス カンパニー リミテッド オーディオ符号化方法及びその装置、オーディオ復号化方法及びその装置、並びにそれを採用するマルチメディア機器
KR101990884B1 (ko) * 2012-09-04 2019-06-19 에스케이 텔레콤주식회사 이종망 간의 통신품질 향상 방법 및 장치
EP2709106A1 (en) 2012-09-17 2014-03-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating a bandwidth extended signal from a bandwidth limited audio signal
US9258428B2 (en) * 2012-12-18 2016-02-09 Cisco Technology, Inc. Audio bandwidth extension for conferencing
EP2950308B1 (en) * 2013-01-22 2020-02-19 Panasonic Corporation Bandwidth expansion parameter-generator, encoder, decoder, bandwidth expansion parameter-generating method, encoding method, and decoding method
MX346945B (es) 2013-01-29 2017-04-06 Fraunhofer Ges Forschung Aparato y metodo para generar una señal de refuerzo de frecuencia mediante una operacion de limitacion de energia.
CN103971694B (zh) * 2013-01-29 2016-12-28 华为技术有限公司 带宽扩展频带信号的预测方法、解码设备
SG11201505912QA (en) 2013-01-29 2015-08-28 Fraunhofer Ges Forschung Audio encoder, audio decoder, method for providing an encoded audio information, method for providing a decoded audio information, computer program and encoded representation using a signal-adaptive bandwidth extension
EP2981959B1 (en) * 2013-04-05 2018-07-25 Dolby International AB Audio encoder and decoder for interleaved waveform coding
CN104217727B (zh) * 2013-05-31 2017-07-21 华为技术有限公司 信号解码方法及设备
EP2830065A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency
US10083708B2 (en) 2013-10-11 2018-09-25 Qualcomm Incorporated Estimation of mixing factors to generate high-band excitation signal
EP2871641A1 (en) * 2013-11-12 2015-05-13 Dialog Semiconductor B.V. Enhancement of narrowband audio signals using a single sideband AM modulation
JP6593173B2 (ja) * 2013-12-27 2019-10-23 ソニー株式会社 復号化装置および方法、並びにプログラム
EP3092640B1 (en) * 2014-01-07 2018-06-27 Harman International Industries, Incorporated Signal quality-based enhancement and compensation of compressed audio signals
FR3017484A1 (fr) * 2014-02-07 2015-08-14 Orange Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences
JPWO2015151451A1 (ja) * 2014-03-31 2017-04-13 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 符号化装置、復号装置、符号化方法、復号方法、およびプログラム
US9984699B2 (en) * 2014-06-26 2018-05-29 Qualcomm Incorporated High-band signal coding using mismatched frequency ranges
EP2963648A1 (en) * 2014-07-01 2016-01-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio processor and method for processing an audio signal using vertical phase correction
JP2016038435A (ja) * 2014-08-06 2016-03-22 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
US9830927B2 (en) * 2014-12-16 2017-11-28 Psyx Research, Inc. System and method for decorrelating audio data
US10847170B2 (en) 2015-06-18 2020-11-24 Qualcomm Incorporated Device and method for generating a high-band signal from non-linearly processed sub-ranges
KR101677137B1 (ko) * 2015-07-17 2016-11-17 국방과학연구소 변조 스펙트로그램을 이용한 수중 방사체의 데몬 및 lofar 특징을 동시 추출하는 방법 및 장치
EP3182411A1 (en) * 2015-12-14 2017-06-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing an encoded audio signal
EP3182410A3 (en) * 2015-12-18 2017-11-01 Dolby International AB Enhanced block switching and bit allocation for improved transform audio coding
EP3430620B1 (en) * 2016-03-18 2020-03-25 Fraunhofer Gesellschaft zur Förderung der Angewand Encoding by reconstructing phase information using a structure tensor on audio spectrograms
TWI752166B (zh) 2017-03-23 2022-01-11 瑞典商都比國際公司 用於音訊信號之高頻重建的諧波轉置器的回溯相容整合
EP3382703A1 (en) * 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and methods for processing an audio signal
GB2562253B (en) * 2017-05-09 2021-11-03 Imagination Tech Ltd Efficient detection of ranging code correlation function of a GNSS signal
US10896684B2 (en) * 2017-07-28 2021-01-19 Fujitsu Limited Audio encoding apparatus and audio encoding method
CN109729585B (zh) * 2017-10-27 2022-04-15 成都鼎桥通信技术有限公司 网络处理方法和装置
US11158297B2 (en) * 2020-01-13 2021-10-26 International Business Machines Corporation Timbre creation system
CA3192322A1 (en) * 2020-09-09 2022-03-17 Sparrow Acoustics Inc. Method and system for performing time-domain processing of a waveform signal
US20230110255A1 (en) * 2021-10-12 2023-04-13 Zoom Video Communications, Inc. Audio super resolution

Family Cites Families (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2512908A (en) 1947-10-16 1950-06-27 Mina M Arndt Telephone switchboard mounting plate with plug-in components
US5455888A (en) 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
EP0880235A1 (en) 1996-02-08 1998-11-25 Matsushita Electric Industrial Co., Ltd. Wide band audio signal encoder, wide band audio signal decoder, wide band audio signal encoder/decoder and wide band audio signal recording medium
JPH10124088A (ja) 1996-10-24 1998-05-15 Sony Corp 音声帯域幅拡張装置及び方法
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US6549884B1 (en) * 1999-09-21 2003-04-15 Creative Technology Ltd. Phase-vocoder pitch-shifting
US7742927B2 (en) * 2000-04-18 2010-06-22 France Telecom Spectral enhancing method and device
SE0001926D0 (sv) * 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
SE0004187D0 (sv) 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
JP2003108197A (ja) 2001-07-13 2003-04-11 Matsushita Electric Ind Co Ltd オーディオ信号復号化装置およびオーディオ信号符号化装置
EP1351401B1 (en) 2001-07-13 2009-01-14 Panasonic Corporation Audio signal decoding device and audio signal encoding device
US6895375B2 (en) 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech
EP1423847B1 (en) * 2001-11-29 2005-02-02 Coding Technologies AB Reconstruction of high frequency components
US20040002844A1 (en) 2002-06-27 2004-01-01 Jess Jochen A.G. System and method for statistical modeling and statistical timing analysis of integrated circuits
US8090577B2 (en) 2002-08-08 2012-01-03 Qualcomm Incorported Bandwidth-adaptive quantization
JP3861770B2 (ja) 2002-08-21 2006-12-20 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
DE10328777A1 (de) 2003-06-25 2005-01-27 Coding Technologies Ab Vorrichtung und Verfahren zum Codieren eines Audiosignals und Vorrichtung und Verfahren zum Decodieren eines codierten Audiosignals
BRPI0414444B1 (pt) * 2003-09-16 2020-05-05 Matsushita Electric Ind Co Ltd aparelho de codificação, aparelho de decodificação, método de codificação e método de decodificação
DE10345996A1 (de) 2003-10-02 2005-04-28 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Verarbeiten von wenigstens zwei Eingangswerten
DE10345995B4 (de) 2003-10-02 2005-07-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Verarbeiten eines Signals mit einer Sequenz von diskreten Werten
JP4254479B2 (ja) * 2003-10-27 2009-04-15 ヤマハ株式会社 オーディオ帯域拡張再生装置
DE102004046746B4 (de) * 2004-09-27 2007-03-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren zum Synchronisieren von Zusatzdaten und Basisdaten
WO2006049205A1 (ja) * 2004-11-05 2006-05-11 Matsushita Electric Industrial Co., Ltd. スケーラブル復号化装置およびスケーラブル符号化装置
EP1686564B1 (en) * 2005-01-31 2009-04-15 Harman Becker Automotive Systems GmbH Bandwidth extension of bandlimited acoustic signals
JP4604864B2 (ja) 2005-06-14 2011-01-05 沖電気工業株式会社 帯域拡張装置及び不足帯域信号生成器
US7953605B2 (en) * 2005-10-07 2011-05-31 Deepen Sinha Method and apparatus for audio encoding and decoding using wideband psychoacoustic modeling and bandwidth extension
US7953604B2 (en) * 2006-01-20 2011-05-31 Microsoft Corporation Shape and scale parameters for extended-band frequency coding
US20080004866A1 (en) * 2006-06-30 2008-01-03 Nokia Corporation Artificial Bandwidth Expansion Method For A Multichannel Signal
ATE435480T1 (de) * 2006-10-25 2009-07-15 Fraunhofer Ges Forschung Vorrichtung und verfahren zur erzeugung von audio-subband-werten und vorrichtung und verfahren zur erzeugung von zeit-domänen-audio-beispielen
JP2008158300A (ja) * 2006-12-25 2008-07-10 Sony Corp 信号処理装置、信号処理方法、再生装置、再生方法、電子機器
US7912729B2 (en) * 2007-02-23 2011-03-22 Qnx Software Systems Co. High-frequency bandwidth extension in the time domain
DE102008015702B4 (de) 2008-01-31 2010-03-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals
EP2293295A3 (en) * 2008-03-10 2011-09-07 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Device and method for manipulating an audio signal having a transient event
US7977562B2 (en) * 2008-06-20 2011-07-12 Microsoft Corporation Synthesized singing voice waveform generator
US8880410B2 (en) * 2008-07-11 2014-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating a bandwidth extended signal
EP2301026B1 (en) * 2008-07-11 2020-03-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio signal synthesizer and audio signal encoder
WO2010036061A2 (en) * 2008-09-25 2010-04-01 Lg Electronics Inc. An apparatus for processing an audio signal and method thereof
US8258849B2 (en) * 2008-09-25 2012-09-04 Lg Electronics Inc. Method and an apparatus for processing a signal
BRPI0917762B1 (pt) * 2008-12-15 2020-09-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V Codificador de áudio e decodificador de extensão de largura de banda
CA2966469C (en) * 2009-01-28 2020-05-05 Dolby International Ab Improved harmonic transposition
PL3998606T3 (pl) * 2009-10-21 2023-03-06 Dolby International Ab Nadrpóbkowanie w połączonym banku filtrów modułu transpozycji
MX2012001696A (es) * 2010-06-09 2012-02-22 Panasonic Corp Metodo de extension de ancho de banda, aparato de extension de ancho de banda, programa, circuito integrado, y aparato de descodificacion de audio.
WO2012113035A1 (en) 2011-02-25 2012-08-30 Polyline Piping Systems Pty Ltd Mobile plastics extrusion plant
CN105976830B (zh) * 2013-01-11 2019-09-20 华为技术有限公司 音频信号编码和解码方法、音频信号编码和解码装置
US9666202B2 (en) * 2013-09-10 2017-05-30 Huawei Technologies Co., Ltd. Adaptive bandwidth extension and apparatus for the same

Also Published As

Publication number Publication date
US20230049083A1 (en) 2023-02-16
EP2945159B1 (en) 2018-03-21
US20150243293A1 (en) 2015-08-27
EP4231290B1 (en) 2023-11-15
EP4224475C0 (en) 2023-10-11
EP4224475A1 (en) 2023-08-09
ES2613941T3 (es) 2017-05-29
HUE064653T2 (hu) 2024-04-28
PL4231295T3 (pl) 2024-05-06
PL4224474T3 (pl) 2024-04-02
CA2908576A1 (en) 2010-06-24
BRPI0917762B1 (pt) 2020-09-29
EP4053838C0 (en) 2023-06-21
US11594237B2 (en) 2023-02-28
HUE064775T2 (hu) 2024-04-28
US20230032124A1 (en) 2023-02-02
HUE064767T2 (hu) 2024-04-28
PL3364414T3 (pl) 2022-08-16
EP3364414B1 (en) 2022-04-13
CA2908847C (en) 2018-02-13
JP2012512437A (ja) 2012-05-31
ES2921059T3 (es) 2022-08-17
EP4231294C0 (en) 2023-11-15
US20230053046A1 (en) 2023-02-16
CA2908550C (en) 2018-02-13
EP4231291C0 (en) 2023-11-15
CA2908550A1 (en) 2010-06-24
EP4231295B1 (en) 2024-02-21
EP4231293A1 (en) 2023-08-23
EP4231292A1 (en) 2023-08-23
PT2945159T (pt) 2018-06-26
EP4231290C0 (en) 2023-11-15
US20230072871A1 (en) 2023-03-09
EP4231291B1 (en) 2023-11-15
JP6076407B2 (ja) 2017-02-08
EP4231290A1 (en) 2023-08-23
EP2359366A1 (en) 2011-08-24
KR20110095354A (ko) 2011-08-24
KR101424944B1 (ko) 2014-08-01
CA2746837A1 (en) 2010-06-24
HUE064777T2 (hu) 2024-04-28
EP4231293C0 (en) 2023-11-15
HK1217810A1 (zh) 2017-01-20
CN102246231A (zh) 2011-11-16
CA2746837C (en) 2016-09-20
HUE064620T2 (hu) 2024-04-28
EP4053838A1 (en) 2022-09-07
TR201808500T4 (tr) 2018-07-23
US10229696B2 (en) 2019-03-12
US20230377590A1 (en) 2023-11-23
PL2359366T3 (pl) 2017-04-28
PL4231294T3 (pl) 2024-04-08
US11631418B2 (en) 2023-04-18
EP4224474C0 (en) 2023-11-01
MX2011006163A (es) 2011-11-02
EP4224475B1 (en) 2023-10-11
HUE065515T2 (hu) 2024-05-28
US11664039B2 (en) 2023-05-30
US11741978B2 (en) 2023-08-29
EP4231294B1 (en) 2023-11-15
HK1259024A1 (zh) 2019-11-22
EP4224474A1 (en) 2023-08-09
EP4231293B1 (en) 2023-11-15
US20230051135A1 (en) 2023-02-16
PL4231293T3 (pl) 2024-04-08
CA2989886A1 (en) 2010-06-24
US20230037621A1 (en) 2023-02-09
US11626124B2 (en) 2023-04-11
US20190156845A1 (en) 2019-05-23
WO2010069885A1 (en) 2010-06-24
CA2908847A1 (en) 2010-06-24
CA2989886C (en) 2020-05-05
DK3364414T3 (da) 2022-06-27
US11670316B2 (en) 2023-06-06
PL4224475T3 (pl) 2024-03-18
BR122015019030A2 (pt) 2019-08-27
EP4231295A1 (en) 2023-08-23
PL4231290T3 (pl) 2024-04-02
BRPI0917762A2 (pt) 2016-07-26
ES2966659T3 (es) 2024-04-23
AU2009328247B2 (en) 2013-06-06
PL4231291T3 (pl) 2024-04-15
US20210151063A1 (en) 2021-05-20
ES2968886T3 (es) 2024-05-14
KR20130133914A (ko) 2013-12-09
US11646043B2 (en) 2023-05-09
HUE064773T2 (hu) 2024-04-28
US10937437B2 (en) 2021-03-02
PL4053838T3 (pl) 2023-11-13
US11705146B2 (en) 2023-07-18
EP4231292C0 (en) 2023-11-15
US20130185082A1 (en) 2013-07-18
EP4231295C0 (en) 2024-02-21
JP2014142653A (ja) 2014-08-07
EP4231291A1 (en) 2023-08-23
PT2359366T (pt) 2017-01-20
EP4053838B1 (en) 2023-06-21
US9058802B2 (en) 2015-06-16
JP2015187747A (ja) 2015-10-29
HUE064774T2 (hu) 2024-04-28
PL2945159T3 (pl) 2018-08-31
AU2009328247B9 (en) 2013-12-05
KR101369267B1 (ko) 2014-03-04
JP5970014B2 (ja) 2016-08-17
HUE064771T2 (hu) 2024-04-28
ES2968852T3 (es) 2024-05-14
US8401862B2 (en) 2013-03-19
PT3364414T (pt) 2022-07-04
US20230041923A1 (en) 2023-02-09
EP4224474B1 (en) 2023-11-01
CN102246231B (zh) 2013-07-10
ES2968884T3 (es) 2024-05-14
ES2951163T3 (es) 2023-10-18
EP2945159A1 (en) 2015-11-18
EP2359366B1 (en) 2016-11-02
ES2968885T3 (es) 2024-05-14
CA2908576C (en) 2018-11-27
EP3364414A1 (en) 2018-08-22
PL4231292T3 (pl) 2024-04-02
EP4231294A1 (en) 2023-08-23
US20110288873A1 (en) 2011-11-24
EP4231292B1 (en) 2023-11-15
BR122015019030B1 (pt) 2020-05-05
AU2009328247A1 (en) 2011-07-07

Similar Documents

Publication Publication Date Title
ES2674386T3 (es) Codificador de audio y decodificador de extensión de ancho de banda
AU2015203736C1 (en) Audio encoder and bandwidth extension decoder