ES2968852T3 - Decodificador de extensión de ancho de banda, procedimiento correspondiente y programa de ordenador - Google Patents

Decodificador de extensión de ancho de banda, procedimiento correspondiente y programa de ordenador Download PDF

Info

Publication number
ES2968852T3
ES2968852T3 ES23180365T ES23180365T ES2968852T3 ES 2968852 T3 ES2968852 T3 ES 2968852T3 ES 23180365 T ES23180365 T ES 23180365T ES 23180365 T ES23180365 T ES 23180365T ES 2968852 T3 ES2968852 T3 ES 2968852T3
Authority
ES
Spain
Prior art keywords
signal
frequency
bandwidth
parameter
audio signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES23180365T
Other languages
English (en)
Inventor
Frederik Nagel
Guillaume Fuchs
Sascha Disch
Jürgen Herre
Christian Griebel
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Application granted granted Critical
Publication of ES2968852T3 publication Critical patent/ES2968852T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • G10L19/265Pre-filtering, e.g. high frequency emphasis prior to encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Circuits Of Receivers In General (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Amplifiers (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)

Abstract

Un decodificador (500), (600) de extensión de ancho de banda para proporcionar una señal (532) de audio extendida en ancho de banda basada en una señal (502) de audio de entrada y una señal (504) de parámetro, en donde la señal (504) de parámetro comprende una indicación de un frecuencia de compensación y una indicación de un parámetro de densidad de potencia, comprende: un generador de parches (510) configurado para generar una señal de alta frecuencia de extensión de ancho de banda (512) que comprende una banda de alta frecuencia, en donde la banda de alta frecuencia de la extensión de ancho de banda alta -la señal de frecuencia (512) se genera basándose en un desplazamiento de frecuencia de una banda de frecuencia de la señal de audio de entrada (502), en donde el cambio de frecuencia se basa en la frecuencia de compensación, y en donde el generador de parches (510) está configurado para amplificar o atenuar la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda (512) por un factor igual al valor del parámetro de densidad de potencia o igual al valor recíproco del parámetro de densidad de potencia, respectivamente; un combinador (529) configurado para combinar la señal de alta frecuencia de extensión de ancho de banda (512) y la señal de audio de entrada (502) para obtener la señal de audio de extensión de ancho de banda (532); y una interfaz de salida (530) configurada para proporcionar la señal de audio ampliada de ancho de banda (532). (Traducción automática con Google Translate, sin valor legal)

Description

DESCRIPCIÓN
Decodificador de extensión de ancho de banda, procedimiento correspondiente y programa de ordenador[0001]Las realizaciones según la invención se refieren al procesamiento de señales de audio y, en particular, a un decodificador de audio y un procedimiento para proporcionar una señal de audio extendida de ancho de banda.
[0002]La codificación adaptada a la audición de señales de audio para reducción de datos para un almacenamiento y transmisión eficiente de estas señales ha ganado aceptación en muchos campos. Algoritmos de codificación son conocidos, por ejemplo, tales como MPEG A CAPA 3, “MP3” o MPEG 4 AAC. El algoritmo de codificación usado para esto, en particular cuando se obtienen proporciones de bits más bajas, conduce a la reducción de la calidad de audio que es frecuentemente provocada principalmente por una limitación lateral del codificador del ancho de banda de la señal de audio que se va a transmitir. Una señal filtrada de paso bajo se codifica utilizando un llamado codificador de núcleo o codificador central y la región con frecuencias más altas se parametriza, de tal manera que se puedan reconstruir aproximadamente a partir de la señal filtrada de paso bajo.
[0003]Se conoce a partir del documento WO 9857436 el hecho de someter la señal de audio a una limitación de banda en tal situación en el lado del codificador y codificar solamente una banda más baja de la señal de audio por medio de un codificador de audio de alta calidad. La banda superior, sin embargo, se caracteriza únicamente de forma muy brusca, es decir, por un conjunto de parámetros que permiten la reproducción de la envolvente espectral original de la banda superior. En el lado del decodificador, la banda superior se sintetiza a continuación. Para este propósito, se propone una transposición armónica, en la que la banda inferior de la señal de audio decodificada se suministra a un banco de filtros. Canales de banco de filtros de la banda inferior están conectados a canales de banco de filtros de la banda superior, o son “parcheados” (interconectados), y cada señal de paso de banda parcheada se somete a un ajuste de envolvente. El banco de filtros de síntesis que pertenece a un banco de filtros de análisis especial recibe aquí señales de paso de banda de la señal de audio en la banda inferior y señales de paso de banda ajustadas a la envolvente de la banda inferior que se parchearon armónicamente a la banda superior. La señal de salida del banco de filtros de síntesis es una señal de audio extendida con respecto a su ancho de banda de audio que fue transmitida del lado del codificador al lado del decodificador con una proporción de datos muy baja. En particular, los cálculos de banco de filtros y parcheo en el dominio de banco de filtros se puede convertir en un esfuerzo computacional alto.
[0004]Procedimientos de complejidad reducida para una extensión de ancho de banda de señales de audio de banda limitada en lugar de esto utilizan una función de copia de porciones de la señal de baja frecuencia (LF) al intervalo de alta frecuencia (HF), con el fin de aproximar información perdida debido a la limitación de banda. Tales procedimientos se describen en M. Dietz, L. Liljeryd, K. Kjorling y 0. Kunz, "Spectral Band Replication, a novel approach in audio coding," en la 112a Convención AES, Munich, Mayo de 2002; S. Meltzer, R. Bohm y F. Henn, "SBR enhanced audio codecs for digital broadcasting such as "Digital Radio Mondiale" (DRM)," 112a Convención AES, Munich, Mayo de 2002; T. Ziegler, A. Ehret, P. Ekstrand y M. Lutzky, "Enhancing mp3 with SBR: Features and Capabilities of the new mp3PRO Algorithm," en 112a Convención AES, Munich, Mayo de 2002; International Standard ISO/IEC 14496 3:2001/FPDAM l, "Bandwidth Extension," ISO/IEC, 2002, o "Speech bandwidth extension method and apparatus", Vasu lyengar y col. Patente de EE. UU. N. ° 5.455.888.
[0005]En estos procedimientos, no se efectúa ninguna transposición armónica, pero los canales del banco de filtros de fase de banda adyacentes de la banda inferior se introducen artificialmente a canales del banco de filtros adyacentes de la banda superior. Así se obtiene una aproximación gruesa de la banda superior de la señal de audio. Esto conduce a una aproximación burda de la banda superior de la señal de audio. Esta aproximación burda de la señal se perfecciona a continuación, en una etapa adicional, al definir parámetros de control adicionales deducidos de la señal original. Como un ejemplo, el estándar de MPEG-4 utiliza factores de escala para ajustar la envolvente espectral, una combinación de filtración inversa y adición de un ruido de fondo para adaptar la tonalidad e inserciones de porciones de señal sinusoidales para complementación de componentes tonales.
[0006]Aparte de esto, existen procedimientos adicionales tales como la llamada “extensión de ancho de banda ciega”, descrita en E. Larsen, R.M. Aarts, and M. Danessis, "Efficient high-frequency bandwidth extension of music and speech", In AES112th Convention, Munich, Germany, May 2002 wherein no Further, also information on the original HF range is used, the method of the so-called "Artificial bandwidth extension", exists which is described in K. Kayhkb, A Robust Wideband Enhancement for Narrowband Speech Signal; Research Report, Helsinki University of Technology, Laboratory of Acoustics and Audio signal Processing, 2001.
[0007]En J. Makinen y col.: AMR-WB+: a new audio coding standard for 3rd generation mobile audio services Broadcasts, IEEE, ICASSP '05 se describe un procedimiento para extensión de ancho de banda, en el que la operación de copia de componentes de baja frecuencia a la banda alta se efectúa por una operación de reflejo o espejo obtenida, por ejemplo, mediante toma de muestras ascendentes de la señal filtrada de paso bajo.
[0008]Como una alternativa, se puede emplear una modulación de banda lateral individual que es básicamente equivalente a una operación de copia en el dominio de banco de filtros. Procedimientos que habilitan una extensión de ancho de banda armónica emplean usualmente una etapa de determinación del paso (rastreo de paso), una etapa de distorsión no lineal (véase, por ejemplo, “U. Kornagel, Spectral widening of the excitation signal for telephone-band speech enhancement, en: Proceedings of the IWAENC, Darmstadt, Alemania, Septiembre de 2001, pp. 215 -218 ”) o hacen uso de vocodificadores de fase tales como por ejemplo como se muestran por la solicitud de patente de EE. UU. provisional “F.Nagel, S. Disch: “Apparatus and method of harmonic bandwidth extension in audio signals” con el número de solicitud US 61/025129.
[0009]El documento WO 02/41302 A1, por ejemplo, muestra un procedimiento para mejorar el desempeño de sistemas de codificación que usan procedimientos de reconstrucción de alta frecuencia. Muestra cómo mejorar el desempeño global de tales sistemas por medio de una adaptación sobre el tiempo de la frecuencia de cruce entre la banda baja codificada por un codificador central y la banda alta codificada por un sistema de reconstrucción de alta frecuencia. Para este procedimiento, el codificador de núcleo o codificador central debe ser capaz de trabajar con diferentes frecuencias de cruce en el lado del codificador, así como en el lado del decodificador. Por tanto, aumenta la complejidad del codificador central.
[0010]Por consiguiente, se incrementa la complejidad del codificador del núcleo o codificador central. Tecnologías adicionales para extensiones de ancho de banda se describen, por ejemplo, en “R. M. Aarts, E. Larsen y O. Ouweltjes, A unified approach to low- and high-frequency bandwidth extension. En 115a Convention AES, Nueva York, EUA, Octubre de 2003”, E. Larsen y R. M. Aarts: Audio Bandwidth Extension - Application to psychoacoustics, Signal Processing and Loudspeaker Design. John Wiley & Sons, Ltd, 2004”, E. Larsen, R. M. Aarts y M. Danessis: Efficient high-frequency bandwidth extension of music and speech. En 112a Convención AES 112th, Munich, Alemania, Mayo de 2002”, “J. Makhoul: Spectral Analysis of Speech by Linear Prediction. IEEE Transactions on Audio and Electroacoustics, AU-21(3), Junio de 1973“, “Solicitud de patente de EE. UU. 08/951.029, Ohmori y col.: Audio band width extending system and method” y la “patente de E<e>. System for bandwidth extension of Narrow-band speech”.
[0011]Los procedimientos de extensión de ancho de banda armónicos frecuentemente exhiben una alta complejidad, mientras que los procedimientos de extensión de ancho de banda de complejidad reducida muestran pérdidas de calidad. En el caso particular en el que una baja proporción de bits se combina con un ancho de banda pequeño de la banda baja, se pueden presentar artefactos tales como rugosidad o aspereza y un timbre percibido como desagradable. Una razón para esto es el hecho de que la porción de HF aproximada se basa en una operación de copia que no mantiene ni las relaciones armónicas entre las porciones de señal tonales. Esto se aplica tanto a la relación armónica entre LF y HF y también a la relación armónica entre interconexiones subsecuentes dentro de la porción de HF misma. Por ejemplo, dentro de SBR, la yuxtaposición de los componentes codificados y los componentes replicados, que se presenta en la frontera entre las bandas baja y alta puede provocar impresiones de sonido áspero o rugoso. La razón se ilustra en la figura 18 donde porciones tonales copiadas del intervalo LF al intervalo de HF son espectralmente adyacentes densamente a porciones tonales del intervalo de LF.
[0012]La figura 18a muestra el espectrograma original 1800a de una señal constituido por tres tonos. De conformidad, la figura 18b muestra un diagrama 1800b de la señal extendida del ancho de banda correspondiente a la señal original de la figura 18a. La abscisa indica el tiempo y la ordenada la frecuencia. En particular, en el último tono se observan posibles problemas 1810 (líneas borrosas 1810)
[0013]Si las relaciones armónicas son consideradas mediante procedimientos conocidos, esto siempre se hace en base a una estimación de F0. En estos casos, el éxito de estos procedimientos depende principalmente de la fiabilidad de esta estimación.
[0014]En general, los procedimientos de extensión de ancho de banda conocidos proporcionan señales de audio a una baja proporción de bits, pero con calidad de audio deficiente o una calidad de audio buena a altas proporciones de bits.
[0015]El documento US 2004/028244 describe un dispositivo de decodificación que genera datos espectrales de frecuencia a partir de un flujo de datos de audio codificado de entrada e incluye: una unidad de decodificación de núcleo para decodificar la corriente de datos codificada de entrada y generar datos espectrales de menor frecuencia que representan una señal de audio; y una unidad de decodificación extendida para generar, basada en los datos espectrales de menor frecuencia, datos espectrales de frecuencia extendidos que indican una estructura armónica, que es la misma que una extensión a lo largo del eje de frecuencia de la estructura armónica indicada por los datos espectrales de menor frecuencia, en una región de frecuencia que no está representada por la corriente de datos codificada.
[0016]Es el objeto de la presente invención proporcionar un esquema de decodificación de extensión de ancho de banda mejorado para señales de audio.
[0017]Este objeto se obtiene por un decodificador de extensión de ancho de banda según la reivindicación 1, o un procedimiento según la reivindicación 8 o un programa informático según la reivindicación 9.
[0018]Un ejemplo proporciona un codificador de audio para proporcionar una señal de salida que utiliza una señal de audio de entrada. El codificador de audio comprende un generador de parche, un comparador y una interfaz de salida.
[0019]El generador de parche está configurado para generar al menos una señal de alta frecuencia de extensión de ancho de banda. Una señal de alta frecuencia de extensión de ancho de banda comprende una banda de alta frecuencia, en la que la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda se basa en una banda de baja frecuencia de la señal de audio de entrada. Diferentes señales de alta frecuencia de extensión de ancho de banda comprenden diferentes frecuencias dentro de sus bandas de alta frecuencia si se generan diferentes señales de alta frecuencia de extensión de ancho de banda.
[0020]El comparador está configurado para calcular una pluralidad de parámetros de comparación. Se calcula un parámetro de comparación en función de una comparación de la señal de audio de entrada y una señal de alta frecuencia de extensión de ancho de banda generada. Cada parámetro de comparación de la pluralidad de los parámetros de comparación se calcula en función de una frecuencia de desplazamiento diferente entre la señal de audio de entrada y una señal de alta frecuencia de extensión de ancho de banda generada. Además, el comparador se configura para determinar un parámetro de comparación a partir de la pluralidad de los parámetros de comparación, en el que el parámetro de comparación determinado cumple un criterio predefinido.
[0021]En otras palabras, por ejemplo, el comparador se puede configurar para determinar el parámetro de comparación entre la pluralidad de los parámetros de comparación que cumple en el mejor de los casos un criterio predefinido.
[0022]La interfaz de salida se configura para proporcionar la señal de salida para la transmisión o el almacenamiento. La señal de salida comprende una indicación de parámetro basada en una frecuencia de desplazamiento correspondiente al parámetro de comparación determinado.
[0023]En otras palabras, la señal de salida puede comprender el parámetro de comparación seleccionado que indica la frecuencia de desplazamiento óptima.
[0024]Una realización de la invención proporciona un decodificador de extensión de ancho de banda para proporcionar una señal de audio extendida de ancho de banda basada en una señal de audio de entrada y una señal de parámetro, como se establece en la reivindicación independiente 1.
[0025]Un ejemplo proporciona un decodificador de extensión de ancho de banda para proporcionar una señal de audio extendida de ancho de banda basada en una señal de audio de entrada. El decodificador de extensión de ancho de banda comprende un generador de parche, un comparador, un combinador y una interfaz de salida.
[0026]El generador de parche está configurado para generar al menos una señal de alta frecuencia de extensión de ancho de banda que comprende una banda de alta frecuencia basada en la señal de audio de entrada, en la que una frecuencia de corte más baja de la banda de alta frecuencia de una señal de alta frecuencia de extensión de ancho de banda generada es más baja que una frecuencia de corte superior de la señal de audio de entrada. Diferentes señales generadas de extensión de ancho de banda de alta frecuencia comprenden diferentes frecuencias dentro de sus bandas de alta frecuencia, si se generan diferentes señales de alta frecuencia de extensión de ancho de banda.
[0027]El comparador está configurado para calcular una pluralidad de parámetros de comparación. Se calcula un parámetro de comparación en función de una comparación de la señal de audio de entrada y una señal de alta frecuencia de extensión de ancho de banda generada. Cada parámetro de comparación de la pluralidad de los parámetros de comparación se calcula en función de una frecuencia de desplazamiento diferente entre la señal de audio de entrada y la señal de alta frecuencia de extensión de ancho de banda generada. Además, el comparador se configura para determinar un parámetro de comparación a partir de la pluralidad de los parámetros de comparación, en el que el parámetro de comparación determinado cumple un criterio predefinido.
[0028]En otras palabras, por ejemplo, el comparador está configurado para determinar el parámetro de comparación entre la pluralidad de los parámetros de comparación que cumple en el mejor de los casos un criterio predefinido.
[0029]El combinador está configurado para combinar la señal de audio de entrada y una señal de alta frecuencia de extensión de ancho de banda para obtener la señal de audio extendida de ancho de banda, en el que la señal de alta frecuencia de extensión de ancho de banda utilizada para obtener la señal de audio extendida de ancho de banda se basa en una frecuencia de desplazamiento correspondiente al parámetro de comparación determinado.
[0030] La interfaz de salida se configura para proporcionar la señal de audio extendida de ancho de banda.
[0031] Las realizaciones según la presente invención se basan en la idea central de que una señal de alta frecuencia de extensión de ancho de banda que también se llama parche puede generarse y compararse con la señal de audio de entrada original. Al usar una frecuencia de desplazamiento diferente de la señal de alta frecuencia de extensión de ancho de banda o varias señales de alta frecuencia de extensión de ancho de banda con diferentes frecuencias de desplazamiento, se pueden calcular una pluralidad de parámetros de comparación correspondientes a las diferentes frecuencias de desplazamiento. Los parámetros de comparación pueden estar relacionados con una cantidad asociada con la calidad de audio. Por lo tanto, se puede determinar un parámetro de comparación asegurando la compatibilidad de la señal de alta frecuencia de extensión de ancho de banda y la señal de audio de entrada, y como consecuencia, haciendo que la calidad de audio mejore.
[0032] La velocidad de bits para la transmisión o el almacenamiento de la señal de audio codificada puede disminuirse utilizando una indicación de parámetro basada en la frecuencia de desplazamiento correspondiente al parámetro de comparación determinado para una reconstrucción de la banda de alta frecuencia de la señal de audio de entrada original. De esta manera, solo una porción de baja frecuencia de la señal de audio de entrada y la indicación del parámetro deben almacenarse o transmitirse.
[0033] El parámetro de comparación de los términos, la frecuencia xOver y la indicación del parámetro se definirán más adelante.
[0034] Algunos ejemplos se refieren a un comparador mediante el uso de una correlación cruzada para la comparación de la señal de audio de entrada y la señal de alta frecuencia de extensión de ancho de banda generada para calcular el parámetro de comparación.
[0035] Algunos ejemplos se refieren a un generador de parche, que genera la señal de alta frecuencia de extensión de ancho de banda en el dominio de tiempo basada en una única modulación de banda lateral.
[0036] Un esquema de codificación mejorado para señales de audio permite incrementar la calidad de audio y/o disminuir la proporción de bits para transmisión o almacenamiento.
[0037] Ejemplos para ilustrar la invención y las realizaciones según la invención se detallarán subsecuentemente en referencia a los dibujos adjuntos, en los cuales:
La figura 1 es un diagrama de bloques de un codificador de audio;
La figura 2 una generación de ancho de banda, una señal y una alta frecuencia de la anchura de banda es una ilustración esquemática de la extensión de alta frecuencia de la señal de comparación de la entrada de audio generado señal de extensión de ancho de banda y una adaptación de potencia de la señal de alta frecuencia de extensión; La figura 3 es una ilustración esquemática de una generación de señal de alta frecuencia de extensión de ancho de banda, una comparación de la señal de audio de entrada y una señal de alta frecuencia de extensión de ancho de banda y una adaptación de energía de la señal de alta frecuencia de extensión de ancho de banda;
La figura 4 es un diagrama de bloques de un codificador de extensión de ancho de banda;
La figura 5 es un diagrama de bloques de un decodificador de extensión de ancho de banda;
La figura 6 es un diagrama de bloques de un decodificador de extensión de ancho de banda;
La figura 7 es un diagrama de flujo de un procedimiento para proporcionar una señal de salida en base a una señal de audio de entrada;
La figura 8 es un diagrama de flujo de un procedimiento para proporcionar una señal de audio extendida en ancho de banda;
La figura 9 es un diagrama de flujo de un procedimiento para proporcionar una señal de salida en base a una señal de audio de entrada;
La figura 10 es un diagrama de flujo de un procedimiento para calcular un parámetro de comparación;
La figura 11 es una ilustración esquemática de una interpolación de la frecuencia de desplazamiento;
La figura 12 es un diagrama de bloques de un decodificador de extensión de ancho de banda;
La figura 13 es un diagrama de flujo de un procedimiento para proporcionar una señal de audio extendida de ancho de banda;
La figura 14 es un diagrama de flujo de un procedimiento para proporcionar una señal de audio extendida de ancho de banda;
La figura 15 es un diagrama de bloques de un codificador de extensión de ancho de banda;
La figura 16a es un espectrograma de tres tonos mediante el uso de una frecuencia de cruce variable;
La figura 16b es un espectrograma de la señal de audio original de tres tonos;
La figura 17 es un diagrama del espectro de energía de una señal de audio original, una señal de audio extendida en ancho de banda mediante el uso de la frecuencia de cruce constante y una señal de audio extendida en ancho de banda mediante el uso de una frecuencia de cruce variable;
La figura 18a es un espectrograma de tres tonos mediante el uso de un procedimiento de extensión de ancho de banda conocido; y
La figura 18b es un espectrograma de la señal de audio original de tres tonos.
[0038]En lo sucesivo, los mismos números de referencia se utilizan parcialmente para objetos y unidades funcionales que tienen las mismas propiedades funcionales o propiedades funcionales similares y la descripción de las mismas con respecto a una figura también se aplicará a otras figuras con el fin de reducir redundancia en la descripción de las realizaciones.
[0039]La figura 1 muestra un diagrama de bloques de un codificador de audio 100 para proporcionar una señal de salida 132 según una realización de la invención, mediante el uso de una señal de audio de entrada 102. La señal de salida es apropiada para una extensión de ancho de banda en un decodificador. Por consiguiente, el codificador de audio se denomina también codificador de extensión de ancho de banda. El codificador de extensión de ancho de banda 100 comprende un generador de parche 110, un comparador 120 y una interfaz de salida 130. El generador de parche 110 está conectado al comparador 120 y el comparador 120 está conectado a la interfaz de salida 130.
[0040]El generador de parche 110 genera al menos una señal de alta frecuencia de extensión de ancho de banda 112. Una señal de alta frecuencia de extensión de ancho de banda 112 comprende una banda de alta frecuencia, en la que la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda 112 está basada en una banda de baja frecuencia de la señal de audio de entrada 102. Si se generan diferentes señales de alta frecuencia de extensión de ancho de banda 112, las diferentes señales de alta frecuencia de extensión de ancho de banda 112 comprenden diferentes frecuencias dentro de sus bandas de alta frecuencia.
[0041]El comparador 120 calcula una pluralidad de parámetros de comparación. Un parámetro de comparación se calcula en base a una comparación de la señal de audio de entrada 102 y una señal de alta frecuencia de extensión de ancho de banda generada 112. Cada parámetro de comparación de la pluralidad de parámetros de comparación se calcula en base a una frecuencia de desplazamiento diferente entre la señal de audio de entrada 102 y una señal de alta frecuencia de extensión de ancho de banda generada 112. Además, el comparador 120 determina un parámetro de comparación de la pluralidad de parámetros de comparación, en el que el parámetro de comparación determinado cumple un criterio predefinido.
[0042]La interfaz de salida 130 proporciona la señal de salida 132 para transmisión o almacenamiento. La señal de salida 132 comprende una indicación de parámetro basada en una frecuencia de desplazamiento correspondiente al parámetro de comparación determinado.
[0043]Al calcular una pluralidad de parámetros de comparación para diferentes frecuencias de desplazamiento, se puede encontrar una señal de alta frecuencia de extensión de ancho de banda 112 que se ajusta bien a la señal de audio de entrada original 102. Esto se puede hacer al generar una pluralidad de señales de alta frecuencia de extensión de ancho de banda 112 cada una con una frecuencia de desplazamiento diferente o al generar una señal de alta frecuencia de extensión de ancho de banda y desplazar la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda 112 por diferentes frecuencias de desplazamiento. También, una combinación de generación de una pluralidad de señales de alta frecuencia de extensión de ancho de banda 112 con diferentes frecuencias de desplazamiento y desplazamiento de la banda de alta frecuencia de ellas por otras frecuencias de desplazamiento diferentes puede ser posible. Por ejemplo, se generan cinco señales de alta frecuencia de extensión de ancho de banda diferentes 112 y cada una de ellas se desplaza cinco veces por un desplazamiento de frecuencia constante.
[0044]La figura 2 muestra una ilustración esquemática 200 de la generación de señal de alta frecuencia de extensión de ancho de banda, la comparación de la señal de alta frecuencia de extensión de ancho de banda y la señal de audio de entrada y una adaptación de energía opcional de la señal de alta frecuencia de extensión de ancho de banda para el caso en que solamente se genera una señal de alta frecuencia de extensión de ancho de banda y desplazada por diferentes frecuencias de desplazamiento.
[0045]El primer diagrama esquemático de “energía contra frecuencia” 210 muestra esquemáticamente una señal de audio de entrada 102. En base a esta señal de audio de entrada 102, el generador de parche 110 puede generar la señal de alta frecuencia de extensión de ancho de banda 112, por ejemplo, al desplazar 222 una banda de baja frecuencia de la señal de audio de entrada 102 a frecuencias más altas (como se indica por el número de referencia). Por ejemplo, la banda de baja frecuencia es desplazada por una frecuencia igual a una frecuencia de cruce de un codificador de núcleo, no ilustrado en la figura 1, que puede ser una parte del codificador de extensión de ancho de banda 100 u otra frecuencia predefinida.
[0046]La señal de alta frecuencia de extensión de ancho de banda generada 112 se puede desplazar a continuación por diferentes frecuencias de desplazamiento 232 y para cada frecuencia de desplazamiento 232 (como se indica por el número de referencia 230), se puede calcular un parámetro de comparación por el comparador 120. La frecuencia de desplazamiento 232 se puede definir, por ejemplo, en relación con una frecuencia de cruce de un codificador de núcleo, en relación con otra frecuencia específica o se puede definir como un valor de frecuencia absoluto.
[0047]A continuación, el comparador 120 determina un parámetro de comparación que cumple el criterio predefinido. De esta manera, una señal de alta frecuencia de extensión de ancho de banda 112 con una frecuencia de desplazamiento 242 correspondiente al parámetro de comparación determinado se puede determinar (como se muestra con el número de referencia 240).
[0048]Adicionalmente, también un parámetro de densidad de energía 252 se puede determinar (como se indica por el número de referencia 250). El parámetro de densidad de energía 252 puede indicar la proporción de la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda con la frecuencia de desplazamiento correspondiente al parámetro de comparación determinado y una banda de frecuencia correspondiente de la señal de audio de entrada. Por ejemplo, la proporción se puede relacionar con una proporción de densidad de energía, una proporción de energía u otra proporción de una cantidad relacionada con la densidad de energía de una banda de frecuencia.
[0049]Alternativamente, la figura 3 muestra una ilustración esquemática 300 de la generación de la señal de alta frecuencia de extensión de ancho de banda, la comparación de las señales de alta frecuencia de extensión de ancho de banda generadas y la señal de audio de entrada y la adaptación de energía opcional de la señal de alta frecuencia de extensión de ancho de banda para el caso en que se generen una pluralidad de señales de alta frecuencia de extensión de ancho de banda con diferentes frecuencias de desplazamiento.
[0050]A diferencia de la secuencia mostrada en la figura 2, el generador de parche 110 genera una pluralidad de señales de alta frecuencia de extensión de ancho de banda 112 con frecuencias de desplazamiento diferentes 232 (como se indica por el número de referencia 320). Esto se puede hacer de nuevo por un desplazamiento de frecuencia 222 de una banda de baja frecuencia de la señal de audio de entrada 102 a frecuencias más altas. La banda de baja frecuencia de la señal de audio de entrada 102 puede ser desplazada por una frecuencia constante más la frecuencia de desplazamiento individual 232 de cada señal de alta frecuencia de extensión de ancho de banda 112. La frecuencia constante puede ser igual a la frecuencia de cruce del codificador del núcleo u otra frecuencia específica.
[0051]Un parámetro de comparación para cada señal de alta frecuencia de extensión de ancho de banda generada 112 se puede calcular a continuación y el parámetro de comparación que cumple el criterio predefinido puede ser determinado 240 por el comparador 120.
[0052]El parámetro de densidad de energía se puede determinar 250 como se describe anteriormente.
[0053]Los conceptos mostrados en las figuras 2 y 3 también se pueden combinar. La comparación de la señal de audio de entrada 102 y la señal de alta frecuencia de extensión de ancho de banda generada 112 se puede hacer por una correlación cruzada de ambas señales.
[0054]En este caso, un parámetro de comparación puede ser, por ejemplo, el resultado de una correlación cruzada para una frecuencia de desplazamiento específica entre la señal de audio de entrada 102 y una señal de alta frecuencia de extensión de ancho de banda generada 112. En este caso, un parámetro de comparación puede ser, por ejemplo, el resultado de una correlación cruzada para una frecuencia de desplazamiento específica entre la señal de audio de entrada 102 y una señal de alta frecuencia 112 de extensión de ancho de banda generada.
[0055]La indicación de parámetro de la señal de salida 132 puede ser la frecuencia de desplazamiento en sí misma, una frecuencia de desplazamiento cuantificada u otra cantidad basada en la frecuencia de desplazamiento.
[0056]Mediante la transmisión o el almacenamiento solamente de la indicación del parámetro en lugar de la banda de alta frecuencia de la señal de audio de entrada 102, la proporción de bits para transmisión o almacenamiento se puede reducir. Al escoger el parámetro en base a la frecuencia de desplazamiento correspondiente a un parámetro de comparación que satisface un criterio predefinido, esto puede producir una mejor calidad de audio que la decodificación solamente de la señal de audio limitada en banda o de banda limitada.
[0057]Un criterio predefinido puede ser para determinar un parámetro de comparación de la pluralidad de parámetros de comparación que indican, por ejemplo, una señal de alta frecuencia de extensión de ancho de banda 112 con una frecuencia de desplazamiento correspondientes que coincide con la señal de audio de entrada 102 mejor que el 70% de las señales de alta frecuencia de extensión de ancho de banda 112 con otras frecuencias de desplazamiento, indicando una señal de alta frecuencia de extensión de ancho de banda 112 con una frecuencia de desplazamiento correspondiente que es una de las tres mejores coincidencias con la señal de audio de entrada 102 o que indica una señal de alta frecuencia de extensión de ancho de banda que coincide mejor 112 con una frecuencia de desplazamiento correspondiente. Esto se relaciona con el caso en el que se genera una pluralidad de señales de alta frecuencia de extensión de ancho de banda 112 con diferentes frecuencias de desplazamiento, también como el caso en el que solamente una señal de alta frecuencia de extensión de ancho de banda 112 es generada y desplazada por diferentes frecuencias de desplazamiento o una combinación de estos dos casos.
[0058]Un parámetro de comparación puede ser el resultado de una correlación cruzada u otra cantidad que indica cómo de bien coincide una señal de alta frecuencia de extensión de ancho de banda 112 con una frecuencia de desplazamiento específica coincide con la señal de audio de entrada 102.
[0059]El codificador de extensión de ancho de banda 100 puede comprender un codificador de núcleo para codificar una banda de baja frecuencia de la señal de audio de entrada 102. Este codificador de núcleo puede comprender una frecuencia de cruce que puede corresponder a la frecuencia de corte superior de la banda de baja frecuencia codificada de la señal de audio de entrada 102. La frecuencia de cruce del codificador del núcleo puede ser constante o variable con el tiempo. La implementación de una frecuencia de cruce variable puede incrementar la complejidad del codificador de núcleo, pero puede incrementar también la flexibilidad para codificación.
[0060]El procedimiento mostrado en la figura 2 y/o figura 3 se puede repetir para bandas de frecuencia más altas o interconexiones. Por ejemplo, la banda de baja frecuencia de la señal de audio de entrada 102 comprende una frecuencia de corte superior de 4 kHz. Por consiguiente, si la banda de baja frecuencia de la señal de audio de entrada 102 es desplazada por la frecuencia de corte superior de la banda de baja frecuencia para generar la señal de alta frecuencia de extensión de ancho de banda 112, la señal de alta frecuencia de extensión de ancho de banda 112 comprende una banda de alta frecuencia con una frecuencia de corte inferior de 4 KHz y una frecuencia de corte superior de 8 kHz. El proceso se puede repetir al desplazar una banda de baja frecuencia de la señal de audio de entrada 102 por dos veces la frecuencia de corte superior de la banda de baja frecuencia. Así, la nueva señal de alta frecuencia de extensión de ancho de banda generada 112 comprende una banda de alta frecuencia con una frecuencia de corte inferior de 8 KHz y una frecuencia de corte superior de 12 kHz. Esto se puede repetir hasta que se alcanza una frecuencia más alta deseada. Alternativamente, esto se puede realizar también al generar una señal de alta frecuencia de extensión de ancho de banda con una pluralidad de bandas de alta frecuencia diferentes.
[0061]Como se ilustra en este ejemplo, el ancho de banda de la banda de baja frecuencia de la señal de audio de entrada y el ancho de banda de una banda de alta frecuencia de una señal de alta frecuencia de extensión de ancho de banda pueden ser los mismos. Alternativamente, la banda de baja frecuencia de la señal de audio de entrada puede ser esparcida y desplazada para generar la señal de alta frecuencia de extensión de ancho de banda.
[0062]La determinación de una señal de alta frecuencia de extensión de ancho de banda 112 con una frecuencia de desplazamiento 232 correspondiente al parámetro de comparación determinado puede dejar un espacio o separación entre la banda de baja frecuencia de la señal de audio de entrada 102 y la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda 112 dependiendo de la frecuencia de desplazamiento 242. Este espacio o separación puede ser completado al generar porciones de frecuencia que se ajustan en este espacio que contienen por ejemplo ruido limitado en banda o de banda limitada. Alternativamente, el espacio se puede dejar vacío, puesto que la calidad de audio puede no verse afectada drásticamente.
[0063]La figura 4 muestra un diagrama de bloques de un codificador de extensión de ancho de banda 400 para proporcionar una señal de salida 132 mediante el uso de una señal de audio de entrada 102 según un ejemplo. El codificador de extensión de ancho de banda 400 comprende un generador de parche 110, un comparador 120, una interfaz de salida 130, un codificador de núcleo 410, un filtro de paso de banda 420 y una unidad de extracción de parámetros 430. El codificador del núcleo 410 está conectado a la interfaz de salida 130 y el generador de parche 110, el generador de parche 110 está conectado al comparador 120, el comparador 120 está conectado a la unidad de extracción de parámetros 430, la unidad de extracción de parámetros 430 está conectada a la interfaz de salida 130 y el filtro de paso de banda 420 está conectado al comparador 120.
[0064]El generador de parche 110 se puede realizar como un modulador para generar la señal de alta frecuencia de extensión de ancho de banda 112 en base a la señal de audio de entrada 102. El comparador 120 puede efectuar la comparación de la señal de audio de entrada 102 filtrada por el filtro de paso de banda 420 y la señal de alta frecuencia de extensión de ancho de banda generada 112 por una correlación cruzada de ellas. La determinación del parámetro de comparación que cumple el criterio predefinido se puede denominar también estimación de retraso.
[0065]La interfaz de salida 130 puede incluir también una funcionalidad de un formateador de corriente de bits y puede comprender un combinador para combinar una señal de baja frecuencia proporcionada por el codificador del núcleo 410 y una señal de parámetro 432 que comprende la indicación de parámetro basada en la frecuencia de desplazamiento proporcionada por la unidad de extracción de parámetros 430. Además, la interfaz de salida 130 puede comprender un codificador de entropía o un codificador diferencial para reducir la proporción de bits de la señal de salida 132. El combinador y el codificador de entropía o codificador diferencial puede ser parte de la interfaz de salida 130 como se muestra en este ejemplo o pueden ser unidades independientes.
[0066]La señal de audio 102 se puede dividir en una parte de baja frecuencia y una parte de alta frecuencia. Esto se puede realizar por un filtro de paso bajo del codificador del núcleo 410 y el filtro de paso de banda 420. El filtro de paso bajo puede ser parte del codificador del núcleo 410 o un filtro de paso bajo independiente conectado al codificador del núcleo 410.
[0067] La parte de baja frecuencia es procesada por un codificador central 410 que puede ser un codificador de audio, por ejemplo, conforme a la norma MPEG12 Layer 3 "MP3" o MPEG 4 AAC o un codificador de voz.
[0068] La parte de baja frecuencia puede ser desplazada por un valor fijo, por ejemplo, por medio de una modulación de banda lateral o una transformación de Fourier rápida (FFT) en el dominio de frecuencia, de tal manera que está ubicada por encima de la región de baja frecuencia original en el área objetivo de la interconexión o parte correspondiente. Opcionalmente, la parte de baja frecuencia se puede obtener directamente de la señal de entrada 102. Esto puede ser realizado por un filtro de paso bajo independiente conectado al generador de parche 110.
[0069] A intervalos de tiempo regulares, la correlación cruzada entre espectros de amplitud de secciones de señal transformadas en ventana entre la parte de alta frecuencia original (de la señal de audio de entrada) y la parte de alta frecuencia obtenida (la señal de alta frecuencia de extensión de ancho de banda) puede ser calculada. De esta manera, el retraso (la frecuencia de desplazamiento) para correlación máxima puede ser determinado. Este retraso puede tener el significado de un factor de corrección en términos de la modulación de banda lateral individual original, es decir, la única modulación de banda lateral puede ser corregida adicionalmente por el retraso para maximizar la correlación de cruce. En otras palabras, se puede determinar la frecuencia de desplazamiento, que se denomina también retraso, correspondiente al parámetro de comparación que cumple el criterio predefinido, en la que el parámetro de comparación corresponde a la correlación de cruce y el criterio predefinido puede ser encontrar la correlación máxima.
[0070] Además, se pueden determinar las proporciones de los valores absolutos de los espectros de amplitud. Mediante esto, puede ser derivado por cuyo factor la señal de alta frecuencia obtenida se debe atenuar o amplificar. En otras palabras, se puede determinar un parámetro de densidad de energía que indica la proporción de energía, las densidades de energía, los valores absolutos de los espectros de amplitud u otro valor relacionado con la proporción de densidad de energía entre la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda 112 y una banda de frecuencia correspondiente de la señal de audio de entrada original 102. Esto puede ser realizado por un comparador de densidad de energía que puede ser parte de la unidad de extracción de parámetros 430 como en el ejemplo mostrado o una unidad independiente. Para determinar el parámetro de densidad de energía, por ejemplo, se puede usar la señal de alta frecuencia de extensión de ancho de banda 112 que se generó al desplazar la banda de baja frecuencia de la señal de audio de entrada 102 por una frecuencia constante o la señal de alta frecuencia de extensión de ancho de banda 112 correspondiente al parámetro de comparación determinado u otra señal de alta frecuencia de extensión de ancho de banda generada 112. Una banda de frecuencia correspondiente en este caso significa, por ejemplo, una banda de frecuencia con el mismo intervalo de frecuencia. Por ejemplo, si la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda comprende frecuencias de 4 kHz a 8 kHz, entonces la banda de frecuencia correspondiente de la señal de audio de entrada comprende también el intervalo de 4 kHz a 8 kHz.
[0071] Los factores de corrección obtenidos (frecuencia de desplazamiento, parámetro de densidad de energía) correspondientes al retraso y correspondientes al valor absoluto de la amplitud pueden ser interpolados en el tiempo. En otras palabras, un parámetro determinado para una sección de señal en ventana (para un marco de tiempo) puede ser interpolado por cada etapa de tiempo de la sección de señal.
[0072] Esta señal (señal de parámetro) de modulación (control) o una representación parametrizada de la misma se puede almacenar o transmitir a un decodificador. En otras palabras, la señal de parámetro 432 se puede combinar con la banda de baja frecuencia de la señal de audio de entrada 102 procesada por el codificador del núcleo 410 para obtener la señal de salida 132 que se puede almacenar o transmitir a un decodificador.
[0073] Adicionalmente, se pueden determinar parámetros adicionales para adaptar, por ejemplo, un nivel de ruido y/o la tonalidad. Esto se puede hacer por la unidad de extracción de parámetros 430. Los parámetros adicionales se pueden añadir a la señal de parámetro 432.
[0074] El ejemplo mostrado en la figura 4 ilustra un cálculo del lado del codificador de una modulación variable en el tiempo. La modulación variable en el tiempo en este caso se relaciona con las señales de alta frecuencia de extensión de ancho de banda 112 con diferentes frecuencias de desplazamiento. La frecuencia de desplazamiento correspondiente al parámetro de comparación determinado que cumple el criterio predefinido puede variar con el tiempo.
[0075] La figura 5 muestra un diagrama de bloques de un decodificador de extensión de ancho de banda 500 para probar una señal de audio extendida en ancho de banda 532 basada en una señal de audio de entrada 502 y una señal de parámetro 504 según una realización de la invención. La señal de parámetro 504 comprende una indicación de una frecuencia de desplazamiento y una indicación de un parámetro de densidad de energía. El decodificador de extensión de ancho de banda 500 comprende un generador de parche 510, un combinador 520 y una interfaz de salida 530. El generador de parche 510 está conectado al combinador 520 y el combinador 520 está conectado a la interfaz de salida 530.
[0076] El generador de parche 510 genera una señal de alta frecuencia de extensión de ancho de banda 512 que comprende una banda de alta frecuencia basada en la señal de audio de entrada 502. La banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda 512 se genera realizando un desplazamiento de frecuencia de una banda de frecuencia de la señal de audio de entrada 502 a frecuencias más altas, en la que el desplazamiento de frecuencia está basado en la frecuencia de desplazamiento.
[0077] Además, el generador de parche 510 amplifica o atenúa la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda 512 por un factor igual al valor del parámetro de densidad de energía o igual al valor recíproco del parámetro de densidad de energía.
[0078] El combinador 520 combina la señal de alta frecuencia de extensión de ancho de banda 512 y la señal de audio de entrada 502 para obtener la señal de audio extendida en ancho de banda 532 y la interfaz de salida 530 proporciona la señal de audio extendida en ancho de banda 532.
[0079] La generación de la señal de alta frecuencia de extensión de ancho de banda 112 basada en la frecuencia de desplazamiento puede permitir una continuación mejorada del intervalo de frecuencia de la señal de audio de entrada en la región de alta frecuencia, por ejemplo, si la frecuencia de desplazamiento se determina como se describe anteriormente. Esto puede incrementar la calidad de audio de la señal de audio extendida en ancho de banda 532.
[0080] Adicionalmente, la densidad de energía de la continuación de alta frecuencia de la señal de audio de entrada 502 se puede hacer de una manera muy eficiente al amplificar o atenuar la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda 512 por el parámetro de densidad de energía. De esta manera, una normalización puede no ser necesaria.
[0081] El generador de parche 510 puede generar la señal de alta frecuencia de extensión de ancho de banda 512 al desplazar la banda de frecuencia de la señal de audio de entrada 512 por una frecuencia constante más la frecuencia de desplazamiento. Si la frecuencia de desplazamiento indica un desplazamiento de frecuencia a frecuencias más bajas, el combinador puede ignorar una parte de la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda 512 que comprende frecuencias más bajas que una frecuencia de corte superior de la señal de audio de entrada 502.
[0082] El generador de parches 510 puede generar la señal de alta frecuencia de extensión de ancho de banda 512 en el dominio del tiempo o, de acuerdo con la invención, genera la señal de alta frecuencia de extensión de ancho de banda 512 en el dominio de la frecuencia. En el dominio de tiempo, el generador de parche 510 puede generar la señal de alta frecuencia de extensión de ancho de banda 512 basada en una sola modulación de banda lateral.
[0083] Adicionalmente, la interfaz de salida puede amplificar la señal de salida antes de proporcionarla.
[0084] La figura 6 muestra un diagrama de bloques de un decodificador de extensión de ancho de banda 600 para proporcionar una señal de audio extendida en ancho de banda 532 basada en una señal de audio de entrada 502 y una señal de parámetro 504 según una realización de la invención. El decodificador de extensión de ancho de banda 600 comprende un generador de parche 510, un combinador 520, una interfaz de salida 530, un decodificador de núcleo 610 y una unidad de extracción de parámetros 620. El decodificador de núcleo 610 está conectado al generador de parche 510 y el combinador 520, la unidad de extracción de parámetros 620 está conectada al generador de parche 510 y a la interfaz de salida 530, el generador de parche 510 está conectado al combinador 520 y el combinador 520 está conectado a la interfaz de salida 530.
[0085] El decodificador de núcleo 610 puede decodificar la corriente de bits recibida 602 y proporciona la señal de audio de entrada 502 al generador de parche 510 y el combinador 520. La señal de audio de entrada 502 puede comprender una frecuencia de corte superior igual a una frecuencia de cruce del decodificador de núcleo 610. Esta frecuencia de cruce puede ser constante o variable en el tiempo. Variable en el tiempo significa, por ejemplo, variable para intervalos de tiempo diferentes o cuadros de tiempo diferentes, pero constante para un intervalo de tiempo o marco de tiempo.
[0086] La unidad de extracción de parámetros 620separa la señal de parámetros 504 del flujo de bits recibido 602 y la proporciona al generador de parches 510, y preferiblemente proporciona, la señal de parámetros 504 o un parámetro de ruido y/o tonalidad extraído a la interfaz de salida 530.
[0087] El generador de parche 510 puede modular la señal de audio de entrada 502 o, de acuerdo con la invención, realiza un desplazamiento de frecuencia de una banda de frecuencia de la señal de entrada 502 a frecuencias más altas, en base a la frecuencia de desplazamiento para obtener la señal de alta frecuencia de extensión de ancho de banda 512, y de acuerdo con la invención, amplifica o atenúa la señal de alta frecuencia de extensión de ancho de banda 512 por un factor igual al valor del parámetro de densidad de energía o igual al valor recíproco del parámetro de densidad de energía, respectivamente. Esta señal de alta frecuencia de extensión de ancho de banda 512 se proporciona al combinador 530. En otras palabras, el generador de parche 510 puede modular la señal de audio de entrada 502 basado en la frecuencia de desplazamiento y el parámetro de densidad de energía para obtener una señal de alta frecuencia. Esto se puede hacer, por ejemplo, en el dominio de tiempo por una sola modulación de banda lateral 634 con una interpolación y/o filtración 632 para cada etapa de tiempo.
[0088] El combinador 520 combina la señal de audio de entrada 502 y la señal de alta frecuencia de extensión de ancho de banda generada 512 para obtener la señal de audio de extensión de ancho de banda 532.
[0089] La interfaz de salida 530 proporciona la señal de audio extendida en ancho de banda 532 y puede comprender adicionalmente una unidad de corrección. La unidad de corrección puede llevar a cabo una corrección de tonalidad y/o corrección de ruido basada en los parámetros proporcionados por la unidad de extracción de parámetros 620. La unidad de corrección puede ser parte de la interfaz de salida 530 como se muestra en la figura 6 o puede ser una unidad independiente. La unidad de corrección puede estar dispuesta también entre el generador de parche 510 y el combinador 520. De esta manera, la unidad de corrección puede corregir solamente la tonalidad y/o ruido de la señal de alta frecuencia de extensión de ancho de banda generada 512. Una corrección de tonalidad y ruido de la señal de audio de entrada 512 no es necesaria puesto que la señal de audio de entrada 502 corresponde a la señal de audio original.
[0090] Resumido en algunas palabras, el decodificador de extensión de ancho de banda 600 puede sintetizar y formar espectralmente una señal de alta frecuencia de una señal de salida del decodificador de audio o decodificador de núcleo (la señal de audio de entrada) por medio de la función de modulación transmitida. Función de modulación transmitida, por ejemplo, significa una función de modulación basada en la frecuencia de desplazamiento y en el parámetro de densidad de energía. A continuación, se pueden combinar la señal de alta frecuencia y la señal de baja frecuencia y se pueden aplicar parámetros adicionales para adaptar el nivel de ruido y tonalidad.
[0091] La figura 7 muestra un diagrama de flujo de un procedimiento 700 para proporcionar una señal de salida basada en una señal de audio de entrada según una realización de la invención. El procedimiento comprende la generación 710 de al menos una señal de alta frecuencia de extensión de ancho de banda, el cálculo 720 de una pluralidad de parámetros de comparación, la determinación 730 de un parámetro de comparación a partir de la pluralidad de parámetros de comparación y el suministro 740 de la señal de salida para transmisión o almacenamiento.
[0092] Una señal de alta frecuencia de extensión de ancho de banda generada comprende una banda de alta frecuencia. La banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda está basada en una banda de baja frecuencia de la señal de audio de entrada. Diferentes señales de alta frecuencia de extensión de ancho de banda comprenden diferentes frecuencias dentro de sus bandas de alta frecuencia, si se generan diferentes señales de alta frecuencia de extensión de ancho de banda.
[0093] Se calcula un parámetro de comparación en función de una comparación de la señal de audio de entrada y una señal de alta frecuencia de extensión de ancho de banda generada. Cada parámetro de comparación de la pluralidad de parámetros de comparación se calcula en base a una frecuencia de desplazamiento diferente entre la señal de audio de entrada y una señal de alta frecuencia de extensión de ancho de banda generada.
[0094] El parámetro de comparación determinado cumple un criterio predefinido.
[0095] La señal de salida comprende una indicación de parámetro basada en una frecuencia de desplazamiento correspondiente al parámetro de comparación determinado.
[0096] La figura 8 muestra un diagrama de flujo de un procedimiento 800 para proporcionar una señal de audio extendida en ancho de banda basada en una señal de audio de entrada y una señal de parámetro según una realización de la invención. La señal de parámetro 504 comprende una indicación de una frecuencia de desplazamiento y una indicación de un parámetro de densidad de energía. El método comprende generar 810 una señal de alta frecuencia de extensión de ancho de banda, amplificar 820 o atenuar la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda, combinar 830 la señal de alta frecuencia de extensión de ancho de banda de entrada y la señal de audio para obtener la señal de audio de extensión de ancho de banda y proporcionar 840 la señal de audio de extensión de ancho de banda.
[0097] La señal de alta frecuencia de extensión de ancho de banda comprende una banda de alta frecuencia. La banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda se genera 810 realizando un desplazamiento de frecuencia de una banda de frecuencia de la señal de audio de entrada a frecuencias más altas. El desplazamiento de frecuencia está basado en la frecuencia de desplazamiento.
[0098] La banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda es amplificada 820 o atenuada por un factor igual al valor del parámetro de densidad de energía o igual al valor recíproco del parámetro de densidad de energía.
[0099]La figura 9 muestra un diagrama de flujo de un procedimiento 900 para proporcionar una señal de salida basada en una señal de audio de entrada. Se ilustra una posibilidad para la secuencia del algoritmo en el codificador. Esto puede ser también formal matemáticamente descrito en lo sucesivo. Las señales en tiempo real se pueden indicar por letras minúsculas latinas, las señales transformadas de Hilbert con griego correspondiente y las señales transformadas de Fourier con letras mayúsculas latinas o alternativamente griegas.
[0100]La señal de entrada puede ser llamada f(n), la señal de salida o(n).fm = f * fi^BF, > l< & < £ m:,x indica la transformada de Fourier, j indica el número imaginario y la transformación de Hilbert H(.) se define como de costumbre:
(/Km):=H(f(n))=T ~ \ - j ■sgn(<w) •Fija))
con
Fijco):= JF(f(n))
xOver puede ser la frecuencia de corte del codificador del núcleo, ne N puede indicar un tiempo. kmax> ne N puede indicar la k-ésima extensión o parche. ak describe un borde de banda de bandas perceptuales relacionadas con xOver, por ejemplo, según la escala de Bark o la escala de ERB. Alternativamente, la ak se puede incrementar por ejemplo linealmente, es decir ak+1-ak = constante. La transformación de Hilbert se puede calcular también computacionalmente eficiente mediante la filtración de la señal con un filtro de paso bajo modulado.
[0101]En primer lugar, una función de modulador analítico 902 con las frecuencias de modulación ak y los 1
1t: - T Tf s
incrementos de fase resultantes con el incremento de tiempo (Fs indica la velocidad de toma de muestras) pueden ser generados. Esto se puede describir de forma matemática en las siguientes fórmulas:
[0102]La suma puede ser reemplazada únicamente por n, si k es independiente de n.
[0103]La señal de audio de entrada 102 o señal de audio real f se puede filtrar por paso de banda a un ancho de banda de ak+1-ak que puede ser expresado por:
f— f *f j l f
1LF<—>i i , l LF
[0104]En este caso, cada parche comprenderá el mismo ancho de banda.
[0105]Alternativamente, la señal de audio de entrada f 102 se puede filtrar por paso de banda a anchos de banda de ak con anchos de banda diferentes que pueden ser descritos por:
[0106]A continuación, se pueden determinar las áreas de la señal original que deben ser reconstruidas por este procedimiento. Estas regiones limitadas en banda se pueden indicar como:
y están ubicadas en los intervalos (ak, ak+1).
[0107]La modulación de la señal de entrada filtrada por paso bajo 904 se puede realizar en el dominio de frecuencia o el dominio de tiempo.
[0108]En el dominio de frecuencia, las señales de entrada se pueden formar en ventana primero, lo que se puede describir por:
en la que NFFT es el número de bins de transformación de Fourier rápida (por ejemplo 512 bins), ês el número de ventana y win(.) es una función de ventana. Las ventanas o marcos de tiempo pueden comprender una superposición temporal. Por ejemplo, la fórmula dada anteriormente describe una superposición temporal de la mitad de una ventana. Así, NeN bloques de la señal original y con la misma conectada con tantos espectros de amplitud F(w) con ^< N como valores absolutos de la transformada de Fourier
describe el índice del borde de banda k en la transformada de Fourier.
[0109]A continuación, la señal se modula en el dominio de frecuencia mediante el desplazamiento de los bins de FFT (bins de transformación de Fourier rápida). La transformación de Hilbert implícita no es aquí necesaria, pero hace una descripción formal igual de las siguientes etapas posibles:
para w > 0 y
[0110]En el dominio de tiempo, se realiza primero una transformación de Hilbert 906 de la señal de audio de entrada f 102 para generar una señal analítica 908.
a continuación, la señal analítica LFk, es modulada por banda lateral individual 710 con un modulador |j(n) 902:
ym=Z<PLFk(n) 'M n)
k=\
o
[0111]De esta manera, se puede generar una señal de alta frecuencia de extensión de ancho de banda que se denomina también señal modulada 910.
[0112]A continuación, se efectúan una formación de ventana (también posible con superposición) de la señal de entrada 912 y de la señal extendida 914 y una transformación de Fourier 916:
y
i//,(n) =y / ( c------- mod{n,NFFT)1) ■ win(mod(n,A//7T) 1)
’ 2
en la que una NFFT es una vez más el número de bins de transformación de Fourier rápida (por ejemplo 256, 512, 1024 bins u otro número entre 24 y 232), ^ es el número de ventana y win(.) es una función de ventana. Así, ne N bloques 914 son creados de la señal original y en relación con tantos espectros de amplitud O^(w), ^ ( w ) con ^< N como valores absolutos de la transformada de Fourier 916.
pueden describir el índice del borde de banda k en la transformada de Fourier.
[0113]El proceso en el dominio de tiempo se muestra en la figura 9.
[0114]La siguiente etapa es el cálculo 720 de la correlación cruzada (el parámetro de comparación puede ser igual al resultado de la correlación cruzada) de los espectros de amplitud parciales de la señal original y la señal extendida lo que se puede expresar matemáticamente por:
con
8 puede indicar el retraso máximo (la frecuencia de desplazamiento máxima) para el cual se calcula una correlación cruzada. Si la correlación cruzada se debe calcular con una predisposición, es decir, retrasos pequeños y así se deberían preferir grandes superposiciones, así que se debe seleccionar p=0. Por el contrario, si se debe compensar que menos bins de FFT (bins de transformación de Fourier rápida) se superponen para retrasos más grandes que pequeños, se debe escoger p=1. En general, se puede 0<peP de forma arbitraria. Alternativa o adicionalmente, se puede escoger 2 <¿eN,mod(í,2)=0 para se|eccionar una región de la correlación cruzada que es un poco más grande que una interconexión parche. Con esto la región que es considerada por la correlación cruzada puede sers
extendida por2en ambos extremos espectrales del parche particular.
[0115]En base a estos resultados de la correlación cruzada, un máximo de la correlación cruzada 730
m ¿k:=max(Rá k(v))
y el retraso d^k de la correlación máxima
se pueden determinar.
[0116]Adicionalmente, las proporciones 920 de las energías o potencias en las interconexiones o parches pueden ser determinadas por los espectros de densidad de energía:
[0117]Si no se puede determinar ningún máximo claro 924, el retraso se vuelve a poner a 0 (como se muestra en el número de referencia 922). De otra manera el retraso estimado 918 puede ser el retraso correspondiente a la correlación cruzada máxima. Para esto, se puede determinar un criterio de umbral, d^k > con que se va a seleccionar. Alternativamente, se puede observar la curvatura o un aplanamiento espectral (SFN) de la correlación cruzada R R^ k, por ejemplo:
con
[0118]Los retrasos d^k y los parámetros de densidad de energía ^,k pueden ser interpolados 926 para obtener un valor para cada etapa de tiempo:
gk(n) := ¡nterpíc *);Ak(n) = ¡nterpiaf^)
[0119]A continuación, se puede generar la función de modulación global modulada en amplitud modificada y desplazada en frecuencia:
27lj^(% (/7?)+/ft (m))
jü(n) = Y j gk(n)e *•'
k=1
[0120]Esta función de modulación global o los parámetros de la función de modulación global se pueden proporcionar 740 con la señal de salida para almacenamiento o transmisión.
[0121]Adicionalmente, se pueden determinar parámetros adicionales para corrección de ruido y/o corrección de tonalidad.
[0122]La modulación en el decodificador puede ser realizada por:
y/(ri).=yLt (n) ■ fi(n)
y además de las k modulaciones parciales (si hay más de un parche o interconexión). Para esta función de modulación global jk(n) o |j(n) o los parámetros Zk(n) y Ak(n) o c^k y d^k de la función de modulación global se pueden codificar apropiadamente, por ejemplo mediante cuantificación. Opcionalmente, la velocidad de toma de muestras se puede reducir y se puede introducir una histéresis.
[0123]El cálculo de los retrasos se puede omitir, si no hay ninguna señal tonal, por ejemplo, en silencio, transitorios o ruido. En estos casos, el retraso se puede ajustar a cero.
[0124]La figura 10 muestra en más detalle un ejemplo 1000 para determinar el retraso.
[0125]Para un marco de tiempo o ventana 5=i 1010 el retraso v se ajusta a menos A como valor de partida. A continuación, se calcula la correlación cruzada R^k(v) 720. Si v es más pequeño que A 1030, entonces v se incrementa 1032 y se calcula el siguiente parámetro de comparación en términos de la correlación cruzada 720. Si v es mayor o igual que A 1030, entonces se puede determinar el retraso correspondiente a la correlación cruzada calculada máxima 730. Si el máximo es claramente identificable 924 el retraso determinado se usa como parámetro d^k 918. De otra manera, el retraso se ajusta a 0 y se usa como parámetro d^=0922.
[0126]A continuación, todo el proceso se repite 1040 para el siguiente marco de tiempo 5=5+1 1050. Los retrasos determinados se pueden interpolar 926 para obtener un parámetro para cada etapa de tiempo N.
[0127]El cálculo de la pluralidad de parámetros de comparación, por ejemplo, el resultado de la correlación cruzada se puede hacer también en paralelo si se usan una pluralidad de comparadores. También, el procesamiento de diferentes marcos de tiempo se puede hacer en paralelo, si los elementos físicos necesarios están disponibles varias veces. El bucle para calcular la correlación cruzada puede comenzar también en A y se puede disminuir cada bucle hasta v < A.
[0128]La figura 11 muestra una ilustración esquemática de la interpolación 926 de las frecuencias de desplazamiento de diferentes marcos de tiempo, intervalos de tiempo o ventanas. La figura 11a muestra la interpolación 1100, si los marcos de tiempo no se traslapan o superponen. Se determina un retraso d^k para todo un marco de tiempo 1110. La manera más fácil para interpolar un parámetro para cada etapa de tiempo 1120 se puede realizar al ajustar los parámetros de todas las etapas de tiempo 1120 de un marco de tiempo 1110 igual al retraso correspondiente d^ k. En los bordes de un marco de tiempo, se puede seleccionar el retraso del marco de tiempo previo o siguiente. Por ejemplo, los parámetros Ak(n) a Ak(n+3) son igual a d^k y los parámetros Ak(n+4) a Ak(n+7) son iguales a d5+1,k.
[0129]Alternativamente, los retrasos de los marcos de tiempo 1110 se pueden interpolar linealmente entre los marcos de tiempo. Por ejemplo:
[0130]De manera conveniente, la figura 11B muestra un ejemplo 1150 para marcos de tiempo superpuestos 1110. En este caso, una etapa de tiempo 1120 está asociada a más de un marco de tiempo 1110. Por consiguiente, más de un retraso determinado se puede asociar a una etapa de tiempo 1120. Así, los retrasos determinados se pueden interpolar 926 para obtener un parámetro para cada etapa de tiempo 1120. Por ejemplo, los retrasos determinados correspondientes a una etapa de tiempo 1120 se pueden interpolar linealmente. Por ejemplo, una interpolación posible puede ser:
[0131]Alternativamente, la interpolación también se puede hacer, por ejemplo, mediante una filtración mediana.
[0132]La interpolación se puede realizar por medio de interpolación. Los medios de interpolación pueden ser parte de la unidad de extracción de parámetros o la interfaz de salida o pueden ser una unidad separada.
[0133]En el lado del decodificador, la extensión de ancho de banda se puede hacer mediante:
ft(n).=<pLF(n)- jLt(n)
[0134]Después de la decodificación de y 9LF(N) como salida del codificador del núcleo. Adicionalmente, puede ser adaptado con los parámetros previamente de los parámetros obtenidos de la señal original para el nivel de tonalidad y/o ruido.
[0135]El cálculo de la función de modulación global en el decodificador se hace según una o ambas de las siguientes fórmulas:
y
iy(n) - <píf (n)• //(n) iruido(^)
[0136]La parte imaginaria de la señal se puede ignorar:
o(n)= Re(t//{n))
[0137]A continuación, como se menciona anteriormente, puede seguir una corrección de tonalidad, por ejemplo, mediante filtración inversa.
[0138]La figura 12 muestra un diagrama de bloques de un decodificador de extensión de ancho de banda 1200 para proporcionar una señal de audio extendida en ancho de banda 532 basada en una señal de audio de entrada 502 según una realización de la invención. El decodificador de extensión de ancho de banda 1200 comprende un generador de parche 1210, un comparador 1220, un combinador 1230 y una interfaz de salida 1240. El generador de parche 1210 está conectado al comparador 1220, el comparador 1220 está conectado al combinador 1230 y el combinador 1230 está conectado a la interfaz de salida 1240.
[0139]El generador de parche 1210 genera al menos una señal de alta frecuencia de extensión de ancho de banda 1212 que comprende una banda de alta frecuencia basada en la señal de audio de entrada 502, en la que una frecuencia de corte inferior de la banda de alta frecuencia de una señal de alta frecuencia de extensión de ancho de banda 1212 es más baja que una frecuencia de corte superior de la señal de audio de entrada 502. Diferentes señales de alta frecuencia de extensión de ancho de banda 1212 comprenden diferentes frecuencias dentro de sus bandas de alta frecuencia, si se generan diferentes señales de alta frecuencia de extensión de ancho de banda 1212.
[0140]El comparador 1220 calcula una pluralidad de parámetros de comparación. Un parámetro de comparación se calcula en base a una comparación de la señal de audio de entrada 502 y una señal de alta frecuencia de extensión de ancho de banda generada 1212. Cada parámetro de comparación de la pluralidad de parámetros de comparación se calcula en base a una frecuencia de desplazamiento diferente entre la señal de audio de entrada 502 y una señal de alta frecuencia de extensión de ancho de banda generada 1212. Además, el comparador determina un parámetro de comparación de la pluralidad de parámetros de comparación, en el que el parámetro de comparación determinado cumple un criterio predefinido.
[0141]Un combinador 1230 combina la señal de audio de entrada 502 y la señal de alta frecuencia de extensión de ancho de banda 1212 para obtener la señal de audio extendida en ancho de banda 532, en la que la señal de alta frecuencia de extensión de ancho de banda 1212 está basada en una frecuencia de desplazamiento correspondiente al parámetro de comparación determinado.
[0142]La interfaz de salida 1240 proporciona la señal de audio extendida en ancho de banda 532.
[0143]En comparación con el decodificador mostrado en la figura 5 el decodificador descrito 1200 determina la frecuencia de desplazamiento por sí mismo. Por consiguiente, no es necesario recibir este parámetro con la señal de audio de entrada 502. De esta manera, la proporción de bits para transmisión o almacenamiento de señales de audio se puede reducir adicionalmente.
[0144]Como se describe para la figura 1, el generador de parche 1210 puede generar una pluralidad de señales de alta frecuencia de extensión de ancho de banda con diferentes frecuencias de desplazamiento o solamente una señal de alta frecuencia de extensión de ancho de banda que es desplazada por diferentes frecuencias de desplazamiento. De nuevo, también se puede usar una combinación de estas dos posibilidades.
[0145]La figura 13 muestra un diagrama de flujo de un procedimiento 1300 para proporcionar una señal de audio extendida en ancho de banda según una realización de la invención. El procedimiento 1300 comprende la generación 1310 de al menos una señal de alta frecuencia de extensión de ancho de banda, el cálculo 1320 de una pluralidad de parámetros de comparación, la determinación 1330 de un parámetro de comparación de la pluralidad de parámetros de comparación, la combinación 1340 de la señal de audio de entrada y una señal de alta frecuencia de extensión de ancho de banda y el suministro 1350 de la señal de audio extendida en ancho de banda.
[0146]Una señal de alta frecuencia extendida en ancho de banda comprende una banda de alta frecuencia basada en la señal de audio de entrada. Una frecuencia de corte inferior de la banda de alta frecuencia de una señal de alta frecuencia extendida en ancho de banda es más baja que una frecuencia de corte superior de la señal de audio de entrada. Diferentes señales de alta frecuencia de extensión de ancho de banda comprenden diferentes frecuencias dentro de sus bandas de alta frecuencia, si se generan diferentes señales de alta frecuencia de extensión de ancho de banda.
[0147]Se calcula un parámetro de comparación en base a la comparación de la señal de audio de entrada y la señal de alta frecuencia de extensión de ancho de banda generada. Cada parámetro de comparación de la pluralidad de los parámetros de comparación se calcula en función de una frecuencia de desplazamiento diferente entre la señal de audio de entrada y la señal de alta frecuencia de extensión de ancho de banda generada.
[0148]El parámetro de comparación determinado cumple un criterio predefinido.
[0149]La señal de alta frecuencia de extensión de ancho de banda que se combina con la señal de audio de entrada para obtener la señal de audio de ancho de banda se basa en una frecuencia de desplazamiento correspondiente al parámetro de comparación determinado.
[0150]La figura 14 muestra un diagrama de flujo de un procedimiento 1400 para proporcionar una señal de audio extendida en ancho de banda según un ejemplo.
[0151]Después de recibir 1402 una corriente de bits que comprende la señal de audio de entrada, un decodificador de núcleo decodifica 1410 la señal de audio de entrada. En base a la señal de audio de entrada, se genera una señal de alta frecuencia de extensión de ancho de banda 1310 y se calculan la pluralidad de parámetros de comparación en términos de una correlación cruzada entre la señal de audio de entrada y una señal de alta frecuencia de extensión de ancho de banda generada con diferentes frecuencias de desplazamiento 1320. A continuación, se determina el parámetro de comparación que cumple el criterio predefinido 1330 que se denomina también estimación de retraso.
[0152]En base a la frecuencia de desplazamiento correspondiente al parámetro de comparación determinado, un modulador puede modular 1420 la señal de audio de entrada. Adicionalmente, un parámetro se puede extraer 1430 de la corriente de bits recibida 1402 para adaptar, por ejemplo, la densidad de energía de la señal modulada. La señal modulada se combina a continuación 1340 con la señal de audio de entrada. Adicionalmente, la tonalidad y el ruido de la señal de audio extendida en ancho de banda se pueden corregir 1440. Esto también se puede hacer antes de la combinación con la señal de audio de entrada. A continuación, los datos de audio en términos de la señal de audio extendida en ancho de banda se proporcionan 1350, por ejemplo, para reproducción acústica.
[0153]De esta manera, el cálculo de la modulación variable en el tiempo se hace en el lado del decodificador.
[0154]Alternativamente al modulador que modula 1420 la señal de audio de entrada para generar una interconexión o parche, por ejemplo, se puede utilizar la señal de alta frecuencia de extensión de ancho de banda ya generada previamente o el generador de parche puede generar una señal de alta frecuencia de extensión de ancho de banda (parche) en base a la frecuencia de desplazamiento correspondiente al parámetro de comparación determinado.
[0155]En otras palabras, si la velocidad de datos baja es más importante que una complejidad baja del lado del decodificador, la determinación de la modulación de frecuencia de los moduladores también se puede hacer en el lado del decodificador. Para esto, se puede ejecutar el algoritmo mostrado en la figura 9 en el decodificador con solo algunos cambios. Puesto que la señal original no está disponible para el cálculo de la correlación cruzada en el decodificador, las correlaciones se pueden calcular entre la señal original (señal de audio de entrada) y una señal original desplazada (señal de audio de entrada) dentro de un intervalo de superposición. Por ejemplo, la señal se puede desplazar entre cero y ak, por ejemplo, ak dividido por 2, ak dividido por 3 o ak dividido por 4. ak indica otra vez el k-ésimo borde de banda, por ejemplo, a1 indica la frecuencia de cruce del codificador de núcleo.
[0156]Por ejemplo, esto puede suceder de la misma manera en el codificador como en el decodificador. En el codificador, los parámetros para formación espectral, corrección de ruido y/o corrección de tonalidad se pueden extraer y transmitir al decodificador.
[0157]De manera conveniente, la figura 15 muestra un diagrama de bloques de un codificador de extensión de ancho de banda 1500 para proporcionar una señal de salida utilizando una señal de audio de entrada. El codificador 1500 corresponde al codificador mostrado en la figura 4. Sin embargo, el codificador 1500 no proporciona la señal de salida 132 con una indicación de parámetro basada en la frecuencia de desplazamiento misma. Puede determinar solamente un parámetro de densidad de energía y parámetros opcionales para corrección de tonalidad y corrección de ruido e incluye una indicación de parámetro de estos parámetros a la señal de salida 132. Sin embargo, el parámetro de densidad de energía (y también los otros parámetros, si se determinan) se determina en base a la frecuencia de desplazamiento correspondiente al parámetro de comparación determinado.
[0158]Por ejemplo, el parámetro de densidad de energía puede indicar la proporción entre la señal de audio de entrada 102 y la señal de alta frecuencia de extensión de ancho de banda con una frecuencia de desplazamiento correspondiente al parámetro de comparación determinado. Por consiguiente, la indicación de parámetro que está relacionada con el parámetro de densidad de energía y opcional a los parámetros para corrección de tonalidad y/o corrección de ruido se basa en la frecuencia de desplazamiento correspondiente al parámetro de comparación determinado.
[0159]Una diferencia adicional entre el codificador 1500 y el codificador mostrado en la figura 4 es que el generador de parche 110 genera una señal de alta frecuencia de extensión de ancho de banda de la misma manera en que el generador de parche del decodificador 1400 lo hace. De esta manera, el codificador 1500 y el decodificador pueden obtener las mismas frecuencias de desplazamiento y por consiguiente, los parámetros extraídos por el codificador 1500 son válidos para las interconexiones generadas por el decodificador.
[0160]Algunos ejemplos se refieren a un dispositivo y un procedimiento para extensión de ancho de banda de señales de audio en el dominio de tiempo mediante el uso de moduladores variables de tiempo. En otras palabras, un parche se puede generar con frecuencia de corte variable, por ejemplo, para cada etapa de tiempo, cada marco de tiempo, una parte de un marco de tiempo o para grupos de marcos de tiempo.
[0161]El procedimiento descrito para extensión del ancho de banda de una señal de audio se puede utilizar en el lado del codificador y el lado del decodificador así como solo en el lado del decodificador. Por el contrario, para procedimientos conocidos, el nuevo procedimiento descrito puede llevar a cabo una extensión denominada armónica del ancho de banda sin la necesidad de información exacta sobre la frecuencia fundamental de la señal de audio. Además, en contraste con las extensiones de ancho de banda denominadas armónicas como, por ejemplo, mostradas por la solicitud de patente provisional de EE.UU. "F.Nagel, S. Disch: "Apparatus and method of harmonic bandwidth extension in audio signals"" con el número de solicitud US 61/025129 que se realizan por medio de vocodificadores de fase, el espectro puede no ser esparcido y, por consiguiente, también puede que la densidad no se cambie. Para asegurar la armonía, se aprovechan correlaciones entre la banda extendida y la banda base. Esta correlación se puede calcular en el codificador, así como en el decodificador, dependiendo de la demanda para cómputo y complejidad de memoria y velocidad de datos.
[0162]Por ejemplo, la extensión de ancho de banda en sí misma se puede hacer mediante el uso de una modulación de amplitud (AM) y un desplazamiento de frecuencia por medio de una sola modulación de banda lateral (SSB) con una pluralidad de portadores variables en el tiempo lentos, adaptables únicos. Un post-procesamiento siguiente según parámetros adicionales puede intentar aproximar la envolvente espectral y el nivel de ruido, así como otras propiedades de las señales originales.
[0163]El nuevo método para la transformación de señales puede evitar los problemas que aparecen debido a una simple operación de copia o espejo mediante la continuación armónica correcta del espectro por medio de una frecuencia de corte variable en el tiempo XOver entre la baja frecuencia (LF) y la alta frecuencia (HF) a continuación de la alta frecuencia Estas frecuencias de corte región, así como entre las regiones, los llamados parches, se eligen de manera que los parches generados se ajustan a una trama armónica tal como existía en el original lo mejor posible.
[0164]La figura 16 muestra un modulador con 3 amplitudes variables en el tiempo y frecuencias de corte mediante las cuales se pueden generar 3 parches mediante la modulación individual de banda lateral de las bandas base. La figura 16a muestra un diagrama 1600a del espectro de la señal extendida en ancho de banda mediante el uso de frecuencias de corte variables en el tiempo 1610. La figura 16b ilustra un diagrama 1600b del espectro de la señal de audio de los tres tonos. En comparación con el espectrograma ilustrado en la figura 18b las líneas 1620 son significativamente menos discontinuas.
[0165]La figura 17 ilustra el efecto por medio de un diagrama 1700 del período. El espectro de densidad de energía de los terceros tonos de la señal de audio se muestra como original 1710, con una frecuencia de corte constante 1720 y con una frecuencia de corte variable 1730. En contraste con el uso de la frecuencia de corte constante 1720, la estructura armónica permanece mediante el uso de la frecuencia de corte variable 1730.
[0166]Mediante la continuación armónica del espectro, se pueden evitar problemas en los puntos de transición entre ambos, la banda base (codificador del núcleo) y la banda extendida, y entre parches subsecuentes. Sin una estimación de F0 como requisito para la función del sistema, señales arbitrarias pueden ser armónicas continuadas, sin la existencia de artefactos audibles, ni por violar la armonía ni por eventos de sonido transitorios.
[0167]Algunas realizaciones según la invención se refieren a un procedimiento apropiado para todas las aplicaciones de audio, donde el ancho de banda completo no está disponible. Por ejemplo, para la difusión de contenido de audio como, por ejemplo, con radio digital, la corriente o flujo de Internet o en aplicaciones de comunicación de audio, se puede usar el procedimiento descrito.
[0168]Una realización según la invención se refiere a un decodificador de extensión de ancho de banda para proporcionar una señal de audio extendida en ancho de banda basada en una señal de audio de entrada y una señal de parámetro, como se establece en la reivindicación independiente 1.
[0169]. Aunque esta invención se ha descrito en términos de varias realizaciones, existen alteraciones, permutaciones y equivalentes que entran dentro del alcance de esta invención. También se debe tener en cuenta que hay muchas formas alternativas de implementar los procedimientos y composiciones de la presente invención.
[0170]En particular, se indica que, dependiendo de las condiciones, el esquema de la invención se puede implementar también en software. La implementación se puede hacer por un medio de almacenamiento digital, particularmente un disco flexible o un CD con señales de control que se pueden leer electrónicamente capaces de cooperar con un sistema informático programable de tal manera que se ejecute el procedimiento correspondiente. En general, la invención también consiste de este modo en un producto de programa informático con códigos de programa almacenados en un soporte que se puede leer por la máquina para efectuar el procedimiento de la invención, cuando el producto de programa informático se ejecuta en un ordenador. En otras palabras, la invención se puede realizar también de este modo como un programa informático con un código de programa para efectuar el procedimiento, cuando el programa informático se ejecuta en un ordenador.

Claims (9)

REIVINDICACIONES
1. Decodificador de extensión de ancho de banda (500, 600) para proporcionar una señal de audio extendida de ancho de banda (532) basada en una señal de audio de entrada (502) y una señal de parámetro (504), en la que la señal de parámetro (504) comprende una indicación de una frecuencia de desplazamiento y una indicación de un parámetro de densidad de energía, comprendiendo el decodificador de extensión de ancho de banda: un generador de parche (510) configurado para generar una señal de alta frecuencia de extensión de ancho de banda (512) que comprende una banda de alta frecuencia, en la que la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda (512) se genera realizando un cambio de frecuencia de una banda de frecuencia de la señal de audio de entrada (502) a frecuencias más altas, en el que el cambio de frecuencia se basa en la frecuencia de desplazamiento, y en el que el generador de parche (510) está configurado para amplificar o atenuar la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda (512) por un factor igual al valor del parámetro de densidad de energía o igual al valor recíproco del parámetro de densidad de energía, respectivamente;
un combinador (529) configurado para combinar la señal de alta frecuencia de extensión de ancho de banda (512) y la señal de audio de entrada (502) para obtener la señal de audio extendida de ancho de banda (532); una interfaz de salida (530) configurada para proporcionar la señal de audio extendida de ancho de banda (532); y
un decodificador de núcleo (610) y una unidad de extracción de parámetros (620), en los que el decodificador de núcleo (610) está conectado al generador de parches (510) y al combinador (520), en los que la unidad de extracción de parámetros (620) está conectada al generador de parches (510) y a la interfaz de salida (530), en los que el generador de parches (510) está conectado al combinador (520), donde el combinador (520) está conectado a la interfaz de salida (530), donde la unidad de extracción de parámetros (620) está configurada para separar la señal de parámetros (504) de un flujo de bits recibido (602) y para proporcionar la señal de parámetros (504) al generador de parches (510), y preferiblemente para proporcionar la señal de parámetros (504) o un parámetro de ruido y/o tonalidad extraído a la interfaz de salida (530).
2. Decodificador de extensión de ancho de banda según la reivindicación 1, en el que el generador de parche (510) está configurado para generar la señal de alta frecuencia de extensión de ancho de banda (512) en el dominio de tiempo.
3. Decodificador de extensión de ancho de banda según la reivindicación 1, en el que el parámetro de densidad de energía (252) indica una relación de la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda (512) con la frecuencia de desplazamiento y una banda de frecuencia correspondiente de la señal de audio de entrada (502).
4. El decodificador de extensión de ancho de banda según la reivindicación 3, en el que la relación se refiere a una relación de densidad de energía, una relación de energía u otra relación de una cantidad relacionada con la densidad de energía de una banda de frecuencia.
5. Decodificador de extensión de ancho de banda según la reivindicación 1, en el que la banda de baja frecuencia de la señal de audio de entrada se extiende y cambia para generar la señal de alta frecuencia de extensión de ancho de banda (512).
6. Decodificador de extensión de ancho de banda según la reivindicación 1, en el que el generador de parche (510) está configurado para generar la señal de alta frecuencia de extensión de ancho de banda (512) cambiando la banda de frecuencia de la señal de audio de entrada (502) por una frecuencia constante más la frecuencia de desplazamiento.
7. Decodificador de extensión de ancho de banda según la reivindicación 1, en el que la interfaz de salida (530) está configurada para amplificar la señal de audio extendida de ancho de banda (532) antes de proporcionar la misma.
8. Procedimiento (800) para proporcionar una señal de audio extendida de ancho de banda (532) basada en una señal de audio de entrada (502) y una señal de parámetro (504), en la que la señal de parámetro (504) comprende una indicación de una frecuencia de desplazamiento y una indicación de un parámetro de densidad de energía, comprendiendo el procedimiento:
generar (810) una señal de alta frecuencia de extensión de ancho de banda (512) que comprende una banda de alta frecuencia, en la que la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda (512) se genera realizando un cambio de frecuencia de una banda de frecuencia de la señal de audio de entrada (502) a frecuencias más altas, en la que el cambio de frecuencia se basa en la frecuencia de desplazamiento;
amplificar (820) o atenuar la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda (512) por un factor igual al valor del parámetro de densidad de energía o igual al valor recíproco del parámetro de densidad de energía;
combinar (830) la señal de alta frecuencia de extensión de ancho de banda (512) y la señal de audio de entrada (502) para obtener la señal de audio extendida de ancho de banda (532);
proporcionar (840) la señal de audio extendida de ancho de banda (532); y
utilizando un decodificador de núcleo (610) y una unidad de extracción de parámetros (620), en donde el decodificador de núcleo (610) está conectado al generador de parches (510) y al combinador (520), en donde la unidad de extracción de parámetros (620) está conectada al generador de parches (510) y a la interfaz de salida (530), en donde el generador de parches (510) está conectado al combinador (520), donde el combinador (520) está conectado a la interfaz de salida (530), donde la unidad de extracción de parámetros (620) está configurada para separar la señal de parámetros (504) de un flujo de bits recibido (602) y para proporcionar 10 la señal de parámetros (504) al generador de parches (510) , y preferiblemente para proporcionar la señal de parámetros (504) o un parámetro de ruido y/o tonalidad extraído a la interfaz de salida (530).
9. Un programa informático que comprende instrucciones que, cuando el programa informático es ejecutado por un ordenador o por un microcontrolador, hace que el ordenador o el microcontrolador realicen el procedimiento según la reivindicación 8.
ES23180365T 2008-12-15 2009-12-11 Decodificador de extensión de ancho de banda, procedimiento correspondiente y programa de ordenador Active ES2968852T3 (es)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US12255208P 2008-12-15 2008-12-15

Publications (1)

Publication Number Publication Date
ES2968852T3 true ES2968852T3 (es) 2024-05-14

Family

ID=42104496

Family Applications (9)

Application Number Title Priority Date Filing Date
ES23180061T Active ES2968884T3 (es) 2008-12-15 2009-12-11 Decodificador de extensión de audio de ancho de banda, procedimiento correspondiente y programa de ordenador
ES23180085T Active ES2968886T3 (es) 2008-12-15 2009-12-11 Decodificador de extensión de audio de ancho de banda, procedimiento correspondiente y programa de ordenador
ES22166970T Active ES2951163T3 (es) 2008-12-15 2009-12-11 Decodificador de extensión de ancho de banda de audio, procedimiento correspondiente y programa informático
ES09797003.2T Active ES2613941T3 (es) 2008-12-15 2009-12-11 Codificador de audio y descodificador de extensión de ancho de banda
ES23180374T Active ES2966659T3 (es) 2008-12-15 2009-12-11 Decodificador de extensión de ancho de banda de audio, procedimiento correspondiente y programa informático
ES15167199.7T Active ES2674386T3 (es) 2008-12-15 2009-12-11 Codificador de audio y decodificador de extensión de ancho de banda
ES23180084T Active ES2968885T3 (es) 2008-12-15 2009-12-11 Decodificador de extensión de audio de ancho de banda, procedimiento correspondiente y programa de ordenador
ES18151917T Active ES2921059T3 (es) 2008-12-15 2009-12-11 Decodificador de extensión de ancho de banda de audio, programa informático y procedimiento correspondiente
ES23180365T Active ES2968852T3 (es) 2008-12-15 2009-12-11 Decodificador de extensión de ancho de banda, procedimiento correspondiente y programa de ordenador

Family Applications Before (8)

Application Number Title Priority Date Filing Date
ES23180061T Active ES2968884T3 (es) 2008-12-15 2009-12-11 Decodificador de extensión de audio de ancho de banda, procedimiento correspondiente y programa de ordenador
ES23180085T Active ES2968886T3 (es) 2008-12-15 2009-12-11 Decodificador de extensión de audio de ancho de banda, procedimiento correspondiente y programa de ordenador
ES22166970T Active ES2951163T3 (es) 2008-12-15 2009-12-11 Decodificador de extensión de ancho de banda de audio, procedimiento correspondiente y programa informático
ES09797003.2T Active ES2613941T3 (es) 2008-12-15 2009-12-11 Codificador de audio y descodificador de extensión de ancho de banda
ES23180374T Active ES2966659T3 (es) 2008-12-15 2009-12-11 Decodificador de extensión de ancho de banda de audio, procedimiento correspondiente y programa informático
ES15167199.7T Active ES2674386T3 (es) 2008-12-15 2009-12-11 Codificador de audio y decodificador de extensión de ancho de banda
ES23180084T Active ES2968885T3 (es) 2008-12-15 2009-12-11 Decodificador de extensión de audio de ancho de banda, procedimiento correspondiente y programa de ordenador
ES18151917T Active ES2921059T3 (es) 2008-12-15 2009-12-11 Decodificador de extensión de ancho de banda de audio, programa informático y procedimiento correspondiente

Country Status (17)

Country Link
US (13) US8401862B2 (es)
EP (12) EP4231290B1 (es)
JP (3) JP2012512437A (es)
KR (2) KR101424944B1 (es)
CN (1) CN102246231B (es)
AU (1) AU2009328247B9 (es)
BR (2) BRPI0917762B1 (es)
CA (5) CA2908550C (es)
DK (1) DK3364414T3 (es)
ES (9) ES2968884T3 (es)
HK (2) HK1217810A1 (es)
HU (9) HUE064773T2 (es)
MX (1) MX2011006163A (es)
PL (12) PL4231292T3 (es)
PT (3) PT2359366T (es)
TR (1) TR201808500T4 (es)
WO (1) WO2010069885A1 (es)

Families Citing this family (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6992481B2 (en) 2003-05-29 2006-01-31 Timex Group B. V. Method for compensating for predictable generated signals in an electronic device
BRPI0917762B1 (pt) * 2008-12-15 2020-09-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V Codificador de áudio e decodificador de extensão de largura de banda
PL3998606T3 (pl) * 2009-10-21 2023-03-06 Dolby International Ab Nadrpóbkowanie w połączonym banku filtrów modułu transpozycji
AU2011226211B2 (en) * 2010-03-09 2014-01-09 Dolby International Ab Apparatus and method for processing an audio signal using patch border alignment
ES2449476T3 (es) 2010-03-09 2014-03-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato, procedimiento y programa de ordenador para procesar una señal de audio
WO2011110494A1 (en) 2010-03-09 2011-09-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Improved magnitude response and temporal alignment in phase vocoder based bandwidth extension for audio signals
FR2961938B1 (fr) * 2010-06-25 2013-03-01 Inst Nat Rech Inf Automat Synthetiseur numerique audio ameliore
US8560330B2 (en) * 2010-07-19 2013-10-15 Futurewei Technologies, Inc. Energy envelope perceptual correction for high band coding
WO2012158333A1 (en) 2011-05-19 2012-11-22 Dolby Laboratories Licensing Corporation Forensic detection of parametric audio coding schemes
US20130006644A1 (en) * 2011-06-30 2013-01-03 Zte Corporation Method and device for spectral band replication, and method and system for audio decoding
US9173025B2 (en) 2012-02-08 2015-10-27 Dolby Laboratories Licensing Corporation Combined suppression of noise, echo, and out-of-location signals
JP2015525374A (ja) * 2012-06-04 2015-09-03 サムスン エレクトロニクス カンパニー リミテッド オーディオ符号化方法及びその装置、オーディオ復号化方法及びその装置、並びにそれを採用するマルチメディア機器
KR101990884B1 (ko) * 2012-09-04 2019-06-19 에스케이 텔레콤주식회사 이종망 간의 통신품질 향상 방법 및 장치
EP2709106A1 (en) 2012-09-17 2014-03-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating a bandwidth extended signal from a bandwidth limited audio signal
US9258428B2 (en) * 2012-12-18 2016-02-09 Cisco Technology, Inc. Audio bandwidth extension for conferencing
EP2950308B1 (en) * 2013-01-22 2020-02-19 Panasonic Corporation Bandwidth expansion parameter-generator, encoder, decoder, bandwidth expansion parameter-generating method, encoding method, and decoding method
MX346945B (es) 2013-01-29 2017-04-06 Fraunhofer Ges Forschung Aparato y metodo para generar una señal de refuerzo de frecuencia mediante una operacion de limitacion de energia.
CN103971694B (zh) * 2013-01-29 2016-12-28 华为技术有限公司 带宽扩展频带信号的预测方法、解码设备
SG11201505912QA (en) 2013-01-29 2015-08-28 Fraunhofer Ges Forschung Audio encoder, audio decoder, method for providing an encoded audio information, method for providing a decoded audio information, computer program and encoded representation using a signal-adaptive bandwidth extension
EP2981959B1 (en) * 2013-04-05 2018-07-25 Dolby International AB Audio encoder and decoder for interleaved waveform coding
CN104217727B (zh) * 2013-05-31 2017-07-21 华为技术有限公司 信号解码方法及设备
EP2830065A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency
US10083708B2 (en) 2013-10-11 2018-09-25 Qualcomm Incorporated Estimation of mixing factors to generate high-band excitation signal
EP2871641A1 (en) * 2013-11-12 2015-05-13 Dialog Semiconductor B.V. Enhancement of narrowband audio signals using a single sideband AM modulation
JP6593173B2 (ja) * 2013-12-27 2019-10-23 ソニー株式会社 復号化装置および方法、並びにプログラム
EP3092640B1 (en) * 2014-01-07 2018-06-27 Harman International Industries, Incorporated Signal quality-based enhancement and compensation of compressed audio signals
FR3017484A1 (fr) * 2014-02-07 2015-08-14 Orange Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences
JPWO2015151451A1 (ja) * 2014-03-31 2017-04-13 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 符号化装置、復号装置、符号化方法、復号方法、およびプログラム
US9984699B2 (en) * 2014-06-26 2018-05-29 Qualcomm Incorporated High-band signal coding using mismatched frequency ranges
EP2963648A1 (en) * 2014-07-01 2016-01-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio processor and method for processing an audio signal using vertical phase correction
JP2016038435A (ja) * 2014-08-06 2016-03-22 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
US9830927B2 (en) * 2014-12-16 2017-11-28 Psyx Research, Inc. System and method for decorrelating audio data
US10847170B2 (en) 2015-06-18 2020-11-24 Qualcomm Incorporated Device and method for generating a high-band signal from non-linearly processed sub-ranges
KR101677137B1 (ko) * 2015-07-17 2016-11-17 국방과학연구소 변조 스펙트로그램을 이용한 수중 방사체의 데몬 및 lofar 특징을 동시 추출하는 방법 및 장치
EP3182411A1 (en) * 2015-12-14 2017-06-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing an encoded audio signal
EP3182410A3 (en) * 2015-12-18 2017-11-01 Dolby International AB Enhanced block switching and bit allocation for improved transform audio coding
EP3430620B1 (en) * 2016-03-18 2020-03-25 Fraunhofer Gesellschaft zur Förderung der Angewand Encoding by reconstructing phase information using a structure tensor on audio spectrograms
TWI752166B (zh) 2017-03-23 2022-01-11 瑞典商都比國際公司 用於音訊信號之高頻重建的諧波轉置器的回溯相容整合
EP3382703A1 (en) * 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and methods for processing an audio signal
GB2562253B (en) * 2017-05-09 2021-11-03 Imagination Tech Ltd Efficient detection of ranging code correlation function of a GNSS signal
US10896684B2 (en) * 2017-07-28 2021-01-19 Fujitsu Limited Audio encoding apparatus and audio encoding method
CN109729585B (zh) * 2017-10-27 2022-04-15 成都鼎桥通信技术有限公司 网络处理方法和装置
US11158297B2 (en) * 2020-01-13 2021-10-26 International Business Machines Corporation Timbre creation system
CA3192322A1 (en) * 2020-09-09 2022-03-17 Sparrow Acoustics Inc. Method and system for performing time-domain processing of a waveform signal
US20230110255A1 (en) * 2021-10-12 2023-04-13 Zoom Video Communications, Inc. Audio super resolution

Family Cites Families (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2512908A (en) 1947-10-16 1950-06-27 Mina M Arndt Telephone switchboard mounting plate with plug-in components
US5455888A (en) 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
EP0880235A1 (en) 1996-02-08 1998-11-25 Matsushita Electric Industrial Co., Ltd. Wide band audio signal encoder, wide band audio signal decoder, wide band audio signal encoder/decoder and wide band audio signal recording medium
JPH10124088A (ja) 1996-10-24 1998-05-15 Sony Corp 音声帯域幅拡張装置及び方法
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US6549884B1 (en) * 1999-09-21 2003-04-15 Creative Technology Ltd. Phase-vocoder pitch-shifting
US7742927B2 (en) * 2000-04-18 2010-06-22 France Telecom Spectral enhancing method and device
SE0001926D0 (sv) * 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
SE0004187D0 (sv) 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
JP2003108197A (ja) 2001-07-13 2003-04-11 Matsushita Electric Ind Co Ltd オーディオ信号復号化装置およびオーディオ信号符号化装置
EP1351401B1 (en) 2001-07-13 2009-01-14 Panasonic Corporation Audio signal decoding device and audio signal encoding device
US6895375B2 (en) 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech
EP1423847B1 (en) * 2001-11-29 2005-02-02 Coding Technologies AB Reconstruction of high frequency components
US20040002844A1 (en) 2002-06-27 2004-01-01 Jess Jochen A.G. System and method for statistical modeling and statistical timing analysis of integrated circuits
US8090577B2 (en) 2002-08-08 2012-01-03 Qualcomm Incorported Bandwidth-adaptive quantization
JP3861770B2 (ja) 2002-08-21 2006-12-20 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
DE10328777A1 (de) 2003-06-25 2005-01-27 Coding Technologies Ab Vorrichtung und Verfahren zum Codieren eines Audiosignals und Vorrichtung und Verfahren zum Decodieren eines codierten Audiosignals
BRPI0414444B1 (pt) * 2003-09-16 2020-05-05 Matsushita Electric Ind Co Ltd aparelho de codificação, aparelho de decodificação, método de codificação e método de decodificação
DE10345996A1 (de) 2003-10-02 2005-04-28 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Verarbeiten von wenigstens zwei Eingangswerten
DE10345995B4 (de) 2003-10-02 2005-07-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Verarbeiten eines Signals mit einer Sequenz von diskreten Werten
JP4254479B2 (ja) * 2003-10-27 2009-04-15 ヤマハ株式会社 オーディオ帯域拡張再生装置
DE102004046746B4 (de) * 2004-09-27 2007-03-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren zum Synchronisieren von Zusatzdaten und Basisdaten
WO2006049205A1 (ja) * 2004-11-05 2006-05-11 Matsushita Electric Industrial Co., Ltd. スケーラブル復号化装置およびスケーラブル符号化装置
EP1686564B1 (en) * 2005-01-31 2009-04-15 Harman Becker Automotive Systems GmbH Bandwidth extension of bandlimited acoustic signals
JP4604864B2 (ja) 2005-06-14 2011-01-05 沖電気工業株式会社 帯域拡張装置及び不足帯域信号生成器
US7953605B2 (en) * 2005-10-07 2011-05-31 Deepen Sinha Method and apparatus for audio encoding and decoding using wideband psychoacoustic modeling and bandwidth extension
US7953604B2 (en) * 2006-01-20 2011-05-31 Microsoft Corporation Shape and scale parameters for extended-band frequency coding
US20080004866A1 (en) * 2006-06-30 2008-01-03 Nokia Corporation Artificial Bandwidth Expansion Method For A Multichannel Signal
ATE435480T1 (de) * 2006-10-25 2009-07-15 Fraunhofer Ges Forschung Vorrichtung und verfahren zur erzeugung von audio-subband-werten und vorrichtung und verfahren zur erzeugung von zeit-domänen-audio-beispielen
JP2008158300A (ja) * 2006-12-25 2008-07-10 Sony Corp 信号処理装置、信号処理方法、再生装置、再生方法、電子機器
US7912729B2 (en) * 2007-02-23 2011-03-22 Qnx Software Systems Co. High-frequency bandwidth extension in the time domain
DE102008015702B4 (de) 2008-01-31 2010-03-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals
EP2293295A3 (en) * 2008-03-10 2011-09-07 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Device and method for manipulating an audio signal having a transient event
US7977562B2 (en) * 2008-06-20 2011-07-12 Microsoft Corporation Synthesized singing voice waveform generator
US8880410B2 (en) * 2008-07-11 2014-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating a bandwidth extended signal
EP2301026B1 (en) * 2008-07-11 2020-03-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio signal synthesizer and audio signal encoder
WO2010036061A2 (en) * 2008-09-25 2010-04-01 Lg Electronics Inc. An apparatus for processing an audio signal and method thereof
US8258849B2 (en) * 2008-09-25 2012-09-04 Lg Electronics Inc. Method and an apparatus for processing a signal
BRPI0917762B1 (pt) * 2008-12-15 2020-09-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V Codificador de áudio e decodificador de extensão de largura de banda
CA2966469C (en) * 2009-01-28 2020-05-05 Dolby International Ab Improved harmonic transposition
PL3998606T3 (pl) * 2009-10-21 2023-03-06 Dolby International Ab Nadrpóbkowanie w połączonym banku filtrów modułu transpozycji
MX2012001696A (es) * 2010-06-09 2012-02-22 Panasonic Corp Metodo de extension de ancho de banda, aparato de extension de ancho de banda, programa, circuito integrado, y aparato de descodificacion de audio.
WO2012113035A1 (en) 2011-02-25 2012-08-30 Polyline Piping Systems Pty Ltd Mobile plastics extrusion plant
CN105976830B (zh) * 2013-01-11 2019-09-20 华为技术有限公司 音频信号编码和解码方法、音频信号编码和解码装置
US9666202B2 (en) * 2013-09-10 2017-05-30 Huawei Technologies Co., Ltd. Adaptive bandwidth extension and apparatus for the same

Also Published As

Publication number Publication date
US20230049083A1 (en) 2023-02-16
EP2945159B1 (en) 2018-03-21
US20150243293A1 (en) 2015-08-27
EP4231290B1 (en) 2023-11-15
EP4224475C0 (en) 2023-10-11
EP4224475A1 (en) 2023-08-09
ES2613941T3 (es) 2017-05-29
HUE064653T2 (hu) 2024-04-28
PL4231295T3 (pl) 2024-05-06
PL4224474T3 (pl) 2024-04-02
CA2908576A1 (en) 2010-06-24
BRPI0917762B1 (pt) 2020-09-29
EP4053838C0 (en) 2023-06-21
US11594237B2 (en) 2023-02-28
HUE064775T2 (hu) 2024-04-28
US20230032124A1 (en) 2023-02-02
HUE064767T2 (hu) 2024-04-28
PL3364414T3 (pl) 2022-08-16
EP3364414B1 (en) 2022-04-13
CA2908847C (en) 2018-02-13
JP2012512437A (ja) 2012-05-31
ES2921059T3 (es) 2022-08-17
EP4231294C0 (en) 2023-11-15
US20230053046A1 (en) 2023-02-16
CA2908550C (en) 2018-02-13
EP4231291C0 (en) 2023-11-15
CA2908550A1 (en) 2010-06-24
EP4231295B1 (en) 2024-02-21
EP4231293A1 (en) 2023-08-23
EP4231292A1 (en) 2023-08-23
PT2945159T (pt) 2018-06-26
EP4231290C0 (en) 2023-11-15
US20230072871A1 (en) 2023-03-09
EP4231291B1 (en) 2023-11-15
JP6076407B2 (ja) 2017-02-08
EP4231290A1 (en) 2023-08-23
EP2359366A1 (en) 2011-08-24
KR20110095354A (ko) 2011-08-24
KR101424944B1 (ko) 2014-08-01
CA2746837A1 (en) 2010-06-24
HUE064777T2 (hu) 2024-04-28
EP4231293C0 (en) 2023-11-15
HK1217810A1 (zh) 2017-01-20
CN102246231A (zh) 2011-11-16
CA2746837C (en) 2016-09-20
HUE064620T2 (hu) 2024-04-28
EP4053838A1 (en) 2022-09-07
TR201808500T4 (tr) 2018-07-23
US10229696B2 (en) 2019-03-12
US20230377590A1 (en) 2023-11-23
PL2359366T3 (pl) 2017-04-28
PL4231294T3 (pl) 2024-04-08
US11631418B2 (en) 2023-04-18
EP4224474C0 (en) 2023-11-01
MX2011006163A (es) 2011-11-02
EP4224475B1 (en) 2023-10-11
HUE065515T2 (hu) 2024-05-28
US11664039B2 (en) 2023-05-30
US11741978B2 (en) 2023-08-29
EP4231294B1 (en) 2023-11-15
HK1259024A1 (zh) 2019-11-22
EP4224474A1 (en) 2023-08-09
EP4231293B1 (en) 2023-11-15
US20230051135A1 (en) 2023-02-16
PL4231293T3 (pl) 2024-04-08
CA2989886A1 (en) 2010-06-24
US20230037621A1 (en) 2023-02-09
US11626124B2 (en) 2023-04-11
US20190156845A1 (en) 2019-05-23
WO2010069885A1 (en) 2010-06-24
CA2908847A1 (en) 2010-06-24
CA2989886C (en) 2020-05-05
DK3364414T3 (da) 2022-06-27
US11670316B2 (en) 2023-06-06
PL4224475T3 (pl) 2024-03-18
ES2674386T3 (es) 2018-06-29
BR122015019030A2 (pt) 2019-08-27
EP4231295A1 (en) 2023-08-23
PL4231290T3 (pl) 2024-04-02
BRPI0917762A2 (pt) 2016-07-26
ES2966659T3 (es) 2024-04-23
AU2009328247B2 (en) 2013-06-06
PL4231291T3 (pl) 2024-04-15
US20210151063A1 (en) 2021-05-20
ES2968886T3 (es) 2024-05-14
KR20130133914A (ko) 2013-12-09
US11646043B2 (en) 2023-05-09
HUE064773T2 (hu) 2024-04-28
US10937437B2 (en) 2021-03-02
PL4053838T3 (pl) 2023-11-13
US11705146B2 (en) 2023-07-18
EP4231292C0 (en) 2023-11-15
US20130185082A1 (en) 2013-07-18
EP4231295C0 (en) 2024-02-21
JP2014142653A (ja) 2014-08-07
EP4231291A1 (en) 2023-08-23
PT2359366T (pt) 2017-01-20
EP4053838B1 (en) 2023-06-21
US9058802B2 (en) 2015-06-16
JP2015187747A (ja) 2015-10-29
HUE064774T2 (hu) 2024-04-28
PL2945159T3 (pl) 2018-08-31
AU2009328247B9 (en) 2013-12-05
KR101369267B1 (ko) 2014-03-04
JP5970014B2 (ja) 2016-08-17
HUE064771T2 (hu) 2024-04-28
US8401862B2 (en) 2013-03-19
PT3364414T (pt) 2022-07-04
US20230041923A1 (en) 2023-02-09
EP4224474B1 (en) 2023-11-01
CN102246231B (zh) 2013-07-10
ES2968884T3 (es) 2024-05-14
ES2951163T3 (es) 2023-10-18
EP2945159A1 (en) 2015-11-18
EP2359366B1 (en) 2016-11-02
ES2968885T3 (es) 2024-05-14
CA2908576C (en) 2018-11-27
EP3364414A1 (en) 2018-08-22
PL4231292T3 (pl) 2024-04-02
EP4231294A1 (en) 2023-08-23
US20110288873A1 (en) 2011-11-24
EP4231292B1 (en) 2023-11-15
BR122015019030B1 (pt) 2020-05-05
AU2009328247A1 (en) 2011-07-07

Similar Documents

Publication Publication Date Title
ES2968852T3 (es) Decodificador de extensión de ancho de banda, procedimiento correspondiente y programa de ordenador
AU2015203736C1 (en) Audio encoder and bandwidth extension decoder