ES2968886T3 - Decodificador de extensión de audio de ancho de banda, procedimiento correspondiente y programa de ordenador - Google Patents
Decodificador de extensión de audio de ancho de banda, procedimiento correspondiente y programa de ordenador Download PDFInfo
- Publication number
- ES2968886T3 ES2968886T3 ES23180085T ES23180085T ES2968886T3 ES 2968886 T3 ES2968886 T3 ES 2968886T3 ES 23180085 T ES23180085 T ES 23180085T ES 23180085 T ES23180085 T ES 23180085T ES 2968886 T3 ES2968886 T3 ES 2968886T3
- Authority
- ES
- Spain
- Prior art keywords
- frequency
- signal
- bandwidth
- audio signal
- parameter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 57
- 238000004590 computer program Methods 0.000 title claims description 9
- 230000005236 sound signal Effects 0.000 claims abstract description 191
- 238000000605 extraction Methods 0.000 claims description 15
- 238000012937 correction Methods 0.000 description 19
- 238000010586 diagram Methods 0.000 description 19
- 230000006870 function Effects 0.000 description 14
- 238000001228 spectrum Methods 0.000 description 14
- 230000003595 spectral effect Effects 0.000 description 13
- 230000005540 biological transmission Effects 0.000 description 9
- 238000004364 calculation method Methods 0.000 description 8
- 230000001934 delay Effects 0.000 description 7
- 238000004422 calculation algorithm Methods 0.000 description 5
- 238000001914 filtration Methods 0.000 description 5
- 230000002829 reductive effect Effects 0.000 description 5
- 230000006978 adaptation Effects 0.000 description 4
- 230000001965 increasing effect Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000002238 attenuated effect Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 230000017105 transposition Effects 0.000 description 2
- 101000969688 Homo sapiens Macrophage-expressed gene 1 protein Proteins 0.000 description 1
- 102100021285 Macrophage-expressed gene 1 protein Human genes 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
- G10L19/265—Pre-filtering, e.g. high frequency emphasis prior to encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/04—Time compression or expansion
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Circuits Of Receivers In General (AREA)
- Stereophonic System (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
- Circuit For Audible Band Transducer (AREA)
- Amplifiers (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
Abstract
Un decodificador (500), (600) de extensión de ancho de banda para proporcionar una señal (532) de audio extendida en ancho de banda basada en una señal (502) de audio de entrada y una señal (504) de parámetro, en donde la señal (504) de parámetro comprende una indicación de un frecuencia de compensación y una indicación de un parámetro de densidad de potencia, comprende: un generador de parches (510) configurado para generar una señal de alta frecuencia de extensión de ancho de banda (512) que comprende una banda de alta frecuencia, en donde la banda de alta frecuencia de la extensión de ancho de banda alta -la señal de frecuencia (512) se genera basándose en un desplazamiento de frecuencia de una banda de frecuencia de la señal de audio de entrada (502), en donde el cambio de frecuencia se basa en la frecuencia de compensación, y en donde el generador de parches (510) está configurado para amplificar o atenuar la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda (512) por un factor igual al valor del parámetro de densidad de potencia o igual al valor recíproco del parámetro de densidad de potencia, respectivamente; un combinador (529) configurado para combinar la señal de alta frecuencia de extensión de ancho de banda (512) y la señal de audio de entrada (502) para obtener la señal de audio de extensión de ancho de banda (532); y una interfaz de salida (530) configurada para proporcionar la señal de audio ampliada de ancho de banda (532). (Traducción automática con Google Translate, sin valor legal)
Description
DESCRIPCIÓN
Decodificador de extensión de audio de ancho de banda, procedimiento correspondiente y programa de ordenador[0001]Las realizaciones según la invención se refieren al procesamiento de señales de audio y, en particular, a un decodificador de audio y un procedimiento para proporcionar una señal de audio extendida de ancho de banda.
[0002]La codificación adaptada a la audición de señales de audio para reducción de datos para un almacenamiento y transmisión eficiente de estas señales ha ganado aceptación en muchos campos. Algoritmos de codificación son conocidos, por ejemplo, tales como MPEG A CAPA 3, “MP3” o MPEG 4 AAC. El algoritmo de codificación usado para esto, en particular cuando se obtienen proporciones de bits más bajas, conduce a la reducción de la calidad de audio que es frecuentemente provocada principalmente por una limitación lateral del codificador del ancho de banda de la señal de audio que se va a transmitir. Una señal filtrada de paso bajo se codifica utilizando un llamado codificador de núcleo o codificador central y la región con frecuencias más altas se parametriza, de tal manera que se puedan reconstruir aproximadamente a partir de la señal filtrada de paso bajo.
[0003]Se conoce a partir del documento WO 9857436 el hecho de someter la señal de audio a una limitación de banda en tal situación en el lado del codificador y codificar solamente una banda más baja de la señal de audio por medio de un codificador de audio de alta calidad. La banda superior, sin embargo, se caracteriza únicamente de forma muy brusca, es decir, por un conjunto de parámetros que permiten la reproducción de la envolvente espectral original de la banda superior. En el lado del decodificador, la banda superior se sintetiza a continuación. Para este propósito, se propone una transposición armónica, en la que la banda inferior de la señal de audio decodificada se suministra a un banco de filtros. Canales de banco de filtros de la banda inferior están conectados a canales de banco de filtros de la banda superior, o son “parcheados” (interconectados), y cada señal de paso de banda parcheada se somete a un ajuste de envolvente. El banco de filtros de síntesis que pertenece a un banco de filtros de análisis especial recibe aquí señales de paso de banda de la señal de audio en la banda inferior y señales de paso de banda ajustadas a la envolvente de la banda inferior que se parchearon armónicamente a la banda superior. La señal de salida del banco de filtros de síntesis es una señal de audio extendida con respecto a su ancho de banda de audio que fue transmitida del lado del codificador al lado del decodificador con una proporción de datos muy baja. En particular, los cálculos de banco de filtros y parcheo en el dominio de banco de filtros se puede convertir en un esfuerzo computacional alto.
[0004]Procedimientos de complejidad reducida para una extensión de ancho de banda de señales de audio de banda limitada en lugar de esto utilizan una función de copia de porciones de la señal de baja frecuencia (LF) al intervalo de alta frecuencia (HF), con el fin de aproximar información perdida debido a la limitación de banda. Tales procedimientos se describen en M. Dietz, L. Liljeryd, K. Kjorling y 0. Kunz, "Spectral Band Replication, a novel approach in audio coding," en la 112a Convención AES, Munich, Mayo de 2002; S. Meltzer, R. Bohm y F. Henn, "SBR enhanced audio codecs for digital broadcasting such as "Digital Radio Mondiale" (DRM)," 112a Convención AES, Munich, Mayo de 2002; T. Ziegler, A. Ehret, P. Ekstrand y M. Lutzky, "Enhancing mp3 with SBR: Features and Capabilities of the new mp3PRO Algorithm," en 112a Convención AES, Munich, Mayo de 2002; International Standard ISO/IEC 14496 3:2001/FPDAM l, "Bandwidth Extension," ISO/IEC, 2002, o "Speech bandwidth extension method and apparatus", Vasu lyengar y col. Patente de EE. UU. N. ° 5.455.888.
[0005]En estos procedimientos, no se efectúa ninguna transposición armónica, pero los canales del banco de filtros de fase de banda adyacentes de la banda inferior se introducen artificialmente a canales del banco de filtros adyacentes de la banda superior. Esto conduce a una aproximación burda de la banda superior de la señal de audio. Esta aproximación burda de la señal se perfecciona a continuación, en una etapa adicional, al definir parámetros de control adicionales deducidos de la señal original. Como un ejemplo, el estándar de MPEG-4 utiliza factores de escala para ajustar la envolvente espectral, una combinación de filtración inversa y adición de un ruido de fondo para adaptar la tonalidad e inserciones de porciones de señal sinusoidales para complementación de componentes tonales.
[0006]Aparte de esto, existen procedimientos adicionales tales como la llamada “extensión de ancho de banda ciega”, descrita en E. Larsen, R.M. Aarts y M. Danessis, “Efficient high-frequency bandwidth extension of music and speech”, en 112a Convención AES, Munich, Alemania, Mayo de 2002 en la que no se usa ninguna información del intervalo de HF original. Además, también existe el procedimiento de la llamada “extensión de ancho de banda artificial” que se describe en K. Kayhko, A Robust Wideband Enhancement for Narrowband Speech Signal; Research Report, Helsinki University of Technology, Laboratory of Acoustics and Audio signal Processing, 2001.
[0007]En J. Makinen y col.: AMR-WB+: a new audio coding standard for 3rd generation mobile audio services Broadcasts, IEEE, ICASSP '05 se describe un procedimiento para extensión de ancho de banda, en el que la operación de copia de componentes de baja frecuencia a la banda alta se efectúa por una operación de reflejo o espejo obtenida, por ejemplo, mediante toma de muestras ascendentes de la señal filtrada de paso bajo.
[0008]Como una alternativa, se puede emplear una modulación de banda lateral individual que es básicamente equivalente a una operación de copia en el dominio de banco de filtros. Procedimientos que habilitan una extensión de ancho de banda armónica emplean usualmente una etapa de determinación del paso (rastreo de paso), una etapa de distorsión no lineal (véase, por ejemplo, “U. Kornagel, Spectral widening of the excitation signal for telephone-band speech enhancement, en: Proceedings of the IWAENC, Darmstadt, Alemania, Septiembre de 2001, pp. 215 - 218”) o hacen uso de vocodificadores de fase tales como por ejemplo como se muestran por la solicitud de patente de EE. UU. provisional “F.Nagel, S. Disch: “Apparatus and method of harmonic bandwidth extension in audio signals” con el número de solicitud US 61/025129.
[0009]El documento WO 02/41302 A1, por ejemplo, muestra un procedimiento para mejorar el desempeño de sistemas de codificación que usan procedimientos de reconstrucción de alta frecuencia. Muestra cómo mejorar el desempeño global de tales sistemas por medio de una adaptación sobre el tiempo de la frecuencia de cruce entre la banda baja codificada por un codificador central y la banda alta codificada por un sistema de reconstrucción de alta frecuencia. Para este procedimiento, el codificador de núcleo o codificador central debe ser capaz de trabajar con diferentes frecuencias de cruce en el lado del codificador, así como en el lado del decodificador. Por consiguiente, se incrementa la complejidad del codificador del núcleo o codificador central.
[0010]Tecnologías adicionales para extensiones de ancho de banda se describen, por ejemplo, en “R. M. Aarts, E. Larsen y O. Ouweltjes, A unified approach to low- and high-frequency bandwidth extension. En 115a Convention AES, Nueva York, EUA, Octubre de 2003”, E. Larsen y R. M. Aarts: Audio Bandwidth Extension -Application to psychoacoustics, Signal Processing and Loudspeaker Design. John Wiley & Sons, Ltd, 2004”, E. Larsen, R. M. Aarts y M. Danessis: Efficient high-frequency bandwidth extension of music and speech. En 112a Convención AES 112th, Munich, Alemania, Mayo de 2002”, “J. Makhoul: Spectral Analysis of Speech by Linear Prediction. IEEE Transactions on Audio and Electroacoustics, AU-21(3), Junio de 1973“, “Solicitud de patente de EE. UU. 08/951.029, Ohmori y col.: Audio band width extending system and method” y la “patente de EE. UU. 6895375, Malah, D y Cox, R. VS.: System for bandwidth extension of Narrow-band speech”.
[0011]Los procedimientos de extensión de ancho de banda armónicos frecuentemente exhiben una alta complejidad, mientras que los procedimientos de extensión de ancho de banda de complejidad reducida muestran pérdidas de calidad. En el caso particular en el que una baja proporción de bits se combina con un ancho de banda pequeño de la banda baja, se pueden presentar artefactos tales como rugosidad o aspereza y un timbre percibido como desagradable. Una razón para esto es el hecho de que la porción de HF aproximada se basa en una operación de copia que no mantiene ni las relaciones armónicas entre las porciones de señal tonales. Esto se aplica tanto a la relación armónica entre LF y HF y también a la relación armónica entre interconexiones subsecuentes dentro de la porción de HF misma. Por ejemplo, dentro de SBR, la yuxtaposición de los componentes codificados y los componentes replicados, que se presenta en la frontera entre las bandas baja y alta puede provocar impresiones de sonido áspero o rugoso. La razón se ilustra en la figura 18 donde porciones tonales copiadas del intervalo LF al intervalo de HF son espectralmente adyacentes densamente a porciones tonales del intervalo de LF.
[0012]La figura 18a muestra el espectrograma original 1800a de una señal constituido por tres tonos. De conformidad, la figura 18b muestra un diagrama 1800b de la señal extendida del ancho de banda correspondiente a la señal original de la figura 18a. La abscisa indica el tiempo y la ordenada indica la frecuencia. En particular, en el último tono, se pueden observar problemas potenciales 1810 (líneas discontinuas 1810).
[0013]Si las relaciones armónicas son consideradas mediante procedimientos conocidos, esto siempre se hace en base a una estimación de F<0>. En estos casos, el éxito de estos procedimientos depende principalmente de la fiabilidad de esta estimación.
[0014]En general, los procedimientos de extensión de ancho de banda conocidos proporcionan señales de audio a una baja proporción de bits, pero con calidad de audio deficiente o una calidad de audio buena a altas proporciones de bits.
[0015]El documento US 2004/028244 describe un dispositivo de decodificación que genera datos espectrales de frecuencia a partir de un flujo de datos de audio codificado de entrada e incluye: una unidad de decodificación de núcleo para decodificar la corriente de datos codificada de entrada y generar datos espectrales de menor frecuencia que representan una señal de audio; y una unidad de decodificación extendida para generar, basada en los datos espectrales de menor frecuencia, datos espectrales de frecuencia extendidos que indican una estructura armónica, que es la misma que una extensión a lo largo del eje de frecuencia de la estructura armónica indicada por los datos espectrales de menor frecuencia, en una región de frecuencia que no está representada por la corriente de datos codificada.
[0016]Es el objeto de la presente invención proporcionar un esquema de decodificación de extensión de ancho de banda mejorado para señales de audio.
[0017]Este objeto se obtiene por un decodificador de extensión de ancho de banda según la reivindicación 1, o un procedimiento según la reivindicación 8 o un programa informático según la reivindicación 9.
[0018]Un ejemplo proporciona un codificador de audio para proporcionar una señal de salida que utiliza una señal de audio de entrada. El codificador de audio comprende un generador de parche, un comparador y una interfaz de salida.
[0019] El generador de parche está configurado para generar al menos una señal de alta frecuencia de extensión de ancho de banda. Una señal de alta frecuencia de extensión de ancho de banda comprende una banda de alta frecuencia, en la que la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda se basa en una banda de baja frecuencia de la señal de audio de entrada. Diferentes señales de alta frecuencia de extensión de ancho de banda comprenden diferentes frecuencias dentro de sus bandas de alta frecuencia si se generan diferentes señales de alta frecuencia de extensión de ancho de banda.
[0020] El comparador está configurado para calcular una pluralidad de parámetros de comparación. Se calcula un parámetro de comparación en función de una comparación de la señal de audio de entrada y una señal de alta frecuencia de extensión de ancho de banda generada. Cada parámetro de comparación de la pluralidad de los parámetros de comparación se calcula en función de una frecuencia de desplazamiento diferente entre la señal de audio de entrada y una señal de alta frecuencia de extensión de ancho de banda generada. Además, el comparador se configura para determinar un parámetro de comparación a partir de la pluralidad de los parámetros de comparación, en el que el parámetro de comparación determinado cumple un criterio predefinido.
[0021] En otras palabras, por ejemplo, el comparador se puede configurar para determinar el parámetro de comparación entre la pluralidad de los parámetros de comparación que cumple en el mejor de los casos un criterio predefinido.
[0022] La interfaz de salida se configura para proporcionar la señal de salida para la transmisión o el almacenamiento. La señal de salida comprende una indicación de parámetro basada en una frecuencia de desplazamiento correspondiente al parámetro de comparación determinado.
[0023] En otras palabras, la señal de salida puede comprender el parámetro de comparación seleccionado que indica la frecuencia de desplazamiento óptima.
[0024] Una realización de la invención proporciona un decodificador de extensión de ancho de banda para proporcionar una señal de audio extendida de ancho de banda basada en una señal de audio de entrada y una señal de parámetro, según la reivindicación independiente 1.
[0025] Un ejemplo proporciona un decodificador de extensión de ancho de banda para proporcionar una señal de audio extendida de ancho de banda basada en una señal de audio de entrada. El decodificador de extensión de ancho de banda comprende un generador de parche, un comparador, un combinador y una interfaz de salida.
[0026] El generador de parche está configurado para generar al menos una señal de alta frecuencia de extensión de ancho de banda que comprende una banda de alta frecuencia basada en la señal de audio de entrada, en la que una frecuencia de corte más baja de la banda de alta frecuencia de una señal de alta frecuencia de extensión de ancho de banda generada es más baja que una frecuencia de corte superior de la señal de audio de entrada. Diferentes señales generadas de extensión de ancho de banda de alta frecuencia comprenden diferentes frecuencias dentro de sus bandas de alta frecuencia, si se generan diferentes señales de alta frecuencia de extensión de ancho de banda.
[0027] El comparador está configurado para calcular una pluralidad de parámetros de comparación. Se calcula un parámetro de comparación en función de una comparación de la señal de audio de entrada y una señal de alta frecuencia de extensión de ancho de banda generada. Cada parámetro de comparación de la pluralidad de los parámetros de comparación se calcula en función de una frecuencia de desplazamiento diferente entre la señal de audio de entrada y la señal de alta frecuencia de extensión de ancho de banda generada. Además, el comparador está configurado para determinar un parámetro de comparación a partir de la pluralidad de los parámetros de comparación, en el que el parámetro de comparación determinado cumple un criterio predefinido.
[0028] En otras palabras, por ejemplo, el comparador está configurado para determinar el parámetro de comparación entre la pluralidad de los parámetros de comparación que cumple en el mejor de los casos un criterio predefinido.
[0029] El combinador está configurado para combinar la señal de audio de entrada y una señal de alta frecuencia de extensión de ancho de banda para obtener la señal de audio extendida de ancho de banda, en el que la señal de alta frecuencia de extensión de ancho de banda utilizada para obtener la señal de audio extendida de ancho de banda se basa en una frecuencia de desplazamiento correspondiente al parámetro de comparación determinado.
[0030] La interfaz de salida se configura para proporcionar la señal de audio extendida de ancho de banda.
[0031] Las realizaciones según la presente invención se basan en la idea central de que una señal de alta frecuencia de extensión de ancho de banda que también se llama parche puede generarse y compararse con la señal de audio de entrada original. Al usar una frecuencia de desplazamiento diferente de la señal de alta frecuencia de extensión de ancho de banda o varias señales de alta frecuencia de extensión de ancho de banda con diferentes frecuencias de desplazamiento, se pueden calcular una pluralidad de parámetros de comparación correspondientes a las diferentes frecuencias de desplazamiento. Los parámetros de comparación pueden estar relacionados con una cantidad asociada con la calidad de audio. Por lo tanto, se puede determinar un parámetro de comparación asegurando la compatibilidad de la señal de alta frecuencia de extensión de ancho de banda y la señal de audio de entrada, y como consecuencia, haciendo que la calidad de audio mejore.
[0032] La velocidad de bits para la transmisión o el almacenamiento de la señal de audio codificada puede disminuirse utilizando una indicación de parámetro basada en la frecuencia de desplazamiento correspondiente al parámetro de comparación determinado para una reconstrucción de la banda de alta frecuencia de la señal de audio de entrada original. De esta manera, solo una porción de baja frecuencia de la señal de audio de entrada y la indicación del parámetro deben almacenarse o transmitirse.
[0033] El parámetro de comparación de los términos, la frecuencia xOver y la indicación del parámetro se definirán más adelante.
[0034]
Algunos ejemplos se refieren a un comparador mediante el uso de una correlación cruzada para la comparación de la señal de audio de entrada y la señal de alta frecuencia de extensión de ancho de banda generada para calcular el parámetro de comparación.
[0035] Algunos ejemplos se refieren a un generador de parche, que genera la señal de alta frecuencia de extensión de ancho de banda en el dominio de tiempo basada en una única modulación de banda lateral.
[0036] Un esquema de codificación mejorado para señales de audio permite incrementar la calidad de audio y/o disminuir la proporción de bits para transmisión o almacenamiento.
[0037] Ejemplos para ilustrar la invención y las realizaciones según la invención se detallarán subsecuentemente en referencia a los dibujos adjuntos, en los cuales:
La figura 1 es un diagrama de bloques de un codificador de audio;
La figura 2 es una ilustración esquemática de una generación de señal de alta frecuencia de extensión de ancho de banda, una comparación de la señal de audio de entrada y una señal de alta frecuencia de extensión de ancho de banda generada y una adaptación de energía de la señal de alta frecuencia de extensión de ancho de banda;
La figura 3 es una ilustración esquemática de una generación de señal de alta frecuencia de extensión de ancho de banda, una comparación de la señal de audio de entrada y una señal de alta frecuencia de extensión de ancho de banda y una adaptación de energía de la señal de alta frecuencia de extensión de ancho de banda;
La figura 4 es un diagrama de bloques de un codificador de extensión de ancho de banda;
La figura 5 es un diagrama de bloques de un decodificador de extensión de ancho de banda;
La figura 6 es un diagrama de bloques de un decodificador de extensión de ancho de banda;
La figura 7 es un diagrama de flujo de un procedimiento para proporcionar una señal de salida en base a una señal de audio de entrada;
La figura 8 es un diagrama de flujo de un procedimiento para proporcionar una señal de audio extendida en ancho de banda;
La figura 9 es un diagrama de flujo de un procedimiento para proporcionar una señal de salida en base a una señal de audio de entrada;
La figura 10 es un diagrama de flujo de un procedimiento para calcular un parámetro de comparación;
La figura 11 es una ilustración esquemática de una interpolación de la frecuencia de desplazamiento;
La figura 12 es un diagrama de bloques de un decodificador de extensión de ancho de banda;
La figura 13 es un diagrama de flujo de un procedimiento para proporcionar una señal de audio extendida de ancho de banda;
La figura 14 es un diagrama de bloques de un procedimiento para proporcionar una señal de audio extendida en ancho de banda;
La figura 15 es un diagrama de bloques de un codificador de extensión de ancho de banda;
La figura 16a es un espectrograma de tres tonos mediante el uso de una frecuencia de cruce variable;
La figura 16b es un espectrograma de la señal de audio original de tres tonos;
La figura 17 es un diagrama del espectro de energía de una señal de audio original, una señal de audio extendida en ancho de banda mediante el uso de la frecuencia de cruce constante y una señal de audio extendida en ancho de banda mediante el uso de una frecuencia de cruce variable;
La figura 18a es un espectrograma de tres tonos mediante el uso de un procedimiento de extensión de ancho de banda conocido; y
La figura 18b es un espectrograma de la señal de audio original de tres tonos.
[0038] En lo sucesivo, los mismos números de referencia se utilizan parcialmente para objetos y unidades funcionales que tienen las mismas propiedades funcionales o propiedades funcionales similares y la descripción de las mismas con respecto a una figura también se aplicará a otras figuras con el fin de reducir redundancia en la descripción de las realizaciones.
[0039]La figura 1 muestra un diagrama de bloques de un codificador de audio 100 para proporcionar una señal de salida 132 según una realización de la invención, mediante el uso de una señal de audio de entrada 102. La señal de salida es apropiada para una extensión de ancho de banda en un decodificador. Por consiguiente, el codificador de audio se denomina también codificador de extensión de ancho de banda. El codificador de extensión de ancho de banda 100 comprende un generador de parche 110, un comparador 120 y una interfaz de salida 130. El generador de parche 110 está conectado al comparador 120 y el comparador 120 está conectado a la interfaz de salida 130.
[0040]El generador de parche 110 genera al menos una señal de alta frecuencia de extensión de ancho de banda 112. Una señal de alta frecuencia de extensión de ancho de banda 112 comprende una banda de alta frecuencia, en la que la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda 112 está basada en una banda de baja frecuencia de la señal de audio de entrada 102. Si se generan diferentes señales de alta frecuencia de extensión de ancho de banda 112, las diferentes señales de alta frecuencia de extensión de ancho de banda 112 comprenden diferentes frecuencias dentro de sus bandas de alta frecuencia.
[0041]El comparador 120 calcula una pluralidad de parámetros de comparación. Un parámetro de comparación se calcula en base a una comparación de la señal de audio de entrada 102 y una señal de alta frecuencia de extensión de ancho de banda generada 112. Cada parámetro de comparación de la pluralidad de parámetros de comparación se calcula en base a una frecuencia de desplazamiento diferente entre la señal de audio de entrada 102 y una señal de alta frecuencia de extensión de ancho de banda generada 112. Además, el comparador 120 determina un parámetro de comparación de la pluralidad de parámetros de comparación, en el que el parámetro de comparación determinado cumple un criterio predefinido.
[0042]La interfaz de salida 130 proporciona la señal de salida 132 para transmisión o almacenamiento. La señal de salida 132 comprende una indicación de parámetro basada en una frecuencia de desplazamiento correspondiente al parámetro de comparación determinado.
[0043]Al calcular una pluralidad de parámetros de comparación para diferentes frecuencias de desplazamiento, se puede encontrar una señal de alta frecuencia de extensión de ancho de banda 112 que se ajusta bien a la señal de audio de entrada original 102. Esto se puede hacer al generar una pluralidad de señales de alta frecuencia de extensión de ancho de banda 112 cada una con una frecuencia de desplazamiento diferente o al generar una señal de alta frecuencia de extensión de ancho de banda y desplazar la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda 112 por diferentes frecuencias de desplazamiento. También, una combinación de generación de una pluralidad de señales de alta frecuencia de extensión de ancho de banda 112 con diferentes frecuencias de desplazamiento y desplazamiento de la banda de alta frecuencia de ellas por otras frecuencias de desplazamiento diferentes puede ser posible. Por ejemplo, se generan cinco señales de alta frecuencia de extensión de ancho de banda diferentes 112 y cada una de ellas se desplaza cinco veces por un desplazamiento de frecuencia constante.
[0044]La figura 2 muestra una ilustración esquemática 200 de la generación de señal de alta frecuencia de extensión de ancho de banda, la comparación de la señal de alta frecuencia de extensión de ancho de banda y la señal de audio de entrada y una adaptación de energía opcional de la señal de alta frecuencia de extensión de ancho de banda para el caso en que solamente se genera una señal de alta frecuencia de extensión de ancho de banda y desplazada por diferentes frecuencias de desplazamiento.
[0045]El primer diagrama esquemático de “energía contra frecuencia” 210 muestra esquemáticamente una señal de audio de entrada 102. En base a esta señal de audio de entrada 102, el generador de parche 110 puede generar la señal de alta frecuencia de extensión de ancho de banda 112, por ejemplo, al desplazar 222 una banda de baja frecuencia de la señal de audio de entrada 102 a frecuencias más altas (como se indica por el número de referencia). Por ejemplo, la banda de baja frecuencia es desplazada por una frecuencia igual a una frecuencia de cruce de un codificador de núcleo, no ilustrado en la figura 1, que puede ser una parte del codificador de extensión de ancho de banda 100 u otra frecuencia predefinida.
[0046]La señal de alta frecuencia de extensión de ancho de banda generada 112 se puede desplazar a continuación por diferentes frecuencias de desplazamiento 232 y para cada frecuencia de desplazamiento 232 (como se indica por el número de referencia 230), se puede calcular un parámetro de comparación por el comparador 120. La frecuencia de desplazamiento 232 se puede definir, por ejemplo, en relación con una frecuencia de cruce de un codificador de núcleo, en relación con otra frecuencia específica o se puede definir como un valor de frecuencia absoluto.
[0047]A continuación, el comparador 120 determina un parámetro de comparación que cumple el criterio predefinido. De esta manera, una señal de alta frecuencia de extensión de ancho de banda 112 con una frecuencia de desplazamiento 242 correspondiente al parámetro de comparación determinado se puede determinar (como se muestra con el número de referencia 240).
[0048]Adicionalmente, también un parámetro de densidad de energía 252 se puede determinar (como se indica por el número de referencia 250). El parámetro de densidad de energía 252 puede indicar la proporción de la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda con la frecuencia de desplazamiento correspondiente al parámetro de comparación determinado y una banda de frecuencia correspondiente de la señal de audio de entrada. Por ejemplo, la proporción se puede relacionar con una proporción de densidad de energía, una proporción de energía u otra proporción de una cantidad relacionada con la densidad de energía de una banda de frecuencia.
[0049]Alternativamente, la figura 3 muestra una ilustración esquemática 300 de la generación de la señal de alta frecuencia de extensión de ancho de banda, la comparación de las señales de alta frecuencia de extensión de ancho de banda generadas y la señal de audio de entrada y la adaptación de energía opcional de la señal de alta frecuencia de extensión de ancho de banda para el caso en que se generen una pluralidad de señales de alta frecuencia de extensión de ancho de banda con diferentes frecuencias de desplazamiento.
[0050]A diferencia de la secuencia mostrada en la figura 2, el generador de parche 110 genera una pluralidad de señales de alta frecuencia de extensión de ancho de banda 112 con frecuencias de desplazamiento diferentes 232 (como se indica por el número de referencia 320). Esto se puede hacer de nuevo por un desplazamiento de frecuencia 222 de una banda de baja frecuencia de la señal de audio de entrada 102 a frecuencias más altas. La banda de baja frecuencia de la señal de audio de entrada 102 puede ser desplazada por una frecuencia constante más la frecuencia de desplazamiento individual 232 de cada señal de alta frecuencia de extensión de ancho de banda 112. La frecuencia constante puede ser igual a la frecuencia de cruce del codificador del núcleo u otra frecuencia específica.
[0051]Un parámetro de comparación para cada señal de alta frecuencia de extensión de ancho de banda generada 112 se puede calcular a continuación y el parámetro de comparación que cumple el criterio predefinido puede ser determinado 240 por el comparador 120.
[0052]El parámetro de densidad de energía se puede determinar 250 como se describe anteriormente.
[0053]Los conceptos mostrados en las figuras 2 y 3 también se pueden combinar.
[0054]La comparación de la señal de audio de entrada 102 y la señal de alta frecuencia de extensión de ancho de banda generada 112 se puede hacer por una correlación cruzada de ambas señales. En este caso, un parámetro de comparación puede ser, por ejemplo, el resultado de una correlación cruzada para una frecuencia de desplazamiento específica entre la señal de audio de entrada 102 y una señal de alta frecuencia de extensión de ancho de banda generada 112.
[0055]La indicación de parámetro de la señal de salida 132 puede ser la frecuencia de desplazamiento en sí misma, una frecuencia de desplazamiento cuantificada u otra cantidad basada en la frecuencia de desplazamiento.
[0056]Mediante la transmisión o el almacenamiento solamente de la indicación del parámetro en lugar de la banda de alta frecuencia de la señal de audio de entrada 102, la proporción de bits para transmisión o almacenamiento se puede reducir. Al escoger el parámetro en base a la frecuencia de desplazamiento correspondiente a un parámetro de comparación que satisface un criterio predefinido, esto puede producir una mejor calidad de audio que la decodificación solamente de la señal de audio limitada en banda o de banda limitada.
[0057]Un criterio predefinido puede ser para determinar un parámetro de comparación de la pluralidad de parámetros de comparación que indican, por ejemplo, una señal de alta frecuencia de extensión de ancho de banda 112 con una frecuencia de desplazamiento correspondientes que coincide con la señal de audio de entrada 102 mejor que el 70% de las señales de alta frecuencia de extensión de ancho de banda 112 con otras frecuencias de desplazamiento, indicando una señal de alta frecuencia de extensión de ancho de banda 112 con una frecuencia de desplazamiento correspondiente que es una de las tres mejores coincidencias con la señal de audio de entrada 102 o que indica una señal de alta frecuencia de extensión de ancho de banda que coincide mejor 112 con una frecuencia de desplazamiento correspondiente. Esto se relaciona con el caso en el que se genera una pluralidad de señales de alta frecuencia de extensión de ancho de banda 112 con diferentes frecuencias de desplazamiento, también como el caso en el que solamente una señal de alta frecuencia de extensión de ancho de banda 112 es generada y desplazada por diferentes frecuencias de desplazamiento o una combinación de estos dos casos.
[0058]Un parámetro de comparación puede ser el resultado de una correlación cruzada u otra cantidad que indica cómo de bien coincide una señal de alta frecuencia de extensión de ancho de banda 112 con una frecuencia de desplazamiento específica coincide con la señal de audio de entrada 102.
[0059]El codificador de extensión de ancho de banda 100 puede comprender un codificador de núcleo para codificar una banda de baja frecuencia de la señal de audio de entrada 102. Este codificador de núcleo puede comprender una frecuencia de cruce que puede corresponder a la frecuencia de corte superior de la banda de baja frecuencia codificada de la señal de audio de entrada 102. La frecuencia de cruce del codificador del núcleo puede ser constante o variable con el tiempo. La implementación de una frecuencia de cruce variable puede incrementar la complejidad del codificador de núcleo, pero puede incrementar también la flexibilidad para codificación.
[0060]El procedimiento mostrado en la figura 2 y/o figura 3 se puede repetir para bandas de frecuencia más altas o interconexiones. Por ejemplo, la banda de baja frecuencia de la señal de audio de entrada 102 comprende una frecuencia de corte superior de 4 kHz. Por consiguiente, si la banda de baja frecuencia de la señal de audio de entrada 102 es desplazada por la frecuencia de corte superior de la banda de baja frecuencia para generar la señal de alta frecuencia de extensión de ancho de banda 112, la señal de alta frecuencia de extensión de ancho de banda 112 comprende una banda de alta frecuencia con una frecuencia de corte inferior de 4 KHz y una frecuencia de corte superior de 8 kHz. El proceso se puede repetir al desplazar una banda de baja frecuencia de la señal de audio de entrada 102 por dos veces la frecuencia de corte superior de la banda de baja frecuencia. Así, la nueva señal de alta frecuencia de extensión de ancho de banda generada 112 comprende una banda de alta frecuencia con una frecuencia de corte inferior de 8 KHz y una frecuencia de corte superior de 12 kHz. Esto se puede repetir hasta que se alcanza una frecuencia más alta deseada. Alternativamente, esto se puede realizar también al generar una señal de alta frecuencia de extensión de ancho de banda con una pluralidad de bandas de alta frecuencia diferentes.
[0061]Como se ilustra en este ejemplo, el ancho de banda de la banda de baja frecuencia de la señal de audio de entrada y el ancho de banda de una banda de alta frecuencia de una señal de alta frecuencia de extensión de ancho de banda pueden ser los mismos. Alternativamente, la banda de baja frecuencia de la señal de audio de entrada puede ser esparcida y desplazada para generar la señal de alta frecuencia de extensión de ancho de banda.
[0062]La determinación de una señal de alta frecuencia de extensión de ancho de banda 112 con una frecuencia de desplazamiento 232 correspondiente al parámetro de comparación determinado puede dejar un espacio o separación entre la banda de baja frecuencia de la señal de audio de entrada 102 y la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda 112 dependiendo de la frecuencia de desplazamiento 242. Este espacio o separación puede ser completado al generar porciones de frecuencia que se ajustan en este espacio que contienen por ejemplo ruido limitado en banda o de banda limitada. Alternativamente, el espacio se puede dejar vacío, puesto que la calidad de audio puede no verse afectada drásticamente.
[0063]La figura 4 muestra un diagrama de bloques de un codificador de extensión de ancho de banda 400 para proporcionar una señal de salida 132 mediante el uso de una señal de audio de entrada 102 según un ejemplo. El codificador de extensión de ancho de banda 400 comprende un generador de parche 110, un comparador 120, una interfaz de salida 130, un codificador de núcleo 410, un filtro de paso de banda 420 y una unidad de extracción de parámetros 430. El codificador del núcleo 410 está conectado a la interfaz de salida 130 y el generador de parche 110, el generador de parche 110 está conectado al comparador 120, el comparador 120 está conectado a la unidad de extracción de parámetros 430, la unidad de extracción de parámetros 430 está conectada a la interfaz de salida 130 y el filtro de paso de banda 420 está conectado al comparador 120.
[0064]El generador de parche 110 se puede realizar como un modulador para generar la señal de alta frecuencia de extensión de ancho de banda 112 en base a la señal de audio de entrada 102. El comparador 120 puede efectuar la comparación de la señal de audio de entrada 102 filtrada por el filtro de paso de banda 420 y la señal de alta frecuencia de extensión de ancho de banda generada 112 por una correlación cruzada de ellas. La determinación del parámetro de comparación que cumple el criterio predefinido se puede denominar también estimación de retraso.
[0065]La interfaz de salida 130 puede incluir también una funcionalidad de un formateador de corriente de bits y puede comprender un combinador para combinar una señal de baja frecuencia proporcionada por el codificador del núcleo 410 y una señal de parámetro 432 que comprende la indicación de parámetro basada en la frecuencia de desplazamiento proporcionada por la unidad de extracción de parámetros 430. Además, la interfaz de salida 130 puede comprender un codificador de entropía o un codificador diferencial para reducir la proporción de bits de la señal de salida 132. El combinador y el codificador de entropía o codificador diferencial puede ser parte de la interfaz de salida 130 como se muestra en este ejemplo o pueden ser unidades independientes.
[0066]La señal de audio 102 se puede dividir en una parte de baja frecuencia y una parte de alta frecuencia. Esto se puede realizar por un filtro de paso bajo del codificador del núcleo 410 y el filtro de paso de banda 420. El filtro de paso bajo puede ser parte del codificador del núcleo 410 o un filtro de paso bajo independiente conectado al codificador del núcleo 410.
[0067]La parte de baja frecuencia es procesada por un codificador de núcleo 410 que puede ser un codificador de audio, por ejemplo, de conformidad con el estándar MPEG1/2 Capa 3 “MP3” o MPEG 4 AAC o un codificador de voz.
[0068]La parte de baja frecuencia puede ser desplazada por un valor fijo, por ejemplo, por medio de una modulación de banda lateral o una transformación de Fourier rápida (FFT) en el dominio de frecuencia, de tal manera que está ubicada por encima de la región de baja frecuencia original en el área objetivo de la interconexión o parte correspondiente. Opcionalmente, la parte de baja frecuencia se puede obtener directamente de la señal de entrada 102. Esto puede ser realizado por un filtro de paso bajo independiente conectado al generador de parche 110.
[0069]A intervalos de tiempo regulares, la correlación cruzada entre espectros de amplitud de secciones de señal transformadas en ventana entre la parte de alta frecuencia original (de la señal de audio de entrada) y la parte de alta frecuencia obtenida (la señal de alta frecuencia de extensión de ancho de banda) puede ser calculada. De esta manera, el retraso (la frecuencia de desplazamiento) para correlación máxima puede ser determinado. Este retraso puede tener el significado de un factor de corrección en términos de la modulación de banda lateral individual original, es decir, la única modulación de banda lateral puede ser corregida adicionalmente por el retraso para maximizar la correlación de cruce. En otras palabras, se puede determinar la frecuencia de desplazamiento, que se denomina también retraso, correspondiente al parámetro de comparación que cumple el criterio predefinido, en la que el parámetro de comparación corresponde a la correlación de cruce y el criterio predefinido puede ser encontrar la correlación máxima.
[0070]Además, se pueden determinar las proporciones de los valores absolutos de los espectros de amplitud. Mediante esto, puede ser derivado por cuyo factor la señal de alta frecuencia obtenida se debe atenuar o amplificar. En otras palabras, se puede determinar un parámetro de densidad de energía que indica la proporción de energía, las densidades de energía, los valores absolutos de los espectros de amplitud u otro valor relacionado con la proporción de densidad de energía entre la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda 112 y una banda de frecuencia correspondiente de la señal de audio de entrada original 102. Esto puede ser realizado por un comparador de densidad de energía que puede ser parte de la unidad de extracción de parámetros 430 como en el ejemplo mostrado o una unidad independiente. Para determinar el parámetro de densidad de energía, por ejemplo, se puede usar la señal de alta frecuencia de extensión de ancho de banda 112 que se generó al desplazar la banda de baja frecuencia de la señal de audio de entrada 102 por una frecuencia constante o la señal de alta frecuencia de extensión de ancho de banda 112 correspondiente al parámetro de comparación determinado u otra señal de alta frecuencia de extensión de ancho de banda generada 112. Una banda de frecuencia correspondiente en este caso significa, por ejemplo, una banda de frecuencia con el mismo intervalo de frecuencia. Por ejemplo, si la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda comprende frecuencias de 4 kHz a 8 kHz, entonces la banda de frecuencia correspondiente de la señal de audio de entrada comprende también el intervalo de 4 kHz a 8 kHz.
[0071]Los factores de corrección obtenidos (frecuencia de desplazamiento, parámetro de densidad de energía) correspondientes al retraso y correspondientes al valor absoluto de la amplitud pueden ser interpolados en el tiempo. En otras palabras, un parámetro determinado para una sección de señal en ventana (para un marco de tiempo) puede ser interpolado por cada etapa de tiempo de la sección de señal.
[0072]Esta señal (señal de parámetro) de modulación (control) o una representación parametrizada de la misma se puede almacenar o transmitir a un decodificador. En otras palabras, la señal de parámetro 432 se puede combinar con la banda de baja frecuencia de la señal de audio de entrada 102 procesada por el codificador del núcleo 410 para obtener la señal de salida 132 que se puede almacenar o transmitir a un decodificador.
[0073]Adicionalmente, se pueden determinar parámetros adicionales para adaptar, por ejemplo, un nivel de ruido y/o la tonalidad. Esto se puede hacer por la unidad de extracción de parámetros 430. Los parámetros adicionales se pueden añadir a la señal de parámetro 432.
[0074]El ejemplo mostrado en la figura 4 ilustra un cálculo del lado del codificador de una modulación variable en el tiempo. La modulación variable en el tiempo en este caso se relaciona con las señales de alta frecuencia de extensión de ancho de banda 112 con diferentes frecuencias de desplazamiento. La frecuencia de desplazamiento correspondiente al parámetro de comparación determinado que cumple el criterio predefinido puede variar con el tiempo.
[0075]La figura 5 muestra un diagrama de bloques de un decodificador de extensión de ancho de banda 500 para probar una señal de audio extendida en ancho de banda 532 basada en una señal de audio de entrada 502 y una señal de parámetro 504 según una realización de la invención. La señal de parámetro 504 comprende una indicación de una frecuencia de desplazamiento y una indicación de un parámetro de densidad de energía. El decodificador de extensión de ancho de banda 500 comprende un generador de parche 510, un combinador 520 y una interfaz de salida 530. El generador de parche 510 está conectado al combinador 520 y el combinador 520 está conectado a la interfaz de salida 530.
[0076]El generador de parche 510 genera una señal de alta frecuencia de extensión de ancho de banda 512 que comprende una banda de alta frecuencia basada en la señal de audio de entrada 502. La banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda 512 se genera realizando un desplazamiento de frecuencia de una banda de frecuencia de la señal de audio de entrada 502 a frecuencias más altas, en la que el desplazamiento de frecuencia está basado en la frecuencia de desplazamiento.
[0077]Además, el generador de parche 510 amplifica o atenúa la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda 512 por un factor igual al valor del parámetro de densidad de energía o igual al valor recíproco del parámetro de densidad de energía.
[0078] El combinador 520 combina la señal de alta frecuencia de extensión de ancho de banda 512 y la señal de audio de entrada 502 para obtener la señal de audio extendida en ancho de banda 532 y la interfaz de salida 530 proporciona la señal de audio extendida en ancho de banda 532.
[0079] La generación de la señal de alta frecuencia de extensión de ancho de banda 112 basada en la frecuencia de desplazamiento puede permitir una continuación mejorada del intervalo de frecuencia de la señal de audio de entrada en la región de alta frecuencia, por ejemplo, si la frecuencia de desplazamiento se determina como se describe anteriormente. Esto puede incrementar la calidad de audio de la señal de audio extendida en ancho de banda 532.
[0080] Adicionalmente, la densidad de energía de la continuación de alta frecuencia de la señal de audio de entrada 502 se puede hacer de una manera muy eficiente al amplificar o atenuar la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda 512 por el parámetro de densidad de energía. De esta manera, una normalización puede no ser necesaria.
[0081] El generador de parche 510 puede generar la señal de alta frecuencia de extensión de ancho de banda 512 al desplazar la banda de frecuencia de la señal de audio de entrada 512 por una frecuencia constante más la frecuencia de desplazamiento. Si la frecuencia de desplazamiento indica un desplazamiento de frecuencia a frecuencias más bajas, el combinador puede ignorar una parte de la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda 512 que comprende frecuencias más bajas que una frecuencia de corte superior de la señal de audio de entrada 502.
[0082] El generador de parche 510 puede generar la señal de alta frecuencia de extensión de ancho de banda 512 en el dominio de tiempo o en el dominio de frecuencia. En el dominio de tiempo, el generador de parche 510 puede generar la señal de alta frecuencia de extensión de ancho de banda 512 basada en una sola modulación de banda lateral.
[0083] Adicionalmente, la interfaz de salida puede amplificar la señal de salida antes de proporcionarla.
[0084] La figura 6 muestra un diagrama de bloques de un decodificador de extensión de ancho de banda 600 para proporcionar una señal de audio extendida en ancho de banda 532 basada en una señal de audio de entrada 502 y una señal de parámetro 504 según una realización de la invención. El decodificador de extensión de ancho de banda 600 comprende un generador de parche 510, un combinador 520, una interfaz de salida 530, un decodificador de núcleo 610 y una unidad de extracción de parámetros 620. El decodificador de núcleo 610 está conectado al generador de parche 510 y el combinador 520, la unidad de extracción de parámetros 620 está conectada al generador de parche 510 y a la interfaz de salida 530, el generador de parche 510 está conectado al combinador 520 y el combinador 520 está conectado a la interfaz de salida 530.
[0085] El decodificador de núcleo 610 puede decodificar la corriente de bits recibida 602 y proporciona la señal de audio de entrada 502 al generador de parche 510 y el combinador 520. La señal de audio de entrada 502 puede comprender una frecuencia de corte superior igual a una frecuencia de cruce del decodificador de núcleo 610. Esta frecuencia de cruce puede ser constante o variable en el tiempo. Variable en el tiempo significa, por ejemplo, variable para intervalos de tiempo diferentes o cuadros de tiempo diferentes, pero constante para un intervalo de tiempo o marco de tiempo.
[0086] La unidad de extracción de parámetros 620 puede separar la señal de parámetro 504 de la corriente de bits recibida 602 y proporcionarla al generador de parche 510. Adicionalmente, la señal de parámetro 504 o un parámetro de ruido y/o tonalidad extraído se puede proporcionar a la interfaz de salida 530.
[0087] El generador de parche 510 puede modular la señal de audio de entrada 502 o, de acuerdo con la invención, realiza un desplazamiento de frecuencia de una banda de frecuencia de la señal de entrada 502 a frecuencias más altas, en base a la frecuencia de desplazamiento para obtener la señal de alta frecuencia de extensión de ancho de banda 512, y de acuerdo con la invención, amplifica o atenúa la señal de alta frecuencia de extensión de ancho de banda 512 por un factor igual al valor del parámetro de densidad de energía o igual al valor recíproco del parámetro de densidad de energía, respectivamente. Esta señal de alta frecuencia de extensión de ancho de banda 512 se proporciona al combinador 530. En otras palabras, el generador de parche 510 puede modular la señal de audio de entrada 502 basado en la frecuencia de desplazamiento y el parámetro de densidad de energía para obtener una señal de alta frecuencia. Esto se puede hacer, por ejemplo, en el dominio de tiempo por una sola modulación de banda lateral 634 con una interpolación y/o filtración 632 para cada etapa de tiempo.
[0088] El combinador 520 combina la señal de audio de entrada 502 y la señal de alta frecuencia de extensión de ancho de banda generada 512 para obtener la señal de audio de extensión de ancho de banda 532.
[0089] La interfaz de salida 530 proporciona la señal de audio extendida en ancho de banda 532 y puede comprender adicionalmente una unidad de corrección. La unidad de corrección puede llevar a cabo una corrección de tonalidad y/o corrección de ruido basada en los parámetros proporcionados por la unidad de extracción de parámetros 620. La unidad de corrección puede ser parte de la interfaz de salida 530 como se muestra en la figura 6 o puede ser una unidad independiente. La unidad de corrección puede estar dispuesta también entre el generador de parche 510 y el combinador 520. De esta manera, la unidad de corrección puede corregir solamente la tonalidad y/o ruido de la señal de alta frecuencia de extensión de ancho de banda generada 512. Una corrección de tonalidad y ruido de la señal de audio de entrada 512 no es necesaria puesto que la señal de audio de entrada 502 corresponde a la señal de audio original.
[0090] Resumido en algunas palabras, el decodificador de extensión de ancho de banda 600 puede sintetizar y formar espectralmente una señal de alta frecuencia de una señal de salida del decodificador de audio o decodificador de núcleo (la señal de audio de entrada) por medio de la función de modulación transmitida. Función de modulación transmitida, por ejemplo, significa una función de modulación basada en la frecuencia de desplazamiento y en el parámetro de densidad de energía. A continuación, se pueden combinar la señal de alta frecuencia y la señal de baja frecuencia y se pueden aplicar parámetros adicionales para adaptar el nivel de ruido y tonalidad.
[0091] La figura 7 muestra un diagrama de flujo de un procedimiento 700 para proporcionar una señal de salida basada en una señal de audio de entrada según una realización de la invención. El procedimiento comprende la generación 710 de al menos una señal de alta frecuencia de extensión de ancho de banda, el cálculo 720 de una pluralidad de parámetros de comparación, la determinación 730 de un parámetro de comparación a partir de la pluralidad de parámetros de comparación y el suministro 740 de la señal de salida para transmisión o almacenamiento.
[0092] Una señal de alta frecuencia de extensión de ancho de banda generada comprende una banda de alta frecuencia. La banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda está basada en una banda de baja frecuencia de la señal de audio de entrada. Diferentes señales de alta frecuencia de extensión de ancho de banda comprenden diferentes frecuencias dentro de sus bandas de alta frecuencia, si se generan diferentes señales de alta frecuencia de extensión de ancho de banda.
[0093] Un parámetro de comparación se calcula en base a una comparación de la señal de audio de entrada y una señal de alta frecuencia de extensión de ancho de banda generada. Cada parámetro de comparación de la pluralidad de parámetros de comparación se calcula en base a una frecuencia de desplazamiento diferente entre la señal de audio de entrada y una señal de alta frecuencia de extensión de ancho de banda generada.
[0094] El parámetro de comparación determinado cumple un criterio predefinido.
[0095] La señal de salida comprende una indicación de parámetro basada en una frecuencia de desplazamiento correspondiente al parámetro de comparación determinado.
[0096] La figura 8 muestra un diagrama de flujo de un procedimiento 800 para proporcionar una señal de audio extendida en ancho de banda basada en una señal de audio de entrada y una señal de parámetro según una realización de la invención. La señal de parámetro comprende una indicación de una frecuencia de desplazamiento y una indicación de un parámetro de densidad de energía. El procedimiento comprende la generación 810 de una señal de alta frecuencia de extensión de ancho de banda, la amplificación 820 o atenuación de la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda, la combinación 830 de la señal de alta frecuencia de extensión de ancho de banda y la señal de audio de entrada para obtener la señal de audio extendida en ancho de banda y el suministro 840 de la señal de audio extendida en ancho de banda.
[0097] La señal de alta frecuencia de extensión de ancho de banda comprende una banda de alta frecuencia. La banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda se genera 810 realizando un desplazamiento de frecuencia de una banda de frecuencia de la señal de audio de entrada a frecuencias más altas. El desplazamiento de frecuencia está basado en la frecuencia de desplazamiento.
[0098] La banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda es amplificada 820 o atenuada por un factor igual al valor del parámetro de densidad de energía o igual al valor recíproco del parámetro de densidad de energía.
[0099] La figura 9 muestra un diagrama de flujo de un procedimiento 900 para proporcionar una señal de salida basada en una señal de audio de entrada. Se ilustra una posibilidad para la secuencia del algoritmo en el codificador. Esto puede ser también formal matemáticamente descrito en lo sucesivo. Las señales en tiempo real se pueden indicar por letras minúsculas latinas, las señales transformadas de Hilbert con griego correspondiente y las señales transformadas de Fourier con letras mayúsculas latinas o alternativamente griegas.
[0100] La señal de entrada puede ser llamada f(n), la señal de salida o(n). £« =f * filtBFk.;1 <k <km» indica la transformada de Fourier, j indica el número imaginario y la transformación de Hilbert H(.) se define como de costumbre:
(,Ám)<:=>n(f{n))<=>T \ - j ■<sgn(¿y) ■>F(jco))
con
F(jco):= Hf{n))
xOver puede ser la frecuencia de corte del codificador del núcleo, neN puede indicar un tiempo. kmax>keN puede indicar la k-ésima extensión o parche. ak describe un borde de banda de bandas perceptuales relacionadas con xOver, por ejemplo, según la escala de Bark o la escala de ERB. Alternativamente, la ak se puede incrementar por ejemplo linealmente, es decir ak+i-ak= constante. La transformación de Hilbert se puede calcular también computacionalmente eficiente mediante la filtración de la señal con un filtro de paso bajo modulado.
[0101]En primer lugar, una función de modulador analítico 902 con las frecuencias de modulación ak y los a ,<1>
1kT Tp s
incrementos de fase resultantes con el incremento de tiempo (Fs indica la velocidad de toma de muestras) pueden ser generados. Esto se puede describir de forma matemática en las siguientes fórmulas:
[0102]La suma puede ser reemplazada únicamente por n, sijkes independiente de n.
[0103]La señal de audio de entrada 102 o señal de audio real f se puede filtrar por paso de banda a un ancho de banda de ak+i-ak que puede ser expresado por:
fLF= f*fí¡tU:
[0104]En este caso, cada parche comprenderá el mismo ancho de banda.
[0105]Alternativamente, la señal de audio de entrada f 102 se puede filtrar por paso de banda a anchos de banda de ak con anchos de banda diferentes que pueden ser descritos por:
[0106]A continuación, se pueden determinar las áreas de la señal original que deben ser reconstruidas por este procedimiento. Estas regiones limitadas en banda se pueden indicar como:
y están ubicadas en los intervalos (ak, ak+<1>).
[0107]La modulación de la señal de entrada filtrada por paso bajo 904 se puede realizar en el dominio de frecuencia o el dominio de tiempo.
[0108]En el dominio de frecuencia, las señales de entrada se pueden formar en ventana primero, lo que se puede describir por:
en la que NFFT es el número de bins de transformación de Fourier rápida (por ejemplo 512 bins), ês el número de ventana y win(.) es una función de ventana. Las ventanas o marcos de tiempo pueden comprender una superposición temporal. Por ejemplo, la fórmula dada anteriormente describe una superposición temporal de la mitad de una ventana. Así, NeN bloques de la señal original y con la misma conectada con tantos espectros de amplitud F$(w) con ^^ N como valores absolutos de la transformada de Fourier
describe el índice del borde de banda k en la transformada de Fourier.
[0109]A continuación, la señal se modula en el dominio de frecuencia mediante el desplazamiento de los bins de FFT (bins de transformación de Fourier rápida). La transformación de Hilbert implícita no es aquí necesaria, pero hace una descripción formal igual de las siguientes etapas posibles:
para u> > 0 y
[0110]En el dominio de tiempo, se realiza primero una transformación de Hilbert 906 de la señal de audio de entrada f 102 para generar una señal analítica 908.
y
a continuación, la señal analíticayLFk,es modulada por banda lateral individual 710 con un modulador |j(n) 902:
o
[0111]De esta manera, se puede generar una señal de alta frecuencia de extensión de ancho de banda que se denomina también señal modulada 910.
[0112]A continuación, se efectúan una formación de ventana (también posible con superposición) de la señal de entrada 912 y de la señal extendida 914 y una transformación de Fourier 916:
y
en la que una NFFT es una vez más el número de bins de transformación de Fourier rápida (por ejemplo 256, 512, 1024 bins u otro número entre 24 y 232), ^ es el número de ventana y win(.) es una función de ventana. Así, NeN bloques 914 son creados de la señal original y en relación con tantos espectros de amplitud O^(w), ^ (w ) con ^ ^ N como valores absolutos de la transformada de Fourier 916.
pueden describir el índice del borde de banda k en la transformada de Fourier.
[0113]El proceso en el dominio de tiempo se muestra en la figura 9.
[0114]La siguiente etapa es el cálculo 720 de la correlación cruzada R ,^k(el parámetro de comparación puede ser igual al resultado de la correlación cruzada) de los espectros de amplitud parciales de la señal original y la señal extendida lo que se puede expresar matemáticamente por:
con
5 puede indicar el retraso máximo (la frecuencia de desplazamiento máxima) para el cual se calcula una correlación cruzada. Si la correlación cruzada se debe calcular con una predisposición, es decir, retrasos pequeños y así se deberían preferir grandes superposiciones, así que se debe seleccionar p=0. Por el contrario, si se debe compensar que menos bins de FFT (bins de transformación de Fourier rápida) se superponen para retrasos más grandes que pequeños, se debe escoger p=1. En general, se puede escoger 0<peP de forma arbitraria. Alternativa o adicionalmente, se puede escoger ' , 7‘ para seleccionar una región de la correlación cruzada que es un poco más grande que una interconexión parche. Con esto la región que es considerada por la correlación cruzada
7
puede ser extendida por ^ en ambos extremos espectrales del parche particular.
[0115]En base a estos resultados de la correlación cruzada, un máximo de la correlación cruzada 730
y el retraso d^k de la correlación máxima
se pueden determinar.
[0116]Adicionalmente, las proporciones 920 de las energías o potencias en las interconexiones o parches pueden ser determinadas por los espectros de densidad de energía:
[0117]Si no se puede determinar ningún máximo claro 924, el retraso se vuelve a poner a 0 (como se muestra en el número de referencia 922). De otra manera el retraso estimado 918 puede ser el retraso correspondiente a la correlación cruzada máxima. Para esto, se puede determinar un criterio de umbral, d^k > t con t que se va a seleccionar. Alternativamente, se puede observar la curvatura o un aplanamiento espectral (SFN) de la correlación cruzada R^ k, por ejemplo:
con
[0118]Los retrasos d ^ y los parámetros de densidad de energía ^,k pueden ser interpolados 926 para obtener un valor para cada etapa de tiempo:
gk (n) -interp(cík);\(n) = ínterpícf,k)
[0119]A continuación, se puede generar la función de modulación global modulada en amplitud modificada y desplazada en frecuencia:
2ff; (m))
P (n) = 2 l$ k (n )e
lc*1
[0120]Esta función de modulación global o los parámetros de la función de modulación global se pueden proporcionar 740 con la señal de salida para almacenamiento o transmisión.
[0121]Adicionalmente, se pueden determinar parámetros adicionales para corrección de ruido y/o corrección de tonalidad.
[0122]La modulación en el decodificador puede ser realizada por:
y>{n).=<pLf{n)■¡j{n)
y además de las k modulaciones parciales (si hay más de un parche o interconexión). Para esta función de modulación global |Jk(n) o |j(n) o los parámetros Zk(n) y Ak(n) o c^k y d^k de la función de modulación global se pueden codificar apropiadamente, por ejemplo mediante cuantificación. Opcionalmente, la velocidad de toma de muestras se puede reducir y se puede introducir una histéresis.
[0123]El cálculo de los retrasos se puede omitir, si no hay ninguna señal tonal, por ejemplo, en silencio, transitorios o ruido. En estos casos, el retraso se puede ajustar a cero.
[0124]La figura 10 muestra en más detalle un ejemplo 1000 para determinar el retraso.
[0125]Para un marco de tiempo o ventana ^=¡ 1010 el retraso v se ajusta a menos A como valor de partida. A continuación, se calcula la correlación cruzada R^k(v) 720. Si v es más pequeño que A 1030, entonces v se incrementa 1032 y se calcula el siguiente parámetro de comparación en términos de la correlación cruzada 720. Si v es mayor o igual que A 1030, entonces se puede determinar el retraso correspondiente a la correlación cruzada calculada máxima 730. Si el máximo es claramente identificable 924 el retraso determinado se usa como parámetro d^k 918. De otra manera, el retraso se ajusta a 0 y se usa como parámetro d^=0922.
[0126]A continuación, todo el proceso se repite 1040 para el siguiente marco de tiempo 5=5+1 1050. Los retrasos determinados se pueden interpolar 926 para obtener un parámetro para cada etapa de tiempo N.
[0127]El cálculo de la pluralidad de parámetros de comparación, por ejemplo, el resultado de la correlación cruzada se puede hacer también en paralelo si se usan una pluralidad de comparadores. También, el procesamiento de diferentes marcos de tiempo se puede hacer en paralelo, si los elementos físicos necesarios están disponibles varias veces. El bucle para calcular la correlación cruzada puede comenzar también en A y se puede disminuir cada bucle hasta v < A.
[0128]La figura 11 muestra una ilustración esquemática de la interpolación 926 de las frecuencias de desplazamiento de diferentes marcos de tiempo, intervalos de tiempo o ventanas. La figura 11a muestra la interpolación 1100, si los marcos de tiempo no se traslapan o superponen. Se determina un retraso d^k para todo un marco de tiempo 1110. La manera más fácil para interpolar un parámetro para cada etapa de tiempo 1120 se puede realizar al ajustar los parámetros de todas las etapas de tiempo 1120 de un marco de tiempo 1110 igual al retraso correspondiente d^ k. En los bordes de un marco de tiempo, se puede seleccionar el retraso del marco de tiempo previo o siguiente. Por ejemplo, los parámetros Ak(n) a Ak(n+3) son igual a d^k y los parámetros Ak(n+4) a Ak(n+7) son iguales a d^<1>,k.
[0129]Alternativamente, los retrasos de los marcos de tiempo 1110 se pueden interpolar linealmente entre los marcos de tiempo. Por ejemplo:
[0130]De manera conveniente, la figura 11B muestra un ejemplo 1150 para marcos de tiempo superpuestos 1110. En este caso, una etapa de tiempo 1120 está asociada a más de un marco de tiempo 1110. Por consiguiente, más de un retraso determinado se puede asociar a una etapa de tiempo 1120. Así, los retrasos determinados se pueden interpolar 926 para obtener un parámetro para cada etapa de tiempo 1120. Por ejemplo, los retrasos determinados correspondientes a una etapa de tiempo 1120 se pueden interpolar linealmente. Por ejemplo, una interpolación posible puede ser:
[0131]Alternativamente, la interpolación también se puede hacer, por ejemplo, mediante una filtración mediana.
[0132]La interpolación se puede realizar por medio de interpolación. Los medios de interpolación pueden ser parte de la unidad de extracción de parámetros o la interfaz de salida o pueden ser una unidad separada.
[0133]En el lado del decodificador, la extensión de ancho de banda se puede hacer mediante:
<j/(n).=(pLf(n) •jj{n)
[0134]Después de la decodificación de y<9 lf>(N) como salida del codificador del núcleo. Adicionalmente, puede ser adaptado con los parámetros previamente de los parámetros obtenidos de la señal original para el nivel de tonalidad y/o ruido.
[0135]El cálculo de la función de modulación global en el decodificador se hace según una o ambas de las siguientes fórmulas:
y
t y ( n )- ^ (n )- // (n ) iruido(f))
[0136]La parte imaginaria de la señal se puede ignorar:
o(n) = Re(t/(n))
[0137]A continuación, como se menciona anteriormente, puede seguir una corrección de tonalidad, por ejemplo, mediante filtración inversa.
[0138]La figura 12 muestra un diagrama de bloques de un decodificador de extensión de ancho de banda 1200 para proporcionar una señal de audio extendida en ancho de banda 532 basada en una señal de audio de entrada 502 según una realización de la invención. El decodificador de extensión de ancho de banda 1200 comprende un generador de parche 1210, un comparador 1220, un combinador 1230 y una interfaz de salida 1240. El generador de parche 1210 está conectado al comparador 1220, el comparador 1220 está conectado al combinador 1230 y el combinador 1230 está conectado a la interfaz de salida 1240.
[0139]El generador de parche 1210 genera al menos una señal de alta frecuencia de extensión de ancho de banda 1212 que comprende una banda de alta frecuencia basada en la señal de audio de entrada 502, en la que una frecuencia de corte inferior de la banda de alta frecuencia de una señal de alta frecuencia de extensión de ancho de banda 1212 es más baja que una frecuencia de corte superior de la señal de audio de entrada 502. Diferentes señales de alta frecuencia de extensión de ancho de banda 1212 comprenden diferentes frecuencias dentro de sus bandas de alta frecuencia, si se generan diferentes señales de alta frecuencia de extensión de ancho de banda 1212.
[0140]El comparador 1220 calcula una pluralidad de parámetros de comparación. Un parámetro de comparación se calcula en base a una comparación de la señal de audio de entrada 502 y una señal de alta frecuencia de extensión de ancho de banda generada 1212. Cada parámetro de comparación de la pluralidad de parámetros de comparación se calcula en base a una frecuencia de desplazamiento diferente entre la señal de audio de entrada 502 y una señal de alta frecuencia de extensión de ancho de banda generada 1212. Además, el comparador determina un parámetro de comparación de la pluralidad de parámetros de comparación, en el que el parámetro de comparación determinado cumple un criterio predefinido.
[0141]Un combinador 1230 combina la señal de audio de entrada 502 y la señal de alta frecuencia de extensión de ancho de banda 1212 para obtener la señal de audio extendida en ancho de banda 532, en la que la señal de alta frecuencia de extensión de ancho de banda 1212 está basada en una frecuencia de desplazamiento correspondiente al parámetro de comparación determinado.
[0142]La interfaz de salida 1240 proporciona la señal de audio extendida en ancho de banda 532.
[0143]En comparación con el decodificador mostrado en la figura 5 el decodificador descrito 1200 determina la frecuencia de desplazamiento por sí mismo. Por consiguiente, no es necesario recibir este parámetro con la señal de audio de entrada 502. De esta manera, la proporción de bits para transmisión o almacenamiento de señales de audio se puede reducir adicionalmente.
[0144]Como se describe para la figura 1, el generador de parche 1210 puede generar una pluralidad de señales de alta frecuencia de extensión de ancho de banda con diferentes frecuencias de desplazamiento o solamente una señal de alta frecuencia de extensión de ancho de banda que es desplazada por diferentes frecuencias de desplazamiento. De nuevo, también se puede usar una combinación de estas dos posibilidades.
[0145]La figura 13 muestra un diagrama de flujo de un procedimiento 1300 para proporcionar una señal de audio extendida en ancho de banda según una realización de la invención. El procedimiento 1300 comprende la generación 1310 de al menos una señal de alta frecuencia de extensión de ancho de banda, el cálculo 1320 de una pluralidad de parámetros de comparación, la determinación 1330 de un parámetro de comparación de la pluralidad de parámetros de comparación, la combinación 1340 de la señal de audio de entrada y una señal de alta frecuencia de extensión de ancho de banda y el suministro 1350 de la señal de audio extendida en ancho de banda.
[0146]Una señal de alta frecuencia extendida en ancho de banda comprende una banda de alta frecuencia basada en la señal de audio de entrada. Una frecuencia de corte inferior de la banda de alta frecuencia de una señal de alta frecuencia extendida en ancho de banda es más baja que una frecuencia de corte superior de la señal de audio de entrada. Diferentes señales de alta frecuencia de extensión de ancho de banda comprenden diferentes frecuencias dentro de sus bandas de alta frecuencia, si se generan diferentes señales de alta frecuencia de extensión de ancho de banda.
[0147]Se calcula un parámetro de comparación en base a la comparación de la señal de audio de entrada y la señal de alta frecuencia de extensión de ancho de banda generada. Cada parámetro de comparación de la pluralidad de parámetros de comparación se calcula en base a una frecuencia de desplazamiento diferente entre la señal de audio de entrada y la señal de alta frecuencia de extensión de ancho de banda generada.
[0148]El parámetro de comparación determinado cumple un criterio predefinido.
[0149]La señal de alta frecuencia de extensión de ancho de banda que se combina con la señal de audio de entrada para obtener la señal de audio de ancho de banda se basa en una frecuencia de desplazamiento correspondiente al parámetro de comparación determinado.
[0150]La figura 14 muestra un diagrama de flujo de un procedimiento 1400 para proporcionar una señal de audio extendida en ancho de banda según un ejemplo.
[0151]Después de recibir 1402 una corriente de bits que comprende la señal de audio de entrada, un decodificador de núcleo decodifica 1410 la señal de audio de entrada. En base a la señal de audio de entrada, se genera una señal de alta frecuencia de extensión de ancho de banda 1310 y se calculan la pluralidad de parámetros de comparación en términos de una correlación cruzada entre la señal de audio de entrada y una señal de alta frecuencia de extensión de ancho de banda generada con diferentes frecuencias de desplazamiento 1320. A continuación, se determina el parámetro de comparación que cumple el criterio predefinido 1330 que se denomina también estimación de retraso.
[0152]En base a la frecuencia de desplazamiento correspondiente al parámetro de comparación determinado, un modulador puede modular 1420 la señal de audio de entrada. Adicionalmente, un parámetro se puede extraer 1430 de la corriente de bits recibida 1402 para adaptar, por ejemplo, la densidad de energía de la señal modulada. La señal modulada se combina a continuación 1340 con la señal de audio de entrada. Adicionalmente, la tonalidad y el ruido de la señal de audio extendida en ancho de banda se pueden corregir 1440. Esto también se puede hacer antes de la combinación con la señal de audio de entrada. A continuación, los datos de audio en términos de la señal de audio extendida en ancho de banda se proporcionan 1350, por ejemplo, para reproducción acústica.
[0153]De esta manera, el cálculo de la modulación variable en el tiempo se hace en el lado del decodificador.
[0154]Alternativamente al modulador que modula 1420 la señal de audio de entrada para generar una interconexión o parche, por ejemplo, se puede utilizar la señal de alta frecuencia de extensión de ancho de banda ya generada previamente o el generador de parche puede generar una señal de alta frecuencia de extensión de ancho de banda (parche) en base a la frecuencia de desplazamiento correspondiente al parámetro de comparación determinado.
[0155]En otras palabras, si la velocidad de datos baja es más importante que una complejidad baja del lado del decodificador, la determinación de la modulación de frecuencia de los moduladores también se puede hacer en el lado del decodificador. Para esto, se puede ejecutar el algoritmo mostrado en la figura 9 en el decodificador con solo algunos cambios. Puesto que la señal original no está disponible para el cálculo de la correlación cruzada en el decodificador, las correlaciones se pueden calcular entre la señal original (señal de audio de entrada) y una señal original desplazada (señal de audio de entrada) dentro de un intervalo de superposición. Por ejemplo, la señal se puede desplazar entre cero y ak, por ejemplo, ak dividido por 2, ak dividido por 3 o ak dividido por 4. ak indica otra vez el k-ésimo borde de banda, por ejemplo, ai indica la frecuencia de cruce del codificador de núcleo.
[0156]Por ejemplo, esto puede suceder de la misma manera en el codificador como en el decodificador. En el codificador, los parámetros para formación espectral, corrección de ruido y/o corrección de tonalidad se pueden extraer y transmitir al decodificador.
[0157]De manera conveniente, la figura 15 muestra un diagrama de bloques de un codificador de extensión de ancho de banda 1500 para proporcionar una señal de salida utilizando una señal de audio de entrada. El codificador 1500 corresponde al codificador mostrado en la figura 4. Sin embargo, el codificador 1500 no proporciona la señal de salida 132 con una indicación de parámetro basada en la frecuencia de desplazamiento misma. Puede determinar solamente un parámetro de densidad de energía y parámetros opcionales para corrección de tonalidad y corrección de ruido e incluye una indicación de parámetro de estos parámetros a la señal de salida 132. Sin embargo, el parámetro de densidad de energía (y también los otros parámetros, si se determinan) se determina en base a la frecuencia de desplazamiento correspondiente al parámetro de comparación determinado.
[0158]Por ejemplo, el parámetro de densidad de energía puede indicar la proporción entre la señal de audio de entrada 102 y la señal de alta frecuencia de extensión de ancho de banda con una frecuencia de desplazamiento correspondiente al parámetro de comparación determinado. Por consiguiente, la indicación de parámetro que está relacionada con el parámetro de densidad de energía y opcional a los parámetros para corrección de tonalidad y/o corrección de ruido se basa en la frecuencia de desplazamiento correspondiente al parámetro de comparación determinado.
[0159]Una diferencia adicional entre el codificador 1500 y el codificador mostrado en la figura 4 es que el generador de parche 110 genera una señal de alta frecuencia de extensión de ancho de banda de la misma manera en que el generador de parche del decodificador 1400 lo hace. De esta manera, el codificador 1500 y el decodificador pueden obtener las mismas frecuencias de desplazamiento y por consiguiente, los parámetros extraídos por el codificador 1500 son válidos para las interconexiones generadas por el decodificador.
[0160]Algunos ejemplos se refieren a un dispositivo y un procedimiento para extensión de ancho de banda de señales de audio en el dominio de tiempo mediante el uso de moduladores variables de tiempo. En otras palabras, un parche se puede generar con frecuencia de corte variable, por ejemplo, para cada etapa de tiempo, cada marco de tiempo, una parte de un marco de tiempo o para grupos de marcos de tiempo.
[0161]El procedimiento descrito para extensión del ancho de banda de una señal de audio se puede utilizar en el lado del codificador y el lado del decodificador así como solo en el lado del decodificador. Por el contrario, para procedimientos conocidos, el nuevo procedimiento descrito puede llevar a cabo una extensión denominada armónica del ancho de banda sin la necesidad de información exacta sobre la frecuencia fundamental de la señal de audio. Además, en contraste con las extensiones de ancho de banda denominadas armónicas como, por ejemplo, mostradas por la solicitud de patente provisional de EE.UU. "F.Nagel, S. Disch: "Apparatus and method of harmonic bandwidth extension in audio signals"" con el número de solicitud US 61/025129 que se realizan por medio de vocodificadores de fase, el espectro puede no ser esparcido y, por consiguiente, también puede que la densidad no se cambie. Para asegurar la armonía, se aprovechan correlaciones entre la banda extendida y la banda base. Esta correlación se puede calcular en el codificador, así como en el decodificador, dependiendo de la demanda para cómputo y complejidad de memoria y velocidad de datos.
[0162]Por ejemplo, la extensión de ancho de banda en sí misma se puede hacer mediante el uso de una modulación de amplitud (AM) y un desplazamiento de frecuencia por medio de una sola modulación de banda lateral (SSB) con una pluralidad de portadores variables en el tiempo lentos, adaptables únicos. Un post-procesamiento siguiente según parámetros adicionales puede intentar aproximar la envolvente espectral y el nivel de ruido, así como otras propiedades de las señales originales.
[0163]El nuevo procedimiento para transformación de señales puede evitar los problemas que aparecen debido a una operación de copia simple o reflejo por una continuación correcta armónica del espectro por medio de una frecuencia de corte variable en el tiempo XOver entre la región de baja frecuencia (LF) y la región de alta frecuencia (HF) también como entre las siguientes regiones de alta frecuencia, los llamados parches o interconexiones. Estas frecuencias de corte se escogen de tal manera que los parches generados reparan una trama armónica existente ya que existía en el original de la mejor forma posible.
[0164]La figura 16 muestra un modulador con 3 amplitudes variables en el tiempo y frecuencias de corte mediante las cuales se pueden generar 3 parches mediante la modulación individual de banda lateral de las bandas base. La figura 16a muestra un diagrama 1600a del espectro de la señal extendida en ancho de banda mediante el uso de frecuencias de corte variables en el tiempo 1610. La figura 16b ilustra un diagrama 1600b del espectro de la señal de audio de los tres tonos. En comparación con el espectrograma ilustrado en la figura 18b las líneas 1620 son significativamente menos discontinuas.
[0165]La figura 17 ilustra el efecto por medio de un diagrama 1700 del período. El espectro de densidad de energía de los terceros tonos de la señal de audio se muestra como original 1710, con una frecuencia de corte constante 1720 y con una frecuencia de corte variable 1730. En contraste con el uso de la frecuencia de corte constante 1720, la estructura armónica permanece mediante el uso de la frecuencia de corte variable 1730.
[0166]Mediante la continuación armónica del espectro, se pueden evitar problemas en los puntos de transición entre ambos, la banda base (codificador del núcleo) y la banda extendida, y entre parches subsecuentes. Sin una estimación de F<0>como requisito para la función del sistema, señales arbitrarias pueden ser armónicas continuadas, sin la existencia de artefactos audibles, ni por violar la armonía ni por eventos de sonido transitorios.
[0167]Algunas realizaciones según la invención se refieren a un procedimiento apropiado para todas las aplicaciones de audio, donde el ancho de banda completo no está disponible. Por ejemplo, para la difusión de contenido de audio como, por ejemplo, con radio digital, la corriente o flujo de Internet o en aplicaciones de comunicación de audio, se puede usar el procedimiento descrito.
[0168]Una realización según la invención se refiere a un decodificador de extensión de ancho de banda para proporcionar una señal de audio extendida en ancho de banda basada en una señal de audio de entrada y una señal de parámetro, según la reivindicación independiente 1.
[0169]Aunque esta invención se ha descrito en términos de varias realizaciones, existen alteraciones, permutaciones y equivalentes que entran dentro del alcance de esta invención. También se debe tener en cuenta que hay muchas formas alternativas de implementar los procedimientos y composiciones de la presente invención.
[0170]En particular, se indica que, dependiendo de las condiciones, el esquema de la invención se puede implementar también en software. La implementación se puede hacer por un medio de almacenamiento digital, particularmente un disco flexible o un CD con señales de control que se pueden leer electrónicamente capaces de cooperar con un sistema informático programable de tal manera que se ejecute el procedimiento correspondiente. En general, la invención también consiste de este modo en un producto de programa informático con códigos de programa almacenados en un soporte que se puede leer por la máquina para efectuar el procedimiento de la invención, cuando el producto de programa informático se ejecuta en un ordenador. En otras palabras, la invención se puede realizar también de este modo como un programa informático con un código de programa para efectuar el procedimiento, cuando el programa informático se ejecuta en un ordenador.
Claims (9)
1. Decodificador de extensión de ancho de banda (500, 600) para proporcionar una señal de audio extendida de ancho de banda (532) basada en una señal de audio de entrada (502) y una señal de parámetro (504), en la que la señal de parámetro (504) comprende una indicación de una frecuencia de desplazamiento y una indicación de un parámetro de densidad de energía, comprendiendo el decodificador de extensión de ancho de banda: un generador de parche (510) configurado para generar una señal de alta frecuencia de extensión de ancho de banda (512) que comprende una banda de alta frecuencia, en la que la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda (512) se genera realizando un cambio de frecuencia de una banda de frecuencia de la señal de audio de entrada (502) a frecuencias más altas, en el que el cambio de frecuencia se basa en la frecuencia de desplazamiento, y en el que el generador de parche (510) está configurado para amplificar o atenuar la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda (512) por un factor igual al valor del parámetro de densidad de energía o igual al valor recíproco del parámetro de densidad de energía, respectivamente;
un combinador (529) configurado para combinar la señal de alta frecuencia de extensión de ancho de banda (512) y la señal de audio de entrada (502) para obtener la señal de audio extendida de ancho de banda (532); y una interfaz de salida (530) configurada para proporcionar la señal de audio extendida de ancho de banda (532); y
un decodificador de núcleo (610) y una unidad de extracción de parámetro (620), en el que el decodificador de núcleo (610) está conectado al generador de parche (510) y el combinador (520), en el que la unidad de extracción de parámetro (620) está conectada al generador de parche (510) y a la interfaz de salida (530), en el que el generador de parche (510) está conectado al combinador (520), y en el que el combinador (520) está conectado a la interfaz de salida (530) donde la señal de audio de entrada (502) comprende una frecuencia de corte superior igual a una frecuencia de cruce del decodificador de núcleo (610), o donde la frecuencia de cruce es constante o es variable en el tiempo.
2. Decodificador de extensión de ancho de banda según la reivindicación 1, en el que el generador de parche (510) está configurado para generar la señal de alta frecuencia de extensión de ancho de banda (512) en el dominio de tiempo.
3. Decodificador de extensión de ancho de banda según la reivindicación 1, en el que el parámetro de densidad de energía (252) indica una relación de la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda (512) con la frecuencia de desplazamiento y una banda de frecuencia correspondiente de la señal de audio de entrada (502).
4. El decodificador de extensión de ancho de banda según la reivindicación 3, en el que la relación se refiere a una relación de densidad de energía, una relación de energía u otra relación de una cantidad relacionada con la densidad de energía de una banda de frecuencia.
5. Decodificador de extensión de ancho de banda según la reivindicación 1, en el que la banda de baja frecuencia de la señal de audio de entrada se extiende y cambia para generar la señal de alta frecuencia de extensión de ancho de banda (512).
6. Decodificador de extensión de ancho de banda según la reivindicación 1, en el que el generador de parche (510) está configurado para generar la señal de alta frecuencia de extensión de ancho de banda (512) cambiando la banda de frecuencia de la señal de audio de entrada (502) por una frecuencia constante más la frecuencia de desplazamiento.
7. Decodificador de extensión de ancho de banda según la reivindicación 1, en el que la interfaz de salida (530) está configurada para amplificar la señal de audio extendida de ancho de banda (532) antes de proporcionar la misma.
8. Procedimiento (800) para proporcionar una señal de audio extendida de ancho de banda (532) basada en una señal de audio de entrada (502) y una señal de parámetro (504), en la que la señal de parámetro (504) comprende una indicación de una frecuencia de desplazamiento y una indicación de un parámetro de densidad de energía, comprendiendo el procedimiento:
generar (810) una señal de alta frecuencia de extensión de ancho de banda (512) que comprende una banda de alta frecuencia, en la que la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda (512) se genera realizando un cambio de frecuencia de una banda de frecuencia de la señal de audio de entrada (502) a frecuencias más altas, en la que el cambio de frecuencia se basa en la frecuencia de desplazamiento;
amplificar (820) o atenuar la banda de alta frecuencia de la señal de alta frecuencia de extensión de ancho de banda (512) por un factor igual al valor del parámetro de densidad de energía o igual al valor recíproco del parámetro de densidad de energía;
combinar (830) la señal de alta frecuencia de extensión de ancho de banda (512) y la señal de audio de entrada (502) para obtener la señal de audio extendida de ancho de banda (532);
proporcionar (840) la señal de audio extendida de ancho de banda (532); y
usar un decodificador de núcleo (610) y una unidad de extracción de parámetro (620), en el que el decodificador de núcleo (610) está conectado al generador de parche (510) y el combinador (520), en el que la unidad de extrac ción de parámetro (620) está conectada al generador de parche (510) y a la interfaz de salida (530), en el que el generador de parche (510) está conectado al combinador (520), y en el que el combinador (520) está conectado a la interfaz de salida (530) donde la señal de audio de entrada (502) comprende una frecuencia de corte superior igual a una frecuencia de cruce del decodificador de núcleo (610), o donde la frecuencia de cruce es constante o es variable en el tiempo,
9. Un programa informático que comprende instrucciones que, cuando el programa informático es ejecutado por un ordenador o por un microcontrolador, hace que el ordenador o el microcontrolador realicen el procedimiento según la reivindicación 8.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12255208P | 2008-12-15 | 2008-12-15 |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2968886T3 true ES2968886T3 (es) | 2024-05-14 |
Family
ID=42104496
Family Applications (12)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES23180084T Active ES2968885T3 (es) | 2008-12-15 | 2009-12-11 | Decodificador de extensión de audio de ancho de banda, procedimiento correspondiente y programa de ordenador |
ES23180061T Active ES2968884T3 (es) | 2008-12-15 | 2009-12-11 | Decodificador de extensión de audio de ancho de banda, procedimiento correspondiente y programa de ordenador |
ES23180085T Active ES2968886T3 (es) | 2008-12-15 | 2009-12-11 | Decodificador de extensión de audio de ancho de banda, procedimiento correspondiente y programa de ordenador |
ES09797003.2T Active ES2613941T3 (es) | 2008-12-15 | 2009-12-11 | Codificador de audio y descodificador de extensión de ancho de banda |
ES23180365T Active ES2968852T3 (es) | 2008-12-15 | 2009-12-11 | Decodificador de extensión de ancho de banda, procedimiento correspondiente y programa de ordenador |
ES23180373T Active ES2974285T3 (es) | 2008-12-15 | 2009-12-11 | Decodificador de extensión de ancho de banda de audio, método correspondiente y programa de ordenador |
ES18151917T Active ES2921059T3 (es) | 2008-12-15 | 2009-12-11 | Decodificador de extensión de ancho de banda de audio, programa informático y procedimiento correspondiente |
ES23180374T Active ES2966659T3 (es) | 2008-12-15 | 2009-12-11 | Decodificador de extensión de ancho de banda de audio, procedimiento correspondiente y programa informático |
ES15167199.7T Active ES2674386T3 (es) | 2008-12-15 | 2009-12-11 | Codificador de audio y decodificador de extensión de ancho de banda |
ES22166970T Active ES2951163T3 (es) | 2008-12-15 | 2009-12-11 | Decodificador de extensión de ancho de banda de audio, procedimiento correspondiente y programa informático |
ES23180369T Active ES2978009T3 (es) | 2008-12-15 | 2009-12-11 | Procedimiento de decodificación de audio con extensión de ancho de banda y programa informático |
ES23180367T Active ES2976382T3 (es) | 2008-12-15 | 2009-12-11 | Decodificador de extensión de ancho de banda |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES23180084T Active ES2968885T3 (es) | 2008-12-15 | 2009-12-11 | Decodificador de extensión de audio de ancho de banda, procedimiento correspondiente y programa de ordenador |
ES23180061T Active ES2968884T3 (es) | 2008-12-15 | 2009-12-11 | Decodificador de extensión de audio de ancho de banda, procedimiento correspondiente y programa de ordenador |
Family Applications After (9)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES09797003.2T Active ES2613941T3 (es) | 2008-12-15 | 2009-12-11 | Codificador de audio y descodificador de extensión de ancho de banda |
ES23180365T Active ES2968852T3 (es) | 2008-12-15 | 2009-12-11 | Decodificador de extensión de ancho de banda, procedimiento correspondiente y programa de ordenador |
ES23180373T Active ES2974285T3 (es) | 2008-12-15 | 2009-12-11 | Decodificador de extensión de ancho de banda de audio, método correspondiente y programa de ordenador |
ES18151917T Active ES2921059T3 (es) | 2008-12-15 | 2009-12-11 | Decodificador de extensión de ancho de banda de audio, programa informático y procedimiento correspondiente |
ES23180374T Active ES2966659T3 (es) | 2008-12-15 | 2009-12-11 | Decodificador de extensión de ancho de banda de audio, procedimiento correspondiente y programa informático |
ES15167199.7T Active ES2674386T3 (es) | 2008-12-15 | 2009-12-11 | Codificador de audio y decodificador de extensión de ancho de banda |
ES22166970T Active ES2951163T3 (es) | 2008-12-15 | 2009-12-11 | Decodificador de extensión de ancho de banda de audio, procedimiento correspondiente y programa informático |
ES23180369T Active ES2978009T3 (es) | 2008-12-15 | 2009-12-11 | Procedimiento de decodificación de audio con extensión de ancho de banda y programa informático |
ES23180367T Active ES2976382T3 (es) | 2008-12-15 | 2009-12-11 | Decodificador de extensión de ancho de banda |
Country Status (17)
Country | Link |
---|---|
US (13) | US8401862B2 (es) |
EP (12) | EP2359366B1 (es) |
JP (3) | JP2012512437A (es) |
KR (2) | KR101424944B1 (es) |
CN (1) | CN102246231B (es) |
AU (1) | AU2009328247B9 (es) |
BR (2) | BRPI0917762B1 (es) |
CA (5) | CA2908576C (es) |
DK (1) | DK3364414T3 (es) |
ES (12) | ES2968885T3 (es) |
HK (2) | HK1217810A1 (es) |
HU (9) | HUE064777T2 (es) |
MX (1) | MX2011006163A (es) |
PL (12) | PL4231290T3 (es) |
PT (3) | PT2359366T (es) |
TR (1) | TR201808500T4 (es) |
WO (1) | WO2010069885A1 (es) |
Families Citing this family (46)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6992481B2 (en) | 2003-05-29 | 2006-01-31 | Timex Group B. V. | Method for compensating for predictable generated signals in an electronic device |
PL4231290T3 (pl) * | 2008-12-15 | 2024-04-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Dekoder powiększania szerokości pasma audio, powiązany sposób oraz program komputerowy |
ES2805349T3 (es) * | 2009-10-21 | 2021-02-11 | Dolby Int Ab | Sobremuestreo en un banco de filtros de reemisor combinado |
KR101412117B1 (ko) | 2010-03-09 | 2014-06-26 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 재생 속도 또는 피치를 변경할 때 오디오 신호에서 과도 사운드 이벤트를 처리하기 위한 장치 및 방법 |
ES2522171T3 (es) | 2010-03-09 | 2014-11-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparato y método para procesar una señal de audio usando alineación de borde de patching |
PL2545551T3 (pl) | 2010-03-09 | 2018-03-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Poprawiona charakterystyka amplitudowa i zrównanie czasowe w powiększaniu szerokości pasma na bazie wokodera fazowego dla sygnałów audio |
FR2961938B1 (fr) * | 2010-06-25 | 2013-03-01 | Inst Nat Rech Inf Automat | Synthetiseur numerique audio ameliore |
US8560330B2 (en) * | 2010-07-19 | 2013-10-15 | Futurewei Technologies, Inc. | Energy envelope perceptual correction for high band coding |
US9117440B2 (en) | 2011-05-19 | 2015-08-25 | Dolby International Ab | Method, apparatus, and medium for detecting frequency extension coding in the coding history of an audio signal |
US20130006644A1 (en) * | 2011-06-30 | 2013-01-03 | Zte Corporation | Method and device for spectral band replication, and method and system for audio decoding |
US9173025B2 (en) | 2012-02-08 | 2015-10-27 | Dolby Laboratories Licensing Corporation | Combined suppression of noise, echo, and out-of-location signals |
US20140046670A1 (en) * | 2012-06-04 | 2014-02-13 | Samsung Electronics Co., Ltd. | Audio encoding method and apparatus, audio decoding method and apparatus, and multimedia device employing the same |
KR101990884B1 (ko) * | 2012-09-04 | 2019-06-19 | 에스케이 텔레콤주식회사 | 이종망 간의 통신품질 향상 방법 및 장치 |
EP2709106A1 (en) | 2012-09-17 | 2014-03-19 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating a bandwidth extended signal from a bandwidth limited audio signal |
US9258428B2 (en) * | 2012-12-18 | 2016-02-09 | Cisco Technology, Inc. | Audio bandwidth extension for conferencing |
WO2014115225A1 (ja) * | 2013-01-22 | 2014-07-31 | パナソニック株式会社 | 帯域幅拡張パラメータ生成装置、符号化装置、復号装置、帯域幅拡張パラメータ生成方法、符号化方法、および、復号方法 |
MX346945B (es) | 2013-01-29 | 2017-04-06 | Fraunhofer Ges Forschung | Aparato y metodo para generar una señal de refuerzo de frecuencia mediante una operacion de limitacion de energia. |
CN103971694B (zh) | 2013-01-29 | 2016-12-28 | 华为技术有限公司 | 带宽扩展频带信号的预测方法、解码设备 |
EP2951822B1 (en) | 2013-01-29 | 2019-11-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder, method for providing an encoded audio information, method for providing a decoded audio information, computer program and encoded representation using a signal-adaptive bandwidth extension |
EP3742440B1 (en) * | 2013-04-05 | 2024-07-31 | Dolby International AB | Audio decoder for interleaved waveform coding |
CN104217727B (zh) * | 2013-05-31 | 2017-07-21 | 华为技术有限公司 | 信号解码方法及设备 |
EP2830061A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping |
US10083708B2 (en) * | 2013-10-11 | 2018-09-25 | Qualcomm Incorporated | Estimation of mixing factors to generate high-band excitation signal |
EP2871641A1 (en) * | 2013-11-12 | 2015-05-13 | Dialog Semiconductor B.V. | Enhancement of narrowband audio signals using a single sideband AM modulation |
JP6593173B2 (ja) * | 2013-12-27 | 2019-10-23 | ソニー株式会社 | 復号化装置および方法、並びにプログラム |
BR112016015695B1 (pt) * | 2014-01-07 | 2022-11-16 | Harman International Industries, Incorporated | Sistema, mídia e método para tratamento de sinais de áudio comprimidos |
FR3017484A1 (fr) * | 2014-02-07 | 2015-08-14 | Orange | Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences |
PL3128513T3 (pl) * | 2014-03-31 | 2019-11-29 | Fraunhofer Ges Forschung | Koder, dekoder, sposób kodowania, sposób dekodowania i program |
US9984699B2 (en) * | 2014-06-26 | 2018-05-29 | Qualcomm Incorporated | High-band signal coding using mismatched frequency ranges |
EP2963646A1 (en) | 2014-07-01 | 2016-01-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decoder and method for decoding an audio signal, encoder and method for encoding an audio signal |
JP2016038435A (ja) * | 2014-08-06 | 2016-03-22 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
US20160171987A1 (en) * | 2014-12-16 | 2016-06-16 | Psyx Research, Inc. | System and method for compressed audio enhancement |
WO2016142002A1 (en) | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
US10847170B2 (en) | 2015-06-18 | 2020-11-24 | Qualcomm Incorporated | Device and method for generating a high-band signal from non-linearly processed sub-ranges |
KR101677137B1 (ko) * | 2015-07-17 | 2016-11-17 | 국방과학연구소 | 변조 스펙트로그램을 이용한 수중 방사체의 데몬 및 lofar 특징을 동시 추출하는 방법 및 장치 |
EP3182411A1 (en) | 2015-12-14 | 2017-06-21 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for processing an encoded audio signal |
EP3182410A3 (en) * | 2015-12-18 | 2017-11-01 | Dolby International AB | Enhanced block switching and bit allocation for improved transform audio coding |
WO2017158105A1 (en) * | 2016-03-18 | 2017-09-21 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Encoding by reconstructing phase information using a structure tensor on audio spectrograms |
TWI807562B (zh) | 2017-03-23 | 2023-07-01 | 瑞典商都比國際公司 | 用於音訊信號之高頻重建的諧波轉置器的回溯相容整合 |
EP3382703A1 (en) | 2017-03-31 | 2018-10-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and methods for processing an audio signal |
GB2562253B (en) * | 2017-05-09 | 2021-11-03 | Imagination Tech Ltd | Efficient detection of ranging code correlation function of a GNSS signal |
EP3435376B1 (en) * | 2017-07-28 | 2020-01-22 | Fujitsu Limited | Audio encoding apparatus and audio encoding method |
CN109729585B (zh) * | 2017-10-27 | 2022-04-15 | 成都鼎桥通信技术有限公司 | 网络处理方法和装置 |
US11158297B2 (en) * | 2020-01-13 | 2021-10-26 | International Business Machines Corporation | Timbre creation system |
WO2022051841A1 (en) * | 2020-09-09 | 2022-03-17 | Sparrow Acoustics Inc. | Method and system for performing time-domain processing of a waveform signal |
US20230110255A1 (en) * | 2021-10-12 | 2023-04-13 | Zoom Video Communications, Inc. | Audio super resolution |
Family Cites Families (45)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US2512908A (en) | 1947-10-16 | 1950-06-27 | Mina M Arndt | Telephone switchboard mounting plate with plug-in components |
US5455888A (en) | 1992-12-04 | 1995-10-03 | Northern Telecom Limited | Speech bandwidth extension method and apparatus |
EP0880235A1 (en) | 1996-02-08 | 1998-11-25 | Matsushita Electric Industrial Co., Ltd. | Wide band audio signal encoder, wide band audio signal decoder, wide band audio signal encoder/decoder and wide band audio signal recording medium |
JPH10124088A (ja) | 1996-10-24 | 1998-05-15 | Sony Corp | 音声帯域幅拡張装置及び方法 |
SE512719C2 (sv) | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
US6549884B1 (en) * | 1999-09-21 | 2003-04-15 | Creative Technology Ltd. | Phase-vocoder pitch-shifting |
US7742927B2 (en) * | 2000-04-18 | 2010-06-22 | France Telecom | Spectral enhancing method and device |
SE0001926D0 (sv) * | 2000-05-23 | 2000-05-23 | Lars Liljeryd | Improved spectral translation/folding in the subband domain |
SE0004187D0 (sv) | 2000-11-15 | 2000-11-15 | Coding Technologies Sweden Ab | Enhancing the performance of coding systems that use high frequency reconstruction methods |
EP1351401B1 (en) | 2001-07-13 | 2009-01-14 | Panasonic Corporation | Audio signal decoding device and audio signal encoding device |
JP2003108197A (ja) | 2001-07-13 | 2003-04-11 | Matsushita Electric Ind Co Ltd | オーディオ信号復号化装置およびオーディオ信号符号化装置 |
US6895375B2 (en) | 2001-10-04 | 2005-05-17 | At&T Corp. | System for bandwidth extension of Narrow-band speech |
EP1423847B1 (en) * | 2001-11-29 | 2005-02-02 | Coding Technologies AB | Reconstruction of high frequency components |
US20040002844A1 (en) | 2002-06-27 | 2004-01-01 | Jess Jochen A.G. | System and method for statistical modeling and statistical timing analysis of integrated circuits |
US8090577B2 (en) | 2002-08-08 | 2012-01-03 | Qualcomm Incorported | Bandwidth-adaptive quantization |
JP3861770B2 (ja) * | 2002-08-21 | 2006-12-20 | ソニー株式会社 | 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体 |
DE10328777A1 (de) | 2003-06-25 | 2005-01-27 | Coding Technologies Ab | Vorrichtung und Verfahren zum Codieren eines Audiosignals und Vorrichtung und Verfahren zum Decodieren eines codierten Audiosignals |
CN101800049B (zh) * | 2003-09-16 | 2012-05-23 | 松下电器产业株式会社 | 编码装置和译码装置 |
DE10345996A1 (de) | 2003-10-02 | 2005-04-28 | Fraunhofer Ges Forschung | Vorrichtung und Verfahren zum Verarbeiten von wenigstens zwei Eingangswerten |
DE10345995B4 (de) | 2003-10-02 | 2005-07-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Verarbeiten eines Signals mit einer Sequenz von diskreten Werten |
JP4254479B2 (ja) * | 2003-10-27 | 2009-04-15 | ヤマハ株式会社 | オーディオ帯域拡張再生装置 |
DE102004046746B4 (de) * | 2004-09-27 | 2007-03-01 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Verfahren zum Synchronisieren von Zusatzdaten und Basisdaten |
JP4977472B2 (ja) * | 2004-11-05 | 2012-07-18 | パナソニック株式会社 | スケーラブル復号化装置 |
DE602005013906D1 (de) * | 2005-01-31 | 2009-05-28 | Harman Becker Automotive Sys | Bandbreitenerweiterung eines schmalbandigen akustischen Signals |
JP4604864B2 (ja) | 2005-06-14 | 2011-01-05 | 沖電気工業株式会社 | 帯域拡張装置及び不足帯域信号生成器 |
US7953605B2 (en) * | 2005-10-07 | 2011-05-31 | Deepen Sinha | Method and apparatus for audio encoding and decoding using wideband psychoacoustic modeling and bandwidth extension |
US7953604B2 (en) * | 2006-01-20 | 2011-05-31 | Microsoft Corporation | Shape and scale parameters for extended-band frequency coding |
US20080004866A1 (en) * | 2006-06-30 | 2008-01-03 | Nokia Corporation | Artificial Bandwidth Expansion Method For A Multichannel Signal |
EP3288027B1 (en) * | 2006-10-25 | 2021-04-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating complex-valued audio subband values |
JP2008158300A (ja) * | 2006-12-25 | 2008-07-10 | Sony Corp | 信号処理装置、信号処理方法、再生装置、再生方法、電子機器 |
US7912729B2 (en) * | 2007-02-23 | 2011-03-22 | Qnx Software Systems Co. | High-frequency bandwidth extension in the time domain |
DE102008015702B4 (de) | 2008-01-31 | 2010-03-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals |
KR101230479B1 (ko) * | 2008-03-10 | 2013-02-06 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 트랜지언트 이벤트를 갖는 오디오 신호를 조작하기 위한 장치 및 방법 |
US7977562B2 (en) * | 2008-06-20 | 2011-07-12 | Microsoft Corporation | Synthesized singing voice waveform generator |
US8880410B2 (en) * | 2008-07-11 | 2014-11-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating a bandwidth extended signal |
ES2796552T3 (es) * | 2008-07-11 | 2020-11-27 | Fraunhofer Ges Forschung | Sintetizador de señales de audio y codificador de señales de audio |
EP2169665B1 (en) * | 2008-09-25 | 2018-05-02 | LG Electronics Inc. | A method and an apparatus for processing a signal |
US8831958B2 (en) * | 2008-09-25 | 2014-09-09 | Lg Electronics Inc. | Method and an apparatus for a bandwidth extension using different schemes |
PL4231290T3 (pl) * | 2008-12-15 | 2024-04-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Dekoder powiększania szerokości pasma audio, powiązany sposób oraz program komputerowy |
RU2493618C2 (ru) * | 2009-01-28 | 2013-09-20 | Долби Интернешнл Аб | Усовершенствованное гармоническое преобразование |
ES2805349T3 (es) * | 2009-10-21 | 2021-02-11 | Dolby Int Ab | Sobremuestreo en un banco de filtros de reemisor combinado |
MX2012001696A (es) * | 2010-06-09 | 2012-02-22 | Panasonic Corp | Metodo de extension de ancho de banda, aparato de extension de ancho de banda, programa, circuito integrado, y aparato de descodificacion de audio. |
AU2012220369C1 (en) | 2011-02-25 | 2017-12-14 | Mobile Pipe Solutions Limited | Mobile plastics extrusion plant |
CN105976830B (zh) * | 2013-01-11 | 2019-09-20 | 华为技术有限公司 | 音频信号编码和解码方法、音频信号编码和解码装置 |
US9666202B2 (en) * | 2013-09-10 | 2017-05-30 | Huawei Technologies Co., Ltd. | Adaptive bandwidth extension and apparatus for the same |
-
2009
- 2009-12-11 PL PL23180061.6T patent/PL4231290T3/pl unknown
- 2009-12-11 ES ES23180084T patent/ES2968885T3/es active Active
- 2009-12-11 ES ES23180061T patent/ES2968884T3/es active Active
- 2009-12-11 EP EP09797003.2A patent/EP2359366B1/en active Active
- 2009-12-11 ES ES23180085T patent/ES2968886T3/es active Active
- 2009-12-11 KR KR1020137031107A patent/KR101424944B1/ko active IP Right Grant
- 2009-12-11 HU HUE23180365A patent/HUE064777T2/hu unknown
- 2009-12-11 CA CA2908576A patent/CA2908576C/en active Active
- 2009-12-11 AU AU2009328247A patent/AU2009328247B9/en active Active
- 2009-12-11 WO PCT/EP2009/066980 patent/WO2010069885A1/en active Application Filing
- 2009-12-11 PL PL23180373.5T patent/PL4224474T3/pl unknown
- 2009-12-11 HU HUE23180084A patent/HUE064774T2/hu unknown
- 2009-12-11 CA CA2746837A patent/CA2746837C/en active Active
- 2009-12-11 CA CA2989886A patent/CA2989886C/en active Active
- 2009-12-11 DK DK18151917.4T patent/DK3364414T3/da active
- 2009-12-11 JP JP2011541363A patent/JP2012512437A/ja active Pending
- 2009-12-11 HU HUE23180369A patent/HUE065515T2/hu unknown
- 2009-12-11 TR TR2018/08500T patent/TR201808500T4/tr unknown
- 2009-12-11 BR BRPI0917762-0A patent/BRPI0917762B1/pt active IP Right Grant
- 2009-12-11 HU HUE22166970A patent/HUE064620T2/hu unknown
- 2009-12-11 ES ES09797003.2T patent/ES2613941T3/es active Active
- 2009-12-11 HU HUE23180061A patent/HUE064773T2/hu unknown
- 2009-12-11 ES ES23180365T patent/ES2968852T3/es active Active
- 2009-12-11 PT PT97970032T patent/PT2359366T/pt unknown
- 2009-12-11 PL PL23180369.3T patent/PL4231295T3/pl unknown
- 2009-12-11 CA CA2908550A patent/CA2908550C/en active Active
- 2009-12-11 EP EP22166970.8A patent/EP4053838B1/en active Active
- 2009-12-11 KR KR1020117013743A patent/KR101369267B1/ko active IP Right Grant
- 2009-12-11 PL PL23180365.1T patent/PL4231293T3/pl unknown
- 2009-12-11 PT PT181519174T patent/PT3364414T/pt unknown
- 2009-12-11 MX MX2011006163A patent/MX2011006163A/es active IP Right Grant
- 2009-12-11 ES ES23180373T patent/ES2974285T3/es active Active
- 2009-12-11 EP EP15167199.7A patent/EP2945159B1/en active Active
- 2009-12-11 PL PL22166970.8T patent/PL4053838T3/pl unknown
- 2009-12-11 EP EP23180085.5A patent/EP4231292B1/en active Active
- 2009-12-11 PL PL15167199T patent/PL2945159T3/pl unknown
- 2009-12-11 CN CN2009801504421A patent/CN102246231B/zh active Active
- 2009-12-11 ES ES18151917T patent/ES2921059T3/es active Active
- 2009-12-11 EP EP18151917.4A patent/EP3364414B1/en active Active
- 2009-12-11 PL PL23180084.8T patent/PL4231291T3/pl unknown
- 2009-12-11 PL PL23180374.3T patent/PL4224475T3/pl unknown
- 2009-12-11 EP EP23180084.8A patent/EP4231291B1/en active Active
- 2009-12-11 ES ES23180374T patent/ES2966659T3/es active Active
- 2009-12-11 HU HUE23180367A patent/HUE064771T2/hu unknown
- 2009-12-11 EP EP23180374.3A patent/EP4224475B1/en active Active
- 2009-12-11 PL PL23180367.7T patent/PL4231294T3/pl unknown
- 2009-12-11 PT PT151671997T patent/PT2945159T/pt unknown
- 2009-12-11 HU HUE23180374A patent/HUE064767T2/hu unknown
- 2009-12-11 PL PL09797003T patent/PL2359366T3/pl unknown
- 2009-12-11 EP EP23180369.3A patent/EP4231295B1/en active Active
- 2009-12-11 EP EP23180367.7A patent/EP4231294B1/en active Active
- 2009-12-11 EP EP23180373.5A patent/EP4224474B1/en active Active
- 2009-12-11 ES ES15167199.7T patent/ES2674386T3/es active Active
- 2009-12-11 HU HUE23180085A patent/HUE064775T2/hu unknown
- 2009-12-11 CA CA2908847A patent/CA2908847C/en active Active
- 2009-12-11 BR BR122015019030A patent/BR122015019030B1/pt active IP Right Grant
- 2009-12-11 PL PL18151917.4T patent/PL3364414T3/pl unknown
- 2009-12-11 HU HUE23180373A patent/HUE064653T2/hu unknown
- 2009-12-11 ES ES22166970T patent/ES2951163T3/es active Active
- 2009-12-11 PL PL23180085.5T patent/PL4231292T3/pl unknown
- 2009-12-11 ES ES23180369T patent/ES2978009T3/es active Active
- 2009-12-11 EP EP23180365.1A patent/EP4231293B1/en active Active
- 2009-12-11 EP EP23180061.6A patent/EP4231290B1/en active Active
- 2009-12-11 ES ES23180367T patent/ES2976382T3/es active Active
-
2011
- 2011-06-13 US US13/158,547 patent/US8401862B2/en active Active
-
2012
- 2012-02-21 HK HK16105619.2A patent/HK1217810A1/zh unknown
- 2012-12-03 US US13/691,950 patent/US9058802B2/en active Active
-
2014
- 2014-03-12 JP JP2014048421A patent/JP5970014B2/ja active Active
-
2015
- 2015-05-12 US US14/709,804 patent/US10229696B2/en active Active
- 2015-06-18 JP JP2015123018A patent/JP6076407B2/ja active Active
-
2019
- 2019-01-29 US US16/260,487 patent/US10937437B2/en active Active
- 2019-01-29 HK HK19101512.6A patent/HK1259024A1/zh unknown
-
2021
- 2021-01-27 US US17/159,331 patent/US11594237B2/en active Active
-
2022
- 2022-10-14 US US17/965,823 patent/US11626124B2/en active Active
- 2022-10-14 US US17/965,824 patent/US11670316B2/en active Active
- 2022-10-14 US US17/965,829 patent/US11631418B2/en active Active
- 2022-10-14 US US17/965,825 patent/US11646043B2/en active Active
- 2022-10-14 US US17/965,826 patent/US11741978B2/en active Active
- 2022-10-14 US US17/965,830 patent/US11705146B2/en active Active
- 2022-10-14 US US17/965,827 patent/US11664039B2/en active Active
-
2023
- 2023-07-14 US US18/221,964 patent/US20230377590A1/en active Pending
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2968886T3 (es) | Decodificador de extensión de audio de ancho de banda, procedimiento correspondiente y programa de ordenador | |
AU2015203736C1 (en) | Audio encoder and bandwidth extension decoder |