ES2534944T3 - Codificador de extensión de ancho de banda, descodificador de extensión de ancho de banda y vocoder de fase, así como métodos correspondientes y programa de computadora - Google Patents

Codificador de extensión de ancho de banda, descodificador de extensión de ancho de banda y vocoder de fase, así como métodos correspondientes y programa de computadora Download PDF

Info

Publication number
ES2534944T3
ES2534944T3 ES10725483.1T ES10725483T ES2534944T3 ES 2534944 T3 ES2534944 T3 ES 2534944T3 ES 10725483 T ES10725483 T ES 10725483T ES 2534944 T3 ES2534944 T3 ES 2534944T3
Authority
ES
Spain
Prior art keywords
signal
window
audio signal
low frequency
analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES10725483.1T
Other languages
English (en)
Inventor
Frederik Nagel
Markus Multrus
Sascha Disch
Jeremie Lecomte
Christian Ertel
Patrick Warmbold
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Application granted granted Critical
Publication of ES2534944T3 publication Critical patent/ES2534944T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

Un codificador de extensión de ancho de banda (100; 300) para codificar una señal de audio (101-1), la señal de audio (101-1) que comprende una señal de baja frecuencia (101-2) que comprende una banda de frecuencia central (101-3) y una señal de alta frecuencia (101-4) que comprende una banda de frecuencia superior (101-5), el codificador (100; 300) comprendiendo: un analizador de señal (110) para analizar la señal de audio (101-1), la señal de audio (101-1) tiene un bloque (101-6) de muestras de audio, el bloque (101-6) tiene una duración de tiempo especificada, en donde el analizador de señal (110) está configurado para determinar de una pluralidad (111-1) de ventanas de análisis, una ventana de análisis (111-2) a ser usada para efectuar una extensión de ancho de banda en un descodificador de extensión de ancho de banda (400); un codificador central (120) para codificar la señal de baja frecuencia (101-2) para obtener una señal de baja frecuencia codificada (121; y un calculador de parámetros (130; 320) para calcular parámetros de extensión de ancho de banda (131; 321-2) a partir de la señal de alta frecuencia (101-4) el codificador de extensión de ancho de banda (300) comprende además un controlador de ventana (310) para proveer información de control de ventana (311) que indica una pluralidad (111-1) de funciones de ventana de análisis, el calculador de parámetros (320) comprende un formador de ventanas controlado por el controlador de ventanas (310), en donde el formador de ventanas está configurado para aplicar la pluralidad (111-1) de funciones de ventana de análisis y una función de ventana de análisis (111-2) a ser seleccionada por un comparador (340) a la señal de alta frecuencia (101-4), el analizador de señal (110) comprende un módulo de interconexiones (330), que está configurado para generar una pluralidad (331- 1) de señales interconectadas en base a la señal de baja frecuencia (101-2), la información de control de ventana (311) y parámetros de BWE (321-2), en donde las señales interconectadas (331-1) comprenden bandas de frecuencia superior (331-2) generadas a partir de la banda de frecuencia central (101-3); un comparador (340) que está configurado para determinar una pluralidad (341-2) de parámetros de comparación en base a una comparación de las señales interconectadas (331-1) y una señal de referencia que es la señal de audio (101-1) o señal (101-4; 101-2) derivada de la señal de audio, en donde la pluralidad (341-2) de parámetros de comparación corresponde a la pluralidad (111-1) de funciones de ventana de análisis, y en donde el comparador (340) está configurado además para proveer una indicación de ventana (341-1)correspondiente a una función de ventana de análisis (111-2) para la cual un parámetro de comparación satisface una condición predeterminada; y un interfaz de salida (350) para proveer una señal de audio codificada (351), la señal de audio codificada (351) que comprende la indicación de ventana (341-1).

Description

15
25
35
45
55
65 E10725483
14-04-2015
Descripción
Codificador de extensión de ancho de banda, descodificador de extensión de ancho de banda y vocoder de fase, así como métodos correspondientes y programa de computadora
[0001] La presente invención es concerniente con el procesamiento de señales de audio y en particular con un codificador de extensión de ancho de banda, un método para codificar una señal de audio, un descodificador de extensión de ancho de banda, un método para descodificar una señal de audio codificada, un vocoder de fase y una señal de audio.
[0002] Además, modalidades de la presente invención son concernientes con una aplicación de un vocoder de fase para estiramiento de tiempo puro, independiente de la extensión de ancho de banda.
[0003] El almacenamiento o transmisión de señales de audio es frecuentemente sometido a restricciones de velocidades de bits estrictas. Estas restricciones son usualmente tomadas en cuenta mediante el uso de codificadores/descodificadores (“codec”) que comprimen eficientemente la señal de audio en términos de la velocidad de información necesaria para almacenar o transmitir la señal. En el pasado, los codificadores fueron forzados a reducir drásticamente el ancho de banda de audio cuando solamente una velocidad de bits muy baja está disponible. Los codecs de audio moderno son aptos de codificar señales de banda ancha al utilizar métodos de extensión de anchos de banda (BWE), como se describe en M. Dietz, L. Liljeryd, K. Kjörling y O. Kunz, “Spectral Band Replication, a novel approach in audio coding” en la 112ª Convención AES, Münich, mayo de 2002; S. Meltzer,
R. Böhm y F. Henn, “SBR enhanced audio codecs for digital broadcasting such as “Digital Radio Mondiale” (DRM)”, en la 112ª Convención AES, Münich, mayo de 2002; T. Ziegler, A. Ehret, P. Rkstrand y M. Lutzky, “Enhancing mp3 with SBR: Features and Capabilities of the new mp3PRO Algorithm” en la 112ª Convención AES, Münich, mayo de 2002; Estándar Internacional ISO/IEC 14496-3: 2001/FDPAM 1, “Bandwidth Extension”, ISO/IEC, 2002; “Speech Bandwidth extensión method and apparatus”, Vasu Iyengar et al., patente estadounidense 5,455,888; E. larsen, R.
M. Aarts y M. Danessis. Efficient high-frecuency bandwidth extensión of music and speech. En la la 112ª Convención AES, Münich, Alemania, mayo de 2002; R. M. Aarts y M. Danessis. Efficient high-frecuency bandwidth extensión of music and speech. En la 112ª Convención AES, Münich, Alemania, mayo de 2002; R. M. Aarts, E. Larsen y O. Ouweltjes. An unified approach to low-and high frequency bandwidth extensión. En la 115ª Convención AES, Nueva York, EUA, octubre de 2003; K. Käyhkö. A robust Wideband Enhancement for Narrowband Speech Signal. Research Report, Universidad de Helsinki de Teconología, laboratorio de Acústuca y Procesamiento de Señal de Audio, 2001;
E. Larsen y R. M. Aarts. Audio bandwith Extension – Application yo psychoacoustics, Signal Processing and Loudspeaker Design. John Wiley & Sons, Ltd., 2004; E. Larsen, R. M. Aarts y M. Danessis. Efficient high-frequency bandwidth extension of music and speech. En la 112ª Convención AES, Münich, Alemania, mayo de 2002; J. Makhoul. Spectral Analysis of Speech by Linear Prediction. IEEE Transactions on Audio and RElectroacoustics, AU21(3), junio de 1973; Solicitud de patente estadounidense 08/951,029, Ohmori et al. Audio band width extending system and method; patente estadounidense 6895375, Malah, D. y Cox, R.V.: System for a bandwidth extension of Narrow-band speech and Frederick Nagel, Sascha Sisch, “A harmonic bandwidth extension method for audio codecs”, Conferencia Internacional ICASSP sobre Acústica, Lenguaje y Procesamiento de Señal, IEEE CNF, Taipei, Taiwán, abril de 2009.
[0004] Estos algoritmos dependen de una representación paramétrica del contenido de alta frecuencia (HF). Esta representación es generada a partir de la parte de baja frecuencia (LF) de la señal descodificada por medio de transposición a la región espectral de HF (“parche”) y aplicación de un post-procesamiento impulsado por parámetros.
[0005] En el arte, son conocidos métodos de extensión de ancho de banda tales como replicación de banda espectral (SBR) o extensión de ancho de banda (HBE). En lo siguiente, estos dos métodos de BWE son descritos brevemente.
[0006] Por una parte, la replicación de banda espectral (SBR), como se describe en M. Dietz, L. Liljeryd, K. Kjörling y
O. Kunz, “Spectral Band Replication, a novel approach in audio coding”, en la 112ª Convención AES, Münich, mayo de 2002, utiliza un banco de filtros de espejo de cuadratura (QMF) para generar la información de HF. La aplicación de un llamado algoritmo de “parche”, señales de banda QMF más bajas son confiadas a bandas de QMF más alta, conduciendo a una replicación de la información de la parte de LF en la parte de HF. Subsecuentemente, la parte de HF es generada es adaptada para coincidir estrechamente con la parte de HF original con la ayuda de parámetros que ajustan la envolvente espectral y la tonalidad.
[0007] Por otra parte, la extensión de ancho de banda harmónica (HBE) es un esquema de extensión de ancho de banda alternativo basado en vocoders de fase. HBE permite una continuación harmónica del espectro en contraposición con SBR, que depende de un desplazamiento espectral no harmónico. Puede ser utilizado para reemplazar o enmemdar el algoritmo de parcehde SBR.
[0008] WO 01/26095 A1 proporciona un método y un aparato para la codificación de envolvente espectral. El documento enseña cómo llevar a cabo y señalar de forma compacta una asignación de tiempo/frecuencia de la
15
25
35
45
55
65 E10725483
14-04-2015
representación de envolvente, y además, codificar los datos de envolvente espectral eficientemente usando codificación adaptativa direccional de tiempo/frecuencia. El método es aplicable tanto a los sistemas de codificación de audio natural y sistemas de codificación del habla y es especialmente adecuado para los codificadores que utilizan SBR [WO 98/57436] u otros métodos de reconstrucción de alta frecuencia.
[0009] EP 1 672 618 A1 describe un método para la determinación de una frontera de tiempo y una resolución de frecuencia en la codificación de envolvente espectral. Un tipo de trama para una trama actual SBR se determina de acuerdo con un tipo de frontera final de una trama anterior, así como la presencia de un transitorio en la trama SBR actual. Una frontera de inicio se determina de acuerdo a la frontera final de la trama anterior SBR. Para una trama FIXFIX, se utiliza un ajuste de baja resolución temporal. Para una trama FIXVAR o VARVAR, se lleva a cabo una búsqueda de las fronteras intermedias en la región entre el transitorio máximo permitido y ubicación de la frontera final. La frontera final se determina también en esta etapa. Si hay un exceso de capacidad de más fronteras, otra búsqueda se lleva a cabo en la región entre el transitorio y la frontera de inicio. Para una trama VARFIX, sólo una búsqueda debe llevarse a cabo, en toda la región dividida por una frontera salida variable y una frontera extremo fijo. Todo lo anterior se logra con dos operaciones búsqueda hacia adelante y una operación de búsqueda hacia atrás. Se emplea el mismo principio, que se basa en la evaluación de la variación de la señal de un tiempo de segmento, pero con variaciones menores para adaptarse a los escenarios en los que se aplican.
[00010] WO 98/57436 A2 describe un método y un aparato para la mejora de los sistemas de codificación de la fuente. El concepto emplea la reducción de ancho de banda antes de o en el codificador, seguido por la replicación de banda espectral en el decodificador. Esto se logra mediante el uso de nuevos métodos de transposición, en combinación con los ajustes de envolvente espectral. Se ofrece una tasa de bits reducida para una calidad de percepción dada o una calidad de percepción mejorada a una determinada tasa de bits. El concepto está integrado preferiblemente en un codec de hardware o software, pero también puede ser implementado como un procesador independiente en combinación con un codec. El concepto ofrece mejoras sustanciales prácticamente independientes del tipo de codec y el proceso tecnológico.
[00011] En Frederik Nagel et al .: "Un método de extensión de ancho de banda armónica para códecs de audio" Acústica, el habla y el procesamiento de señales de 2009. ICASSP 2009. IEEE CONFERENCIA INTERNACIONAL, IEEE, Piscataway, NJ, EE.UU., 19 de abril de 2009 (2009-04-19), páginas 145-148, se describe un esquema de extensión de ancho de banda armónica. Codecs de audio eficientes para escenarios de aplicación con tasas de bits bajas a menudo se basan en la codificación paramétrica de la porción de banda superior de frecuencia de una señal, mientras que la porción de banda de frecuencia inferior de la misma es transportada mediante un método de codificación que conserva una forma de onda. En el decodificador, la señal de frecuencia superior se aproxima a partir de los datos de frecuencia más bajos utilizando los parámetros de la banda de frecuencia superior. Sin embargo, los métodos de uso general de extensión de ancho de banda sufren casi inevitablemente de una sensación de rugosidad desagradable, que es especialmente presente en elementos de música tonal. En este artículo, el origen de la rugosidad está expuesto y se proporciona un método de extensión de ancho de banda, que no introduce rugosidad en la señal de audio reconstruida. Una prueba de escucha demuestra la ventaja del método proporcionado en comparación con una extensión de ancho de banda estándar.
[00012] WO 98/02971 A1 describe un método de codificación y decodificación de señales de audio. Un método de codificación de señales de audio de tiempo discreto comprende las etapas de ponderación de la señal de audio de tiempo discreto por medio de funciones de ventana que se solapan entre sí para formar bloques, las funciones de ventana productoras de bloques de una primera longitud de señales que varían débilmente con el tiempo y bloques de una segunda longitud de señales que varían fuertemente con el tiempo. Una secuencia ventana de inicio se selecciona para la transición de enventanado con bloques de la primera longitud a enventanado con bloques de la segunda longitud, mientras que se selecciona una secuencia de ventana única para la transición opuesta. La secuencia ventana de inicio se selecciona entre al menos dos secuencias de ventana de inicio diferentes que tienen diferentes longitudes, mientras que la secuencia ventana de parada se selecciona de al menos dos secuencias de ventana de parada diferentes que tienen diferentes longitudes. Un método de bloques de descodificación de señales de audio codificadas selecciona una transformación inversa adecuada, así como una ventana de síntesis adecuada en reacción a la información secundaria asociada con cada bloque.
[00013] La solicitud de patente estadounidense provisional US con el número de solicitud 61/079,841 revela un método de BWE, que puede escoger entre algoritmos de parche alternativos que operan ya sea en el dominio de frecuencia o en el dominio de tiempo. En la transformada de tiempo-frecuencia mediante el banco de filtros, se aplica una cierta ventana de análisis predeterminada. Además, en implementaciones de vocoder de fase clásicos de acuerdo con el uso del estado del arte de la forma de ventana predefinida tal como una ventana elevada al coseno o una ventana de Bartlett.
[00014] Sin embargo, el escoger una ventana de análisis predeterminada para aplicaciones de vocoder siempre abarca que se haga una solución intermedia por el diseñador de aplicación en términos de calidad de audio perceptual global obtenida para diferentes clases de señales de audio. Así, aunque la calidad de audio media puede ser optimizada por la elección inicial de una cierta ventana, la calidad de audio para cada clase individual de señales sigue siendo sub-óptima.
15
25
35
45
55
65 E10725483
14-04-2015
[00015] Además, se encontró que ciertas señales se benefician de usar ventanas de análisis especializadas para un vocoder de fase, que pueden sustancialmente ser usadas para el esparcimiento temporal de la señal de audio sin modificar el tono de la misma.
[00016] Por consiguiente, se requiere un concepto para seleccionar las ventanas de análisis óptimas tal como dentro de un esquema de BWE. Sin embargo, medidas contra la degradación recién mencionada de la calidad de audio perceptual deben preferiblemente no dar como resultado una complejidad de cálculos ilustrativamente incrementada de los codecs empleados.
[00017] Es un objeto de la presente invención proveer un concepto de codificación y/o descodificación o concepto de vocoder en fase que provee una calidad de audio mejorada.
[00018] Este objeto es obtenido por medio de las soluciones definidas en las reivindicaciones adjuntas.
[00019] Una idea fundamental de la presente invención es que se puede obtener una calidad perceptual mejorada cuando la señal de audio que tiene un bloque de muestras de audio con una duración especificada de tiempo es analizada con el fin de determinar a partir de una pluralidad de ventanas de análisis, una ventana de análisis a ser usada para efectuar una extensión de ancho de banda en un decodificador de extensión de ancho de banda. Mediante esta medida, se puede impedir la reducción de la calidad de audio resultante de la aplicación de una ventana de análisis predeterminada y consecuentemente, la calidad de audio perceptual puede ser mejorada con relativamente poco esfuerzo en comparación con los métodos de BWE del arte previo.
[00020] De acuerdo con una modalidad de la presente invención, un codificador de extensión de ancho de banda para codificar una señal de audio comprende un analizador de señal, un codificador de núcleo y un calculador de parámetros. La señal de audio comprende una señal de baja frecuencia que comprende una banda de frecuencia del núcleo y una señal de alta frecuencia que comprende una banda de frecuencia superior. El analizador de señales está configurado para analizar la señal de audio, la señal de audio que tiene un bloque de muestras de audio, el bloque tiene una duración especificada de tiempo. El analizador de señal está configurado además para determinar, de una pluralidad de ventanas de análisis una ventana de análisis a ser usada para efectuar una extensión de ancho de banda en un descodificador de extensión de ancho de banda. El codificador de núcleo está configurado para codificar la señal de baja frecuencia para obtener una señal de baja frecuencia codificada. El calculador de parámetros está configurado para calcular parámetros de extensión de ancho de banda de la señal de alta frecuencia.
[00021] El codificador de extensión de ancho de banda comprende además un controlador de ventana, un comparador y un interfaz de salida. El controlador de ventana está configurado para proveer información de control de ventana que indica una pluralidad de funciones de ventana de análisis. El calculador de parámetros comprende un formador de ventanas controlado por el controlador de ventanas, en donde el formador de ventanas está configurado para aplicar la pluralidad de funciones de ventana de análisis y una función de ventana de análisis a ser seleccionada por un comparador a la señal de alta frecuencia. El analizador de señal comprende un módulo de interconexiones, que está configurado para generar una pluralidad de señales interconectadas en base a la señal de baja frecuencia, la información de control de ventana y parámetros de BWE, en donde las señales interconectadas comprenden bandas de frecuencia superior generadas a partir de la banda de frecuencia central. El comparador está configurado para determinar una pluralidad de parámetros de comparación en base a una comparación de las señales interconectadas y una señal de referencia que es la señal de audio o señal derivada de la señal de audio, en donde la pluralidad de parámetros de comparación corresponde a la pluralidad de funciones de ventana de análisis. El comparador está configurado además para proveer una indicación de ventana correspondiente a una función de ventana de análisis para la cual un parámetro de comparación satisface una condición predeterminada. El interfaz de salida está configurado para proveer una señal de audio codificada.
[00022] De acuerdo con otra modalidad de la presente invención, un descodificador de extensión de ancho de banda para descodificar una señal de audio codificada comprende un descodificador de núcleo, un módulo de interconexiones y un combinador. La señal de audio codificada comprende una señal de baja frecuencia codificada y parámetros de banda superior. El descodificador de núcleo está configurado para descodificar la señal de baja frecuencia codificada, en donde la señal de baja frecuencia descodificada comprende una banda de frecuencia central. El módulo de interconexiones está configurado para generar una señal interconectada en base a la señal de baja frecuencia descodificada y los parámetros de banda superior, en donde la señal interconectada comprende una banda de frecuencia superior generada a partir de la banda de frecuencia de núcleo. El combinador está configurado para combinar la señal interconectada y la señal de baja frecuencia descodificada para obtener una señal de salida combinada.
[00023] El módulo de interconexión comprende un formador de ventanas de análisis, un convertidor de tiempo/espectro, un procesador de dominio de frecuencia, un convertidor de frecuencia/tiempo, un formador de ventanas de síntesis y un comparador. El formador de ventanas de análisis está configurado para aplicar una pluralidad de funciones de ventana de análisis a la señal de baja frecuencia descodificada para obtener una
10
15
20
25
30
35
40
45
50
55
60
65 E10725483
14-04-2015
pluralidad de señales de baja frecuencia representadas en ventana. El convertidor de tiempo/espectro está configurado para convertir las señales de baja frecuencia representadas en ventana a espectros. El procesador de dominio de frecuencia está configurado para procesar los espectros en un dominio de frecuencia para obtener espectros modificados. El convertidor de frecuencia/tiempo está configurado para convertir los espectros modificados en señales de dominio de tiempo modificadas. El formador de ventanas de síntesis está configurado para aplicar una pluralidad de funciones de ventana a las señales de dominio de tiempo modificadas, en donde las funciones de ventana de síntesis se hacen coincidir con las funciones de ventana de análisis para obtener señales de dominio de tiempo modificadas representadas en ventana. El comparador está configurado para determinar una pluralidad de parámetros de comparación en base a una comparación de la pluralidad de señales de dominio de tiempo modificadas representadas en ventana y la señal de baja frecuencia descodificada, en donde la pluralidad de parámetros de comparación corresponde a la pluralidad de funciones de ventana de análisis. El comparador está configurado además para seleccionar una función de ventana de análisis y una función de ventana de síntesis para la cual un parámetro de comparación satisface una condición predeterminada. El módulo de interconexión está configurado para generar una señal interconectada en base a la señal de baja frecuencia descodificada, la función de ventana de análisis y la función de ventana de síntesis seleccionadas por el comparador y los parámetros de banda superior.
[00024] De acuerdo con otra modalidad, un procesador de vocoder de fase para codificar una señal de audio comprende un formador de ventana de análisis, un convertidor de tiempo/espectro, un procesador de dominio de frecuencia, un convertidor de frecuencia/tiempo, un formador de ventana de análisis, un comparador y un adicionador de superposición. El formador de ventana de síntesis está configurado para aplicar una pluralidad de funciones de ventana de análisis a la señal de audio o una señal derivada de la señal de audio, la señal de audio que tiene un bloque de muestras de audio, el bloque tiene una relación de tiempo especificada, para obtener una pluralidad de señales de audio representadas en ventana. El convertidor de tiempo/espectro está configurado para convertir las señales de audio formadas en ventana en espectros. El procesador de dominio de frecuencia está configurado para trazar los espectros en un dominio de frecuencia para obtener espectros codificados. El convertidor de frecuencia/tiempo está configurado para convertir los espectros modificados a señales de dominio de tiempo modificadas. El formador de ventanas de síntesis está configurado para aplicar una pluralidad de funciones de ventana de síntesis a las señales de dominio de tiempo modificadas, en donde las funciones de ventana de síntesis se hacen coincidir con las funciones de ventana de análisis para obtener señales de dominio de equipo modificadas representadas en ventanas. El comparador está configurado para determinar una pluralidad de parámetros de comparación en base a una comparación de la pluralidad de señales de dominio de tiempo modificadas representadas en ventana y la señal de audio o una señal derivada de la señal de audio, en donde la pluralidad de parámetros de comparación corresponde con la pluralidad de funciones de ventana de análisis. El comparador está configurado además para seleccionar una función de ventana de análisis y una función de ventana de síntesis para las cuales un parámetro de comparación satisface una condición predeterminada. El adicionador de superposición está configurado para albergar bloques de superfunción de una señal de dominio de tiempo modificada representada en ventana para obtener una señal temporalmente esparcida. El adicionador de superposición está configurado más para procesar bloques de la señal de dominio de tiempo modificada representada en ventana que ha sido modificada por una función de ventana de análisis y una función de ventana de síntesis seleccionada por el comparador.
[00025] Modalidades de la presente invención están basadas en el concepto de que una pluralidad de señales interconectadas pueden ser generadas de una pluralidad de funciones de ventana de análisis aplicadas a la señal de audio que comprende la banda de frecuencia del núcleo. La pluralidad de señales interconectadas pueden ser comparadas con una señal de referencia que esta señal de audio original o una señal derivada de la señal de audio. Esto dará como resultado una pluralidad de parámetros de comparación, que pueden ser relacionados con medidas de la calidad de audio. Además, de la pluralidad de funciones de ventana de análisis, se puede seleccionar una sección de ventana de análisis para la cual un parámetro de comparación satisface una condición predeterminada. Por consiguiente, el uso de la función de ventana de análisis seleccionada puede asegurar reducción mínima de la calidad de audio, conduciendo a calidad de audio perceptual óptima en el contexto de un escenario de BWE.
[00026] Otras modalidades son concernientes con un analizador de señales que comprende un clasificador de señal, en donde el clasificador de señal está configurado para analizar/clasificar la señal de audio o una señal derivada de la señal de audio. En este caso, la función de ventana de análisis a ser usada para efectuar una extensión de ancho de banda en el descodificador de extensión de ancho de banda es seleccionada en base a una característica de señal de la señal analizada/clasificada.
[00027] Por consiguiente, modalidades proveen un método para seleccionar la ventana de análisis óptima para la extensión de ancho de banda en el descodificador. Parámetros de control pueden ser efectuados con el fin de decidir cual ventana de análisis es la más apropiada. Para obtener esto, se puede usar un esquema de análisis por síntesis; esto es, un conjunto de ventanas pueden ser aplicadas y la mejor de acuerdo con un objetivo apropiado es escogida. En el modo preferido de la invención, el objetivo es asegurar calidad de audio perceptual óptima de la restitución. En modos alternativos, una función objetivo puede ser optimizada. Por ejemplo, el objetivo puede ser conservar la llanura espectral de la HF original tan cercana como sea posible.
15
25
35
45
55
65 E10725483
14-04-2015
[00028] Por otra parte, la selección de ventana se puede hacer solamente en el codificador al considerar la señal adicional, la señal sintetizada o ambas de ellas. Una decisión (indicación de ventana) es luego transmitida al descodificador. Por otra parte, la selección puede ser efectuada síncronamente en el descodificador y el lado del descodificador considerando solamente el ancho de banda del núcleo de la señal descodificada. El último método no está en necesidad de generar información lateral adicional, lo que es favorable en términos de eficiencia de velocidad de bits del códec.
[00029] La invención es ventajosa en que optimiza la calidad perceptual de la señal de salida del vocoder. Modalidades proveen una elección adaptable de señal de ventanas de análisis y síntesis apropiadas para el proceso de vocoding, en donde diferentes respuestas de tiempo o respuestas de frecuencia de las ventanas de análisis y/o síntesis son posibles.
[00030] Otra ventaja de la invención es que permite una solución intermedia mejor entre la reducción de la degradación mencionada anteriormente y la complejidad computacional tal como dentro de un esquema de BWE.
[00031] En lo siguiente, modalidades (no todas ellas referidas a la presente invención) son explicadas con referencia a las figuras adjuntas en las cuales:
La Figura 1 muestra un diagrama de bloques de una modalidad de un codificador de extensión de ancho de banda;
La Figura 2 muestra un diagrama de bloques de una modalidad de un descodificador de extensión de ancho de banda;
La Figura 3 muestra un diagrama de bloques de una modalidad adicional de un codificador de extensión de ancho de banda.
La Figura 4 muestra un diagrama de bloques de una modalidad adicional de un descodificador de extensión de ancho de banda.
La Figura 5 muestra un diagrama de bloques de una modalidad adicional de un codificador de extensión de ancho de banda.
La Figura 6 muestra diagrama de bloques de una modalidad adicional de un descodificador de extensión de ancho de banda.
La Figura 7 muestra un diagrama de bloques de una implementación de un comparador.
La Figura 8 muestra un diagrama de bloques de una modalidad adicional de un codificador de extensión de ancho de banda.
La Figura 9 muestra un diagrama de bloques de una modalidad implementación de un clasificador de señal.
La Figura 10 muestra un diagrama de bloques de una modalidad adicional de un codificador de extensión de ancho de banda.
La Figura 11 muestra un diagrama de bloques de una modalidad adicional de un descodificador de extensión de ancho de banda.
La Figura 12 muestra un diagrama de una modalidad de un procesador de vocoder de fase.
La Figura 13 muestra un diagrama de bloques de una modalidad de un aparato para cambiar entre diferentes ventanas de análisis y de síntesis dependiendo de la información de control.
La Figura 14A-14B muestran una vista general de una modalidad de un vocoder de fase impulsado por un descodificador de extensión de ancho de banda.
[00032] La figura 1 muestra un diagrama de bloque de un codificador de extensión de ancho de banda 100 para codificar una señal de audio 101-1 de acuerdo con una modalidad. La señal de audio 101-1 comprende una señal de baja frecuencia 101-2 que comprende una banda de frecuencia central 101-3 y una señal de alta frecuencia 101-4 que comprende una banda de frecuencia superior 101-5. El codificador de extensión de ancho de banda 100 comprende un analizador de señal 110, un codificador central 120 y un calculador de parámetros 130. El analizador de señal 110 está configurado para analizar la señal de audio 101-1, la señal de audio 101-1 que tiene un bloque 101-6 de muestras de audio, el bloque 101-6 que tiene una duración de tiempo especificada. El analizador de señal 110 está configurado además para determinar de una pluralidad 111-1 de ventanas de análisis una ventana de análisis 111-2 a ser usada para efectuar una extensión de ancho de banda, tal como en el descodificador de extensión de ancho de banda 200. El codificador central 120 está configurado para codificar la señal de baja frecuencia 101-2 para obtener una señal de baja frecuencia codificada 121. Finalmente, el calculador de parámetros 130 está configurado para calcular parámetros de extensión de ancho de banda 131 de la señal de alta frecuencia 101-4. Los parámetros de extensión de ancho de banda 131, la ventana de análisis 111-2 a ser usada en el descodificador de extensión de ancho de banda 200 y la señal de baja frecuencia codificada 121 constituyen una señal de audio codificada 110-1 provista por el codificador de extensión de ancho de banda 100.
[00033] La Figura 2 muestra un diagrama de bloques de un descodificador de extensión de ancho de banda 200 para descodificar una señal de audio codificada 201-1 de acuerdo con otra modalidad. La señal de audio codificada 201-1 comprende una señal de baja frecuencia codificada 201-2 y parámetros de banda superior 201-3. Aquí, la señal de audio codificada 201-1 puede corresponder a la señal de audio codificada 103-1 tal y como es provista por el codificador de extensión de ancho de banda 100 mostrado en la Figura 1. El descodificador de extensión de ancho de banda 200 comprende un descodificador central 210, un módulo de interconexión 220 y un combinador
15
25
35
45
55
65 E10725483
14-04-2015
230. El descodificador central 210 está configurado para descodificar la señal de baja frecuencia codificada 201-2 para obtener una señal de baja frecuencia 211-1. La señal de baja frecuencia descodificada 211-1 comprende una banda de frecuencia central 211-2. El módulo de interconexión 220 está configurado para generar una señal interconectada 221-1 en base a la señal de baja frecuencia descodificada 211-1 y parámetros de banda superiores 201-3, en donde la señal interconectada 221-1 comprende una banda de frecuencia superior 221-2 generado de la banda de frecuencia central 211-2. Finalmente, el combinador 230 está configurado para combinar la señal interconectada 221-1 y la señal de baja frecuencia descodificada 211-1 para obtener una señal de salida combinada 231-1. En particular, la señal interconectada 221-1 puede ser una señal en un intervalo de frecuencia objetivo de un algoritmo de extensión de ancho de banda, mientras que la señal de salida combinada 231-1 provista por el descodificador de extensión de ancho de banda 200 puede ser una señal manipulada con un ancho de banda extendido (231-2).
[00034] La Figura 3 muestra un diagrama de bloques de una modalidad adicional de un codificador de extensión de ancho de banda 300. El codificador de extensión de ancho de banda 300 puede comprender un filtro de paso de bajos (LP) y un filtro de paso de altos (HP). Los filtros pueden ser implementados para generar una versión filtrada en paso de bajos de la señal de audio 101-1 que es la señal de baja frecuencia 101-2 y una versión filtrada del paso de altos de la señal de audio 101-1 que es la señal de alta frecuencia 101-4. Como se muestra en la Figura 3, el codificador de extensión de ancho de banda 300 puede comprender además un controlador de ventana 310 para proveer información de control de ventana 311 a ser usada por un calculador de parámetros 320 y un módulo de interconexiones 330. La información de control de ventana 311 provista por el controlador de ventana 310 puede indicar una pluralidad 111-1 de funciones de ventana de análisis a ser reflejadas al bloque 101-6 de muestras de audio derivadas de la señal de audio 101-1. El calculador de parámetros 320, en particular, puede comprender un formador de ventanas controlado por el controlador de ventanas 110, en donde el formador de ventanas del calculador de parámetros 320 está configurado para aplicar la pluralidad 111-1 de funciones de ventana de análisis y una función de ventana de análisis 111-2 a ser seleccionada por un comparador 340 a la señal de alta frecuencia 101-4. Aquí, los parámetros de extensión de ancho de banda 321-1, 321-2 correspondientes a la pluralidad 111-1 de funciones de ventana de análisis como se indica por la información del control de ventana 311 y correspondientes a la función de ventana de análisis seleccionada 111-2 tal como es provista por una indicación de ventana 340-1 en la función del comparador 340 son obtenidas, respectivamente.
[00035] En la modalidad mostrada en la Figura 3, el analizador de señal 110 comprende un módulo de interconexiones 330, que está configurado para generar una pluralidad 331-1 de señales interconectadas en base a la señal de baja frecuencia 101-2, la información del control de ventanas 311 y los parámetros de extensión de ancho de banda 321-1. Aquí, las señales interconectadas 331-1 comprenden bandas de frecuencia superior 331-2 generadas de la banda de frecuencia central 101-3. El módulo de interconexión 330, en particular comprende un formador de ventanas controlado por el controlador de ventanas 310, en donde el formador de ventanas del módulo de interconexión 330 está configurado para aplicar la pluralidad 111-1 de funciones de ventana de análisis a la señal de baja frecuencia 101-2.
[00036] Además, el analizador de señal 110 del codificador de extensión de ancho de banda 300 comprende un comparador 340 que está configurado para determinar una pluralidad 341-2 de parámetros de comparación en base a una comparación de señales interconectadas 331-1 y una señal de referencia que es la señal de audio 101-1 o una señal derivada de la señal de audio tal como la señal de alta frecuencia 101-4 indicada por la línea discontinua, en donde la pluralidad 341-2 de los parámetros de comparación corresponden a la pluralidad 111-1 de funciones de ventana de análisis. El comparador 340 está configurado además para proveer una indicación de ventana 341-1 correspondiente a una función de ventana de análisis 111-2 para el cual un parámetro de comparación satisface una condición predeterminada. Finalmente, el codificador de función de ancho de banda 300 comprende un interfaz de salida 350 para proveer una señal de audio codificada 351, la señal de audio codificada 351 que comprende la indicación de ventana 341-1.
[00037] Con respecto a una implementación de la comparación anterior, la Figura 7 muestra un diagrama de bloques de una modalidad de un comparador 700, que puede comprender un calculador de parámetros de medida de llanura espectral (SFM) 710, un comparador de parámetros SFM 720 y un extractor de indicación de ventana
730. El calculador de parámetros de SFM 710 puede ser implementado para calcular, por ejemplo, una pluralidad 703-1 de parámetros de SFM de una pluralidad 701-1 de señales de entrada y un parámetro de SFM de referencia 703-2 de una señal de entrada de referencia 701-2. En particular, cada parámetro de SFM puede ser calculado al dividir la media geométrica del espectro de potencia por la media aritmética del espectro de potencia derivado de la señal de entrada correspondiente, en donde un parámetro de SFM relativamente alto indica que el espectro tiene una cantidad de energía similar en todas las bandas espectrales, mientras que un parámetro de SFM relativamente bajo indica que la potencia espectral está concentrada en un número relativamente pequeño de bandas. Además. El parámetro de SFM puede también ser medido dentro de una cierta banda parcial (sub-banda) en lugar de a través de toda la banda de la señal de entrada. El comparador de parámetros de SFM 720 puede ser implementado para comparar los parámetros de SFM 703-1 con el parámetro de SFM de referencia 703-2 para obtener una pluralidad 705 de parámetros de comparación, en donde los parámetros de comparación 705 pueden por ejemplo estar basados en las desviaciones en los parámetros de SFM comparados. El extractor de indicación de ventana 730 puede ser implementado para seleccionar de la pluralidad de parámetros de comparación 705, un parámetro de
15
25
35
45
55
65 E10725483
14-04-2015
comparación para el cual una condición predeterminada será satisfecha. La condición predeterminada puede por ejemplo ser escogida de tal manera que el parámetro de comparación seleccionado será un mínimo de la pluralidad de parámetros de comparación 705. En este caso, el parámetro de comparación seleccionado corresponderá a una señal de entrada de la pluralidad de señales de entrada 701-1, que está caracterizada por una desviación mínima de la señal de entrada de referencia 701-2 en términos de llanura espectral.
[00038] Específicamente, las señales de entrada 701-1 pueden corresponder a las señales interconectadas 731-1, las señales interconectadas 731-1 habiendo sido obtenidas después de la aplicación de la pluralidad 111-1 de funciones de ventana de análisis de la señal de audio 101-1 o una señal derivada de la señal de audio 101-1 tal como la señal de baja frecuencia 101-2, mientras que la señal de entrada de referencia 701-2 puede corresponder a la señal de audio original 101-1. Además, la pluralidad 705 de parámetros de comparación del comparador 700 pueden corresponder a la pluralidad 341-2 de parámetros de comparación del codificador de extensión de ancho de banda 300. Por consiguiente, una función de ventana de análisis 111-2 puede ser seleccionada correspondiente al parámetro de comparación seleccionado en que una desviación en los parámetros de SFM de las señales interconectadas 331-1 y la señal de audio original 101-1, por ejemplo, será mínima. La función de ventana de análisis seleccionada 111-2 puede también ser determinada por una indicación de ventana 707, que puede corresponder a la indicación de ventana 341-1, provista en la salida del comparador 700 o el comparador 340, respectivamente. Consecuentemente, la calidad de audio perceptual tal como es medida por una llanura espectral, por ejemplo, será cambiada o reducida tan menos como sea posible cuando la función de ventana de análisis seleccionada 111-2 es escogida para efectuar una extensión de ancho de banda tal como dentro de un descodificador de extensión de ancho de banda.
[00039] Además, la pluralidad 111-1 de funciones de ventana de análisis indicada por la información del control de ventana 311 en la salida del controlador de ventana 310 puede comprender diferentes funciones de ventana de análisis que tienen diferentes características de ventana que tienen la misma longitud de ventana como el bloque 101-6 en tiempo. En particular, las diferentes funciones de ventana de análisis pueden ser caracterizadas por diferentes funciones de respuestas de frecuencia (“funciones de transferencia”) obtenidas de un análisis espectral. Las funciones de transferencia a su vez, pueden ser distinguidas por elementos característicos tales como sus anchos de lóbulo principal, niveles de lóbulo lateral o caídas de lóbulo laterales. Las diferentes funciones de ventana de análisis pueden también ser divididas en varios grupos con respecto a sus características de desempeño tales como resolución espectral o intervalo dinámico. Por ejemplo, ventanas de alta resolución y de resolución moderada pueden ser representadas por funciones de ventana rectangulares, triangulares, de coseno, de coseno elevado, de Hamming, de Hann, de Bartlett, de Blackman, gausiana, de Kaiser o de Bartlett-Hann, mientras que las ventanas de baja resolución o intervalo alto dinámico pueden ser representadas por funciones de ventana planas-superiores, de Blackman-Harris o de Tukey. En modalidades alternativas, puede también ser posible usar funciones de ventana que tienen un número diferente de muestras (esto es, ventanas de diferentes longitudes de ventana).
[00040] Específicamente, la aplicación de diferentes funciones de ventanas de análisis 111-1, que pueden pertenecer a diferentes grupos de funciones de ventana de análisis, al bloque 101-6 de muestras de audio mediante el uso del módulo de interconexiones 330, por ejemplo, dará como resultado señales interconectadas 331-1 que tienen diferentes elementos característicos tales como diferentes parámetros de SFM.
[00041] La Figura 4 muestra un diagrama de bloque de una modalidad adicional de un descodificador de función de ancho de banda 400, que puede hacer uso explícitamente de la función de ventana 341-1 tal como es provista, por ejemplo, por el codificador de extensión de ancho de banda 300 mostrado en la Figura 3. El descodificador de extensión de ancho de banda 400 en particular es implementado para ser operativo en una señal de audio codificada 401-1 que comprende, además de una señal de baja frecuencia codificada 401-2 y parámetros de banda superior 401-3, una indicación de ventana 401-1. Aquí, la señal de baja frecuencia codificada 401-2, los parámetros de banda superior 401-3 y la indicación de ventana 401-4 pueden corresponder a la señal de baja frecuencia codificada 121, los parámetros de extensión de ancho de banda 321-2 y la indicación de ventana 341-1 emitida del interfaz de salida 350 del codificador de extensión de ancho de banda 300, respectivamente. En la modalidad mostrada en la Figura 4, el descodificador de extensión de ancho de banda 400 comprende un descodificador central 410, que puede corresponder al descodificador central 410 del descodificador de extensión de ancho de banda 200, el descodificador central 410 estando configurado para descodificar la señal de baja frecuencia codificada 401-2, en donde la señal de baja frecuencia descodificada 411-1 comprende una banda de frecuencia central 411-2. Además, el descodificador de extensión de ancho de banda 400 comprende un módulo de interconexiones 420, que puede corresponder al módulo de interconexiones 320 del descodificador de extensión de ancho de banda 200, en donde el módulo de interconexión 420 comprende un formador de ventanas controlable para seleccionar una función de ventana de análisis de una pluralidad de funciones de ventana de análisis en base a la indicación de ventana 401-4 y para aplicar la sección de ventana de análisis seleccionada a la señal de baja frecuencia descodificada 411-1. De esta manera, una señal interconectada 421 será obtenida en la salida del módulo de interconexiones 420. La señal interconectada 421 puede ser combinada adicionalmente con la señal de baja frecuencia 411-1 por un combinador 430, de tal manera que una señal de salida combinada 431 será emitida del descodificador de extensión de ancho de banda 400. Aquí, la señal interconectada 421, la señal de baja frecuencia descodificada 411-1, el combinador 430 y la señal de salida combinada 431 pueden corresponder a la señal interconectada 421-1, la señal de baja frecuencia descodificada 411-1, el combinador 230 y la señal de salida
15
25
35
45
55
65 E10725483
14-04-2015
combinada 231-1, respectivamente. Como antes, la señal de salida combinada 431 puede ser una señal manipulada por un an6cho de banda extendido.
[00042] Con respecto a las Figuras 3 y 4, puede ser ventajoso que la indicación de ventana 341.1; 401-4 correspondientes a una función de ventana de análisis óptima habiendo sido obtenida con un análisis de señal en el lado del codificador (Figura 3), puedan ser transmitidas dentro de la señal de audio codificada 331; 401-1 y subsecuentemente sean usadas por el módulo de interconexiones 420, de tal manera que una extensión de ancho de banda pueda ser efectuada sin requerir de la señal de análisis adicional en el lado del descodificador (Figura 4).
[00043] La Figura 5 muestra un diagrama de bloques de una modalidad adicional de un codificador de extensión de ancho de banda 500. El codificador de extensión de ancho de banda 500 comprende esencialmente los mismos bloques como el codificador de extensión de ancho de banda 300 de la Figura 3. Por consiguiente, bloques idénticos que tienen implementaciones y/o funciones similares son denotados por los mismos números de referencia. Sin embargo, contrario a la modalidad mostrada en la Figura 3, el codificador de extensión de ancho de banda 500 comprende un comparador 510 que está configurado para comparar la pluralidad de señales interconectadas en 333-1 con una señal de baja frecuencia de referencia derivada de la señal de audio 101-1. El codificador de extensión de ancho de banda 500 puede también comprender opcionalmente un descodificador central 520, que es implementado para proveer una señal de baja frecuencia descodificada 521 al descodificar la señal de baja frecuencia descodificada 121 de la salida del codificador central 120. Para la señal de baja frecuencia de referencia, por ejemplo, la señal de baja frecuencia 101-2 es una versión filtrada en paso de bajos de la señal de audio 101-1 o la señal de baja frecuencia descodificada 521 de la salida del descodificador central 520, pueden ser usadas. Además, el comparador 510 está configurado para proveer una indicación de ventana 511 correspondiente a una función de ventana de análisis seleccionada (óptima) en donde, en este caso, la selección de ventana está basada en la comparación de señales interconectadas 331-1 con la señal de baja frecuencia de referencia 101-2 o 521. Como con la indicación de ventana 541-1 en la modalidad mostrada en la Figura 3, la indicación de ventana 511 puede ser suministrada al calculador de parámetros 320 de tal manera que sólo los parámetros de BWE 321-2 correspondientes a la indicación de ventana 511 serán obtenidos. Los parámetros de BWE 321-2, junto con la señal de baja frecuencia codificada 121, pueden ser suministrados a un interfaz de salida 530. Aquí, la indicación de ventana 511, sin embargo, puede no ser suministrada al interfaz de salida 530. Finalmente, el interfaz de salida 530 está configurado para proveer una señal de audio codificada 531, la señal de audio codificada 531 que no comprende la indicación de ventana 511.
[00044] La Figura 6 muestra un diagrama de bloques de una modalidad adicional de un descodificador de extensión de ancho de banda 600. El descodificador de extensión de ancho de banda 600, en particular, es implementado para ser operativo sobre una señal de audio codificada 601-1 que comprende una señal de baja frecuencia codificada 601-2 y parámetros de banda superiores 601-3. Aquí, la señal de audio codificada 601-1, la señal de baja frecuencia codificada 601-2 y los parámetros de banda superior 601-3 pueden corresponder a la señal de audio codificada 2011, la señal de baja frecuencia codificada 201-2 y los parámetros de banda superior 201-3, respectivamente. Especialmente en la modalidad mostrada en la Figura 6, la señal de audio codificada 601-1, que es alimentada en el descodificador de extensión de ancho de banda 600, no comprende una indicación de ventana. Por esta razón, una señal de análisis con el objetivo de seleccionar una función de ventana apropiada a ser aplicada tal como dentro de un esquema de extensión de ancho de banda es requerido en el lado del descodificador en este caso (Figura 6).
[00045] Como se muestra en la Figura 6, el módulo de interconexiones 220 del descodificador de extensión de ancho de banda 600 comprende un formador de ventana de análisis 610, un convertidor de tiempo/espectro 620, un procesador de dominio de frecuencia 630, un convertidor de frecuencia/tiempo 640, un formador de ventana de síntesis 650, un comparador 660 y un módulo de extensión de ancho de banda 670. Además, el descodificador de extensión de ancho de banda 600 comprende un descodificador central 680 para descodificar la señal de baja frecuencia codificada 601-2, en donde la señal de baja frecuencia descodificada 681-1 comprende una banda de frecuencia central 681-2. Aquí, el descodificador central 680 y la señal de baja frecuencia descodificada 681-1 pueden corresponder al descodificador central 210 y la señal de baja frecuencia descodificada 211-1, respectivamente.
[00046] El formador de ventana de análisis 610 está configurado para aplicar una pluralidad de funciones de ventanas de análisis tales como las funciones de ventana 111-1 en las modalidades de los codificadores de extensión de ancho de banda 300; 500 a la señal de baja frecuencia descodificada 681-1 para obtener una pluralidad 611 de señales de baja frecuencia representadas en ventana. El convertidor de tiempo/espectro 620 está configurado para convertir las señales de baja frecuencia representados en ventana 611 al espectro 621. El procesador de dominio de frecuencia 630 está configurado para procesar los espectros 621 en un dominio de frecuencia para obtener espectros modificados 631. El convertidor de frecuencia/tiempo 640 está configurado para convertir los espectros modificados 631 a señales de dominio de tiempo codificadas 641. El formador de ventanas de síntesis 650 está configurado para aplicar una pluralidad de funciones de ventanas de síntesis a las señales de dominio de tiempo modificadas 641, en donde las funciones de ventanas de síntesis se hacen coincidir con las funciones de ventana de análisis para obtener señales de dominio de tiempo modificadas representadas en ventana
651. En particular, las funciones de ventana de síntesis se pueden hacer coincidir con las funciones de ventanas de análisis, de tal manera que la aplicación de las funciones de ventana de síntesis compensará el efecto de las
15
25
35
45
55
65 E10725483
14-04-2015
funciones de ventanas de análisis correspondientes. El comparador 660 está configurado para determinar una pluralidad de parámetros de comparación en base a una comparación de la pluralidad 651 de señales de dominio de tiempo modificadas representadas en ventana y la señal de baja frecuencia descodificada 681-1, en donde la pluralidad de parámetros de comparación corresponden a la pluralidad 108-1 de funciones de ventanas de análisis habiendo sido aplicadas a las señales de baja frecuencia descodificada 681-1 por el formador de ventanas de análisis 610. El comparador 660 está configurado además para seleccionar una función de ventana de análisis y una función de ventana de síntesis para la cual un parámetro de comparación satisface una condición predeterminada. Aquí, el comparador 660 puede estar configurado especialmente como se discute anteriormente en el contexto de la Figura 7. En la función de ventana de análisis y función de ventana de síntesis seleccionadas pueden constituir una indicación de ventana 661 provista en la salida del comparador 660. Sin embargo, en contraposición a la modalidad del descodificador de extensión de ancho de banda 400 mostrada en la Figura 4, en donde la indicación de ventana 401-4 usada para efectuar una extensión de ancho de banda en el lado del descodificador está contenida en la señal de audio codificada 401-1, la indicación de ventana 661 del descodificador de extensión de ancho de banda 600 mostrado en la Figura 6 no está disponible en la señal de audio codificada 601-1, de tal manera que la indicación de ventana 661 tiene que ser determinada del análisis de la señal de baja frecuencia descodificada 681-1 derivada de la señal de audio codificada 601-1 primero. Además, el módulo de interconexiones 220 del descodificador de extensión de ancho de banda 600 puede comprender un módulo de extensión de ancho de banda 670, que está configurado paras llevar a cabo un algoritmo de extensión de ancho de banda en que el módulo de interconexiones 220 generará una señal interconectada 671 en base a la señal de baja frecuencia descodificada 681-1, la función de ventana de análisis y la función de ventana de síntesis seleccionadas por el comparador 660 y el parámetro de banda superior 601-3. Finalmente, las señales interconectadas 681 y la señal de baja frecuencia descodificada 6811 pueden ser combinadas por un combinador 690 para obtener una señal de salida combinada 691 que tiene un ancho de banda extendido. Aquí, la señal interconectada 681 y la señal de baja frecuencia descodificada 681-1, el combinador 690 y la señal de salida combinada 691 pueden corresponder a la señal interconectada 221-1, la señal de baja frecuencia descodificada 211-1, el combinador 230 y la señal de salida combinada 231-1 del descodificador de extensión de ancho de banda 200 mostrado en la Figura 2.
[00047] En las modalidades de los codificadores/descodificadores de extensión de ancho de banda presentados anteriormente, los comparadores empleados pueden corresponder al comparador 700 como se describe en la Figura
7. Específicamente, el comparador 700 puede ser implementado para recibir, como la pluralidad de señales de entrada 701-1, la pluralidad 331-1 de señales interconectadas de los codificadores de extensión de ancho de banda 300 y 500 de las Figuras 3 y 5 o la pluralidad 651 de señales de dominio de tiempo modificadas representadas en ventana de descodificador de extensión de ancho de banda 600 de la Figura 6 y como la señal de entrada de referencia 701-2, la señal de audio 101-1 denotada por “señal de referencia” en la Figura 3 o la señal de alta frecuencia 101-4 indicada por la línea discontinua de la Figura 3, la señal de baja frecuencia 101-2 denotada por “señal de baja frecuencia de referencia” de la Figura 5 o la señal de baja frecuencia descodificada 521 indicada por la línea discontinua de la Figura 5 o la señal de baja frecuencia descodificada 681-1 del descodificador de extensión de ancho de banda 600 de la Figura 6. El comparador 700 está configurado además para proveer la indicación de ventana 707, que puede corresponder a la indicación de ventana 741-1 del codificador de extensión de ancho de banda 300 de la Figura 3, la indicación de ventana 511 del codificador de extensión de ancho de banda 500 de la Figura 5 o la indicación de ventana 661 del descodificador de extensión de ancho de banda 600 de la Figura 6. Como se discute anteriormente, la comparación puede por ejemplo estar basada en un cálculo de los parámetros de SFM de las señales de entrada. Alternativamente, las señales de entrada 701-1 pueden también ser comparadas con las señales de entrada de referencia 701-2 en base a un cálculo de muestra en muestras de las diferencias en sus valores de señal de audio.
[00048] En las modalidades previas, la selección de ventana es efectuada por un análisis de señal en que una pluralidad de diferentes funciones de ventana de análisis es aplicada a la señal de audio o una señal derivada de la señal de audio, generando una pluralidad de diferentes señales interconectadas (sintetizadas). De esta pluralidad de señales sintetizadas, se selecciona una función de ventana óptima en base a un criterio predefinido en base a una comparación de las señales sintetizadas con la señal de audio original o una señal derivada de la señal de audio. La función de ventana seleccionada es una aplicada a la señal de audio o una señal derivada de la señal de audio tal como dentro de un esquema de extensión de ancho de banda, de tal manera que una señal interconectada (sintetizada) específica será generada. El procedimiento anterior, en particular, corresponde a un bucle cerrado y puede ser denominado como un esquema de “análisis por síntesis”. Alternativamente, la selección de ventana puede también ser efectuada por un análisis directo de una señal de entrada que es una señal de audio o una señal derivada de la señal de audio, en donde la señal de entrada original es analizada/clasificada con respecto a una cierta característica de señal, tal como una medida de la tonalidad. Este esquema de análisis alternativo correspondiente a un bucle abierto será presentado en las siguientes modalidades.
[00049] La Figura 8 muestra un diagrama de bloques de una modalidad adicional de un codificador de extensión de ancho de banda 800. Aquí, la estructura básica del codificador de extensión de ancho de banda 800 corresponde a aquella del codificador de ancho de banda 300 mostrado en la Figura 3. Por consiguiente, bloques idénticos mostrados en las Figuras 3 y 8 pueden ser presentados por los mismos números.
[00050] El analizador de señal 110 del codificador de extensión de ancho de banda 800 comprende un clasificador
15
25
35
45
55
65 E10725483
14-04-2015
de señal 810, en donde el clasificador de señal 810 está configurado para clasificar la señal de audio 101-1 o una señal derivada de la señal de audio tal como la señal de alta frecuencia 101-4 (línea discontinua) para determinar una indicación de ventana 811 correspondiente a una función de ventana de análisis en base a una característica de señal de la señal clasificada. Por ejemplo, el clasificador de señal 810 puede ser implementado para terminar la indicación de ventana 811 al calcular una medida de tonalidad de la señal de audio 101-1 o la señal de alta frecuencia 101-4, en donde la medida de tonalidad puede indicar cómo la energía espectral está distribuida en sus bandas. En el caso de que la energía espectral esté distribuida relativamente de manera uniforme que las bandas, existe una señal más bien no tonal (“señal ruidosa”) en esta banda y la indicación de ventana 811 puede estar relacionada con una primera función de ventana que tiene una primera característica apta para ser aplicada a la señal no tonal, mientras que en el caso en que la energía espectral está relativamente concentrada fuertemente en cierto sentido en esta banda, existe una señal más bien tonal para esta banda y la indicación de ventana 811puede estar relacionada con una segunda función de ventana que tiene una característica apta para ser aplicada a la señal que tiene una segunda característica apta para ser aplicada a la señal tonal. Además, el codificador 800 comprende un controlador de ventana 820 para proveer información de control de ventana 821 en base a la indicación de ventana 811 determinada por el clasificador de señal 810. El calculador de parámetros 830 del codificador 800 comprende un formador de ventanas controlado por el controlador de ventanas 820, en donde el formador de ventana del calculador de parámetros 830 está configurado para aplicar una función de ventana de análisis en base a la información del control de ventana 821 a la señal de alta frecuencia 101-4 para obtener parámetros de BWE
831. El controlador de ventana 820 puede por ejemplo, ser implementado para proveer la información de control de ventana 821 para el calculador de parámetros 820, de tal manera que una primera ventana caracterizada por una función de transferencia por un primer ancho de un lóbulo principal será aplicada por el formador de ventanas del calculador de parámetros 830, cuando la medida de tonalidad determinada está por debajo de un umbral predefinido
o una segunda ventana que es utilizada por una función de transferencia por un segundo ancho de un lóbulo principal será aplicada por el formador de ventanas del calculador de parámetros 830, cuando la medida de tonalidad determinada es igual o mayor del umbral predefinido, en donde el primer ancho del lóbulo principal y la función de transferencia es mayor que el segundo ancho del lóbulo principal de la función de transferencia. En particular, en e contexto de un esquema de extensión de ancho de banda, puede ser ventajoso usar una función de ventana que tiene un lóbulo principal más bien grande de la función de transferencia en caso de una señal no tonal y un lóbulo principal más bien pequeño de la función de transferencia en caso de una señal tonal.
[00051] El codificador central 120 del codificador de extensión de ancho de banda 800 está configurado para codificar la señal de baja frecuencia 101-2 para tener la señal de baja frecuencia codificada 121. Como en la modalidad mostrada en la Figura 3, la señal de baja frecuencia codificada 121, la indicación de ventana 811 y los parámetros de BWE 831 pueden ser suministrados a un interfaz de salida 840 para proveer una señal de audio codificada 841 que comprende la indicación de ventana 811.
[00052] La Figura 9 muestra un diagrama de bloques de una implementación de un clasificador de señal 900 que puede ser usado para el análisis directo de la señal de audio 101-1 en la modalidad de las Figuras 8, 10 y 11. El clasificador de señal 900 puede comprender un medidor de tonalidad 910, un caracterizador de señal 920 y un selector de ventana 930. El medidor de tonalidad 910 puede estar configurado para analizar la señal de audio 101-1 con el fin de determinar una medida de tonalidad 911 de la señal de audio 101-1. El caracterizador de señal 920 puede estar configurado para determinar una característica de señal 921 de la señal de audio 101-1 en base a la medida de tonalidad 911 provista por el medidor de tonalidad 910. En particular, el caracterizador de señal 920 está configurado para determinar si la señal de audio 101-1 corresponde a una señal ruidosa o más bien a una señal tonal. Finalmente, el selector de ventana 930 es implementado para proveer la indicación de ventana 911 en base a la característica de señal 921.
[00053] La Figura 10 muestra un diagrama de bloques de una modalidad adicional del codificador de extensión de ancho de banda 1000, que puede corresponder con el codificador de extensión de ancho de banda 500 mostrado en la Figura 5. Correspondientemente, bloques idénticos en las modalidades mostradas en las Figuras 5 y 10 son denotados por los mismos números. El analizador de señal 110 del codificador de extensión de ancho de banda 1000 comprende un clasificador de señal 1010, en donde el clasificador de señal 1010 está configurado para clasificar la señal de baja frecuencia 101-2 derivado de la señal de audio 101-1 para determinar una indicación de ventana 1011 correspondiente a una función de ventana de análisis de interfaz a una característica de señal de la señal clasificada provista por el clasificador de señal 1010. Además, el codificador 1000 posee un controlador de ventana 1020 para proveer información de control de ventana 1020 para proveer información de control de ventana 1021 en base a la indicación de ventana 1011 determinada por el clasificador de señal 1010. El calculador de parámetros 1030 del codificador de extensión de ancho de banda 1000 comprende un formador de ventanas controlado por el controlador de ventanas 1020, en donde el formador de ventanas del calculador de parámetros 1030 está configurado para aplicar una función de ventana de análisis en base a la información de control de ventana 1021 a la señal de alta frecuencia 101-4 para obtener parámetros de BWE 1031. El codificador de extensión de ancho de banda 1000 puede comprender un codificador central 120 para codificar la señal de baja frecuencia 101-2 para obtener una señal de baja frecuencia codificada 121. Además, el codificador de extensión de ancho de banda 1000 puede también comprender opcionalmente un descodificador central 1050 indicado por el bloque de líneas discontinuas, que está configurado para descodificar la señal de baja frecuencia codificada 121 para obtener una señal de baja frecuencia descodificada 1051 (flechas discontinuas). Correspondientemente, el clasificador de
15
25
35
45
55
65 E10725483
14-04-2015
señal 1010 puede opcionalmente estar configurado para analizar/clasificar la señal de baja frecuencia 1051 con el fin de determinar la indicación de ventana 1011. La señal de baja frecuencia codificada 121 y los parámetros de BWE 1031 pueden ser suministrados adicionalmente a un interfaz de salida 1040, que está configurada para proveer una señal de audio codificada 1041 que no comprende la indicación de ventana 1011. Aquí, la señal de audio codificada 1041 puede corresponder a la señal de audio codificada 531 mostrada en la Figura 5.
[00054] En este caso, la indicación de ventana no está contenida en la señal de audio codificada en el lado del codificador (Figura 10), lo que significa que la indicación de ventana tiene que ser determinada en el lado del descodificador también (Figura 11) como se ilustrará en lo siguiente.
[00055] La Figura 11 muestra un diagrama de bloques de una modalidad adicional de un descodificador de extensión de ancho de banda 1100, que puede corresponder con el descodificador de extensión de ancho de banda 600 mostrado en la Figura 6. Correspondientemente, bloques idénticos en la modalidad de las Figuras 6 y 11 son denotados por los mismos números6. En particular, el descodificador de extensión de ancho de banda 1100 comprende un descodificador central 680 para descodificar la señal de baja frecuencia codificada 101-2 para obtener una señal de baja frecuencia descodificada 681-1. El módulo de interconexiones 220 del descodificador de extensión de ancho de banda 1100 comprende un clasificador de señal 1110 que está configurado para analizar/clasificar la señal de baja frecuencia descodificada 681-1 para determinar una indicación de ventana 1111 correspondiente con una función de ventana de análisis en base a una característica de señal de la señal analizada. Además, el descodificador 1100 comprende un controlador de ventana 1120 para proveer información de control de ventana 1121 en base a la indicación de ventana 1111 determinada por el codificador de señal 1110. Además, el descodificador 1100 puede comprender un módulo de BWE 1130, que puede estar configurado de tal manera que el módulo de interconexiones 1120 generará una señal interconectada 671 en base a la señal de baja frecuencia descodificada 681-1, la función de ventana de análisis en base a la información de control de ventana 1121 y el parámetro de banda superior 601-3. La señal interconectada 671 y la señal de baja frecuencia descodificada 671-1 pueden ser combinadas adicionalmente por un combinador 690 para obtener una señal de salida combinada 691.
[00056] El esquema de análisis por síntesis de las modalidades previas puede también ser usado en el contexto de una implementación de vocoder de fase. Así, la Figura 12 muestra un diagrama de bloques de una modalidad de un procesador de vocoder de fase 1200. El procesador de vocoder de fase 1200 para procesar una señal de audio 1201 puede comprender un formador de ventana de análisis 1210, un convertidor de tiempo/espectro 1220, un procesador de dominio de frecuencia 1230, un convertidor de frecuencia/tiempo 1240, un formador de ventana de síntesis 1250, un comparador 1260 y un sumador o adicionador de superposición 1270. Específicamente, el formador de ventana de análisis 1210 puede estar configurado para aplicar una pluralidad 111-1 de funciones de ventanas de análisis a la señal de audio 1201 o una señal derivada de la señal de audio, de tal manera que la señal de baja frecuencia descodificada 1202 indicada por la flecha de líneas discontinuas, la señal de audio 1201 que tiene un bloque de muestras de audio, el bloque que tiene una duración de tiempo especificada, para obtener una pluralidad 1211 de señales de audio representadas en ventana. El convertidor de tiempo/espectro 1220 puede estar configurado para convertir las señales de audio representadas en ventana 1211 en espectros 1221. El procesador de dominio de frecuencia 1230 puede estar configurado para procesar los espectros 1221 en dominios de frecuencia para obtener espectros modificados 1231. El convertidor de frecuencia/tiempo 1240 puede estar configurado para convertir los espectros modificados 1231 en señales de dominio de tiempo modificadas 1241. El formador de ventanas de síntesis 1250 puede estar configurado para aplicar una pluralidad de funciones de ventana de síntesis a las señales de dominio de tiempo modificadas 1241, en donde las funciones de ventana de síntesis se hacen coincidir con las funciones de ventanas de análisis para obtener señales de dominio de tiempo modificadas representadas en ventana 1251. El comparador 1260 puede estar configurado además para determinar una pluralidad de parámetros de comparación en base a una comparación de la pluralidad de señales de dominio de tiempo modificadas representadas en ventana 1261 y la señal de audio 1201 o una señal derivada de la señal de audio tal como la señal de baja frecuencia descodificada 1202 (línea discontinua), en donde la pluralidad de parámetros de comparación corresponden con la pluralidad de funciones de ventana de análisis y en donde el comparador 1260 está configurado además para seleccionar una función de ventana de análisis y una función de ventana de síntesis para la cual un parámetro de comparación satisface una condición predeterminada. Aquí, se notará que la función de ventana de análisis y la función de ventana de síntesis seleccionadas por el comparador 1260 pueden ser determinadas de manera similar como se ha descrito anteriormente en el contexto de las modalidades previas. En particular, el comparador 1260 puede ser implementado como en la modalidad mostrada en la Figura 7. Subsecuentemente, la función de ventana de análisis y la función de ventana de síntesis seleccionadas pueden ser usadas para una trayectoria de señal que inicia en el formador de ventanas de análisis 1210 y que termina con el formador de ventana de síntesis 1250 antes del comparador 1260 en la cadena de procesamiento como se muestra en la Figura 12, de tal manera que una señal de dominio de tiempo codificada representada en ventana específica (optimizada) 1255 será obtenida en la salida del formador de ventana de síntesis 61250. Finalmente, el adicionador de superposición 1270 puede estar configurado para agregar bloques consecutivos traslapantes de la señal de dominio de tiempo modificada representada en ventana 1255 habiendo sido modificada por la función de ventana de análisis y la función de ventana de síntesis seleccionadas por el comparador 1260 para obtener una señal esparcida temporalmente 1271.
[00057] En particular, la señal esparcida temporalmente 1271 puede ser obtenida al espaciar por bloques
E10725483
14-04-2015
consecutivos traslapantes de la señal de dominio de tiempo modificada representada en la ventana 1255 alejadas adicionalmente entre sí que los bloques correspondientes de la señal de audio original 1201 o la señal de baja frecuencia descodificada 1202. Adicionalmente, el sumador de superposición 1270 que actúa aquí como dispersador de señal puede también estar configurado para esparcir temporalmente la señal de audio 1201 o la señal de baja
5 frecuencia descodificada 1202 en que la altura de la misma no será cambiada, conduciendo a un escenario de “estiramiento de tiempo puro”.
[00058] Alternativamente, el comparador 1260 puede también ser colocado después del sumador de superposición 1270 en la cadena de procesamiento, de tal manera que el último también será incluido en el esquema de análisis
10 por síntesis, que puede ser ventajoso ya que en este caso, los efectos de las diferentes señales de dominio de tiempo modificadas representadas en la ventana 1251 procesadas por el sumador de superposición 1270 también se han tomado en cuenta para una selección de comparación/ventana subsecuente.
[00059] En modalidades alternativas adicionales, el procesador de vocoder de fase 1200 puede también
15 comprender un decimador en forma de, por ejemplo, un simple convertidor de velocidad de muestras, en donde el decimador 15 puede estar configurado para decimar (comprimir) la señal esparcida, de tal manera que una señal decimada en un intervalo de frecuencia objetivo de un algoritmo de extensión de ancho de banda será obtenida.
[00060] En modalidades alternativas adicionales, un procesador de vocoder de fase puede también ser
20 implementado para efectuar un análisis directo de una señal de audio de entrada con el objetivo de seleccionar una función de ventana de análisis óptima apta a la característica de señal de la señal de audio analizada. Particularmente, se encontró que ciertas señales se benefician de usar ventanas de análisis especializadas para el vocoder de fase. Por ejemplo, señales ruidosas son analizadas mejor mediante la aplicación de por ejemplo, una ventana de Tukey, mientras que las señales predominantemente tonales se benefician de un lóbulo principal
25 pequeño de la función de transferencia tal como es provista por ejemplo por la ventana de Bartlett.
[00061] En resumen, se puede ver que el procedimiento de seleccionar la función de ventana óptima puede ser ya sea efectuado solo en el lado del codificador, tal como dentro de los codificadores de extensión de ancho de banda 300 y 800 de las Figuras 3 y 8, en donde la indicación de ventana provista es transmitida al lado del descodificador,
30 tal como el descodificador de extensión de ancho de banda 400 de la Figura 4 ó 3 o tanto en el lado del codificador como el lado del decodificador, tal como con respecto a los codificadores/descodificadores de extensión de ancho de banda 500 y 600 de las Figuras 5 y 6 o los codificadores/descodificadores de extensión de ancho de banda 1000 y 1100 de las Figuras 10 y 11.
35 [00062] En este contexto, puede ser de ventaja que en el último caso, la indicación de ventana no va a ser almacenada como información lateral adicional dentro de la señal de audio codificada, de tal manera que la velocidad de bits para almacenamiento o transmisión de la señal de audio codificada puede ser reducida.
[00063] La Figura 13 ilustra una modalidad de un aparato 1300, que puede ser usado para conmutar entre
40 diferentes ventanas de análisis y síntesis dependiendo de información de control en el contexto de transformada de tiempo-frecuencia aplicables para aplicaciones de vocoder de fase. La corriente de bits entrante 1301-1 puede ser interpretada por un interpretador de corriente de datos, que es implementado para separar la información de control 1301-2 de los datos de audio 1301-3. Además, dependiendo de la información de control 1301-2, una función de ventana de análisis 1311-1 de una pluralidad 1311-2 de ventanas de análisis puede ser aplicada a los datos de
45 audio 1301-3. Aquí, ejemplarmente, la pluralidad 1311-2 de ventanas de análisis comprende cuatro ventanas de análisis diferentes denotadas por los bloques “ventana de análisis 1” a “ventana de análisis 4”, en donde el bloque “ventana de análisis 1” se refiere a la ventana de análisis aplicada 1311-1. La información de control 1301-2, en particular, puede haber sido obtenida mediante un cálculo directo de la característica de señal o un esquema de análisis por síntesis como se describe correspondientemente antes. En el caso de una señal ruidosa, por ejemplo,
50 una ventana de Tukey puede ser escogida, mientras que en el caso de una señal tonal, por ejemplo, una ventana de Bartlett puede ser escogida. La ventana de Tukey, que puede también ser denominada como una ventana cosenoahusada, puede ser representada en imagen como un lóbulo de coseno de ancho (α • 2) N convolucionada con una ventana rectangular de ancho (1.0 – α • 2)N. La ventana de Tukey puede ser definida por
imagen1
en donde la ventana evoluciona de la ventana rectangular a la ventana de Hanning a medida que 15
imagen2
25
35
45
55
65 E10725483
14-04-2015
[00064] En las Ecuaciones (1) y (2), n es un valor entero y N el ancho (en muestras) de las funciones de ventana tiempo-discretas w(n).
[00065] La señal de audio representado en ventana obtenida después de aplicar la ventana de análisis 1311-1 puede ser transformada adicionalmente en un bloque 1320 denotado por “transformación de tiempo-frecuencia” del dominio de tiempo a un dominio de frecuencia. El espectro obtenido puede luego ser procesado en un bloque 1330 denotado por “procesamiento de dominio de frecuencia”. En particular, el bloque 1330 puede comprender un modificador de fase para modificar fases de valores espectrales del espectro. Luego, el espectro procesado puede ser transformado en un bloque 1340 denotado por “transformación de frecuencia-tiempo” de regreso al dominio de tiempo para obtener una señal de dominio de tiempo modificada. Finalmente, dependiendo de la información de control 1301-2, una ventana de síntesis 1351-1 de una pluralidad de ventana de síntesis 1351-2 denotadas por “ventana de síntesis 1” a “ventana de síntesis 4”, en donde la ventana de síntesis 1351-1 compensa el efecto de las ventanas de análisis 1311-1, pueden ser aplicadas a la señal de dominio de tiempo modificada para obtener, después de agregar contribuciones de todas las trayectorias de señal posibles en un bloque 1360 indicado por un símbolo de más, la señal de dominio de tiempo modificada representada en ventana 1361 en la salida del aparato 1300.
[00066] La Figura 14A-14B muestran una vista general de una modalidad de un descodificador de extensión de ancho de banda impulsado por vocoder de fase 1400. En particular, una corriente de audio de datos 1411-1 puede ser separada en una señal de baja frecuencia codificada 1411-2 y datos de HBE/SBR 1411-3. La señal de baja frecuencia codificada 1411-2 puede ser descodificada por un descodificador central 1420 para obtener una señal de baja frecuencia descodificada 1421 que comprende una banda de frecuencia central 1425. La señal de baja frecuencia descodificada 1421 puede por ejemplo representar datos de PCM (modulación de código de impulso) que tiene un tamaño de cuadro de 1024. La señal de baja frecuencia descodificada 1421 es suministrada adicionalmente a una etapa de retardo 1430 para obtener una señal retardada 1431. Subsecuentemente, la señal retardada 1431 es introducida en un banco de análisis de QMF de 32 bandas (filtro de espejo en cuadratura) 1440, que genera, por ejemplo, 32 sub-bandas de frecuencia 1441 de la señal retardada 1431. Los datos de HBE/SBR 1411-3 pueden comprender información de control para controlar un conmutador de interconexiones 1450, en donde el conmutador de interconexión 1450 está configurado para conmutar entre un algoritmo de interconexión de SBR y un algoritmo de interconexión de HBE. En el caso del algoritmo de interconexión de SBR, las sub-bandas de frecuencia 1441 son suministradas a un dispositivo de interconexión de SBR 1460-1 con el fin de obtener datos de QMF interconectados 1461. Los datos de QMF interconectados 1461 presentes en la salida del dispositivo de interconexión de SBR 14601 son suministrados a una herramienta de HBE/SBR 1470-1 que comprende, por ejemplo, una unidad de relleno de ruido 1470-2, una unidad de reconstrucción de armónicas faltantes 1470-3 o una unidad de filtración inversa 1470-4. En particular, la herramienta de HBE/SBR 1470-1 puede implementar técnicas de replicación de banda espectral conocida a ser usadas en los datos de QMF interconectados 1461. El algoritmo de interconexión usado por el dispositivo de interconexión de SBR 1460-1 puede por ejemplo usar un espejo o copia de los datos espectrales dentro del dominio de frecuencia. Además, la herramienta de HBE/SBR 1470-1 es controlada por los datos de HBE/SBR 1411-3. Los datos de QMF interconectados 1461 y la salida 1471 de la herramienta de HBE/SBR 1470-1 son suministrados a un formateador de envolvente 1470. El formateador de envolvente 1470 es implementado para ajustar la envolvente para la interconexión generada, de tal manera que se genera una señal interconectada envolvente-ajustada 1471 que comprende una banda de frecuencia superior. La señal envolvente-ajustada 1471 es suministrada a un banco de síntesis de QMF 1480, que está configurado para combinar los componentes de la banda de frecuencia superior con la señal de audio en el dominio de frecuencia 1441. Finalmente, una señal de audio de síntesis 1481 denotada por “forma de onda” es obtenida.
[00067] En el caso del algoritmo de interconexión de HBE (bloque 1460-2), la señal de baja frecuencia descodificada 1421 puede ser muestreada descendentemente por un muestreador descendente 1490 por un factor por ejemplo de 2 para obtener una versión muestreada descendentemente de la señal de baja frecuencia descodificada 1491. La señal muestreada descendentemente 1491 puede ser procesada adicionalmente en un esquema de procesamiento avanzado de un algoritmo de extensión de ancho de banda armónico utilizando un vocoder de fase.
[00068] Por una parte, se puede emplear un esquema de procesamiento dependiente de señal, haciendo uso de la conmutación entre un algoritmo estándar como se ilustra por una trayectoria de señal 1500 denotada por “no” cuando un evento transitorio no es detectado en un bloque de la señal de baja frecuencia descodificada 1421 por un detector transitorio 1485 y un algoritmo avanzado como se ilustra por una trayectoria de señal 1510 denotada por “sí” que inicia desde una operación de relleno de cero (bloque 1515) cuando se detecta un evento transitorio en el bloque.
[00069] Por otra parte, esencialmente, una conmutación dependiente de señal de características de ventana de análisis dentro de un vocoder de fase en una implementación de transformada de tiempo-frecuencia puede ser efectuada como se ha descrito en detalle anteriormente. En particular, en la Figura 14A, los bloques denominados por 1520; 1530 con fronteras de puntos indican las ventanas que pueden ser alteradas por la señalización. Básicamente, la Figura 14B muestra la aplicación de la modalidad de la Figura 13 dentro de una extensión de ancho de banda impulsada por vocoder de fase.
10
15
20
25
30
35
40
45
50
55 E10725483
14-04-2015
[00070] Aquí, los bloques denotados por “FFT” (Transformada de Fourier Rápida), “adaptación de fase” y “iFFTV (Transformada de Fourier Rápida inversa) pueden corresponder a los bloques 1320, 1330 y 1340 mostrados en la Figura 13, respectivamente. Específicamente, los bloques de procesamiento de FFT y iFFT pueden ser implementados para aplicar una transformada de Fourier de corto tiempo (STFT) o una transformada de Fourier discreta (DFT) y una transformada de Fourier de corto tiempo inversa (iSTFT) o una transformada de Fourier discreta inversa (iDFT) a un bloque de la señal de baja frecuencia descodificada 1421, respectivamente. Además, el descodificador de extensión de ancho de banda 1400 mostrado en la Figura 14A-14B puede también comprender una etapa de muestreo ascendente 1540, una etapa de suma o adición de superposición (OLA) 1550 y una etapa de decimación 1560.
[00071] Se notará que con el concepto anterior, es posible conmutar entre diferentes ventanas en posiciones arbitrarias en la señal de audio.
[00072] Aunque la presente invención ha sido descrita en el contexto de diagramas de bloques, en donde los bloques representan componentes de elementos físicos reales o lógicos, la presente invención puede también ser implementada por un método implementado por computadora. En el último caso, los bloques representan etapas de método correspondientes, en donde estas etapas significan las funcionalidades efectuadas por bloques de elementos físicos lógicos o físicos correspondientes.
[00073] Las modalidades descritas son solamente ilustrativas para los principios de la presente invención. Se comprenderá que modificaciones y variaciones de las disposiciones y los detalles descritos en la presente se harán evidentes para otros experimentados en el arte. Por consiguiente, es el intento estar limitados solamente por el alcance de las reivindicaciones de patente pendientes y no por los detalles específicos presentados a manera de descripción y explicación de las modalidades de la presente.
[00074] Dependiendo de ciertos requerimientos de implementación de los métodos de la invención, los métodos de la invención pueden ser implementados en elementos físicos o en elementos de programación. La implementación puede ser efectuada utilizando un medio de almacenamiento digital, en particular un disco, un DVD o un CD que tiene señales de control que se pueden leer electrónicamente, almacenadas en las mismas que cooperan con sistemas de computadora programables, de tal manera que los métodos de la invención son efectuados. En general, la presente invención puede implementada por consiguiente como un producto de programa de computadora con los códigos de programa almacenados en un portador que se puede leer por la máquina, el código de programa es operativo para efectuar los métodos de la invención cuando el producto de programa de computadora se ejecuta en una computadora. En otras palabras, los métodos de la invención son por consiguiente, un programa de computadora que tiene un código de programa para efectuar por lo menos uno de los métodos de la invención cuando el programa de computadora se ejecuta en una computadora. La señal de audio codificada de la invención puede ser almacenada en cualquier medio de almacenamiento que se puede leer por la máquina, tal como un medio de almacenamiento digital.
[00075] Las ventajas del nuevo procesamiento son que las modalidades mencionadas anteriormente, esto es, aparatos, métodos o programas de computadora, descritos en esta solicitud permiten mejorar la calidad de audio perceptual de aplicaciones de extensión de ancho de banda. En particular, utiliza una conmutación dependiente de señal de características de ventana de análisis tal como dentro de una extensión de ancho de banda impulsada por vocoder de fase.
[00076] El nuevo procesamiento puede también ser usado en otras aplicaciones de vocoder de fase, tal como estiramiento de tiempo puro, siempre que sea benéfico tomar en cuenta características de señal para la elección de una ventana de análisis o síntesis óptima.
[00077] El concepto presentado permite que la extensión de ancho de banda tome en cuenta características de señal para el proceso de interconexión. La decisión para la ventana de análisis más apropiada se puede tomar dentro de un circuito abierto o dentro de un circuito cerrado. Por consiguiente, la calidad de restitución puede ser optimizada y así mejorada adicionalmente.
[00078] La mayoría de aplicaciones prominentes son descodificadores de audio basados en principios de extensión de ancho de banda. Sin embargo, el procesamiento de la invención puede también mejorar aplicaciones de vocoder de fase para producción de música y post-procesamiento de audio.

Claims (11)

15
25
35
45
55
65
REIVINDICACIONES
1. Un codificador de extensión de ancho de banda (100; 300) para codificar una señal de audio (101-1), la señal de audio (101-1) que comprende una señal de baja frecuencia (101-2) que comprende una banda de frecuencia central (101-3) y una señal de alta frecuencia (101-4) que comprende una banda de frecuencia superior (101-5), el codificador (100; 300) comprendiendo:
un analizador de señal (110) para analizar la señal de audio (101-1), la señal de audio (101-1) tiene un bloque (101-6) de muestras de audio, el bloque (101-6) tiene una duración de tiempo especificada, en donde el analizador de señal (110) está configurado para determinar de una pluralidad (111-1) de ventanas de análisis, una ventana de análisis (111-2) a ser usada para efectuar una extensión de ancho de banda en un descodificador de extensión de ancho de banda (400);
un codificador central (120) para codificar la señal de baja frecuencia (101-2) para obtener una señal de baja frecuencia codificada (121; y
un calculador de parámetros (130; 320) para calcular parámetros de extensión de ancho de banda (131; 321-2) a partir de la señal de alta frecuencia (101-4)
el codificador de extensión de ancho de banda (300) comprende además
un controlador de ventana (310) para proveer información de control de ventana (311) que indica
una pluralidad (111-1) de funciones de ventana de análisis, el calculador de parámetros (320) comprende un formador de ventanas controlado por el controlador de ventanas (310), en donde el formador de ventanas está configurado para aplicar la pluralidad (111-1) de funciones de ventana de análisis y una función de ventana de análisis (111-2) a ser seleccionada por un comparador (340) a la señal de alta frecuencia (101-4), el analizador de señal (110) comprende un módulo de interconexiones (330), que está configurado para generar una pluralidad (3311) de señales interconectadas en base a la señal de baja frecuencia (101-2), la información de control de ventana
(311) y parámetros de BWE (321-2), en donde las señales interconectadas (331-1) comprenden bandas de frecuencia superior (331-2) generadas a partir de la banda de frecuencia central (101-3);
un comparador (340) que está configurado para determinar una pluralidad (341-2) de parámetros de comparación en base a una comparación de las señales interconectadas (331-1) y una señal de referencia que es la señal de audio (101-1) o señal (101-4; 101-2) derivada de la señal de audio, en donde la pluralidad (341-2) de parámetros de comparación corresponde a la pluralidad (111-1) de funciones de ventana de análisis, y en donde el comparador (340) está configurado además para proveer una indicación de ventana (341-1)correspondiente a una función de ventana de análisis (111-2) para la cual un parámetro de comparación satisface una condición predeterminada; y
un interfaz de salida (350) para proveer una señal de audio codificada (351), la señal de audio codificada (351) que comprende la indicación de ventana (341-1).
2. Un descodificador de extensión de ancho de banda (200; 600; 1400) para descodificar una señal de audio codificada (201-1; 601-1; 1411-1), la señal de audio codificada (201-1; 601-1; 1411-1) comprende una señal de baja frecuencia codificada (201-2; 601-2; 1411-2) y parámetros de banda superior (201-3; 601-3; 1411-3), el descodificador (200; 600; 1400) comprendiendo:
un descodificador central (210; 680; 1420) para descodificar la señal de baja frecuencia codificada (201-2; 601-2; 1411-2), en donde la señal de baja frecuencia descodificada (211-1; 681-1; 1421) comprende una banda de frecuencia central (211-2; 681-2; 1425);
un módulo de interconexiones (220; 1460-2) que está configurado para generar una señal interconectada (221-1; 671; 1461) en base a la señal de baja frecuencia descodificada (211-1; 681-1; 1421) y los parámetros de banda superior (201-3; 601-3; 1411-3), en donde la señal interconectada (221-1; 671; 1461) comprende una banda de frecuencia superior (221-2) generada a partir de la banda de frecuencia central (211-2; 681-2; 1425); y
un combinador (230; 690; 1480) que está configurado para combinar la señal interconectada (2211; 671; 1461) y la señal de baja frecuencia descodificada (211-1; 681-1; 1421) para obtener una señal de salida combinada (231-1; 691; 1481),
en donde el módulo de interconexiones (220) comprende
un formador de ventanas de análisis (610) para aplicar una pluralidad (111-1) de funciones de ventana de análisis a la señal de baja frecuencia descodificada (681-1) para obtener una pluralidad (611) de señales de baja frecuencia representadas en ventanas;
un convertidor de tiempo/espectro (620) para convertir las señales de baja frecuencia representadas en ventana (611) a espectros (621);
un procesador de dominio de frecuencia (630) para procesar los espectros (621) en un dominio de frecuencia para obtener espectros modificados (631);
un convertidor de frecuencia/tiempo (640) para convertir los espectros modificados (631) en señales de dominio de tiempo modificadas (641);
un formador de ventanas de síntesis (650) para aplicar una pluralidad de funciones de ventana a las señales de dominio de tiempo modificadas (641), en donde las funciones de ventana de síntesis se hacen coincidir con las funciones de ventana de análisis para obtener señales de dominio de tiempo modificadas representadas en ventana (651); y
un comparador (660) que está configurado para determinar una pluralidad de parámetros de comparación en base a una comparación de la pluralidad (651) de señales de dominio de tiempo modificadas
15
25
35
45
55
65
representadas en ventana y la señal de baja frecuencia descodificada (681-1), en donde la pluralidad de parámetros de comparación corresponde a la pluralidad (111-1) de funciones de ventana de análisis, y en donde el comparador
(660) está configurado además para seleccionar una función de ventana de análisis y una función de ventana de síntesis para la cual un parámetro de comparación satisface una condición predeterminada, y en donde el módulo de interconexión (220) está configurado para generar una señal interconectada (671) en base a la señal de baja frecuencia descodificada (681-1), la función de ventana de análisis y la función de ventana de síntesis seleccionadas por el comparador (660) y los parámetros de banda superior (601-3).
3.
El codificador (300) o descodificador (500) de extensión de ancho de banda de acuerdo con una de las reivindicaciones 1 ó 2, en donde el comparador (340; 660; 700) está configurado para calcular una pluralidad (703-1) de parámetros de medida de planitud espectral (SFM) para las señales interconectadas (331-1) o las señales de dominio de tiempo modificadas representadas en ventana (651) y un parámetro de SFM de referencia (703-2) derivado de la señal de audio (101-1) o la señal de baja frecuencia descodificada (681-1) y para determinar la pluralidad (705) de parámetros de comparación en base a una comparación de los parámetros de SFM (703-1) y el parámetro de SFM de referencia (703-2).
4.
El codificador de extensión de ancho de banda (500) según la reivindicación 9, que comprende además:
un descodificador central (520) para descodificar la señal de baja frecuencia codificada (121) para obtener una señal de baja frecuencia descodificada (521).
5.
Un procesador de vocoder de fase (1200) para procesar una señal de audio (1201), el procesador de vocoder de fase comprendiendo:
un formador de ventanas de análisis (1210) para aplicar una pluralidad (111-1) de funciones de ventana de análisis a la señal de audio (1201) o una señal (1202) derivada de la señal de audio, la señal de audio (1201) tiene un bloque (101-6) de muestras de audio, el bloque (101-6) tiene una duración de tiempo especificada, para obtener una pluralidad (1211) de señales de audio representadas en ventana;
un convertidor de tiempo/espectro (1220) para convertir las señales de audio representadas en ventana (1211) en espectros (1221);
un procesador de dominio de frecuencia (1230) para procesar los espectros (1221) en un dominio de frecuencia para obtener los espectros modificados (1231);
un convertidor de frecuencia/tiempo (1240) para convertir los espectros modificados (1231) en señales de dominio de tiempo modificadas (1241);
un formador de ventanas de síntesis (1250) para aplicar una pluralidad de funciones de ventana de síntesis a las señales de dominio de tiempo modificadas (1241), en donde las funciones de ventana de síntesis se hacen coincidir con las funciones de ventana de análisis, para obtener señales de dominio de tiempo modificadas representadas en ventana (1251);
un comparador (1260) que está configurado para determinar una pluralidad de parámetros de comparación en base a una comparación de la pluralidad (1251) de señales de dominio de tiempo modificadas representadas en ventana y la señal de audio (1201) o una señal (1202) derivada de la señal de audio, en donde la pluralidad de parámetros de comparación corresponde a la pluralidad de funciones de ventana de análisis, y en donde el comparador (1260) está configurado además para seleccionar una función de ventana de análisis y una función de venta de síntesis para la cual un parámetro de comparación satisface una condición predeterminada; y
un sumador de superposición (1270) para agregar o sumar bloques traslapantes de una señal de dominio de tiempo modificada representada en ventana (1255) para obtener una señal dispersada temporalmente (1271), en donde el sumador de superposición (1270) está configurado para procesar bloques de la señal de dominio de tiempo modificada representada en ventana (1255) habiendo sido modificada por una función de ventana de análisis y una función de ventana de síntesis seleccionadas por el comparador (1260).
6. Un método (100; 300) para codificar una señal de audio (101-1), la señal de audio (101-1) comprende una señal de baja frecuencia (101-2) que comprende una banda de frecuencia central (101-3) y una señal de alta frecuencia (101-4)que comprende una banda de frecuencia superior (101-5), el método (100; 300) comprendiendo:
analizar (110) la señal de audio (101-1), la señal de audio (101-1) tiene un bloque (101-6) de muestras de audio, el bloque (101-6) tiene una duración de tiempo especificada para determinar, de una pluralidad (111-1)de ventanas de análisis, una ventana de análisis (111-2)a ser usada para efectuar una extensión de ancho de banda en un descodificador de extensión de ancho de banda (400);
codificar (120) la señal de baja frecuencia (102-2) para obtener una señal de baja frecuencia codificada (121); y
calcular (130; 320; 830; 1030) parámetros de extensión de ancho de banda a partir de la señal de alta frecuencia (101-4)
el método comprende además
proveer información de control de ventana (311) que indica una pluralidad (111-1) de funciones de
ventana de análisis, aplicar la pluralidad (111-1) de funciones de ventana de análisis y una función de ventana de análisis (111-2) a ser seleccionada por un comparador (340) a la señal de alta frecuencia (101-4), generar una pluralidad (331-1) de señales interconectadas en base a la señal de baja frecuencia (101-2), la información de control de ventana (311) y parámetros de BWE (321-2), en donde las señales interconectadas (331-1) comprenden bandas de frecuencia superior (331-2) generadas a partir de la banda de frecuencia central (101-3);
15
25
35
45
55
65
determinar una pluralidad (341-2) de parámetros de comparación en base a una comparación de las señales interconectadas (331-1) y una señal de referencia que es la señal de audio (101-1) o señal (101-4; 1012) derivada de la señal de audio, en donde la pluralidad (341-2) de parámetros de comparación corresponde a la pluralidad (111-1) de funciones de ventana de análisis, y proveer una indicación de ventana (341-1) correspondiente a una función de ventana de análisis (111-2) para la cual un parámetro de comparación satisface una condición predeterminada; y
proveer una señal de audio codificada (351), la señal de audio codificada (351) que comprende la indicación de ventana (341-1).
7. Un método (200; 600; 1400) para descodificar una señal de audio codificada (201-1; 601-1; 1411-1), la señal de audio codificada (201-1; 601-1; 1411-1) comprende una señal de baja frecuencia codificada (201-2; 601-2; 1411-2) y parámetros de banda superior (201-3; 601-3; 1411-3), el método (200; 600; 1400) comprendiendo:
descodificar (210; 680; 1429) la señal de baja frecuencia codificada (201-2; 601-2; 1411-2), en donde la señal de baja frecuencia descodificada (211-1; 681-1; 1421) comprende una banda de frecuencia central (211-2; 681-2; 1425);
generar (220; 1460-2) una señal interconectada (221-1; 671; 1461) en base a la señal de baja frecuencia descodificada (211-1; 681-1; 1421) y los parámetros de banda superior (201-3; 601-3; 1411-3), en donde la señal interconectada (221-1; 671; 1461) comprende una banda de frecuencia superior (221-2) generada de la banda de frecuencia central (211-2; 681-2; 1425); y
combinar (230; 690; 1480) la señal interconectada (221-1; 671; 1461) y la señal de baja frecuencia descodificada (211-1; 681-1; 1421) para obtener una señal de salida combinada (231-1; 691; 1481)
en donde generar (220) una señal interconectada comprende
aplicar una pluralidad (111-1) de funciones de ventana de análisis a la señal de baja frecuencia descodificada (681-1) para obtener una pluralidad (611) de señales de baja frecuencia representadas en ventanas;
convertir las señales de baja frecuencia representadas en ventana (611) a espectros (621);
procesar los espectros (621) en un dominio de frecuencia para obtener espectros modificados (631);
convertir los espectros modificados (631) en señales de dominio de tiempo modificadas (641);
aplicar una pluralidad de funciones de ventana a las señales de dominio de tiempo modificadas (641), en donde las funciones de ventana de síntesis se hacen coincidir con las funciones de ventana de análisis para obtener señales de dominio de tiempo modificadas representadas en ventana (651); y
determinar una pluralidad de parámetros de comparación en base a una comparación de la pluralidad (651) de señales de dominio de tiempo modificadas representadas en ventana y la señal de baja frecuencia descodificada (681-1), en donde la pluralidad de parámetros de comparación corresponde a la pluralidad (111-1) de funciones de ventana de análisis, seleccionar una función de ventana de análisis y una función de ventana de síntesis para la cual un parámetro de comparación satisface una condición predeterminada, y generar una señal interconectada (671) en base a la señal de baja frecuencia descodificada (681-1), la función de ventana de análisis y la función de ventana de síntesis seleccionadas por el comparador (660) y los parámetros de banda superior (601-3).
8. Un método para procesar una señal de audio (1201) mediante un procesador de vocoder de fase (1200), el método comprendiendo:
aplicar una pluralidad (111-1) de funciones de ventana de análisis a la señal de audio (1201) o una señal (1202) derivada de la señal de audio, la señal de audio (1201) tiene un bloque (101-6) de muestras de audio, el bloque (101-6) tiene una duración de tiempo especificada, para obtener una pluralidad (1211) de señales de audio representadas en ventana mediante un formador de ventanas de análisis (1210);
convertir las señales de audio representadas en ventana (1211) en espectros (1221) mediante un convertidor de tiempo/espectro (1220);
procesar los espectros (1221) en un dominio de frecuencia para obtener los espectros modificados (1231) mediante un procesador de dominio de frecuencia (1230);
convertir los espectros modificados (1231) en señales de dominio de tiempo modificadas (1241) mediante un convertidor de frecuencia/tiempo (1240);
aplicar una pluralidad de funciones de ventana de síntesis a las señales de dominio de tiempo modificadas (1241), en donde las funciones de ventana de síntesis se hacen coincidir con las funciones de ventana de análisis, para obtener señales de dominio de tiempo modificadas representadas en ventana (1251) mediante un formador de ventanas de síntesis (1250);
determinar una pluralidad de parámetros de comparación en base a una comparación de la pluralidad (1251) de señales de dominio de tiempo modificadas representadas en ventana y la señal de audio (1201)
o una señal (1202) derivada de la señal de audio, en donde la pluralidad de parámetros de comparación corresponde a la pluralidad de funciones de ventana de análisis mediante un comparador (1260), y seleccionar una función de ventana de análisis y una función de venta de síntesis para la cual un parámetro de comparación satisface una condición predeterminada mediante el comparador (1260); y
agregar o sumar bloques traslapantes de una señal de dominio de tiempo modificada representada en ventana (1255) para obtener una señal dispersada temporalmente (1271) mediante un sumador de superposición (1270), y procesar bloques de la señal de dominio de tiempo modificada representada en ventana (1255) habiendo sido modificada por una función de ventana de análisis y una función de ventana de síntesis seleccionadas por el
15
25
35
45
55
65
comparador (1260) mediante el sumador de superposición (1270).
9. Un codificador de extensión de ancho de banda (500) para codificar una señal de audio (101-1), la señal de audio (101-1) que comprende una señal de baja frecuencia (101-2) que comprende una banda de frecuencia central (101-3) y una señal de alta frecuencia (101-4) que comprende una banda de frecuencia superior (101-5), el codificador (500) comprendiendo:
un analizador de señal (110) para analizar la señal de audio (101-1), la señal de audio (101-1) tiene un bloque (101-6) de muestras de audio, el bloque (101-6) tiene una duración de tiempo especificada, en donde el analizador de señal (110) está configurado para determinar de una pluralidad (111-1) de ventanas de análisis, una ventana de análisis (111-2) a ser usada para efectuar una extensión de ancho de banda en un descodificador de extensión de ancho de banda (200);
un codificador central (120) para codificar la señal de baja frecuencia (101-2) para obtener una señal de baja frecuencia codificada (121); y
un calculador de parámetros (320) para calcular parámetros de extensión de ancho de banda (3212) a partir de la señal de alta frecuencia (101-4)
el codificador de extensión de ancho de banda (300) comprende además
un controlador de ventana (310) para proveer información de control de ventana (311) que indica
una pluralidad (111-1) de funciones de ventana de análisis, el calculador de parámetros (320) comprende un formador de ventanas controlado por el controlador de ventanas (310), en donde el formador de ventanas está configurado para aplicar la pluralidad (111-1) de funciones de ventana de análisis y una función de ventana de análisis (111-2) a ser seleccionada por un comparador (510) a la señal de alta frecuencia (101-4), el analizador de señal (110) comprende un módulo de interconexiones (330), que está configurado para generar una pluralidad (3311) de señales interconectadas en base a la señal de baja frecuencia (101-2), la información de control de ventana
(311) y parámetros de extensión de ancho de banda (321-1), en donde las señales interconectadas (331-1) comprenden bandas de frecuencia superior (331-2) generadas a partir de la banda de frecuencia central (101-3), y en donde el formador de ventana está configurado para aplicar la pluralidad (111-1) de funciones de ventana de análisis a la señal de baja frecuencia (101-2);
un comparador (510) que está configurado para determinar una pluralidad de parámetros de comparación en base a una comparación de las señales interconectadas (331-1) y una señal de baja frecuencia de referencia (101-2) derivada de la señal de audio, en donde la pluralidad de parámetros de comparación corresponde a la pluralidad (111-1) de funciones de ventana de análisis, y en donde el comparador (510) está configurado además para proveer una indicación de ventana (511) correspondiente a una función de ventana de análisis para la cual un parámetro de comparación satisface una condición predeterminada; y
un interfaz de salida (530) para proveer una señal de audio codificada, la señal de audio codificada
(531) que no comprende la indicación de ventana (511).
10. Un método (500) para codificar una señal de audio (101-1), la señal de audio (101-1) que comprende una señal de baja frecuencia (101-2) que comprende una banda de frecuencia central (101-3) y una señal de alta frecuencia (101-4) que comprende una banda de frecuencia superior (101-5), el método (500) comprendiendo:
analizar (110), mediante un analizador de señal, la señal de audio (101-1), la señal de audio (1011) tiene un bloque (101-6) de muestras de audio, el bloque (101-6) tiene una duración de tiempo especificada, para determinar, de una pluralidad (111-1) de ventanas de análisis, una ventana de análisis (111-2) a ser usada para efectuar una extensión de ancho de banda en un descodificador de extensión de ancho de banda (200);
codificar (120) la señal de baja frecuencia (101-2) para obtener una señal de baja frecuencia codificada (121); y
calcular (320), mediante un calculador de parámetros, parámetros de extensión de ancho de banda a partir de la señal de alta frecuencia (101-4)
proveer información de control de ventana (311) que indica una pluralidad (111-1) de funciones de ventana de análisis, el calculador de parámetros (320) comprende un formador de ventanas controlado por el controlador de ventanas (310), en donde el formador de ventanas está configurado para aplicar la pluralidad (111-1) de funciones de ventana de análisis y una función de ventana de análisis (111-2) a ser seleccionada por un comparador (510) a la señal de alta frecuencia (101-4), el analizador de señal (110) comprende un módulo de interconexiones (330), que está configurado para generar una pluralidad (331-1) de señales interconectadas en base a la señal de baja frecuencia (101-2), la información de control de ventana (311) y parámetros de extensión de ancho de banda (321-1), en donde las señales interconectadas (331-1) comprenden bandas de frecuencia superior (331-2) generadas a partir de la banda de frecuencia central (101-3), y en donde el módulo de interconexiones (330) comprende un formador de ventana controlador por el controlador de ventanas (310), y en donde el formador de ventana está configurado para aplicar la pluralidad (111-1) de funciones de ventana de análisis a la señal de baja frecuencia (101-2);
determinar, mediante un comparador, una pluralidad de parámetros de comparación en base a una comparación de las señales interconectadas (331-1) y una señal de baja frecuencia de referencia (101-2) derivada de la señal de audio, en donde la pluralidad de parámetros de comparación corresponde a la pluralidad (111-1) de funciones de ventana de análisis, y en donde el comparador (510) está configurado además para proveer una indicación de ventana (511) correspondiente a una función de ventana de análisis para la cual un parámetro de comparación satisface una condición predeterminada; y
proveer, mediante un interfaz de salida, una señal de audio codificada, la señal de audio codificada
(531) que no comprende la indicación de ventana (511).
11. Un programa de computadora que tiene un código de programa para implementar cualquiera de los métodos según una de las reivindicaciones 6 a 8, o 10, cuando el programa de computadora se ejecuta en una computadora.
ES10725483.1T 2009-06-29 2010-06-24 Codificador de extensión de ancho de banda, descodificador de extensión de ancho de banda y vocoder de fase, así como métodos correspondientes y programa de computadora Active ES2534944T3 (es)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US22144209P 2009-06-29 2009-06-29
US221442P 2009-06-29
EP10153530 2010-02-12
EP10153530A EP2273493B1 (en) 2009-06-29 2010-02-12 Bandwidth extension encoding and decoding
PCT/EP2010/059025 WO2011000780A1 (en) 2009-06-29 2010-06-24 Bandwidth extension encoder, bandwidth extension decoder and phase vocoder

Publications (1)

Publication Number Publication Date
ES2534944T3 true ES2534944T3 (es) 2015-04-30

Family

ID=42537947

Family Applications (2)

Application Number Title Priority Date Filing Date
ES10153530T Active ES2400661T3 (es) 2009-06-29 2010-02-12 Codificación y decodificación de extensión de ancho de banda
ES10725483.1T Active ES2534944T3 (es) 2009-06-29 2010-06-24 Codificador de extensión de ancho de banda, descodificador de extensión de ancho de banda y vocoder de fase, así como métodos correspondientes y programa de computadora

Family Applications Before (1)

Application Number Title Priority Date Filing Date
ES10153530T Active ES2400661T3 (es) 2009-06-29 2010-02-12 Codificación y decodificación de extensión de ancho de banda

Country Status (14)

Country Link
US (1) US8606586B2 (es)
EP (2) EP2273493B1 (es)
JP (1) JP5329714B2 (es)
KR (1) KR101425157B1 (es)
CN (1) CN102473414B (es)
AU (1) AU2010268160B2 (es)
BR (1) BRPI1010165B1 (es)
CA (2) CA2856587C (es)
ES (2) ES2400661T3 (es)
HK (2) HK1153035A1 (es)
MX (1) MX2011013610A (es)
PL (2) PL2273493T3 (es)
RU (1) RU2563164C2 (es)
WO (1) WO2011000780A1 (es)

Families Citing this family (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
HUE028738T2 (en) 2010-06-09 2017-01-30 Panasonic Ip Corp America Bandwidth Extension Procedure, Bandwidth Extension Device, Program, Integrated Circuit, and Audio Decoder
KR101826331B1 (ko) * 2010-09-15 2018-03-22 삼성전자주식회사 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법
JP5704397B2 (ja) * 2011-03-31 2015-04-22 ソニー株式会社 符号化装置および方法、並びにプログラム
US9177570B2 (en) * 2011-04-15 2015-11-03 St-Ericsson Sa Time scaling of audio frames to adapt audio processing to communications network timing
US9697840B2 (en) * 2011-11-30 2017-07-04 Dolby International Ab Enhanced chroma extraction from an audio codec
TWI591620B (zh) * 2012-03-21 2017-07-11 三星電子股份有限公司 產生高頻雜訊的方法
PL2831875T3 (pl) * 2012-03-29 2016-05-31 Ericsson Telefon Ab L M Rozszerzenie pasma harmonicznego sygnału audio
CN110706715B (zh) * 2012-03-29 2022-05-24 华为技术有限公司 信号编码和解码的方法和设备
EP2709106A1 (en) * 2012-09-17 2014-03-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating a bandwidth extended signal from a bandwidth limited audio signal
EP2720222A1 (en) 2012-10-10 2014-04-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for efficient synthesis of sinusoids and sweeps by employing spectral patterns
SG11201505912QA (en) 2013-01-29 2015-08-28 Fraunhofer Ges Forschung Audio encoder, audio decoder, method for providing an encoded audio information, method for providing a decoded audio information, computer program and encoded representation using a signal-adaptive bandwidth extension
RU2608447C1 (ru) 2013-01-29 2017-01-18 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ для генерирования расширенного по частоте сигнала, используя временное сглаживание поддиапазонов
MX345622B (es) * 2013-01-29 2017-02-08 Fraunhofer Ges Forschung Decodificador para generar una señal de audio mejorada en frecuencia, método de decodificación, codificador para generar una señal codificada y metodo de codificación utilizando informacion secundaria de selección compacta.
US9319510B2 (en) * 2013-02-15 2016-04-19 Qualcomm Incorporated Personalized bandwidth extension
EP2830064A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding and encoding an audio signal using adaptive spectral tile selection
JP6396459B2 (ja) * 2013-10-31 2018-09-26 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 周波数領域における時間的予備整形雑音の挿入によるオーディオ帯域幅拡張
EP2881943A1 (en) 2013-12-09 2015-06-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding an encoded audio signal with low computational resources
CN103714822B (zh) * 2013-12-27 2017-01-11 广州华多网络科技有限公司 基于silk编解码器的子带编解码方法及装置
CN111312278B (zh) 2014-03-03 2023-08-15 三星电子株式会社 用于带宽扩展的高频解码的方法及设备
KR102386736B1 (ko) * 2014-03-03 2022-04-14 삼성전자주식회사 대역폭 확장을 위한 고주파 복호화 방법 및 장치
SG10201808274UA (en) * 2014-03-24 2018-10-30 Samsung Electronics Co Ltd High-band encoding method and device, and high-band decoding method and device
CN111710342B (zh) * 2014-03-31 2024-04-16 弗朗霍弗应用研究促进协会 编码装置、解码装置、编码方法、解码方法及程序
KR102191506B1 (ko) * 2014-05-14 2020-12-16 삼성전자주식회사 통신 시스템에서 송신 신호 처리 장치 및 방법
CN104007977A (zh) * 2014-06-09 2014-08-27 威盛电子股份有限公司 电子装置及音频播放方法
EP2980795A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor
EP2980794A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
JP2016038435A (ja) * 2014-08-06 2016-03-22 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
CN104269173B (zh) * 2014-09-30 2018-03-13 武汉大学深圳研究院 切换模式的音频带宽扩展装置与方法
US10117247B2 (en) * 2015-03-13 2018-10-30 Futurewei Technologies, Inc. Windowing methods for efficient channel aggregation and deaggregation
KR101642112B1 (ko) 2015-10-29 2016-07-22 주식회사 님버스 이동통신망에서 실시간 멀티미디어를 송수신하기 위한 모뎀 본딩 시스템 및 방법
US10504530B2 (en) 2015-11-03 2019-12-10 Dolby Laboratories Licensing Corporation Switching between transforms
KR101688647B1 (ko) 2016-04-04 2016-12-22 주식회사 님버스 이동통신망에서 실시간 저지연 전송을 위한 모뎀 본딩 시스템 및 방법
RU169931U1 (ru) * 2016-11-02 2017-04-06 Акционерное Общество "Объединенные Цифровые Сети" Устройство сжатия аудиосигнала для передачи по каналам распространения данных
CN110062945B (zh) * 2016-12-02 2023-05-23 迪拉克研究公司 音频输入信号的处理
BR112020021832A2 (pt) 2018-04-25 2021-02-23 Dolby International Ab integração de técnicas de reconstrução de alta frequência
WO2019210068A1 (en) 2018-04-25 2019-10-31 Dolby Laboratories Licensing Corporation Integration of high frequency reconstruction techniques with reduced post-processing delay
WO2020094263A1 (en) * 2018-11-05 2020-05-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and audio signal processor, for providing a processed audio signal representation, audio decoder, audio encoder, methods and computer programs
CN113593586A (zh) * 2020-04-15 2021-11-02 华为技术有限公司 音频信号编码方法、解码方法、编码设备以及解码设备

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5455888A (en) 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
US5848391A (en) * 1996-07-11 1998-12-08 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Method subband of coding and decoding audio signals using variable length windows
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
DE10084385T1 (de) * 1999-08-31 2002-08-01 Mitsubishi Paper Mills Ltd Elektronenannehmende Verbindung und wärmeempfindliches Aufzeichnungsmaterial
US6978236B1 (en) * 1999-10-01 2005-12-20 Coding Technologies Ab Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching
US6704711B2 (en) * 2000-01-28 2004-03-09 Telefonaktiebolaget Lm Ericsson (Publ) System and method for modifying speech signals
US6636830B1 (en) * 2000-11-22 2003-10-21 Vialta Inc. System and method for noise reduction using bi-orthogonal modified discrete cosine transform
US20020128839A1 (en) * 2001-01-12 2002-09-12 Ulf Lindgren Speech bandwidth extension
US6895375B2 (en) 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech
US7389226B2 (en) * 2002-10-29 2008-06-17 Ntt Docomo, Inc. Optimized windows and methods therefore for gradient-descent based window optimization for linear prediction analysis in the ITU-T G.723.1 speech coding standard
JP4431568B2 (ja) * 2003-02-11 2010-03-17 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音声符号化
DE602004030594D1 (de) * 2003-10-07 2011-01-27 Panasonic Corp Verfahren zur entscheidung der zeitgrenze zur codierung der spektro-hülle und frequenzauflösung
WO2005036806A2 (en) 2003-10-08 2005-04-21 Unisys Corporation Scalable partition memory mapping system
DE102004009954B4 (de) * 2004-03-01 2005-12-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Verarbeiten eines Multikanalsignals
US7953605B2 (en) * 2005-10-07 2011-05-31 Deepen Sinha Method and apparatus for audio encoding and decoding using wideband psychoacoustic modeling and bandwidth extension
JP2007304258A (ja) * 2006-05-10 2007-11-22 Matsushita Electric Ind Co Ltd オーディオ信号符号化およびその復号化装置、方法ならびにプログラム
US8463412B2 (en) * 2008-08-21 2013-06-11 Motorola Mobility Llc Method and apparatus to facilitate determining signal bounding frequencies

Also Published As

Publication number Publication date
US8606586B2 (en) 2013-12-10
AU2010268160B2 (en) 2014-03-06
HK1170331A1 (en) 2013-02-22
PL2449554T3 (pl) 2015-08-31
CA2856587C (en) 2016-09-13
MX2011013610A (es) 2012-03-26
PL2273493T3 (pl) 2013-07-31
EP2273493A1 (en) 2011-01-12
CA2766573C (en) 2015-06-23
KR20120031957A (ko) 2012-04-04
EP2449554A1 (en) 2012-05-09
CN102473414A (zh) 2012-05-23
CA2766573A1 (en) 2011-01-06
ES2400661T3 (es) 2013-04-11
JP2012531632A (ja) 2012-12-10
BRPI1010165A2 (pt) 2016-03-29
JP5329714B2 (ja) 2013-10-30
CN102473414B (zh) 2013-11-06
EP2273493B1 (en) 2012-12-19
KR101425157B1 (ko) 2014-08-01
US20120158409A1 (en) 2012-06-21
CA2856587A1 (en) 2011-01-06
EP2449554B1 (en) 2015-03-25
BRPI1010165B1 (pt) 2021-01-05
RU2012102411A (ru) 2013-08-20
AU2010268160A1 (en) 2012-02-02
WO2011000780A1 (en) 2011-01-06
RU2563164C2 (ru) 2015-09-20
HK1153035A1 (en) 2012-03-16

Similar Documents

Publication Publication Date Title
ES2534944T3 (es) Codificador de extensión de ancho de banda, descodificador de extensión de ancho de banda y vocoder de fase, así como métodos correspondientes y programa de computadora
RU2413191C2 (ru) Системы, способы и устройства для устраняющей разреженность фильтрации
ES2593072T3 (es) Aparato y método para la reproducción de una señal de audio, aparato y método para la generación de una señal de audio codificada y programa de ordenador correspondiente
RU2421828C2 (ru) Системы и способы для включения идентификатора в пакет, ассоциативно связанный с речевым сигналом
ES2439549T3 (es) Un aparato y un método para decodificar una señal de audio codificada
ES2592416T3 (es) Esquema de codificación/decodificación de audio que tiene una derivación conmutable
CA2936987C (en) Harmonic bandwidth extension of audio signals
KR20150051301A (ko) 광대역 신호 생성방법 및 장치와 이를 채용하는 기기
AU2014201331B2 (en) Bandwidth extension encoder, bandwidth extension decoder and phase vocoder