MX2012010314A - Dispositivo y metodo para respuesta de magnitud mejorada y alineacion temporaria en un metodo de extension de ancho de banda basado en un codificador de fase operado por voz para señales de audio. - Google Patents

Dispositivo y metodo para respuesta de magnitud mejorada y alineacion temporaria en un metodo de extension de ancho de banda basado en un codificador de fase operado por voz para señales de audio.

Info

Publication number
MX2012010314A
MX2012010314A MX2012010314A MX2012010314A MX2012010314A MX 2012010314 A MX2012010314 A MX 2012010314A MX 2012010314 A MX2012010314 A MX 2012010314A MX 2012010314 A MX2012010314 A MX 2012010314A MX 2012010314 A MX2012010314 A MX 2012010314A
Authority
MX
Mexico
Prior art keywords
phase
patch
signal
block
subband
Prior art date
Application number
MX2012010314A
Other languages
English (en)
Inventor
Sascha Disch
Lars Villemoes
Frederik Nagel
Per Ekstrand
Stephan Wilde
Original Assignee
Fraunhofer Ges Forschung
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Ges Forschung filed Critical Fraunhofer Ges Forschung
Publication of MX2012010314A publication Critical patent/MX2012010314A/es

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering

Abstract

Un aparato para generar una señal extendida de ancho de banda de audio desde una señal de entrada, que comprende un generador de parche para generar la señal o señales de parche desde la señal de entrada, donde el generador de parche se configura para realizar una expansión de tiempo (1800, 1808) de señales de sub-banda desde un banco de filtro de análisis, y donde el generador de parche además comprende un ajustador de fase (1806) para ajustar fases de señales de sub-banda utilizando una corrección de fase que depende de un banco de filtro-canal.

Description

DISPOSITIVO Y MÉTODO PARA RESPUESTA DE MAGNITUD MEJORADA Y ALINEACIÓN TEMPORARIA EN UN MÉTODO DE EXTENSIÓN DE ANCHO DE BANDA BASADO EN UN CODIFICADOR DE FASE OPERADO POR VOZ PARA SEÑALES DE AUDIO Memoria Descriptiva Por medio de los codificadores de fase operados por voz [1-3] u otras técnicas para algoritmos de modificación de tiempo o tono como el algoritmo de Superposición y Suma Sincronizado (Synchronized Overlap-Add (SOLA, por su sigla en inglés)), las señales de audio pueden por ejemplo modificarse con respecto a la proporción de sonido pregrabado, preservando el tono original. Además, estos métodos pueden aplicarse para llevar a cabo una transposición de la señal manteniendo a la vez la duración original del sonido pregrabado. El último puede lograrse expandiendo la señal de audio con un factor entero y subsecuente ajuste de la proporción de sonido pregrabado de la señal de audio expandida aplicando el mismo factor. Para una señal en tiempo discreto, el último corresponde a un submuestreo de la señal de audio con tiempo expandido sobre el factor de expansión dado que la proporción de muestreo permanece sin cambios.
Los métodos de extensión de ancho de banda basados en codificadores de voz de fase como [4-5] generan, dependiendo del ancho de banda total requerido, una cantidad variable de sub bandas limitadas en banda (parches) sumadas para formar una señal que exhiba el ancho de banda total necesario.
La alineación temporaria de los parches individuales que resultan de la aplicación del codificador de fase operado por voz resulta ser un desafío específico. En general, estos parches poseen retardos de tiempo de diferentes duraciones. Esto se debe a que la ventana de síntesis del codificador de fase operado por voz posee un tamaño de salto fijo que depende del factor de expansión, y por lo tanto cada parche individual posee un retardo de duración predefinido. Se produce así un retardo de tiempo selectivo en la frecuencia de la señal de suma extendida de ancho de banda. Como este retardo selectivo en frecuencia afecta las propiedades de coherencia vertical de la señal total, tiene un impacto negativo en la respuesta transitoria del método de extensión de ancho de banda.
Otro desafío se presenta al considerar los parches individuales, donde la falta de coherencia de frecuencia cruzada posee un impacto negativo de la respuesta de magnitud del codificador de fase operado por voz.
El objetivo de la presente invención consiste en proveer un concepto para generar una señal de audio extendida de ancho de banda, que provee una mejor calidad de audio.
El objetivo se logra utilizando un aparato para generar una señal extendida de ancho de banda de audio de acuerdo con la reivindicación 1 , un método para generar una señal extendida de ancho de banda de audio de acuerdo con la reivindicación 19 o un programa de computación de acuerdo con la reivindicación Un aparato para generar una señal extendida de ancho de banda de audio desde una señal de entrada comprende un generador de parche para generar una o más señales de parche desde la señal de entrada. El generador de parche se configura para realizar una expansión de tiempo de señales de sub-banda desde un banco de filtro de análisis y comprende un ajustador de fase para ajustar fases de las señales de sub-banda usando una corrección de fase que depende de un banco de filtro-canal.
Otra ventaja de la presente invención consiste en que se evitan los impactos negativos en las respuestas de magnitud normalmente introducidos por estructuras tipo codificador de fase operado por voz para extensiones de ancho de banda u otras estructuras para extensiones de ancho de banda.
Otra ventaja de la presente invención consiste en que se obtiene una repuesta de magnitud optimizada de los parches individuales, que, por ejemplo, son creados por medio de codificadores de fase operados por voz o estructuras del tipo codificadores de fase operados por voz. En otra forma de realización, se puede tratar también la alineación temporaria de los parches individuales, pero la corrección de fase dentro de un parche, es decir entre las señales de sub-banda procesadas usando uno y el mismo factor de transposición, puede aplicarse con o sin corrección de tiempo válida para todas las señales de sub-banda dentro de un parche en conjunto.
Una forma de realización de la presente invención consiste en un método nuevo para la optimización de la repuesta de magnitud y alineación temporaria de los parches individuales creados por codificadores de fase operados por voz. Este método básicamente consiste en opciones de correcciones de fase para las sub-bandas transpuestas en una implementación de banco de filtro modulado complejo y en la introducción de retardos adicionales de tiempo en los parches individuales que resultan de los codificadores de fase operados por voz con diferentes factores de transposición. La duración de tiempo del retardo adicional introducido a un parche específico depende del factor de transposición aplicado y puede determinarse en forma teórica. En forma alternativa, el retardo se ajusta de modo que, al aplicar una señal de entrada con impulso Dirac, el centro de gravedad temporario del impulso Dirac transpuesto en cada parche se alinea en la misma posición temporaria en una representación de espectrograma.
Existen muchos métodos que llevan a cabo transposiciones de señales de audio por un factor de transposición individual como el codificador de fase operado por voz. Si se deben combinar varias señales transpuestas, se puede corregir los retardos de tiempo entre las diferentes señales de señal de salidas. Una alineación vertical correcta entre los parches resulta útil pero no necesariamente parte de estos algoritmos. Esto no resulta nocivo en la medida que no se consideren transientes. El problema de la correcta alineación de los diferentes parches no es tenido en cuenta en la literatura de vanguardia.
La transposición de espectros por medio de codificadores de fase operados por voz no garantiza preservar la coherencia vertical de transientes. Además, los ecos posteriores emergen en las bandas de alta frecuencia debido al método de superposición y suma utilizado en el codificador de fase operado por voz como los diferentes retardos de tiempo de los parches individuales que contribuyen a la señal de suma. Por lo tanto es deseable alinear los parches de modo que el post procesamiento paramétrico de la extensión de ancho de banda pueda explotar una mejor alineación vertical entre los parches. Por lo tanto se debe minimizar todo el período de vigencia que cubre el pre y post eco.
Un codificador de fase operado por voz se implementa típicamente por medio de una modificación de fase multiplicativa de entero de muestras de sub-bandas en el domino de un par de bancos de filtro modulados complejos de síntesis/análisis. Este procedimiento no garantiza en forma automática la adecuada alineación de las fases de las contribuciones de señal de salidas resultantes de casa sub-banda de síntesis, y se obtiene así una repuesta de magnitud del codificador de fase operado por voz no plana. Este artefacto da por resultado una amplitud con variación de tiempo de un barrido senoidal lento transpuesto. En términos de calidad de audio para audio general, el inconveniente radica en la coloración de la señal de señal de salida por medio de efectos de modulación.
Las formas de realización preferidas de la presente invención se analizan a continuación con respecto a los dibujos adjuntos, donde: La Fig. 1 ilustra un espectograma de impulso DIRAC con filtro pasa bajos; La Fig. 2 ilustra un espectrograma de transposición de vanguardia de impulso Dirac con los factores de transposición 2, 3, y 4; La Fig. 3 ilustra una transposición alineada de espectogarma de tiempo o impulso Dirac con factores de transposición 2, 3, y 4; La Fig. 4 ilustra una transposición alineada de espectogarma de tiempo de impulso Dirac con factores de transposición 2, 3, y 4 y ajuste de retardo; La Fig. 5 ilustra un diagrama de tiempo de la transposición de barrido senoidal lento con fase pobremente ajustada; La Fig. 6 ilustra una transposición de barrido senoidal lento con mejor corrección de fase; La Fig. 7 ¡lustra una transposición de barrido senoidal lento con otra mejor corrección de fase; La Fig. 8 ilustra un sistema de extensión de ancho de banda de acuerdo con una forma de realización; La Fig. 9 ilustra otra forma de realización de un ejemplo de implementación de procesamiento para procesar una señal de sub-banda individual; La Fig. 10 ilustra una forma de realización donde se muestra el procesamiento de sub-banda no lineal y subsecuente ajuste de la envolvente dentro de un dominio de sub-banda; La Fig. 11A-B ilustra otra forma de realización del el procesamiento de sub- banda no lineal de la Fig. 10; La Fig. 12 ilustra diferentes implementaciones para seleccionar la corrección de fase que depende del canal de sub-banda; La Fig. 13 ilustra una implementación del ajustador de fase; La Fig. 14a ¡lustra detalles de implementación para un filtro de banco de análisis que permite una corrección de fase independiente del factor de transposición; y La Fig. 14b ilustra detalles de implementación para un filtro de banco de análisis que requiere una corrección de fase que dependa del factor de transposición.
La presente solicitud provee diferentes aspectos de aparatos, métodos o programas de computación para procesar señales de audio en el contexto de extensión de ancho de banda y en el contexto de otras aplicaciones de audio, que no se relacionan con la extensión de ancho de banda. Los rasgos de los aspectos individuales de las siguientes reivindicaciones podrán ser combinarse en forma parcial o total, pero podrá ser utilizadas además en forma separada entre sí, ya que los aspectos individuales ya proveen ventajas con respecto a la calidad perceptual, complejidad computacional y recursos de procesador/memoria al implementarse en un sistema de computación o micro procesador.
Las formas de realización emplean una alineación de tiempo de los diferentes parches armónicos creados por los codificadores de fase operados por voz. La alineación de tiempo se realiza teniendo en cuenta el centro de gravedad de un impulso Dirac transpuesto. La siguiente Fig. 1 muestra el espectrograma de un impulse Dirac con filtro paso bajo que exhibe un ancho de banda limitado. Esta señal sirve como señal de entrada para la transposición.
Al transponer este Impulso Dirac por medio de un codificador de fase operado por voz, los retardos selectivos de frecuencia se introducen en las sub bandas resultantes. La duración de tiempo de los mismos depende del factor de transposición usado. En consecuencia, la transposición de un Impulso Dirac con el factor de transposición 2, 3 y 4 se muestra como ejemplo en la Fig. 2.
Los retardos selectivos de frecuencia se compensan al insertar un retardo de tiempo individual adicional en cada "patch", es decir en cada parche resultante. De este modo, cada sub banda individual se alinea de modo que, el centro de gravedad del impulso Dirac en cada parche se encuentra en la misma posición temporal del centro de gravedad del impulso Dirac en el parche más alto. La alineación se realiza teniendo en cuenta el parche más alto ya que usualmente posee el retardo de tiempo más alto. Al aplicar la compensación de retardo de la invención, el centro de gravedad del impulso Dirac se encuentra en la misma posición temporal para todos los parches dentro de un espectrograma. Dicha representación de las señales resultantes se verían como las de la Fig. 3. Se minimiza así toda la expansión de energía de transientes.
Finalmente, es necesario compensar en forma adicional el retardo de tiempo remanente entre las regiones alta frecuencia transpuestas y la señal de entrada original. Para tal fin, la señal de entrada puede ser retardada como también los centros de gravedad de los impulsos Dirac transpuestos, alineados a una posición temporal certera de antemano, que corresponden a la posición temporal del impulso Dirac con límite de banda. En consecuencia, el espectrograma de la señal resultante de muestra en la Fig. 4.
Para aplicar el método descripto no se tiene en cuenta si el codificador de fase operado por voz como componente fundamental del método de extensión de ancho de banda se realiza en dominio de tiempo o dentro de una representación de banco de filtro como por ejemplo un banco de filtro espejo en cuadratura polifase (PQMF, por su sigla en inglés).
Utilizando las técnicas "SOLA", la calidad de audio subjetiva de transitorios se ve dañada por los efectos de eco debido a la superposición y suma mientras que el criterio de coherencia vertical se cumple en los transitorios. Algunas posibles, y leves desviaciones de las posiciones del centro de gravedad en los parches individuales desde el centro de gravedad real en el parche más alto yacen en el rango de pre máscara o post máscara, respectivamente.
El resultado de un codificador de fase operado por voz pobremente ajustado en términos de repuesta de magnitud se ilustra por la señal de señal de salida de la Fig. 5 que corresponde a una entrada de barrido senoidal de amplitud constante. Como se puede observar, existen fuertes variaciones de amplitud y cancelaciones constantes en la señal de señal de salida. La señal de señal de salida de un codificador de fase operado por voz apenas mayor ajustado se representa en la Fig. 6.
Una operación en un codificador de fase operado por voz complejo modulado basado en banco de filtro es la modificación de fase multiplicativa de muestras de sub-bandas. Una entrada sinusoidal en dominio de tiempo resulta ser precisa en las señales de valor complejo de sub-banda de forma Cv„(ú))exp[i(ú)qAk + en)] Donde ? es la frecuencia sinusoidal, n es el índice de sub-banda, k es el índice de intervalo de tiempo de la sub-banda, qA es el desplazamiento de tiempo del banco de filtro de análisis, C es una constante compleja, ??(?) es la respuesta de frecuencia del filtro prototipo del banco de filtro, y 9n es una característica de término de fase para el banco de filtro en cuestión, definida por el requisito que ??(?) se transforma con valor real. Para diseños de banco de filtro típicos QMF, se supone que son positivos. En una modificación de fase un resultado típico tiene la forma Mn(a>)8p[i(Te>qsk + Ten)] Donde T es el orden de transposición y qs es el desplazamiento de tiempo del banco de filtro de análisis. Como el banco de filtro de síntesis se elige típicamente como imagen espejo del banco de filtro de análisis, una síntesis sinusoidal adecuada requiere esta última expresión para corresponder con las sub-bandas de análisis de una señal sinusoide. La no conformidad de lo anterior conduce a modulaciones de amplitud como se muestra en la Fig. 5.
Una forma de realización de la presente invención consiste en usar una post modificación aditiva de corrección de fase teniendo en cuenta ?0„= (1-7 Esto indicará las señales de sub-banda no modificadas hasta obtener la evolución de fase de sub-banda cruzada deseada.
I^^ Taqsk + T0 ] ^ Dvn(a)exp[i(Taqsk + 0n)] .
Para el ejemplo específico de un banco de filtro QMF modulado complejo con apilamiento irregular, uno posee («+±) .
Y la corrección de fase de la invención se da teniendo en cuenta A¾ = f(T-lXn+i) La señal de señal de salida del codificador de fase operado por voz con fase ajustada de acuerdo con esta regla se representa en la Fig. 7.
Si el par de banco de filtro de análisis/síntesis posee más distribución asimétrica de vuelta giro de fase, existirá una corrección de fase ?? que, cuando se suma a las sub-bandas de análisis, y un signo menos antes de la síntesis, retorna la situación al caso simétrico anterior. En tal caso la corrección de fase de la invención deberá ajustarse teniendo en cuenta ?? ={\-t)f? -??) Un ejemplo de esto se da por un par de banco de filtro QMF de banda 64 usado en la próxima norma MPEG (sigla en inglés correspondiente a grupo de expertos sobre imágenes en movimiento) en Discurso Unificado y Codificación de Audio (USAC, por su sigla en inglés) teniendo en cuenta Donde C es un número real y puede tener valores entre 2 y 3,5. Los valores particulares son 321/128 o 385/128.
Por lo tanto para ese par se puede usar ??? = ^p(? -\)(? + ^ .
Además, en una implementación especial de la situación anterior, se observa que una corrección de fase, independiente del orden de transposición T , podría incorporarse en el paso de banco de filtro de análisis en sí. Como una corrección antes de la multiplicación del codificador de fase operado por voz corresponde a T veces la misma corrección luego de lá multiplicación de fase, la siguiente descomposición ocurre como ventaja, ?? = ?^p{? + ) -^p{? + ) , La modulación del banco de filtro de análisis se modifica para agregar la fase §7t(« + ?) comparada con el caso para el par de banco de filtro QMF estandarizado, y la corrección de fase de la invención se vuelve igual a segundo término solo, La ventaja de la corrección de fase radica en que se obtiene una repuesta plana de magnitud de cada contribución de orden del codificador de fase operado por voz a la señal de salida.
El procesamiento de la invención es adecuado para todas las aplicaciones de audio que extienden el ancho de banda de señales de audio aplicando la expansión de tiempo del codificador de fase operado por voz y submuestreo o sonido pregrabado en una proporción aumentada respectivamente.
La Fig. 8 ilustra un sistema de extensión de ancho de banda de acuerdo con un aspecto de la presente invención. El sistema de extensión de ancho de banda comprende un decodificador de núcleo 80 que genera una señal decodificada de núcleo. El decodificador de núcleo 80 se conecta a un generador de parche 82 analizado más adelante en detalle. El generador de parche 82 comprende todos los rasgos de la Fig. 8 pero el decodificador de núcleo 80, la conexión de banda baja 83 y el corrector de banda baja 84 como el mezclador 85. Específicamente, el generador de parche se configura para generar una o más señales de parches desde la señal de entrada de audio 86, donde una señal de parche posee una frecuencia central de parche diferente a la frecuencia central de parche de otro parche o de la frecuencia central de parche de la señal de entrada de audio. Específicamente, el generador de parche comprende un primer parche 87a, un segundo parche 87b y un tercer parche 87c, donde en la forma de realización de la Fig. 8, cada parche individual 87a, 87b, 87c comprende un aparato para submuestreo 88a, 88b, 88c, un bloque de análisis QMF 89a, 89b, 89c, un bloque de expansión de tiempo 90a, 90b, 90c, y un bloque corrector de canal de parche 91a, 91b, 91c. Las señales de señal de salidas de los bloques 91a a 91c y el corrector de banda baja 84 ingresan en un mezclador 85 que emite una señal extendida de ancho de banda. Esta señal puede procesarse mediante módulos de procesamiento como el módulo de corrección de envolvente, el módulo de corrección de tonalidad u otros módulos conocidos del procesamiento de señal de extensión de ancho de banda.
Preferentemente, una corrección de parche se realiza de modo que el generador de parche 82 genera la señal o señales de parche para que la desalineación de tiempo entre la señal de entrada de audio y la señal o señales de parches o desalineación de tiempo entre diferentes señales de parches, al compararla con un procesamiento sin corrección, reducido o eliminado. En la forma de realización de la Fig. 8, esta reducción o eliminación de la desalineación de tiempo se obtiene mediante los correctores de parche 91a a 91c. En forma alternativa o adicional, el generador de parche 82 se configura para realizar una corrección de fase que depende del banco de filtro-canal con una funcionalidad de expansión de tiempo. Esto se indica mediante la entrada de corrección de fase 92a, 92b, 92c.
Debe observarse que en la forma de realización de la Fig. 8 cada bloque de análisis QMF 89a emite una pluralidad de señales de sub-banda. La funcionalidad de expansión de tiempo debe realizarse para cada señal de sub-banda individual. Cuando, por ejemplo, el análisis QMF 89a emite 32 señales de sub-banda, podrá haber 32 expansores de tiempo 90a. Sin embargo, un corrector de parche individual para todas las señales con expansión de tiempo individual de este parche 87a es suficiente. Como se analiza más tarde, la Fig. 9 ilustra el procesamiento en el expansor de tiempo a realizar para cada señal de salida de señal de sub-banda individual por medio de un banco de análisis QMF como los bancos de análisis QMF 89a, 89b, 89c.
Mientras que un retardo para el resultado de todas las señales de tiempo procesadas usando la misma cantidad de expansión de tiempo es suficiente, una corrección de fase individual deberá aplicarse para cada señal de sub-banda, ya que la corrección de fase individual, aunque es independiente de la señal, depende de la cantidad de canales de un banco de filtro de sub-banda o, de otro modo, un índice de sub-banda de una señal de sub-banda, donde un índice de sub-banda significa lo mismo que una cantidad de canales en el contexto de esta descripción.
La Fig. 9 ilustra otra forma de realización de un ejemplo de implementación de procesamiento para procesar una señal de sub-banda individual. La señal de sub-banda individual ha estado sujeta a cualquier tipo de decimación antes o después de su filtrado por medio de un banco de filtro de análisis que no se muestra en la Fig. 9. Por lo tanto, la longitud de tiempo de la señal de sub-banda individual es más corta que la longitud de tiempo antes de formar la decimación. La señal de sub-banda individual ingresa en un extractor de bloque 1800, que puede ser idéntico al extractor de bloque 201, pero puede implementarse de modo diferente. El extractor de bloque 1800 en la Fig. 9 opera usando un valor de avance de muestra/bloque ejemplificativamente llamado e. El valor de avance de muestra/bloque puede ser variable o determinado en forma fija y se ilustra en la Fig..9 con una flecha en la caja del extractor de bloque 1800. En la señal de salida del extractor de bloque 1800, existe una pluralidad de bloques extraídos. Estos bloques se encuentran muy superpuestos, ya que el valor de avance de muestra/bloque es significativamente menor a la longitud del bloque del extractor de bloque. Un ejemplo consiste en que el extractor de bloque extrae bloques de 12 muestras. El primer bloque comprende muestras 0 a 11 , el segundo bloque comprende muestras 1 a 12, el tercer bloque comprende muestras 2 a 13, etc. En esta forma de realización, el valor de avance de muestra/bloque es igual a 1, y existe una superposición de 11 -pliegues.
Los bloques individuales ingresan en un generador de partición en ventanas 1802 para realizar la partición en ventanas de los bloques usando una función ventana para cada bloque. Además, se provee un calculador de fase 1804, que calcula una fase para cada bloque. El calculador de fase 1804 puede usar el bloque individual antes de realizar la partición en ventanas o después de realizar la partición en ventanas. Luego, se calcula un valor de ajuste de fase p x k e ingresa en un ajustador de fase 1806. El ajustador de fase aplica el valor de ajuste a cada muestra en el bloque. Además, el factor k es igual al factor de extensión de ancho de banda. Cuando, por ejemplo, se debe obtener una extensión de ancho de banda por un factor 2 la fase p calculada para un bloque extraído por el extractor de bloque 1800 se multiplica por el factor 2 y el valor de ajuste aplicado a cada muestra del bloque en el ajustador de fase 1806 es p multiplicado por 2.
En una forma de realización, la señal de sub-banda individual es una señal de sub-banda compleja, y la fase de un bloque puede calcularse de diferentes formas. Una forma consiste en tomar la muestra en el medio o alrededor de la mitad del bloque y calcular la fase de ésta muestra compleja.
Aunque se ilustra en la Fig. 9 de modo que un ajustador de fase opera luego del generador de partición en ventanas. Estos dos bloques pueden ser también intercambiados, para que el ajuste de fase se realice en los bloques extraídos por el extractor de bloques y se realice la subsecuente operación de partición en ventanas. Como ambas operaciones, es decir, la partición en ventanas y ajuste de fase son multiplicaciones de valor real o valor complejo, estas dos operaciones pueden ser compendiadas en una sola operación usando un factor de multiplicación complejo, el cual, en sí, es el producto de un factor de multiplicación de ajuste de fase y factor de partición en ventanas g.
Los bloques con fase ajustada ingresan en un bloque de superposición/suma y corrección de amplitud 1808, donde los bloques sujetos a partición en ventanas y con fase ajustada son superpuestos-sumados. Es importante, sin embargo, que el valor de avance de la muestra/bloque en el bloque 1808 es diferente al valor usado en el extractor de bloque 1800. Particularmente, el valor de avance de muestra/bloque en el bloque 1808 es mayor al valor e usado en el bloque 1800, para obtener una expansión de tiempo de la emisión de señal por un bloque 1808. De esta forma, la emisión de señal de sub-banda procesada por el bloque 1808 posee una longitud mayor a la señal de sub-banda que ingresa en el bloque 1800. Cuando debe obtenerse la extensión del ancho de banda de dos, se usa el valor de avance de muestra/bloque, que es dos veces el valor correspondiente en el bloque 1800. Se obtiene así una expansión de tiempo por un factor de dos. Cuando, sin embargo, se necesitan otros factores de expansión de tiempo, se pueden usar otros valores de avance de muestra/para que la señal de salida del bloque 1808 posea una longitud de tiempo requerida. En una forma de realización, solo una muestra con índice m = 0 será modificada para tener k (o T) veces su fase. En esta forma de realización, esto no es válido para todo el bloque. Para otras muestras, la modificación puede ser diferente como por ejemplo se ilustra en la Fig. 13 bloque 143.
Con respecto a la superposición, se realiza una corrección de amplitud preferentemente para enfocar el tema de diferentes superposiciones en el bloque 1800 y 1808. Esta corrección de amplitud podría, sin embargo, introducirse también en el factor de multiplicación del ajustador de generador de partición en ventanas/fase, pero la corrección de amplitud podrá realizarse además luego de la superposición/procesamiento.
En el ejemplo con longitud de bloque anterior de 12 y un valor de avance de muestra/bloque en el extractor de bloque de uno, el valor de avance de muestra/bloque para el bloque de superposición /suma 1808 sería igual a dos, cuando se realiza una extensión de ancho de banda por un factor de dos. Esto resultaría en una superposición de cinco bloques. Cuando se debe realizar una extensión de ancho de banda por un factor de tres, el valor de avance de muestra/bloque usado por el bloque 1808 sería igual a tres, y la superposición caería a una superposición de tres. Cuando debe realizarse una extensión de ancho de banda de cuatro pliegues, el bloque de superposición/suma 1808 tendría que usar un valor de avance de muestra muestra/bloque de cuatro, que resultaría en una superposición de más de dos bloques.
Además, una corrección de fase que depende del canal de banco de filtro ingresa en el ajustador de fase. Preferentemente, se realiza una operación de corrección de fase individual, donde el valor de corrección de fase es una combinación del valor de fase de ajuste que depende de la señal determinado por el calculador de fase y la corrección de fase independiente de la señal (pero depende del número de canales del banco de filtro).
Mientras la Fig. 8 ilustra una forma de realización de extensión de ancho de banda de un aparato para generar una señal extendida de ancho de banda de audio con mayor ancho de banda que la señal original del decodificador de núcleo, donde se usan varios bancos de filtro de análisis QMF 89a a 89c, otra forma de realización, donde se usa sólo un banco de filtro de análisis se describe con respecto a las Figs. 10 y 1 1. Además, debe definirse con respecto a la Fig. 8 que el análisis QMF 89d para el codificador de núcleo es sólo necesario cuando el mezclador 85 comprende un banco de filtro de síntesis. Sin embargo, cuando la mezcla con la señal de banda baja se realiza en dominio de tiempo, no se necesita el ítem 89d.
Asimismo, el mezclador 85 podrá comprender además un ajustador de envolvente, o básicamente un procesador de reconstrucción de alta frecuencia para procesar la entrada de señal en el reconstructor de alta frecuencia teniendo en cuenta los parámetros de reconstrucción de alta frecuencia transmitidos. Estos parámetros de reconstrucción podrán comprender parámetros de ajuste de la envolventes, parámetros de agregado de ruidos, parámetros de filtrado inverso, parámetros de armónicos ausentes u otros parámetros. El uso de estos parámetros y los parámetros en sí y como se aplican para realizar un ajuste de la envolvente o, generalmente, una generación de la señal extendida de ancho de banda se describe en ISO/IEC 14496-3: 2005(E), sección 4.6.8 dedicada a la herramienta de replicación de banda espectral (SBR, por su sigla en inglés).
En forma alternativa, sin embargo, el mezclador 85 puede comprender un banco de filtro de síntesis y subsecuentemente al banco de filtro de síntesis un procesador HFR para procesar la señal usando los parámetros HFR en el dominio de tiempo en vez de en el dominio de banco de filtro, donde el procesador HFR se sitúa antes del banco de filtro de síntesis.
Además, en la Fig. 8 la funcionalidad de decimación puede aplicarse además luego del análisis QMF. Al mismo tiempo, la funcionalidad de expansión de tiempo ilustrada en 92a a 92c, .ilustrada en forma individual para cada rama de transposición puede realizarse también con una sola operación para todas las tres ramas juntas.
La Fig. 10 ilustra un aparato para generar una señal extendida de ancho de banda de audio desde una señal de entrada de banda baja 100 de acuerdo con otra forma de realización. El aparato comprende un banco de filtro de análisis 101 , procesadores de sub-banda no lineal en lo que respecta a la sub-banda 102a, 102b, un ajustador de envolvente conectado en forma subsecuente 103 o, en general, un procesador de reconstrucción de alta frecuencia que opera en parámetros de reconstrucción de alta frecuencia como por ejemplo, ingreso en la línea de parámetro 104. Los procesadores de sub-banda no lineales 102a, 102b de la Fig. 10 o 11 son generadores de parches similares al bloque 82 en la Fig. 8. El ajustador de envolvente, o en general, el procesador de reconstrucción de alta frecuencia procesa señales de sub-banda individuales para cada canal de sub-banda e ingresa señales de sub-banda procesadas para cada canal de sub-banda en un banco de filtro de síntesis 105. El banco de filtro de síntesis 105 recibe, en su señal de entrada del canal inferior s, una representación de sub-banda de la señal del decodificador de núcleo de banda baja generada, por ejemplo, por el banco de análisis QMF 89d ilustrado en la Fig. 8. Dependiendo de la implementación, la banda baja puede derivar también de las señales de salida del banco de filtro de análisis 101 en la Fig. 10. Las señales de sub-banda transpuestas son suministradas en canales de banco de filtro más altos del banco de filtro de síntesis para realizar una reconstrucción de alta frecuencia.
El banco de filtro 105 finalmente emite una señal de señal de salida del transponedor que comprende extensiones de ancho de banda por los factores de transposición 2, 3, y 4, y la señal de salida de señal por el bloque 105 ya no es limitada al ancho de banda a la frecuencia cruzada, es decir a la mayor frecuencia de la señal de núcleo correspondiente a la menor frecuencia de componentes de señal generados por SBR o HFR.
En la forma de realización de la Fig. 10, el banco de filtro de análisis realiza un sobre muestreo de dos veces y posee una cierta separación de sub-banda de análisis 106. El banco de filtro de síntesis 105 posee una separación de sub-banda de síntesis 107 que, en esta forma de realización, duplica el tamaño de la separación de sub-banda de análisis que resulta en una contribución de transposición como se analiza más adelante en el contexto de la Fig. 1.
La Fig. 1 ilustra una detallada implementación de una forma de realización preferida de un procesador de sub-banda no lineal 2a en la Fig. 10. El circuito ilustrado en la Fig. 11 recibe como entrada una sola señal de sub-banda 108, que se procesa en tres "ramas": La rama superior 110a es para una transposición por un factor de transposición de 2. La rama en el medio de la Fig. 11 indicada como 110b es para una transposición por un factor de transposición de 3, y la rama inferior en la Fig. 11 es para una transposición por un factor de transposición de 4 y se indica con el número de referencia 110c. Sin embargo, la transposición real obtenida por cada elemento de procesamiento en la Fig. 11 es sólo 1 (es decir sin transposición) para la rama 110a. La transposición real obtenida por el elemento de procesamiento ilustrada en la Fig. 11 para la rama media 110b es igual a 1 ,5 y la transposición real para la rama inferior 110c es igual a 2. Esto se indica por los números en paréntesis a la izquierda de la Fig. 11 , donde se indican los factores de transposición T. Las transposiciones de 1 ,5 y 2 representan una primera contribución de transposición obtenida al tener operaciones de decimación en las ramas i 10b, 110c y una expansión de tiempo por el procesador de superposición -suma. La segunda contribución, es decir el doble de la transposición, se obtiene por el banco de filtro de síntesis 105, que posee una separación de sub-banda de síntesis 107 que es dos veces separación de sub-banda del banco de filtro de análisis. Por lo tanto, como el banco de filtro de síntesis posee una separación dos veces separación de sub-banda de síntesis, no hay funcionalidades de decimación en la rama 110a.
La rama 110b, sin embargo, posee una funcionalidad de decimación para obtener una transposición por 1 ,5. Debido a que el banco de filtro de síntesis posee dos veces la separación de sub-banda física del banco de filtro de análisis, un factor de transposición de 3 se obtiene como lo indica la Fig. 11 a la izquierda del extractor de bloque para la segunda rama 110b.
En forma análoga, una tercera rama posee una funcionalidad de decimación correspondiente a un factor de transposición de 2, y la contribución final de las diferentes separaciones de sub-banda en el banco de filtro de análisis y banco de filtro de síntesis finalmente corresponde al factor de transposición de 4 de la tercera rama 110c.
Particularmente cada rama posee un extractor de bloque 120a, 120b, 120c y cada extractor de bloque puede ser similar al extractor de bloque 1800 de la Fig. 9. Además, cada rama posee un calculador de fase 122a, 122b y 122c, y el calculador de fase puede ser similar al calculador de fase 1804 de la Fig. 9. Además, cada rama posee un ajustador de fase 124a, 124b, 124c y el ajustador de fase puede ser similar al ajustador de fase 1806 de la Fig. 9. Además, cada rama posee un generador de partición en ventanas 126a, 126b, 126c, donde cada generador de partición en ventanas puede ser similar al generador de partición en ventanas 1802 of Fig. 9. Sin embargo, los generador de partición en ventanas 126a, 126b, 126c pueden configurarse para aplicar una ventana rectangular junto con un "relleno de ceros"(zero padding, por su término en inglés). La transposición o señal de parches desde cada rama 110a, 110b, 110c, en la forma de realización de la Fig. 11 , ingresa en el sumador 128, que suma la contribución de cada rama a la actual señal de sub-banda para finalmente obtener los denominados bloques de transposición en la señal de salida del sumador 128. Luego, se realiza un procesamiento de superposición-suma en el dispositivo de superposición-sumador 130 y el dispositivo de superposición-sumador 130 puede ser similar al bloque de superposición/suma 1808 de la Fig. 9. El dispositivo de superposición-sumador aplica un valor de avance de superposición-suma de 2 e, donde e es el valor de superposición-avance o "valor de desplazamiento" de los extractores de bloque 120a, 120b, 120c, y el dispositivo de superposición-sumador 130 emite la señal transpuesta que es en la forma de realización de la Fig. 11 , una señal de salida de sub-banda individual para el canal k, es decir, para el canal de sub-banda actualmente observado. El procesamiento ilustrado en la Fig. 11 se realiza para cada sub-banda de análisis para un cierto grupo de sub-bandas de análisis y, como lo ilustra la Fig. 10, las señales de sub-banda transpuestas ingresan en el banco de filtro de síntesis 105 luego de ser procesadas por el bloque 103 para finalmente obtener la señal de señal de salida transpuesta ilustrada en la Fig. 10 en la señal de salida del bloque 105.
En una forma de realización, el extractor de bloque 120a de la primera rama del transponedor 110a extrae 10 muestras de sub-banda y luego se realiza una subsecuente conversión de estas 10 muestras Q F a coordenadas polares. La señal de salida se define como en la Fig. 13, bloque 143, analizada más adelante. Esta señal de salida, generada por el ajustador de fase 124a, es reenviada al generador de partición en ventanas 126a, que extiende la señal de salida por ceros para el primer y último valor del bloque, donde esta operación es equivalente a (síntesis) la partición en ventanas con una ventana rectangular de longitud 10. El extractor de bloque 120a en la rama 110a no realiza una decimación. Por lo tanto, las muestras extraídas por el extractor de bloque son mapeadas en un bloque extraído en la misma separación de muestra tal como fueron extraídas.
Sin embargo, esto es diferente para las ramas 110b y 110c. El extractor de bloque 120b preferentemente extrae un bloque de 8 muestras de sub-banda y distribuye estas 8 muestras de sub-banda en el bloque extraído en una separación de muestra de sub-banda diferente. Las entradas de muestra de sub-banda sin entero para el bloque extraído se obtienen mediante interpolación, y por lo tanto las muestras QMF obtenidas junto con las muestras interpoladas se convierten en coordenadas polares y son procesadas por el ajustador de fase 124b para obtener una expresión similar a la expresión en el bloque 143 de la Fig. 13. Luego, nuevamente, la partición en ventanas se realiza en un generador de partición en ventanas 126b se realiza para extender la señal de salida del bloque mediante el ajustador de fase 124b por medio de ceros para las primeras dos muestras y las últimas dos muestras, cuya operación es equivalente a una (síntesis) partición en ventanas con una ventana rectangular de longitud 8.
El extractor de bloque 120c es configura para extraer un bloque con extensión de tiempo de 6 muestras de sub-banda y realiza una decimación de un factor de decimación 2, realiza una conversión de las muestras QMF en coordenadas polares y nuevamente realiza una operación en el ajustador de fase 124b para obtener una expresión similar a lo que se incluye en el bloque 143 de la Fig. 13, y la señal de salida es nuevamente extendida por medio de ceros, sin embargo ahora para las primeras tres muestras de sub-banda y para las últimas tres muestras de sub-banda. Esta operación es equivalente a (síntesis) la partición en ventanas con una ventana rectangular de longitud con una ventana rectangular de longitud 6.
Las señal de salidas de transposición de cada rama se suman para formar la señal de salida QMF combinada por el sumador 128, y las señal de salidas QMF combinadas finalmente se superponen usando superposición -suma en el bloque 130, donde el valor de avance o desplazamiento del superposición -suma es dos veces el valor de desplazamiento de los extractores de bloque 120a, 120b, 120c como se analizó antes.
A continuación, se analizan diferentes formas de realización para determinar correcciones de fase preferidas en el contexto de la Fig. 12. En una forma de realización indicada en 151 , existe una situación simétrica de par de bancos de filtro de análisis/síntesis y la corrección de fase D9n posee un primer término 151 a dependiendo del factor de transposición T y un segundo término 151 b que depende del número de canal n o, en la notación en la Fig. 1 1 , k.
En esta forma de realización, el ajustador de fase se configura para aplicar una corrección de fase usando el valor O n indicado como O(k) en la Fig. 1 1 , que no solo depende del canal del banco de filtro de acuerdo con el término 151b, sino que puede depender también del factor de transposición T indicado con el término 151a. Es importante, sin embargo, que la corrección de fase no dependa de la señal de sub-banda real. Esta dependencia se debe al calculador de fase para la transposición del codificador de fase operado por voz como se analiza en contexto con los bloques 122a, 122b, 122b, pero la corrección de fase o "valor de ganancia de señal de salida complejo Q(k)" es independiente de la señal de sub-banda.
En otra forma de realización, indicada como 152 en la Fig. 12, ocurre una distribución asimétrica de giros de fase. Los giros de fase se usan para desplazar las muestras de entradas de un bloque del banco de filtro de análisis a lo largo del eje de tiempo y para desplazar los valores de señal de salida de un banco de filtro de síntesis a lo largo del eje de tiempo. Los valores de los giros de fase se indican como ??. Las correcciones de fase usadas en un caso con distribución asimétrica de giros de fase se indican como ?0„, y nuevamente existe un término que depende de un factor de transposición 152a y canal de sub-banda 152b.
Otra forma de realización preferida de la presente invención indicada como 153 posee la ventaja sobre las formas de realización 151 y 152 que el término de corrección de fase DQn o ü(k) ilustrado en la Fig. 1 1 sólo depende del canal de sub-banda, pero ya no depende del factor de transposición. Esta situación ventajosa puede obtenerse mediante aplicación específica de giros de fase al banco de filtro de análisis para cancelar el término dependiente de la transposición de la corrección de fase. En una cierta forma de realización para una implementación específica de un banco de filtro este valor s igual a D6n indicado en la Fig. 12. Sin embargo, para otros diseños de bancos de filtro el valor de D9n puede variar. La Fig. 12 ilustra un factor constante de 385/128, pero este factor puede variar de 2 a 4 dependiendo de la situación. Asimismo, se describe el uso de otros valores parte de 385/128, y el desvío de este valor para el diseño específico de banco de filtro, para el cual este valor es óptimo sólo dará por resultado una leve dependencia del factor de transposición, que puede ser ignorado hasta cierta magnitud.
La Fig. 13 ilustra una secuencia de pasos realizados por cada rama del transponedor 1 10a, 10b, 110c. En un paso 140, una muestra m para un bloque extraído se determina mediante extracción de muestra pura como en el bloque 120a, o realizando una decimación como en los bloques 120b, 120c y probablemente también mediante interpolación como se indica en el contexto del bloque 120b. Luego, en el paso 141 , se calculan la magnitud r y fase F de cada muestra. En el bloque 142, el calculador de fase 122a, 122b, 122c en la Fig. 1 1 , calcula cierta magnitud y cierta fase para el bloque. En la forma de realización preferida, se calcula la magnitud y fase del valor en el medio del bloque extraído y potencialmente decimado e interpolado bloque como valor de fase para el bloque y como valor de amplitud del bloque. Sin embargo, otras muestras del bloque pueden tomarse para determinar la fase y magnitud para cada bloque. En forma alternativa, aún una magnitud promedio o fase promedio de cada bloque determinado sumando las magnitudes y fases de todas las muestras en un bloque y dividiendo los valores resultantes por el número de muestras en un bloque pueda usarse como fase y magnitud del bloque. En la forma de realización de la Fig. 13, sin embargo, es preferible usar la magnitud y fase de la muestra en la mitad del bloque en índice cero como magnitud y fase para el bloque. Luego se calcula una muestra ajustada mediante el ajustador de fase 124a, 124b, 124c usando la corrección de fase O de la invención (siendo un número complejo) como primer término, usando una modificación de magnitud como segundo término (del cual sin embargo se puede eximir), usando el valor de fase que depende de la señal por los bloques 122a, 122b, 122c correspondiente a (T - 1) ·F(0) como tercer término, y usando la fase real de la muestra actualmente considerada F(??) como cuarto término como lo indica el bloque 143.
La Fig. 14a y Fig. 14b indican dos diferentes funcionalidades de modulación para bancos de filtro de análisis para las formas de realización de la Fig. 12. La Fig. 14a ilustra una modulación para un banco de filtro de análisis que requiere una corrección de fase que dependa del factor de transposición. Esta modulación del banco de filtro corresponde a la forma de realización 153 en la Fig. 12.
Una forma de realización alternativa se ilustra en la Fig. 14b correspondiente a la forma de realización 152, donde una corrección de fase que depende del factor de transposición se aplica debido a una distribución asimétrica de los giros de fase. En particular, la Fig. 14b ilustra la modulación específica del banco de filtro de análisis que corresponde al banco de filtro SBR complejo en ISO/IEC 14496-3, sección 4.6.18.4.2, incorporada a la presente a modo de referencia.
Cuando se comparan las Figs. 14a y 14b resulta claro que la cantidad de giros de fase para calcular los valores de coseno y seño es diferente en los últimos dos términos de la Fig. 14b y último término de la Fig. 14a.
Una forma de realización comprende un aparato para generar una señal extendida de ancho de banda de audio desde una señal de entrada, que comprende: un generador de parche para generar una o más señales de parche desde la señal de entrada de audio, donde una señal de parche posee una frecuencia central de parche diferente a la frecuencia central de parche de un parche diferente o desde una frecuencia central de la señal de entrada de audio, donde el generador de parche se configura para generar la señal o señales de parche para reducir o eliminar una desalineación de tiempo entre la señal de entrada de audio y la señal o señales de parche o desalineación de tiempo entre diferentes señales de parche, o donde el generador de parche se configura para realizar una corrección de fase que depende del banco de filtro-canal dentro de una funcionalidad de expansión de tiempo.
En otra forma de realización, el generador de parche comprende una pluralidad de parches, cada parche posee una funcionalidad de decimación, una funcionalidad de expansión de tiempo, y un corrector de parche para aplicar una corrección de tiempo a la señal de parches para reducir o eliminar la desalineación de tiempo.
En otra forma de realización, el generador de parche se configura para que el retardo de tiempo se almacene y seleccione de modo que cuando una señal del tipo impulse es procesada, los centros de gravedad de las señales sujetas a parche obtenidas por el procesamiento queden alineadas entre sí en el tiempo.
En otra forma de realización los retardos de tiempo aplicados por el generador de parche para reducir o eliminar la desalineación se almacenan en forma fija e independiente de la señal procesada.
En otra forma de realización el expansor de tiempo comprende un extractor de bloque usando un valor de avance de extracción, un generador de partición en ventanas/ajustador de fase, y un dispositivo de superposición-sumador con un valor de avance de superposición -suma diferente al valor de avance de extracción.
En otra forma de realización, un retardo de tiempo aplicado para reducir o eliminar la desalineación depende del valor de avance de extracción, valor de avance de superposición -suma o ambos.
En otra forma de realización, el expansor de tiempo comprende el extractor de bloque, el generador de partición en ventanas/ajustador de fase, y el dispositivo de superposición-sumador para al menos dos diferentes canales con diferentes números de canal de un banco de filtro de análisis, donde el generador de partición en ventanas/ajustador de fase para cada uno de los al menos dos canales de configura para aplicar un ajuste de fase para cada canal, el ajuste de fase depende del número de canal.
En otra forma de realización, donde el ajustador de fase se configura para aplicar un ajuste de fase en valores de muestreo de un bloque de valores de muestreo, el ajuste de fase es una combinación de un valor de fase que depende de una cantidad de expansión de tiempo y de la fase real del bloque, y valor de fase independiente de la señal que depende del número de canal.
Aunque algunos aspectos han sido descriptos en el contexto de un aparato, resulta claro que estos aspectos también representan una descripción del correspondiente método, donde un bloque o dispositivo corresponde a un paso del método o rasgo del paso del método. En forma análoga, los aspectos descriptos en el contexto del paso de un método además representan la descripción de un bloque correspondiente o ítem o rasgo de un aparato correspondiente.
La señal de audio codificada de la invención podrá almacenarse en un medio de almacenamiento digital o transmitirse en un medio de transmisión como medio de transmisión inalámbrico o por cableado como Internet.
Dependiendo de ciertos requisitos de implementación, las formas de realización de la invención podrán can be implementarse en hardware o software.
La implementación podrá realizarse usando un medio de almacenamiento digital por ejemplo un disco flexible, DVD, CD, ROM, PROM, EPROM, EEPROM o memoria FLASH, con señales de control legibles en forma electrónica almacenadas en los mismos, que cooperan (o pueden cooperar) con un sistema de computación programable de modo que se aplique el respectivo método.
Algunas formas de realización de acuerdo con la invención comprenden portadores de datos con señales de control legibles en forma electrónica, que pueden cooperar con un sistema de computación programable de modo que se aplique uno de los métodos descriptos en la presente.
Generalmente, las formas de realización de la presente invención podrán implementarse como producto de programa de computación con un código de programa, el código de programa aplica una de los métodos cuando el producto de programa de computación opera en una computadora. El código de programa podrá por ejemplo almacenarse en un portador legible por máquina.
Otras formas de realización comprenden el programa de computación para aplicar uno de los métodos de la presente, almacenado en un portador legible por máquina.
En otras palabras, una forma de realización del método de invención, consiste por lo tanto, en un programa de computación con un código de programa para aplicar uno de los métodos de la presente cuando el producto de programa de computación opera en una computadora.
Otra forma de realización del método de invención consiste por lo tanto, en un portador de datos (o medio de almacenamiento digital o medio legible por computadora) que comprende, el programa de computación para aplicar uno de los métodos de la presente grabado en el mismo.
Otra forma de realización del método de invención consiste por lo tanto, en un flujo de datos o secuencia de señales que representan el programa de computación para aplicar uno de los métodos de la presente. El flujo de datos o secuencia de señales podrá por ejemplo configurarse para ser transferido mediante conexión de comunicación de datos, por ejemplo mediante Internet.
Otra forma de realización comprende un medio de procesamiento, por ejemplo una computadora, o dispositivo lógico programable, configurado para o adaptado para aplicar uno de los métodos de la presente.
Otra forma de realización comprende una computadora con un programa de computación instalado en la misma para aplicar uno de los métodos de la presente.
En algunas formas de realización, un dispositivo lógico programable (por ejemplo un Campo de Matrices de Puertas Programables) podrá usarse para aplicar algunas o todas las funcionalidades de los métodos de la presente. En algunas formas de realización, un Campo de Matrices de Puertas Programables podrá cooperar con un microprocesador para aplicar uno de los métodos de la presente. Generalmente, los métodos preferentemente se aplican mediante un aparato de hardware.
Las formas de realización antes descriptas son solo ilustrativas para los principios de la presente invención. Se entiende que las modificaciones y variaciones de las disposiciones y detalles de la presente resultarán evidentes para otros expertos en la técnica. Por lo tanto se intenta quedar sólo limitado al alcance de las reivindicaciones de la patente y no a los detalles específicos presentados a modo de descripción y explicación de las formas de realización de la presente, Literatura: [1] J. L. Flanagan y R. M. Golden, Codificador de fase operado por voz, The Bell System Technical Journal, Noviembre 1966, pp 1394 -1509 [2] Patente de EEUU 6549884 Laroche, J. & Dolson, M.: Fase-codificador de voz/ tono-désplazamiento [3] J. Laroche y M. Dolson, Nuevas Técnicas de Codificador de fase operado por voz para Tono-Desplazamiento, Armonización y demás Efectos Exóticos, Proc. IEEE Taller de Ap. de Señal Proc. ao Señal Proc. A Audio y Acús., New Paltz, NY 1999. [4] Frederik Nagel, Sascha Disch, Método de extensión de ancho de banda de armónicos para codificadores de audio, ICASSP, Taipei, Taiwan, Abril 2009 [5] Frederik Nagel., Sascha Disch y Nikolaus Rettelbach, Método de extensión de ancho de banda para codificador de fase operado por voz con nuevo manejo de transitoriospara codificadores de audio, Convención 126 AES, Munich, Alemania Mayo 7-10, 2009

Claims (1)

  1. REIVINDICACIONES Habiendo así especialmente descripto y determinado la naturaleza de la presente invención y la forma como la misma ha de ser llevada a la práctica, se declara reivindicar como de propiedad y derecho exclusivo. 1 . Un aparato para generar una señal extendida de ancho de banda de audio desde una señal de entrada, que comprende: un generador de parche (82, 102a, 102b) para generar la señal o señales de parche desde la señal de entrada, donde una señal de parche posee una frecuencia central de parche diferente a la frecuencia central de parche de un parche diferente o de la frecuencia central de la señal de entrada de audio, donde el generador de parche (82, 102a, 102b) se configura para realizar una expansión de tiempo (90a, 90b, 90c; 1808; 130) de las señales de sub- banda desde un banco de filtro de análisis (101 ), y donde el generador de parche (82, 102a, 102b) comprende un ajustador de fase (1806, 124a, 124b, 124c) para ajustar fases de las señales de sub- banda usando una corrección de fase que depende de un banco de filtro- canal (151 , 152, 153). 2. ' Un aparato de sacuerdo con la reivindicación 1 , donde el ajustador de fase (124a, 124b, 124c, 1806) se configura para seleccionar la corrección de fase (151 , 152, 153) para reducir o eliminar una variación de amplitud de una señal introducida por un diseño del banco de filtro (101 , 105). Un aparato de acuerdo con la reivindicación 1 o 2, donde el ajustador de fase (124a, 124b, 124c, 1806) se configura para aplicar la corrección de fase (151 , 152, 153), la corrección de fase es independiente de la señal de sub-banda. Un aparato de acuerdo con una de las reivindicaciones anteriores, donde el ajustador de fase (124a, 124b, 124c, 1806) se configura para aplicar además una corrección de fase que depende de la señal dependiendo de un factor de transposición aplicado (143). Un aparato de acuerdo con una de las reivindicaciones anteriores, donde el generador de parche (82, 102a, 102b) se configura para realizar un procesamiento en lo que respecta al bloque y comprende: un extractor de bloque (1800, 120a, 120b, 120c) para extraer subsecuentes bloques de valores desde la señal de sub-banda usando un valor de avance de bloque (e); el ajustador de fase (124a, 124b, 124c, 1806); y un procesador de superposición -suma (1808, 130), donde el procesador de superposición -suma se configura para aplicar un valor de avance de bloque (k · e) mayor al valor de avance de bloque (e) para obtener la expansión de tiempo. Un aparato de acuerdo con la reivindicación 5, donde el extractor de bloque (120b, 120c) se configura para realizar además una operación de decimación que depende del factor de transposición T y realizar una interpolación en caso de operación de decimación sin entero. Un aparato de acuerdo con una de las reivindicaciones anteriores, donde el ajustador de fase (124a, 124b, 124c, 1806) se configura para aplicar la corrección de fase (153), la corrección de fase comprende: TTC(k + 1/2) donde k indica un canal de banco de filtro y C es un número real entre 2 y 4. Un aparato de acuerdo con la reivindicación 5, donde el generador de parche (82, 102a, 102b) además comprende un generador de partición en ventanas (126a, 126b, 126c, 1802) para realizar la partición en ventanas de un bloque usando una función ventana. Un aparato de acuerdo con una de las reivindicaciones anteriores, configurado para realizar una extensión de ancho de banda utilizando al menos dos factores de transposición T, donde el generador de parche se configura: Para el primer factor de transposición, para extraer (120a, 120b) utilizando un valor de avance de bloque y utilizando o no una primera decimación utilizando un primer factor de decimación; para ajusfar la fase de muestras del bloque de muestras de sub- banda; para rellenar a cero el bloque con fase ajustada a una cierta longitud para obtener una primera señal transpuesta; para el segundo factor de transposición, para extraer un bloque de muestras de sub-banda utilizando un valor de avance de bloque y utilizando una decimación utilizando un segundo factor de decimación mayor al primer factor de decimación, cuando se ha realizado una primera decimación; para ajustar la fase de muestras del bloque de muestras de sub- banda; y para rellenar a cero el bloque con fase ajustada a una cierta longitud para obtener una segunda señal transpuesta; para sumar (128) la primera y segunda señal transpuesta en una muestra-por-muestra para obtener un bloque transpuesto; y para superponer-sumar (130) bloques de transposición secuencial utilizando un valor de avance mayor al valor de avance de bloque para obtener una señal de sub-banda transpuesta. Un aparato de acuerdo con una de las reivindicaciones anteriores, que además comprende: un procesador de reconstrucción de alta frecuencia (103) para aplicar parámetros de reconstrucción de alta frecuencia (104) a las señales de sub-banda luego de la corrección de fase aplicada a las señales de sub-banda para obtener señales de sub-banda ajustadas. Un aparato de acuerdo con una de las reivindicaciones anteriores, que además comprende un banco de filtro de síntesis (105) con una separación de sub-banda mayor a la separación de sub-banda del banco de filtro de análisis (101). Un aparato de acuerdo con una de las reivindicaciones anteriores, donde el generador de parche (82, 102a, 102b) comprende un banco de filtro de análisis (101) para generar señales de sub-banda desde una señal de banda baja, donde el banco de filtro de análisis (101) un Banco de filtro Espejo en Cuadratura con giros de fase, y donde la corrección dé fase depende del factor de transposición. Un aparato de acuerdo con una de las reivindicaciones 1 a 11 , donde el banco de filtro de análisis (101) es un banco de filtro Q F y está configurado para aplicar giros de fase para que la corrección de fase (153) sea independiente de un factor de transposición usado para generar la seña o señales de parche. Un aparato de acuerdo con una de las reivindicaciones anteriores, donde el generador de parche comprende un expansor de tiempo (92a), y donde el expansor de tiempo (92a) comprende un extractor de bloque utilizando un valor de avance de extracción. Un aparato de acuerdo con una de las reivindicaciones anteriores, donde el generador de parche (82, 102a, 102b) comprende un expansor de tiempo (92a), donde el expansor de tiempo (92a) comprende un extractor de bloque, un generador de partición en ventanas, o un ajustador de fase y el dispositivo de superposición-sumador para al menos dos diferentes canales con diferentes números de canal de un banco de filtro de análisis, donde el generador de partición en ventanas o ajustador de fase para cada de los al menos dos canales se configura para aplicar un ajuste de fase para cada canal, el ajuste de fase depende del número de canales. 16. Un aparato de acuerdo con una de las reivindicaciones anteriores, donde el ajustador de fase se configura para aplicar un ajuste de fase valores de muestreo de un bloque de valores de muestreo, el ajuste de fase es una combinación de un valor de fase que depende de la cantidad de expansión de tiempo y de la fase real del bloque, y un valor de fase independiente de la señal en el número de canales como corrección de fase. 17. Un aparato de acuerdo con una de las reivindicaciones anteriores, donde el generador de parche (82, 102a, 102b) se configura para generar la señal o señales de parche para reducir o eliminar una desalineación de tiempo entre la señal de entrada de audio y la señal o señales de parches o desalineación de tiempo entre diferentes señales de parches. 18. Un aparato de acuerdo con una de las reivindicaciones anteriores, donde el generador de parche (82, 102a, 102b) comprende una pluralidad de parches (87a, 87b, 87c, 110a, 110b, 110c), al menos un parche posee una funcionalidad de decimación, una funcionalidad de expansión de tiempo y un corrector de parche para aplicar una corrección de tiempo a la señal de parches para reducir o eliminar la desalineación de tiempo. 19. Un método para generar una señal extendida de ancho de banda de audio desde una señal de entrada, que comprende: generar (82, 102a, 102b) una o más señales de parche desde la señal de entrada, donde una señal de parche posee una frecuencia central de parche diferente a la una frecuencia central de parche de un parche diferente o de la frecuencia central de la señal de entrada de audio, donde se realiza una expansión de tiempo (90a, 90b, 90c; 1808; 130) de señales de sub-banda desde un banco de filtro de análisis (101), y donde las fases de las señales de sub-banda se ajustan (1806, 124a, 124b, 124c) utilizando una corrección de fase que depende de un banco de filtro-canal (151 , 152, 153). Un programa de computación con un código de programa, que cuando opera en una computadora aplica el método de acuerdo con la reivindicación 19.
MX2012010314A 2010-03-09 2011-03-04 Dispositivo y metodo para respuesta de magnitud mejorada y alineacion temporaria en un metodo de extension de ancho de banda basado en un codificador de fase operado por voz para señales de audio. MX2012010314A (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US31211810P 2010-03-09 2010-03-09
PCT/EP2011/053298 WO2011110494A1 (en) 2010-03-09 2011-03-04 Improved magnitude response and temporal alignment in phase vocoder based bandwidth extension for audio signals

Publications (1)

Publication Number Publication Date
MX2012010314A true MX2012010314A (es) 2012-09-28

Family

ID=43829366

Family Applications (1)

Application Number Title Priority Date Filing Date
MX2012010314A MX2012010314A (es) 2010-03-09 2011-03-04 Dispositivo y metodo para respuesta de magnitud mejorada y alineacion temporaria en un metodo de extension de ancho de banda basado en un codificador de fase operado por voz para señales de audio.

Country Status (17)

Country Link
US (2) US9318127B2 (es)
EP (1) EP2545551B1 (es)
JP (1) JP5854520B2 (es)
KR (1) KR101483157B1 (es)
CN (1) CN102985970B (es)
AR (1) AR080475A1 (es)
BR (1) BR112012022745B1 (es)
CA (1) CA2792449C (es)
ES (1) ES2655085T3 (es)
MX (1) MX2012010314A (es)
MY (1) MY152376A (es)
PL (1) PL2545551T3 (es)
PT (1) PT2545551T (es)
RU (1) RU2596033C2 (es)
SG (1) SG183966A1 (es)
TW (1) TWI425501B (es)
WO (1) WO2011110494A1 (es)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102985970B (zh) * 2010-03-09 2014-11-05 弗兰霍菲尔运输应用研究公司 在用于音频信号的基于相角声码器的带宽扩展中改善的幅值响应和时间对准
PL2545553T3 (pl) 2010-03-09 2015-01-30 Fraunhofer Ges Forschung Urządzenie i sposób do przetwarzania sygnału audio z użyciem zrównania granicy obszaru
US8958510B1 (en) * 2010-06-10 2015-02-17 Fredric J. Harris Selectable bandwidth filter
EP2631906A1 (en) * 2012-02-27 2013-08-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Phase coherence control for harmonic signals in perceptual audio codecs
EP2682941A1 (de) * 2012-07-02 2014-01-08 Technische Universität Ilmenau Vorrichtung, Verfahren und Computerprogramm für frei wählbare Frequenzverschiebungen in der Subband-Domäne
EP2709106A1 (en) * 2012-09-17 2014-03-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating a bandwidth extended signal from a bandwidth limited audio signal
KR20160087827A (ko) * 2013-11-22 2016-07-22 퀄컴 인코포레이티드 고대역 코딩에서의 선택적 위상 보상
US9564141B2 (en) * 2014-02-13 2017-02-07 Qualcomm Incorporated Harmonic bandwidth extension of audio signals
EP2963645A1 (en) * 2014-07-01 2016-01-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Calculator and method for determining phase correction data for an audio signal
MX371223B (es) * 2016-02-17 2020-01-09 Fraunhofer Ges Forschung Post-procesador, pre-procesador, codificador de audio, decodificador de audio y metodos relacionados para mejorar el procesamiento de transitorios.
TWI807562B (zh) * 2017-03-23 2023-07-01 瑞典商都比國際公司 用於音訊信號之高頻重建的諧波轉置器的回溯相容整合
CA3152262A1 (en) 2018-04-25 2019-10-31 Dolby International Ab Integration of high frequency reconstruction techniques with reduced post-processing delay
EP3785260A1 (en) 2018-04-25 2021-03-03 Dolby International AB Integration of high frequency audio reconstruction techniques
CN110881157B (zh) * 2018-09-06 2021-08-10 宏碁股份有限公司 正交基底修正的音效控制方法及音效输出装置
GB2579348A (en) * 2018-11-16 2020-06-24 Nokia Technologies Oy Audio processing
JP7270836B2 (ja) * 2019-08-08 2023-05-10 ブームクラウド 360 インコーポレイテッド 音響心理学的周波数範囲拡張のための非線形適応フィルタバンク

Family Cites Families (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS55107313A (en) 1979-02-08 1980-08-18 Pioneer Electronic Corp Adjuster for audio quality
US5455888A (en) 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
US6766300B1 (en) 1996-11-07 2004-07-20 Creative Technology Ltd. Method and apparatus for transient detection and non-distortion time scaling
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US6549884B1 (en) 1999-09-21 2003-04-15 Creative Technology Ltd. Phase-vocoder pitch-shifting
SE0001926D0 (sv) 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
WO2002084645A2 (en) 2001-04-13 2002-10-24 Dolby Laboratories Licensing Corporation High quality time-scaling and pitch-scaling of audio signals
CN1272911C (zh) 2001-07-13 2006-08-30 松下电器产业株式会社 音频信号解码装置及音频信号编码装置
US6895375B2 (en) 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech
JP2005509928A (ja) * 2001-11-23 2005-04-14 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ信号帯域幅拡張
US20030187663A1 (en) 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
JP4227772B2 (ja) 2002-07-19 2009-02-18 日本電気株式会社 オーディオ復号装置と復号方法およびプログラム
JP4313993B2 (ja) 2002-07-19 2009-08-12 パナソニック株式会社 オーディオ復号化装置およびオーディオ復号化方法
SE0202770D0 (sv) 2002-09-18 2002-09-18 Coding Technologies Sweden Ab Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks
KR100524065B1 (ko) 2002-12-23 2005-10-26 삼성전자주식회사 시간-주파수 상관성을 이용한 개선된 오디오 부호화및/또는 복호화 방법과 그 장치
US7337108B2 (en) 2003-09-10 2008-02-26 Microsoft Corporation System and method for providing high-quality stretching and compression of a digital audio signal
ATE471557T1 (de) 2003-10-23 2010-07-15 Panasonic Corp Spektrum-codierungseinrichtung, spektrum- decodierungseinrichtung, übertragungseinrichtung für akustische signale, empfangseinrichtung für akustische signale und verfahren dafür
JP4254479B2 (ja) 2003-10-27 2009-04-15 ヤマハ株式会社 オーディオ帯域拡張再生装置
DE102004046746B4 (de) * 2004-09-27 2007-03-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren zum Synchronisieren von Zusatzdaten und Basisdaten
MX2007005103A (es) 2004-11-02 2007-07-04 Koninkl Philips Electronics Nv Codificacion y decodificacion de senales de audio utilizando bancos de filtros de valor complejo.
WO2006075663A1 (ja) * 2005-01-14 2006-07-20 Matsushita Electric Industrial Co., Ltd. 音声切替装置および音声切替方法
WO2006108543A1 (en) * 2005-04-15 2006-10-19 Coding Technologies Ab Temporal envelope shaping of decorrelated signal
JP2007017628A (ja) 2005-07-06 2007-01-25 Matsushita Electric Ind Co Ltd 復号化装置
US7565289B2 (en) 2005-09-30 2009-07-21 Apple Inc. Echo avoidance in audio time stretching
JP4760278B2 (ja) 2005-10-04 2011-08-31 株式会社ケンウッド 補間装置、オーディオ再生装置、補間方法および補間プログラム
EP1964438B1 (en) 2005-12-13 2010-02-17 Nxp B.V. Device for and method of processing an audio data stream
FR2910743B1 (fr) 2006-12-22 2009-02-20 Thales Sa Banque de filtres numeriques cascadable, et circuit de reception comportant une telle banque de filtre en cascade.
JP5400059B2 (ja) 2007-12-18 2014-01-29 エルジー エレクトロニクス インコーポレイティド オーディオ信号処理方法及び装置
CN101471072B (zh) 2007-12-27 2012-01-25 华为技术有限公司 高频重建方法、编码装置和解码装置
DE102008015702B4 (de) * 2008-01-31 2010-03-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals
US9275652B2 (en) 2008-03-10 2016-03-01 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Device and method for manipulating an audio signal having a transient event
US9147902B2 (en) * 2008-07-04 2015-09-29 Guangdong Institute of Eco-Environmental and Soil Sciences Microbial fuel cell stack
BRPI0904958B1 (pt) * 2008-07-11 2020-03-03 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Aparelho e método para calcular dados de extensão de largura de banda usando um quadro controlado por inclinação espectral
ES2461141T3 (es) 2008-07-11 2014-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y procedimiento para generar una señal de ancho de banda ampliado
MY155538A (en) 2008-07-11 2015-10-30 Fraunhofer Ges Forschung An apparatus and a method for generating bandwidth extension output data
EP2169665B1 (en) * 2008-09-25 2018-05-02 LG Electronics Inc. A method and an apparatus for processing a signal
EP2169670B1 (en) * 2008-09-25 2016-07-20 LG Electronics Inc. An apparatus for processing an audio signal and method thereof
PL4231290T3 (pl) 2008-12-15 2024-04-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Dekoder powiększania szerokości pasma audio, powiązany sposób oraz program komputerowy
CA3107567C (en) * 2009-01-28 2022-08-02 Dolby International Ab Improved harmonic transposition
EP2214165A3 (en) 2009-01-30 2010-09-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for manipulating an audio signal comprising a transient event
JP5433022B2 (ja) * 2009-09-18 2014-03-05 ドルビー インターナショナル アーベー 高調波転換
ES2805349T3 (es) * 2009-10-21 2021-02-11 Dolby Int Ab Sobremuestreo en un banco de filtros de reemisor combinado
EP2704143B1 (en) * 2009-10-21 2015-01-07 Panasonic Intellectual Property Corporation of America Apparatus, method and computer program for audio signal processing
US8321216B2 (en) 2010-02-23 2012-11-27 Broadcom Corporation Time-warping of audio signals for packet loss concealment avoiding audible artifacts
CN102985970B (zh) * 2010-03-09 2014-11-05 弗兰霍菲尔运输应用研究公司 在用于音频信号的基于相角声码器的带宽扩展中改善的幅值响应和时间对准

Also Published As

Publication number Publication date
RU2596033C2 (ru) 2016-08-27
JP2013521536A (ja) 2013-06-10
BR112012022745A2 (pt) 2018-06-05
TWI425501B (zh) 2014-02-01
TW201207844A (en) 2012-02-16
JP5854520B2 (ja) 2016-02-09
US20160267917A1 (en) 2016-09-15
KR101483157B1 (ko) 2015-01-15
AU2011226206B2 (en) 2013-12-19
AR080475A1 (es) 2012-04-11
PT2545551T (pt) 2018-01-03
RU2012142246A (ru) 2014-04-20
EP2545551B1 (en) 2017-10-04
US9318127B2 (en) 2016-04-19
WO2011110494A1 (en) 2011-09-15
BR112012022745B1 (pt) 2020-11-10
US9905235B2 (en) 2018-02-27
CN102985970A (zh) 2013-03-20
ES2655085T3 (es) 2018-02-16
CA2792449C (en) 2017-12-05
AU2011226206A1 (en) 2012-10-18
CN102985970B (zh) 2014-11-05
MY152376A (en) 2014-09-15
US20130058498A1 (en) 2013-03-07
EP2545551A1 (en) 2013-01-16
CA2792449A1 (en) 2011-09-15
KR20130007598A (ko) 2013-01-18
PL2545551T3 (pl) 2018-03-30
SG183966A1 (en) 2012-10-30

Similar Documents

Publication Publication Date Title
MX2012010314A (es) Dispositivo y metodo para respuesta de magnitud mejorada y alineacion temporaria en un metodo de extension de ancho de banda basado en un codificador de fase operado por voz para señales de audio.
JP5523589B2 (ja) カスケード式フィルタバンクを用いて入力オーディオ信号を処理するための装置および方法
US9236061B2 (en) Harmonic transposition in an audio coding method and system
JP6701429B2 (ja) 高調波転換
KR101773631B1 (ko) 대역 확장 방법, 대역 확장 장치, 프로그램, 집적 회로 및 오디오 복호 장치
JP2007535849A (ja) スペクトル/変調スペクトル域表現における変形による情報信号処理
EP3985666B1 (en) Improved harmonic transposition
AU2011226206B9 (en) Improved magnitude response and temporal alignment in phase vocoder based bandwidth extension for audio signals

Legal Events

Date Code Title Description
FG Grant or registration